《一种基于因素空间的对象分类方法.pdf》由会员分享,可在线阅读,更多相关《一种基于因素空间的对象分类方法.pdf(14页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103838977 A (43)申请公布日 2014.06.04 CN 103838977 A (21)申请号 201410113282.6 (22)申请日 2014.03.25 G06F 19/00(2011.01) (71)申请人 辽宁工程技术大学 地址 125105 辽宁省葫芦岛市龙湾南大街 188 号 016 信箱 (72)发明人 王诗 王伟 张敏 (54) 发明名称 一种基于因素空间的对象分类方法 (57) 摘要 本发明公开了一种基于因素空间的对象分类 方法, 其特征在于, 基于因素空间理论对多域值属 性影响对象集合进行聚类分析, 提出了以研究对 象为中心的。
2、图形化域值属性表示方法属性圆, 属 性圆可以表示无穷多个域属性对对象的影响 ; 其 包括如下步骤 : 先基于属性圆概念进行对象的相 似性分析, 后为计算方便将图形定义转化为数值 相似性定义, 进而研究了对象集合的聚类分析方 法 ; 本发明可用于考虑多域值属性影响对象集合 进行聚类分析。 (51)Int.Cl. 权利要求书 2 页 说明书 6 页 附图 5 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书6页 附图5页 (10)申请公布号 CN 103838977 A CN 103838977 A 1/2 页 2 1. 一种基于因素空间的对象分类方法, 其特。
3、征在于, 基于因素空间理论对多域值属性 影响对象集合进行聚类分析, 提出了以研究对象为中心的图形化域值属性表示方法属性 圆, 属性圆可以表示无穷多个域属性对对象的影响 ; 其包括如下步骤 : 先基于属性圆概念 进行对象的相似性分析, 后为计算方便将图形定义转化为数值相似性定义, 进而研究了对 象集合的聚类分析方法 ; 本发明可用于考虑多域值属性影响对象集合进行聚类分析。 2. 一种基于因素空间的对象分类方法, 其特征在于, 分类系统的构造, 设系统 ,为对象集合, m 为对象数量 ;为条件属 性集, n 为条件数量,属性是一个连续的区间,;; k 为决策数量。 3. 一种基于因素空间的对象分类。
4、方法, 其特征在于, 构建基础信息决策表 表示系统 T, 表头集合为 U,C,D, 其中, C 中的属性必须归一化 ; 设的真实范围 A,B, 对 于 因 素的 研 究 范 围 LL,UL, 。 4. 根据权利要求 1 所述的属性圆, 其特征在于, 属性圆是一个单位圆, 即半径为 1, 每 一个属性圆代表一个对象集中的对象 ; 属性圆周上某一点与圆心的连线为属性域线 ( 下文简称 “域线” ) 代表了该对象的一个属性范围, 域线长为 1 ;在域线上, 表示 属性域值的起点,表示属性域值的终点 ; 在属性圆中的线段用表示,表 示属性圆中任意的两个点, 如域线表示为; 属性角为域线与 之间的夹角 。
5、; 属性圆中的面积使用表示,表示属性圆 中任意的多个点, 这些点按照出现顺序能组成凸多边形 ; 属性圆定义的规则可总结规则如 式 : 。 5. 根据权利要求 4 所述的, 其特征在于,或表示对象在 属性上作用的特征范围,越大属性对对象的影响越小 ;越小属性 对对象的影响越大。 权 利 要 求 书 CN 103838977 A 2 2/2 页 3 6. 根据权利要求 1 所述的相似性, 其特征在于, 在系统 T 中, 定义 为与关于属性的相似度,确定方法如下 : 当 i=j 时, 表示两个对象相同 ; 当时, 比较与的相对覆盖区域情况 ; 当与在上无重叠时, 表明两个对象的对于因素根本 不相关 。
6、; 当与在上有重叠时, 根据重叠情况得如式 : , 式中 : 。 7. 一种基于因素空间的对象分类方法, 其特征在于,的总相似度的 分类规则, 设为对于单一属性的相似性判断阀值, 一般地; 意为相似,意为不相似, 之间意为模糊相似, 所以对于 ,意为相似,意为不相似, 之间意 为模糊相似。 8. 根据权利要求 7 所述的, 其特征在于,的总相似度为, 对于 ,。 9. 一种基于因素空间的对象分类方法, 其特征在于, 实施的聚类原则为 : 严格遵照相 似与不相似划分, 参考模糊相似划分。 权 利 要 求 书 CN 103838977 A 3 1/6 页 4 一种基于因素空间的对象分类方法 技术领。
7、域 0001 本发明涉及系统工程, 特别是涉及考虑多域值属性影响的对象集合进行聚类分 析。 背景技术 0002 在对某电器系统安全性进行调研时, 对一位操作者提出系统安全性问题后的回 答 : 系统在 12以下多出现故障, 工作七八十天后故障较多, 系统严重不稳定。这个例子有 一些特点, 第一例子是一个多因素决策系统 ; 第二因素的表达是一个域值, 即因素是一个范 围 ; 第三基础数据来源于多个使用者的经验, 不同的工作时间和工作环境使他们对系统的 评价基础不同 ; 第四基础数据是人的一种对事物的描述, 具有模糊性。 第五如何知晓这些描 述的置信度, 这些描述是否可以相互佐证。 0003 当然,。
8、 目前有一些方法可以对描述语义进行处理。钱怡等对对象定位处理中分类 信息融合技术进行了研究 ; 余晓敏等利用改进 SEaTH 算法研究了面向对象分类特征选择方 法 ; 窦丹丹等基于信息熵和 SVM 多分类对飞机液压系统故障进行了诊断 ; 牛俊磊等基于全 方位优化算法的改进了马田系统分类方法 ; 黄恒秋等实现了混合值不完备决策信息系统的 粗糙分类方法。但是就上述例子而言显得捉襟见肘。 0004 因素是分析事物属性与因果关联的要素。因素空间是以因素命名的坐标空间, 它 是事物描述的普适性的数学框架。是人工智能特别是智能数据科学的基本数学理论。 0005 因素被数学地定义为一种映射。它把一个对象 (。
9、具体事物) 映射成为一个属性值 (用自然语言中的形容词来描述) , 这种映射称为质映射 ; 同时, 也映射成为一个性态 (用有 限维欧式空间中的实向量来表示) 这种映射称为量映射。例如, 身高是一个映射, 它把一个 对象张三映射成性态 很高 , 同时, 也映射成一个量态 1.8(米) , 如图 1 所示。任何事物都 同时存在着质与量的两种规定性。从量变到质变, 量决定质。 0006 基于这一哲理, 我们设定这两种映射共存。 因素f的量映射形成一个 (一维或高维) 坐标轴 Xf, f 的质映射所得的属性值是 Xf中的普通或模糊子集。有关模糊子集的形成方法 由模糊集理论早已解决。 0007 因素是。
10、分析, 是抽象, 回到具体, 便是认识的分析综合过程。 如图所示, 把诸因素 轴联合起来, 就得到以因素命名的坐标架, 这就是因素空间。 任何事物都可以被看成是因素 空间中的点。数学的定义便是以因素 F 为指标集的一个集合族。这里 F 是诸因素所形成的 一个集合, 由于因素与因素之间存在着布尔运算, F 是一个布尔代数, 故因素空间被定义成 以布尔代数为指标集的集合族。 0008 因素库是一种新的数据库, 它是因素空间理论的数据实现, 它对数据的处理采用 一系列的基本表格形式。 0009 用因素空间来研究和处理因素库, 除了能干净利落地从其概念分析表进行属性划 分和概念格的提取外, 还有很多更。
11、加深入的理论和应用, 主要研究的表型还有 :(1) 因素分 析表 (定量值域生成定性值域, 因素相关分析, 事件因果分析) ;(2) 加入目标因素进行优化 说 明 书 CN 103838977 A 4 2/6 页 5 的多目标决策表 ;(3) 加入安全因素进行评估的安全警示表 ;(4) 加入控制因素进行调节的 稳定调节表 ;(5) 因素词典及因素表头库的建立。 发明内容 0010 1 属性圆的概念及性质 如图 1 所示, 为人的因素空间性态表述图。该图能表示因素空间的基本建立思想, 即对象集中的某一个对象 (一个人)与这个对象属性之间的关系, 只要属性确定下来, 那么一个实例化的人就确定了。但。
12、是在实际问题中, 问题的研究对象往往属性较多, 使 用图 1 形式, 其属性的大小方向及它们和属性之间的关系难以确定且不直观, 难以进 行进一步分析。所以作者提出了属性圆的概念。同时为表述方便先给出实例中对象 的属性圆, 如图 2 所示。 0011 定义 1 设系统为决策表,为对象集合, m 为对象 数量 ;为条件属性集, n 为条件数量,属性是一个连续的区间, ;;k 为决策数量。如需区别对象之间的变 量概念, 在变量下方添加, 如表示对象的属性, 同下定义。 0012 定义 2 构建基础信息决策表表示系统 T。表头集合为 U,C,D, 其 中, C 中的属性必须归一化。设的真实范围 A,B。
13、, 对于因素的研究范围 LL,UL,。 0013 通过上面的定义可知,中的数据是经过归一化的, 即, , 这为属性圆的建立提供了基础。 0014 定义 3 属性圆是一个单位圆, 即半径为 1, 每一个属性圆代表一个对象集中的对 象。属性圆周上某一点与圆心的连线为属性域线 ( 下文简称 “域线” ) 代表了该对象 的一个属性范围, 域线长为 1。在域线上, 表示属性域值的起点,表示属性域值 的终点。在属性圆中的线段用表示,表示属性圆中任意的两个点, 如域线 表示为。属性角为域线与之间的夹角。属性圆中的面 积使用表示,表示属性圆中任意的多个点, 这些点按照出现顺序 能组成凸多边形。属性圆定义的规则。
14、可总结规则如式 (1) 所示。 0015 (1) 说 明 书 CN 103838977 A 5 3/6 页 6 式中参数见定义 1 及定义 2。 0016 定义 4 或表示对象在属性上作用的特征范围, 越大属性对对象的影响越小 ;越小属性对对象的影响越大。 0017 2 基于属性圆的分类方法 为进行分类方法的说明, 先给出与的相似性定义图, 如图3所示。 首先从几何图示 的角度给出对象相似的概念。如图 2 中,表示了一个凸多边形, 其意义为同时 表示了对象在属性上其特征的大小。图 3 表示与的属性圆图的重叠图 (请注 意, 与中面积的底纹不同) , 那么与的重叠部分可以较大程 度的反应与关于属。
15、性的相似程度。 0018 但是明显地使用上述方法确定与的相似程度存在困难。上述方法 与的重叠部分同时反映了与关于两个属性的相似程 度, 不能就单一属性确定。 另一方面与的重叠部分需要通过复杂 的解析手段才能确定。对于工程应用要求简便快捷的特点显然是不满足的。因此将相似的 属性圆思想转化为数值计算方法进行定义和使用。 0019 从图 3 可以看出在属性上和有一部分是重叠的, 这部分说明 属性有一个区域 () 对和有着相同的影响, 也就是说在这个区 域中和是相似的。基于该思想定义相似性。 0020 定义 5 在系统 T 中, 则定义为与关于属性的相似 度,确定方法如下 : 当 i=j 时, 表示两。
16、个对象相同。 0021 当时, 比较与的相对覆盖区域情况。 0022 当与在上无重叠时, 表明两个对象的对于因素 根本不相关。 0023 当与在上有重叠时, 根据重叠情况得如式 (2) 所示。 0024 (2) 说 明 书 CN 103838977 A 6 4/6 页 7 式中 : 。 0025 定 义 6 的 总 相 似 度 为, 对 于, 。 0026 上述定义的具体体现可见图 3 表征。 0027 定义 7 的总相似度的分类规则。设为对于单一属性的 相似性判断阀值, 一般地。意为相似,意 为不相似, 之间意为模糊相似。 所以对于,意为 相似,意为不相似, 之间意为模糊相似。 附图说明 0。
17、028 图 1 人的因素空间性态表述。 0029 图 2 对象的属性圆表示。 0030 图 3 与的相似性定义图。 0031 图 4 的属性圆。 0032 图 5 的属性圆。 0033 图 6 的属性圆。 0034 图 7 的属性圆。 0035 图 8 的属性圆。 0036 图 9 的属性圆。 具体实施方式 0037 任何理论的价值在于其可以处理实际的问题。 上述理论的形成也是从实际问题中 提炼出来的。 0038 在对一个电器系统进行可靠性分析时, 调研了 7 位使用过该系统的人员, 他们给 出了对系统可靠性的评价语言论述。 由于他们工作调度等方面的原因使他们操作系统的环 境不同。实际上, 就。
18、系统中元件发生故障概率而言, 其影响因素是多样的。比如电器系统中 的二极管, 它的故障概率就与工作时间的长短、 工作温度的大小、 通过电流及电压等有直接 关系。 如果对这个系统进行分析, 各个元件的工作时间和工作适应的温度等可能都不一样, 随着系统整体的工作时间和环境温度的改变, 系统的安全性也是不同的 10。所以他们给 出的系统可靠性评价的基础环境是不同的。 0039 使用论文提出的方法试图将这些操作人员的描述进行分类, 如果得到的对象集 说 明 书 CN 103838977 A 7 5/6 页 8 (语义描述集合) 分类与决策集分类相同, 那么说明这些操作人员对系统可靠性评价是客观 的, 。
19、可以相互佐证 ; 如果对象集分类与决策集分类不对应, 那么要增加其他操作者的评价才 能进一步确定表述的准确性。 0040 根据现场调研情况, 如某位操作者的回答为 : 系统在 12以下多出现故障, 工作 七八十天后故障较多, 系统严重不稳定 ( 由于篇幅所限, 7 个表述不都给出 )。该系统一般 100 天大修一次, 设定使用时间的域范围为 0,100d ; 使用温度考虑到系统位于北方户外 且有一定的保护, 设定其域范围为 0,40; 湿度是根据工作期间的季节气候大体确定的。 0041 定义系统, 7 位被调查者的描述为对象集合, 为第 i 位被调查者的意见,。系统的使用时间, 使用温度和湿度。
20、为系统的条件属 性集合, 为使用温度, 为使用时间, 为湿度。, 和是连续的范围 值, 根据被调查者提供的意见将, 和归一化, 如可将该位操作者的回答作为, 定量 为使用温度 0,12, 使用时间 70,95d 和使用湿度的安全情况描述, 归一化 , 同理,。决 策等级分别表示安全等级为一到三级, 为 “不可靠” 、“一般可靠” 、“很可靠” 。 得到基础信息决策表, 如表 1 所示。撇开决策集 D 研究对象集与属性集的属性圆表 示, 的属性圆已给出,的属性圆如图组 4 所示。根据表 1, 定义 5 和 6, 得到对象相 似表, 如表 2 所示。 0042 表 1 基础信息决策表 表 2 对象。
21、相似表 说 明 书 CN 103838977 A 8 6/6 页 9 为确定对象集合的划分, 首先定义,的相似性划分 相似, 模糊相似, 不相似 =1,0.125,(0.125,0),0。结合表 2 得到的相似对象归类如 下 : 相似 :、; 模 糊 相 似 :、 、; 不相似 :、 。 0043 对象聚类原则为 : 严格遵照相似与不相似划分, 参考模糊相似划分。如 说明对象要划分为一组 ;说明对象不能划分为一组。所 以最终对象集 U=,。在考虑表 1 中决策集 D 与对象集 U 的 对应关系, 发现 UD=,, 这说明对 对象的划分就其决策属性而言是非奇异的, 准确的。转化为语义即为 7 位。
22、操作人员尽管在 不同环境下对系统进行了可靠性评价, 但是这些评价语义是相对客观的, 所在环境属性域 值与决策等级对应较好, 评价的语义可以相互佐证。 说 明 书 CN 103838977 A 9 1/5 页 10 图 1 图 2 说 明 书 附 图 CN 103838977 A 10 2/5 页 11 图 3 图 4 说 明 书 附 图 CN 103838977 A 11 3/5 页 12 图 5 图 6 说 明 书 附 图 CN 103838977 A 12 4/5 页 13 图 7 图 8 说 明 书 附 图 CN 103838977 A 13 5/5 页 14 图 9 说 明 书 附 图 CN 103838977 A 14 。