说明书一种基于范式转换的不完备系统知识库生成方法
技术领域
本发明涉及知识发现与知识工程的技术领域,特别是涉及一种基于范式转换的不完备系统知识库生成方法。
背景技术
现实应用中数据的测量误差、获取限制等原因通常会导致信息系统的不完备情形。目前,对不完备数据的处理方法包括删除法、数据补齐法和模型扩充法等。删除法直接删除含缺失信息的所有对象,形成完备信息系统再加以处理。数据补齐法运用概率与统计方法补齐缺失数据,将原不完备系统转换为完备系统再行处理。扩充模型法考虑对经典模型加以拓展,使之适应于不完备系统数据处理。删除法会损失系统中大量有用信息,数据补齐法改变了原有信息,因而均不能很好地适应不完备决策系统数据处理。
基于相容关系定义不完备决策系统的极大相容块,是目前不完备系统数据处理的主流方法与技术。极大相容块是不完备系统的最小知识粒单元,对于不完备系统知识约简与决策分析具有重要研究意义。许多研究者基于极大相容块的概念进一步研究了不完备决策系统的知识约简方法。然而,这些工作多是从理论上对不完备系统数据处理模型加以拓展,鲜有考虑获取基本知识粒的有效算法,且难以得到具有最大泛化能力的全体知识。因此,如何设计有效的基本知识粒获取方法,以及在此基础上设计快捷高效的知识库构造方法,是当前不完备决策系统数据分析与处理面临的重要问题。
发明内容
本发明要解决的技术问题是提供一种基于范式转换的不完备系统知识库生成方法,针对不完备系统获取基本知识粒及发掘全体极大泛化规则,提高了算法的计算速度,并且增加计算的通用性。
本发明的技术方案是:一种基于范式转换的不完备系统知识库生成方法,其步骤如下:
(1)将不完备决策系统生成其简化不完备决策系统;
(2)对简化不完备决策系统中的各对象生成极大相容块分辨范式;
(3)将极大相容块分辨范式等价变换,计算得到简化不完备决策系统的全体极 大相容块;
(4)收集每个极大相容块的最全描述生成极大相容块最全描述决策系统;
(5)针对极大相容块最全描述决策系统中的每一对象构造决策分辨范式,生成其对应的决策规则集;
(6)收集步骤(5)中计算得到的全体规则集即得到原不完备决策系统的知识库。
所述不完备决策系统为IDS=<U,A=C∪D,V,f>,其中U={x1,…,xn}为非空有限论域,A=C∪D为非空有限属性集,C和D分别为条件属性集与决策属性集,V=∪a∈AVa,Va为属性a的值域;f:U×A→V为映射函数使得f(xi,a)∈Va(xi∈U,a∈A)。
所述将不完备决策系统生成其简化不完备决策系统具体方法为:
(101)将不完备决策系统IDS中的缺失值“*”看作值域V中的一取值,计算非空有限论域U关于条件属性C导致的条件等价类商集U/C={X1,…X|U/C|}和论域U关于决策属性D导致的决策等价类商集U/D={Y1,…Y|U/D|};
(102)对于不完备决策系统IDS中的每一对象Xi∈U/C(1≤i≤|U/C|),计算其决策向量DV(Xi)=<|Xi∩Y1||Xi|,|Xi∩Y2||Xi|,...,|Xi∩Y|U/D|||Xi|>;]]>
(103)针对不完备决策系统IDS生成其简化不完备决策系统sim(IDS)=<U/C,C∪D′,V′,f′>,其中V′=∪a∈C∪D′Va,f′为信息函数使得f′(Xi,a)∈Va(Xi∈U/C,a∈C),D′为决策向量属性且f′(Xi,D′)=DV(Xi)。
所述对简化不完备决策系统中的各对象生成极大相容块分辨范式具体方法为:
(201)为简化不完备决策系统sim(IDS)中的每一对象Xi∈U/C计算其容差块T(Xi);其中
(202)为简化不完备决策系统sim(IDS)中的每一对象Xi∈U/C生成极大相容块分辨范式
所述将极大相容块分辨范式等价变换,计算得到简化不完备决策系统的全体极大相容块具体方法为:
(301)考虑简化不完备决策系统sim(IDS)中的每一对象Xi∈U/C的极大相容块分辨范式DF(Xi)的情形:若则其容差块T(Xi)即为一极大相容块;否则,将极大相容块分辨范式DF(Xi)等价转换为其极小析取范式DF′(Xi)=(∧Q1)∨…∨(∧Qh);其中若Qj={Xk,Xm,Xl}则∧Qj=Xk∧Xm∧Xl;
(302)对简化不完备决策系统sim(IDS)的每一对象Xi∈U/C收集其极大相容块MCB(Xi)={{T(Xi)-Y1},…,{T(Xi)-Yh}};
(303)计算简化不完备决策系统sim(IDS)中的全体极大相容块MCB(sim(IDS))=∪{MCB(Xi):Xi∈U/C}。
所述收集每个极大相容块的最全描述生成极大相容块最全描述决策系统具体方法为:
(401)对每一极大相容块MCB(Xi)生成其最全描述;
(402)收集每一极大相容块最全描述得到极大相容块最全描述决策系统DES(MCB(sim(IDS)))。
所述针对极大相容块最全描述决策系统中的每一对象构造决策分辨范式,生成其对应的决策规则集具体方法为:
(501)对计算其原不完备决策系统容差块CB(z);其中
(502)对计算其决策向量DV(z)=<|CB(z)∩Y1||CB(z)|,...,|CB(z)∩Y|U/C|||CB(z)|>;]]>
(503)对计算其最大决策MD(z)={Di:f′(z,D′)[i]=max(f′(z,D′))},其中f′(z,D′)[i]为极大相容块z的决策向量的第i维;
(504)若z的最大决策仅有第i维一个,则生成决策分辨范式
(505)转换决策分辨范式DF(z)为等价的极小析取范式 DF′(z)=(∧R1)∨…∨(∧Rk),针对每一Rj生成其对应规则RULj=f′(z,Rj)→max(f′(z,D′)。
(506)若z的最大决策包含多个,则针对每一最大决策执行步骤(504)和步骤(505)得到对应规则。
与现有技术相比,本发明的有益效果:
1.本发明运用粒计算的基本原理,以条件等价类划分不完备决策系统,计算其决策向量,生成简化不完备系统,减少了获取系统极大相容块的比较次数,从而降低了算法的时空开销。
2.本发明针对简化不完备决策系统中各对象构造极大相容块分辨范式,实施等价变换计算与该对象相关的全体极大相容块,为获取不完备系统全体极大相容块提供了一条有效途径。
3.本发明以极大相容块最全描述代替极大相容块,生成极大相容块最全描述决策系统,以此作为不完备系统知识库生成的基础,为不完备系统提供了一种有效的信息表达转换方式。
4.本发明针对极大相容块最全描述系统中每一对象自动计算阈值参数,构造其决策分辨范式生成对应规则集,为不完备系统发掘全体极大泛化规则提供了一种有效解决方案。
附图说明
图1为本发明的原理图。
图2为图1的具体流程图。
具体实施方式
为更好地理解本发明的技术方案,下面结合附图与实施例作进一步描述。
实施例1
一种基于范式转换的不完备系统知识库生成方法,如图1和图2所示,其步骤如下:
步骤(1):针对不完备决策系统生成其简化不完备决策系统
设不完备决策系统为IDS=<U,A=C∪D,V,f>,其中U={x1,…,xn}为非空有限论域,A=C∪D为非空有限属性集,C和D分别为条件属性集与决策属性集,V=∪a∈AVa,Va为属性a的值域;f:U×A→V为映射函数使得 f(xi,a)∈Va(xi∈U,a∈A)。符号“*”表示属性值缺失,代表系统中的不完备情形。
其具体实现方法为:
(101)将不完备决策系统IDS中的缺失值“*”看作值域V中的一取值,计算非空有限论域U关于条件属性C导致的条件等价类商集U/C={X1,…X|U/C|}和论域U关于决策属性D导致的决策等价类商集U/D={Y1,…Y|U/D|}。
(102)对于不完备决策系统IDS中的每一对象Xi∈U/C(1≤i≤|U/C|),计算其决策向量DV(Xi)=<|Xi∩Y1||Xi|,|Xi∩Y2||Xi|,...,|Xi∩Y|U/D|||Xi|>.]]>
(103)针对不完备决策系统IDS生成其简化不完备决策系统sim(IDS)=<U/C,C∪D′,V′,f′>,其中V′=∪a∈C∪D′Va,f′为信息函数使得f′(Xi,a)∈Va(Xi∈U/C,a∈C),D′为决策向量属性且f′(Xi,D′)=DV(Xi)。
该方法运用粒计算基本原理,以条件等价类划分不完备决策系统,计算其决策向量,生成简化不完备系统。减少了后续步骤中获取系统极大相容块的比较次数,从而降低了算法的时空开销。
步骤(2):对简化不完备决策系统中的各对象生成极大相容块分辨范式
(201)为简化不完备决策系统sim(IDS)中的每一对象Xi∈U/C计算其容差块T(Xi)。其中
(202)为简化不完备决策系统sim(IDS)中的每一对象Xi∈U/C生成极大相容块分辨范式其中,极大相容块分辨范式DF(Xi)为一合取范式。
针对简化不完备决策系统中sim(IDS)中的各对象构造极大相容块分辨范式DF(Xi)。
步骤(3):计算得到简化不完备决策系统的全体极大相容块
(301)考虑简化不完备决策系统sim(IDS)中的每一对象Xi∈U/C的极大相容块分辨范式DF(Xi)的情形:若则其容差块T(Xi)即为一极大相容块;否则,将极大相容块分辨范式DF(Xi)等价转换为其极小析取范式DF′(Xi)=(∧Q1)∨…∨(∧Qh);其中若Qj={Xk,Xm,Xl}则 ∧Qj=Xk∧Xm∧Xl。
(302)对简化不完备决策系统sim(IDS)的每一对象Xi∈U/C收集其极大相容块MCB(Xi)={{T(Xi)-Y1},…,{T(Xi)-Yh}}。
(303)计算简化不完备决策系统sim(IDS)中的全体极大相容块MCB(sim(IDS))=∪{MCB(Xi):Xi∈U/C}。
根据简化不完备决策系统中sim(IDS)中的各对象构造极大相容块分辨范式DF(Xi)的情况,实施等价变换计算与该对象相关的全体极大相容块,为获取不完备系统全体极大相容块提供了一条有效途径。
步骤(4):计算得到极大相容块最全描述决策系统
(401)对每一极大相容块MCB(Xi)生成其最全描述。即针对每一“*”取值属性判断该块中是否存在其它对象在该属性有取值,若存在则以该取值替代,否则仍取值为“*”;
(402)收集每一极大相容块最全描述得到极大相容块最全描述决策系统DES(MCB(sim(IDS)))。
该方法以极大相容块最全描述代替极大相容块,生成极大相容块最全描述决策系统,以此作为不完备系统知识库生成的基础,为不完备系统提供了一种有效的信息表达转换方式
步骤(5):针对极大相容块最全描述决策系统中的每一对象构造决策分辨范式生成对应规则集
(501)对计算其原不完备决策系统容差块CB(z);其中
(502)对计算其决策向量DV(z)=<|CB(z)∩Y1||CB(z)|,...,|CB(z)∩Y|U/C|||CB(z)|>;]]>
(503)对计算其最大决策MD(z)={Di:f′(z,D′)[i]=max(f′(z,D′))},其中f′(z,D′)[i]为极大相容块z的决策向量的第i维;
(504)若z的最大决策仅有第i维一个,则生成决策分辨范式
(505)转换决策分辨范式DF(z)为等价的极小析取范式DF′(z)=(∧R1)∨…∨(∧Rk),针对每一Rj生成其对应规则RULj=f′(z,Rj)→max(f′(z,D′)。
(506)若z的最大决策包含多个,则针对每一最大决策执行步骤(504)和步骤(505)得到对应规则。
步骤(6):收集步骤(5)中计算得到的全体规则集即得到原不完备决策系统的知识库。
针对极大相容块最全描述系统中每一对象自动计算阈值参数,构造其决策分辨范式生成对应规则集,为不完备系统发掘全体极大泛化规则提供了一种有效解决方案。
实施例2
对于不完备决策系统IDS=(U,A)如表1,其中,非空有限论域为U={x1,…x15},有限属性集A=C∪D,C={a0,a1,a2,a3}为条件属性,D={d}为决策属性。符号“*”表示属性值缺失,代表系统中的不完备情形。
表1 不完备决策系统IDS
(1)由不完备决策系统IDS=(U,A),将其中的缺失值“*”看作值域V中的一取值,计算非空有限论域U关于条件属性C导致的条件等价类商集U/C={X1,…X6}和论域U关于决策属性D导致的决策等价类商集U/D={Y1,…Y3},其中X1={x1,x2,x3},X2={x4,x5,x6},X3={x7,x8},X4={x9,x10,x11},X5={x12,x13},X6={x14,x15},Y1={x1,x2},Y2={x3,x4,x7,x8,x11,x12,x13,x14,x15},Y3={x5,x6,x9,x10}。对于不完备决策系统IDS=(U,A)中的每一对象X1、X2、X3、X4、X5和X6,计算其决策向量DV(X1)=<2/3,1/3,0>,DV(X2)=<0,1/3,2/3>,DV(X3)=<0,1,0>,DV(X4)=<0,1/3,2/3>,DV(X5)=<0,1,0>,DV(X6)=<0,1,0>。根据决策向量条件DV和等价类商集U/C生成其简化不完备决策系统sim(IDS)=(U/C,C∪D′)如表2。
表2 简化不完备决策系统sim(IDS)
(2)针对简化不完备决策系统sim(IDS)中各对象Xi计算相容块T(Xi)。以X2为例得到容差块T(X2)={X2,X4,X5};由容差块得到其极大相容块分辨范式DF(X2)=(X4∨X5)。
(3)将极大相容块分辨范式DF(Xi)等价转换为其极小析取范式DF′(Xi)。以X2为例,其极小析取范式DF′(X2)=(X4)∨(X5)。收集与X2相关的极大相容块得到MCB(X2)={T(X2)-X4,T(X2)-X5}={{X2,X5},{X2,X4}}。同理,针对计算其相容块、生成极大相容块分辨范式DF(Xi)、将DF(Xi)等价转换为极小析取范式DF′(Xi)、获得与Xi相关的极大相容块集MCB(Xi),列出如表3。
表3 简化不完备决策系统sim(IDS)中各对象Xi的T(Xi)、DF(Xi)与MCB(Xi)
收集表3中各MCB(Xi)即得到简化不完备决策系统的全体极大相容块MCB(sim(IDS))={{X1},{X2,X5},{X2,X4},{X3,X4},{X6}}。
(4)对每一极大相容块计算其最全描述。以极大相容块{X2,X5}为例,针对每一“*”取值属性判断该块中是否存在其它对象在该属性有取值,若存在则以该取值替代,否则仍取值为“*”,由表2可计算得到DES({X2,X5})=(1,*,1,1)。收集每一极大相容块最全描述得到极大相容块最全描述决策系统DES(MCB(sim(IDS))),如表4中“a0,a1,a2,a3”列。
(5)对每一极大相容块z∈MCB(sim(IDS))计算其决策向量DV(z)。以z={X2,X5}为例,得到其关于原不完备系统IDS=(U,A)的容差块为CB(z)={x4,x5,x6,x12,x13},其决策向量DV(z)=<0,3/5,2/5>。按照上述方法,对即可得到其决策向量DV(z)列出如表4“DV(z)”列。
表4 极大相容块最全描述决策系统DES(MCB(sim(IDS)))
对每一极大相容块z∈MCB(sim(IDS))计算其蕴含的规则集。以极大相容块z={X2,X5}为例得到其最大决策MD(z)={第1维},且第1维取值为3/5。由于相容块{X1}与{X2,X4}的决策向量第1维取值小于3/5,故生成其决策分辨范式为 DF(z)=(a2∨a3)∧(a0)。将决策分辨范式DF(z)等价转换为极小析取范式DF′(z)=(a0∧a2)∨(a0∧a3),得到与z={X2,X5}对应的规则集为“{(a0,1)∧(a2,1)→(d,1),(a0,1)∧(a3,1)→(d,1)}”。同理,实施上述步骤对即可生成其相应的规则集。生成的全体规则集如表5(表5中各规则置信度、支持度、覆盖度的分子分母均为原不完备系统中匹配对象数目)。
表5 不完备系统IDS的全体规则集
(6)收集表5中计算得到的全体规则集即得到原不完备决策系统的知识库。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。