粗糙集中属性集变化时规则集动态更新方法 【技术领域】
本发明涉及一种规则集动态更新方法。背景技术 随着网络信息技术的快速发展, 各个领域的数据急剧膨胀, 在决策信息系统中, 数 据集也随着外部信息世界的变化而不断发生变化。当属性增加、 删除时, 会引起对象的分 类变化, 进而引起近似集的变化, 相应地, 对决策规则产生一定的影响。规则的动态更新是 粗糙集领域中的研究热点。 其中一个方面的工作是根据区分矩阵、 核进行规则的动态更新, 如杨明提出的一种基于改进差别矩阵的核增量式更新算法 [ 一种基于改进差别矩阵的属 性约简增量式更新算法 [J]. 计算机学报, 2007, 30(5) : 815-822] ; 在集值粗糙集模型中邹 维丽等提出了近似集的动态增量更新方法 [ 邹维丽, 陈红梅, 胡成祥等 . 集值粗糙集模型 的近似集增量更新方法研究 [J]. 广西师范大学学报 ( 自然科学版 ), 2009, 27(3) : 96-99] ; 胡成祥等提出了基于限制容差关系的近似集增量更新方法 [ 胡成祥, 李天瑞, 邹维丽等 . 基 于限制容差关系的粗糙集模型中近似集增量更新方法研究 [J]. 西南民族大学学报 ( 自然 科学版 ), 2009, 35(3) : 480-484] ; 陈红梅等研究了在变精度模型下对象变化时近似集增量 更新方法 [Chen H.M., LiT.R.Dynamic maintenance methods for approximations based variable precision rough set[C].2010 3rd International Conference on Advanced Computer Theory and Engineering(ICACTE 2010), Chengdu, China.2010 : 269-274] ; 季 晓岚等对优势关系下属性值粗化细化时近似集性质进行了分析 [ 季晓岚, 李天瑞, 邹维丽
等 . 优势关系下属性值粗化细化时近似集分析 [J]. 计算机工程 .2010, 36(12) : 33-35]。 刘伟斌等在特性关系粗糙集下属性值粗化细化时对近似集增量更新方法进行了研究 [ 刘 伟斌, 李天瑞, 邹维丽等 . 特性关系粗糙集下属性值粗化细化时近似集增量更新方法研究 [J]. 计算机科学 .2010, 37(6) : 248-251] ; 吕国英、 钱宇华等基于动态粒度原理, 提出双向 近似的概念, 并将其应用于决策表中决策规则的获取 [ 吕国英, 钱宇华等 . 动态粒度下的粗 糙集双向近似 [J]. 计算工程与应用 .2009, 45(4) : 165-168] ; 属性增加或删除时, 在属性集 变化情形下, 关于决策规则集变化趋势以及规则集更新研究很少。钱宇华、 梁吉业等研究 了属性个数增减、 属性取值改变对知识粒度变化的影响, 并建立了知识粒度与规则确信度 之间的动态关系 [ 钱宇华, 梁吉业等 . 决策表决策规则与知识粒度 [J]. 电脑开发与应用, 2006, 19(3) : 27-29.]。 其主要思想是从规则的确信度的角度来研究决策规则集的动态变化 情况。 发明内容
本发明的目的是提供一种粗糙集中属性集变化时规则集动态更新方法, 从近似集 动态变化角度来讨论决策规则集的动态变化规律, 同时也提出了在条件属性集和决策属性 集同时变化时决策规则集的变化规律, 并给出了条件属性增加、 删除时决策规则集动态增 量更新方法。本发明为解决上述技术问题采取的技术方案是 : 本发明所述的粗糙集中属性集变 化时规则集动态更新方法基于以下定义来实现的 :
定义 1 : 给定知识库 K = (U, S), 其中 U 为论域, S 表示论域 U 上等价关系簇, 给定 论域 U 上的一个等价关系 R ∈ IND(K), 则 定义子集关于知识 R 上的下近似和上近 似分别为 :
并且 X 的 R- 下近似也称为正区域, 记为 posR(X) ;
定义 2 : 设给定一个论域 U 和论域 U 上的一个等价关系 R, 以及论域 U 的一个划分 π(U) = {X1, X2,…, Xn} ∈∏ (U), 且这个划分独立于 R ; 其中子 Xi(i = 1, 2,…, n) 是划 分 π(U) 的等价类 ; π(U) 的 R 下近似和上近似分别为 :
定义 3 : 一个决策信息系统以四个元组 T = (U, C ∪ D, V, f) 表示, 其中 U : U= {x1, x2, ..., xn} 为对象的非空有限集合, 称为论域 ; C∪D: C = {α|α ∈ C} 称为条件属性 集, 每个 αi ∈ C(1 ≤ j ≤ m) 称为 C 的一个简单属性 ; D = {d|d ∈ D} 称为决策系统属性 集, 且 是信息函数 f 的值域, 而 Vα 表示值域 ; 表示决策系统的信息函数, fα 为属性 α 的信息函数 ;
定义 4 : 设 T = (U, C ∪ D, V, f) 是一个决策信息系统, 令 Xi 和 Yi 分别代表 U/(C) 与 U/(D) 中的各个等价类, des(Xi) 表示对等价类的描述, 即等价类 Xi 对于各条件属性值的 特定取值 ; des(Yi) 表示对等价类的描述, 即等价类 Yi 对于各决策属性值的特定取值, 则决 策规则如下 :
rij : des(Xi) → des(Yi), 定义 5 : 给定决策信息系统 T = (U, C ∪ D, V, f), Xi ∈ U/IND(C), Yi ∈ U/IND(D),有
0 < μ(Xi, Yj) ≤ 1(6)当 μ(Xi, Yi) = 1 时, rij 是确定性规则 ; 当 0 < μ(Xi, Yj) < 1 时, rij 是不确定规 则, 或者说是近似规则。μ(Xi, Yj) 可解释为论域中给定对象属于 Xi 时, 该对象属于 Yj 的概 率;
在粗糙集模型中不可分辨类或等价类被看作是基本粒, 任意给定的一个属性子集 都可以诱导出对象集上的一个等价关系。一般来说, 从细粒度层次到粗粒度层次的转换可 以通过减少该属性子集中的元素来实现, 而通过向该属性子集增添新的属性则可以实现从 粗粒度层次到细粒度层次的转换 :
定义 6 : 设信息系统 Ts = (U, A, V, f), R 是 U 上的属性集, R 是 U 上的一个知识, S 表示论域 U 上等价关系簇, 存在有不可分辨关系 : 将 r 添加到 R 中, 称为知识细化, 记作
对于单个属性 r ∈ A,并且有 R 是 U 上的一个知识, S表 对于单个属性 r ∈ R, 将r从 若 则有 则有定义 7 : 设 Ts = (U, A, V, f), R 是 U 上的属性集, 并且有示论域 U 上等价关系簇, 存在有不可分辨关系 : R 中删除, 称为知识粗化, 记作
对论域 U, 设 α1, α2, … αt 是属性集, 对论域 U, 设 α1, α2,… αt 是属性集,是属性 α1, α2,…, αt-1, αt 决定的元素等价类, 若
知识的粗化细化能够表达出知识分辨能力的变化 ;
所述方法的具体过程为 :
A1、 当属性增加删除时近似集的变化情况时 :
A11、 属性增加是对知识的细化, 以下引理成立 :
设给定一个论域 U 和论域 U 上的一个等价关系 ( 知识 )R, 以及论域 U 的一个划分 X2,…, Xn} ∈∏ (U), 且这个划分独立于 R。其中, 子集 Xi(i = 1, 2,…, n) 是 π(U) = {X1, 划分 π(U) 的等价类。 属性 r 为新增加的属性 ( 知识细化 ), π(U) 的近似集的变化情况为 : R′ (π(U)), 分别表示知识细化后近似分类 的上、 下近似 ; ( 引理 1)
由此可以得出, 在粗糙集模型下, 当属性增加时下近似集基数及上近似集基数是 不减 ;
A12、 属性删除是对知识的粗化, 以下引理成立 :
设给定一个论域 U 和论域 U 上的一个等价关系 ( 知识 )R, 以及论域 U 的一个划分 ( 或称完备分类 )π(U) = {X1, X2, …, Xn} ∈∏ (U), 且这个划分独立于 R ; 其中子集 Xi(i = 1, 2,…, n) 是划分 π(U) 的等价类 ; R 中的属性 r 删除 ( 知识粗化 ), π(U) 的近似集的变 化情况为 :
( 引理 2) 分别表示知识粗化后近似分类的上、 下近似 ;R′ (π(U)),可以得出, 在粗糙集模型下, 当属性删除时下近似集基数及上近似集基数是不增的; A2、 当属性增加删除时决策规则集变化分析
当属性增加删除时可能会起引近似集的变化, 由粗糙集理论的基本概念知, 通过 近似集可以得到决策规则集, 所以近似集的变化势必引起决策规则集的变化 ;
在决策信息系统中 T = (U, C ∪ D, V, f), 当按条件属性形成等价类精确包含在按 决策属性集形成的等价类中, 对应着确定性规则, 即下近似集对应着决策系统的确定性规 则, 边界域对应着不协调决策系统的不确定性规则 ;
设 L = {l1, l2,…, lm} 是决策表 T = (U, C ∪ D, V, f) 的确定性决策规则集, 在属 性集增加或删除单个属性或多个属性后, 确定性决策规则集变化为 L′= {l′ 1, l′ 2, …, l′ n}。在决策信息系统中, 属性集变化时决策规则集的变化分为以下三种情况讨论 :
A21、 条件属性集变化, 决策属性集不变 ;
8102306190 A CN 102306197
说明书( 定理 3)4/17 页在决策系统 T = (U, C ∪ D, V, f) 中, 当条件属性增加, 当条件属性减少, 决策属性 D 不变时有, A22、 条件属性集不变, 决策属性集变化 ; 定理 4 在决策系统 T = (U, C ∪ D, V, f) 中, 当决策属性增加, 当决策属性减少, 条件属性 D 不变时有,决策属性 D 不变时有,
条件属性 C 不变时有,
证明 : 证明过程的原理与定理 3 类似, 此处略 ; A23、 条件属性集和决策属性集同时变化 : 定理 5 在决策系统 T = (U, C ∪ D, V, f) 中, 当条件属性增加, 当条件属性减少, 决策属性增加 有, 决策属性减少时有,
在决策系统 T = (U, C ∪ D, V, f) 中, 当条件属性和决策属性同时增加,时有, 若所有条件属性集 C 的等价类 [x]c 被包含在决策属性集 D 的等价类 [x]D 的集合元素 增加, 则有 反之, 则有 ( 定理 6)
在决策系统 T = (U, C ∪ D, V, f) 中, 当条件属性和决策属性同时减少,有, 若所有条件属性集 C 的等价类 [x]c 被包含在决策属性集 D 的等价类 [x]D 的集合元素减 反之, 则有 ( 定理 7) 少, 则有
以上表明, 在决策信息系统中, 当条件属性集增加, 决策属性集减少时, 确定性规 则集基数是不减的 ; 当决策属性集增加, 条件属性集减少时, 确定性规则集基数是不增的 ; 当条件属性集与决策属性集同时变化时, 依几种不同的情况规则集呈不同的变化 ;
步骤 B、 当属性增加、 删除时决策规则集增量更新方法 :
单属性决策信息系统中, 利用近似集的增量来实现条件属性增加、 删除时决策规 则集的更新过程为 :
在决策系统 T = (U, C ∪ D, V, f) 中, U 是论域, C 是条件属性集, D 是决策属性, V 为论域的属性值。设 属性集 B 对 U 的划分所形成的等价类为 EB = {EB1, EB2, …, EBn}, 决策属性 d ∈ D 对 U 的划分所形成的等价类为 Ed = {Ed1, Ed2, …, Edm}, Ed 关于条件属性集 B 的上近似集和下近似集分别用 条件属性集 B 添加一个属性 a 后的上近似集和下近似集分别用 表示 ; 从条件属性集 B 删除一个属性 b 后的上近似集和下 近似集分别用 示属性集变化后下近似集的增量, 集用
表示。表示。 ΔAprB(Ed) 表 表示属性集变化后上近似集的增量。决策规则 表示, 设 rik : des(Ei) → des(Ej) 表示为新增规则 ;B1、 条件属性增加时决策规则集增量更新算法 : 输入 T = (U, C ∪ D, V, f), 现有决策规则集 M, 新增属性 a ; 输出更新后的决策规则集 M′ ; 步骤 1、 计算 AprB(Ed), 步骤 2、 添加新增属性 a, a ∈ C, 计算 步骤 3、 若 步骤 4、 若 则计算9则决策规则集 M 不变 ;102306190 A CN 102306197
说若 若明书5/17 页步骤 5、 步 骤 6、则将决策规则 rik : des(EBi) → des(Edk) 更新为决 且 若 且 则 将 决 策 规 则 rjk : 则新增决策规策规则集
des(EBj) → des(Edk) 更新为 则
原有决策规则 rjk : des(EBj) → des(Edk) 保持不变 ; 步骤 7 输出更新后的决策规则集 M′, 算法结束 ; B2、 条件属性删除时决策规则集增量更新算法 : 输入 T = (U, C ∪ D, V, f), 现有决策规则集 M, 删除属性 b ; 输出 更新后的决策规则集 M′ ; 步骤 1、 计算 AprB(Ed), 步骤 2、 步骤 3、 若 步骤 4、 若 步骤 5、 若 若 步骤 6、 若 则计算 则将决策规则集 rik : des(EBi) → des(Edk) 更新 删除决策 rik : des(EBi) → des(Edk), 原有决策 则将决策规则 rjk : des(EBj) → des(Edk) 更新为 b ∈ B, 将属性 b 从 B 中删除, 计算 则决策规则集 M 不变 ;为规则
规则 rjk : des(EBj) → des(Edk) 保持不变 ;步骤 7 输出更新后的决策规则集 M′, 算法结束。
本发明的有益效果是 :
针对动态决策信息系统中属性集变化时, 分析了动态规则的变化趋势, 提出了属 性集变化时动态规则更新算法, 并通过实例验证了其正确性。以后的主要工作通过实验仿 真测试规则增量更新算法的性能, 以及分析扩展粗糙集模型下属性集变化时规则集的动态 变化及规则增量更新, 辅助各应用领域做出更好的决策。
具体实施方式
具体实施方式一 : 本实施方式所述的粗糙集中属性集变化时规则集动态更新方法 基于以下定义来实现的 :
定义 1 : 给定知识库 K = (U, S), 其中 U 为论域, S 表示论域 U 上等价关系簇, 给定 论域 U 上的一个等价关系 R ∈ IND(K), 则 定义子集关于知识 R 上的下近似和上近 似分别为 :
并且 X 的 R- 下近似也称为正区域, 记为 posR(X) ;
定义 2 : 设给定一个论域 U 和论域 U 上的一个等价关系 R, 以及论域 U 的一个划分 π(U) = {X1, X2,…, Xn} ∈∏ (U), 且这个划分独立于 R ; 其中子 Xi(i = 1, 2,…, n) 是划
分 π(U) 的等价类 ; π(U) 的 R 下近似和上近似分别为 :
定义 3 : 一个决策信息系统以四个元组 T = (U, C ∪ D, V, f) 表示, 其中 U : U= {x1, x2, ..., xn} 为对象的非空有限集合, 称为论域 ; C∪D: C = {α|α ∈ } 称为条件属性 集, 每个 αj ∈ C(1 ≤ j ≤ m) 称为 C 的一个简单属性 ; D = {d|d ∈ D} 称为决策系统属性 集, 且 是信息函数 f 的值域, 而 Vα 表示值域 ; 表示决策系统的信息函数, fα 为属性 α 的信息函数 ;
定义 4 : 设 T = (U, C ∪ D, V, f) 是一个决策信息系统, 令 Xi 和 Yj 分别代表 U/(C) 与 U/(D) 中的各个等价类, des(Xi) 表示对等价类的描述, 即等价类 Xi 对于各条件属性值的 特定取值 ; des(Yj) 表示对等价类的描述, 即等价类 Yj 对于各决策属性值的特定取值, 则决 策规则如下 :
rij : des(Xi) → des(Yj), 定义 5 : 给定决策信息系统 T = (U, C ∪ D, V, f), Xi ∈ U/IND(C), Yj ∈ U/IND(D),有
0 < μ(Xi, Yj) ≤ 1(6)当 μ(Xi, Yj) = 1 时, rij 是确定性规则 ; 当 0 < μ(Xi, Yj) < 1 时, rij 是不确定规 则, 或者说是近似规则。μ(Xi, Yj) 可解释为论域中给定对象属于 Xi 时, 该对象属于 Yj 的概 率;
在粗糙集模型中不可分辨类或等价类被看作是基本粒, 任意给定的一个属性子集 都可以诱导出对象集上的一个等价关系。一般来说, 从细粒度层次到粗粒度层次的转换可 以通过减少该属性子集中的元素来实现, 而通过向该属性子集增添新的属性则可以实现从 粗粒度层次到细粒度层次的转换 :
定义 6 : 设信息系统 Ts = (U, A, V, f), R 是 U 上的属性集, R 是 U 上的一个知 识, S 表示论域 U 上等价关系簇, 存在有不可分辨关系 : 将 r 添加到 R 中, 称为知识细化, 记作
对于单个属性 r ∈ A,并且有 R 是 U 上的一个知识, S表 对于单个属性 r ∈ R, 将r从 若 则有 则有定义 7 : 设 Ts = (U, A, V, f), R 是 U 上的属性集, 并且有示论域 U 上等价关系簇, 存在有不可分辨关系 : R 中删除, 称为知识粗化, 记作
对论域 U, 设 α1, α2, … αt 是属性集, 对论域 U, 设 α1, α2,… αt 是属性集,是属性 α1, α2,…, αt-1, αt 决定的元素等价类, 若
知识的粗化细化能够表达出知识分辨能力的变化 ; 所述方法的具体过程为 :A1、 当属性增加删除时近似集的变化情况时 :
A11、 属性增加是对知识的细化, 以下引理成立 :
设给定一个论域 U 和论域 U 上的一个等价关系 ( 知识 )R, 以及论域 U 的一个划分 π(U) = {X1, X2,…, Xn} ∈∏ (U), 且这个划分独立于 R。其中, 子集 Xi(i = 1, 2,…, n) 是 划分 π(U) 的等价类。 属性 r 为新增加的属性 ( 知识细化 ), π(U) 的近似集的变化情况为 : R′ (π(U)), 分别表示知识细化后近似分类 的上、 下近似 ; ( 引理 1)
由此可以得出, 在粗糙集模型下, 当属性增加时下近似集基数及上近似集基数是 不减 ;
A12、 属性删除是对知识的粗化, 以下引理成立 :
设给定一个论域 U 和论域 U 上的一个等价关系 ( 知识 )R, 以及论域 U 的一个划分 ( 或称完备分类 )π(U) = {X1, X2,…, Xn} ∈∏ (U), 且这个划分独立于 R。其中子集 Xi(i = 1, 2,…, n) 是划分 π(U) 的等价类。R 中的属性 r 删除 ( 知识粗化 ), π(U) 的近似集 的变化情况为 :
( 引理 2) 分别表示知识粗化后近似分类的上、 下近似 ;R′ (π(U)),可以得出, 在粗糙集模型下, 当属性删除时下近似集基数及上近似集基数是不增的; A2、 当属性增加删除时决策规则集变化分析
当属性增加删除时可能会起引近似集的变化, 由粗糙集理论的基本概念知, 通过 近似集可以得到决策规则集, 所以近似集的变化势必引起决策规则集的变化 ;
在决策信息系统中 T = (U, C ∪ D, V, f), 当按条件属性形成等价类精确包含在按 决策属性集形成的等价类中, 对应着确定性规则, 即下近似集对应着决策系统的确定性规 则, 边界域对应着不协调决策系统的不确定性规则。
设 L = {l1, l2,…, lm} 是决策表 T = (U, C ∪ D, V, f) 的确定性决策规则集, 在属 性集增加或删除单个属性或多个属性后, 确定性决策规则集变化为 L′= {l′ 1, l′ 2, …, l′ n}。在决策信息系统中, 属性集变化时决策规则集的变化分为以下三种情况讨论 :
A21、 条件属性集变化, 决策属性集不变 ;
在决策系统 T = (U, C ∪ D, V, f) 中, 当条件属性增加, 当条件属性减少, 决策属性 D 不变时有,决策属性 D 不变时有,
( 定理 3)证明 : 根据定义 5 及定理 1 可知, 当条件属性增加, 即知识细化时, 由其条件属性划 分的等价类增加, 此时有 [X]C′是 [X]C 的一个分解。由粗糙集理论的下近似集 的概念知, 在决策信息系统中, 集合的下近似集和确定性决策规则相对应, 其变化相一致, 又由于 可得 即 进而得出 证毕。 同理, 容 易得证, 当条件属性减少,
决策属性 D 不变时有, 条件属性 C 不A22、 条件属性集不变, 决策属性集变化 ; 定理 4 在决策系统 T = (U, C ∪ D, V, f) 中, 当决策属性增加, 当决策属性减少, 条件属性 D 不变时有, 证明 : 证明过程的原理变时有,与定理 3 类似, 此处略 ;A23、 条件属性集和决策属性集同时变化 : 定理 5 在决策系统 T = (U, C ∪ D, V, f) 中, 当条件属性增加, 当条件属性减少, 决策属性增加 有, 决策属性减少时有,
证明 : 证明过程的原理结合定理 3 和定理 6 证明思路即可得证, 此处略。 在决策系统 T = (U, C ∪ D, V, f) 中, 当条件属性和决策属性同时增加,时有, 若所有条件属性集 C 的等价类 [x]c 被包含在决策属性集 D 的等价类 [x]D 的集合元素 增加, 则有 反之, 则有 ( 定理 6)
证明 : 设 Z = [X]C ∩ [X]D 是属性集变化前条件属性集 C 的等价类 [x]c 被包含在 决策属性集 D 的等价类 [x]D 的集合, 根据定义 6 及定理 1 可知, 当条件属性和决策属性同时 增加, 即知识细化时, 由其条件属性和决策属性划分的等价类均减少, 此时有 [X]C 是 [X]C′的分解, [X]D′是 [X]D 的分解, Z′= [X]C′∩ [X]D′, 若所有条件 属性集 C 的等价类 [x]c 被包含在决策属性集 D 的等价类 [x]D 的集合元素减少, 则有 又由于
可得,即进而得出证毕。在决策系统 T = (U, C ∪ D, V, f) 中, 当条件属性和决策属性同时减少,有, 若所有条件属性集 C 的等价类 [x]c 被包含在决策属性集 D 的等价类 [x]D 的集合元素减 少, 则有 反之, 则有 ( 定理 7)
证明 : 证明过程的原理与定理 6 类似, 此处略。
以上表明, 在决策信息系统中, 当条件属性集增加, 决策属性集减少时, 确定性规 则集基数是不减的 ; 当决策属性集增加, 条件属性集减少时, 确定性规则集基数是不增的 ; 当条件属性集与决策属性集同时变化时, 依几种不同的情况规则集呈不同的变化 ;
步骤 B、 当属性增加、 删除时决策规则集增量更新方法 :
单属性决策信息系统中, 利用近似集的增量来实现条件属性增加、 删除时决策规 则集的更新过程为 :
在决策系统 T = (U, C ∪ D, V, f) 中, U 是论域, C 是条件属性集, D 是决策属性, V 为论域的属性值。设 属性集 B 对 U 的划分所形成的等价类为 EB = {EB1, EB2, …, EBn}, 决策属性 d ∈ D 对 U 的划分所形成的等价类为 Ed = {Ed1, Ed2, …, Edm}, Ed 关于条件属性集 B 的上近似集和下近似集分别用 条件属性集 B 添加一个属性 a 后的上近似集和下近似集分别用 表示 ; 从条件属性集 B 删除一个属性 b 后的上近似集和下 近似集分别用 表示属性集变化后下近似集的增量, 则集用
表示。表示。ΔAprB(Ed) 表示属性集变化后上近似集的增量。决策规 表示, 设 rik : des(Ei) → des(Ej) 表示为新增规则 ;B1、 条件属性增加时决策规则集增量更新算法 : 输入 T = (U, C ∪ D, V, f), 现有决策规则集 M, 新增属性 a ; 输出 更新后的决策规则集 M′ ; 步骤 1、 计算 AprB(Ed), 步骤 2、 添加新增属性 a, a ∈ C, 计算13102306190 A CN 102306197
说明书则决策规则集 M 不变 ;9/17 页步骤 3、 若 步骤 4、 若 步骤 5、 步 骤 6、 若 若 则计算则将决策规则 rik : des(EBi) → des(Edk) 更新为决 且 若 且 则 将 决 策 规 则 rjk : 则新增决策规策规则集
des(EBj) → des(Edk) 更新为 则
原有决策规则 rjk : des(EBj) → des(Edk) 保持不变 ; 步骤 7 输出更新后的决策规则集 M′, 算法结束 ; B2、 条件属性删除时决策规则集增量更新算法 : 输入 T = (U, C ∪ D, V, f), 现有决策规则集 M, 删除属性 b ; 输出 更新后的决策规则集 M′ ; 步骤 1、 计算 步骤 2、 步骤 3、 若 步骤 4、 若 步骤 5、 若 若 步骤 6、 若 则计算 则将决策规则集 rik : des(EBi) → des(Edk) 更新 删除决策 rik : des(EBi) → des(Edk), 原有决策 则将决策规则 rjk : des(EBj) → des(Edk) 更新为 b ∈ B, 将属性 b 从 B 中删除, 计算 则决策规则集 M 不变 ;为规则
des(EBj) → des(Edk) 保持不变 ; 规则 rjk :步骤 7 输出更新后的决策规则集 M′, 算法结束。
针对本发明方法结合例子进行说明 :
1、 相关知识
定义 1[2]( 集合的下近似和上近似 ) 给定知识库 ( 近似空间 )K = (U, S), 其中 U 为 论域, S 表示论域 U 上等价关系簇, 给定论域 U 上的一个等价关系 R ∈ IND(K), 则 定 义子集 ( 概念或信息粒 ) 关于知识 R 上的下近似和上近似分别为
并且 X 的 R- 下近似也称为正区域, 记为 posR(X)。 [2]
定义 2 ( 近似分类的上近似和下近似 ) 设给定一个论域 U 和论域 U 上的一个等价 关系 ( 知识 )R, 以及论域 U 的一个划分 ( 或称完备分类 )π(U) = {X1, X2, …, Xn} ∈∏ (U), 且这个划分独立于 R。其中子集 Xi(i = 1, 2, …, n) 是划分 π(U) 的等价类。π(U) 的 R 下 近似和上近似分别为
定义 3[2]( 决策信息系统 ) 一个决策信息系统以四个元组 T = (U, C ∪ D, V, f) 表 示, 其中 U : U = {x1, x2, ..., xn} 为对象的非空有限集合, 称为论域 ; C∪D: C = {α|α ∈ C} 称为条件属性集, 每个 αj ∈ C(1 ≤ j ≤ m) 称为 C 的一个简单属性 ; D = {d|d ∈ D} 称为决 策系统属性集, 且 是信息函数 f 的值域, 而 Vα 表示值域 ; 表示决策系统的信息函数, fα 为属性 α 的信息函 数。
定义 4[1]( 决策规则 ) 设 T = (U, C ∪ D, V, f) 是一个决策信息系统, 令 Xi 和 Yj 分 别代表 U/(C) 与 U/(D) 中的各个等价类, des(Xi) 表示对等价类的描述, 即等价类 Xi 对于各 条件属性值的特定取值 ; des(Yj) 表示对等价类的描述, 即等价类 Yj 对于各决策属性值的特 定取值, 则决策规则如下 :
rij : des(Xi) → des(Yj),定义 5[1]( 规则的确定因子 ) 给定决策信息系统 T = (U, C ∪ D, V, f), Xi ∈ U/ IND(C), Yj ∈ U/IND(D), 有
0 < μ(Xi, Yj) ≤ 1(6)当 μ(Xi, Yj) = 1 时, rij 是确定性规则 ; 当 0 < μ(Xi, Yj) < 1 时, rij 是不确定规 则, 或者说是近似规则。μ(Xi, Yj) 可解释为论域中给定对象属于 Xi 时, 该对象属于 Yj 的概 率。
2、 知识粗化细化
在粗糙集模型中不可分辨类或等价类被看作是基本粒, 任意给定的一个属性子集 都可以诱导出对象集上的一个等价关系。一般来说, 从细粒度层次到粗粒度层次的转换可 以通过减少该属性子集中的元素来实现, 而通过向该属性子集增添新的属性则可以实现从 粗粒度层次到细粒度层次的转换。
定义 6 设信息系统 Ts = (U, A, V, f), R 是 U 上的属性集, R 是 U 上的一个知 识, S 表示论域 U 上等价关系簇, 存在有不可分辨关系 : 将 r 添加到 R 中, 称为知识细化, 记作
对于单个属性 r ∈ A,并且有 R 是 U 上的一个知识, S表 对于单个属性 r ∈ R, 将r从 若 则有定义 7 设 Ts = (U, A, V, f), R 是 U 上的属性集, 并且有示论域 U 上等价关系簇, 存在有不可分辨关系 : R 中删除, 称为知识粗化, 记作
定理 1[4] 对论域 U, 设 α1, α2, … αt 是属性集, 定 理 2[4] 对 论 域 U, 设 α1, α2, … αt 是 属 性 集,
是 属 性 α1, α2, …, αt-1, αt 决 定 的 元 素 等 价 类,若 则有
知识的粗化细化能够表达出知识分辨能力的变化。 3 当属性集变化时所引起的决策规则集的变化3.1 当属性增加删除时近似集的变化情况
(1) 属性增加是对知识的细化, 以下引理成立
引理 1 设给定一个论域 U 和论域 U 上的一个等价关系 ( 知识 )R, 以及论域 U 的一个 划分 π(U) = {X1, X2,…, Xn} ∈∏ (U), 且这个划分独立于 R。其中, 子集 Xi(i = 1, 2,…, n) 是划分 π(U) 的等价类。属性 r 为新增加的属性 ( 知识细化 ), π(U) 的近似集的变化 情况为 : R ′ (π(U)), 分别表示知识细化后 近似分类的上、 下近似。
由此可以得出, 在粗糙集模型下, 当属性增加时下近似集基数及上近似集基数是 不减的。
(2) 属性删除是对知识的粗化, 以下引理成立
引理 2 设给定一个论域 U 和论域 U 上的一个等价关系 ( 知识 )R, 以及论域 U 的一 个划分 ( 或称完备分类 )π(U) = {X1, X2,…, Xn} ∈∏ (U), 且这个划分独立于 R。其中子 集 Xi(i = 1, 2,…, n) 是划分 π(U) 的等价类。R 中的属性 r 删除 ( 知识粗化 ), π(U) 的 近似集的变化情况为 :
R′ (π(U)),分别表示知识粗化后近似分类的上、 下近似。可以得出, 在粗糙集模型下, 当属性删除时下近似集基数及上近似集基数是不增的。 3.2 当属性增加删除时决策规则集变化分析
当属性增加删除时可能会起引近似集的变化, 由粗糙集理论的基本概念知, 通过 近似集可以得到决策规则集, 所以近似集的变化势必引起决策规则集的变化。
在决策信息系统中 T = (U, C ∪ D, V, f), 当按条件属性形成等价类精确包含在按 决策属性集形成的等价类中, 对应着确定性规则, 即下近似集对应着决策系统的确定性规 则, 边界域对应着不协调决策系统的不确定性规则。
设 L = {l1, l2,…, lm} 是决策表 T = (U, C ∪ D, V, f) 的确定性决策规则集, 在属 性集增加或删除单个属性或多个属性后, 确定性决策规则集变化为 L′= {l′ 1, l′ 2, …, l′ n}。在决策信息系统中, 属性集变化时决策规则集的变化分为以下三种情况讨论 :
(1) 条件属性集变化, 决策属性集不变。
定理 3 在决策系统 T = (U, C ∪ D, V, f) 中, 当条件属性增加, 当条件属性减少, 决策属性 D 不变时有,决策属性 D 不变时有,
证明 : 根据定义 5 及定理 1 可知, 当条件属性增加, 即知识细化时, 由其条件属性划 分的等价类增加, 此时有 [X]C′是 [X]C 的一个分解。由粗糙集理论的下近似集 的概念知, 在决策信息系统中, 集合的下近似集和确定性决策规则相对应, 其变化相一致, 又由于 可得 即 进而得出 证毕。 同理, 容 易得证, 当条件属性减少,
决策属性 D 不变时有, 条件属性 C 不(2) 条件属性集不变, 决策属性集变化。 定理 4 在决策系统 T = (U, C ∪ D, V, f) 中, 当决策属性增加, 当决策属性减少, 条件属性 D 不变时有, 证明 : 证明过程的原理变时有,与定理 3 类似, 此处略。(3) 条件属性集和决策属性集同时变化。 定理 5 在决策系统 T = (U, C ∪ D, V, f) 中, 当条件属性增加, 当条件属性减少, 决策属性增加 有, 决策属性减少时有,
证明 : 证明过程的原理结合定理 3 和定理 6 证明思路即可得证, 此处略。 定理 6 在决策系统 T = (U, C ∪ D, V, f) 中, 当条件属性和决策属性同时增加,时有, 若所有条件属性集 C 的等价类 [x]c 被包含在决策属性集 D 的等价类 [x]D 的集 反之, 则有 合元素增加, 则有
证明 : 设 Z = [X]C ∩ [X]D 是属性集变化前条件属性集 C 的等价类 [x]c 被包含在 决策属性集 D 的等价类 [x]D 的集合, 根据定义 6 及定理 1 可知, 当条件属性和决策属性同时 增加, 即知识细化时, 由其条件属性和决策属性划分的等价类均减少, 此时有 [X]C 是 [X]C′的分解, [X]D′是 [X]D 的分解, Z′= [X]C′∩ [X]D′若所有条件属 性集 C 的等价类 [x]c 被包含在决策属性集 D 的等价类 [x]D 的集合元素减少, 则有 又 由于
可得,即进而得出证毕。定理 7 在决策系统 T = (U, C ∪ D, V, f) 中, 当条件属性和决策属性同时减少,有, 若所有条件属性集 C 的等价类 [x]c 被包含在决策属性集 D 的等价类 [x]D 的集合 反之, 则有 元素减少, 则有
证明 : 证明过程的原理与定理 6 类似, 此处略。
以上表明, 在决策信息系统中, 当条件属性集增加, 决策属性集减少时, 确定性规 则集基数是不减的 ; 当决策属性集增加, 条件属性集减少时, 确定性规则集基数是不增的 ; 当条件属性集与决策属性集同时变化时, 依几种不同的情况规则集呈不同的变化。
下面的实例是条件属性集和决策属性集同时减少时决策规则集的变化情况, 其它 实例不再一一列举。
例 1 表 1[5] 是一个决策表。决策表由 8 个对象, 4 个条件属性, 4 个决策属性组成。
表 1 决策表
解: 决策表的论域 U = {1, 2,…, 8}, 得
(1) 设初条件属性集 C1 = {α1, α2, α3, α4}, 决策属性集 D = {d1, d2, d3, d4}, πC(U) = {X1, X2, X3, X 4, X5}, |πc(U)| = 5, 其中, X1 = {1, 3}, X2 = {2, 4}, X3 = {5}, X4 = {6}, X5 = {7, 8}。
πD(U) = {Y1, Y2, Y3, Y 4, Y5, Y6}, 其中 Y1 = {1}, Y2 = {2}, Y3 = {3}, Y4 = {4}, Y5 = {5, 6}, Y6 = {7, 8}, rc(D) = πC(U), |rc(D)| = 3, |dv| = 0。
|dv| = 0, 则决策信息系统为协调决策信息系统, 只存在有确定性规则。
确定性规则确定性决策规则集 ri(d) 条数 : k = |rc(D)| = 3。
(2) 当从条件属性集 C1 中删除属性元素 α2, 从决策属性集 D 中删除属性元素 d2, 此时 C2 = {α1, α 2, α4}, D = {d1, d3, d4}, 则 πc(U) = {X1, X2, X3, X4}, 其中 X1 = {1, 3}, X2 = {2, 4}, X3 = {5, 6}, X4 = {7, 8}。
πD(U) = {Y1, Y2, Y3, Y4, Y5, Y6}, 其中 Y1 = {1}, Y2 = {2}, Y3 = {3}, Y4 = {4}, Y5 = {5, 6}, Y6 = {7, 8}, rc(D) = {Z1, Z2}, |rc(D)| = 2, 其中 Z1 = {5, 6}, Z2 = {7, 8}。
dv = πc(U)-rc(D) = {W1, W2}, |dv| = 2, W1 = {1, 3}, W2 = {2, 4}。
0 < |dv| < |πc(U)|, 则决策信息系统为不协调决策信息系统, 既存在有确定性 规则, 又有不确定性规则。
确定性规则确定性决策规则集 ri(d) 条数 : k = |rc(D)| = 2 ; 不确定性决策规
则集 ru(d) 条数 : Wl 与 Yj 的交集不为空的集合对的个数 所以 : t = 4。
确定性规则及不确定性规则不再一一列出。
从例 1 看到, 当条件属性集和决策属性集同时减少时, 且下近似集相比属性集变 化前是增加时, 确定性规则集是减少的。 同时也看到, 随着属性的增加或删除实例中的不确 定性规则集变化不定, 是没有规律可循的。
综上, 在决策信息系统中, 当属性增加删除时会引起近似集和边界域的变化, 对于 下近似集的变化会引起确定性的规则集的规律性变化, 边界域对应不确定性规则集, 由于 属性的增加或删除都有可能引起协调性决策信息系统和非协调性决策信息系统之间的转 换, 所以说属性集的变化对边界域的变化没有一定的规律可循, 从而也不能进一步得出当 属性增加删除时不确定性规则集的变化趋势。
4、 当属性增加、 删除时决策规则集增量更新方法
下面只讨论单属性决策信息系统中, 利用近似集的增量来实现条件属性增加、 删 除时决策规则集的更新。
在决策系统 T = (U, C ∪ D, V, f) 中, U 是论域, C 是条件属性集, D 是决策属性, V 为论域的属性值。设 属性集 B 对 U 的划分所形成的等价类为 EB = {EB1, EB2, …, EBn}, 决策属性 d ∈ D 对 U 的划分所形成的等价类为 Ed = {Ed1, Ed2, …, Edm}, Ed 关于条件属性集 B 的上近似集和下近似集分别用 条件属性集 B 添加一个属性 a 后的上近似集和下近似集分别用 表示 ; 从条件属性集 B 删除一个属性 b 后的上近似集和下 近似集分别用 示属性集变化后下近似集的增量, 集用
表示。表示。 ΔAprB(Ed) 表 表示属性集变化后上近似集的增量。决策规则 表示, 设 rik : des(Ei) → des(Ej) 表示为新增规则。4.1 条件属性增加时决策规则集增量更新算法 输入 T = (U, C ∪ D, V, f), 现有决策规则集 M, 新增属性 a。 输出 更新后的决策规则集 M′。 步骤 1 计算 AprB(Ed), 步骤 2 添加新增属性 a, a ∈ C, 计算 步骤 3 若 步骤 4 若 步骤 5 步 骤6 若 若 则计算 则将决策规则 rik : des(EBi) → des(Edk) 更新为决 且 若 且 则 将 决 策 规 则 rjk : 则新增决策规则 则决策规则集 M 不变 ;策规则集
des(EBj) → des(Edk) 更新为
原有决策规则 rjk : des(EBj) → des(Edk) 保持不变。 步骤 7 输出更新后的决策规则集 M′, 算法结束。 4.2 条件属性删除时决策规则集增量更新算法输入 输出 步骤 2T = (U, C ∪ D, V, f), 现有决策规则集 M, 删除属性 b。 更新后的决策规则集 M′。 b ∈ B, 将属性 b 从 B 中删除, 计算 则决策规则集 M 不变 ; 则计算 若 若 则将决策规则集 rik : des(EBi) → des(Edk) 更新 删除决策 rik : des(EBi) → des(Edk), 原有决策 则将决策规则 rjk : des(EBj) → des(Edk) 更新为步骤 1 计算 AprB(Ed), 步骤 3 若 步骤 4 若 步骤 5为规则
规则 rjk : des(EBj) → des(Edk) 保持不变 ; 步骤 6 若步骤 7 输出更新后的决策规则集 M′, 算法结束。
下面只对条件属性增加时决策规则集的更新举例如下, 条件属性删除时决策规则 集的更新不再列出。
例2: 表 2 是关于某些病人的决策表, U = {e1, e2,…, e8}, 条件属性集 C = {α, β, γ}, 决策属性 D = {d}。
U/{α} = {{e1, e2, e3}, {e4, e5, e6, e7, e8}} ; U/{α, β} = {{e1, e2, e3}, {e4, e6, e8}, {e5, e7}} ;
U/{α, β, γ} = {{e1}, {e2}, {e3}, {e4}, {e6, e8}, {e5, e7}} ; U/{d} = {{e2, e3, e6, e7}, {e1, e4, e5, e8}}。
表 2( 决策表 )
设 B = {α, β},因此有, EB1 = {e1, e2, e3}, Eb2 = {e4, e6, e8}, EB3 = {e5, e7}, 决策规则集Ed1 = {e2, e3, e6, e7}, Ed2 = {e1, e4, e 5, e8}, M:
r11 : des(EB1) → des(Ed1), ( 头痛, 是 ) 且 ( 肌肉痛, 是 ) → ( 流感, 否 ) 规则的确定 性因子为 0.5。
r12 : des(EB1) → des(Ed2), ( 头痛, 是 ) 且 ( 肌肉痛, 是 ) → ( 流感, 是 ) 规则的确定 性因子为 0.5。
r21 : des(EB2) → des(Ed1), ( 头痛, 否 ) 且 ( 肌肉痛, 是 ) → ( 流感, 否 ) 规则的确定 性因子为 0.5。
r22 : des(EB2) → des(Ed2), ( 头痛, 否 ) 且 ( 肌肉痛, 是 ) → ( 流感, 是 ) 规则的确定 性因子为 0.5。
r31 : des(EB3) → des(Ed1), ( 头痛, 否 ) 且 ( 肌肉痛, 否 ) → ( 流感, 否 ) 规则的确定 性因子为 0.5。
r32 : des(EB3) → des(Ed2), ( 头痛, 否 ) 且 ( 肌肉痛, 否 ) → ( 流感, 是 ) 规则的确定 性因子为 0.5。
设属性 γ ∈ C, 将属性 γ 添加到 B, 决策规则集更新如下 :
21102306190 A CN 102306197说有 且明书17/17 页
(1)则将决策规则 r11, r12 更新如下:
( 头痛, 是 ) 且 ( 肌肉痛, 是 ) 且 ( 体温, 正常 ) → ( 流感, ( 头痛, 是 ) 且 ( 肌肉痛, 是 ) 且 ( 体温, 高 ) → ( 流感, 是 )。 ( 头痛, 是 ) 且 ( 肌肉痛, 是 ) 且 ( 体温, 很高 ) → ( 流感, (2) 有 且 则 新 增 决 策 规 则否 )。
是 )。
原 有 决 策 规 则 r2k : des(EB2) → des(Edk) 保 持 不 变, 有 ( 头痛, 否 ) 且 ( 肌肉痛, 是 ) 且 ( 体温, 正常 ) → ( 流感, 否 )。 r21 : des(EB2) → des(Ed1), ( 头痛, 否 ) 且 ( 肌肉痛, 是 ) 且 ( 体温, 很高 ) → ( 流 感, 否 ) 规则的确定性因子为 0.5。
r22 : des(EB2) → des(Ed2), ( 头痛, 否 ) 且 ( 肌肉痛, 是 ) 且 ( 体温, 很高 ) → ( 流 感, 是 ) 规则的确定性因子为 0.5。
(3) 设属性 γ ∈ C, 将属性 γ 添加到 B, 更新后的决策规则集 M′如下 :
( 头痛, 是 ) 且 ( 肌肉痛, 是 ) 且 ( 体温, 正常 ) → ( 流感, 否 )。
( 头痛, 是 ) 且 ( 肌肉痛, 是 ) 且 ( 体温, 高 ) → ( 流感, 是 )。
( 头痛, 是 ) 且 ( 肌肉痛, 是 ) 且 ( 体温, 很高 ) → ( 流感, 是 )。
( 头痛, 否 ) 且 ( 肌肉痛, 是 ) 且 ( 体温, 正常 ) → ( 流感, 否 )。
( 头痛, 否 ) 且 ( 肌肉痛, 是 ) 且 ( 体温, 很高 ) → ( 流感, 否 ) 规则的确定性因子 为 0.5。
( 头痛, 否 ) 且 ( 肌肉痛, 是 ) 且 ( 体温, 很高 ) → ( 流感, 是 ) 规则的确定性因子 为 0.5。
总结 : 针对动态决策信息系统中属性集变化时, 分析了动态规则的变化趋势, 提出 了属性集变化时动态规则更新算法, 并通过实例验证了其正确性。以后的主要工作通过实 验仿真测试规则增量更新算法的性能, 以及分析扩展粗糙集模型下属性集变化时规则集的 动态变化及规则增量更新, 辅助各应用领域做出更好的决策。
22