《基于粗糙集和集成学习的人脸识别方法.pdf》由会员分享,可在线阅读,更多相关《基于粗糙集和集成学习的人脸识别方法.pdf(12页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 (43)申请公布日 (21)申请号 201410704349.3 (22)申请日 2014.11.26 G06K 9/62(2006.01) (71)申请人 西安电子科技大学 地址 710071 陕西省西安市太白南路 2 号 (72)发明人 焦李成 郭雨薇 屈嵘 王爽 侯彪 杨淑媛 马文萍 马晶晶 戎凯旋 (74)专利代理机构 陕西电子工业专利中心 61205 代理人 王品华 朱红星 (54) 发明名称 基于粗糙集和集成学习的人脸识别方法 (57) 摘要 本发明公开了一种基于粗糙集和集成学习的 人脸识别方法。其步骤为 : 1. 提取人脸图像并预 处理, 产生决策表 ; 2.。
2、 对决策表进行属性约减, 得 到最佳属性约减空间 ; 3. 从最佳属性约减空间中 随机选择一组最佳属性约减组合并保存 ; 4. 计算 最佳属性约减组合中每一个条件属性的依赖度 值 ; 5. 根据依赖度值缩小约减空间 ; 6. 从缩小的 约减空间中选择一组最佳属性约减组合并保存 ; 7. 判断保存的最佳属性约减组合的数量是否达 到预先设定的值, 若是, 则返回 4., 否则, 用保存 的最佳属性约减组合训练基本分类器, 识别人脸 图像。 本发明通过对人脸图像的属性约减, 提高了 人脸图像的识别率和稳定性。 可用于反恐安全、 案 件调查取证及商业、 个人隐私保密。 (51)Int.Cl. (19)。
3、中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书3页 说明书6页 附图2页 (10)申请公布号 CN 104408468 A (43)申请公布日 2015.03.11 CN 104408468 A 1/3 页 2 1. 一种基于粗糙集和集成学习的人脸识别方法, 包括如下步骤 : (1) 人脸图像预处理 : (1a) 从标准人脸库中获取 T 幅人脸图像, 并将其划分成 N 幅训练样本图像和 M 幅测试 样本图像, 其中 T 2,N 1,M 1,N+M T ; (1b)为训练样本图像建立决策表S, 它是一个NL矩阵, 每一行代表一幅人脸图像, 每 一列代表人脸图像的一个属性特征, 其。
4、中L2, 前L-1列表示图像的条件属性, 第L列表示图 像的决策属性 ; (2) 对决策表 S 进行属性约减, 产生多组最佳属性约减组合, 用这些最佳属性约减组合 构成一个最佳属性的约减空间 K A1,Ai,Az, 其中 Ai为第 i 组最佳属性约减组合, i 1,.,z, z 2, Ai c1,cj,cn, cj为图像的第 j 个条件属性, j 1,.,n, 12, 前 L-1 列表示图像的条件属性, 第 L 列 表示图像的决策属性 ; 0012 (2) 对决策表 S 进行属性约减, 产生多组最佳属性约减组合, 用这些最佳属性约减 组合构成一个最佳属性的约减空间KA1,Ai,Az, 其中Ai。
5、为第i组最佳属性约减组 合, i 1,.,z, z 2, Ai c1,cj,cn, cj为图像的第 j 个条件属性, j 1,.,n, 1nL ; 0013 (3) 从最佳属性约减空间中, 随机选择一组最佳属性约减组合, 并保存。 0014 (4) 计算最新保存的最佳属性约减组合中每一个条件属性的依赖度值公式 : 其中rP(cj)为条件属性cj对P的依赖度值, P为从最佳属性约减组合中 删除条件属性 cj后的属性集, POSP(cj) 为条件属性 cj相对属性集 P 的正区域, | 为 “” 的势 ; 0015 (5) 找出最大的依赖度值所对应的条件属性 cm, 其中 m 1,n, 从约减空间。
6、 K 中 删除包含该条件属性 cm的最佳属性约减组合, 用剩余的最佳属性约减组合构成一个缩小的 约减空间 ; 0016 (6) 从缩小的约减空间中, 利用准确 - 多样评估函数选择一组最佳属性约减组合, 并保存。 0017 (7) 判断保存的最佳属性约减组合的数量是否达到预先设定的值 : 如果数量达不 到预先设定的值, 则返回步骤 (4), 如果数量达到预先设定的值, 则执行步骤 (8) ; 0018 (8) 利用保存的每一个最佳属性约减组合构建一个训练样本集, 得到重新构建的 多组训练样本集 ; 用每一个训练样本集训练一个基本分类器, 利用不同的基本分类器对测 试样本集进行分类, 得到不同的。
7、分类结果 ; 采用集成学习中的多数投票法融合这些不同的 分类结果, 得到测试样本集的最终识别结果。 0019 本发明具有如下优点 : 0020 1. 本发明方法由于利用模糊粗糙集算法对人脸图像进行属性约减, 有效弥补了传 统的属性约减方法降低了属性分辨能力的缺陷。 0021 2. 本发明方法由于采用集成学习的分类方法, 改善了传统单个分类器分类正确率 较低和鲁棒性较差的问题。 附图说明 0022 图 1 是本发明的实现流程图 ; 0023 图 2 是 ORL 和 CMU PIE 数据库中的人脸图像示意图 ; 0024 图 3 是基本分类器的个数对于本发明性能的影响曲线图。 具体实施方式 002。
8、5 参照图 1, 本发明的具体实施步骤如下 : 0026 步骤 1、 人脸图像预处理。 0027 (1a) 选取人脸图像。 说 明 书 CN 104408468 A 6 3/6 页 7 0028 本实例使用 ORL 和 CMU PIE 两组标准人脸库, 从 ORL 中选取由 40 个人组成的 400 幅图像, 从 CMU PIE 中选取由 68 人组成的 3329 幅图像 ; 利用 MATLAB 软件中的 imresize 函 数将图像的大小调整到 3232, 如图 2 所示, 其中图 2(a) 为 ORL 数据库中第一个人的人脸 图像示意图, 图 2(b) 为 CMU PIE 数据库中第一个。
9、人的人脸图像示意图。 0029 从每组人脸图像中随机选取一半图像作为训练样本图像, 另一半图像作为测试样 本图像。 0030 (1b)为训练样本图像建立决策表S : 利用MATLAB软件中的reshape函数分别将每 一幅人脸图像转换成一个行向量, 在本实施例中每个行向量包含 1024 个元素, N 幅人脸图 像形成一个N1024的矩阵A ; 用N幅人脸图像的决策属性形成一个N1的列向量B ; 将得 到的矩阵 A 与列向量 B 合并, 得到 N 幅训练样本图像的决策表 S, 它是一个 N1025 矩阵。 0031 步骤 2、 对决策表 S 进行属性约减。 0032 本实施例利用Richard 。
10、Jensen编写的嵌入到weka软件中的模糊粗糙集算法对决 策表 S 进行属性约减, 产生多组最佳属性约减组合, 用这些最佳属性约减组合构成一个最 佳属性约减空间 K A1,Ai,Az, 其中 Ai为第 i 组最佳属性约减组合, i 1,.,z, z 2, Ai c1,cj,cn, cj为图像的第 j 个条件属性, j 1,.,n, 1nL ; 0033 对决策表 S 进行属性约减的方法不局限于模糊粗糙集算法, 除了模糊粗糙集算法 还可以使用 WADF 算法, 具体参见 Multiknowledge for decision making Knowledge and information s。
11、ystems,2005,7(2):246-266。 0034 步骤 3、 从最佳属性约减空间中, 随机选择一组最佳属性约减组合, 并保存。 0035 步骤 4、 计算最新保存的最佳属性约减组合中每一个条件属性的依赖度值。 0036 (4a)训练样本集Ux1,xk,xN, 其中xk为第k个样本图像, 对于属性集P, 计算不可分辨关系 I(P) : 0037 0038 其中, P 为从最佳属性约减组合中删除条件属性 cj后的属性集, c 为属性集 P 中的 条件属性, xl为第 l 个样本图像, g(xk,c) 表示第 k 个样本图像的第 c 个属性所对应的值, g(xl,c) 表示第 l 个样本。
12、图像的第 c 个属性所对应的值 ; 0039 (4b) 根据步骤 (4a) 得到的不可分辨关系, 计算基于属性集 P 产生的等价类 xP: xP x|(xk,xl) I(P),x U ; 0040 (4c) 根据步骤 (4b) 中得到的等价类, 计算属性集 P 对于样本集 X 的下近似 和上近似 0041 0042 其中, X 是基于属性集 ci产生的等价类表示包含, 表示相交, 表示空 集 ; 0043 (4d) 根据步骤 (4c) 中得到的下近似计算条件属性 cj相对属性集 P 的正 区域 : 说 明 书 CN 104408468 A 7 4/6 页 8 0044 0045 (4e) 根据。
13、步骤 (4d) 中得到的条件属性 cj相对属性集 P 的正区域 POSP(cj), 计算 最佳属性约减组合中每一个条件属性的依赖度值 : 0046 0047 其中, | 表示 “” 的势。 0048 步骤 5、 构造缩小的约减空间。 0049 找出最大的依赖度值所对应的条件属性 cm, 其中 m 1,n, 从约减空间 K 中删除 包含该条件属性 cm的最佳属性约减组合, 用剩余的最佳属性约减组合构成一个缩小的约减 空间。 0050 步骤 6、 从缩小的约减空间中, 利用准确 - 多样评估函数选择一组最佳属性约减组 合, 并保存。 0051 (6a) 计算基本分类器的经验损失 Aemp(Ft,N。
14、) : 0052 0053 其中, 基本分类器组 Ft由多个已确定的分类器和一个基本分类器组成, 这些已确 定的分类器是基于保存的最佳属性约减组合训练得到, 一个基本分类器是基于缩小的约减 空间中的一个最佳属性约减组合训练得到 ; at表示基本分类器组 Ft中基本分类器的数量, fb(xk) 表示基本分类器组 Ft中第 b 个分类器对第 k 个人脸图像分类的结果, yk表示第 k 个 人脸图像的决策属性, 其中为基于缩小的约减空间中的最佳属性约减组合训练 的分类器的总数, b 1,at, k 1,N ; 0054 (6b) 计算基本分类器之间的多样性数值 Ddiv(Ft,N) : 0055 计。
15、算基本分类器之间的多样性数值有多种方法可以实现, 包括 CFD, ENT 和 DF 方 法, 具体参见 Measures of diversity in classifi er ensembles and their relationship with the ensemble accuracy Machine learning,2003,51(2):181-207, 本实施例利用 DF 计算基本分类器之间的多样性数值, 其公式如下 : 0056 0057 其中, Ork定义为 : 如果第 r 个分类器能正确分类第 k 幅人脸图像, 则 Ork 1, 否则 Ork 0, Oqk定义为, 如果第。
16、 q 个分类器能正确分类第 k 幅人脸图像, 则 Oqk 1, 否则 Oqk 0, r 1,at-1, q r+1,at ; 0058 (6c) 根据步骤 (6a) 得到的基本分类器的经验损失 Aemp(Ft,N) 和步骤 (6b) 得到的 基本分类器之间的多样性数值 Ddiv(Ft,N), 得到准确 - 多样评估函数 : 0059 AD(Ft,N) 1-Aemp(Ft,N)+Ddiv(Ft,N), 说 明 书 CN 104408468 A 8 5/6 页 9 0060 其中, 是平衡经验损失和多样性的参数, 在本实施例中 1, 但 的取值不 局限于 1, 它根据经验获得 ; 0061 (6d。
17、)根据步骤(6c)得到的准确-多样评估函数, 为缩小的约减空间中的每一组最 佳属性约减组合计算一个准确 - 多样评估函数值 AD(Ft,N), 选择最大的准确 - 多样评估函 数值所对应的最佳属性约减组合予以保存。 0062 步骤 7、 判断保存的最佳属性约减组合的数量是否达到预先设定的值 : 如果数量 达不到预先设定的值, 则返回步骤 4, 如果数量达到预先设定的值, 则执行步骤 8 ; 0063 步骤 8、 训练基本分类器, 在测试样本图像上进行人脸识别, 得到最终识别的结果。 0064 (8a) 利用保存的每一个最佳属性约减组合构建一个训练样本集, 得到重新构建的 多组训练样本集 : 0。
18、065 (8a1) 给出一个最佳属性约减组合 Ai c1,cj,cn, 其中 cj为训练样本集 的第 j 个条件属性 ; 0066 (8a2) 从训练样本集 U 中删除最佳属性约减组合 Ai中没有出现的属性, 得到重新 构建的训练样本集其中为第 k 个样本图像。 0067 (8b) 用每一个训练样本集训练一个基本分类器, 利用不同的基本分类器对测试样 本集进行分类, 得到不同的分类结果, 在本实施例中使用 SVM 作为基本分类器, 但基本分类 器的选择并不局限于 SVM, 也可以选择决策树作为基本分类器 ; 0068 (8c) 采用集成学习中的多数投票法融合这些不同的分类结果, 得到测试样本图。
19、像 的最终识别结果。 0069 本发明的效果可以通过仿真实验具体说明 : 0070 1. 实验条件 0071 实验所用微机 CPU 为 Intel Core(TM)2Duo 3GHz 内存 2GB, 编程平台是 Matlab R2012a。 0072 实验选用 ORL 和 CMU PIE 这两个标准人脸库。其中, ORL 标准人脸库由 40 个人, 每个人10幅图像组成, 图像包含不同的表情、 微小姿态以及20以内的尺度变化 ; 对于CMU PIE标准人脸库, 我们选取由68人共3329张不同光照的人脸图像进行测试。 实验中所用的 这两组人脸图像的大小均调整到 3232, 如图 2 所示, 其。
20、中图 2(a) 为 ORL 数据库中第一个 人的人脸图像, 图 2(b) 为 CMU PIE 数据库中第一个人的人脸图像。 0073 实验中随机选取一半图像作为训练样本, 另一半图像作为测试样本。 0074 2. 实验内容与结果 0075 实验一 : 利用Richard Jensen编写的嵌入到weka软件中的模糊粗糙集算法, 产生 最佳属性约减组合, 对于不同的人脸数据库产生的最佳属性约减组合的数目如表 1 所示 : 0076 表 1 最佳属性约减组合的数目 0077 数据集最佳属性约减组合的数目 ORL133 CMU PIE135 说 明 书 CN 104408468 A 9 6/6 页 。
21、10 0078 从表 1 中可以看出, 在 ORL 数据库上使用该算法可以产生 133 组最佳属性约减组 合, 在 CMU PIE 数据库上使用该算法可以产生 135 组最佳属性约减组合。 0079 实验二 : 使用 SVM 作为基本分类器, 仿真当基本分类器的数量从 5 个增加到 30 个 时本发明的准确性, 每组仿真重复进行 30 次, 计算 30 次仿真的平均分类正确率, 作为最终 分类正确率, 结果如图3所示, 图3的横坐标为分类器的个数, 纵坐标为分类正确率, 其中图 3(a) 为在 ORL 数据库上的准确性曲线图, 图 3(b) 为在 CMU PIE 数据库上的准确性曲线图 ; 0。
22、080 从图 3 中可以看出, 当基本分类器的数量达到 25 时, 本发明能得到较高分类正确 率。 0081 实验三 : 在同样的实验设置前提下将本发明与其他方法进行比较, 本实施例中基 本分类器的数量定为 25。这些方法包括 : Single 表示使用单个 SVM 分类器在人脸图像上进 行分类的方法, Bagging 表示现有的一种经典集成方法, AdaBoost 表示现有的另一种经典 集成方法, RS 表示现有的随机子空间集成方法。 0082 表 2 不同方法在 ORL 和 CMU PIE 数据库上的结果对比 ( 均值 方差 ) 0083 数据库SingleBaggingAdaBoostR。
23、S本发明 ORL52.754.569.384.771.334.368.914.978.753.9 CMU PIE62.261.487.321.288.641.786.992.391.012.8 0084 从表 2 中可以看出, 本发明与现有的方法相比具有较高的准确率。 0085 综上, 本发明提出的基于粗糙集和集成学习的人脸识别方法, 对人脸图像进行属 性约减, 有效弥补了传统的属性约减方法降低了属性分辨能力的缺陷 ; 采用集成学习的分 类方法, 改善了传统单个分类器分类正确率较低和鲁棒性较差的问题。 说 明 书 CN 104408468 A 10 1/2 页 11 图 1 图 2 说 明 书 附 图 CN 104408468 A 11 2/2 页 12 图 3 说 明 书 附 图 CN 104408468 A 12 。