《基于LRR图的半监督学习人脸识别方法.pdf》由会员分享,可在线阅读,更多相关《基于LRR图的半监督学习人脸识别方法.pdf(12页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102880875 A (43)申请公布日 2013.01.16 CN 102880875 A *CN102880875A* (21)申请号 201210387089.2 (22)申请日 2012.10.12 G06K 9/62(2006.01) G06K 9/00(2006.01) (71)申请人 西安电子科技大学 地址 710071 陕西省西安市太白南路 2 号 (72)发明人 杨淑媛 焦李成 王秀秀 刘芳 缑水平 侯彪 王爽 马文萍 杨丽霞 徐雯辉 谢冬梅 (74)专利代理机构 陕西电子工业专利中心 61205 代理人 田文英 王品华 (54) 发明名称 基于 。
2、LRR 图的半监督学习人脸识别方法 (57) 摘要 本发明公开了一种基于 LRR 图的半监督学习 人脸识别方法。其步骤为 : (1) 划分数据库样本 集 ; (2) 组成样本集合 ; (3) 生成初始标签矩阵 ; (4) 低秩表示 ; (5) 生成样本相似度矩阵 ; (6) 生 成类别概率矩阵 ; (7)输出测试样本的类别。 本发 明采用半监督学习的方法可以在已知标签样本较 少的情况下获得更高的识别正确率, 同时, 本发明 采用低秩表示的方法, 在样本受到噪声污染的情 况下具有更强的鲁棒性。 (51)Int.Cl. 权利要求书 3 页 说明书 6 页 附图 2 页 (19)中华人民共和国国家知。
3、识产权局 (12)发明专利申请 权利要求书 3 页 说明书 6 页 附图 2 页 1/3 页 2 1. 一种基于 LRR 图的半监督学习人脸识别方法, 包括如下步骤 : (1) 划分数据库样本集 将人脸图像集中所有已知标签的样本作为训练集, 所有未知标签的样本作为测试集 ; (2) 组成样本集合 2a) 将训练集中的样本按标签顺序依次排列在测试集样本前, 组成原始样本矩阵 ; 2b) 生成一个服从高斯分布的随机矩阵, 将随机矩阵与原始样本矩阵相乘得到降维后 的样本矩阵 ; (3) 生成初始标签矩阵 采用标签矩阵公式得到带标记样本的初始标签矩阵 ; (4) 低秩表示 采用非精确增广拉格朗日乘子法。
4、获得低秩系数矩阵 ; (5) 生成样本相似度矩阵 采用对称处理公式获得样本相似度矩阵 ; (6) 计算概率 采用图保持标准方法获得测试样本集的类别概率矩阵 ; (7) 输出类别 选取类别概率矩阵每一列的最大值, 将最大值所在行的行标作为测试集样本的类别, 输出测试集样本的类别。 2. 根据权利要求 1 所述的基于 LRR 图的半监督学习人脸识别方法, 其特征在于 : 步骤 2b) 中所述的随机矩阵行数的取值范围为 50 300。 3. 根据权利要求 1 所述的基于 LRR 图的半监督学习人脸识别方法, 其特征在于 : 步骤 (3) 所述的标签矩阵公式如下 : 其中, Yi(k) 为第 i 个样。
5、本在第 k 个类别中与 k 对应的值, i 1, M, M 为训练样本总 数, k 1, K, K 为类别总数 ; xi Rd1为第 i 个样本, d 为降维后的样本矩阵的维数。 4. 根据权利要求 1 所述的基于 LRR 图的半监督学习人脸识别方法, 其特征在于 : 步骤 (4) 中所述的非精确增广拉格朗日乘子法按照如下步骤进行 : 第一步, 将低秩系数矩阵和等价矩阵分别初始化为 NN 的零矩阵, N 表示训练集和测 试集中所有样本的总数 ; 将误差矩阵和两个拉格朗日乘子矩阵分别初始化为 dN 的零矩 阵, d 为降维后的样本矩阵的维数 ; 第二步, 将用于控制等价矩阵的固有参数初始化为 1。
6、0-6; 第三步, 采用下列公式更新等价矩阵 : 其中, Jp代表更新后的等价矩阵 ; 代表用于控制等价矩阵的固有参数 ; J 代表更新前 的等价矩阵 ; |J|*表示矩阵 J 的核范数 ; Z 代表低秩系数矩阵 ; Y2代表拉格朗日乘子矩阵 ; 表示矩阵 F 范数的平方 ; 权 利 要 求 书 CN 102880875 A 2 2/3 页 3 第四步, 采用下列公式更新低秩系数矩阵 : Zp (I+XTX)-1(XT(X-E)+Jp+(XTY1-Y2)/) 其中, Zp代表更新后的低秩系数矩阵 ; I 代表单位矩阵 ; X 代表降维后的样本矩阵 ; T 表 示转置符号 ; (*)-1表示 (。
7、*) 的逆矩阵 ; E 代表误差矩阵 ; Y1和 Y2代表两个拉格朗日乘子矩 阵 ; 第五步, 采用下列公式更新误差矩阵 : 其中, Ep代表更新后的误差矩阵 ; 代表用于控制误差矩阵的控制参数 ; E 代表更新前 的误差矩阵 ; |*|2, 1代表 l2/l1范数 ; 第六步, 采用下列公式分别更新拉格朗日乘子矩阵其中, 和 分别表示更新后的两个拉格朗日乘子矩阵 ; Y1和Y2分别表示更新前的两个拉格朗日乘子 矩阵 ; 第七步, 采用下列公式更新固有参数 p min(1.1, 106) 其中, p为更新后的固有参数 ; 为更新前的固有参数 ; min 表示取两者中较小的值 ; 第八步, 判断。
8、下列收敛表达式是否满足下列收敛条件, 若满足, 则得到最后的低秩系数 矩阵, 若不满足, 则返回本步骤的第三步, |X-XZp-Ep| 10-8 and|Zp-Jp| 10-8 其中, X 代表样本矩阵 ; Zp代表更新后的低秩系数矩阵 ; Ep代表更新后的误差矩阵 ; Jp 代表更新后的等价矩阵 ; |*|表示矩阵无穷范数。 5. 根据权利要求 1 所述的基于 LRR 图的半监督学习人脸识别方法, 其特征在于 : 步骤 (5) 中所述的对称处理公式如下 : Wij max(Zij, Zji) 其中, Wij表示样本相似度矩阵 W 中第 i 行第 j 列的元素 ; Zij表示低秩系数矩阵 Z 。
9、中第 i 行第 j 列的元素, Zji表示低秩系数矩阵 Z 中第 j 行第 i 列的元素 ; max 表示取括号内最大 的值。 6. 根据权利要求 1 所述的基于 LRR 图的半监督学习人脸识别方法, 其特征在于, 步骤 (6) 中所述的图保持标准方法按照如下步骤进行 : 第一步, 采用如下公式得到对角矩阵 Dii jWij 其中, Dii表示对角矩阵 D 的第 i 行第 i 列的元素, i 1, 2, ., N, N 表示训练集和测 试集样本的总数 ; Wij表示相似度矩阵 W 第 i 行第 j 列的元素, j 1, 2, ., N, N 表示训练 集和测试集样本的总数 ; 第二步, 将对角。
10、矩阵的对应元素减去样本相似度矩阵的对应元素得到特征矩阵 ; 第三步, 采用下列公式得到测试样本集的类别概率矩阵 权 利 要 求 书 CN 102880875 A 3 3/3 页 4 其中, Yu表示测试样本集的类别概率矩阵 ; Y 表示训练样本集的初始标签矩阵 ; LluRMT表示将特征矩阵划分成四个子矩阵后的右上矩阵, M表示训练样本总数, T表示测 试样本总数 ;表示将特征矩阵划分成四个子矩阵后的右下矩阵的逆矩阵。 权 利 要 求 书 CN 102880875 A 4 1/6 页 5 基于 LRR 图的半监督学习人脸识别方法 技术领域 0001 本发明属于图像处理技术领域, 更进一步涉及一。
11、种模式识别技术领域中的人脸识 别方法, 具体是基于低秩表示 (Low-Rank Representation, LRR) 图的半监督学习人脸识别 方法, 本发明可用于视频监控环境下的身份识别, 网络安全以及安防领域。 背景技术 0002 人脸识别不同于虹膜识别、 指纹识别等, 是比较容易为人们所接受的非侵犯性识 别手段, 从而成为计算机视觉和模式识别技术领域需要突破的一种技术。人脸识别的主要 任务是根据提取的待识别人脸的特征, 将其和数据库中的人脸图像进行比对, 确定待识别 人脸的身份。 目前, 对任意人脸图像进行识别的方法通常分为两类 : 第一类是基于特征提取 的方法, 第二类是基于分类器的。
12、方法。 0003 基于人脸特征的方法需要对人脸进行特征提取或选择, 常用提取人脸特征的技术 包括 : 特征脸、 Fisher 脸、 Laplace 脸和核映射等, 由上述方法提取出来的特征可以用包括 最近邻和最近子空间在内的简单分类器进行识别。该方法存在的不足是, 基于特征的方法 在图像存在噪声时, 提取的特征受到噪声的影响很大, 从而导致该方法在图像含有噪声时 因鲁棒性不强降低了人脸识别精度。 0004 Wright 等人在文献 “Wright J., Ganesh A., Yang A.and Ma Y., Robust face recognition via sparse repres。
13、entation.IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.31, no.2, pp.210-227, Feb.2009” 中提出了一种利用稀疏表示 进行人脸识别的方法。该方法首先将训练样本矩阵和测试样本矩阵降维至所需要的维度, 并对其进行归一化处理 ; 然后, 用训练样本矩阵对测试样本矩阵进行稀疏表出, 根据压缩感 知的原理求出稀疏表示向量 ; 最后, 求得各类别重构样本与原测试样本的残差, 带入类别判 定公式得到识别结果。该方法存在的不足是, 由于该专利申请的方法为有监督的人脸识别 方法, 在已知。
14、样本及对应标签数较少时降低了人脸识别精度, 从而导致该方法在小样本学 习情况下因缺少监督信息而降低了人脸识别精度。 发明内容 0005 本发明的目的在于克服上述已有技术的不足, 提出一种基于 LRR 图的半监督学习 人脸识别方法。 本发明可在小样本学习情况下, 利用少量的监督信息, 可以实现对人脸图像 进行识别, 同时, 本发明对含有噪声的人脸图像识别具有很强的鲁棒性。 0006 本发明实现的具体步骤如下 : 0007 (1) 划分数据库样本集 0008 将人脸图像集中所有已知标签的样本作为训练集, 所有未知标签的样本作为测试 集。 0009 (2) 组成样本集合 0010 2a) 将训练集中。
15、的样本按标签顺序依次排列在测试集样本前, 组成原始样本矩 说 明 书 CN 102880875 A 5 2/6 页 6 阵 ; 0011 2b) 生成一个服从高斯分布的随机矩阵, 将随机矩阵与原始样本矩阵相乘得到降 维后的样本矩阵。 0012 (3) 生成初始标签矩阵 0013 采用标签矩阵公式得到带标记样本的初始标签矩阵。 0014 (4) 低秩表示 0015 采用非精确增广拉格朗日乘子法获得低秩系数矩阵。 0016 (5) 生成样本相似度矩阵 0017 采用对称处理公式获得样本相似度矩阵。 0018 (6) 计算概率 0019 采用图保持标准方法获得测试样本的类别概率矩阵。 0020 (7。
16、) 输出类别 0021 选取类别概率矩阵每一列的最大值, 将最大值所在行的行标作为测试集样本的类 别, 输出测试集样本的类别。 0022 与现有技术相比, 本发明有以下优点 : 0023 第一, 由于本发明在人脸识别中采用了半监督学习的方法, 克服了现有技术因缺 乏足够监督信息而无法得到较高的识别正确率的不足, 使得本发明在训练样本较少的时候 能取得较高的识别率。 0024 第二, 由于本发明采用了低秩表示方法, 克服了现有技术因图像中含有噪声而严 重降低识别正确率的不足, 使得本发明对含有噪声的人脸图像鲁棒性更强。 附图说明 0025 图 1 是本发明的流程图 ; 0026 图 2 是现有 。
17、Yale 人脸数据库人脸样本示意图 ; 0027 图 3 是对图 2 加入不同程度高斯噪声后的图像。 具体实施方式 0028 参照图 1, 对本发明做进一步的详细描述。 0029 步骤 1, 划分数据库样本集。将 Yale 人脸数据库中每类取出 3 个样本作为训练集 A RDM, 剩余的样本作为测试集 B RDT。 0030 其中, D 表示训练集样本和测试集样本的维数, Rn表示 n 维实数空间, M 是训练集 样本的总数, T是测试集样本的总数 ; 在本发明的实施实例中, 样本维数D为8000, 训练集样 本的总数 M 为 45, 测试集样本的总数 T 为 125。 0031 步骤 2, 。
18、组成样本集合。 0032 2a) 将训练集中的样本按标签顺序依次排列在测试集样本前, 组成原始样本矩 阵 ; 0033 2b) 将随机矩阵 Q RdD乘以原始样本矩阵得到降维后的样本矩阵 X Rd(M+T); 0034 其中, d D 是原始样本矩阵降到的维数。 0035 步骤 3, 生成初始标签矩阵。 说 明 书 CN 102880875 A 6 3/6 页 7 0036 采用如下的标签矩阵公式得到训练集样本的初始标签矩阵。 0037 0038 其中, Yi(k) 为第 i 个样本在第 k 个类别中与 k 对应的值, i 1, M, M 是训练集 样本的总数, k 1, K, K 为类别总数。
19、 ; xi Rd1为第 i 个样本 ; 在本发明的实施实例中, 类别总数 K 为 15。 0039 步骤 4, 低秩表示。 0040 采用非精确增广拉格朗日乘子法获得低秩系数矩阵。 0041 将样本矩阵在自身上进行低秩表示, 0042 0043 其中, Z RNN表示低秩系数矩阵, E RNN表示误差矩阵, 代表用于控制误 差矩阵的控制参数, | |*表示矩阵的核范数, 即矩阵奇异值的和 ;代表 l2/l1范数。上述优化问题通过如下的非精确增广拉格朗日乘子法求解低秩系数矩阵。 0044 4a) 将低秩系数矩阵 Z 和等价矩阵分别初始化为 NN 的零矩阵, N 表示训练集和 测试集中所有样本的总。
20、数, 本发明的实施实例中所有样本总数 N 为 165 ; 将误差矩阵和两个 拉格朗日乘子矩阵分别初始化为 dN 的零矩阵, d 为原始样本矩阵降到的维数 ; 0045 4b) 将用于控制等价矩阵的步长参数初始化为 10-6; 0046 4c) 采用下列公式更新等价矩阵 : 0047 0048 其中, Jp代表更新后的等价矩阵 ; 代表用于控制等价矩阵的步长参数 ; |J|*表 示矩阵 J 的核范数 ; Y2代表拉格朗日乘子矩阵 ;表示矩阵 F 范数的平 方 ; 0049 4d) 采用下列公式更新低秩系数矩阵 : 0050 Zp (I+XTX)-1(XT(X-E)+Jp+(XTY1-Y2)/) 。
21、0051 其中, Zp代表更新后的低秩系数矩阵 ; I 代表 NN 的单位矩阵 ; X 代表样本矩阵 ; T 表示转置符号 ; (*)-1表示 (*) 的逆矩阵 ; E 代表误差矩阵 ; Y1和 Y2代表两个拉格朗日乘子 矩阵 ; 0052 4e) 采用下列公式更新误差矩阵 : 0053 0054 其中, Ep代表更新后的误差矩阵 ; 代表用于控制误差矩阵的控制参数 ; E 代表更 新前的误差矩阵 ;代表 l2/l1范数 ; 0055 4f) 采用下列公式分别更新拉格朗日乘子矩阵 说 明 书 CN 102880875 A 7 4/6 页 8 0056 Y1p Y1+(X-XZp-Ep) 005。
22、7 Y2p Y2+(Zp-Jp) 0058 其中, 和分别表示更新后的两个拉格朗日乘子矩阵 ; Y1和 Y2分别表示更新前 的两个拉格朗日乘子矩阵 ; 0059 4g) 采用下列公式更新步长参数 0060 p min(1.1, 106) 0061 其中, p为更新后的步长参数 ; 为更新前的步长参数 ; min 表示取两者中较小 的值 ; 0062 4h) 判断下列收敛表达式是否满足下列收敛条件, 若满足, 则得到最后的低秩系数 矩阵, 若不满足, 则返回本步骤的 4c) 继续往下执行, 0063 |X-XZp-Ep| 10-8 and|Zp-Jp| 10-8 0064 其中, X代表样本矩阵。
23、 ; Zp代表更新后的低秩系数矩阵 ; Ep代表更新后的误差矩阵 ; Jp代表更新后的等价矩阵 ; |*|表示矩阵无穷范数。 0065 步骤 5, 生成样本相似度矩阵。 0066 采用如下的对称处理公式得到样本相似度矩阵 : 0067 Wij max(Zij, Zji) 0068 其中, Wij表示样本相似度矩阵 W 中第 i 行第 j 列的元素 ; Zij表示低秩系数矩阵 Z 中第 i 行第 j 列的元素, Zji表示低秩系数矩阵 Z 中第 j 行第 i 列的元素 ; max 表示取括号 内最大的值。 0069 步骤 6, 计算概率。 0070 采用如下的图保持标准方法获得测试样本集的类别概。
24、率矩阵 ; 0071 6a) 采用如下公式得到对角矩阵 0072 Dii jWij 0073 其中, Dii表示对角矩阵 D 的第 i 行第 i 列的元素, i 1, 2, ., N, N 表示训练集 和测试集样本的总数, 这里 N 165 ; Wij表示相似度矩阵 W 第 i 行第 j 列的元素, j 1, 2, ., N ; 0074 6b) 将对角矩阵的对应元素减去样本相似度矩阵的对应元素得到特征矩阵 ; 0075 6c) 采用下列公式得到测试样本集的类别概率矩阵 0076 0077 其中, YuRKT表示测试样本集的类别概率矩阵 ; Y表示训练样本集的初始标签矩 阵 ; Llu RMT。
25、表示将特征矩阵划分成四个子矩阵后的右上矩阵 ;表示将 特征矩阵划分成四个子矩阵后的右下矩阵的逆矩阵。 0078 步骤 7, 输出类别。 0079 选取步骤 (6) 中类别概率矩阵每一列的最大值, 将每一列最大值所在行的行数构 成类别向量, 该类别向量即为测试集样本的类别, 输出测试集样本的类别。 0080 本发明的效果可以通过以下仿真实验进一步说明。 0081 1. 实验条件 0082 本实验采用Yale人脸数据库作为实验数据, 采用软件MATLAB 7.10.0作为仿真工 说 明 书 CN 102880875 A 8 5/6 页 9 具, 计算机配置为Intel Core i3/2.27G/。
26、2G。 本实验在Yale人脸数据库上进行人脸识别仿 真实验, 该数据库是由耶鲁大学计算视觉与控制中心创建的, 数据库中包含了 15 位志愿者 的 165 张图片, 每位志愿者 11 张图片。数据库包含了光照, 表情和姿态的变化。本发明的 图 2 是从 Yale 人脸数据库中调取的一个样本的示意图。 0083 2. 实验内容 0084 本发明共有两组实验 : 0085 实验 1 : 在 Yale 人脸数据库上进行不同维数的人脸识别实验。 0086 实验 2 : 在 Yale 人脸数据库上进行将人脸图像加入不同程度高斯噪声的人脸识别 实验。 0087 3. 实验结果和分析 0088 实验 1 : 。
27、不同维数下的人脸识别 0089 本实验在 Yale 人脸数据库上进行, 将本发明与现有的 L1 图方法、 k 近邻图 (KNN 图 ) 方法和 -ball 方法进行比较。将 Yale 人脸数据库中的 11 类样本, 每类取出 3 个样 本共 45 幅图像作为训练集, 剩余的 125 幅图像作为测试集。表 1 显示了对训练集和测试集 样本进行随机采样, 采样维数分别取 300 维, 250 维, 200, 150 维, 100 维和 50 维时的识别正 确率结果。本实验中控制参数 1.6。从表 1 中可以看出, 本发明在采样维数为 100 维, 150 维, 200 维, 250 维, 300 。
28、维时, 识别正确率在表中所列的四种方法中是最高的, 通常情况 在相同条件下, 识别正确率高的方法可以正确识别更多的人脸图像, 由此可见本发明的识 别效果是下列四种方法中最好的。 0090 表 1.Yale 人脸数据库在不同采样维数下的识别正确率 0091 0092 实验 2 : 加入不同程度噪声的人脸识别 0093 由于在现实应用中得到的图像可能会受到硬件或者环境的影响含有噪声, 对人脸 识别造成不利影响, 本实验在人脸图像上加入噪声进行仿真。 从Yale人脸数据库的11类样 本中每类取出 3 个样本共 45 幅图像作为训练集, 剩余的 125 幅图作为测试集。将训练集和 测试集依次加入均值为。
29、 0 方差为 0.01 0.08 的高斯噪声。图 3 中 (a) 是将图 2 加入均值 为 0 方差为 0.01 的高斯噪声后的图像, 图 3 中 (b) 是将图 2 加入均值为 0 方差为 0.02 的 高斯噪声后的图像, 图 3 中 (c) 是将图 2 加入均值为 0 方差为 0.03 的高斯噪声后的图像, 图 3 中 (d) 是将图 2 加入均值为 0 方差为 0.04 的高斯噪声后的图像, 图 3 中 (e) 是将图 2 加入均值为 0 方差为 0.05 的高斯噪声后的图像, 图 3 中 (f) 是将图 2 加入均值为 0 方差为 0.06 的高斯噪声后的图像, 图 3 中 (g) 是。
30、将图 2 加入均值为 0 方差为 0.07 的高斯噪声后的 说 明 书 CN 102880875 A 9 6/6 页 10 图像, 图 3 中 (h) 是将图 2 加入均值为 0 方差为 0.08 的高斯噪声后的图像。将训练集和测 试集样本均下采样到 100 维。表 2 显示了在 Yale 数据库的图像上加入不同程度的高斯噪 声后的识别正确率结果。本实验中, 控制参数 1。 0094 从表 2 可以看出, 本发明的基于 LRR 图的半监督学习人脸识别方法 LRR 图不仅比 传统方法 KNN 图以及 -ball 的方法的识别正确率高, 而且比目前效果较好的 L1 图方法 识别率正确高, - 通常。
31、情况在相同条件下, 识别正确率高的方法可以正确识别更多的人脸图 像, 由此可见, 本发明的识别效果是下列四种方法中最好的。其中, 表 2 中 “-” 表示该处正 确率在 50以下, 失去了比较意义, 本实验中不予显示。 0095 表 2. 在 Yale 数据库的图像上加入不同程度的高斯噪声后的识别正确率 0096 0097 以上实验结果表明, 本发明能在较低的维数时达到较高的识别正确率, 并且对于 加噪后的人脸图像鲁棒性也很强。 说 明 书 CN 102880875 A 10 1/2 页 11 图 1 图 2 说 明 书 附 图 CN 102880875 A 11 2/2 页 12 图 3 说 明 书 附 图 CN 102880875 A 12 。