基于核稀疏表示的人脸识别方法 【技术领域】
本发明属于图像处理技术领域,特别是涉及人脸的识别,可用于公共安全,信息安全,金融安全的监督和防护。
背景技术
人脸识别是比较容易为人们所接受的非侵犯性识别手段,从而成为备受计算机视觉与模式识别等领域关注的热点问题。人脸识别技术的目的是赋予计算机根据人的面孔辨别人物身份的能力。人脸识别作为一个科学问题,是一个典型的图像模式分析,理解与分类的计算机问题,它涉及模式识别,计算机视觉,智能人机交互,图形学,认知科学等多个学科。作为生物特征识别关键技术之一的人脸识别技术在公共安全,信息安全,金融等领域具有潜在的应用前景。
人脸被普遍认为是在图像识别领域中最有研究价值的物体。这一方面是因为人脸在人类视觉系统中具有显著的识别能力,另一方面是因为自动人脸识别技术中有大量重要的应用。另外,人脸识别中的技术问题也涵盖了物体识别研究中所遇到的问题。物体识别研究中的核心问题就是:物体的哪个特征对于识别来说是最重要的或者是最富信息的。考虑到人脸的特殊几何结构和差异性,那些固定的滤波器,比如:下采样、傅里叶、小波等,就不能使用了,因为它们只对固定的信号有效,比如纹理图像。取而代之的是那些能够根据给出图像而自适应的提取人脸特征的方法,这些技术包括:特征脸、Fisher脸、Laplace脸、主分量分析等等。由上述方法提取出来的特征更加利于人脸识别,包括最近邻和最近子空间在内的简单的分类器都可以利用其进行识别。
虽然有众多的特征提取或选择的方法,却很少涉及到讨论哪种特征更好或者更坏,对于使用者来说也缺少指导去挑选哪种特征去应用。在人脸识别领域,已经付出了大量的努力和关注去寻找所谓“最优”特征。这种需求可能会导致某种重要因素被模糊化甚至被掩盖,这些因素可能对整个识别过程中的特征选择起到重要的作用。比如,不同的特征可能会影响到分类器的选择,也可能影响到特征维度的确定。
为此,Allen Y.Yang和Yi Ma在2007年提出一种用训练图片对测试图片进行稀疏表出的方法,根据压缩感知的原理求出稀疏表示向量,并进行设计分类的方法。该方法说明特征的数量要比这些特征是如果构造的要重要的多。只要特征的数量足够多,甚至是随机选择特征也能够进行很好的分类和识别。但是由于该方法求解的问题是一范数优化问题,这样就不可避免的遇到了针对同比例缩放的样本无法合理求解系数向量和准确分类的问题,从而可能导致分类不够精确。
【发明内容】
本发明的目的在于克服上述已有技术的不足,提出了一种基于核稀疏表示的人脸识别方法,以合理求解系数向量和准确分类的问题,提高分类器的精确。
为实现上述目的,本发明包括如下步骤:
(1)将训练样本矩阵与测试样本通过高斯核非线性映射至核空间,得到映射后的训练样本矩阵和测试样本其中表示实数集;
(2)生成一个随机矩阵其中d<<n,然后将随机矩阵R与训练样本矩阵C和测试样本l相乘进行降维处理,得到降维后训练样本矩阵和测试样本并对该降维后地训练样本矩阵和测试样本进行归一化;
(3)对归一化后的训练样本矩阵和测试样本,利用如下优化函数:
min||x||1subject tol~=C~x]]>
求解最优的样本重构系数向量x,为归一化后的测试样本,为归一化后的训练样本矩阵;
(4)将求解得到的样本重构系数向量x,分别代入类别带通函数δi:
δ1(x)=α10···0,δ2(x)=0α2···0,···,δK(x)=00···αK]]>
并用与δi(x)相乘,对原测试样本进行重构,K为类别总数,αi代表第i类样本所对应系数的位置,其中i=1,2,…,K,代表样本类别;
(5)计算重构后的样本与原测试样本的残差ri:
ri(l)=||l~-C~δi(x)||2]]>
(6)将原测试样本的残差ri代入测试样本l的类别判定公式:
identity(l)=arg miniri(l)
求得在K个残差中寻找的最小值,并将其下标i作为最终的人脸识别结果,用identity(l)表示。
本发明与现有方法相比具有以下优点:
1、本方法由于对训练样本矩阵和测试样本采用了高斯核非线性映射,克服了求解一范数优化函数的固有缺陷,即对同比例缩放的样本无法合理求解样本的重构系数向量的问题,高了样本的识别率。
2、本方法由于对训练样本矩阵和测试样本采用了高斯核非线性映射,相比于原方法,映射后样本的属性值就具备了相似度的概念,这样就能明确地反映出样本在其特征空间中的位置关系,以便于分类。
【附图说明】
图1是本发明的流程图;
图2是本发明在人工数据上与原分类算法的对比结果图;
图3是现有Extended Yale B数据库中的人脸样本示意图。
【具体实施方式】
下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和过程,但本发明的保护范围不限于下述的实施例。
步骤1:将得到的训练和测试的人脸样本映射至核空间。
(1a)输入的样本为Extended Yale B数据库中的人脸样本图片,如图3所示。该数据库由2414张正面人脸组成,总共有38个类别,其中每一张图片的尺寸均为192*168,且均经过标准化处理。
随机的选取一半的样本作为训练样本,另一半作为测试样本。由于每个类别的样本数并不完全一致,所以每个类别平均取32幅图片作为训练样本,其余作为测试样本。
(1b)将训练样本和测试样本分别映射至核空间,本实施例采用的核函数为高斯径向基核,其核函数的表示式如下:
k=exp(-|u-v|2/(2*p2))
其中u、v均为样本,k为核映射结果,p为高斯径向基核的参数。
关于该核参数的选取,本实施例采用十倍交叉验证的方法,将样本均分为十等份,九份训练,一份测试。测试时,选择将样本映射至实验中的最低维数,选出最优参数。推广至其他维数时,则在当前最优参数附近挑选即可。原训练样本矩阵测试样本通过映射后得到的训练样本矩阵为测试样本为其中,m为原样本维数,在本实施例中为32256,n为训练样本的个数。
步骤2:求解样本重构系数向量x。
(2a)根据降维需要生成一个随机矩阵其中d<<n,然后将随机矩阵R与训练样本矩阵C和测试样本l相乘,以进行降维处理,得到降维后训练样本矩阵和测试样本
(2b)将降维后的训练样本矩阵和测试样本同时除以这两者中的最大值,完成对降维后训练样本矩阵和测试样本的归一化处理;
(2c)对归一化后的训练样本矩阵和测试样本,利用如下优化函数:
min||x||1subject tol~=C~x]]>
求解最优样本重构系数向量x,该向量是归一化后的训练样本矩阵对测试样本的最稀疏表示,其中为归一化后的测试样本,为归一化后的训练样本矩阵。
步骤3:对测试样本进行识别。
(3a)将求解得到的样本重构系数向量x,分别代入类别带通函数δi,
δ1(x)=α10···0,δ2(x)=0α2···0,···,δK(x)=00···αK]]>
并用与δi(x)相乘,对原测试样本进行重构,K为类别总数,αi代表第i类样本所对应系数的位置,其中i=1,2,…,K,代表样本类别,这样就得到K个测试样本的重构结果:其中i=1,2,…,K;
(3b)计算重构后的样本与归一化后测试样本的残差ri:
ri(l)=||l~-C~δi(x)||2]]>
(3c)将原测试样本的残差ri代入测试样本l的类别判定公式:
identity(l)=arg mini ri(l)
求得在K个残差中寻找的最小值,并将其下标i作为最终的人脸识别结果,用identity(l)表示。
本发明的效果通过以下仿真进一步说明:
1、仿真条件与内容:
本发明首先采用人工数据进行实验,人工数据选取的是分别以(0,0)、(0,5)和(5,5)为中心的三类高斯正态分布数据,训练样本由每类各50个样本组成,测试样本由每类各20个样本组成,如图2(a)和图2(b)所示。
使用Extended Yale B数据库进行人脸识别实验,该数据库由2414张正面人脸组成,总共有38个类别。其中每一张图片的尺寸均为192*168,且均经过标准化处理。每个类别中的人脸图片均在人工控制的不同光照强度和角度下拍摄获得,如图3所示。在实验中,我们随机的选取一半的样本作为训练样本,另一半作为测试样本。由于每个类别的样本数并不完全一致,所以每个类别取32幅图片作为训练样本,其余作为测试样本。软件平台为MATLAB7.0。
2、仿真结果:
本发明首先采用人工数据进行实验,为的是说明在同比例缩放的样本分布情况下,现有方法在分类时的缺陷,以为在高维样本实验中的良好效果提供直观的实验依据,实验结果如图2所示。其中图2(a)为训练样本的分布示意图,图2(b)为测试样本,图2(c)为现有稀疏表示分类方法的实验结果,图2(d)为本发明核稀疏表示分类方法的实验结果。从图2(c)中可以明显看出,现有方法在低维样本的分类中存在明显缺陷,而图2(d)所示的本发明引入高斯核映射之后,测试样本得到了正确的分类。
对于Extended Yale B数据库的人脸识别实验,为了进行对比,本实验将人脸样本分别降至20、30、56、120和504维,进行仿真比较,其实验结果如表1所示。
表1两种方法在不同维数上的识别率对比
从表1可以看出,本发明方法在实验中各个维度上的识别率均比现有方法要好。
综上,现有方法的应用使得特征选择的作用变得不再重要,随机降维也能在人脸识别中得到好的实验结果。本发明方法对训练样本矩阵和测试样本采用了高斯核非线性映射,在实验中可以看到,在低维的人工数据和在人脸数据库上的实验效果都要优于现有方法。