基于等距映射的人脸图像识别方法 【技术领域】
本发明涉及的是一种图像处理技术领域的方法,具体是一种基于等距映射的人脸图像识别方法。
背景技术
传统模式识别中,经典子空间方法如主成分分析法(Principal ComponentAnalysis,PCA)、Fisher线性判别分析方法(Fisher Linear DiscriminantAnalysis,LDA)等本质上都是运用各种优化准则寻找高维输入空间到低维子空间的最佳投影矩阵,它们在人脸、文字识别等应用中取得了良好的效果。但是在遇到一些复杂的非线性问题时,就失去了它们的优势,基于此,非线性方法便应运而生,一种是基于核的方法,另外一种就是基于流形学习的方法。基于谱论的流形学习方法可以分为局部方法与全局方法两种。
局部流形学习方法起始于Rowels和Saul提出的局部线性嵌入方法(Locally Linear embedding,LLE)(S.Roweis and L.K.Saul.Nonlineardimensional reduction by locally linear embedding[J].Science,December2001 vol.290:2323-2326.),该方法能够把高维输入空间的数据点映射到一个全局低维坐标系,同时保留了邻接点之间的关系,这样,局部的几何结构就能够得到保持,近年来,在LLE方法的基础上,局部保持流形学习方法逐渐发展成为一个比较活跃而且相对成熟的重要分支;全局流形学习方法起始于Tenenbaum等提出的等距映射方法(ISOMAP)(J.B.Tenenbaum,V.de Silva,and john C.Langford.A global geometric framework for nonlinear dimensionalreduction[J].Science,2000,vol.290:2319-2323.),该方法首先构建每个输入数据点的邻域图,然后利用邻域图中的最短路径得到近似的测地线距离,代替不能表达内在流形结构的Euclidean距离,最后经过多维尺度分析(Multidimensional Scaling,MDS)处理,发现嵌入在高维输入空间的低维嵌入.在人脸和手势的实验中,ISOMAP方法发现了嵌入高维空间中的潜在低维参数空间。此后,引入了核的思想,一定程度上增强了ISOMAP方法的推广能力。
以上方法都是基于重构误差最小化的思想,没有清晰的投影矩阵,对于模式分类而言不是最优的,不能直接应用于识别。
此外,已有的ISOMAP系列方法需要通过计算点与点间的欧氏距离寻找最近邻,进而得到点与点间的最短路径。这种基于点的运算对噪声高度敏感,尤其在图像识别领域,对哪怕很小的形变都会影响到整个方法的处理效果,不具有拓扑稳定性。
鉴于此,为了使等距映射算法能够很好的应用于模式识别领域,便提出了一种基于邻域图像欧氏距离和Direct LDA的ISOMAP识别方法(KIMD-ISOMAP),该方法基于邻域的图像欧氏距离(Image Euclidean Distance,IMED)计算点与点间的距离,进而寻找最近邻,建立全部数据点的距离关系矩阵,较之传统欧氏距离,图像欧氏距离考虑到二维图像像素间的空间位置关系,对图像噪声有一定的鲁棒性。此外,运用基于邻域的图像欧氏距离,可以一定程度上降低距离计算的时间复杂度。同时用直接线性判别分析方法(Direct LDA)取代多维尺度分析法(MDS)进行降维,MDS方法基于可视化的准则,对分类而言不是最优的,不能直接用于识别,基于分类的Direct LDA方法便能够很好的解决这个问题,在减小计算复杂度和处理“小样本问题”上也有一定的优势。
【发明内容】
本发明针对现有技术存在的上述不足,提供一种基于等距映射的人脸图像识别方法,同时考虑图像像素间的空间关系特征,用直接线性判别分析方法取代多维尺度分析法,在人脸识别试验中取得了较高的识别率。
本发明是通过以下技术方案实现的,本发明包括以下步骤:
第一步、对输入的高维空间中的n幅图像作为高维空间中的一个点,每幅图像的分辨率为M×N,对此n个点X={x1,x2,…,xn}依次进行预处理,将每幅图像xi,1≤i≤n以向量形式表示,即将所得的每幅图像xi,1≤i≤n为列向量,其中:xia,1≤i≤n,1≤a≤M×N为列向量的元素值,i为列向量的序号,a为列向量元素的序号。
所述的预处理是指:灰度化处理、分辨率调整处理和小波分解处理。
第二步、将列向量作为训练样本,组成训练样本集,然后将训练样本集中每个训练样本作为顶点建立邻域连接赋权无向图GX;
所述的邻域连接赋权无向图GX具体是指:定义邻域大小为ε邻域或K邻域,计算每个样本点xi,1≤i≤n同其余样本点地基于邻域的图像欧氏距离dIMED,并定义近邻点之间的边的权值为dx(i,j)=dIMED(xi,xj),则这些近邻点之间带权值的边组成邻域连接赋权无向图GX。
所述的K邻域是指:当xj是xi的最近的K个点中的一个时判定为邻域关系且邻域边长为xjxi;
所述的ε邻域是指:当xi和xj的距离dIMED(xi,xj)小于固定值ε时,认为它们近邻,邻域边长为xjxi。
所述基于邻域的图像欧氏距离dIMED是指:所述M×N维图像向量化之后为其中:xikN+1是二维图像像素点(k,l)处的灰度值,令为两像素xia,a=kN+l和xib,b=k′N+l′之间的距离,定义像素xia和xib间的度量系数:
其中σ为像素集的方差参数,可设为1,λ为以目标像素xia或xib为中心的邻域参数,根据应用环境的不同可自由设定。
则两幅图像X和Y间的基于邻域的图像欧氏距离为:
dIMED(X,Y)=Σi,j=1MNgij(xi-yi)(xj-yj)=(X-Y)TG(X-Y),]]>其中G=(gij)MN×MN
其中:u=G1/2X,v=G1/2Y,则图像欧氏距离重新表达为:
dIMED(X,Y)=(X-Y)TG1/2G1/2(X-Y)=(u-v)T(u-v);
其中:G1/2=ΓΛ1/2ΓT,Λ为G的特征值矩阵,Γ为对应的特征向量矩阵。
第三步、根据邻域连接赋权无向图GX,计算得到每两个训练样本之间的最短路径,建立最短路径矩阵DG=(dG(i,j));
所述的最短路径即测地距离,是指根据邻接图GX,利用图论中经典的Floyd迭代算法或者Dijkstra算法计算流形上任意两点间的最短流形距离:当图GX有边xjxi时,设最短路径dG(i,j)=dIMED(xi,xj);否则设dG(i,j)=∞,则最短路径矩阵为:
DG=(dG(i,j))=[dG2(xi,xj)]i,j=1n;]]>
其中:dG(xi,xj)=min{dG(xi,xj),dG(xi,xl)+dG(xl,xj)},l=1,2,…n。
第四步、对最短路径矩阵进行直接线性分类处理,得到最佳投影矩阵W,具体包括以下步骤:
4.1)在最短路径矩阵DG中随机选取训练样本集作为输入训练输入数据。令fi=[DG(ij)],其中i≠j,DG(ii)=0,共c类,作为高维输入。计算出类内离散度Sw和类间离散度Sb,然后由和计算出Φb和Φw,根据任意矩阵LLT和LTL在求解特征值和特征向量时的一一对应关系,则有可以直接用代替计算量大为降低。
4.2)对4.1中所得到的S′w和S′b代入直接线性判别法(Direct LDA),代替ISOMAP方法中的MDS方法,寻找DG的最佳分类投影子空间映射φ:RD→Rd,其中:RD是高维特征空间,D≥d。具体如下:
(1)白化寻找其特征值Λb和特征向量Vb,满足(ΦbVb)TΦbVb=Λb,其中令P为Vb的前m个非零特征值对应的特征向量,则有(PVb)TPVb=Db>0,其中Db为Λb的m×m主子矩阵。令满足(2)对角化W1TΦwTΦwW1。选取W1TΦwTΦwW1的前d个最小特征值所对应的特征向量组成矩阵W2,满足Λw为对角矩阵,其主对角元素为(ΦwW1)TΦwW1的前d个最小特征值。(3)构造线性变换矩阵W=W1W2,作为φ:RD→Rd的最佳投影矩阵。
第五步、将最佳投影矩阵W作用于测试集Dtest,进行降维,得到低维的优化特征样本,然后用最小距离法或者K近邻法对测试集进行分类,得到人脸识别结果。分类方法可以是最小距离法或者K近邻法等。
经过对比发现,本发明与现有技术中的经典Eigenface方式、Fisherface方式、PCA+LPP方式、ISOMAP方式和Ext-ISOMAP方式相比较,本发明通过基于邻域的图像欧氏距离取代经典欧氏距离寻找最近邻,和扩大邻域半径的选取范围,对于涉及光照条件变化、姿态变化、轻微噪声和几何形变的复杂图像具有良好的优化识别效果,识别准确率达到98%以上,能够广泛应用于人脸识别、军事目标跟踪识别系统等各类民用及军用系统中。
【附图说明】
图1为本发明实施例的流程图。
图2为近邻半径识别率曲线图。
图3为实施例在高斯噪声环境下识别率曲线图。
图4为实施例在旋转形变条件下的识别率曲线图。
图中:方法一为Fisherface方式、方法二为Eigenface方式、方法三为PCA+LPP方式、方法四为Ext-ISOMAP方式、方法五为KIMD-ISOMAP方式。
【具体实施方式】
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,本实施例包括以下步骤:
第一步、输入的高维空间中的n个点X={x1,x2,…,xn},本实施过程指输入的n幅图像,每幅图像为xi,1≤i≤n,分辨率为M×N,为在高维空间中的一个点,如ORL和YALE图像库)依次进行预处理,然后将每幅图像xi,1≤i≤n以向量形式表示,即将所得的每幅图像xi,1≤i≤n为列向量,其中:设xij,1≤i≤n,1≤j≤M×N为列向量的元素值,i为列向量的序号,j为列向量元素的序号。
所述的预处理是指:灰度化处理、分辨率调整处理和小波分解处理。
第二步、将列向量作为训练样本,组成训练样本集,然后将训练样本集中每个训练样本作为顶点建立邻域连接赋权无向图GX;
所述的邻域连接赋权无向图GX具体是指:定义邻域大小为ε球或K最近邻,计算每个样本点xi,1≤i≤n同其余样本点的基于邻域的图像欧氏距离dIMED。当xj是xi的最近的K个点中的一个时判定为邻域关系且邻域边长为xjxi(这种邻域称为K-邻域);或者当xi和xj的距离dIMED(xi,xj)小于固定值ε时,认为它们近邻,邻域边长为xjxi(这种邻域称为ε-邻域)。并定义近邻点之间的边的权值为dx(i,j)=dIMED(xi,xj),则这些近邻点之间带权值的边组成邻域连接赋权无向图GX;
所述基于邻域的图像欧氏距离dIMED是指:上文所述M×N维图像向量化之后为其中:xikN+l是二维图像像素点(k,l)处的灰度值,令为两像素xia,a=kN+l和xib,b=k′N+l′之间的距离,定义像素xia和xib间的度量系数:
其中σ为像素集的方差参数,可设为1,λ为以目标像素xia或xib为中心的邻域参数,根据应用环境的不同可自由设定。
则两幅图像X和Y间的基于邻域的图像欧氏距离为:
dIMED(X,Y)=Σi,j=1MNgij(xi-yi)(xj-yj)=(X-Y)TG(X-Y),]]>其中G=(gij)MN×MN
为减小计算复杂度,可设u=G1/2X,v=G1/2Y,则距离公式可以重新表达为:
dIMED(X,Y)=(X-Y)TG1/2G1/2(X-Y)=(u-v)T(u-v);
其中G1/2=ΓΛ1/2ΓT,A为G的特征值矩阵,Γ为对应的特征向量矩阵。
第三步、根据邻域连接赋权无向图GX,计算得到每两个训练样本之间的最短路径,建立最短路径矩阵DG=(dG(i,j));
所述的最短路径即测地距离,是指根据邻接图GX,利用图论中经典的Floyd迭代算法或者Dijkstra算法计算流形上任意两点间的最短流形距离:当图GX有边xjxi时,设最短路径dG(i,j)=dIMED(xi,xj);否则设dG(i,j)=∞。则最终的距离公式如下:
dG(xi,xj)=min{dG(xi,xj),dG(xi,xl)+dG(xl,xj)},l=1,2,…n
这样可以得到最短路径矩阵DG=(dG(i,j))=[dG2(xi,xj)]i,j=1n]]>
第四步、对最短路径矩阵进行直接线性分类处理,得到最佳投影矩阵W,具体包括以下步骤:
4.1)在最短路径矩阵DG中随机选取训练样本集作为输入训练输入数据。令fi=[DG(ij)],其中i≠j,DG(ii)=0,共c类,作为高维输入。计算出类内离散度Sw和类间离散度Sb,然后由和计算出Φb和Φw,根据任意矩阵LLT和LTL在求解特征值和特征向量时的一一对应关系,则有可以直接用代替计算量大为降低。
4.2)对4.1中所得到的S′w和S′b代入直接线性判别法(Direct LDA),代替ISOMAP方法中的MDS方法,寻找DG的最佳分类投影子空间映射φ:RD→Rd,其中:RD是高维特征空间,D≥d。具体如下:
(1)白化寻找其特征值Λb和特征向量Vb,满足(ΦbVb)TΦbVb=Λb,其中令P为Vb的前m个非零特征值对应的特征向量,则有(PVb)TPVb=Db>0,其中Db为Λb的m×m主子矩阵。令满足(2)对角化W1TΦwTΦwW1。选取W1TΦwTΦwW1的前d个最小特征值所对应的特征向量组成矩阵W2,满足Λw为对角矩阵,其主对角元素为(ΦwW1)TΦwW1的前d个最小特征值。(3)构造线性变换矩阵W=W1W2,作为φ:RD→Rd的最佳投影矩阵。
第五步、将最佳投影矩阵W作用于测试集Dtest,进行降维,得到低维的优化数据,然后用合适的分类方法对测试集进行分类,检验识别效果。分类方法可以是最小距离法或者K近邻法等。
本实施例在实施过程中分别与经典方法Eigenface,Fisherface,PCA+LPP等算法以及基于全局流形学习的ISOMAP算法和Ext-ISOMAP算法,在归一化条件下和加噪条件下分别进行识别效果的比较,实验结果如表1、2和图2、3、4所示。
如表1所示,为不同方法在ORL人脸库上的识别率
方法 邻域参数(k/ε) 特征维数 错误率(%) 方法一 NA 40 13.15 方法二 NA 40 3.50
方法 邻域参数(k/ε) 特征维数 错误率(%) 方法三 K=11 40 4.90 方法四 K=18 40 2.75 方法四 ε=30 40 2.60 方法五 K=18 35 1.90 方法五ε=30 35 1.60 方法六K=18 40 19.3
表1
如表2所示,为不同方法在YALE人脸库上的识别率
方法 邻域参数(k/ε) 特征维数 错误率(%) 方法一 NA 40 6.53 方法二 NA 40 13.53 方法三 K=11 40 15.84 方法四 K=18 40 11.70 方法四 ε=29 40 8.32 方法五 K=14 35 9.335 方法五 ε=29 35 7.33 方法六 K=18 40 27.30
表2
注:方法一:Fisherface,方法二:Eigenface,方法三:PCA+LPP,方法四:Ext-ISOMAP,方法五:KIMD-ISOMAP,方法六:ISOMAP。
如图2所示,为本实施例所述方法对ORL人脸和YALE人脸分别进行处理后得到的识别率-最近邻半径比较图,其中:菱形线为Ext-Isomap算法,星形线为本实施例所提出的方法(KIMD-ISOMAP)。
如图3所示,为本实施例所述方法对增加高斯噪声后的ORL人脸和增加高斯噪声后的YALE人脸分别进行处理后得到的识别率比较图,其中:星形线为本实施例所提出的方法(KIMD-ISOMAP).
如图4所示,为本实施例所述方法对增加旋转噪声后的ORL人脸和增加旋转噪声后的YALE人脸分别进行处理后得到的识别率比较图,其中:星形线为本实施例所提出的方法(KIMD-ISOMAP)。
如附图所示,在高斯噪声和几何形变的环境下,在较小的噪声环境和轻微的几何形变环境下,本实施例与现有技术相比具有更高的识别率。且与经典的Ext-Isomap算法相比,最近邻半径的选取范围也获得有效的扩大。