一种基于局部三值模式分层重构的人脸识别方法技术领域
本发明涉及一种基于局部三值模式分层重构的人脸识别方法,属于图像处理
的技术领域。
背景技术
人脸识别作为近年来发展较为迅速的技术,各种新的研究理论层出不群,与
此同时,人脸识别在商业系统中也有成熟的应用,这是由于人脸识别作为一种生
物特征识别技术,具有实现成本低、隐蔽性强、复杂度低、可存储等优点,在门
禁防盗系统、电子商务、刑侦执法等领域有较为深入的应用,随着互联网的不断
发展,人脸识别的应用前景也会越来越广泛。但绝大多数的识别算法都需要在特
定的环境以及用户进行配合的情况下完成,所以不可控条件下的人脸识别逐步的
受到学术界的重视。
现有的识别技术研究种类较为复杂,从不同的角度出发,对于识别技术的分
类也不尽相同。从特征提取的角度出发,人脸识别的技术科分为如下几类:
(1)基于几何特征的人脸识别
在人脸识别初期的发展中应用较广,几何特征一般是题取人脸的五官比如双
眼、眉毛、下巴、嘴唇、鼻梁等,除此之外,也可取人脸上的一些明显特征如伤
疤、黑素细胞痣等作为识别特征。基于几何特征的方法复杂度不高,占用的空间
也较小,但是在不可控条件如光照、姿态发生变化下的识别效果不佳,以及几何
特征所携带的信息量不足,易被干扰等特点。
(2)基于神经网络的人脸识别
神经网络主要是将复杂度较高的函数映射通过数量较多的简单函数映射互
相连接进而实现,其实质是非线性且时间连续的自适应处理技术。其主要优点是
较强的学习处理能力,能够做到举一反三,稳健性较强且在处理过程中能够实现
自我创新。现在基于神经网络的技术理论越来越成为研究的热点,取得的发展也
较为迅速。神经网络适合处理一些环境复杂、信息模糊不清、逻辑不十分明确、
已知样本损失畸变较为严重的难题,而不可控条件下的人脸识别符合神经网络的
处理方向。
(3)基于弹性图匹配的人脸识别
弹性图匹配作为一种非静态链接结构的算法,常用作人脸矩形稀疏表征,其
主要实现步骤为:首先取和输入最接近的图像,对图中所以像素点完成最佳匹配,
进而输出已发生改变的图像,此时图像的像素点逼近模型图对应像素点的位置。
其优点是弹性图匹配对于人脸图像的表情、年龄、形态等的变化具有一定的鲁棒
性。缺点也较为明确:因为需要处理的数据量较大,所以其运行效率较低且占用
空间较大,实时性较差。
发明内容
针对现有技术的不足,本发明提供一种基于局部三值模式分层重构的人脸识
别方法。本发明的目的是为了提高人脸图像在不可控条件下的识别可靠性,该方
法对光照变化、姿态变化下的人脸识别具有鲁棒性。
本发明的技术方案如下:
一种基于局部三值模式分层重构的人脸识别方法,包括以下步骤:
(1)将选取人脸库分为训练样本以及测试样本;
(2)对训练样本以及测试样本做几何裁剪以及光照预处理;
(3)将经步骤(2)预处理后的样本图像引入灰度值,对所述样本图像进行二
维坐标标记,所述样本图像的灰度值和二维坐标组成三维信息量;
将样本图像进行梯度分层:首先将样本图像的像素点以为3×3作为基本单
元进行划分作为第一层像素层,自定义阈值为v,并将像素层的关键点像素灰度
值c分别与边界的八个领域点灰度值b做对比:如果b大于c+v时,将对应领域
点的值设置为1;如果b小于c-v时,将对应领域点的值设置为-1;如果b介于
c+v以及c-v之间,将对应领域点的值设置为0,将边界领域的数值按自定义顺
序进行组合,即为所述关键点的特征描述;
正负值编码:若将样本图像的局部三值模式特征向量设为m,则子局部三值
模式正向量V+为向量m与同等位数的1做异或处理后的结果,子局部三值模式
负向量V-是将向量m与同等位数的-1做异或处理后的结果;
(4)取4×4的像素层作为单元层模块,并将每个模块里包含的特征向量按
顺序进行组合形成单元层的特征描述:对该特征向量的梯度直方图进行权重投影,
梯度方向值小于180时选幅值作为投影权重,反之将选幅值的平方根作为投影权
重,并将样本内所有特征向量进行组合;
(5)将步骤(4)提取的特征向量投影到高维空间,求出该特征空间内的最佳
投影方向,即使得图像矩阵类间散度与类内聚度的比值取到最大值,将空间内的
图像矩阵在求出的最佳投影方向进行投影;
(6)提取测试样本的特征向量,投影到步骤(5)求出的最佳投影方向,并求
得测试样本以及训练样本之间余弦距离,并用“z-score”方法进行标准化后融
合分类。
根据本发明优选的,所述步骤(2)中对图像进行预处理的方法,包括:
1)将训练样本和测试样本几何裁剪为像素为80×80的样本;
2)所述光照预处理包括伽马校正、高斯差分滤波、对比度均衡化;所述伽
马校正包括将样本矩阵对数变换后输出样本的结构信息,此时的输出与
光照成不相关,伽马值取0.3;
对比度均衡化是将样本的总体亮度以及对比度实现标准化,实现公式如下:
S ( x , y ) = S ′ ( x , y ) ( m e a n ( m i n ( τ , | S ( x ′ , y ′ ) | ) a ) ) 1 / a ]]>
其中a=0.15,τ=9。
根据本发明优选的,所述步骤(4)中样本像素点水平以及垂直方向的梯度向
量为:
Px(x,y)=V(x+1,y)-V(x-1,y)
Py(x,y)=V(x,y+1)-V(x,y-1)
式中V(x,y)为样本点(x,y)处的像素值,进一步得到像素点的梯度幅值以及
方向:
P ( x , y ) = P x ( x , y ) 2 + P y ( x , y ) 2 ]]>
dir(x,y)=arctan(Py(x,y)/Px(x,y))。
根据本发明优选的,所述步骤(5)中高维特征空间内的最佳投影方向公式如
下:
J ( w ) = arg w m a x | w T S b w | | w T S w w | ]]>
S b = 1 C Σ i = 1 C ( μ i - μ 0 ) ( μ i - μ 0 ) T ]]>
式中为特征空间的样本均值,μ0为总体样本均值,N为训
练样本数;空间内的图像矩阵x在F空间w方向的投影计算式为:
式中表示投影算子,为特征空间中样本矩阵的线性组合。
根据本发明优选的,所述步骤(6)中余弦距离的计算公式为:
S c o s = - f t e s t T f t r a i n | | f t e s t | | | | f t r a i n | | ]]>
用“z-score”方法进行标准化:
z = s - μ δ ]]>
式中μ,δ分别代表余弦距离s的均值以及标准差,最后采用最近邻法分类。
本发明的有益效果:
本发明所述基于局部三值模式分层重构的人脸识别方法,结合了局部三值模
式的旋转不变性以及特征重构对阴影、光照变化的鲁棒性,对样本图像完成了分
层自适应权重的局部特征重构,最终输出的特征具有高效性以及较强的抗干扰能
力,在不可控条件下取得了很好的识别效果。
附图说明:
图1是ORL人脸库原始图像(上排)以及预处理后图像(下排)的对比。
图2是样本图像分层结构示意图。
图3是子局部模式正向量以及负向量生成流程。
图4是本发明所述人脸识别方法的具体流程图。
具体实施方式:
下面结合实施例和说明书附图对本发明做详细的说明,但不限于此。
实施例1、
一种基于局部三值模式分层重构的人脸识别方法,包括以下步骤:
(1)将选取人脸库分为训练样本以及测试样本;
(2)对训练样本以及测试样本做几何裁剪以及光照预处理;
所述步骤(2)中对图像进行预处理的方法,包括:
1)将训练样本和测试样本几何裁剪为像素为80×80的样本;
2)所述光照预处理包括伽马校正、高斯差分滤波、对比度均衡化;所述伽
马校正包括将样本矩阵对数变换后输出样本的结构信息,此时的输出与
光照成不相关,伽马值取0.3;
对比度均衡化是将样本的总体亮度以及对比度实现标准化,实现公式如下:
S ( x , y ) = S ′ ( x , y ) ( m e a n ( m i n ( τ , | S ( x ′ , y ′ ) | ) a ) ) 1 / a ]]>
其中a=0.15,τ=9。
(3)将经步骤(2)预处理后的样本图像引入灰度值,对所述样本图像进行二
维坐标标记,所述样本图像的灰度值和二维坐标组成三维信息量;
将样本图像进行梯度分层:首先将样本图像的像素点以为3×3作为基本单
元进行划分作为第一层像素层,自定义阈值为v,并将像素层的关键点像素灰度
值c分别与边界的八个领域点灰度值b做对比:如果b大于c+v时,将对应领域
点的值设置为1;如果b小于c-v时,将对应领域点的值设置为-1;如果b介于
c+v以及c-v之间,将对应领域点的值设置为0,将边界领域的数值按自定义顺
序进行组合,即为所述关键点的特征描述;
正负值编码:若将样本图像的局部三值模式特征向量设为m,则子局部三值
模式正向量V+为向量m与同等位数的1做异或处理后的结果,子局部三值模式
负向量V-是将向量m与同等位数的-1做异或处理后的结果;
(4)取4×4的像素层作为单元层模块,并将每个模块里包含的特征向量按
顺序进行组合形成单元层的特征描述:对该特征向量的梯度直方图进行权重投影,
梯度方向值小于180时选幅值作为投影权重,反之将选幅值的平方根作为投影权
重,并将样本内所有特征向量进行组合;
(5)将步骤(4)提取的特征向量投影到高维空间,求出该特征空间内的最佳
投影方向,即使得图像矩阵类间散度与类内聚度的比值取到最大值,将空间内的
图像矩阵在求出的最佳投影方向进行投影;
(6)提取测试样本的特征向量,投影到步骤(5)求出的最佳投影方向,并求
得测试样本以及训练样本之间余弦距离,并用“z-score”方法进行标准化后融
合分类。
实施例2、
如实施例1所述的一种基于局部三值模式分层重构的人脸识别方法,其区别
在于,所述步骤(4)中样本像素点水平以及垂直方向的梯度向量为:
Px(x,y)=V(x+1,y)-V(x-1,y)
Py(x,y)=V(x,y+1)-V(x,y-1)
式中V(x,y)为样本点(x,y)处的像素值,进一步得到像素点的梯度幅值以及
方向:
P ( x , y ) = P x ( x , y ) 2 + P y ( x , y ) 2 ]]>
dir(x,y)=arctan(Py(x,y)/Px(x,y))。
实施例3、
如实施例1所述的一种基于局部三值模式分层重构的人脸识别方法,其区别
在于,所述步骤(5)中高维特征空间内的最佳投影方向公式如下:
J ( w ) = arg w m a x | w T S b w | | w T S w w | ]]>
S b = 1 C Σ i = 1 C ( μ i - μ 0 ) ( μ i - μ 0 ) T ]]>
式中为特征空间的样本均值,μ0为总体样本均值,N为训
练样本数;空间内的图像矩阵x在F空间w方向的投影计算式为:
式中表示投影算子,为特征空间中样本矩阵的线性组合。
实施例4、
如实施例1所述的一种基于局部三值模式分层重构的人脸识别方法,其区别
在于,所述步骤(6)中余弦距离的计算公式为:
S c o s = - f t e s t T f t r a i n | | f t e s t | | | | f t r a i n | | ]]>
用“z-score”方法进行标准化:
z = s - μ δ ]]>
式中μ,δ分别代表余弦距离s的均值以及标准差,最后采用最近邻法分类。