一种基于关系矩阵正则化增强表示的图像检索方法.pdf

上传人:zhu****69 文档编号:1491615 上传时间:2018-06-18 格式:PDF 页数:19 大小:1.86MB
返回 下载 相关 举报
摘要
申请专利号:

CN201310399734.7

申请日:

2013.09.05

公开号:

CN103440332A

公开日:

2013.12.11

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20130905|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

南京大学

发明人:

杨育彬; 李亚楠

地址:

210093 江苏省南京市汉口路22号南京大学

优先权:

专利代理机构:

江苏圣典律师事务所 32237

代理人:

胡建华

PDF下载: PDF下载
内容摘要

本发明公开了一种基于关系矩阵正则化增强方法从图像实例库中检索图像的方法,包含如下步骤:步骤1,输入待检索图像;步骤2,抽取待检索图像和图像实例库中图像的特征;步骤3,从图像实例特征库中选取P个图像类,从每一个图像类选取n幅图像构成样本数据X;步骤4,基于谱图理论的流形学习算法,对样本数据X构建三个矩阵;步骤5,初步建立增强关系矩阵W′;步骤6,计算正则化增强关系矩阵W*:步骤7,计算广义特征矩阵A;步骤8,计算最终的图像表示;步骤9,计算待检索图像的图像表示;步骤10,采用欧氏距离计算待检索图像与图像实例库中所有图像的相似度,按照相似度由大到小输出图像实例库中与待检索图像最相似的图像。

权利要求书

权利要求书
1.  一种基于关系矩阵正则化增强方法的图像检索方法,其特征在于,该方法从图像实例库中检索图像,包含如下步骤:
步骤1,输入待检索图像;
步骤2,抽取待检索图像和图像实例库中图像的特征,用N维向量描述每幅图像,N=112,得到图像实例特征库以及带检索图像的特征,所述图像实例库包括50个以上的图像类,每一个图像类表示一个语义类,每个图像类包括600幅以上的图像;
步骤3,从图像实例特征库中选取P个图像类,P取值范围20~50,从每一个图像类选取n幅图像,n取值范围100~500,P个图像类共有n×P张图像构成样本数据X;步骤4,基于谱图理论的流形学习算法,对样本数据X构建增强关系矩阵W、正例关系矩阵WP和反例关系矩阵WN;步骤5,对构建的关系矩阵W进行增强,初步建立增强关系矩阵W′;步骤6,借助概率转移矩阵正则化增强关系矩阵W′得到正则化增强关系矩阵W*步骤7,根据正则化增强关系矩阵W*构建目标方程,计算广义特征矩阵A;
步骤8,利用广义特征矩阵A对图像实例特征库中的所有图像进行降维,得到最终的图像表示;
步骤9,利用广义特征矩阵A对待检索图像降维,得到待检索图像的图像表示;
步骤10,根据步骤8的最终的图像表示和步骤9的待检索图像的图像表示的欧氏距离计算待检索图像与图像实例库中所有图像的相似度,按照相似度由大到小输出图像实例库中与待检索图像最相似的图像。

2.  根据权利要求1所述的一种基于关系矩阵正则化增强表示的图像检索方法,其特征在于,步骤2中图像特征包括颜色矩、Tamura纹理特征、Gabor纹理特征、颜色直方图。

3.  根据权利要求2所述的一种基于关系矩阵正则化增强表示的图像检索方法,其特征在于,步骤4具体包括如下步骤:在样本数据X中随机选取一幅图像,计算该图像与样本数据X中其他图像的欧式距离,利用相关反馈检索技术,根据返回结果中的同类图像和不同类图像对应设立正例集合和反例集合,并采用简单的k近邻方法建立关系矩阵,即属于k近邻并且是同一个图像类的两图像间的权值为1,否则为0。

4.  根据权利要求3所述的一种基于关系矩阵正则化增强表示的图像检索方法,其 特征在于,步骤4中采用基于反馈技术的嵌入关系拓宽ARE方法作为谱图理论的流形学习算法,包括以下步骤:
(1)首先对样本数据X构建关系矩阵W,从样本数据X中随机抽取一幅图像I,图像I的特征为xi,采用k近邻方法计算xi与样本数据X中其他图像特征的欧式距离,得到与图像I最相似的k幅图像,其中k取值范围5~10;
从k幅图像中任意取出一幅图像T属于,图像T的特征为xt,则图像I与图像T之间的权值Wit为1,图像I与k幅图像以外的图像之间的权值为0;即xi∈Nk(xt)or xt∈NK(xi),Wit=1,其中Nk(xi)表示图像xi的k近邻集合,Nk(xt)表示图像xt的k近邻集合;得到关系矩阵W,关系矩阵W第i行第t列的值即为Wit;
将k幅图像中与图像I属于同一图像类的图像记为正例集合Pos,不同图像类的图像记为反例集合Neg;
(2)构建正例关系矩阵WP,如果图像R与图像I属于同一图像类且都属于k幅图像,且图像R的特征为xr,则图像I与图像R之间的权值为1,图像I与k幅图像以外的图像之间的权值为0;即,为图像I与图像R之间的权值,xi,xr∈Pos为表示特征xi,xr属于正例集合Pos,正例关系矩阵WP的第i行第r列的值即为公式为:

(3)构建反例关系矩阵WN,如果图像H与图像I属于不同图像类且都属于k幅图像,图像H的特征为xh,则图像I与图像H之间的权值为1,图像I与k幅图像以外的图像之间的权值为0;即xi∈Posand xh∈negor xh∈Posand xi∈neg,xi∈pos表示特征xi属于正例集合Pos为,xh∈Neg表示特征xh属于反例集合Neg,xh∈Pos表示特征xh属于正例集合Pos,xi∈Neg表示特征xi属于反例集合Neg为,为图像I与图像H之间的权值,反例关系矩阵WN的第i第h列为公式为:
最后构建得到三个关系矩阵W,WP和WN,其中和为计算广义特征矩阵需要用到的关系矩阵。

5.  根据权利要求4所述的一种基于关系矩阵正则化增强表示的图像检索方法,其特征在于,步骤5具体包括如下步骤:从关系矩阵W出发,如果图像z是图像i的近邻图像,且图像z也是图像j的近邻图像,则采用下式计算增强图像i与图像j之间的权值W′ij:W′ij∑zWizWjz,其中Wiz为图像i与图像z的权值,Wjz为图像j与图像z的权值,W′ij即为增强关系矩阵W′的第i行第j列值。

6.  根据权利要求5所述的一种基于关系矩阵正则化增强表示的图像检索方法,其特征在于,步骤6具体包括如下步骤:
多次传播图像间的近邻关系得到新的增强关系矩阵W″,公式为W″=W′*W′;
利用转移概率矩阵表示图像间的转移关系,相应的转移矩阵为P=[Pij]n×n,Pij=p(j|i)为样本数据X中任一图像i到任一图像j的转移概率,根据欧式距离选择与图像i最相似的n幅图像,图像j的特征为xj,转移概率P(j|i)的计算公式为:

其中dij=||xi-xj||2,表示图像i与图像j特征的欧氏距离;
采用下式计算关系矩阵正则化增强的模型WR:
WR=ηP+(1-η)geT
其中,η为图像i转移到图像j这个事件发生的概率,(1-η)为图像i随机跳转的概率,g=(1/n)e,其中g是一个均匀随机分布向量,e是n维单位列向量,n即每个图像类的图像数,e=(1,1,…)T,矩阵P的第i行第j列为P(j|i);
图像i与图像j之间的新的关系权值计算公式为:
wij*=wij·wijR]]>
w″ij为图像i与图像j的权值,w″ij为W″的第i行第j列的值,为图像i跳转到图像j的概率权值,为WR的第i行第j列的值;
最终得到正则化增强关系矩阵W*,W*的第i行第j列为

7.  根据权利要求6所述的一种基于关系矩阵正则化增强表示的图像检索方法,其特征在于,步骤7中包括如下步骤:
首先从样本数据X中选取任意两幅图像的特征xi和xj,两幅图像的关系权值为Wij,两幅图像的正例关系权值为两幅图像的反例关系权值为根据以下目标方程计算得到广义特征矩阵A:
X(LN-γLP)XTA=λXLXTA
L为关系矩阵W的拉普拉斯矩阵,LN为反例关系矩阵WN的拉普拉斯矩阵,LP为正例关系矩阵WP的拉普拉斯矩阵,γ为与反例图像个数和正例图像个数的比值成正比的常数,XT表示样本数据X的转置矩阵,λ表示方程求解的特征值。

说明书

说明书一种基于关系矩阵正则化增强表示的图像检索方法
技术领域
本发明属于图像检索领域,特别是一种基于关系矩阵正则化增强方法的图像检索方法。
背景技术
在科技日益发达的今天,随着图像获取处理设备和互联网技术的迅猛发展和普及应用,以图像为代表的新一代信息资源已经成为与材料、能源具有同等重要地位的战略资源,其数据量也已达到海量规模,成为当前信息处理和信息资源建设的主体。由于图像具有信息量大、内容丰富、表现力强等优点,因此对海量规模的图像进行有效的信息处理和应用,已成为众多实际应用领域的核心问题。
由于当前图像数据已呈海量规模,并且在不断增长,传统的技术手段已经无法适应这种需求,这对图像的组织、分析、检索和管理等技术都提出了全新的挑战。尽管目前基于内容的图像检索研究已经取得了很大的进展,有效克服了基于手工标注的文本信息进行图像检索的局限性,但离真正的实用阶段还有一定的距离,尤其是对图像的高层语义理解方面。大部分方法还仅仅停留在围绕图像的底层特征进行语义描述和学习这一层次,相对于人类能够理解和运用的丰富多彩的语义概念,底层数据特征的表达能力尚有很大局限,因此底层特征与高层语义之间存在着较大差距,即所谓的“语义鸿沟”(semantic gap),从而导致在图像检索的准确率和效率上还远远达不到实际应用的需要,尤其是对图像的多种丰富语义进行准确有效的理解和检索方面。时至今日,图像检索中的“语义鸿沟”问题仍然没有得到很好的解决,仍然是困扰研究者的关键性难题之一。在解决这一难题的众多技术当中,基于相关反馈的图像检索技术提供了一种可行的解决方案。早期的相关反馈技术主要集中于基于相关反馈的信息,修正查询向量即图像特征,例如对查询向量的每一维数值重新分配权值,调整查询向量的位置等。近年来,由于流形学习的兴起,许多研究者转向通过流形学习技术,将高维的图像数据空间降维来探求图像特征空间的内在结构,其主要的理论假设是将图像看成是一种流形,目标就是发现其内在的结构信息。发现嵌入在高维数据中的低维子空间是学习数据潜在流形的重要手段,流形学习中子空间的学习方法都是基于局部分析的。通过流形学习的方法学习其所对应的低维的语义子空间,这与流形学习假设整个数据 集只在局部满足欧氏距离相吻合,因此通过分析图像数据的局部信息,发掘局部的语义流形结构对图像检索来说更加有意义。
发明内容
发明目的:本发明为了解决现有技术中的问题,提出了一种基于关系矩阵正则化增强表示的图像检索方法,有效地解决大规模数据下,图像的快速准确检索问题。
发明内容:本发明公开了一种基于关系矩阵正则化增强方法的图像检索方法,该方法从图像实例库中检索图像,包含如下步骤:
步骤1,输入待检索图像;
步骤2,抽取待检索图像和图像实例库中图像的特征,用N维向量描述每幅图像,N=112,得到图像实例特征库U=(u1,…,uM),ui为图像实例库第i幅图像的特征,i=1,…M,M为图像实例库中所包含的图像数,以及待检索图像的特征v,所述图像实例库包括50个以上的图像类,每一个图像类表示一个语义类,每个图像类包括600幅以上的图像;
步骤3,从图像实例特征库中选取P个图像类,P取值范围20~50,从每一个图像类选取n幅图像,n取值范围100~500,P个图像类共有n×P张图像构成样本数据X;例如发明的一个实施例中,从中选取30个图像类,每一类表示了不同的语义类,每一类有100幅图像,共有3000张图像构成样本数据X,X=(x1,…,xq),q=n×P,xi为样本数据中第i幅图像的特征,q为样本数据大小,X为112×q维的矩阵;
步骤4,基于谱图理论的流形学习算法,对样本数据X构建增强关系矩阵W、正例关系矩阵WP和反例关系矩阵WN;
步骤5,对构建的关系矩阵W进行增强,初步建立增强关系矩阵W′;
步骤6,借助概率转移矩阵正则化增强关系矩阵W′得到正则化增强关系矩阵W*;
步骤7,根据正则化增强关系矩阵W*构建目标方程,计算广义特征矩阵A;
步骤8,利用广义特征矩阵A对图像实例特征库中的所有图像进行降维,即AU=A*(u1,…,uM)=(A*u1,…,A*uM),记yi=A*xi,i=1,…M,得到最终的图像表示Y=(y1,…,yM),yi为图像实例库第i幅图像特征降维后的特征;
步骤9,利用广义特征矩阵A对待检索图像特征v降维,得到待检索图像的图像表 示f=A*v;
步骤10,根据步骤8的最终的图像表示和步骤9的待检索图像的图像表示的欧氏距离计算待检索图像与图像实例库中所有图像的相似度,即计算待检索图像降维特征f与图像实例特征库每幅图像特征降维后特征的欧氏距离||f-yi||2,i=1,…M,yi为图像实例库第i幅图像特征降维后的特征,按照相似度由大到小输出图像实例库中与待检索图像最相似的图像。
步骤2中图像特征包括颜色矩、Tamura纹理特征、Gabor纹理特征、颜色直方图。
步骤4具体包括如下步骤:在样本数据X中随机选取一幅图像,计算该图像与样本数据X中其他图像的欧式距离,利用相关反馈检索技术,根据返回结果中的同类图像和不同类图像对应设立正例集合和反例集合,并采用简单的k近邻方法建立关系矩阵,即属于k近邻并且是同一个图像类的两图像间的权值为1,否则为0。
步骤4中采用基于反馈技术的嵌入关系拓宽ARE方法作为谱图理论的流形学习算法,包括以下步骤:
(1)首先对样本数据X构建关系矩阵W,从样本数据X中随机抽取一幅图像I,图像I的特征为xi,采用k近邻方法计算xi与样本数据X中其他图像特征的欧式距离,得到与图像I最相似的k幅图像,其中k取值范围5~10;
从k幅图像中任意取出一幅图像T属于,图像T的特征为xt,则图像I与图像T之间的权值Wit为1,图像I与k幅图像以外的图像之间的权值为0;即xi∈Nk(xt)或xt∈Nk(xi),Wit=1,其中Nk(xi)表示图像xi的k近邻集合,Nk(xt)表示图像xt的k近邻集合;得到关系矩阵W,关系矩阵W第i行第t列的值即为Wit;
公式为:

将k幅图像中与图像I属于同一图像类的图像记为正例集合Pos,不同图像类的图像记为反例集合Neg,;
(2)构建正例关系矩阵WP,如果图像R与图像I属于同一图像类且都属于k幅图像,且图像R的特征为xr,则图像I与图像R之间的权值为1,图像I与k幅图像以外的图像之间的权值为0;即,为图像I与图像R之间的权值,xi,xr∈Pos 为表示特征xi,xr属于正例集合Pos,正例关系矩阵WP的第i行第r列的值即为公式为:

(3)构建反例关系矩阵WN,如果图像H与图像I属于不同图像类且都属于k幅图像,图像H的特征为xh,则图像I与图像H之间的权值为1,图像I与k幅图像以外的图像之间的权值为0;即xi∈Pos且xh∈Neg或xh∈Pos且表示特征xi属于正例集合Pos,xh∈Neg表示特征xh属于反例集合Neg,xh∈Pos表示特征xh属于正例集合Pos,xi∈Neg表示特征xi属于反例集合Neg,为图像I与图像H之间的权值,反例关系矩阵WN的第i第h列为公式为:

最后构建得到三个关系矩阵W,WP和WN,其中和为计算广义特征矩阵需要用到的关系矩阵。
步骤5具体包括如下步骤:从关系矩阵W出发,如果图像z是图像i的近邻图像,且图像z也是图像j的近邻图像,则采用下式计算增强图像i与图像j之间的权值W′ij:W′ij=ΣzWizWjz
其中Wiz为图像i与图像z的权值,Wjz为图像j与图像z的权值,W′ij即为增强关系矩阵W′的i行第j列值。
步骤6具体包括如下步骤:
多次传播图像间的近邻关系得到新的增强关系矩阵W″,公式为W″=W′*W′;
利用转移概率矩阵表示图像间的转移关系,相应的转移矩阵为P=[Pij]n×n,Pij=p(j|i)为样本数据X中任一图像i到任一图像j的转移概率,根据欧式距离选择与图像i最相似的n幅图像,图像j的特征为xj,转移概率P(j|i)的计算公式为:

其中dij=||xi-xj||2,表示图像i与图像j特征的欧氏距离。
采用下式计算关系矩阵正则化增强的模型WR:
WR=ηP+(1-η)geT
其中,η为图像i转移到图像j这个事件发生的概率,(1-η)为图像i随机跳转的概率,g=(1/n)e,其中g是一个均匀随机分布向量,e是n维单位列向量,n即每个图像类的图像数,e=(1,1,…)T,矩阵P的第i行第j列为P(j|i);
图像i与图像j之间的新的关系权值计算公式为:
wij*=wij·wijR]]>
w″ij为图像i与图像j的权值,w″ij为W″的第i行第j列的值,为图像i跳转到图像j的概率权值,为WR的第i行第j列的值;
最终得到正则化增强关系矩阵W*,W*的第i行第j列为
步骤7中包括如下步骤:
首先从样本数据X中选取任意两幅图像的特征xi和xj,两幅图像的关系权值为Wij,两幅图像的正例关系权值为两幅图像的反例关系权值为根据以下目标方程计算得到广义特征矩阵A:
X(LN-γLP)XTA=λXLXTA,
L为关系矩阵W的拉普拉斯矩阵,LN为反例关系矩阵WN的拉普拉斯矩阵,LP为正例关系矩阵WP的拉普拉斯矩阵,γ为与反例图像个数和正例图像个数的比值成正比的常数,XT表示样本数据X的转置矩阵,λ表示方程求解的特征值。
本发明中ARE为拓宽关系嵌入方法(Augmented Relation Embedding),一种拓宽关系图嵌入的流形学习降维算法,ARE主要利用正例关系矩阵与反例关系矩阵嵌入全局关系矩阵中,寻找投影矩阵,即广义特征矩阵,从而实现对数据特征的降维。
本发明原理为,样本数据X=(x1,…,xN),xi∈Rm,数据点间的关系矩阵W∈RN×N表示,矩阵的元素衡量了每对数据点间的相似度。对角矩阵D和相应的拉普拉斯矩阵L由下式定义:
Dii=ΣjWij,∀i,]]>
L=D-W
Dii为对角矩阵D的第i行第i列,假设广义特征矩阵为A,通过投影完成原始数据空间的低维嵌入,A可由下式最小化求得:
Σij(ATxi-ATxj)2Wij]]>
矩阵A的每列aj单独作用,故上式可写成argminaΣij(aTxi-aTxj)2Wij,其中a为待求的特征向量。令yi=aTxi,则有:
Σij(yi-yj)2wij=Σijyi2wij-2Σijyiyjwij+Σijyj2Wij]]>
=2Σiyi2Dii-2ΣijyiyjWij]]>
=2yT(D-W)y=2yTLy]]>
其中,y表示所有数据在a这个投影向量上的投影,且y=aTX。对转换后的坐标限制,Dii表示与第i个点相连接的个数,某种程度上说明了该点重要性程度,进而可增加约束使得yTDy=1。这一约束可使重要性高的点转换后其坐标值更加接近域原点,让最密集区域位于原点,最终求解的目标函数方程变为:
a*=argminaaTXLXTa,s.t.aTXDXTa=1]]>
从推导过程来看,关系矩阵W在整个过程起着主导作用,投影后的数据点y也与W有着密切的关系,例如当Wij较大时,表示xi和xj相似度较大,降维后yi和yj间的距离也应该越小越好;若Wij较小,表示xi和xj相似度较小,降维后yi和yj间的距离也应该越大越好。这里的相似度关系可以表示数据间是否属于同一个类别,同类数据间的相似度自然很高;对于没有类别信息的数据,数据间的相似度就用近邻关系来衡量,近邻数据点间的相似度应该较高;对于既不是同类数据,也不具有近邻关系的数据点间的相似度会 比较低,一般令Wij=0。
有益效果:本发明利用关系矩阵正则化增强表示对图像实例特征进行降维,该方法能够有效加强同类图像之间的关系,构建关系矩阵的过程中融合了数据的类别信息,使其很容易的扩展到半监督学习的框架中,从而充分利用标记数据和未标记数据,有效的提高算法的稳定性并降低计算复杂度,同时使得图像查询具有较高的准确率,因此关系矩阵正则化增强表示的图像检索方法具有较高的使用价值。
附图说明
图1为本发明的流程图。
图2位图像实例库特征降维流程图。
图3为待检索图像特征降维流程图。
图4为图像关系增强示意图。
图5为图像随机游走模型示意图。
图6位正则化增强关系示意图。
图7为图像检索结果示意图。
具体实施方式
如图1所示,本发明公开了一种基于正则化增强关系矩阵表示的图像检索方法;包含如下步骤:
步骤1:输入待检索图像;
如图2~3所示,构建图像正则化增强关系矩阵主要由步骤2~步骤6进行,对图像实例特征库降维由步骤8进行,对待检索图像特征降维由步骤9进行:
步骤2,抽取待检索图像和图像实例库图像的图像特征,,特征包括颜色矩、Tamura纹理特征、Gabor纹理特征和颜色直方图,用N维的向量来描述每幅图像,N=112,待检索图像为v,图像实例特征库为U=(u1,…,uM),M为图像实例库图像总数,U为N×M维矩阵;
步骤3,抽取后的特征表示每幅图像,从图像实例库中选取30个图像类,每一类表示一个语义类,每一类有100幅图像,共有3000张图像,并将其作为样本数据X,X=(x1,…,x3000),矩阵X为112×3000维;
步骤4,基于谱图理论的流形学习算法,对样本数据X构建增强关系矩阵W、正例 关系矩阵WP和反例关系矩阵WN;
步骤5,增强关系矩阵W,初步建立增强关系矩阵W′;
步骤6,借助概率转移矩阵正则化增强关系矩阵W′得到正则化增强关系矩阵W*;
步骤7,根据正则化增强关系矩阵W*和正例关系矩阵WP和反例关系矩阵WN构建目标函数,求解广义特征矩阵A;
步骤8,利用广义特征矩阵A对图像实例库中所有图像进行降维,即AU=A*(u1,…,uM)=(A*u1,…,A*uM),记yi=A*xi,i=1,…M,得到最终的图像表示Y=(y1,…,yM);
步骤9,如图3所示,利用广义特征矩阵A对待检索图像特征v进行降维,得到待检索图像的图像表示f=A*v;
步骤10,采用欧式距离计算待检索图像与图像实例库中所有图像的相似性,即计算||f-yi||2,i=1,…M,按照相似度由大到小输出图像实例库中与待检索图像最相似的图像。
步骤2具体包括如下步骤:
抽取每幅图像特征,即图像描述方面由颜色矩(RGB颜色空间):9维;颜色矩(LUV颜色空间):9维;Tamura纹理特征:6维;Gabor纹理特征:24维;颜色直方图(HSV颜色空间):64维组成。
步骤4具体包括如下步骤:在样本数据X中随机选取一幅图像,计算该图像与样本数据X中其他图像的欧式距离,利用相关反馈检索技术,根据返回结果中的同类图像和不同类图像对应设立正例集合和反例集合,并采用简单的k近邻方法建立关系矩阵,即属于k近邻并且是同一个图像类的两图像间的权值为1,否则为0。
步骤4中采用基于反馈技术的嵌入关系拓宽ARE方法作为谱图理论的流形学习算法,包括以下步骤:
(1)首先对样本数据X构建关系矩阵W,从样本数据X中随机抽取一幅图像I,图像I的特征为xi,采用k近邻方法计算xi与样本数据X中其他图像特征的欧式距离,得到与图像I最相似的k幅图像,其中k取值范围5~10;
从k幅图像中任意取出一幅图像T属于,图像T的特征为xt,则图像I与图像T之间的权值Wit为1,图像I与k幅图像以外的图像之间的权值为0;即xi∈Nk(xt)或xt∈ Nk(xi),Wit=1,其中Nk(xi)表示图像xi的k近邻集合,Nk(xt)表示图像xt的k近邻集合;得到关系矩阵W,关系矩阵W第i行第t列的值即为Wit;
公式为:

将k幅图像中与图像I属于同一图像类的图像记为正例集合Pos,不同图像类的图像记为反例集合Neg,;
(2)构建正例关系矩阵WP,如果图像R与图像I属于同一图像类且都属于k幅图像,且图像R的特征为xr,则图像I与图像R之间的权值为1,图像I与k幅图像以外的图像之间的权值为0;即,为图像I与图像R之间的权值,xi,xr∈Pos为表示特征xi,xr属于正例集合Pos,正例关系矩阵WP的第i行第r列的值即为公式为:

(3)构建反例关系矩阵WN,如果图像H与图像I属于不同图像类且都属于k幅图像,图像H的特征为xh,则图像I与图像H之间的权值为1,图像I与k幅图像以外的图像之间的权值为0;即xi∈Pos且xh∈Neg或xh∈Pos且xi∈Pos表示特征xi属于正例集合Pos,xh∈Neg表示特征xh属于反例集合Neg,xh∈Pos表示特征xh属于正例集合Pos,xi∈Neg表示特征xi属于反例集合Neg,为图像I与图像H之间的权值,反例关系矩阵WN的第i第h列为公式为:

最后构建得到三个关系矩阵W,WP和WN,其中和为计算广义特征矩阵需要用到的关系矩阵。
步骤5具体包括如下步骤:从关系矩阵W出发,如果图像z是图像i的近邻图像,且图像z也是图像j的近邻图像,则采用下式计算增强图像i与图像j之间的权值W′ij:
W′ij=∑zWizWjz
其中Wiz为图像i与图像z的权值,Wjz为图像j与图像z的权值,W′ij即为增强关系矩阵W′的i行第j列值。
步骤6具体包括如下步骤:
多次传播图像间的近邻关系得到新的增强关系矩阵W″,公式为W″=W′*W′;
利用转移概率矩阵表示图像间的转移关系,相应的转移矩阵为P=[Pij]n×n,Pij=p(j|i)为样本数据X中任一图像i到任一图像j的转移概率,根据欧式距离选择与图像i最相似的n幅图像,图像j的特征为xj,转移概率P(j|i)的计算公式为:

其中dij=||xi-xj||2,表示图像i与图像j特征的欧氏距离。
采用下式计算关系矩阵正则化增强的模型WR:
WR=ηP+(1-η)geT其中,η为图像i转移到图像j这个事件发生的概率,(1-η)为图像i随机跳转的概率,g=(1/n)e,其中g是一个均匀随机分布向量,e是n维单位列向量,n即每个图像类的图像数,e=(1,1,…)T,矩阵P的第i行第j列为P(j|i);
图像i与图像j之间的新的关系权值计算公式为:
wij*=wij·wijR]]>
w″ij为图像i与图像j的权值,w″ij为W″的第i行第j列的值,为图像i跳转到图像j的概率权值,为WR的第i行第j列的值;最终得到正则化增强关系矩阵W*,W*的第i行第j列为步骤7中包括如下步骤:首先从样本数据X中选取任意两幅图像的特征xi和xj,两幅图像的关系权值为Wij, 两幅图像的正例关系权值为两幅图像的反例关系权值为根据以下目标方程计算得到广义特征矩阵A:X(LN-γLP)XTA=λXLXTA,
L为关系矩阵W的拉普拉斯矩阵,LN为反例关系矩阵WN的拉普拉斯矩阵,LP为正例关系矩阵WP的拉普拉斯矩阵,γ为与反例图像个数和正例图像个数的比值成正比的常数,XT表示样本数据X的转置矩阵,λ表示方程求解的特征值。
实施例1
本实施例包括以下部分:
1.输入一幅待检索图像I;
2.抽取图像实例库和待检索图像的图像特征,各个特征和其对应的维数如下所示:
颜色矩(RGB颜色空间):9维;颜色矩(LUV颜色空间):9维;Tamura纹理特征:6维;Gabor纹理特征:24维;颜色直方图(HSV颜色空间):64维。这样每幅图像将用112维的向量来描述,待检索图像为v,图像实例特征库为U=(u1,…,uM),M为图像实例库图像总数,U为N×M维矩阵;
3.从图像特征库U中选取训练样本数据,每幅图像用抽取特征表示,并从中选取30个图像类,每一类表示一个语义类,每一类有100幅图像,共有3000张图像,并将其作为样本数据X,X=(x1,…,x3000),矩阵X为112×3000维;。
4.在样本数据X中随机选取一幅图像,计算该图像与样本数据X中其他图像的欧式距离,利用相关反馈检索技术,根据返回结果中的同类图像和不同类图像对应设立正例集合和反例集合,并采用简单的k近邻方法建立关系矩阵,即属于k近邻并且是同一个图像类的两图像间的权值为1,否则为0。
步骤4中采用基于反馈技术的嵌入关系拓宽ARE方法作为谱图理论的流形学习算法,包括以下步骤:
(1)首先对样本数据X构建关系矩阵W,从样本数据X中随机抽取一幅图像I,图像I的特征为xi,采用k近邻方法计算xi与样本数据X中其他图像特征的欧式距离,得到与图像I最相似的k幅图像,其中k取值5;
从k幅图像中任意取出一幅图像T属于,图像T的特征为xt,则图像I与图像T之间的权值Wit为1,图像I与k幅图像以外的图像之间的权值为0;即xi∈Nk(xt)或xt∈ Nk(xi),Wit=1,其中Nk(xi)表示图像xi的k近邻集合,Nk(xt)表示图像xt的k近邻集合;得到关系矩阵W,关系矩阵W第i行第t列的值即为Wit;
公式为:

将k幅图像中与图像I属于同一图像类的图像记为正例集合Pos,不同图像类的图像记为反例集合Neg,;
(2)构建正例关系矩阵WP,如果图像R与图像I属于同一图像类且都属于k幅图像,且图像R的特征为xr,则图像I与图像R之间的权值为1,图像I与k幅图像以外的图像之间的权值为0;即,为图像I与图像R之间的权值,xi,xr∈Pos为表示特征xi,xr属于正例集合Pos,正例关系矩阵WP的第i行第r列的值即为公式为:

(3)构建反例关系矩阵WN,如果图像H与图像I属于不同图像类且都属于k幅图像,图像H的特征为xh,则图像I与图像H之间的权值为1,图像I与k幅图像以外的图像之间的权值为0;即xi∈Pos且xh∈Neg或xh∈Pos且xi∈pos表示特征xi属于正例集合Pos,xh∈Neg表示特征xh属于反例集合Neg,xh∈Pos表示特征xh属于正例集合Pos,xi∈Neg表示特征xi属于反例集合Neg,为图像I与图像H之间的权值,反例关系矩阵WN的第i第h列为公式为:

最后构建得到三个关系矩阵W,WP和WN,为计算广义特征矩阵需要用到的关系矩阵。
5.建立初始关系增强矩阵W′,从关系矩阵W出发,如果图像z是图像i的近邻图像,且图像z也是图像j的近邻图像,则采用下式计算增强图像i与图像j之间的权值W′ij:
W′ij=ΣzWizWjz
其中Wiz为图像i与图像z的权值,Wjz为图像j与图像z的权值,W′ij即为增强关系矩阵W′的i行第j列值。具体实例如图4所示,图像3是图像1的近邻图像,图像3是图像2的近邻图像,图像间用有箭头的实线连接代表近邻关系,图像1与图像2之间用虚线连接,代表图像1与图像2之间的关系需要增强。
6.构建概率转移矩阵WR并对增强关系矩阵W′进行正则化,
多次传播图像间的近邻关系得到新的增强关系矩阵W",公式为w"=w′*w′;
利用转移概率矩阵表示图像间的转移关系,相应的转移矩阵为P=[Pij]n×n,Pij=P(j|i)为样本数据X中任一图像i到任一图像j的转移概率,根据欧式距离选择与图像i最相似的n幅图像,图像j的特征为xj,转移概率P(j|i)的计算公式为:

其中dij=||xi-xj||2,表示图像i与图像j特征的欧氏距离。
采用下式计算关系矩阵正则化增强的模型WR:
WR=ηP+(1-η)geT
其中,η为图像i转移到图像j这个事件发生的概率,η取为0.85,(1-η)为图像i随机跳转的概率,g=(1/n)e,其中g是一个均匀随机分布向量,e是n维单位列向量,n即每个图像类的图像数,e=(1,1,…)T,矩阵P的第i行第j列为P(j|i);
图像i与图像j之间的新的关系权值计算公式为:
wij*=wij·wijR]]>
w″ij为图像i与图像j的权值,w″ij为W″的第i行第j列的值,为图像i跳转到图像j的概率权值,为WR的第i行第j列的值;
最终得到正则化增强关系矩阵W*,W*的第i行第j列为具体实例如图5~6所示,图5代表图像间的概率转移权值关系,图6中左上图1表示图像间的增强关系矩阵W″,两幅图像间用实线连接的是近邻图像,虚线连接代表是两幅图像之间的增强关 系,右上图2表示图像间的转移概率矩阵WR,图像间用实现连接代表图像间存在转移关系,下图3代表图像间的正则化增强关系矩阵W*,由W″和WR相乘得到;
7.根据正则化后的关系增强矩阵W*构建目标函数,求解广义特征矩阵A,
首先从样本数据X中选取任意两幅图像的特征xi和xj,两幅图像的关系权值为Wij,两幅图像的正例关系权值为两幅图像的反例关系权值为根据以下目标方程计算得到广义特征矩阵A:
X(LN-γLP)XTA=λXLXTA,
L为关系矩阵W的拉普拉斯矩阵,LN为反例关系矩阵WN的拉普拉斯矩阵,LP为正例关系矩阵WP的拉普拉斯矩阵,γ为与反例图像个数和正例图像个数的比值成正比的常数,XT表示样本数据X的转置矩阵,λ表示方程求解的特征值。
8.主要利用广义特征矩阵A对图像实例特征库中图像数据进行降维得到最终的图像表示,即AU=A*(u1,…,uM)=(A*ui,…,A*uM),记yi=A*xi,i=1,…M,最终的图像表示为Y=(y1,…,yM);
9.主要利用广义特征矩阵A对待检索图像特征v进行降维,得到待检索图像的图像表示f,f=A*v;
10.计算待检索图像与图像实例库中图像相似性:
采用欧式距离计算待检索图像与图像实例库中所有图像的相似性,即计算||f-yi||2,i=1,…M,||f-yi||2越小相似度越大,按照相似度由大到小输出图像实例库中与待检索图像最相似的图像。如图7所示,根据欧氏距离计算待检索图像与图像实例库所有图像的相似性,根据相似度由大到小输出4幅最相似的图像。
实施例2
图1为实施例2检索流程图,图中图像来源为公用的Corel5k数据库。图中2是对原始图像进行预处理,用颜色矩、Tamura纹理特征、Gabor纹理特征和颜色直方图表示一幅图像,图中3选取特征样本,从图像实例库中选取30个图像类,每一类表示了一个语义类,每一类有100幅图像,共有3000幅图像,为了提高计算速度,只用结果集中前400幅图像作为全局的数据集,用于建立关系矩阵W,正例关系矩阵WP,反例关系矩阵WN。然后对关系矩阵W进行增强得到W′,并利用概率转移矩阵WR正则化增 强关系矩阵,得到W*,然后根据正则化的增强关系矩阵W*求解目标函数的广义特征矩阵A,最后利用广义特征矩阵A对图像实例库中图像特征和待检索图像特征进行降维,对待检索图像进行检索,利用欧氏距离计算待检索图像与图像实例库中图像的相似度,按照相似度由大到小输出图像实例库中与待检索图像最相似的图像。
本发明提供了一种正则化增强关系矩阵表示的图像检索方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

一种基于关系矩阵正则化增强表示的图像检索方法.pdf_第1页
第1页 / 共19页
一种基于关系矩阵正则化增强表示的图像检索方法.pdf_第2页
第2页 / 共19页
一种基于关系矩阵正则化增强表示的图像检索方法.pdf_第3页
第3页 / 共19页
点击查看更多>>
资源描述

《一种基于关系矩阵正则化增强表示的图像检索方法.pdf》由会员分享,可在线阅读,更多相关《一种基于关系矩阵正则化增强表示的图像检索方法.pdf(19页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103440332 A(43)申请公布日 2013.12.11CN103440332A*CN103440332A*(21)申请号 201310399734.7(22)申请日 2013.09.05G06F 17/30(2006.01)(71)申请人南京大学地址 210093 江苏省南京市汉口路22号南京大学(72)发明人杨育彬 李亚楠(74)专利代理机构江苏圣典律师事务所 32237代理人胡建华(54) 发明名称一种基于关系矩阵正则化增强表示的图像检索方法(57) 摘要本发明公开了一种基于关系矩阵正则化增强方法从图像实例库中检索图像的方法,包含如下步骤:步骤1,输入待检。

2、索图像;步骤2,抽取待检索图像和图像实例库中图像的特征;步骤3,从图像实例特征库中选取P个图像类,从每一个图像类选取n幅图像构成样本数据X;步骤4,基于谱图理论的流形学习算法,对样本数据X构建三个矩阵;步骤5,初步建立增强关系矩阵W;步骤6,计算正则化增强关系矩阵W*:步骤7,计算广义特征矩阵A;步骤8,计算最终的图像表示;步骤9,计算待检索图像的图像表示;步骤10,采用欧氏距离计算待检索图像与图像实例库中所有图像的相似度,按照相似度由大到小输出图像实例库中与待检索图像最相似的图像。(51)Int.Cl.权利要求书3页 说明书11页 附图4页(19)中华人民共和国国家知识产权局(12)发明专利。

3、申请权利要求书3页 说明书11页 附图4页(10)申请公布号 CN 103440332 ACN 103440332 A1/3页21.一种基于关系矩阵正则化增强方法的图像检索方法,其特征在于,该方法从图像实例库中检索图像,包含如下步骤:步骤1,输入待检索图像;步骤2,抽取待检索图像和图像实例库中图像的特征,用N维向量描述每幅图像,N=112,得到图像实例特征库以及带检索图像的特征,所述图像实例库包括50个以上的图像类,每一个图像类表示一个语义类,每个图像类包括600幅以上的图像;步骤3,从图像实例特征库中选取P个图像类,P取值范围2050,从每一个图像类选取n幅图像,n取值范围100500,P个。

4、图像类共有nP张图像构成样本数据X;步骤4,基于谱图理论的流形学习算法,对样本数据X构建增强关系矩阵W、正例关系矩阵WP和反例关系矩阵WN;步骤5,对构建的关系矩阵W进行增强,初步建立增强关系矩阵W;步骤6,借助概率转移矩阵正则化增强关系矩阵W得到正则化增强关系矩阵W*步骤7,根据正则化增强关系矩阵W*构建目标方程,计算广义特征矩阵A;步骤8,利用广义特征矩阵A对图像实例特征库中的所有图像进行降维,得到最终的图像表示;步骤9,利用广义特征矩阵A对待检索图像降维,得到待检索图像的图像表示;步骤10,根据步骤8的最终的图像表示和步骤9的待检索图像的图像表示的欧氏距离计算待检索图像与图像实例库中所有。

5、图像的相似度,按照相似度由大到小输出图像实例库中与待检索图像最相似的图像。2.根据权利要求1所述的一种基于关系矩阵正则化增强表示的图像检索方法,其特征在于,步骤2中图像特征包括颜色矩、Tamura纹理特征、Gabor纹理特征、颜色直方图。3.根据权利要求2所述的一种基于关系矩阵正则化增强表示的图像检索方法,其特征在于,步骤4具体包括如下步骤:在样本数据X中随机选取一幅图像,计算该图像与样本数据X中其他图像的欧式距离,利用相关反馈检索技术,根据返回结果中的同类图像和不同类图像对应设立正例集合和反例集合,并采用简单的k近邻方法建立关系矩阵,即属于k近邻并且是同一个图像类的两图像间的权值为1,否则为。

6、0。4.根据权利要求3所述的一种基于关系矩阵正则化增强表示的图像检索方法,其特征在于,步骤4中采用基于反馈技术的嵌入关系拓宽ARE方法作为谱图理论的流形学习算法,包括以下步骤:(1)首先对样本数据X构建关系矩阵W,从样本数据X中随机抽取一幅图像I,图像I的特征为xi,采用k近邻方法计算xi与样本数据X中其他图像特征的欧式距离,得到与图像I最相似的k幅图像,其中k取值范围510;从k幅图像中任意取出一幅图像T属于,图像T的特征为xt,则图像I与图像T之间的权值Wit为1,图像I与k幅图像以外的图像之间的权值为0;即xiNk(xt)or xtNK(xi),Wit1,其中Nk(xi)表示图像xi的k。

7、近邻集合,Nk(xt)表示图像xt的k近邻集合;得到关系矩阵W,关系矩阵W第i行第t列的值即为Wit;将k幅图像中与图像I属于同一图像类的图像记为正例集合Pos,不同图像类的图像记为反例集合Neg;(2)构建正例关系矩阵WP,如果图像R与图像I属于同一图像类且都属于k幅图像,且图像R的特征为xr,则图像I与图像R之间的权值为1,图像I与k幅图像以外的图像之间权 利 要 求 书CN 103440332 A2/3页3的权值为0;即,为图像I与图像R之间的权值,xi,xrPos为表示特征xi,xr属于正例集合Pos,正例关系矩阵WP的第i行第r列的值即为公式为:(3)构建反例关系矩阵WN,如果图像H。

8、与图像I属于不同图像类且都属于k幅图像,图像H的特征为xh,则图像I与图像H之间的权值为1,图像I与k幅图像以外的图像之间的权值为0;即xiPosand xhnegor xhPosand xineg,xipos表示特征xi属于正例集合Pos为,xhNeg表示特征xh属于反例集合Neg,xhPos表示特征xh属于正例集合Pos,xiNeg表示特征xi属于反例集合Neg为,为图像I与图像H之间的权值,反例关系矩阵WN的第i第h列为公式为:最后构建得到三个关系矩阵W,WP和WN,其中和为计算广义特征矩阵需要用到的关系矩阵。5.根据权利要求4所述的一种基于关系矩阵正则化增强表示的图像检索方法,其特征在。

9、于,步骤5具体包括如下步骤:从关系矩阵W出发,如果图像z是图像i的近邻图像,且图像z也是图像j的近邻图像,则采用下式计算增强图像i与图像j之间的权值Wij:WijzWizWjz,其中Wiz为图像i与图像z的权值,Wjz为图像j与图像z的权值,Wij即为增强关系矩阵W的第i行第j列值。6.根据权利要求5所述的一种基于关系矩阵正则化增强表示的图像检索方法,其特征在于,步骤6具体包括如下步骤:多次传播图像间的近邻关系得到新的增强关系矩阵W,公式为WW*W;利用转移概率矩阵表示图像间的转移关系,相应的转移矩阵为PPijnn,Pijp(j|i)为样本数据X中任一图像i到任一图像j的转移概率,根据欧式距离。

10、选择与图像i最相似的n幅图像,图像j的特征为xj,转移概率P(j|i)的计算公式为:其中dij|xi-xj|2,表示图像i与图像j特征的欧氏距离;采用下式计算关系矩阵正则化增强的模型WR:WRP+(1-)geT其中,为图像i转移到图像j这个事件发生的概率,(1-)为图像i随机跳转的概率,g(1/n)e,其中g是一个均匀随机分布向量,e是n维单位列向量,n即每个图像类的图像数,e(1,1,)T,矩阵P的第i行第j列为P(j|i);图像i与图像j之间的新的关系权值计算公式为:权 利 要 求 书CN 103440332 A3/3页4wij为图像i与图像j的权值,wij为W的第i行第j列的值,为图像i。

11、跳转到图像j的概率权值,为WR的第i行第j列的值;最终得到正则化增强关系矩阵W*,W*的第i行第j列为7.根据权利要求6所述的一种基于关系矩阵正则化增强表示的图像检索方法,其特征在于,步骤7中包括如下步骤:首先从样本数据X中选取任意两幅图像的特征xi和xj,两幅图像的关系权值为Wij,两幅图像的正例关系权值为两幅图像的反例关系权值为根据以下目标方程计算得到广义特征矩阵A:X(LN-LP)XTAXLXTAL为关系矩阵W的拉普拉斯矩阵,LN为反例关系矩阵WN的拉普拉斯矩阵,LP为正例关系矩阵WP的拉普拉斯矩阵,为与反例图像个数和正例图像个数的比值成正比的常数,XT表示样本数据X的转置矩阵,表示方程。

12、求解的特征值。权 利 要 求 书CN 103440332 A1/11页5一种基于关系矩阵正则化增强表示的图像检索方法技术领域0001 本发明属于图像检索领域,特别是一种基于关系矩阵正则化增强方法的图像检索方法。背景技术0002 在科技日益发达的今天,随着图像获取处理设备和互联网技术的迅猛发展和普及应用,以图像为代表的新一代信息资源已经成为与材料、能源具有同等重要地位的战略资源,其数据量也已达到海量规模,成为当前信息处理和信息资源建设的主体。由于图像具有信息量大、内容丰富、表现力强等优点,因此对海量规模的图像进行有效的信息处理和应用,已成为众多实际应用领域的核心问题。0003 由于当前图像数据已。

13、呈海量规模,并且在不断增长,传统的技术手段已经无法适应这种需求,这对图像的组织、分析、检索和管理等技术都提出了全新的挑战。尽管目前基于内容的图像检索研究已经取得了很大的进展,有效克服了基于手工标注的文本信息进行图像检索的局限性,但离真正的实用阶段还有一定的距离,尤其是对图像的高层语义理解方面。大部分方法还仅仅停留在围绕图像的底层特征进行语义描述和学习这一层次,相对于人类能够理解和运用的丰富多彩的语义概念,底层数据特征的表达能力尚有很大局限,因此底层特征与高层语义之间存在着较大差距,即所谓的“语义鸿沟”(semantic gap),从而导致在图像检索的准确率和效率上还远远达不到实际应用的需要,尤。

14、其是对图像的多种丰富语义进行准确有效的理解和检索方面。时至今日,图像检索中的“语义鸿沟”问题仍然没有得到很好的解决,仍然是困扰研究者的关键性难题之一。在解决这一难题的众多技术当中,基于相关反馈的图像检索技术提供了一种可行的解决方案。早期的相关反馈技术主要集中于基于相关反馈的信息,修正查询向量即图像特征,例如对查询向量的每一维数值重新分配权值,调整查询向量的位置等。近年来,由于流形学习的兴起,许多研究者转向通过流形学习技术,将高维的图像数据空间降维来探求图像特征空间的内在结构,其主要的理论假设是将图像看成是一种流形,目标就是发现其内在的结构信息。发现嵌入在高维数据中的低维子空间是学习数据潜在流形。

15、的重要手段,流形学习中子空间的学习方法都是基于局部分析的。通过流形学习的方法学习其所对应的低维的语义子空间,这与流形学习假设整个数据集只在局部满足欧氏距离相吻合,因此通过分析图像数据的局部信息,发掘局部的语义流形结构对图像检索来说更加有意义。发明内容0004 发明目的:本发明为了解决现有技术中的问题,提出了一种基于关系矩阵正则化增强表示的图像检索方法,有效地解决大规模数据下,图像的快速准确检索问题。0005 发明内容:本发明公开了一种基于关系矩阵正则化增强方法的图像检索方法,该方法从图像实例库中检索图像,包含如下步骤:0006 步骤1,输入待检索图像;说 明 书CN 103440332 A2/。

16、11页60007 步骤2,抽取待检索图像和图像实例库中图像的特征,用N维向量描述每幅图像,N=112,得到图像实例特征库U(u1,uM),ui为图像实例库第i幅图像的特征,i1,M,M为图像实例库中所包含的图像数,以及待检索图像的特征v,所述图像实例库包括50个以上的图像类,每一个图像类表示一个语义类,每个图像类包括600幅以上的图像;0008 步骤3,从图像实例特征库中选取P个图像类,P取值范围2050,从每一个图像类选取n幅图像,n取值范围100500,P个图像类共有nP张图像构成样本数据X;例如发明的一个实施例中,从中选取30个图像类,每一类表示了不同的语义类,每一类有100幅图像,共有。

17、3000张图像构成样本数据X,X(x1,xq),qnP,xi为样本数据中第i幅图像的特征,q为样本数据大小,X为112q维的矩阵;0009 步骤4,基于谱图理论的流形学习算法,对样本数据X构建增强关系矩阵W、正例关系矩阵WP和反例关系矩阵WN;0010 步骤5,对构建的关系矩阵W进行增强,初步建立增强关系矩阵W;0011 步骤6,借助概率转移矩阵正则化增强关系矩阵W得到正则化增强关系矩阵W*;0012 步骤7,根据正则化增强关系矩阵W*构建目标方程,计算广义特征矩阵A;0013 步骤8,利用广义特征矩阵A对图像实例特征库中的所有图像进行降维,即AUA*(u1,uM)(A*u1,A*uM),记y。

18、iA*xi,i1,M,得到最终的图像表示Y(y1,yM),yi为图像实例库第i幅图像特征降维后的特征;0014 步骤9,利用广义特征矩阵A对待检索图像特征v降维,得到待检索图像的图像表示fA*v;0015 步骤10,根据步骤8的最终的图像表示和步骤9的待检索图像的图像表示的欧氏距离计算待检索图像与图像实例库中所有图像的相似度,即计算待检索图像降维特征f与图像实例特征库每幅图像特征降维后特征的欧氏距离|f-yi|2,i1,M,yi为图像实例库第i幅图像特征降维后的特征,按照相似度由大到小输出图像实例库中与待检索图像最相似的图像。0016 步骤2中图像特征包括颜色矩、Tamura纹理特征、Gabo。

19、r纹理特征、颜色直方图。0017 步骤4具体包括如下步骤:在样本数据X中随机选取一幅图像,计算该图像与样本数据X中其他图像的欧式距离,利用相关反馈检索技术,根据返回结果中的同类图像和不同类图像对应设立正例集合和反例集合,并采用简单的k近邻方法建立关系矩阵,即属于k近邻并且是同一个图像类的两图像间的权值为1,否则为0。0018 步骤4中采用基于反馈技术的嵌入关系拓宽ARE方法作为谱图理论的流形学习算法,包括以下步骤:0019 (1)首先对样本数据X构建关系矩阵W,从样本数据X中随机抽取一幅图像I,图像I的特征为xi,采用k近邻方法计算xi与样本数据X中其他图像特征的欧式距离,得到与图像I最相似的。

20、k幅图像,其中k取值范围510;0020 从k幅图像中任意取出一幅图像T属于,图像T的特征为xt,则图像I与图像T之间的权值Wit为1,图像I与k幅图像以外的图像之间的权值为0;即xiNk(xt)或xtNk(xi),Wit1,其中Nk(xi)表示图像xi的k近邻集合,Nk(xt)表示图像xt的k近邻集合;得到关系矩阵W,关系矩阵W第i行第t列的值即为Wit;0021 公式为:说 明 书CN 103440332 A3/11页70022 0023 将k幅图像中与图像I属于同一图像类的图像记为正例集合Pos,不同图像类的图像记为反例集合Neg,;0024 (2)构建正例关系矩阵WP,如果图像R与图像。

21、I属于同一图像类且都属于k幅图像,且图像R的特征为xr,则图像I与图像R之间的权值为1,图像I与k幅图像以外的图像之间的权值为0;即,为图像I与图像R之间的权值,xi,xrPos为表示特征xi,xr属于正例集合Pos,正例关系矩阵WP的第i行第r列的值即为公式为:0025 0026 (3)构建反例关系矩阵WN,如果图像H与图像I属于不同图像类且都属于k幅图像,图像H的特征为xh,则图像I与图像H之间的权值为1,图像I与k幅图像以外的图像之间的权值为0;即xiPos且xhNeg或xhPos且表示特征xi属于正例集合Pos,xhNeg表示特征xh属于反例集合Neg,xhPos表示特征xh属于正例集。

22、合Pos,xiNeg表示特征xi属于反例集合Neg,为图像I与图像H之间的权值,反例关系矩阵WN的第i第h列为公式为:0027 0028 最后构建得到三个关系矩阵W,WP和WN,其中和为计算广义特征矩阵需要用到的关系矩阵。0029 步骤5具体包括如下步骤:从关系矩阵W出发,如果图像z是图像i的近邻图像,且图像z也是图像j的近邻图像,则采用下式计算增强图像i与图像j之间的权值Wij:WijzWizWjz0030 其中Wiz为图像i与图像z的权值,Wjz为图像j与图像z的权值,Wij即为增强关系矩阵W的i行第j列值。0031 步骤6具体包括如下步骤:0032 多次传播图像间的近邻关系得到新的增强关。

23、系矩阵W,公式为WW*W;0033 利用转移概率矩阵表示图像间的转移关系,相应的转移矩阵为PPijnn,Pijp(j|i)为样本数据X中任一图像i到任一图像j的转移概率,根据欧式距离选择与图像i最相似的n幅图像,图像j的特征为xj,转移概率P(j|i)的计算公式为:0034 说 明 书CN 103440332 A4/11页80035 其中dij|xi-xj|2,表示图像i与图像j特征的欧氏距离。0036 采用下式计算关系矩阵正则化增强的模型WR:0037 WRP+(1-)geT0038 其中,为图像i转移到图像j这个事件发生的概率,(1-)为图像i随机跳转的概率,g(1/n)e,其中g是一个均。

24、匀随机分布向量,e是n维单位列向量,n即每个图像类的图像数,e(1,1,)T,矩阵P的第i行第j列为P(j|i);0039 图像i与图像j之间的新的关系权值计算公式为:0040 0041 wij为图像i与图像j的权值,wij为W的第i行第j列的值,为图像i跳转到图像j的概率权值,为WR的第i行第j列的值;0042 最终得到正则化增强关系矩阵W*,W*的第i行第j列为0043 步骤7中包括如下步骤:0044 首先从样本数据X中选取任意两幅图像的特征xi和xj,两幅图像的关系权值为Wij,两幅图像的正例关系权值为两幅图像的反例关系权值为根据以下目标方程计算得到广义特征矩阵A:0045 X(LN-L。

25、P)XTA=XLXTA,0046 L为关系矩阵W的拉普拉斯矩阵,LN为反例关系矩阵WN的拉普拉斯矩阵,LP为正例关系矩阵WP的拉普拉斯矩阵,为与反例图像个数和正例图像个数的比值成正比的常数,XT表示样本数据X的转置矩阵,表示方程求解的特征值。0047 本发明中ARE为拓宽关系嵌入方法(Augmented Relation Embedding),一种拓宽关系图嵌入的流形学习降维算法,ARE主要利用正例关系矩阵与反例关系矩阵嵌入全局关系矩阵中,寻找投影矩阵,即广义特征矩阵,从而实现对数据特征的降维。0048 本发明原理为,样本数据X(x1,xN),xiRm,数据点间的关系矩阵WRNN表示,矩阵的元。

26、素衡量了每对数据点间的相似度。对角矩阵D和相应的拉普拉斯矩阵L由下式定义:0049 0050 LD-W0051 Dii为对角矩阵D的第i行第i列,假设广义特征矩阵为A,通过投影完成原始数据空间的低维嵌入,A可由下式最小化求得:0052 0053 矩阵A的每列aj单独作用,故上式可写成argminaij(aTxi-aTxj)2Wij,其中a为待求的特征向量。令yiaTxi,则有:说 明 书CN 103440332 A5/11页90054 0055 0056 0057 其中,y表示所有数据在a这个投影向量上的投影,且yaTX。对转换后的坐标限制,Dii表示与第i个点相连接的个数,某种程度上说明了该。

27、点重要性程度,进而可增加约束使得yTDy1。这一约束可使重要性高的点转换后其坐标值更加接近域原点,让最密集区域位于原点,最终求解的目标函数方程变为:0058 0059 从推导过程来看,关系矩阵W在整个过程起着主导作用,投影后的数据点y也与W有着密切的关系,例如当Wij较大时,表示xi和xj相似度较大,降维后yi和yj间的距离也应该越小越好;若Wij较小,表示xi和xj相似度较小,降维后yi和yj间的距离也应该越大越好。这里的相似度关系可以表示数据间是否属于同一个类别,同类数据间的相似度自然很高;对于没有类别信息的数据,数据间的相似度就用近邻关系来衡量,近邻数据点间的相似度应该较高;对于既不是同。

28、类数据,也不具有近邻关系的数据点间的相似度会比较低,一般令Wij0。0060 有益效果:本发明利用关系矩阵正则化增强表示对图像实例特征进行降维,该方法能够有效加强同类图像之间的关系,构建关系矩阵的过程中融合了数据的类别信息,使其很容易的扩展到半监督学习的框架中,从而充分利用标记数据和未标记数据,有效的提高算法的稳定性并降低计算复杂度,同时使得图像查询具有较高的准确率,因此关系矩阵正则化增强表示的图像检索方法具有较高的使用价值。附图说明0061 图1为本发明的流程图。0062 图2位图像实例库特征降维流程图。0063 图3为待检索图像特征降维流程图。0064 图4为图像关系增强示意图。0065 。

29、图5为图像随机游走模型示意图。0066 图6位正则化增强关系示意图。0067 图7为图像检索结果示意图。具体实施方式0068 如图1所示,本发明公开了一种基于正则化增强关系矩阵表示的图像检索方法;包含如下步骤:0069 步骤1:输入待检索图像;0070 如图23所示,构建图像正则化增强关系矩阵主要由步骤2步骤6进行,对图像实例特征库降维由步骤8进行,对待检索图像特征降维由步骤9进行:说 明 书CN 103440332 A6/11页100071 步骤2,抽取待检索图像和图像实例库图像的图像特征,特征包括颜色矩、Tamura纹理特征、Gabor纹理特征和颜色直方图,用N维的向量来描述每幅图像,N=。

30、112,待检索图像为v,图像实例特征库为U(u1,uM),M为图像实例库图像总数,U为NM维矩阵;0072 步骤3,抽取后的特征表示每幅图像,从图像实例库中选取30个图像类,每一类表示一个语义类,每一类有100幅图像,共有3000张图像,并将其作为样本数据X,X(x1,x3000),矩阵X为1123000维;0073 步骤4,基于谱图理论的流形学习算法,对样本数据X构建增强关系矩阵W、正例关系矩阵WP和反例关系矩阵WN;0074 步骤5,增强关系矩阵W,初步建立增强关系矩阵W;0075 步骤6,借助概率转移矩阵正则化增强关系矩阵W得到正则化增强关系矩阵W*;0076 步骤7,根据正则化增强关系。

31、矩阵W*和正例关系矩阵WP和反例关系矩阵WN构建目标函数,求解广义特征矩阵A;0077 步骤8,利用广义特征矩阵A对图像实例库中所有图像进行降维,即AUA*(u1,uM)(A*u1,,A*uM),记yiA*xi,i1,M,得到最终的图像表示Y(y1,yM);0078 步骤9,如图3所示,利用广义特征矩阵A对待检索图像特征v进行降维,得到待检索图像的图像表示fA*v;0079 步骤10,采用欧式距离计算待检索图像与图像实例库中所有图像的相似性,即计算|f-yi|2,i1,M,按照相似度由大到小输出图像实例库中与待检索图像最相似的图像。0080 步骤2具体包括如下步骤:0081 抽取每幅图像特征,。

32、即图像描述方面由颜色矩(RGB颜色空间):9维;颜色矩(LUV颜色空间):9维;Tamura纹理特征:6维;Gabor纹理特征:24维;颜色直方图(HSV颜色空间):64维组成。0082 步骤4具体包括如下步骤:在样本数据X中随机选取一幅图像,计算该图像与样本数据X中其他图像的欧式距离,利用相关反馈检索技术,根据返回结果中的同类图像和不同类图像对应设立正例集合和反例集合,并采用简单的k近邻方法建立关系矩阵,即属于k近邻并且是同一个图像类的两图像间的权值为1,否则为0。0083 步骤4中采用基于反馈技术的嵌入关系拓宽ARE方法作为谱图理论的流形学习算法,包括以下步骤:0084 (1)首先对样本数据X构建关系矩阵W,从样本数据X中随机抽取一幅图像I,图像I的特征为xi,采用k近邻方法计算xi与样本数据X中其他图像特征的欧式距离,得到与图像I最相似的k幅图像,其中k取值范围510;0085 从k幅图像中任意取出一幅图像T属于,图像T的特征为xt,则图像I与图像T之间的权值Wit为1,图像I与k幅图像以外的图像之间的权值为0;即xiNk(xt)或xtNk(xi),Wit1,其中Nk(xi)表示图像xi的k近邻集合,Nk(xt)表示图像xt的k近邻集合;得到关系矩阵W,关系矩阵W第i行第t列的值即为Wit;0086 公式为:0087 说 明 书CN 103440332 A10。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1