一种融合颜色特征与词汇树的车辆图像检索方法技术领域
本发明涉及一种融合颜色特征与词汇树的车辆图像检索方法,属于图像处理与分
析在智能交通系统上的应用。
背景技术
车辆图像检索是智能交通系统的重要组成部分,是公安系统破获车辆被盗等相关
案件的重要手段。所以面对城市交通中的海量卡口高清图像,车辆图像检索的准确性和高
效性对及时破案极为关键。基于词袋模型的图像检索机制是近几年来图像检索领域的主流
方法,该方法将大量训练图像特征(通常是SIFT特征)通过k-means聚类映射为视觉单词的
集合,构成视觉单词词典。然后将测试图像的特征逐个匹配量化到视觉单词词典中,得到了
图像的视觉单词直方图。由于将大量特征量化到视觉单词这个过程时间耗损过大,为此,
Nistér等人提出了利用分层k-means聚类的方法生成视觉单词词汇树,有效解决了搜索非
层次化单词带来的量化过程太慢的问题,生成的视觉单词由TF-IDF模型(词频-逆文档频
率)加权。由于视觉词汇树模型采用的SIFT特征只采用了灰度信息,而忽略了图像的全局颜
色特征,因此,本发明将车辆图像的颜色信息作为图像全局权值融入到视觉单词匹配模型
中去,从而提高车辆图像的检索精度,同时本发明引入感知哈希算法原理,能有效节约大规
模车辆图像检索时间。
发明内容
本发明所要解决的技术问题是提供一种融合颜色特征与词汇树的车辆图像检索
方法,本发明检索时间缩短,并在一定程度上提高检索精度,能够满足现实使用中对准确性
和实时性的要求。
为解决上述技术问题,本发明所采用的技术方案是:一种融合颜色特征与词汇树
的车辆图像检索方法,其特征在于,包括以下部分:
S01、词汇树的创建:对训练图像库中的每幅图像先提取车身部分,对于剔除掉背
景部分的车辆图像提取SIFT特征,这样就得到了一个特征集合F={f(i)}。然后对特征集合
F进行分层k-means聚类。初始时,在词汇树的第一层上对特征集合F进行第一次k-means聚
类,计算出每个聚类的中心向量Ci。类似的,对新产生的每个聚类再用k-means聚类聚成k个
簇集,不断地重复上述操作直到树的深度达到预先设定的L值,每个簇集定义为一个视觉单
词,得到视觉单词词汇树;
S02、用权值向量来表示图像:提取测试图像库中图像的车身部分,对于剔除掉背
景部分的车辆图像提取SIFT特征,分别将每个SIFT特征分配给词汇树中最为接近的视觉单
词,然后依据每幅图像中视觉单词出现的次数以及视觉单词与图像的相关程度来计算图像
的视觉单词权值;
S03、颜色特征权重的计算:提取图像车身部分HSV颜色空间模型,采用均匀分段的
方法对特征进行量化,再将特征向量统一到一个特征度中,计算查询图像与待检索图像之
间的特征度欧式距离排序并标号,根据颜色标号建立颜色特征权重;
S04、感知哈希进制数的选择:为提高大规模图像的检索效率,本发明采用感知哈
希算法原理,将视觉单词分别量化给不同的哈希码,在综合考虑本发明的量化时间与检索
正确率之后,本发明的进制数选取为4;
S05、图像相似度计算:通过汉明距离计算图像哈希序列的感知距离,再将颜色特
征权重作为汉明距离的加权系数得到最终查询图像与待检索图像的相似度sim(q,d)=
CqdHqd,将最为相似图像输出。
作为本发明的进一步说明,所述步骤S02具体为:
(1)对测试库中每一幅图像首先提取车身部分,对车身部分提取SIFT特征,这样就
得到了一个特征集合F={f(i)}以及相应的图像ID集合imgID={id(i)};
(2)根据距离最近原则将SIFT特征分配给词汇树中最邻近的视觉单词,这样每幅
图像的SIFT特征就转化成了视觉单词;
(3)wi,j则表示图像dj中视觉单词Fi的权值,即视觉单词Fi与图像dj的相关程度。权
值是按照TF-IDF的原理定义的,mi,j表示视觉单词Fi在图像dj中出现的次数,它可以用来衡
量视觉单词用来描述图像的好坏程度。N表示图像库中图像的总数,ni表示包含视觉单词Fi
的图像数目。逆文献频率定义为idfi=lg(N/ni),它表示的含义是视觉单词对于区分相似图
像和不相似图像的作用大小。所以,wi,j可以表示为
(4)图像dj可以用视觉单词的权值向量来表示为dj=[w1,j,w2,j,L,wt,j],测试图像
库中的所有图像可以用矩阵表示为
作为本发明的进一步改进,所述步骤S03具体为:
(1)对图像直接提取HSV空间颜色特征向量,为了降低计算复杂程度,采用均匀分
段的方法对颜色特征进行量化,为了降低计算复杂程度,采用均匀分段的方法对颜色特征
进行量化,在根据公式L=HQSQV+SQV+V将特征向量统一到一个特征度中,其中QS、QV分别表示
饱和度和亮度分量的量化级数;
(2)计算查询图像与待检索图像之间的特征度欧式距离,根据欧式距离由小到大
进行排序并标号,颜色最相似的标号为1,第二相似标号为2,以此类推;
(3)根据颜色的标号建立颜色特征权重,查询图像q和图像d的颜色特征权重计算
公式为其中Rqd表示在查询图像为q时,图像d的标号。
作为本发明的进一步说明,所述步骤S04具体为:
(1)鉴于本发明的进制数为4,计算同一视觉单词在各个图像中权值的和,平均将
它分为四段,每一段表示一个哈希码,得到四个哈希码区间;
(2)将每个视觉单词与其对应的视觉单词的哈希码区间进行比较,分别将各个视
觉单词映射给哈希码,得到图像的哈希码序列。
本发明的有益效果是,将图像的颜色特征作为全局权值加入到视觉单词的权值匹
配中去,将全局特征与局部特征综合考虑,并引入感知哈希算法原理,在有效节约检索时间
的基础上,也一定程度提高了车辆图像检索的准确率。
附图说明
图1为本发明所提供的一种融合颜色特征与词汇树的车辆图像检索方法流程图。
具体实施方式
下面结合附图所示的各实施方式对本发明进行详细说明,但应当说明的是,这些
实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、
或者结构上的等效变换或替代,均属于本发明的保护范围之内。
针对当前基于词袋模型以及词汇树的车辆图像检索方法采用的SIFT特征只基于
灰度信息,忽略了图像的颜色信息,本发明提出了一种融合颜色特征与词汇树的车辆图像
检索方法,下面进行详细说明:
在本实施方式中,一种融合颜色特征与词汇树的车辆检索方法,其包括以下部分:
S01、词汇树的创建:对训练图像库中的每幅图像先提取车身部分,对于剔除掉背
景部分的车辆图像提取SIFT特征,这样就得到了一个特征集合F={f(i)}。然后对特征集合
F进行分层k-means聚类。初始时,在词汇树的第一层上对特征集合F进行第一次k-means聚
类,计算出每个聚类的中心向量Ci。类似的,对新产生的每个聚类再用k-means聚类聚成k个
簇集,不断地重复上述操作直到树的深度达到预先设定的L值,每个簇集定义为一个视觉单
词,得到视觉单词词汇树;
S02、用权值向量来表示图像:提取测试图像库中图像的车身部分,对于剔除掉背
景部分的车辆图像提取SIFT特征,分别将每个SIFT特征分配给词汇树中最为接近的视觉单
词,然后依据每幅图像中视觉单词出现的次数以及视觉单词与图像的相关程度来计算图像
的视觉单词权值;
所述步骤S02具体为:
(1)对测试库中每一幅图像首先提取车身部分,对车身部分提取SIFT特征,这样就
得到了一个特征集合F={f(i)}以及相应的图像ID集合imgID={id(i)};
(2)根据距离最近原则将SIFT特征分配给词汇树中最邻近的视觉单词,这样每幅
图像的SIFT特征就转化成了视觉单词;
(3)wi,j则表示图像dj中视觉单词Fi的权值,即视觉单词Fi与图像dj的相关程度。权
值是按照TF-IDF的原理定义的,mi,j表示视觉单词Fi在图像dj中出现的次数,它可以用来衡
量视觉单词用来描述图像的好坏程度。N表示图像库中图像的总数,ni表示包含视觉单词Fi
的图像数目。逆文献频率定义为idfi=lg(N/ni),它表示的含义是视觉单词对于区分相似图
像和不相似图像的作用大小。所以,wi,j可以表示为
(4)图像dj可以用视觉单词的权值向量来表示为dj=[w1,j,w2,j,L,wt,j],测试图像
库中的所有图像可以用矩阵表示为
S03、颜色特征权重的计算:提取图像车身部分HSV颜色空间模型,采用均匀分段的
方法对特征进行量化,再将特征向量统一到一个特征度中,计算查询图像与待检索图像之
间的特征度欧式距离排序并标号,根据颜色标号建立颜色特征权重;
所述步骤S03具体为:
(1)对图像直接提取HSV空间颜色特征向量,为了降低计算复杂程度,采用均匀分
段的方法对颜色特征进行量化,为了降低计算复杂程度,采用均匀分段的方法对颜色特征
进行量化,在根据公式L=HQSQV+SQV+V将特征向量统一到一个特征度中,其中QS、QV分别表示
饱和度和亮度分量的量化级数;
(2)计算查询图像与待检索图像之间的特征度欧式距离,根据欧式距离由小到大
进行排序并标号,颜色最相似的标号为1,第二相似标号为2,以此类推;
(3)根据颜色的标号建立颜色特征权重,查询图像q和图像d的颜色特征权重计算
公式为其中Rqd表示在查询图像为q时,图像d的标号。
S04、感知哈希进制数的选择:为提高大规模图像的检索效率,本发明采用感知哈
希算法原理,将视觉单词分别量化给不同的哈希码,在综合考虑本发明的量化时间与检索
正确率之后,本发明的进制数选取为4;
所述步骤S04具体为:
(1)鉴于本发明的进制数为4,计算同一视觉单词在各个图像中权值的和,平均将
它分为四段,每一段表示一个哈希码,得到四个哈希码区间;
(2)将每个视觉单词与其对应的视觉单词的哈希码区间进行比较,分别将各个视
觉单词映射给哈希码,得到图像的哈希码序列。
S05、图像相似度计算:通过汉明距离计算图像哈希序列的感知距离,再将颜色特
征权重作为汉明距离的加权系数得到最终查询图像与待检索图像的相似度sim(q,d)=
CqdHqd,将最为相似图像输出。
以上已以较佳实施例公开了本发明,然其并非用以限制本发明,凡采用等同替换
或者等效变换方式所获得的技术方案,均落在本发明的保护范围之内。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在
不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论
从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权
利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有
变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独
立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书
作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解
的其他实施方式。