一种融合颜色特征与词汇树的车辆图像检索方法.pdf

摘要
申请专利号：	CN201611069889.4	申请日：	2016.11.29
公开号：	CN106776856A	公开日：	2017.05.31
当前法律状态：	实审	有效性：	审中
法律详情：	实质审查的生效IPC(主分类):G06F 17/30申请日:20161129\|\|\|公开
IPC分类号：	G06F17/30; G06K9/00; G06K9/46; G06K9/62	主分类号：	G06F17/30
申请人：	江南大学
发明人：	陈莹; 郭佳宇
地址：	214122 江苏省无锡市滨湖区蠡湖大道1800号
优先权：
专利代理机构：		代理人：
PDF下载：	PDF下载

内容摘要

本发明提供了一种融合颜色特征与词汇树的车辆图像检索方法，首先提取训练图像的车辆部分，然后对车辆部分提取局部特征，利用分层k??means方法将特征量化为视觉单词词汇树，然后将测试图像提取车身部分局部特征，再将该特征分配到对应的视觉单词，并采用感知哈希的原理，将视觉单词分别映射为哈希码，得到图像的哈希码序列，然后提取车身图像的颜色特征，量化并统一为一个特征度，按照颜色差异由小到大排序，根据排序结果建立颜色特征权重，计算图像哈希码序列之间汉明距离，将颜色特征权重作为汉明距离的加权系数，计算图像的最终相似度，该方法有效节约车辆图像检索时间，提高车辆图像的检索准确率，可满足实际应用要求。

权利要求书

1.一种融合颜色特征与词汇树的车辆图像检索方法，其特征在于，包括以下步骤：
S01、词汇树的创建：对训练图像库中的每幅图像先提取车身部分，对于剔除掉背景部
分的车辆图像提取SIFT特征,这样就得到了一个特征集合F＝{f(i)}，然后对特征集合F进
行分层k-means聚类，初始时,在词汇树的第一层上对特征集合F进行第一次k-means聚类,
计算出每个聚类的中心向量Ci，类似的,对新产生的每个聚类再用k-means聚类聚成k个簇
集,不断地重复上述操作直到树的深度达到预先设定的L值,每个簇集定义为一个视觉单
词,得到视觉单词词汇树；
S02、用权值向量来表示图像：提取测试图像库中图像的车身部分，对于剔除掉背景部
分的车辆图像提取SIFT特征，分别将每个SIFT特征分配给词汇树中最为接近的视觉单词，
然后依据每幅图像中视觉单词出现的次数以及视觉单词与图像的相关程度来计算图像的
视觉单词权值；
S03、颜色特征权重的计算：提取图像车身部分HSV颜色空间模型，采用均匀分段的方法
对特征进行量化，再将特征向量统一到一个特征度中，计算查询图像与待检索图像之间的
特征度欧式距离排序并标号，根据颜色标号建立颜色特征权重；
S04、感知哈希进制数的选择：为提高大规模图像的检索效率，本发明采用感知哈希算
法原理，将视觉单词分别量化给不同的哈希码，在综合考虑本发明的量化时间与检索正确
率之后，本发明的进制数选取为4；
S05、图像相似度计算：通过汉明距离计算图像哈希序列的感知距离，再将颜色特征权
重作为汉明距离的加权系数得到最终查询图像与待检索图像的相似度sim(q,d)＝CqdHqd，
将最为相似图像输出。
2.根据权利要求1所述的融合颜色特征与词汇树的车辆图像检索方法，所述步骤S02包
括：
(1)对测试库中每一幅图像首先提取车身部分，对车身部分提取SIFT特征，这样就得到
了一个特征集合F＝{f(i)}以及相应的图像ID集合imgID＝{id(i)}；
(2)根据距离最近原则将SIFT特征分配给词汇树中最邻近的视觉单词，这样每幅图像
的SIFT特征就转化成了视觉单词；
(3)wi,j则表示图像dj中视觉单词Fi的权值,即视觉单词Fi与图像dj的相关程度，权值是
按照TF-IDF的原理定义的,mi,j表示视觉单词Fi在图像dj中出现的次数,它可以用来衡量视
觉单词用来描述图像的好坏程度，N表示图像库中图像的总数,ni表示包含视觉单词Fi的图
像数目，逆文献频率定义为idfi＝lg(N/ni),它表示的含义是视觉单词对于区分相似图像和
不相似图像的作用大小，所以,wi,j可以表示为
(4)图像dj可以用视觉单词的权值向量来表示为dj＝[w1,j,w2,j,L,wt,j]，测试图像库中
的所有图像可以用矩阵表示为
3.根据权利要求1所述的融合颜色特征与词汇树的车辆图像检索方法，所述步骤S03包
括：
(1)对图像直接提取HSV空间颜色特征向量，为了降低计算复杂程度，采用均匀分段的
方法对颜色特征进行量化，为了降低计算复杂程度，采用均匀分段的方法对颜色特征进行
量化，在根据公式L＝HQSQV+SQV+V将特征向量统一到一个特征度中，其中QS、QV分别表示饱和
度和亮度分量的量化级数；
(2)计算查询图像与待检索图像之间的特征度欧式距离，根据欧式距离由小到大进行
排序并标号，颜色最相似的标号为1，第二相似标号为2，以此类推；
(3)根据颜色的标号建立颜色特征权重，查询图像q和图像d的颜色特征权重计算公式
为其中Rqd表示在查询图像为q时，图像d的标号。
4.根据权利要求1所述的融合颜色特征与词汇树的车辆图像检索方法，所述步骤S04包
括：
(1)鉴于本发明的进制数为4，计算同一视觉单词在各个图像中权值的和，平均将它分
为四段，每一段表示一个哈希码，得到四个哈希码区间；
(2)将每个视觉单词与其对应的视觉单词的哈希码区间进行比较，分别将各个视觉单
词映射给哈希码，得到图像的哈希码序列。

说明书

一种融合颜色特征与词汇树的车辆图像检索方法

技术领域

本发明涉及一种融合颜色特征与词汇树的车辆图像检索方法，属于图像处理与分
析在智能交通系统上的应用。

背景技术

车辆图像检索是智能交通系统的重要组成部分，是公安系统破获车辆被盗等相关
案件的重要手段。所以面对城市交通中的海量卡口高清图像，车辆图像检索的准确性和高
效性对及时破案极为关键。基于词袋模型的图像检索机制是近几年来图像检索领域的主流
方法,该方法将大量训练图像特征(通常是SIFT特征)通过k-means聚类映射为视觉单词的
集合,构成视觉单词词典。然后将测试图像的特征逐个匹配量化到视觉单词词典中,得到了
图像的视觉单词直方图。由于将大量特征量化到视觉单词这个过程时间耗损过大,为此,
Nistér等人提出了利用分层k-means聚类的方法生成视觉单词词汇树,有效解决了搜索非
层次化单词带来的量化过程太慢的问题,生成的视觉单词由TF-IDF模型(词频-逆文档频
率)加权。由于视觉词汇树模型采用的SIFT特征只采用了灰度信息，而忽略了图像的全局颜
色特征，因此，本发明将车辆图像的颜色信息作为图像全局权值融入到视觉单词匹配模型
中去，从而提高车辆图像的检索精度，同时本发明引入感知哈希算法原理，能有效节约大规
模车辆图像检索时间。

发明内容

本发明所要解决的技术问题是提供一种融合颜色特征与词汇树的车辆图像检索
方法，本发明检索时间缩短，并在一定程度上提高检索精度，能够满足现实使用中对准确性
和实时性的要求。

为解决上述技术问题，本发明所采用的技术方案是：一种融合颜色特征与词汇树
的车辆图像检索方法，其特征在于，包括以下部分：

S01、词汇树的创建：对训练图像库中的每幅图像先提取车身部分，对于剔除掉背
景部分的车辆图像提取SIFT特征,这样就得到了一个特征集合F＝{f(i)}。然后对特征集合
F进行分层k-means聚类。初始时,在词汇树的第一层上对特征集合F进行第一次k-means聚
类,计算出每个聚类的中心向量Ci。类似的,对新产生的每个聚类再用k-means聚类聚成k个
簇集,不断地重复上述操作直到树的深度达到预先设定的L值,每个簇集定义为一个视觉单
词,得到视觉单词词汇树；

S02、用权值向量来表示图像：提取测试图像库中图像的车身部分，对于剔除掉背
景部分的车辆图像提取SIFT特征，分别将每个SIFT特征分配给词汇树中最为接近的视觉单
词，然后依据每幅图像中视觉单词出现的次数以及视觉单词与图像的相关程度来计算图像
的视觉单词权值；

S03、颜色特征权重的计算：提取图像车身部分HSV颜色空间模型，采用均匀分段的
方法对特征进行量化，再将特征向量统一到一个特征度中，计算查询图像与待检索图像之
间的特征度欧式距离排序并标号，根据颜色标号建立颜色特征权重；

S04、感知哈希进制数的选择：为提高大规模图像的检索效率，本发明采用感知哈
希算法原理，将视觉单词分别量化给不同的哈希码，在综合考虑本发明的量化时间与检索
正确率之后，本发明的进制数选取为4；

S05、图像相似度计算：通过汉明距离计算图像哈希序列的感知距离，再将颜色特
征权重作为汉明距离的加权系数得到最终查询图像与待检索图像的相似度sim(q,d)＝
CqdHqd，将最为相似图像输出。

作为本发明的进一步说明，所述步骤S02具体为：

(1)对测试库中每一幅图像首先提取车身部分，对车身部分提取SIFT特征，这样就
得到了一个特征集合F＝{f(i)}以及相应的图像ID集合imgID＝{id(i)}；

(2)根据距离最近原则将SIFT特征分配给词汇树中最邻近的视觉单词，这样每幅
图像的SIFT特征就转化成了视觉单词；

(3)wi,j则表示图像dj中视觉单词Fi的权值,即视觉单词Fi与图像dj的相关程度。权
值是按照TF-IDF的原理定义的,mi,j表示视觉单词Fi在图像dj中出现的次数,它可以用来衡
量视觉单词用来描述图像的好坏程度。N表示图像库中图像的总数,ni表示包含视觉单词Fi
的图像数目。逆文献频率定义为idfi＝lg(N/ni),它表示的含义是视觉单词对于区分相似图
像和不相似图像的作用大小。所以,wi,j可以表示为

(4)图像dj可以用视觉单词的权值向量来表示为dj＝[w1,j,w2,j,L,wt,j]，测试图像
库中的所有图像可以用矩阵表示为

作为本发明的进一步改进，所述步骤S03具体为：

(1)对图像直接提取HSV空间颜色特征向量，为了降低计算复杂程度，采用均匀分
段的方法对颜色特征进行量化，为了降低计算复杂程度，采用均匀分段的方法对颜色特征
进行量化，在根据公式L＝HQSQV+SQV+V将特征向量统一到一个特征度中，其中QS、QV分别表示
饱和度和亮度分量的量化级数；

(2)计算查询图像与待检索图像之间的特征度欧式距离，根据欧式距离由小到大
进行排序并标号，颜色最相似的标号为1，第二相似标号为2，以此类推；

(3)根据颜色的标号建立颜色特征权重，查询图像q和图像d的颜色特征权重计算
公式为其中Rqd表示在查询图像为q时，图像d的标号。

作为本发明的进一步说明，所述步骤S04具体为：

(1)鉴于本发明的进制数为4，计算同一视觉单词在各个图像中权值的和，平均将
它分为四段，每一段表示一个哈希码，得到四个哈希码区间；

(2)将每个视觉单词与其对应的视觉单词的哈希码区间进行比较，分别将各个视
觉单词映射给哈希码，得到图像的哈希码序列。

本发明的有益效果是，将图像的颜色特征作为全局权值加入到视觉单词的权值匹
配中去，将全局特征与局部特征综合考虑，并引入感知哈希算法原理，在有效节约检索时间
的基础上，也一定程度提高了车辆图像检索的准确率。

附图说明

图1为本发明所提供的一种融合颜色特征与词汇树的车辆图像检索方法流程图。

具体实施方式

下面结合附图所示的各实施方式对本发明进行详细说明，但应当说明的是，这些
实施方式并非对本发明的限制，本领域普通技术人员根据这些实施方式所作的功能、方法、
或者结构上的等效变换或替代，均属于本发明的保护范围之内。

针对当前基于词袋模型以及词汇树的车辆图像检索方法采用的SIFT特征只基于
灰度信息，忽略了图像的颜色信息，本发明提出了一种融合颜色特征与词汇树的车辆图像
检索方法，下面进行详细说明：

在本实施方式中，一种融合颜色特征与词汇树的车辆检索方法，其包括以下部分：