在线图片实时检索方法及系统 【技术领域】
本发明涉及网络搜索领域,特别是涉及一种在线的图片实时检索方法及系统。
【背景技术】
传统的基于内容的图片搜索是利用提取图片的底层特征的方法来进行相似度查询。基于内容的图片搜索在20世纪90年代初被提出来,为了克服基于手工标注的图片搜索的两大难题——图片数量的巨大性以及手工标注的主观性,初期,基于内容的图片搜索获得了相当的成功,产生了许多研究和商业的应用系统,其中卡耐基梅隆大学开发的Informedia系统以及IBM公司开发的QBIC系统即为两个典型的系统。
但是传统的图像分析检索的方法都只考虑了图像中的像素,而忽略了图像本身所携带的元信息。在图像中和图像之间存在着一定的上下文关系:时间、空间和图片元信息的上下文关系。这种信息能够被用来进行图像语义分析。其中相机元信息是指Exif信息,例如一组标准的相机元信息包含在JPEG图片中,Exif信息记录着拍摄时的相机信息,如焦距长度、曝光时间、光圈F值、闪光灯、物理距离和曝光偏差等。利用这些信息进行图像的语义分析,如:闪光灯在室内使用的频率远大于室外;光圈F值越大,图像越可能是室外的风景而不是具体的物体。传统的图像分析检索的方法只考虑像素因素,因而在检索精确度上无法进一步提高。
【发明内容】
本发明的目的之一是提供一种在线图片实时管理方法,该方法能够充分利用图片自身携带的信息,便于对图片进行检索,提高图片检索的精确度和效率。
本发明的又一目的是提供一种在线图片实时管理系统,该系统能够根据用户提供的查询命令,充分利用图片自身携带的信息,对图片进行快速和高精确度的检索。
一种在线图片实时检索方法,其特征在于,包含如下步骤:
建立一图片数据库,该图片数据库中包含若干图片及这些图片的相机元信息;
提供一图片检索命令;
根据图片检索命令对图片数据库中的图片进行预排序;
利用相机元信息对经过预排序的图片进行顺序调整;以及
将调整后的结果返回。
其中,所述相机元信息包含曝光时间和光圈F值。
作为优选的技术方案,所述建立一图片数据库的步骤之后还包含一将所述图片数据库中的每张图片分割为若干区域,并提取各个所述区域的图片特征的步骤。所述根据图片查询命令对图片数据库中的图片进行预排序的方法为根据图片查询命令按照各个所述区域的图片特征对图片进行预排序。其中,所述图片特征为图片的高层语义特征或图片的底层特征。所述图片的底层特征为图片的颜色特征。所述图片的高层语义特征为图片的主题名称。
作为优选的技术方案,建立图片数据库的步骤中还包含将图片数据库中地图片皆调整为指定大小和格式。其中,图片数据库中的图片大小调整为320×240像素。图片数据库中的图片的格式调整为JPEG格式。
所述将调整后的结果返回的步骤为将图片数据库中的图片按照与图片查询命令的相似度从高到低顺序排列的结果返回。
一种在线图片实时检索系统,包含系统检索端及用户端,所述系统检索端包含算法引擎和数据库,该系统检索端与用户端之间通过网络进行通信,所述系统检索端根据用户端提供的图片查询命令通过算法引擎对数据库中的图片进行预排序后利用相机元信息对这些图片进行顺序调整,然后将调整后的结果返回至客户端。
其中,所述用户端为移动通信设备或电脑。所述网络为有线网络或无线网络。
本发明的有益效果在于,本发明既利用了图片的像素信息、颜色信息、名称信息等,同时也利用了图片本身携带的相机元信息,优化了对图片进行检索的步骤,提高了图片检索的精确度和检索效率,广泛适用于有线或无线网络中的图片检索和信息共享。
【附图说明】
图1为本发明在线图片实时检索系统的结构示意图;
图2为本发明具体实施方式的流程图。
【具体实施方式】
下面结合实施例并参照附图对本发明作进一步描述。
参见图1,图1为本发明在线图片实时检索系统的结构示意图。一种在线图片实时检索系统,包含系统检索端30及用户端10、20,如图所示,用户端可以为电脑或移动通信设备,如手机或PDA等,该系统检索端30与用户端10、20之间通过网络进行通信,所述系统检索端30包含算法引擎31和数据库32,所述网络为有线网络40或无线网络。所述系统检索端30根据用户端提供的图片查询命令通过算法引擎31对图片进行预排序,然后利用相机元信息33对这些图片进行顺序调整,最后将调整后的结果34返回至客户端。
下面以用户端为可上网的照相手机为例描述检索过程。
如图2所示,图2为本发明在线图片实时检索方法的流程图,包含如下步骤:
步骤S101,建立一图片数据库,该图片数据库中包含若干图片及这些图片的相机元信息;
相机元信息是指Exif信息,例如一组标准的相机元信息包含在JPEG图片中,Exif信息记录着拍摄时的相机信息,如焦距长度、曝光时间、光圈F值、闪光灯、物理距离和曝光偏差等。为了保证相机元信息不丢失,图片中的相机元信息的提取需要在网络端保证当图片上传时,网站端不对图片进行压缩处理,Exif包含在JPEG格式的图片内,而且由于JPEG图片本身由于具有存储体积小,图片质量好的特点,被很多智能手机所采用作为存储图片的格式。所以我们对于上传至网站端后,统一将图片格式转化为JPEG格式。
在后续对图像进行处理时,由于图像分辨率越高,图像质量越好而处理时间越长,为平衡二者关系,建立图片数据库的步骤中还包含将图片数据库中的图片皆调整为指定大小和格式。其中,图片数据库中的图片大小调整为320×240像素。处理大约需要30秒左右,此时图像的质量丢失不大。
步骤S102,将图片数据库中的图片分割为若干区域;
在进行图像分割时,采用JSEG分割算法,由于该算法对于大尺寸的图片处理时间很长,所以系统对用户上传的图片首先采用调整到指定大小的方法来平衡图片的清晰度和处理时间复杂度之间的关系.根据图片分割出的区域类别矩阵,在图片中勾画出不同的区域,结果显示给用户。在进行特征提取时,根据分割的区域矩阵,对每个区域计算其外接最小矩形,然后计算其底层颜色特征,获得各个区域的颜色特征。例如:给定一张查询图片,经过图片分割和底层特征提取之后,可把图片描述成如下形式:
Ii={(f1,w1),...,(fn,wn)} (1)
其中(fj,wj)描述了第i幅图片的第j个区域,fj表述第j个区域的底层特征,wj描述了第j个区域的权重,其由式(2)所定义.
wj=size_of(region_j)/size_of(mage_i) (2)
采用上述的描述方式,将数据库中的所有图片都描述成公式(1)的形式.
步骤S103,提供一图片检索命令;
该图片检索命令为根据用户的查询命令提出的检索图片特征的命令,所述图片特征为图片的高层语义特征或图片的底层特征,例如图片的主题名称或颜色特征等等。
步骤S104,根据图片检索命令对图片数据库中的图片进行预排序;
查询第i幅图片:Qi={(f1,w1),...,(fn,wn)}n个区域
源第t幅图片: Yt={(f1,w1),...,(fm,wm)}m个区域
将图像之间的相似性转化成计算不同区域个数的Qi和Yt之间的相似性.本发明采用EMD算法来计算二者的相似性。EMD算法的原理是:将Qi和Yt分别认为是散落在地球上不同地方的大小不一、数目不等的洞和土堆。算法的目标是利用这些土堆来尽可能地填满这些洞,同时保持总的运输距离最小。在EMD算法中,一个洞和一堆土之间的距离被称作为基准距离,用户可以自己选择定义该距离,如一阶范式,或者欧氏距离等。本具体实施方式使用了欧氏距离,由于其具有易计算性和良好的图片搜索效果,如式(3)所示,其中,d为底层特征的维数.
D(fjQ,fkY)=(fj1Q-fk1Y)2+(fj2Q-fk2Y)2+...+(fjdQ-fkdY)2---(3)]]>
因此,两幅图片的EMD距离计算如式(4)所示。
EMD(Qi,Yt)=Σm∈iΣn∈tcmnD(fmQ,fnY)Σm∈iΣn∈tcmn---(4)]]>
其中,cmn表述第i幅查询图片Qi的第m区域和第t幅源图片Yt的第n区域之间的路径。函数D通过式(3)定义,分母则为归一化因子.EMD算法通过迭代的方式最小化式(4)来找到最优的图片Qi和Yt之间的路径cmn。最后再根据EMD值从小到大进行排序。
步骤S105,利用相机元信息对经过预排序的图片进行顺序调整;
在本具体实施方式中,相机元信息仅考虑曝光时间和光圈F值。通过融合进图片中包含的相机的Exif信息来调整两副图片之类的相似度.对于不同大小的物体,光圈F-值是不同的,曝光时间也是随着物体本身颜色的明亮程度而不同等.本算法使用曝光时间(ExposureTime)以及光圈F值(FNumber)来调整搜索的结果.同样使用欧氏距离来度量两幅图像的Exif信息之间的差异,记为SE
SE=ET_D(q,ti)+FN_D(q,ti) (5)
利用Exif信息,调整后的最终的查询图片q和第i幅源图片ti之间的相似度S(q,ti)计算公式为:
S(q,ti)=w1SL(q,ti)+w2SE(q,ti) (6)
其中,w1和w2分别为底层特征相似度SL和Exif信息相似度SE的相似度权重,角标L代表底层特征,E代表Exif信息.w1和w2满足w1+w2=1。最后通过排序S(q,ti)获得最后的数据库中的图片和查询图片的相似度高低。
步骤S106,将调整后的结果返回。
其中,将调整后的结果返回的步骤为:将图片数据库中的图片按照与图片查询命令的相似度从高到低顺序排列的结果返回,即最相似查询图片的图片排在最前面,最不相似的排最后。
由此,本发明可供网络用户利用手机或电脑等终端设备实时上传并检索和分享图片,本发明优化了图片检索的步骤,提高了图片检索的精确度和检索效率。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明构思的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围内。