《基于比特向量的多媒体信息检索方法和系统.pdf》由会员分享,可在线阅读,更多相关《基于比特向量的多媒体信息检索方法和系统.pdf(25页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103440292 A(43)申请公布日 2013.12.11CN103440292A*CN103440292A*(21)申请号 201310359716.6(22)申请日 2013.08.16G06F 17/30(2006.01)(71)申请人新浪网技术(中国)有限公司地址 100080 北京市海淀区北四环西路58号理想国际大厦20层(72)发明人刘洁(74)专利代理机构北京市京大律师事务所 11321代理人张璐 方晓明(54) 发明名称基于比特向量的多媒体信息检索方法和系统(57) 摘要本发明公开了一种基于比特向量的多媒体信息检索方法和系统,所述方法包括:提取当前。
2、多媒体信息的特征数据后,得到当前多媒体信息的n维的高维特征向量;将n维的高维特征向量通过投影矩阵变换后得到m维的中间向量;将m维的阈值向量的各元素分别与中间向量的相应元素进行比较,根据比较结果对中间向量进行二值化,得到当前多媒体信息的m维的比特向量;其中,m小于n;根据得到的比特向量,在多媒体特征数据库中查找出与该比特向量相似的比特向量,将查找出的比特向量所对应的多媒体信息作为检索结果输出。该方法保证了原有向量识别能力,将多媒体信息的高维特征向量映射为低维的比特向量后,使得基于比特向量的检索效率更高、检索消耗更小。(51)Int.Cl.权利要求书5页 说明书14页 附图5页(19)中华人民共和。
3、国国家知识产权局(12)发明专利申请权利要求书5页 说明书14页 附图5页(10)申请公布号 CN 103440292 ACN 103440292 A1/5页21.一种基于比特向量的多媒体信息检索方法,其特征在于,包括:提取当前多媒体信息的特征数据后,得到所述当前多媒体信息的n维的高维特征向量,记为X(x1,x2,.,xn);将高维特征向量X(x1,x2,.,xn)通过投影矩阵P变换后得到m维的中间向量W(w1,w2,.,wm);将m维的阈值向量的各元素分别与所述中间向量的相应元素进行比较,根据比较结果对所述中间向量进行二值化,得到所述当前多媒体信息的m维的比特向量;其中,m小于n;根据得到的。
4、比特向量,在多媒体特征数据库中查找出与该比特向量相似的比特向量,将查找出的比特向量所对应的多媒体信息作为检索结果输出;其中,所述投影矩阵P为mn的矩阵,并满足以下条件:对于资料库中存储的各已分类的多媒体信息的高维特征向量,其中同类的高维特征向量经过P变换后的向量间距离期望值,与不同类的高维特征向量经过P变换后的向量间距离期望值的差值最小;所述阈值向量满足以下条件:对于所述资料库中存储的各多媒体信息的高维特征向量,其中同类的高维特征向量经过P变换、并经过所述阈值向量比较、二值化后的向量间距离期望值,与不同类的高维特征向量经过P变换、并经过所述阈值向量比较、二值化后的向量间距离期望值的差值最小。2。
5、.如权利要求1所述的方法,其特征在于,在所述提取当前多媒体信息的特征数据之前,还包括:通过所述资料库中存储的多媒体信息训练出所述投影矩阵P:对于所述资料库中存储的多媒体信息,将其中任意一对同类的多媒体信息的高维特征向量作为一个集合元素,存储到同类样本集合中;并将其中任意一对不同类的多媒体信息的高维特征向量作为一个集合元素,存储到非同类样本集合中;构建出使得如下公式1中最小的投影矩阵P:(公式1)其中,Q为所述同类样本集合;R为所述非同类样本集合;EPX-PX2Q表示所述Q中同类的高维特征向量经过P变换后的向量间距离期望值;EPX-PX2R表示所述R中不同类的高维特征向量经过P变换后的向量间距离。
6、期望值;为设定的权值。3.如权利要求2所述的方法,其特征在于,所述构建出使得如下公式1中最小的投影矩阵P,具体包括:求取矩阵G的m个最小的n维矩阵特征向量;其中,所述Q如公式2所示、所述R如公式3所示:Q=E(X-X)(X-X)T|Q (公式2)所述公式2中,E(X-X)(X-X)T|Q表示所述Q中同类的高维特征向量间的协方差矩阵的均值;R=E(X-X)(X-X)T|R (公式3)所述公式3中,E(X-X)(X-X)T|R表示所述R中不同类的高维特征向量间的协方差权 利 要 求 书CN 103440292 A2/5页3矩阵的均值;由求取的m个n维矩阵特征向量,构成mn的投影矩阵P。4.如权利要。
7、求2所述的方法,其特征在于,在所述通过所述资料库中存储的多媒体信息训练出所述投影矩阵P后,还包括:计算出使得如下公式4中L最小的m维向量,记为U(u1,u2,.,um),并作为所述阈值向量:L=Esign(PX+U)Tsign(PX+U)|R-Esign(PX+U)Tsign(PX+U)|Q (公式4)其中,Esign(PX+U)Tsign(PX+U)|Q表示所述Q中同类的高维特征向量经过P变换、并经过所述阈值向量比较确定正负符号后,得到的符号向量之间的距离的均值;Esign(PX+U)Tsign(PX+U)|R表示所述R中不同类的高维特征向量经过P变换、并经过所述阈值向量比较确定正负符号后,。
8、得到的符号向量之间的距离的均值。5.如权利要求2所述的方法,其特征在于,在所述通过所述资料库中存储的多媒体信息训练出所述投影矩阵P后,还包括:计算出使得如下公式4中L最小的m维向量,记为U(u1,u2,.,um):L=Esign(PX+U)Tsign(PX+U)|R-Esign(PX+U)Tsign(PX+U)|Q (公式4)其中,Esign(PX+U)Tsign(PX+U)|Q表示所述Q中同类的高维特征向量经过P变换、并经过所述阈值向量比较确定正负符号后,得到的符号向量之间的距离的均值;Esign(PX+U)Tsign(PX+U)|R表示所述R中不同类的高维特征向量经过P变换、并经过所述阈值。
9、向量比较确定正负符号后,得到的符号向量之间的距离的均值;之后,对U(u1,u2,.,um)进行优化后,得到所述阈值向量:对于所述阈值向量U的元素ui,利用如下公式5和公式6,求取使得FN(ui)+FP(ui)最小的ui值,作为优化后的ui值;FN(ui)=Pr(minz,zuiormaxz,zui|Q) (公式5)FP(ui)=Pr(minz,zuimaxz,z|R) (公式6)所述公式5中,(minz,zuiormaxz,zui|Q)中的z和z表示所述Q中任意一个集合元素中的一对同类的高维特征向量X和X分别经过所述投影矩阵P变换后得到的向量的第i个元素,Pr(minz,zuiormaxz,z。
10、ui|Q)表示对于所述Q中的集合元素,ui满足如下条件:minz,zuiormaxz,zui的概率;所述公式6中,(minz,zuimaxz,zR)中的z和z表示所述R中任意一个集合元素中的一对同类的高维特征向量X和X分别经过所述投影矩阵P变换后得到的向量的第i个元素,Pr(minz,zuimaxz,z|R)表示对于所述R中的集合元素,ui满足如下条件:minz,zuiormaxz,zui的概率。6.如权利要求4或5所述的方法,其特征在于,所述计算出使得如下L最小的m维向量,具体包括:求取使得如下表达式7最小的ui值;其中,i为1m的自然数;Esign(PiTX+ui)(PiTX+ui)|R-。
11、Esign(PiTX+ui)T(PiTX+ui)|Q (表达式7)其中,PiT为所述投影矩阵P的第i行向量;ui为U(u1,u2,.,um)的第i个元素;并将得到的u1um组成所述m维向量。7.一种基于比特向量的多媒体信息检索系统,其特征在于,包括:权 利 要 求 书CN 103440292 A3/5页4比特向量转换模块,用于提取当前多媒体信息的特征数据后,得到所述当前多媒体信息的n维的高维特征向量,记为X(x1,x2,.,xn);将高维特征向量X(x1,x2,.,xn)通过投影矩阵P变换后得到m维的中间向量W(w1,w2,.,wm)后,将m维的阈值向量的各元素分别与所述中间向量的相应元素进行。
12、比较,根据比较结果对所述中间向量进行二值化,得到所述当前多媒体信息的m维的比特向量;其中,m小于n;检索模块,用于根据所述比特向量转换模块得到的当前多媒体信息的比特向量,在多媒体特征数据库中查找出与该比特向量相似的比特向量,将查找出的比特向量所对应的多媒体信息作为检索结果输出;其中,所述投影矩阵P为mn的矩阵,并满足以下条件:对于资料库中存储的各已分类的多媒体信息的高维特征向量,其中同类的高维特征向量经过P变换后的向量间距离期望值,与不同类的高维特征向量经过P变换后的向量间距离期望值的差值最小;所述阈值向量满足以下条件:对于所述资料库中存储的各多媒体信息的高维特征向量,其中同类的高维特征向量经。
13、过P变换、并经过所述阈值向量比较、二值化后的向量间距离期望值,与不同类的高维特征向量经过P变换、并经过所述阈值向量比较、二值化后的向量间距离期望值的差值最小。8.如权利要求7所述的系统,其特征在于,所述比特向量转换模块具体包括:高维特征向量确定单元,用于提取当前多媒体信息的特征数据后,得到所述当前多媒体信息的n维的高维特征向量,记为X(x1,x2,.,xn);中间向量计算单元,用于将所述高维特征向量确定单元得到的高维特征向量X(x1,x2,.,xn)通过投影矩阵P变换后得到m维的中间向量W(w1,w2,.,wm);阈值比较单元,用于将m维的阈值向量的各元素分别与所述中间向量计算单元得到的中间向。
14、量的相应元素进行比较,根据比较结果对所述中间向量进行二值化,得到所述当前多媒体信息的m维的比特向量;其中,m小于n。9.如权利要求8所述的系统,其特征在于,还包括:投影矩阵构建模块,用于通过所述资料库中存储的多媒体信息训练出所述投影矩阵P:对于所述资料库中存储的多媒体信息,将其中任意一对同类的多媒体信息的高维特征向量作为一个集合元素,存储到同类样本集合中;并将其中任意一对不同类的多媒体信息的高维特征向量作为一个集合元素,存储到非同类样本集合中;构建出使得如下公式1中最小的投影矩阵P:(公式1)其中,Q为所述同类样本集合;R为所述非同类样本集合;E|PX-PX|2|Q表示所述Q中同类的高维特征向。
15、量经过P变换后的向量间距离期望值;E|PX-PX|2|R表示所述R中不同类的高维特征向量经过P变换后的向量间距离期望值;为设定的权值;第一阈值向量确定模块,用于计算出使得如下公式4中L最小的m维向量,记为U(u1,u2,.,um),并作为所述阈值向量:L=Esign(PX+U)Tsign(PX+U)|R-Esign(PX+U)Tsign(PX+U)|Q (公式4)其中,Esign(PX+U)Tsign(PX+U)|Q表示所述Q中同类的高维特征向量经过P变换、并经过所述阈值向量比较确定正负符号后,得到的符号向量之间的距离的均值;权 利 要 求 书CN 103440292 A4/5页5Esign(。
16、PX+U)Tsign(PX+U)|R表示所述R中不同类的高维特征向量经过P变换、并经过所述阈值向量比较确定正负符号后,得到的符号向量之间的距离的均值。10.如权利要求9所述的系统,其特征在于,所述第一阈值向量确定模块具体包括:最小值计算单元,用于求取使得如下表达式7最小的ui值;其中,i为1m的自然数;Esign(PiTX+ui)(PiTX+ui)|R-Esign(PiTX+ui)T(PiTX+ui)|Q (表达式7)其中,PiT为所述投影矩阵P的第i行向量;ui为U(u1,u2,.,um)的第i个元素;向量组成单元,用于将所述最小值计算单元得到的u1um组成所述m维向量U(u1,u2,.,u。
17、m),作为所述阈值向量。11.如权利要求8所述的系统,其特征在于,还包括:投影矩阵构建模块,用于通过所述资料库中存储的多媒体信息训练出所述投影矩阵P:对于所述资料库中存储的多媒体信息,将其中任意一对同类的多媒体信息的高维特征向量作为一个集合元素,存储到同类样本集合中;并将其中任意一对不同类的多媒体信息的高维特征向量作为一个集合元素,存储到非同类样本集合中;构建出使得如下公式1中最小的投影矩阵P:(公式1)其中,Q为所述同类样本集合;R为所述非同类样本集合;E|PX-PX|2|Q表示所述Q中同类的高维特征向量经过P变换后的向量间距离期望值;E|PX-PX|2|R表示所述R中不同类的高维特征向量经。
18、过P变换后的向量间距离期望值;为设定的权值;第二阈值向量确定模块,用于计算出使得如下公式4中L最小的m维向量,记为U(u1,u2,.,um):L=Esign(PX+U)Tsign(PX+U)|R-Esign(PX+U)Tsign(PX+U)|Q (公式4)其中,Esign(PX+U)Tsign(PX+U)|Q表示所述Q中同类的高维特征向量经过P变换、并经过所述阈值向量比较确定正负符号后,得到的符号向量之间的距离的均值;Esign(PX+U)Tsign(PX+U)|R表示所述R中不同类的高维特征向量经过P变换、并经过所述阈值向量比较确定正负符号后,得到的符号向量之间的距离的均值;第二阈值向量确定。
19、模块对U(u1,u2,.,um)进行优化后,得到所述阈值向量。12.如权利要求11所述的系统,其特征在于,所述第二阈值向量确定模块具体包括:最小值计算单元,用于求取使得如下表达式7最小的ui值;其中,i为1m的自然数;Esign(PiTX+ui)(PiTX+ui)|R-Esign(PiTX+ui)T(PiTX+ui)|Q (表达式7)其中,PiT为所述投影矩阵P的第i行向量;ui为U(u1,u2,.,um)的第i个元素;向量优化单元,用于对U(u1,u2,.,um)的元素ui进行优化:对于所述阈值向量U的元素ui,利用如下公式5和公式6,求取使得FN(ui)+FP(ui)最小的ui值,作为优化。
20、后的ui值;FN(ui)=Pr(minz,zuiormaxz,zui|Q) (公式5)FP(ui)=Pr(minz,zuimaxz,z|R) (公式6)所述公式5中,(minz,zuiormaxz,zui|Q)中的z和z表示所述Q中任意一个集合元素中的一对同类的高维特征向量X和X分别经过所述投影矩阵P变换后得到的向量的第i个元素,Pr(minz,zuiormaxz,zui|Q)表示对于所述Q中的权 利 要 求 书CN 103440292 A5/5页6集合元素,ui满足如下条件:minz,zuiormaxz,zui的概率;所述公式6中,(minz,zuimaxz,z|R)中的z和z表示所述R中任。
21、意一个集合元素中的一对同类的高维特征向量X和X分别经过所述投影矩阵P变换后得到的向量的第i个元素,Pr(minz,zuimaxz,z|R)表示对于所述R中的集合元素,ui满足如下条件:minz,zuiormaxz,zui的概率;向量组成单元,用于将所述向量优化单元优化后的u1um组成所述阈值向量。13.如权利要求7-12任一所述的系统,其特征在于,所述投影矩阵构建模块具体包括:最小矩阵特征向量计算单元,用于求取矩阵G的m个最小的n维矩阵特征向量;其中,所述Q如公式2所示、所述R如公式3所示:Q=E(X-X)(X-X)T|Q (公式2)所述公式2中,E(X-X)(X-X)T|Q表示所述Q中同类的。
22、高维特征向量间的协方差矩阵的均值;R=E(X-X)(X-X)T|R (公式3)所述公式3中,E(X-X)(X-X)T|R表示所述R中不同类的高维特征向量间的协方差矩阵的均值;投影矩阵确定单元,用于由求取的m个n维矩阵特征向量,构成mn的投影矩阵P。权 利 要 求 书CN 103440292 A1/14页7基于比特向量的多媒体信息检索方法和系统技术领域0001 本发明涉及计算机领域,尤其涉及一种基于比特向量的多媒体信息检索方法和系统。背景技术0002 近年来,随着多媒体技术和计算机技术的飞速发展、大规模的多媒体信息越来越多地出现在众多的研究和应用领域。为了使这些庞杂的数据中所包含的信息能够得到有。
23、效地访问和利用,传统的基于文本的检索技术已经无法满足用户日益增长的需求,基于内容的检索技术便应运而生。0003 基于内容的检索方法需要先提取出多媒体的特征数据建立特征数据库,然后将对多媒体信息的检索转换为对特征数据的近邻检索。对于大规模多媒体信息而言,其特征数据也是大规模的。这就需要有与特征数据相对应的合适的索引方法来组织特征数据,加快检索的速度。0004 然而,多媒体信息的特征数据往往是高维的向量数据(简称高维特征向量),传统的适应于低维数据的索引机制难以适应于基于内容检索的要求,这也就是通常所说的高维数据的索引维数灾难现象。也就是说,基于高维特征向量实现多媒体信息的检索将耗费巨大的检索资源。
24、、消耗很大,效率低下。0005 为解决上述问题,现有技术的方法,如相似敏感哈希(Similarity Sensitive Hash,SSH)、局部敏感哈希(Locality Sensitive Hash,LSH)方法,通过将高维特征向量映射为低维的比特向量,从而利用基于比特向量的相似度量方法和高效索引方法来加快高维特征向量的检索速度,从而提高多媒体信息的检索效率。然而,现有技术的方法易造成相似的高维特征向量(即同类的高维特征向量)被映射为不相似的比特向量,不相似的高维特征向量(即非同类的高维特征向量)被映射为相似的比特向量,导致进行多媒体信息检索时,多媒体信息的高维特征向量映射为比特向量后,具。
25、有较大的错误匹配率,使得原有向量的识别能力下降。0006 因此,有必要提供一种基于比特向量的多媒体信息检索方法,在保证原有向量识别能力的情况下,将多媒体信息的高维特征向量映射为低维的比特向量,以使得基于比特向量的多媒体信息的检索效率相比于基于高维特征向量的多媒体信息的检索效率更高,减小检索消耗,并降低基于比特向量的多媒体信息的检索的错误匹配率。发明内容0007 针对上述现有技术存在的缺陷,本发明提供了一种基于比特向量的多媒体信息检索方法和系统,用以在保证原有向量识别能力的情况下,将多媒体信息的高维特征向量映射为低维的比特向量后,使得基于比特向量的检索效率更高、检索消耗更小。0008 根据本发明。
26、的一个方面,提供了一种基于比特向量的多媒体信息检索方法,包括:说 明 书CN 103440292 A2/14页80009 提取当前多媒体信息的特征数据后,得到所述当前多媒体信息的n维的高维特征向量,记为X(x1,x2,.,xn);0010 将高维特征向量X(x1,x2,.,xn)通过投影矩阵P变换后得到m维的中间向量W(w1,w2,.,wm);0011 将m维的阈值向量的各元素分别与所述中间向量的相应元素进行比较,根据比较结果对所述中间向量进行二值化,得到所述当前多媒体信息的m维的比特向量;其中,m小于n;0012 根据得到的比特向量,在多媒体特征数据库中查找出与该比特向量相似的比特向量,将查。
27、找出的比特向量所对应的多媒体信息作为检索结果输出;0013 其中,所述投影矩阵P为mn的矩阵,并满足以下条件:对于资料库中存储的各已分类的多媒体信息的高维特征向量,其中同类的高维特征向量经过P变换后的向量间距离期望值,与不同类的高维特征向量经过P变换后的向量间距离期望值的差值最小;0014 所述阈值向量满足以下条件:对于所述资料库中存储的各多媒体信息的高维特征向量,其中同类的高维特征向量经过P变换、并经过所述阈值向量比较、二值化后的向量间距离期望值,与不同类的高维特征向量经过P变换、并经过所述阈值向量比较、二值化后的向量间距离期望值的差值最小。0015 较佳地,在所述提取当前多媒体信息的特征数。
28、据之前,还包括:0016 通过所述资料库中存储的多媒体信息训练出所述投影矩阵P:0017 对于所述资料库中存储的多媒体信息,将其中任意一对同类的多媒体信息的高维特征向量作为一个集合元素,存储到同类样本集合中;并0018 将其中任意一对不同类的多媒体信息的高维特征向量作为一个集合元素,存储到非同类样本集合中;0019 构建出使得如下公式1中最小的投影矩阵P:0020 (公式1)0021 其中,Q为所述同类样本集合;R为所述非同类样本集合;E|PX-PX|2|Q表示所述Q中同类的高维特征向量经过P变换后的向量间距离期望值;E|PX-PX|2|R表示所述R中不同类的高维特征向量经过P变换后的向量间距。
29、离期望值;为设定的权值。0022 较佳地,所述构建出使得如下公式1中最小的投影矩阵P,具体包括:0023 求取矩阵G的m个最小的n维矩阵特征向量;其中,所述Q如公式2所示、所述R如公式3所示:0024 Q=E(X-X)(X-X)T|Q (公式2)0025 所述公式2中,E(X-X)(X-X)T|Q表示所述Q中同类的高维特征向量间的协方差矩阵的均值;0026 R=E(X-X)(X-X)T|R (公式3)0027 所述公式3中,E(X-X)(X-X)T|R表示所述R中不同类的高维特征向量间的协方差矩阵的均值;0028 由求取的m个n维矩阵特征向量,构成mn的投影矩阵P。说 明 书CN 103440。
30、292 A3/14页90029 较佳地,在所述通过所述资料库中存储的多媒体信息训练出所述投影矩阵P后,还包括:0030 计算出使得如下公式4中L最小的m维向量,记为U(u1,u2,.,um),并作为所述阈值向量:0031 L=Esign(PX+U)Tsign(PX+U)|R-Esign(PX+U)Tsign(PX+U)|Q (公式4)0032 其中,Esign(PX+U)Tsign(PX+U)|Q表示所述Q中同类的高维特征向量经过P变换、并经过所述阈值向量比较确定正负符号后,得到的符号向量之间的距离的均值;Esign(PX+U)Tsign(PX+U)|R表示所述R中不同类的高维特征向量经过P变。
31、换、并经过所述阈值向量比较确定正负符号后,得到的符号向量之间的距离的均值。0033 或者,在所述通过所述资料库中存储的多媒体信息训练出所述投影矩阵P后,还包括:0034 计算出使得如下公式4中L最小的m维向量,记为U(u1,u2,.,um):0035 L=Esign(PX+U)Tsign(PX+U)|R-Esign(PX+U)Tsign(PX+U)|Q (公式4)0036 其中,Esign(PX+U)Tsign(PX+U)|Q表示所述Q中同类的高维特征向量经过P变换、并经过所述阈值向量比较确定正负符号后,得到的符号向量之间的距离的均值;Esign(PX+U)Tsign(PX+U)|R表示所述R。
32、中不同类的高维特征向量经过P变换、并经过所述阈值向量比较确定正负符号后,得到的符号向量之间的距离的均值;0037 之后,对U(u1,u2,.,um)进行优化后,得到所述阈值向量:0038 对于所述阈值向量U的元素ui,利用如下公式5和公式6,求取使得FN(ui)+FP(ui)最小的ui值,作为优化后的ui值;0039 FN(ui)=Pr(minz,zuiormaxz,zui|Q) (公式5)0040 FP(ui)=Pr(minz,zuimaxz,z|R) (公式6)0041 所述公式5中,(minz,zuiormaxz,zui|Q)中的z和z表示所述Q中任意一个集合元素中的一对同类的高维特征向。
33、量X和X分别经过所述投影矩阵P变换后得到的向量的第i个元素,Pr(minz,zuiormaxz,zui|Q)表示对于所述Q中的集合元素,ui满足如下条件:minz,zuiormaxz,zui的概率;0042 所述公式6中,(minz,zuimaxz,z|R)中的z和z表示所述R中任意一个集合元素中的一对同类的高维特征向量X和X分别经过所述投影矩阵P变换后得到的向量的第i个元素,Pr(minz,zuimaxz,z|R)表示对于所述R中的集合元素,ui满足如下条件:minz,zuiormaxz,zui的概率。0043 较佳地,所述计算出使得如下L最小的m维向量,具体包括:0044 求取使得如下表达。
34、式7最小的ui值;其中,i为1m的自然数;0045 Esign(PiTX+ui)(PiTX+ui)|R-Esign(PiTX+ui)T(PiTX+ui)|Q (表达式7)0046 其中,PiT为所述投影矩阵P的第i行向量;ui为U(u1,u2,.,um)的第i个元素;0047 并将得到的u1um组成所述m维向量。0048 根据本发明的另一个方面,还提供了一种基于比特向量的多媒体信息检索系统,包括:0049 比特向量转换模块,用于提取当前多媒体信息的特征数据后,得到所述当前多媒体信息的n维的高维特征向量,记为X(x1,x2,.,xn);将高维特征向量X(x1,x2,.,xn)通说 明 书CN 1。
35、03440292 A4/14页10过投影矩阵P变换后得到m维的中间向量W(w1,w2,.,wm)后,将m维的阈值向量的各元素分别与所述中间向量的相应元素进行比较,根据比较结果对所述中间向量进行二值化,得到所述当前多媒体信息的m维的比特向量;其中,m小于n;0050 检索模块,用于根据所述比特向量转换模块得到的当前多媒体信息的比特向量,在多媒体特征数据库中查找出与该比特向量相似的比特向量,将查找出的比特向量所对应的多媒体信息作为检索结果输出;0051 其中,所述投影矩阵P为mn的矩阵,并满足以下条件:对于资料库中存储的各多媒体信息的高维特征向量,其中同类的高维特征向量经过P变换后的向量间距离期望。
36、值,与不同类的高维特征向量经过P变换后的向量间距离期望值的差值最小;0052 所述阈值向量满足以下条件:对于所述资料库中存储的各已分类的多媒体信息的高维特征向量,其中同类的高维特征向量经过P变换、并经过所述阈值向量比较、二值化后的向量间距离期望值,与不同类的高维特征向量经过P变换、并经过所述阈值向量比较、二值化后的向量间距离期望值的差值最小。0053 较佳地,所述比特向量转换模块具体包括:0054 高维特征向量确定单元,用于提取当前多媒体信息的特征数据后,得到所述当前多媒体信息的n维的高维特征向量,记为X(x1,x2,.,xn);0055 中间向量计算单元,用于将所述高维特征向量确定单元得到的。
37、高维特征向量X(x1,x2,.,xn)通过投影矩阵P变换后得到m维的中间向量W(w1,w2,.,wm);0056 阈值比较单元,用于将m维的阈值向量的各元素分别与所述中间向量计算单元得到的中间向量的相应元素进行比较,根据比较结果对所述中间向量进行二值化,得到所述当前多媒体信息的m维的比特向量;其中,m小于n。0057 进一步,所述基于比特向量的多媒体信息检索系统,还包括:0058 投影矩阵构建模块,用于通过所述资料库中存储的多媒体信息训练出所述投影矩阵P:对于所述资料库中存储的多媒体信息,将其中任意一对同类的多媒体信息的高维特征向量作为一个集合元素,存储到同类样本集合中;并将其中任意一对不同类。
38、的多媒体信息的高维特征向量作为一个集合元素,存储到非同类样本集合中;构建出使得如下公式1中最小的投影矩阵P:0059 (公式1)0060 其中,Q为所述同类样本集合;R为所述非同类样本集合;E|PX-PX|2|Q表示所述Q中同类的高维特征向量经过P变换后的向量间距离期望值;E|PX-PX|2|R表示所述R中不同类的高维特征向量经过P变换后的向量间距离期望值;为设定的权值;0061 第一阈值向量确定模块,用于计算出使得如下公式4中L最小的m维向量,记为U(u1,u2,.,um),并作为所述阈值向量:0062 L=Esign(PX+U)Tsign(PX+U)|R-Esign(PX+U)Tsign(PX+U)|Q (公式4)0063 其中,Esign(PX+U)Tsign(PX+U)|Q表示所述Q中同类的高维特征向量经过P变换、并经过所述阈值向量比较确定正负符号后,得到的符号向量之间的距离的均值;Esign(PX+U)Tsign(PX+U)|R表示所述R中不同类的高维特征向量经过P变换、并经过所述阈值向量比较确定正负符号后,得到的符号向量之间的距离的均值。说 明 书CN 103440292 A10。