基于稀疏组群结构的图像标注方法.pdf

上传人:奻奴 文档编号:1037225 上传时间:2018-03-27 格式:PDF 页数:11 大小:569.12KB
返回 下载 相关 举报
摘要
申请专利号:

CN201010262568.2

申请日:

2010.08.20

公开号:

CN102375855A

公开日:

2012.03.14

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20100820|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

浙江大学

发明人:

吴飞; 庄越挺; 袁莹

地址:

310018 浙江省杭州市西湖区浙大路38号

优先权:

专利代理机构:

杭州求是专利事务所有限公司 33200

代理人:

张法高

PDF下载: PDF下载
内容摘要

本发明公开了一种基于稀疏组群结构的图像标注方法。包括如下步骤:1)对图像数据集进行特征提取;2)对每个图像数据集选取n个数据作为训练集,其余作为测试集,使每个标注单词都出现在训练集合中;3)利用稀疏组群结构对图像进行特征选择;4)利用图像标注单词之间的关系进一步优化标注结果。本发明充分利用了图像异构特征的组群性质来对图像特征进行筛选,利用图像标注单词之间的相关性来优化图像标注,比传统标注方法产生的标注结果更准确。

权利要求书

1: 一种基于稀疏组群结构的图像标注方法, 其特征在于包括如下步骤 : 1) 对图像数据集进行特征提取 ; 2) 对每个图像数据集选取 n 个数据作为训练集, 其余作为测试集, 使每个标注单词都 出现在训练集合中 ; 3) 利用稀疏组群结构对图像进行特征选择 ; 4) 利用图像标注单词之间的关系进一步优化标注结果。
2: 根据权利要求 1 所述的一种基于稀疏组群结构的图像标注方法, 其特点在于, 所述 的对图像数据集进行特征提取的步骤为 : 1) 对图像数据进行特征提取, 特征包括全局特征和局部特征, 全局特征包括颜色、 纹 理、 形状, 局部特征包括 SIFT、 形状上下文 ; 2) 将 每 幅 图 像 用 多 种 异 构 特 征 向 量 的 组 合 来 表 示, 即, 一 幅 图 像 表 示 为 (x i, p C T p yi) ∈ R ×{0, 1} , 其中 xi = (xi1, ..., xip) ∈ R 表示图像的特征向量, p 表示特征维数, yi T C = (yi1, ..., yiC) ∈ {0, 1} 是相应的标注向量, C 表示数据集的标注单词总数, yij = 1 表示 第 i 幅图像有第 j 个标注, 否则, yij = 0, 假设从图像数据中提取 G 类特征, dg 表示第 g 类 特征的维数, g ∈ {1, ..., G}, 那么 图像的特征向量重新表示为
3: 根据权利要求 1 所述的一种基于稀疏组群结构的图像标注方法, 其特点在于, 所述 的利用稀疏组群结构对图像进行特征选择的步骤为 : 1) 对每个标注单词 c(c ∈ {1, ..., C}), 训练回归模型 fc, 训练模型包括一个逻辑损失 函数和一个正则化项 : 其中 λ 是一个可调节的参数, 是截距项, 表 示对应第 g 类异构特征的参数向量 ; 2) 通过迭代求解上述最优化问题, 得到参数向量 β, 图像特征选择结果为
4: 根据权利要求 1 所述的一种基于稀疏组群结构的图像标注方法, 其特点在于, 所述 的利用图像标注单词之间的关系进一步优化标注结果的步骤为 : 1) 假设给定 n 个有标注单词的图像样例, X = (x1, x2, ..., xn) ∈ Rp×n, Y = (y1, y2, ..., c×n yn) ∈ R , 分别表示图像的特征向量和标注单词向量 ; 2) 运用典型相关分析选择向量 wx 和 wy 使 X 和 Y 之间相关性最大, 即求解以下最优化 问题 : 解得相关向量 wx 和 wy ; 3) 优化的标注结果 , 其中 是前一步通过回归模型解得的, B = T-1DT, T 是一个 D 是一个 C×C 的矩阵, 其中的每一行是运用典型相关分析得到的典型相关坐标, 即 2 C×C 的对角矩阵 D = diag(d1, d2, ..., dC), 其对角线上的元素通过典型相关分析以后的 X 和 Y 的协方差得到 : 其中 k = 1, 2, ..., C, γ = p/n。

说明书


基于稀疏组群结构的图像标注方法

    技术领域 本发明涉及一种基于稀疏组群结构的图像标注的方法。 该方法利用稀疏组群结构 进行特征选择, 结合标注单词间的相关性学习来对图像进行标注。
     背景技术 随着图像特征提取技术的日益成熟, 可以提取的异构特征越来越多, 它们可以用 来描述图像视觉特征的多个方面, 例如全局特征 ( 颜色、 纹理 ) 和局部特征 (SIFT、 形状上下 文、 GLOH( 梯度位置和方向直方图 ))。虽然可从图像中提取众多异构特征, 但是不同异构特 征有着不同的内在表达能力。也就是说, 若干种类异构特征的组合可充分表达图像某一语 义, 而不是所有异构特征全部组合起来表达图像某一语义, 后者将会引入过多无关特征或 噪音, 影响图像语义的精确表达。
     因此, 在图像标注过程中, 对于给定的图像标注单词, 将会只有有限种异构特征可 以用来表达这一标注单词, 对某个图像语义来说, 所选择的异构特征因此往往是比较稀疏
     的。 近年来, lasso(least absolution shrinkage and selection operator) 这一思 想被提出, 借助于其所具有的变量选择特性, 一些在 lasso 基础上进行图像特征稀疏性选 择的方法被提出。 但是, 图像的视觉特征具有明显的组群结构, 不同类别的视觉特征具有不 同的视觉特性。如果在图像标注中能够充分利用这种组群结构, 构造相应异构特征的选择 机制, 将会促进图像标注结果的 “可解释性” 。
     在传统图像多标注处理过程中, 一般会对每个标注单词构建一个独立的回归模型 而预测标注结果, 这种方法没有考虑到标注单词之间的相关性, 影响了标注结果。 为了将标 注间的相关性考虑进来, 一些算法利用了典型相关分析或者共享结构来更好的学习多标注 间的关联。
     发明内容
     本发明的目的是克服现有技术的不足, 提供一种基于稀疏组群结构的图像标注方法。 基于稀疏组群结构的图像标注方法包括如下步骤 :
     1) 对图像数据集进行特征提取 ;
     2) 对每个图像数据集选取 n 个数据作为训练集, 其余作为测试集, 使每个标注单 词都出现在训练集合中 ;
     3) 利用稀疏组群结构对图像进行特征选择 ;
     4) 利用图像标注单词之间的关系进一步优化标注结果。
     所述的对图像数据集进行特征提取的步骤为 :
     1) 对图像数据进行特征提取, 特征包括全局特征和局部特征, 全局特征包括颜色、 纹理、 形状, 局部特征包括 SIFT、 形状上下文 ;
     2) 将每幅图像用多种异构特征向量的组合来表示, 即, 一幅图像表示为 (xi, C T p yi) ∈ R ×{0, 1} , 其中 xi = (xi1, ..., xip) ∈ R 表示图像的特征向量, p 表示特征维数, yi T C = (yi1, ..., yiC) ∈ {0, 1} 是相应的标注向量, C 表示数据集的标注单词总数, yij = 1 表示 第 i 幅图像有第 j 个标注, 否则, yij = 0, 假设从图像数据中提取 G 类特征, dg 表示第 g 类p特征的维数, g ∈ {1, ..., G}, 那么
     图像的特征向量重新表示为所述的利用稀疏组群结构对图像进行特征选择的步骤为 : 1) 对每个标注单词 c(c ∈ {1, ..., C}), 训练回归模型 fc, 训练模型包括一个逻辑 其中 λ 是一个可调节的参 是截距项,损失函数和一个正则化项 : 数,表示对应第 g 类异构特征的参数向量 ;
     2) 通 过 迭 代 求 解 上 述 最 优 化 问 题, 得 到 参 数 向 量 β, 图像特征选择结果为 所述的利用图像标注单词之间的关系进一步优化标注结果的步骤为 :
     1) 假设给定 n 个有标注单词的图像样例, X = (x1, x2, ..., xn) ∈ Rp×n, Y = (y1, c×n y2, ..., yn) ∈ R , 分别表示图像的特征向量和标注单词向量 ;
     2) 运用典型相关分析选择向量 wx 和 wy 使 X 和 Y 之间相关性最大, 即求解以下最 优化问题 :
     解得相关向量 wx 和 wy ; 3) 优化的标注结果 , 其中 是前一步通过回归模型解得的, B = T-1DT, T是 D是一个 C×C 的矩阵, 其中的每一行是运用典型相关分析得到的典型相关坐标, 即一个 C×C 的对角矩阵 D = diag(d1, d2, ..., dC), 其对角线上的元素通过典型相关分析以后 的 X 和 Y 的协方差得到 :
     其中k = 1, 2, ..., C, γ = p/n。本发明利用稀疏组群结构进行特征选择, 结合标注单词间的相关性学习来对图像 进行标注, 可以取得比传统的标注方法更准确的标注结果。 附图说明
     图 1 是基于稀疏组群结构的图像标注方法流程图 ; 图 2 是举例本发明的 5 幅图像标注结果。具体实施方式
     基于稀疏组群结构的图像标注方法包括如下步骤 :
     1) 对图像数据集进行特征提取 ;
     2) 对每个图像数据集选取 n 个数据作为训练集, 其余作为测试集, 使每个标注单 词都出现在训练集合中 ;
     3) 利用稀疏组群结构对图像进行特征选择 ;
     4) 利用图像标注单词之间的关系进一步优化标注结果。
     所述的对图像数据集进行特征提取的步骤为 :
     1) 对图像数据进行特征提取, 特征包括全局特征和局部特征, 全局特征包括颜色、 纹理、 形状, 局部特征包括 SIFT、 形状上下文 ;
     2) 将每幅图像用多种异构特征向量的组合来表示, 即, 一幅图像表示为 (xi, p C T p yi) ∈ R ×{0, 1} , 其中 xi = (xi1, ..., xip) ∈ R 表示图像的特征向量, p 表示特征维数, yi T C = (yi1, ..., yiC) ∈ {0, 1} 是相应的标注向量, C 表示数据集的标注单词总数, yij = 1 表示 第 i 幅图像有第 j 个标注, 否则, yij = 0, 假设从图像数据中提取 G 类特征, dg 表示第 g 类 特征的维数, g ∈ {1, ..., G}, 那么
     图像的特征向量重新表示为所述的利用稀疏组群结构对图像进行特征选择的步骤为 : 1) 对每个标注单词 c(c ∈ {1, ..., C}), 训练回归模型 fc, 训练模型包括一个逻辑 其中 λ 是一个可调节的参 是截距项,损失函数和一个正则化项 : 数,表示对应第 g 类异构特征的参数向量 ;
     2) 通 过 迭 代 求 解 上 述 最 优 化 问 题, 得 到 参 数 向 量 β, 图像特征选择结果为 所述的利用图像标注单词之间的关系进一步优化标注结果的步骤为 :
     1) 假设给定 n 个有标注单词的图像样例, X = (x1, x2, ..., xn) ∈ Rp×n, Y = (y1, c×n y2, ..., yn) ∈ R , 分别表示图像的特征向量和标注单词向量 ;
     2) 运用典型相关分析选择向量 wx 和 wy 使 X 和 Y 之间相关性最大, 即求解以下最 优化问题 :
     解得相关向量 wx 和 wy ; 3) 优化的标注结果 , 其中 是前一步通过回归模型解得的, B = T-1DT, T是 D是一个 C×C 的矩阵, 其中的每一行是运用典型相关分析得到的典型相关坐标, 即一个 C×C 的对角矩阵 D = diag(d1, d2, ..., dC), 其对角线上的元素通过典型相关分析以后 的 X 和 Y 的协方差得到 :
     其中k = 1, 2, ..., C, γ = p/n。实施例 :
     基于稀疏组群结构的图像标注方法包括如下步骤 :
     1) 对图像数据进行特征提取, 包括全局特征和局部特征, 全剧特征有颜色直方图、 颜色矩、 颜色相关图、 小波变换, 局部特征有 SIFT、 形状上下文 ;
     2) 将每幅图像用提取出的多种异构特征向量的组合来表示。即, 一幅图像 i 表 p C T p 示为 (xi, yi) ∈ R ×{0, 1} , 其中 xi = (xi1, ..., xip) ∈ R 表示图像的特征向量, p 表示特 T C 征维数, yi = (yi1, ..., yiC) ∈ {0, 1} 是相应的标注单词向量, C 表示数据集的标注单词 总数, yij = 1 表示第 i 幅图像具有第 j 个标注, 否则, yij = 0。假设图像有 G 类特征表示, dg 表示第 g 类特征的维数, g ∈ {1, ..., G}, 那么 即 G 类特征向量的组合。 3) 对每个图像数据集, 随机选取 n 幅图像作为训练集, 其余作为测试集 ; 保证选取 的训练集中, 所有标注单词都至少出现一次, 即这 n 个数据要包括所有的 C 个标注单词, 否 则重新选取。
     4) 给定 n 个图像训练数据 {(xi, yi) ∈ Rp×{0, 1}C : i = 1, 2, ..., n}, 对每个标注 单词 c(c ∈ {1, ..., C}), 训练回归模型 fc, 训练模型包括一个逻辑损失函数 ( 度量模型和 数据间的拟合优度 ) 和一个正则化项 ( 增强组群结构的效应 ) :
     图像 i 的特征向量重新表示为
     其中 λ 是一个可调节的参数, 是截距项, 表示对应第 g 类异构特征的参数向 中的系数全为 0 或者全为非 0 值。因此, 对每个 能够确定哪些量。(1) 式中的 l2 范数使得 标注单词 c 训练模型 fc 得到的参数向量异构特征的组群被选择作为标注单词 c 的最适合特征。
     5) 为了求解参数向量 β, 即求解 (1) 式的最优化问题, 使用分块坐标下降法, 算法 描述如下 :
     步骤 1 : 初始化 βc ∈ Rp+1 ;
     7步骤 2 : 步骤 3 : For g = 1, ..., G102375855 A CN 102375862
     说明书5/6 页elseend end 步骤 4 : 重复步骤 2-3 直到收敛 ; 步骤 5 : 预测值 步骤 4 中, 用 表示把 设为 0, 其余的 保持不变时的参数向量 βc, 函数 p 表示一个概率模型 : 6) 给定 n 个样例, X = (x1, x2, ..., xn) ∈ Rp×n 和 Y = (y1, y2, ..., yn) ∈ Rc×n 分 别表示 n 幅图像的特征向量和标注单词向量 ;
     7) 运用典型相关分析选择向量 wx 和 wy 使 X 和 Y 之间相关性最大, 即求解以下最 优化问题 :
     通过缩放 wx 和 wy, (2) 式的优化问题可以转换成一个有约束的最优化问题 :为了解 (4) 式的最优化问题, 构造拉普拉斯方程如下 :上式对 wx 和 wy 求导得 : XYTwy-λxXXTwx = 0 YXTwx-λyYYTwy = 0 (6) 式乘以 减去 (7) 式乘以 得:(6) (7)即 λy = λx, 令 λ = λx = λy, 代入 (6)(7) 式, 解得 :其中 Cxx = XXT, Cxy = XYT, Cyx = YXT, Cyy = YYT。
     显然, (8) 式即是一个求解特征根的问题, 这样就可以解得相关向量 wy, 同样方法 可以解得相关向量 wx。
     8102375855 A CN 102375862
     -1说明书6/6 页8) 进一步优化的标注结果其中 是前一步通过回归模型解得的, B=T DT, T 是一个 C×C 的矩阵, 其中的每一行是运用典型相关分析得到的典型相关坐标, 即 D 是一个 C×C 的对角矩阵 D = diag(d1, d2, ..., dC), 其对角线上的元素通过典型 相关分析以后的 X 和 Y 的协方差得到 :
     其中k = 1, 2, ..., C, γ = p/n。图 2 给出了本发明的 5 幅图像标注结果。
     从上面的例子可以看到, 与传统的图像标注方法不同的是, 本发明利用了稀疏组 群结构进行特征选择, 并结合标注单词间的相关性学习来对图像进行标注, 取得了比传统 的标注方法更准确的标注结果。

基于稀疏组群结构的图像标注方法.pdf_第1页
第1页 / 共11页
基于稀疏组群结构的图像标注方法.pdf_第2页
第2页 / 共11页
基于稀疏组群结构的图像标注方法.pdf_第3页
第3页 / 共11页
点击查看更多>>
资源描述

《基于稀疏组群结构的图像标注方法.pdf》由会员分享,可在线阅读,更多相关《基于稀疏组群结构的图像标注方法.pdf(11页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN102375855A43申请公布日20120314CN102375855ACN102375855A21申请号201010262568222申请日20100820G06F17/3020060171申请人浙江大学地址310018浙江省杭州市西湖区浙大路38号72发明人吴飞庄越挺袁莹74专利代理机构杭州求是专利事务所有限公司33200代理人张法高54发明名称基于稀疏组群结构的图像标注方法57摘要本发明公开了一种基于稀疏组群结构的图像标注方法。包括如下步骤1对图像数据集进行特征提取;2对每个图像数据集选取N个数据作为训练集,其余作为测试集,使每个标注单词都出现在训练集合中;3利用稀疏。

2、组群结构对图像进行特征选择;4利用图像标注单词之间的关系进一步优化标注结果。本发明充分利用了图像异构特征的组群性质来对图像特征进行筛选,利用图像标注单词之间的相关性来优化图像标注,比传统标注方法产生的标注结果更准确。51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书6页附图2页CN102375862A1/2页21一种基于稀疏组群结构的图像标注方法,其特征在于包括如下步骤1对图像数据集进行特征提取;2对每个图像数据集选取N个数据作为训练集,其余作为测试集,使每个标注单词都出现在训练集合中;3利用稀疏组群结构对图像进行特征选择;4利用图像标注单词之间的关系进一步优化。

3、标注结果。2根据权利要求1所述的一种基于稀疏组群结构的图像标注方法,其特点在于,所述的对图像数据集进行特征提取的步骤为1对图像数据进行特征提取,特征包括全局特征和局部特征,全局特征包括颜色、纹理、形状,局部特征包括SIFT、形状上下文;2将每幅图像用多种异构特征向量的组合来表示,即,一幅图像表示为XI,YIRP0,1C,其中XIXI1,XIPTRP表示图像的特征向量,P表示特征维数,YIYI1,YICT0,1C是相应的标注向量,C表示数据集的标注单词总数,YIJ1表示第I幅图像有第J个标注,否则,YIJ0,假设从图像数据中提取G类特征,DG表示第G类特征的维数,G1,G,那么图像的特征向量重新。

4、表示为3根据权利要求1所述的一种基于稀疏组群结构的图像标注方法,其特点在于,所述的利用稀疏组群结构对图像进行特征选择的步骤为1对每个标注单词CC1,C,训练回归模型FC,训练模型包括一个逻辑损失函数和一个正则化项其中是一个可调节的参数,是截距项,表示对应第G类异构特征的参数向量;2通过迭代求解上述最优化问题,得到参数向量,图像特征选择结果为4根据权利要求1所述的一种基于稀疏组群结构的图像标注方法,其特点在于,所述的利用图像标注单词之间的关系进一步优化标注结果的步骤为1假设给定N个有标注单词的图像样例,XX1,X2,XNRPN,YY1,Y2,YNRCN,分别表示图像的特征向量和标注单词向量;2运。

5、用典型相关分析选择向量WX和WY使X和Y之间相关性最大,即求解以下最优化问题解得相关向量WX和WY;3优化的标注结果,其中是前一步通过回归模型解得的,BT1DT,T是一个CC的矩阵,其中的每一行是运用典型相关分析得到的典型相关坐标,即D是一个权利要求书CN102375855ACN102375862A2/2页3CC的对角矩阵DDIAGD1,D2,DC,其对角线上的元素通过典型相关分析以后的X和Y的协方差得到其中K1,2,C,P/N。权利要求书CN102375855ACN102375862A1/6页4基于稀疏组群结构的图像标注方法技术领域0001本发明涉及一种基于稀疏组群结构的图像标注的方法。该方。

6、法利用稀疏组群结构进行特征选择,结合标注单词间的相关性学习来对图像进行标注。背景技术0002随着图像特征提取技术的日益成熟,可以提取的异构特征越来越多,它们可以用来描述图像视觉特征的多个方面,例如全局特征颜色、纹理和局部特征SIFT、形状上下文、GLOH梯度位置和方向直方图。虽然可从图像中提取众多异构特征,但是不同异构特征有着不同的内在表达能力。也就是说,若干种类异构特征的组合可充分表达图像某一语义,而不是所有异构特征全部组合起来表达图像某一语义,后者将会引入过多无关特征或噪音,影响图像语义的精确表达。0003因此,在图像标注过程中,对于给定的图像标注单词,将会只有有限种异构特征可以用来表达这。

7、一标注单词,对某个图像语义来说,所选择的异构特征因此往往是比较稀疏的。0004近年来,LASSOLEASTABSOLUTIONSHRINKAGEANDSELECTIONOPERATOR这一思想被提出,借助于其所具有的变量选择特性,一些在LASSO基础上进行图像特征稀疏性选择的方法被提出。但是,图像的视觉特征具有明显的组群结构,不同类别的视觉特征具有不同的视觉特性。如果在图像标注中能够充分利用这种组群结构,构造相应异构特征的选择机制,将会促进图像标注结果的“可解释性”。0005在传统图像多标注处理过程中,一般会对每个标注单词构建一个独立的回归模型而预测标注结果,这种方法没有考虑到标注单词之间的相。

8、关性,影响了标注结果。为了将标注间的相关性考虑进来,一些算法利用了典型相关分析或者共享结构来更好的学习多标注间的关联。发明内容0006本发明的目的是克服现有技术的不足,提供一种基于稀疏组群结构的图像标注方法。0007基于稀疏组群结构的图像标注方法包括如下步骤00081对图像数据集进行特征提取;00092对每个图像数据集选取N个数据作为训练集,其余作为测试集,使每个标注单词都出现在训练集合中;00103利用稀疏组群结构对图像进行特征选择;00114利用图像标注单词之间的关系进一步优化标注结果。0012所述的对图像数据集进行特征提取的步骤为00131对图像数据进行特征提取,特征包括全局特征和局部特。

9、征,全局特征包括颜色、纹理、形状,局部特征包括SIFT、形状上下文;说明书CN102375855ACN102375862A2/6页500142将每幅图像用多种异构特征向量的组合来表示,即,一幅图像表示为XI,YIRP0,1C,其中XIXI1,XIPTRP表示图像的特征向量,P表示特征维数,YIYI1,YICT0,1C是相应的标注向量,C表示数据集的标注单词总数,YIJ1表示第I幅图像有第J个标注,否则,YIJ0,假设从图像数据中提取G类特征,DG表示第G类特征的维数,G1,G,那么图像的特征向量重新表示为0015所述的利用稀疏组群结构对图像进行特征选择的步骤为00161对每个标注单词CC1,C。

10、,训练回归模型FC,训练模型包括一个逻辑损失函数和一个正则化项其中是一个可调节的参数,是截距项,表示对应第G类异构特征的参数向量;00172通过迭代求解上述最优化问题,得到参数向量,图像特征选择结果为0018所述的利用图像标注单词之间的关系进一步优化标注结果的步骤为00191假设给定N个有标注单词的图像样例,XX1,X2,XNRPN,YY1,Y2,YNRCN,分别表示图像的特征向量和标注单词向量;00202运用典型相关分析选择向量WX和WY使X和Y之间相关性最大,即求解以下最优化问题002100220023解得相关向量WX和WY;00243优化的标注结果,其中是前一步通过回归模型解得的,BT1。

11、DT,T是一个CC的矩阵,其中的每一行是运用典型相关分析得到的典型相关坐标,即D是一个CC的对角矩阵DDIAGD1,D2,DC,其对角线上的元素通过典型相关分析以后的X和Y的协方差得到00250026其中K1,2,C,P/N。0027本发明利用稀疏组群结构进行特征选择,结合标注单词间的相关性学习来对图像进行标注,可以取得比传统的标注方法更准确的标注结果。附图说明0028图1是基于稀疏组群结构的图像标注方法流程图;0029图2是举例本发明的5幅图像标注结果。说明书CN102375855ACN102375862A3/6页6具体实施方式0030基于稀疏组群结构的图像标注方法包括如下步骤00311对图。

12、像数据集进行特征提取;00322对每个图像数据集选取N个数据作为训练集,其余作为测试集,使每个标注单词都出现在训练集合中;00333利用稀疏组群结构对图像进行特征选择;00344利用图像标注单词之间的关系进一步优化标注结果。0035所述的对图像数据集进行特征提取的步骤为00361对图像数据进行特征提取,特征包括全局特征和局部特征,全局特征包括颜色、纹理、形状,局部特征包括SIFT、形状上下文;00372将每幅图像用多种异构特征向量的组合来表示,即,一幅图像表示为XI,YIRP0,1C,其中XIXI1,XIPTRP表示图像的特征向量,P表示特征维数,YIYI1,YICT0,1C是相应的标注向量,。

13、C表示数据集的标注单词总数,YIJ1表示第I幅图像有第J个标注,否则,YIJ0,假设从图像数据中提取G类特征,DG表示第G类特征的维数,G1,G,那么图像的特征向量重新表示为0038所述的利用稀疏组群结构对图像进行特征选择的步骤为00391对每个标注单词CC1,C,训练回归模型FC,训练模型包括一个逻辑损失函数和一个正则化项其中是一个可调节的参数,是截距项,表示对应第G类异构特征的参数向量;00402通过迭代求解上述最优化问题,得到参数向量,图像特征选择结果为0041所述的利用图像标注单词之间的关系进一步优化标注结果的步骤为00421假设给定N个有标注单词的图像样例,XX1,X2,XNRPN,。

14、YY1,Y2,YNRCN,分别表示图像的特征向量和标注单词向量;00432运用典型相关分析选择向量WX和WY使X和Y之间相关性最大,即求解以下最优化问题004400450046解得相关向量WX和WY;00473优化的标注结果,其中是前一步通过回归模型解得的,BT1DT,T是一个CC的矩阵,其中的每一行是运用典型相关分析得到的典型相关坐标,即D是说明书CN102375855ACN102375862A4/6页7一个CC的对角矩阵DDIAGD1,D2,DC,其对角线上的元素通过典型相关分析以后的X和Y的协方差得到00480049其中K1,2,C,P/N。0050实施例0051基于稀疏组群结构的图像标。

15、注方法包括如下步骤00521对图像数据进行特征提取,包括全局特征和局部特征,全剧特征有颜色直方图、颜色矩、颜色相关图、小波变换,局部特征有SIFT、形状上下文;00532将每幅图像用提取出的多种异构特征向量的组合来表示。即,一幅图像I表示为XI,YIRP0,1C,其中XIXI1,XIPTRP表示图像的特征向量,P表示特征维数,YIYI1,YICT0,1C是相应的标注单词向量,C表示数据集的标注单词总数,YIJ1表示第I幅图像具有第J个标注,否则,YIJ0。假设图像有G类特征表示,DG表示第G类特征的维数,G1,G,那么图像I的特征向量重新表示为即G类特征向量的组合。00543对每个图像数据集,。

16、随机选取N幅图像作为训练集,其余作为测试集;保证选取的训练集中,所有标注单词都至少出现一次,即这N个数据要包括所有的C个标注单词,否则重新选取。00554给定N个图像训练数据XI,YIRP0,1CI1,2,N,对每个标注单词CC1,C,训练回归模型FC,训练模型包括一个逻辑损失函数度量模型和数据间的拟合优度和一个正则化项增强组群结构的效应00560057其中是一个可调节的参数,是截距项,表示对应第G类异构特征的参数向量。1式中的L2范数使得中的系数全为0或者全为非0值。因此,对每个标注单词C训练模型FC得到的参数向量能够确定哪些异构特征的组群被选择作为标注单词C的最适合特征。00585为了求解。

17、参数向量,即求解1式的最优化问题,使用分块坐标下降法,算法描述如下0059步骤1初始化CRP1;0060步骤20061步骤3FORG1,G0062说明书CN102375855ACN102375862A5/6页800630064ELSE00650066END0067END0068步骤4重复步骤23直到收敛;0069步骤5预测值0070步骤4中,用表示把设为0,其余的保持不变时的参数向量C,函数P表示一个概率模型00716给定N个样例,XX1,X2,XNRPN和YY1,Y2,YNRCN分别表示N幅图像的特征向量和标注单词向量;00727运用典型相关分析选择向量WX和WY使X和Y之间相关性最大,即求。

18、解以下最优化问题007300740075通过缩放WX和WY,2式的优化问题可以转换成一个有约束的最优化问题0076007700780079为了解4式的最优化问题,构造拉普拉斯方程如下00800081上式对WX和WY求导得0082XYTWYXXXTWX060083YXTWXYYYTWY0700846式乘以减去7式乘以得0085008600870088即YX,令XY,代入67式,解得00890090其中CXXXXT,CXYXYT,CYXYXT,CYYYYT。0091显然,8式即是一个求解特征根的问题,这样就可以解得相关向量WY,同样方法可以解得相关向量WX。说明书CN102375855ACN102。

19、375862A6/6页900928进一步优化的标注结果其中是前一步通过回归模型解得的,BT1DT,T是一个CC的矩阵,其中的每一行是运用典型相关分析得到的典型相关坐标,即D是一个CC的对角矩阵DDIAGD1,D2,DC,其对角线上的元素通过典型相关分析以后的X和Y的协方差得到00930094其中K1,2,C,P/N。0095图2给出了本发明的5幅图像标注结果。0096从上面的例子可以看到,与传统的图像标注方法不同的是,本发明利用了稀疏组群结构进行特征选择,并结合标注单词间的相关性学习来对图像进行标注,取得了比传统的标注方法更准确的标注结果。说明书CN102375855ACN102375862A1/2页10图1说明书附图CN102375855ACN102375862A2/2页11图2说明书附图CN102375855A。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1