年龄估计装置、年龄估计方法和年龄估计程序.pdf

上传人:32 文档编号:4638496 上传时间:2018-10-23 格式:PDF 页数:15 大小:478.19KB
返回 下载 相关 举报
摘要
申请专利号:

CN201080019028.X

申请日:

2010.04.14

公开号:

CN102422323A

公开日:

2012.04.18

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||著录事项变更IPC(主分类):G06T 7/00变更事项:申请人变更前:NEC软件有限公司变更后:日本电气方案创新株式会社变更事项:地址变更前:日本东京都变更后:日本东京都变更事项:申请人变更前:国立大学法人东京工业大学变更后:国立大学法人东京工业大学|||实质审查的生效IPC(主分类):G06T 7/00申请日:20100414|||公开

IPC分类号:

G06T7/00

主分类号:

G06T7/00

申请人:

NEC软件有限公司; 国立大学法人东京工业大学

发明人:

植木一也; 杉山将; 伊原康行

地址:

日本东京都

优先权:

2009.04.28 JP 2009-109680

专利代理机构:

北京东方亿思知识产权代理有限责任公司 11258

代理人:

宋鹤

PDF下载: PDF下载
内容摘要

提供了能够减少年龄估计所用的对图像数据进行加标签的劳动的年龄估计装置、年龄估计方法和年龄估计程序。用于估计拍摄成图像数据中的人的年龄的年龄估计装置包括:维度压缩装置,用于对图像数据应用维度压缩以输出低维度数据;分簇装置用于对所输出的低维度数据执行分簇;加标签装置用于对已分簇的低维度数据中的每个簇的代表性数据加标签;以及识别装置用于利用包含在已加标签的低维度数据和未加标签的低维度数据中的特征量基于学习结果来估计人的年龄。

权利要求书

1: 一种用于估计图像数据中的人的年龄的年龄估计装置, 包括 : 维度压缩单元, 该维度压缩单元用于对所述图像数据应用维度压缩以输出低维度数 据; 分簇单元, 该分簇单元用于对所输出的低维度数据执行分簇 ; 加标签单元, 该加标签单元用于对已分簇的低维度数据中的每个簇的代表性数据加标 签; 以及 识别单元, 该识别单元用于利用包含在已加标签的低维度数据和未加标签的低维度数 据中的特征量基于学习结果来估计人的年龄。
2: 根据权利要求 1 所述的装置, 其中 用于所述维度压缩单元的维度压缩的参数和用于所述识别单元的年龄估计的特征量 是利用加权函数基于对一般化能力的评估结果而设置的, 该加权函数示出了每个年龄的估 计年龄误差的严重程度, 以及 所述识别设备的学习是基于所述加权函数而执行的。
3: 根据权利要求 1 或 2 所述的装置, 其中 所述对一般化能力的评估是基于加权均方误差做出的。
4: 根据权利要求 1 至 3 中的任一项所述的装置, 其中 所述加权函数是基于每个感知年龄的标准偏差定义的。
5: 根据权利要求 1 至 4 中的任一项所述的装置, 其中 所述加权函数的值越小, 所述估计年龄误差越严重。
6: 一种用于估计图像数据中的人的年龄的年龄估计方法, 包括 : 用于对所述图像数据应用维度压缩以输出低维度数据的维度压缩步骤 ; 用于对所输出的低维度数据执行分簇的分簇步骤 ; 用于对已分簇的低维度数据中的每个簇的代表性数据加标签的加标签步骤 ; 以及 用于利用包含在已加标签的低维度数据和未加标签的低维度数据中的特征量基于学 习结果来估计人的年龄的识别步骤。
7: 根据权利要求 6 所述的方法, 其中 用于所述维度压缩步骤中的维度压缩的参数和用于所述识别步骤中的年龄估计的特 征量是基于加权函数设置的, 该加权函数示出了每个年龄的估计年龄误差的严重程度, 以 及 执行所述识别步骤的识别设备被使得基于所述加权函数执行学习。
8: 根据权利要求 6 或 7 所述的方法, 其中 所述对一般化能力的评估是基于加权均方误差做出的。
9: 根据权利要求 6 至 8 中的任一项所述的方法, 其中 所述加权函数是基于每个感知年龄的标准偏差定义的。
10: 根据权利要求 6 至 9 中的任一项所述的方法, 其中 所述加权函数的值越小, 所述估计年龄误差越严重。
11: 一种用于估计图像数据中的人的年龄的年龄估计程序, 其中, 计算机被使得执行如 下处理 : 对所述图像数据应用维度压缩以输出低维度数据的维度压缩处理 ; 2 对所输出的低维度数据执行分簇的分簇处理 ; 对已分簇的低维度数据中的每个簇的代表性数据加标签的加标签处理 ; 以及 利用包含在已加标签的低维度数据和未加标签的低维度数据中的特征量基于学习结 果来估计人的年龄的识别处理。
12: 根据权利要求 11 所述的程序, 其中 用于所述维度压缩处理的维度压缩的参数和用于所述识别处理的年龄估计的特征量 是基于加权函数设置的, 该加权函数示出了每个年龄的估计年龄误差的严重程度, 以及 所述计算机被使得基于所述加权函数来执行用于执行所述识别处理的识别设备的学 习的处理。
13: 根据权利要求 11 或 12 所述的程序, 其中 所述计算机被使得基于加权均方误差来执行做出对一般化能力的评估的处理。
14: 根据权利要求 11 至 13 中的任一项所述的程序, 其中 所述计算机被使得基于每个感知年龄的标准偏差来执行用于定义所述加权函数的处 理。
15: 根据权利要求 11 至 14 中的任一项所述的程序, 其中 所述加权函数的值越小, 所述估计年龄误差越严重。

说明书


年龄估计装置、 年龄估计方法和年龄估计程序

    【技术领域】
     本发明涉及用于估计人的年龄的装置、 方法和程序。背景技术 例如, 作为一种基于人脸图像数据利用识别设备等来机械地估计人的年龄的方 法, 例如, 存在自己识别年龄的方法, 即将年龄作为连续量来估计的方法 ( 在该方法中, 年 龄估计被作为回归问题执行 )。例如, 非专利文献 1 中公开了这种方法。由于可以表达连续 年龄, 因此实验已表明, 与年龄估计被作为识别问题执行的方法相比, 出现更少的矛盾, 并 且, 可以以高准确性来识别年龄。
     回归问题可通过将求解所估计年龄 ( 被估计的年龄 ) 和正确年龄 ( 正确的年 龄 ) 作为最小化问题来获得。具体的示例包括多线性回归分析和 ( 内核 ) 岭回归 (ridge regression)。 这些方法执行学习, 以便减少所估计年龄和正确年龄之间的均方误差或平均 绝对误差。
     图 5 示出了将年龄估计作为回归问题来执行的年龄估计装置的示例。一般而言, 将要输入的图像数据 ( 例如, 脸部图像数据 ) 是诸如像素数或像素数 ×3(R、 G 和 B 的颜色 值 ) 之类的高维度数据。因此, 在维度压缩器 61 中, 从图像数据中抽取特征, 使得年龄信息 被突出, 而非必要信息 ( 光照条件、 脸部角度, 等等 ) 被删除。因此, 图像数据被从高维度数 据转换成低维度数据。 此处, 在维度压缩器 61 中, 例如, 使用诸如主成分分析 (PCA)、 线性判 别分析 (LDA) 和局部保持投影 (LPP) 之类的方法。该处理还被称为是 “特征选择” 和 “维度 压缩” 。然后, 识别设备 62 基于所抽取的特征来估计年龄。
     为了通过年龄估计装置 60 基于图像数据来估计年龄, 需要维度压缩器 61 和识别 设备 62 的学习。 即, 其正确年龄 ( 实际年龄或感知年龄 ( 即, 视年龄 (apparent age))) 已知 的人的多个图像数据被输入到维度压缩器 61, 并且, 每个数据由诸如 N 倍交叉验证 (N-fold cross validation) 和留一交叉验证 (leave-one-out cross-validation) 之类的方法评 估。基于该评估结果, 识别设备 62 的输出被调整, 使得误差 ( 所估计年龄和正确年龄之间 的差异 ) 可被减少。对于识别设备 62 的学习, 应用诸如线性回归、 多回归、 岭回归和神经网 络之类的方法。
     通过重复类似的流程同时变更特征的类型和组合、 抽取方法 ( 即, 维度压缩所使 用的参数 ) 等, 参数和模型被选择, 使得误差可被减少。
     相关领域文献
     [ 非专利文献 ]
     非专利文献 1 : Y.Fu、 Y.Xu 和 T.S.Huang, Estimating human age by manifold analysis of face pictures and regression on aging features, IEEE 多媒体和展览会 论文集, 第 1383 页至第 1386 页, 2007。
     发明内容发明所要解决的问题
     为了在图 5 中所示的年龄估计装置中获得带有高准确性的年龄估计, 需要收集大 量的图像数据。 但是, 存在如下问题 : 需要手动地将正确年龄数据应用到大量图像数据中的 每一个的操作 ( 加标签 )。
     鉴于以上问题, 做出了本发明, 并且, 其意欲提供能够减少对用于年龄估计的图像 数据的加标签劳动的年龄估计装置、 年龄估计方法和年龄估计程序。
     解决问题的手段
     为了获得前述目的, 本发明的年龄估计装置是一种用于估计图像数据中的人的年 龄的年龄估计装置, 包括 : 维度压缩单元, 该维度压缩单元用于对图像数据应用维度压缩以 输出低维度数据 ; 分簇单元, 该分簇单元用于对所输出的低维度数据执行分簇 ; 加标签单 元, 该加标签单元用于对已分簇的低维度数据中的每个簇的代表性数据加标签 ; 以及识别 单元, 该识别单元用于利用包含在已加标签的低维度数据和未加标签的低维度数据中的特 征量基于学习结果来估计人的年龄。
     本发明的年龄估计方法是一种用于估计图像数据中的人的年龄的年龄估计方法, 包括 : 用于对图像数据应用维度压缩以输出低维度数据的维度压缩步骤 ; 用于对所输出的 低维度数据执行分簇的分簇步骤 ; 用于对已分簇的低维度数据中的每个簇的代表性数据加 标签的加标签步骤 ; 以及用于利用包含在已加标签的低维度数据和未加标签的低维度数据 中的特征量基于学习结果来估计人的年龄的识别步骤。
     本发明的程序是一种用于估计图像数据中的人的年龄的年龄估计程序, 其中, 计 算机被导致执行如下处理 : 对图像数据应用维度压缩以输出低维度数据的维度压缩处理 ; 对所输出的低维度数据执行分簇的分簇处理 ; 对已分簇的低维度数据中的每个簇的代表性 数据加标签的加标签处理 ; 以及利用包含在已加标签的低维度数据和未加标签的低维度数 据中的特征量基于学习结果来估计人的年龄的识别处理。
     发明的效果
     根据本发明, 可减少对用于年龄估计的图像数据的加标签工作。 附图说明
     图 1 是示出了根据本发明的实施例的年龄估计装置的配置的示图。 图 2 是示出了由根据本发明的实施例的年龄估计装置所执行的年龄估计结果的示例。 图 3 是示出了根据本发明的实施例的年龄估计装置的模型中的数据分布的示例 的示图。
     图 4 是示出了由估计器针对每个年龄基于脸部图像的年龄估计结果的示例的示 图。
     图 5 是示出了将年龄估计作为回归问题来执行的年龄估计装置的示例的示图。
     具体实施方式
     [ 第一实施例 ]
     将描述合适地实现了本发明的第一实施例。图 1 示出了根据该实施例的年龄估计装置的配置。年龄估计装置 10 包括维度压 缩器 11、 分簇设备 12、 加标签设备 13, 以及识别设备 14。
     例如, 人的图像数据 ( 例如, 人脸图像数据 ) 作为训练数据 ( 学习数据 ) 被输入到 年龄估计装置 10。该图像数据是具有像素数 × 照明水平数的维度的高维度数据。
     当高维度图像数据被输入时, 维度压缩器 11 执行维度压缩 ( 维度减少 )。即, 维 度压缩器 11 从图像数据抽取特征, 使得年龄信息被突出, 而非必要信息 ( 光照条件、 脸部角 度, 等等 ) 被删除。例如, 特征通过诸如 PCA、 LDA 和 LPP 之类的方法被抽取。因此, 高维度 图像数据被转换成低维度图像数据 ( 低维度数据 )。
     接下来, 分簇设备 12 执行对通过维度压缩所获得的低维度数据的分簇。作为分 簇, 例如, 可使用 K- 均值分簇。
     接下来, 在经过了分簇的低维度数据中, 仅有代表性数据被加标签设备 13 加标签 ( 对正确年龄数据的应用 )。例如, 最接近属于每个簇的数据的平均值的数据被看作是代表 性数据, 并且, 代表性数据由加标签设备 13 加标签 ; 或者, 从每个簇中随机选出的数据被看 作是代表性数据, 并且, 代表性数据由加标签设备 13 加标签。另外, 多个代表性数据可由加 标签设备 13 来加标签。 以下, 已加标签的数据被称为已加标签训练数据 ( 已指导数据 ), 而 未加标签的数据被称为未加标签训练数据 ( 未指导数据 )。 在输入到年龄估计装置 10 的图像数据中, 认为数据的出现频率被局部增加的部 分依赖于脸部特征的各种变化和拍摄环境的差异而被分散。如将稍后描述的, 在高斯内核 被用于回归模型的情形中, 训练数据和测试数据之间的距离给出了重要的信息。 因此, 如上 所述, 对数据的出现频率增加的部分训练数据加标签可以是有效的方法。
     通过这种方式, 根据该实施例, 加标签不是关于所有所输入的图像数据而执行的, 而是关于部分数据 ( 代表性数据 ) 来执行的。因此, 根据该实施例, 可减少加标签的劳动。
     识别设备 14 基于由维度压缩器 11 所抽取的特征来估计年龄。
     作为维度压缩器 11 和识别设备 14, 可使用那些具有共同配置的设备。但是, 在维 度压缩器 11 中的特征抽取方法 ( 维度压缩所使用的参数 ) 和识别设备 14 的类型是基于通 过考虑示出了所估计的年龄误差 ( 所估计年龄和正确年龄之间的差异 ) 的严重程度的 “权 重” 所获得的评估结果来决定的。另外, 权重的概念被引入到识别设备 14 的学习内容中。 此处, 将如以下来描述引入权重概念的原因。
     如上所述, 通过惯常的年龄估计装置 ( 例如, 在图 5 中所示的装置 ), 基于脸部图像 数据, 通过重复流程同时变更特征的类型和组合以及抽取方法 ( 即, 维度压缩所使用的参 数 ), 参数和模型被选择, 使得误差可被减少。但是, 由于依赖于所意欲的年龄, 年龄之间的 距离是不同的, 因此, 使用所估计年龄和正确年龄之间的均方误差和平均绝对误差导致年 龄识别的准确度的降低。例如, 在正确年龄和识别年龄之间存在 10 年差异 ( 误差 ) 的情形 中, 在将 5 岁误认为是 15 岁和将 35 岁误认为是 45 岁之间的严重程度是不同的。 换言之, 即 便是在相同的 10 岁差异的误差中, 将 5 岁误认为 15 岁意味着将幼儿园的孩子误认为是初 中生或高中生, 并且, 就人的感知而言, 这是非常严重的误差。在另一方面, 由于 35 岁的人 的脸部特征非常类似于 45 岁的人的脸部特征, 因此, 人甚至常常不能识别其间的差异。因 此, 将 35 岁误认为 45 岁不像将 5 岁误认为 15 岁那么严重。
     人的外观在青年阶段 ( 诸如成长阶段 ) 急剧变化, 而在变成成年人之后缓慢地变
     化。因此, 即便是相同的年龄差异误差, 如果用相同的指示符来做出评估, 则出现问题。
     图 4 示出了由估计器针对每个年龄基于脸部图像来做出的年龄估计的结果的示 例。 示图示出了在针对每个年龄对其正确年龄已知的人的年龄估计的结果进行分类的情形 中的 “所估计年龄的标准偏差 ( 变化程度 )” 。水平轴指示对象的正确年龄 ( 真实年龄 ), 而 垂直轴示出估计误差的标准偏差。此处, 正确年龄 ( 真实年龄 ) 是由估计器所估计的年龄 的平均值。 由于年轻人的标准偏差很小, 可以理解, 大多数估计器将年轻人估计为类似的年 龄。
     因此, 如果在年龄估计装置中年轻人的数据被错误地识别为成年人, 则这与人所 感知的结果极大地不同。
     此处, 该实施例通过将权重的概念引入到识别设备 14 的学习内容中而获得能够 获得与人的识别结果非常匹配的识别结果的特征抽取。
     另外, 识别设备 14 通过不仅利用已加标签的训练数据还通过利用未加标签的训 练数据来创建准确的模型 ( 用于年龄估计的模型 )。
     此处, 将参照图 3A 和图 3B 来描述在该实施例中所创建的模型的示例。图 3A 示出 了在识别设备 14 的学习之前 ( 初始状态 ) 的模型的数据分布。如图 3A 所示, 在学习之前 的模型包括两种类型的数据, 其已加标签的训练数据和未加标签的训练数据, 并且, 这些数 据被边界分开。即, 在图 3A 中, 在 a 的范围内的未加标签训练数据被分类为由菱形所指示 的已加标签的训练数据, 而在 b 的范围内的未加标签训练数据被分类为由圆圈所指示的已 加标签的训练数据。在该实施例中, 例如通过将稍后描述的半指导学习, 在图 3A 中所示的 模型被转换成在图 3B 中所示的准确模型。与在图 3A 中所示的模型相比, 在图 3B 中所示的 模型的边界被变形, 并且, 在 a 的范围内的未加标签的训练数据被分类为由圆圈所指示的 已加标签的训练数据, 并且, 在 b 的范围内的未加标签的训练数据被分类为由菱形所指示 的已加标签的训练数据。
     以下, 将描述通过不仅利用已加标签的训练数据还利用未加标签的训练数据的半 指导学习的年龄估计方法。 该方法是未加标签的训练数据被用于内核函数的正规化最小二 乘的方法 ( 将权重指派给内核函数的正规化最小二乘的方法, 内核正规化加权最小二乘 : KRWLS), 并且, 有效地使用整个训练数据的示图和副本 (manifold) 的结构。该方法意欲通 过利用诸如示图和副本的结构 ( 将稍后描述的表达式 (3)) 之类的信息来平滑回归模型, 从 而提高年龄估计的准确度。另外, 年龄的权重被在最小二乘中考虑。从这种特点来看, 该方 法可被称为是半指导内核正规化加权最小二乘 (SKRWLS)。
     此处, 所考虑的问题是预测测试数据的真实年龄 y* 的半指导学习, 测试数据为特 征向量 x 的抽取源, 其中, 在应用一个已加标签训练数据 (xi, yi)[xi 是示例性变量 ( 脸部特 征 < 其可被称为特征向量 >), yi 是客观变量 ( 年龄 ), i 是 1 到 l] 和 u 个未加标签训练数 据 (xi)[xi 是示例性变量 ( 脸部特征 < 其可被称为特征向量 >), i 是 1+l 到 l+u] 的条件下, * y = f(x)。在该实施例中, 年龄估计函数 f(x) 由正定内核 k(x, x’ ) 的线性组合建模。这 由以下的表达式 (1) 来表达。表达式 (1) 是用于输出确定的年龄的表达式。该年龄是通过 在学习 ( 将稍后描述其细节 ) 期间获得最佳解并然后将所获得的最佳解带入表达式 (1) 中 来输出的。在训练数据的数值 l 或 u 很大的情形中, 可使用内核函数 k(xi, x)[i 是 1 到 l+u] 的子集而非其全部。在识别设备 14 中, 对由以下表达式 (2)( 带有 l+u 行和 1 列的具有 a1 到 al+u 分量的矩阵 ) 所示的参数的学习被执行, 使得以下的表达式 (3) 被最小化。表达式 (3) 是定义误差 ( 处罚 ) 的表达式。该实施例意欲最小化误差 ( 处罚 )。
     α = (α1,…, αl+u)T … (2)
     w(y) 是加权函数, ‖·‖ 是 Rn 的欧几里得范数
     在表达式 (3) 中的 λ( > 0) 是正规化参数, 其用于防止过度拟合 (overfitting) 而引入, 并且, 表达式 (3) 的第二个项是用于防止过度拟合的校正项 ( 用于计算所获得的参 数的大小的项 )。在表达式 (3) 中的第一项是用于计算训练数据的年龄识别误差的项。在 表达式 (3) 中的第三项是用于计算即便两个数据 ( 已加标签或未加标签的数据 ) 之间的距 离很小也将大处罚应用到其间具有很大差异的两个年龄时的误差值的项 ( 即, 该项用于执 行学习使得当两个数据之间的距离很小时两个年龄之间的差异被减小 )。
     在表达式 (3) 中的 μ( > 0) 是用于调整年龄估计函数 f(x) 的平滑的参数。
     在表达式 (3) 中的 Wi, j 表达 xi 和 xj 之间的近似程度 (Wi, j 随着两个数据间的距离 的减少而增加 )。Wi, j 的示例通过以下的表达式 (4) 来示出。
     在表达式 (3) 中的加权函数 w(y) 是表达针对每个年龄的所估计年龄误差的严重 程度的函数。w(y) 的值 ( 权重 ) 越大, 所估计的年龄的误差越严重。
     在表达式 (3) 中的最佳解可通过以下表达式 (5) 来获得。
     最佳解K KT D具有 k(xi, xj) 作为 (i, j) 分量的内核矩阵 K 的转置矩阵 当 1 ≤ i ≤ I 时, 具有 作为 (i, i) 对角线分量, 并当 I < i ≤ I+u 时,具有 0 作为 (i, i) 对角线分量的 I+u 维对角矩阵
     L具有 Lij 作为 (i, j) 分量的拉普拉斯矩阵是克罗内克增量 )
     II+u I+u 维单位矩阵
     y 当 1 ≤ i ≤ I 时具有 yi 作为 i 分量并当 I < i ≤ I+u 时具有 0 作为 i 分量 的 I+u 维向量
     在训练数据的数量 I+u 很大的情形中, 由于对在表达式 (5) 中的加括号部分的计 算是困难的, 因此, 最佳解可通过减少所使用的内核函数的数量或通过梯度方法来执行数 值计算来获得。
     通过利用通过表达式 (5) 所获得的最佳解作为参数, 新近输入到年龄估计装置 10 的 m- 测试数据的年龄被预测。此处, 测试数据及其真实年龄被按以下表达。
     测试数据 测试数据的真实年龄根据以下的表达式 (6), 基于加权均方误差 (WMSE), 做出对一般化能力的评估。表 达式 (6) 是定义测试数据的误差的表达式 ( 计算测试数据的误差的表达式 )。
     在确定在维度压缩器 11 中的特征抽取方法和确定识别设备 14 的类型时, 通过利 用学习数据和测试数据来执行 N 倍交叉验证和留一交叉验证, 评估基于表达式 (6) 的 WMSE 来做出, 并且, 获得在测试数据中的最高准确度的方法和类型 ( 导致最小误差的方法和类 型 ) 被选择。
     此处, 将描述实验的示例, 其中, 已加标签的训练数据的数量 I 是 200, 未加标签的 训练数据的数量 u 是 5000, 测试数据的数量 m 是 1500, 以及每个年龄组的数据数量近似被 均衡。此处, 所考虑的情形是在以下表达式 (7) 中所示的高斯内核被用作内核函数的情形。 内核宽度 σ 和正规化参数 λ 和 μ 被确定, 使得测试误差变为最小。
     例如, 图 2 示出了利用通过此处以下的三种方法所获得的 200 个已加标签训练数 据和随机获得的 5000 个未加标签训练数据关于女性的脸部特征向量集合所执行的指导学
     习 ( 仅利用已加标签的训练数据的学习 ) 和半指导学习 ( 利用已加标签的训练数据和未加 标签的训练数据的学习 ) 的结果。三种方法如下述。
     LR : 随机获得已加标签的训练数据
     LC1 : 通过利用 PCA 执行到四维水平的维度减少之后计算 200 个簇来获得已加标签 的训练数据
     LC2 : 通过利用 PCA 执行到十维水平的维度减少之后计算 200 个簇来获得已加标签 的训练数据
     参照图 2, 在指导学习仅通过利用由三种方法 (LR、 LC1 和 LC2) 来获得的三种类型 的训练数据来执行的情形中, 利用由 LC2 所获得的训练数据的学习示出了最优效果。
     另外, 图 2 示出了在半指导学习被执行的情形中, 其中, 除了上述各自已加标签的 训练数据之外, 还是用了未加标签的训练数据, 与指导学习的结果相比, 其结果被改善了。
     这说明包括如下步骤的方法是最有效的方法 : 通过分簇来获得少量已加标签的训 练数据, 并且, 利用未加标签的训练数据组合已加标签的训练数据执行半指导学习。
     通过这种方式, 在该实施例中, 通过利用已加标签的训练数据组合未加标签的训 练数据并且利用 WMSE 作为评估标准, 输出与人感知的年龄非常匹配的特征抽取方法和识 别设备被选择。 由于特征抽取方法和识别设备被选择, 使得输出与人感知的年龄非常匹配的输出 年龄, 根据该实施例的年龄估计装置可输出与人的感知非常匹配的估计结果。 另外, 由于利 用识别设备 ( 其中, 与人的感知非常匹配的学习被执行 ) 年龄被估计, 因此, 可估计与感知 年龄非常匹配的年龄。
     在前述实施例中, 使用基于实际测量数据的加权函数。 但是, 人工做出的加权函数 可被应用到表达式 (3)、 (5) 和 (6)。另外, 在前述实施例中, 仅使用了一个加权函数。但是, 可使用多于一个加权函数。通过这种方式, 年龄的权重及其估计的准确度希望可被提高和 增加。因此, 可提高所希望的年龄的估计准确度。
     参照实施例, 描述了本发明。但是, 本发明并不限于上述实施例。在本申请的发明 的范围内, 可做出各种变更。
     在前述实施例中的操作还可被硬件、 软件或其复合结果所执行。
     在处理通过软件实施的情形中, 处理可通过将记录处理序列的程序安装到结合在 专用硬件中的计算机的存储器中来实施。可替换地, 处理可通过将程序安装到能够执行各 种处理的通用计算机中来实施。
     例如, 程序可被初步记录在用作记录介质的硬盘和只读存储器 (ROM) 中。可替换 地, 程序可被临时或永久地存储 ( 记录 ) 在可移动记录介质中, 诸如, 紧致盘只读存储器 (CD-ROM)、 磁光 (MO) 盘、 数字通用盘 (DVD)、 磁盘, 以及半导体存储器。
     除了将程序安装到来自前述可移动记录介质的计算机中以外, 程序可从下载站点 无线地被转移。可替换地, 程序可经由诸如局域网 (LAN) 和因特网之类的网络有线地转移。 计算机可接收所转移的程序, 并且, 可将程序安装到诸如集成了硬盘的记录介质中。
     以上, 参照实施例描述了本申请的发明。但是, 本申请的发明并不限于上述实施 例。在本申请的发明的范围内, 可在发明的配置和细节中做出可被本领域技术人员所理解 的各种变更。
     该申请要求 2009 年 4 月 28 递交的日本专利申请 No.2009-109680 的优先权。日 本专利申请的整个主题内容通过引用被结合于此。
     参考标号说明
     10 年龄估计装置
     11 维度压缩器
     12 分簇设备
     13 加标签设备
     14 识别设备

年龄估计装置、年龄估计方法和年龄估计程序.pdf_第1页
第1页 / 共15页
年龄估计装置、年龄估计方法和年龄估计程序.pdf_第2页
第2页 / 共15页
年龄估计装置、年龄估计方法和年龄估计程序.pdf_第3页
第3页 / 共15页
点击查看更多>>
资源描述

《年龄估计装置、年龄估计方法和年龄估计程序.pdf》由会员分享,可在线阅读,更多相关《年龄估计装置、年龄估计方法和年龄估计程序.pdf(15页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102422323 A (43)申请公布日 2012.04.18 CN 102422323 A *CN102422323A* (21)申请号 201080019028.X (22)申请日 2010.04.14 2009-109680 2009.04.28 JP G06T 7/00(2006.01) (71)申请人 NEC 软件有限公司 地址 日本东京都 申请人 国立大学法人东京工业大学 (72)发明人 植木一也 杉山将 伊原康行 (74)专利代理机构 北京东方亿思知识产权代理 有限责任公司 11258 代理人 宋鹤 (54) 发明名称 年龄估计装置、 年龄估计方法和年。

2、龄估计程 序 (57) 摘要 提供了能够减少年龄估计所用的对图像数据 进行加标签的劳动的年龄估计装置、 年龄估计方 法和年龄估计程序。用于估计拍摄成图像数据 中的人的年龄的年龄估计装置包括 : 维度压缩装 置, 用于对图像数据应用维度压缩以输出低维度 数据 ; 分簇装置用于对所输出的低维度数据执行 分簇 ; 加标签装置用于对已分簇的低维度数据中 的每个簇的代表性数据加标签 ; 以及识别装置用 于利用包含在已加标签的低维度数据和未加标签 的低维度数据中的特征量基于学习结果来估计人 的年龄。 (30)优先权数据 (85)PCT申请进入国家阶段日 2011.10.28 (86)PCT申请的申请数据 。

3、PCT/JP2010/056690 2010.04.14 (87)PCT申请的公布数据 WO2010/125916 JA 2010.11.04 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 8 页 附图 4 页 CN 102422335 A1/2 页 2 1. 一种用于估计图像数据中的人的年龄的年龄估计装置, 包括 : 维度压缩单元, 该维度压缩单元用于对所述图像数据应用维度压缩以输出低维度数 据 ; 分簇单元, 该分簇单元用于对所输出的低维度数据执行分簇 ; 加标签单元, 该加标签单元用于对已分簇的低维度数据中的每个簇的代表性。

4、数据加标 签 ; 以及 识别单元, 该识别单元用于利用包含在已加标签的低维度数据和未加标签的低维度数 据中的特征量基于学习结果来估计人的年龄。 2. 根据权利要求 1 所述的装置, 其中 用于所述维度压缩单元的维度压缩的参数和用于所述识别单元的年龄估计的特征量 是利用加权函数基于对一般化能力的评估结果而设置的, 该加权函数示出了每个年龄的估 计年龄误差的严重程度, 以及 所述识别设备的学习是基于所述加权函数而执行的。 3. 根据权利要求 1 或 2 所述的装置, 其中 所述对一般化能力的评估是基于加权均方误差做出的。 4. 根据权利要求 1 至 3 中的任一项所述的装置, 其中 所述加权函数是。

5、基于每个感知年龄的标准偏差定义的。 5. 根据权利要求 1 至 4 中的任一项所述的装置, 其中 所述加权函数的值越小, 所述估计年龄误差越严重。 6. 一种用于估计图像数据中的人的年龄的年龄估计方法, 包括 : 用于对所述图像数据应用维度压缩以输出低维度数据的维度压缩步骤 ; 用于对所输出的低维度数据执行分簇的分簇步骤 ; 用于对已分簇的低维度数据中的每个簇的代表性数据加标签的加标签步骤 ; 以及 用于利用包含在已加标签的低维度数据和未加标签的低维度数据中的特征量基于学 习结果来估计人的年龄的识别步骤。 7. 根据权利要求 6 所述的方法, 其中 用于所述维度压缩步骤中的维度压缩的参数和用于。

6、所述识别步骤中的年龄估计的特 征量是基于加权函数设置的, 该加权函数示出了每个年龄的估计年龄误差的严重程度, 以 及 执行所述识别步骤的识别设备被使得基于所述加权函数执行学习。 8. 根据权利要求 6 或 7 所述的方法, 其中 所述对一般化能力的评估是基于加权均方误差做出的。 9. 根据权利要求 6 至 8 中的任一项所述的方法, 其中 所述加权函数是基于每个感知年龄的标准偏差定义的。 10. 根据权利要求 6 至 9 中的任一项所述的方法, 其中 所述加权函数的值越小, 所述估计年龄误差越严重。 11. 一种用于估计图像数据中的人的年龄的年龄估计程序, 其中, 计算机被使得执行如 下处理 。

7、: 对所述图像数据应用维度压缩以输出低维度数据的维度压缩处理 ; 权 利 要 求 书 CN 102422323 A CN 102422335 A2/2 页 3 对所输出的低维度数据执行分簇的分簇处理 ; 对已分簇的低维度数据中的每个簇的代表性数据加标签的加标签处理 ; 以及 利用包含在已加标签的低维度数据和未加标签的低维度数据中的特征量基于学习结 果来估计人的年龄的识别处理。 12. 根据权利要求 11 所述的程序, 其中 用于所述维度压缩处理的维度压缩的参数和用于所述识别处理的年龄估计的特征量 是基于加权函数设置的, 该加权函数示出了每个年龄的估计年龄误差的严重程度, 以及 所述计算机被使得。

8、基于所述加权函数来执行用于执行所述识别处理的识别设备的学 习的处理。 13. 根据权利要求 11 或 12 所述的程序, 其中 所述计算机被使得基于加权均方误差来执行做出对一般化能力的评估的处理。 14. 根据权利要求 11 至 13 中的任一项所述的程序, 其中 所述计算机被使得基于每个感知年龄的标准偏差来执行用于定义所述加权函数的处 理。 15. 根据权利要求 11 至 14 中的任一项所述的程序, 其中 所述加权函数的值越小, 所述估计年龄误差越严重。 权 利 要 求 书 CN 102422323 A CN 102422335 A1/8 页 4 年龄估计装置、 年龄估计方法和年龄估计程序。

9、 技术领域 0001 本发明涉及用于估计人的年龄的装置、 方法和程序。 背景技术 0002 例如, 作为一种基于人脸图像数据利用识别设备等来机械地估计人的年龄的方 法, 例如, 存在自己识别年龄的方法, 即将年龄作为连续量来估计的方法 ( 在该方法中, 年 龄估计被作为回归问题执行 )。例如, 非专利文献 1 中公开了这种方法。由于可以表达连续 年龄, 因此实验已表明, 与年龄估计被作为识别问题执行的方法相比, 出现更少的矛盾, 并 且, 可以以高准确性来识别年龄。 0003 回归问题可通过将求解所估计年龄 ( 被估计的年龄 ) 和正确年龄 ( 正确的年 龄 ) 作为最小化问题来获得。具体的示。

10、例包括多线性回归分析和 ( 内核 ) 岭回归 (ridge regression)。 这些方法执行学习, 以便减少所估计年龄和正确年龄之间的均方误差或平均 绝对误差。 0004 图 5 示出了将年龄估计作为回归问题来执行的年龄估计装置的示例。一般而言, 将要输入的图像数据 ( 例如, 脸部图像数据 ) 是诸如像素数或像素数 3(R、 G 和 B 的颜色 值 ) 之类的高维度数据。因此, 在维度压缩器 61 中, 从图像数据中抽取特征, 使得年龄信息 被突出, 而非必要信息 ( 光照条件、 脸部角度, 等等 ) 被删除。因此, 图像数据被从高维度数 据转换成低维度数据。 此处, 在维度压缩器61。

11、中, 例如, 使用诸如主成分分析(PCA)、 线性判 别分析 (LDA) 和局部保持投影 (LPP) 之类的方法。该处理还被称为是 “特征选择” 和 “维度 压缩” 。然后, 识别设备 62 基于所抽取的特征来估计年龄。 0005 为了通过年龄估计装置 60 基于图像数据来估计年龄, 需要维度压缩器 61 和识别 设备62的学习。 即, 其正确年龄(实际年龄或感知年龄(即, 视年龄(apparent age)已知 的人的多个图像数据被输入到维度压缩器61, 并且, 每个数据由诸如N倍交叉验证(N-fold cross validation) 和留一交叉验证 (leave-one-out cro。

12、ss-validation) 之类的方法评 估。基于该评估结果, 识别设备 62 的输出被调整, 使得误差 ( 所估计年龄和正确年龄之间 的差异 ) 可被减少。对于识别设备 62 的学习, 应用诸如线性回归、 多回归、 岭回归和神经网 络之类的方法。 0006 通过重复类似的流程同时变更特征的类型和组合、 抽取方法 ( 即, 维度压缩所使 用的参数 ) 等, 参数和模型被选择, 使得误差可被减少。 0007 相关领域文献 0008 非专利文献 0009 非专利文献 1 : Y.Fu、 Y.Xu 和 T.S.Huang, Estimating human age by manifold anal。

13、ysis of face pictures and regression on aging features, IEEE 多媒体和展览会 论文集, 第 1383 页至第 1386 页, 2007。 发明内容 说 明 书 CN 102422323 A CN 102422335 A2/8 页 5 0010 发明所要解决的问题 0011 为了在图 5 中所示的年龄估计装置中获得带有高准确性的年龄估计, 需要收集大 量的图像数据。 但是, 存在如下问题 : 需要手动地将正确年龄数据应用到大量图像数据中的 每一个的操作 ( 加标签 )。 0012 鉴于以上问题, 做出了本发明, 并且, 其意欲提供能够减。

14、少对用于年龄估计的图像 数据的加标签劳动的年龄估计装置、 年龄估计方法和年龄估计程序。 0013 解决问题的手段 0014 为了获得前述目的, 本发明的年龄估计装置是一种用于估计图像数据中的人的年 龄的年龄估计装置, 包括 : 维度压缩单元, 该维度压缩单元用于对图像数据应用维度压缩以 输出低维度数据 ; 分簇单元, 该分簇单元用于对所输出的低维度数据执行分簇 ; 加标签单 元, 该加标签单元用于对已分簇的低维度数据中的每个簇的代表性数据加标签 ; 以及识别 单元, 该识别单元用于利用包含在已加标签的低维度数据和未加标签的低维度数据中的特 征量基于学习结果来估计人的年龄。 0015 本发明的年。

15、龄估计方法是一种用于估计图像数据中的人的年龄的年龄估计方法, 包括 : 用于对图像数据应用维度压缩以输出低维度数据的维度压缩步骤 ; 用于对所输出的 低维度数据执行分簇的分簇步骤 ; 用于对已分簇的低维度数据中的每个簇的代表性数据加 标签的加标签步骤 ; 以及用于利用包含在已加标签的低维度数据和未加标签的低维度数据 中的特征量基于学习结果来估计人的年龄的识别步骤。 0016 本发明的程序是一种用于估计图像数据中的人的年龄的年龄估计程序, 其中, 计 算机被导致执行如下处理 : 对图像数据应用维度压缩以输出低维度数据的维度压缩处理 ; 对所输出的低维度数据执行分簇的分簇处理 ; 对已分簇的低维度。

16、数据中的每个簇的代表性 数据加标签的加标签处理 ; 以及利用包含在已加标签的低维度数据和未加标签的低维度数 据中的特征量基于学习结果来估计人的年龄的识别处理。 0017 发明的效果 0018 根据本发明, 可减少对用于年龄估计的图像数据的加标签工作。 附图说明 0019 图 1 是示出了根据本发明的实施例的年龄估计装置的配置的示图。 0020 图 2 是示出了由根据本发明的实施例的年龄估计装置所执行的年龄估计结果的 示例。 0021 图 3 是示出了根据本发明的实施例的年龄估计装置的模型中的数据分布的示例 的示图。 0022 图 4 是示出了由估计器针对每个年龄基于脸部图像的年龄估计结果的示例。

17、的示 图。 0023 图 5 是示出了将年龄估计作为回归问题来执行的年龄估计装置的示例的示图。 具体实施方式 0024 第一实施例 0025 将描述合适地实现了本发明的第一实施例。 说 明 书 CN 102422323 A CN 102422335 A3/8 页 6 0026 图 1 示出了根据该实施例的年龄估计装置的配置。年龄估计装置 10 包括维度压 缩器 11、 分簇设备 12、 加标签设备 13, 以及识别设备 14。 0027 例如, 人的图像数据 ( 例如, 人脸图像数据 ) 作为训练数据 ( 学习数据 ) 被输入到 年龄估计装置 10。该图像数据是具有像素数 照明水平数的维度的高。

18、维度数据。 0028 当高维度图像数据被输入时, 维度压缩器 11 执行维度压缩 ( 维度减少 )。即, 维 度压缩器11从图像数据抽取特征, 使得年龄信息被突出, 而非必要信息(光照条件、 脸部角 度, 等等 ) 被删除。例如, 特征通过诸如 PCA、 LDA 和 LPP 之类的方法被抽取。因此, 高维度 图像数据被转换成低维度图像数据 ( 低维度数据 )。 0029 接下来, 分簇设备 12 执行对通过维度压缩所获得的低维度数据的分簇。作为分 簇, 例如, 可使用 K- 均值分簇。 0030 接下来, 在经过了分簇的低维度数据中, 仅有代表性数据被加标签设备 13 加标签 ( 对正确年龄数。

19、据的应用 )。例如, 最接近属于每个簇的数据的平均值的数据被看作是代表 性数据, 并且, 代表性数据由加标签设备 13 加标签 ; 或者, 从每个簇中随机选出的数据被看 作是代表性数据, 并且, 代表性数据由加标签设备 13 加标签。另外, 多个代表性数据可由加 标签设备13来加标签。 以下, 已加标签的数据被称为已加标签训练数据(已指导数据), 而 未加标签的数据被称为未加标签训练数据 ( 未指导数据 )。 0031 在输入到年龄估计装置 10 的图像数据中, 认为数据的出现频率被局部增加的部 分依赖于脸部特征的各种变化和拍摄环境的差异而被分散。如将稍后描述的, 在高斯内核 被用于回归模型的。

20、情形中, 训练数据和测试数据之间的距离给出了重要的信息。 因此, 如上 所述, 对数据的出现频率增加的部分训练数据加标签可以是有效的方法。 0032 通过这种方式, 根据该实施例, 加标签不是关于所有所输入的图像数据而执行的, 而是关于部分数据 ( 代表性数据 ) 来执行的。因此, 根据该实施例, 可减少加标签的劳动。 0033 识别设备 14 基于由维度压缩器 11 所抽取的特征来估计年龄。 0034 作为维度压缩器 11 和识别设备 14, 可使用那些具有共同配置的设备。但是, 在维 度压缩器 11 中的特征抽取方法 ( 维度压缩所使用的参数 ) 和识别设备 14 的类型是基于通 过考虑示。

21、出了所估计的年龄误差 ( 所估计年龄和正确年龄之间的差异 ) 的严重程度的 “权 重” 所获得的评估结果来决定的。另外, 权重的概念被引入到识别设备 14 的学习内容中。 此处, 将如以下来描述引入权重概念的原因。 0035 如上所述, 通过惯常的年龄估计装置(例如, 在图5中所示的装置), 基于脸部图像 数据, 通过重复流程同时变更特征的类型和组合以及抽取方法 ( 即, 维度压缩所使用的参 数 ), 参数和模型被选择, 使得误差可被减少。但是, 由于依赖于所意欲的年龄, 年龄之间的 距离是不同的, 因此, 使用所估计年龄和正确年龄之间的均方误差和平均绝对误差导致年 龄识别的准确度的降低。例如。

22、, 在正确年龄和识别年龄之间存在 10 年差异 ( 误差 ) 的情形 中, 在将5岁误认为是15岁和将35岁误认为是45岁之间的严重程度是不同的。 换言之, 即 便是在相同的 10 岁差异的误差中, 将 5 岁误认为 15 岁意味着将幼儿园的孩子误认为是初 中生或高中生, 并且, 就人的感知而言, 这是非常严重的误差。在另一方面, 由于 35 岁的人 的脸部特征非常类似于 45 岁的人的脸部特征, 因此, 人甚至常常不能识别其间的差异。因 此, 将 35 岁误认为 45 岁不像将 5 岁误认为 15 岁那么严重。 0036 人的外观在青年阶段 ( 诸如成长阶段 ) 急剧变化, 而在变成成年人之。

23、后缓慢地变 说 明 书 CN 102422323 A CN 102422335 A4/8 页 7 化。因此, 即便是相同的年龄差异误差, 如果用相同的指示符来做出评估, 则出现问题。 0037 图 4 示出了由估计器针对每个年龄基于脸部图像来做出的年龄估计的结果的示 例。 示图示出了在针对每个年龄对其正确年龄已知的人的年龄估计的结果进行分类的情形 中的 “所估计年龄的标准偏差 ( 变化程度 )” 。水平轴指示对象的正确年龄 ( 真实年龄 ), 而 垂直轴示出估计误差的标准偏差。此处, 正确年龄 ( 真实年龄 ) 是由估计器所估计的年龄 的平均值。 由于年轻人的标准偏差很小, 可以理解, 大多数。

24、估计器将年轻人估计为类似的年 龄。 0038 因此, 如果在年龄估计装置中年轻人的数据被错误地识别为成年人, 则这与人所 感知的结果极大地不同。 0039 此处, 该实施例通过将权重的概念引入到识别设备 14 的学习内容中而获得能够 获得与人的识别结果非常匹配的识别结果的特征抽取。 0040 另外, 识别设备 14 通过不仅利用已加标签的训练数据还通过利用未加标签的训 练数据来创建准确的模型 ( 用于年龄估计的模型 )。 0041 此处, 将参照图 3A 和图 3B 来描述在该实施例中所创建的模型的示例。图 3A 示出 了在识别设备 14 的学习之前 ( 初始状态 ) 的模型的数据分布。如图 。

25、3A 所示, 在学习之前 的模型包括两种类型的数据, 其已加标签的训练数据和未加标签的训练数据, 并且, 这些数 据被边界分开。即, 在图 3A 中, 在 a 的范围内的未加标签训练数据被分类为由菱形所指示 的已加标签的训练数据, 而在 b 的范围内的未加标签训练数据被分类为由圆圈所指示的已 加标签的训练数据。在该实施例中, 例如通过将稍后描述的半指导学习, 在图 3A 中所示的 模型被转换成在图 3B 中所示的准确模型。与在图 3A 中所示的模型相比, 在图 3B 中所示的 模型的边界被变形, 并且, 在 a 的范围内的未加标签的训练数据被分类为由圆圈所指示的 已加标签的训练数据, 并且, 。

26、在 b 的范围内的未加标签的训练数据被分类为由菱形所指示 的已加标签的训练数据。 0042 以下, 将描述通过不仅利用已加标签的训练数据还利用未加标签的训练数据的半 指导学习的年龄估计方法。 该方法是未加标签的训练数据被用于内核函数的正规化最小二 乘的方法 ( 将权重指派给内核函数的正规化最小二乘的方法, 内核正规化加权最小二乘 : KRWLS), 并且, 有效地使用整个训练数据的示图和副本 (manifold) 的结构。该方法意欲通 过利用诸如示图和副本的结构(将稍后描述的表达式(3)之类的信息来平滑回归模型, 从 而提高年龄估计的准确度。另外, 年龄的权重被在最小二乘中考虑。从这种特点来看。

27、, 该方 法可被称为是半指导内核正规化加权最小二乘 (SKRWLS)。 0043 此处, 所考虑的问题是预测测试数据的真实年龄 y*的半指导学习, 测试数据为特 征向量 x 的抽取源, 其中, 在应用一个已加标签训练数据 (xi, yi)xi是示例性变量 ( 脸部特 征 ), yi是客观变量 ( 年龄 ), i 是 1 到 l 和 u 个未加标签训练数 据 (xi)xi是示例性变量 ( 脸部特征 ), i 是 1+l 到 l+u 的条件下, y* f(x)。在该实施例中, 年龄估计函数 f(x) 由正定内核 k(x, x ) 的线性组合建模。这 由以下的表达式 (1) 来表达。表达式 (1) 。

28、是用于输出确定的年龄的表达式。该年龄是通过 在学习 ( 将稍后描述其细节 ) 期间获得最佳解并然后将所获得的最佳解带入表达式 (1) 中 来输出的。 说 明 书 CN 102422323 A CN 102422335 A5/8 页 8 0044 0045 在训练数据的数值 l 或 u 很大的情形中, 可使用内核函数 k(xi, x)i 是 1 到 l+u 的子集而非其全部。在识别设备 14 中, 对由以下表达式 (2)( 带有 l+u 行和 1 列的具有 a1 到 al+u分量的矩阵 ) 所示的参数的学习被执行, 使得以下的表达式 (3) 被最小化。表达式 (3) 是定义误差 ( 处罚 ) 的。

29、表达式。该实施例意欲最小化误差 ( 处罚 )。 0046 (1, l+u)T (2) 0047 0048 0049 w(y) 是加权函数, 是 Rn的欧几里得范数 0050 在表达式 (3) 中的 ( 0) 是正规化参数, 其用于防止过度拟合 (overfitting) 而引入, 并且, 表达式(3)的第二个项是用于防止过度拟合的校正项(用于计算所获得的参 数的大小的项 )。在表达式 (3) 中的第一项是用于计算训练数据的年龄识别误差的项。在 表达式 (3) 中的第三项是用于计算即便两个数据 ( 已加标签或未加标签的数据 ) 之间的距 离很小也将大处罚应用到其间具有很大差异的两个年龄时的误差值。

30、的项 ( 即, 该项用于执 行学习使得当两个数据之间的距离很小时两个年龄之间的差异被减小 )。 0051 在表达式 (3) 中的 ( 0) 是用于调整年龄估计函数 f(x) 的平滑的参数。 0052 在表达式 (3) 中的 Wi, j表达 xi和 xj之间的近似程度 (Wi, j随着两个数据间的距离 的减少而增加 )。Wi, j的示例通过以下的表达式 (4) 来示出。 0053 0054 在表达式 (3) 中的加权函数 w(y) 是表达针对每个年龄的所估计年龄误差的严重 程度的函数。w(y) 的值 ( 权重 ) 越大, 所估计的年龄的误差越严重。 0055 在表达式 (3) 中的最佳解可通过以。

31、下表达式 (5) 来获得。 说 明 书 CN 102422323 A CN 102422335 A6/8 页 9 0056 最佳解 0057 0058 K 具有 k(xi, xj) 作为 (i, j) 分量的内核矩阵 0059 KT K 的转置矩阵 0060 D 当 1 i I 时, 具有作为 (i, i) 对角线分量, 并当 I i I+u 时, 具有 0 作为 (i, i) 对角线分量的 I+u 维对角矩阵 0061 L 具有 Lij作为 (i, j) 分量的拉普拉斯矩阵 0062 0063 是克罗内克增量 ) 0064 II+u I+u 维单位矩阵 0065 y 当 1 i I 时具有 。

32、yi作为 i 分量并当 I i I+u 时具有 0 作为 i 分量 的 I+u 维向量 0066 在训练数据的数量 I+u 很大的情形中, 由于对在表达式 (5) 中的加括号部分的计 算是困难的, 因此, 最佳解可通过减少所使用的内核函数的数量或通过梯度方法来执行数 值计算来获得。 0067 通过利用通过表达式 (5) 所获得的最佳解作为参数, 新近输入到年龄估计装置 10 的 m- 测试数据的年龄被预测。此处, 测试数据及其真实年龄被按以下表达。 0068 测试数据 0069 测试数据的真实年龄 0070 根据以下的表达式 (6), 基于加权均方误差 (WMSE), 做出对一般化能力的评估。。

33、表 达式 (6) 是定义测试数据的误差的表达式 ( 计算测试数据的误差的表达式 )。 0071 0072 在确定在维度压缩器 11 中的特征抽取方法和确定识别设备 14 的类型时, 通过利 用学习数据和测试数据来执行 N 倍交叉验证和留一交叉验证, 评估基于表达式 (6) 的 WMSE 来做出, 并且, 获得在测试数据中的最高准确度的方法和类型 ( 导致最小误差的方法和类 型 ) 被选择。 0073 此处, 将描述实验的示例, 其中, 已加标签的训练数据的数量 I 是 200, 未加标签的 训练数据的数量 u 是 5000, 测试数据的数量 m 是 1500, 以及每个年龄组的数据数量近似被 。

34、均衡。此处, 所考虑的情形是在以下表达式 (7) 中所示的高斯内核被用作内核函数的情形。 内核宽度 和正规化参数 和 被确定, 使得测试误差变为最小。 0074 0075 例如, 图 2 示出了利用通过此处以下的三种方法所获得的 200 个已加标签训练数 据和随机获得的 5000 个未加标签训练数据关于女性的脸部特征向量集合所执行的指导学 说 明 书 CN 102422323 A CN 102422335 A7/8 页 10 习 ( 仅利用已加标签的训练数据的学习 ) 和半指导学习 ( 利用已加标签的训练数据和未加 标签的训练数据的学习 ) 的结果。三种方法如下述。 0076 LR : 随机获。

35、得已加标签的训练数据 0077 LC1 : 通过利用PCA执行到四维水平的维度减少之后计算200个簇来获得已加标签 的训练数据 0078 LC2 : 通过利用PCA执行到十维水平的维度减少之后计算200个簇来获得已加标签 的训练数据 0079 参照图 2, 在指导学习仅通过利用由三种方法 (LR、 LC1 和 LC2) 来获得的三种类型 的训练数据来执行的情形中, 利用由 LC2 所获得的训练数据的学习示出了最优效果。 0080 另外, 图 2 示出了在半指导学习被执行的情形中, 其中, 除了上述各自已加标签的 训练数据之外, 还是用了未加标签的训练数据, 与指导学习的结果相比, 其结果被改善。

36、了。 0081 这说明包括如下步骤的方法是最有效的方法 : 通过分簇来获得少量已加标签的训 练数据, 并且, 利用未加标签的训练数据组合已加标签的训练数据执行半指导学习。 0082 通过这种方式, 在该实施例中, 通过利用已加标签的训练数据组合未加标签的训 练数据并且利用 WMSE 作为评估标准, 输出与人感知的年龄非常匹配的特征抽取方法和识 别设备被选择。 0083 由于特征抽取方法和识别设备被选择, 使得输出与人感知的年龄非常匹配的输出 年龄, 根据该实施例的年龄估计装置可输出与人的感知非常匹配的估计结果。 另外, 由于利 用识别设备 ( 其中, 与人的感知非常匹配的学习被执行 ) 年龄被。

37、估计, 因此, 可估计与感知 年龄非常匹配的年龄。 0084 在前述实施例中, 使用基于实际测量数据的加权函数。 但是, 人工做出的加权函数 可被应用到表达式 (3)、 (5) 和 (6)。另外, 在前述实施例中, 仅使用了一个加权函数。但是, 可使用多于一个加权函数。通过这种方式, 年龄的权重及其估计的准确度希望可被提高和 增加。因此, 可提高所希望的年龄的估计准确度。 0085 参照实施例, 描述了本发明。但是, 本发明并不限于上述实施例。在本申请的发明 的范围内, 可做出各种变更。 0086 在前述实施例中的操作还可被硬件、 软件或其复合结果所执行。 0087 在处理通过软件实施的情形中。

38、, 处理可通过将记录处理序列的程序安装到结合在 专用硬件中的计算机的存储器中来实施。可替换地, 处理可通过将程序安装到能够执行各 种处理的通用计算机中来实施。 0088 例如, 程序可被初步记录在用作记录介质的硬盘和只读存储器 (ROM) 中。可替换 地, 程序可被临时或永久地存储 ( 记录 ) 在可移动记录介质中, 诸如, 紧致盘只读存储器 (CD-ROM)、 磁光 (MO) 盘、 数字通用盘 (DVD)、 磁盘, 以及半导体存储器。 0089 除了将程序安装到来自前述可移动记录介质的计算机中以外, 程序可从下载站点 无线地被转移。可替换地, 程序可经由诸如局域网 (LAN) 和因特网之类的。

39、网络有线地转移。 计算机可接收所转移的程序, 并且, 可将程序安装到诸如集成了硬盘的记录介质中。 0090 以上, 参照实施例描述了本申请的发明。但是, 本申请的发明并不限于上述实施 例。在本申请的发明的范围内, 可在发明的配置和细节中做出可被本领域技术人员所理解 的各种变更。 说 明 书 CN 102422323 A CN 102422335 A8/8 页 11 0091 该申请要求 2009 年 4 月 28 递交的日本专利申请 No.2009-109680 的优先权。日 本专利申请的整个主题内容通过引用被结合于此。 0092 参考标号说明 0093 10 年龄估计装置 0094 11 维度压缩器 0095 12 分簇设备 0096 13 加标签设备 0097 14 识别设备 说 明 书 CN 102422323 A CN 102422335 A1/4 页 12 图 1 图 2 说 明 书 附 图 CN 102422323 A CN 102422335 A2/4 页 13 图 3 说 明 书 附 图 CN 102422323 A CN 102422335 A3/4 页 14 图 4 说 明 书 附 图 CN 102422323 A CN 102422335 A4/4 页 15 图 5 说 明 书 附 图 CN 102422323 A 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1