《姿势估计装置、姿势估计方法以及姿势估计程序.pdf》由会员分享,可在线阅读,更多相关《姿势估计装置、姿势估计方法以及姿势估计程序.pdf(37页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 (43)申请公布日 (21)申请号 201380039239.3 (22)申请日 2013.06.04 2012-165671 2012.07.26 JP G06T 7/60(2006.01) G01B 11/00(2006.01) (71)申请人 松下电器产业株式会社 地址 日本大阪府 (72)发明人 川口京子 岩井和彦 (74)专利代理机构 北京市柳沈律师事务所 11105 代理人 邸万奎 (54) 发明名称 姿势估计装置、 姿势估计方法以及姿势估计 程序 (57) 摘要 能够对具有成对的部位的多关节物体的姿势 高精度地进行估计的姿势估计装置。在该装置 中, 候选区域提。
2、取单元 (110) 使用共同特征量, 从图像中提取多个候选区域。部位区域提取单 元 (120) 划分部位的似然较高的部位区域和除此 以外的第二部位的候选区域。特征量计算单元 (130) 对部位区域以及第二部位的候选区域的每 一个计算固有特征量。特征量校正单元 (140) 将 部位区域以及第二部位的候选区域中的、 任意一 方的候选区域的固有特征量, 基于另一方的候选 区域的长度、 宽度、 以及角度中的至少一个进行校 正。判定单元 (150) 基于校正后的固有特征量和 另一方的候选区域的固有特征量之间的相似度, 判定部位区域和第二部位的候选区域是否为成对 的部位。 (30)优先权数据 (85)PC。
3、T国际申请进入国家阶段日 2015.01.23 (86)PCT国际申请的申请数据 PCT/JP2013/003509 2013.06.04 (87)PCT国际申请的公布数据 WO2014/017006 JA 2014.01.30 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书20页 附图14页 (10)申请公布号 CN 104487999 A (43)申请公布日 2015.04.01 CN 104487999 A 1/2 页 2 1.姿势估计装置, 基于包含具有成对的部位的多关节物体的全部或一部分的图像, 估 计所述成对的部位, 包括。
4、 : 候选区域提取单元, 从所述图像中, 使用对于所述成对的部位表示未指定多个多关节 物体共同的形状特征的共同特征量, 提取多个所述成对的部位的候选区域 ; 部位区域提取单元, 从所述多个候选区域中, 提取作为所述成对的部位的似然为最大 的第一候选区域, 并将所述第一候选区域以外的区域作为第二候选区域 ; 特征量计算单元, 分别对于所述第一候选区域以及所述第二候选区域, 计算对于所述 成对的部位表示估计对象的多关节物体上固有的特征的固有特征量 ; 特征量校正单元, 将所述第一候选区域以及所述第二候选区域中的、 一方的候选区域 的固有特征量, 基于另一方的候选区域的长度、 宽度、 以及角度中的至。
5、少一个进行校正 ; 以 及 判定单元, 基于所述校正后的固有特征量和所述另一方的候选区域的固有特征量之间 的相似度, 判定所述第一候选区域和所述第二候选区域是否为所述成对的部位。 2.如权利要求 1 所述的姿势估计装置, 所述特征量校正单元 计算所述第一候选区域的固有特征量和所述第二候选区域的固有特征量之间的相似 度, 基于所述算出的相似度, 判断是否存在能够估计为与所述第一候选区域成对的所述第 二候选区域, 在所述判断的结果不存在能够估计为与所述第一候选区域成对的所述第二候选区域 的情况下, 进行所述一方的候选区域的固有特征量的校正。 3.如权利要求 1 所述的姿势估计装置, 所述特征量校正。
6、单元将所述第一候选区域的固有特征量, 基于所述第二候选区域的长 度、 宽度、 以及角度中的至少一个进行校正。 4.如权利要求 1 所述的姿势估计装置, 所述特征量校正单元 提取距基准点的距离短的第一交点和距所述基准点的距离长的第二交点, 作为所述第 二候选区域的长轴和椭圆周之间的交点, 基于在有可能存在其他部位的区域中是否包含所述第一交点以及所述第二交点, 判断 所述第二候选区域被所述其他部位遮挡的可能性, 在有被遮挡的可能性的情况下, 提取所述第一候选区域的一部分, 对于提取出的所述第一候选区域的一部分, 进行固有特征量的计算。 5.如权利要求 1 所述的姿势估计装置, 所述特征量校正单元 。
7、判断所述第一候选区域和所述第二候选区域形成的角度是否为 0 度, 在所述角度不是 0 度的情况下, 使用所述角度, 使所述第一候选区域的一部分或全部 转动。 6.如权利要求 1 所述的姿势估计装置, 所述特征量校正单元 权 利 要 求 书 CN 104487999 A 2 2/2 页 3 比较所述第一候选区域的长轴的长度和所述第二候选区域的长轴的长度, 在所述长轴的长度之差小于规定的值的情况下, 或者, 在所述长轴的长度相等的情况 下, 与所述第二候选区域的长轴的长度相对所述第一候选区域的长轴的长度的比率相匹配 来缩小所述第一候选区域, 对于缩小后的所述第一候选区域, 进行固有特征量的计算。 。
8、7.如权利要求 1 所述的姿势估计装置, 所述候选区域提取单元基于对所述成对的部位的特性预先确定的限制信息, 提取所述 多个候选区域。 8.如权利要求 1 所述的姿势估计装置, 所述共同特征量只是边缘, 或者是边缘以及轮廓。 9.如权利要求 1 所述的姿势估计装置, 所述固有特征量是颜色以及纹理中的至少一个。 10.姿势估计方法, 基于包含具有成对的部位的多关节物体的全部或一部分的图像, 估 计所述成对的部位, 该方法包括以下步骤 : 从所述图像中, 使用对于所述成对的部位表示未指定多个多关节物体共同的形状特征 的共同特征量, 提取多个所述成对的部位的候选区域的步骤 ; 从所述多个候选区域中,。
9、 提取作为所述成对的部位的似然为最大的第一候选区域, 并 将所述第一候选区域以外的区域作为第二候选区域的步骤 ; 分别对于所述第一候选区域以及所述第二候选区域, 计算对于所述成对的部位表示估 计对象的多关节物体上固有的特征的固有特征量的步骤 ; 将所述第一候选区域以及所述第二候选区域中的、 一方的候选区域的固有特征量, 基 于另一方的候选区域的长度、 宽度、 以及角度中的至少一个进行校正的步骤 ; 以及 基于所述校正后的固有特征量和所述另一方的候选区域的固有特征量之间的相似度, 判定所述第一候选区域和所述第二候选区域是否为所述成对的部位的步骤。 11.姿势估计程序, 使基于包含具有成对的部位的。
10、多关节物体的全部或一部分的图像, 估计所述成对的部位的装置的计算机执行以下处理 : 从所述图像中, 使用对于所述成对的部位表示未指定多个多关节物体共同的形状特征 的共同特征量, 提取多个所述成对的部位的候选区域的处理 ; 从所述多个候选区域中, 提取作为所述成对的部位的似然为最大的第一候选区域, 并 将所述第一候选区域以外的区域作为第二候选区域的处理 ; 分别对于所述第一候选区域以及所述第二候选区域, 计算对于所述成对的部位表示估 计对象的多关节物体上固有的特征的固有特征量的处理 ; 将所述第一候选区域以及所述第二候选区域中的、 一方的候选区域的固有特征量, 基 于另一方的候选区域的长度、 宽。
11、度、 以及角度中的至少一个进行校正的处理 ; 以及 基于所述校正后的固有特征量和所述另一方的候选区域的固有特征量之间的相似度, 判定所述第一候选区域和所述第二候选区域是否为所述成对的部位的处理。 权 利 要 求 书 CN 104487999 A 3 1/20 页 4 姿势估计装置、 姿势估计方法以及姿势估计程序 技术领域 0001 本发明涉及对具有成对的部位的多关节物体的姿势进行估计的姿势估计装置、 姿 势估计方法、 以及姿势估计程序。 背景技术 0002 近年来, 一直在积极地开展与基于拍摄到的运动图像的图像数据的人的姿势估计 相关的研究。姿势估计装置能够利用计算机分析从运动图像来判定人的行。
12、为, 能够不依赖 于人工进行行为分析。作为行为分析的适用应用, 例如, 有街头中的异常行为检测、 商店中 的购买行为分析、 工厂中的作业效率辅助、 以及运动中的姿势 (form) 指导。 0003 在估计人的姿势的情况下, 例如, 期望可进行部位的姿势的估计。这里, 部位表示 多关节物体的结构要素(例如, 头部、 躯干、 胳膊、 腿等)。 此外, 部位的姿势表示人的姿势中 的部位的位置或角度。 人因动作而改变部位的姿势, 所以如果能够估计部位的位置, 则可进 行该人在干什么、 今后要干什么这样的动作的估计等。 0004 这样的人的姿势估计, 最好在人上不安装方位传感器等装置。因为在人上安装装 。
13、置的估计方法, 难以将未指定的人作为估计对象, 在估计对象为多个的情况下, 花费成本。 0005 因此, 例如在专利文献 1 中记载了基于拍摄到的人的视频, 估计该人的姿势的技 术。 0006 专利文献 1 中记载的技术 ( 以下, 称为 “现有技术 1” ), 从拍摄视频求人物轮廓 (silhouette) 的重心, 计算从重心到人物轮廓的轮廓线上的各点为止的距离, 并检测从重 心延伸到上方的垂直轴, 将与人物轮廓的轮廓线的交点作为头顶点。而且, 现有技术 1 中, 搜索以头顶点为始点并逆时针转动地算出的距离为极大的点, 将第一极大的点判定为右手 的前端, 将第二极大点判定为右腿、 左腿、 。
14、左手的前端。根据这种现有技术 1, 能够在人上不 安装方位传感器等装置而估计人的姿势。 0007 此外, 例如在专利文献 2 中记载了基于拍摄到人的图像, 估计该人的姿势的技术。 0008 专利文献 2 中记载的技术 ( 以下, 称为 现有技术 2 ), 在蓝色的背景中, 拍摄穿着 蓝色以外的颜色、 并且每个部位颜色不同的衣服的人。由此, 现有技术 2 从背景图像和人物 图像之间的颜色信息的差异获取人物轮廓, 从衣服的颜色信息检测人的部位。如果采用这 种现有技术 2, 能够在人上不安装方位传感器等装置而估计人的姿势。 0009 现有技术文献 0010 专利文献 0011 专利文献 1 : ( 。
15、日本 ) 专利第 3400961 号公报 0012 专利文献 2 : ( 日本 ) 特开 2005-339100 号公报 发明内容 0013 发明要解决的问题 0014 但是, 现有技术 1 以及现有技术 2, 因拍摄条件而存在无法高精度地估计人的姿势 说 明 书 CN 104487999 A 4 2/20 页 5 的课题。因为现有技术 1 在双臂、 双脚彼此交差, 并且胳膊或腿与躯干体重合的情况下, 在 人物轮廓内胳膊或腿重合, 所以无法估计胳膊或腿的姿势。此外, 现有技术 2 如果不以特定 的背景以及特定的衣服来拍摄人, 就无法检测人的部位。 0015 本发明的目的在于, 高精度地估计具有。
16、成对的部位的多关节物体的姿势。 0016 解决问题的方式 0017 本发明的一方式的姿势估计装置, 基于包含具有成对的部位的多关节物体的全部 或一部分的图像, 估计所述成对的部位, 包括 : 候选区域提取单元, 从所述图像中, 使用对于 所述成对的部位表示未指定多个多关节物体共同的形状特征的共同特征量, 提取多个所述 成对的部位的候选区域 ; 部位区域提取单元, 从所述多个候选区域中, 提取作为所述成对 的部位的似然为最大的第一候选区域, 并将所述第一候选区域以外的区域作为第二候选区 域 ; 特征量计算单元, 分别对于所述第一候选区域以及所述第二候选区域, 计算对于所述成 对的部位表示估计对象。
17、的多关节物体上固有的特征的固有特征量 ; 特征量校正单元, 将所 述第一候选区域以及所述第二候选区域中的、 一方的候选区域的固有特征量, 基于另一方 的候选区域的长度、 宽度、 以及角度中的至少一个进行校正 ; 以及判定单元, 基于所述校正 后的固有特征量和所述另一方的候选区域的固有特征量之间的相似度, 判定所述第一候选 区域和所述第二候选区域是否为所述成对的部位。 0018 本发明的一方式的姿势估计方法, 基于包含具有成对的部位的多关节物体的全部 或一部分的图像, 估计所述成对的部位, 该方法包括以下步骤 : 从所述图像中, 使用对于所 述成对的部位表示未指定多个多关节物体共同的形状特征的共。
18、同特征量, 提取多个所述成 对的部位的候选区域的步骤 ; 从所述多个候选区域中, 提取作为所述成对的部位的似然为 最大的第一候选区域, 并将所述第一候选区域以外的区域作为第二候选区域的步骤 ; 分别 对于所述第一候选区域以及所述第二候选区域, 计算对于所述成对的部位表示估计对象的 多关节物体上固有的特征的固有特征量的步骤 ; 将所述第一候选区域以及所述第二候选区 域中的、 一方的候选区域的固有特征量, 基于另一方的候选区域的长度、 宽度、 以及角度中 的至少一个进行校正的步骤 ; 以及基于所述校正后的固有特征量和所述另一方的候选区域 的固有特征量之间的相似度, 判定所述第一候选区域和所述第二候。
19、选区域是否为所述成对 的部位的步骤。 0019 本发明的一方式的姿势估计程序, 使基于包含具有成对的部位的多关节物体的全 部或一部分的图像, 估计所述成对的部位的装置的计算机执行以下处理 : 从所述图像中, 使 用对于所述成对的部位表示未指定多个多关节物体共同的形状特征的共同特征量, 提取多 个所述成对的部位的候选区域的处理 ; 从所述多个候选区域中, 提取作为所述成对的部位 的似然为最大的第一候选区域, 并将所述第一候选区域以外的区域作为第二候选区域的处 理 ; 分别对于所述第一候选区域以及所述第二候选区域, 计算对于所述成对的部位表示估 计对象的多关节物体上固有的特征的固有特征量的处理 ;。
20、 将所述第一候选区域以及所述第 二候选区域中的、 一方的候选区域的固有特征量, 基于另一方的候选区域的长度、 宽度、 以 及角度中的至少一个进行校正的处理 ; 以及基于所述校正后的固有特征量和所述另一方的 候选区域的固有特征量之间的相似度, 判定所述第一候选区域和所述第二候选区域是否为 所述成对的部位的处理。 0020 发明的效果 说 明 书 CN 104487999 A 5 3/20 页 6 0021 根据本发明, 能够高精度地估计具有成对的部位的多关节物体的姿势。 附图说明 0022 图 1 是表示本发明的实施方式 1 的一例姿势估计装置的结构的框图。 0023 图 2 是表示本发明的实施。
21、方式 2 的一例姿势估计系统的结构的系统结构图。 0024 图 3 是表示本发明的实施方式 2 中的一例身体模型的图。 0025 图 4 是表示本发明的实施方式 2 的姿势估计装置的一例动作的流程图。 0026 图 5 是表示本发明的实施方式 2 中的一例候选区域提取处理的流程图。 0027 图 6 是表示本发明的实施方式 2 中的一例边缘对似然映射图生成处理的流程图。 0028 图 7 是用于说明本发明的实施方式 2 中的边缘对似然映射图生成处理的图。 0029 图 8 是用于说明本发明的实施方式 2 中的极大值的图。 0030 图 9 表示本发明的实施方式 2 中的一例特征量校正处理的流程。
22、图。 0031 图 10 表示本发明的实施方式 2 中的一例人的姿势的图。 0032 图 11 表示本发明的实施方式 2 中的一例特征量算出区域提取处理的流程图。 0033 图 12 表示本发明的实施方式 2 中的一例人的姿势的图。 0034 图 13 表示本发明的实施方式 2 中的一例无法正确计算固有特征量的情况下的图 像和其直方图的图。 0035 图 14 表示本发明的实施方式 2 中的一例无法正确计算固有特征量的情况下的直 方图的图。 0036 图 15 表示本发明的实施方式 2 中的一例无法正确计算固有特征量的情况下的直 方图的图。 具体实施方式 0037 以下, 关于本发明的各实施方。
23、式, 参照附图详细地说明。 0038 ( 实施方式 1) 0039 本发明的实施方式 1 是一例本发明的基本方式。 0040 图 1 是表示一例本实施方式的姿势估计装置的结构的框图。 0041 在图 1 中, 姿势估计装置 100 包括候选区域提取单元 110、 部位区域提取单元 120、 特征量计算单元 130、 特征量校正单元 140、 以及判定单元 150。 0042 再有, 本实施方式的姿势估计装置 100 对构成多关节物体的 “成对的部位” 的姿势 进行估计。这里,“部位” 是多关节物体的结构要素。此外,“部位的姿势” 意味着部位的位 置或角度。 0043 候选区域提取单元 110 。
24、从包含作为估计对象的多关节物体的一部分或全部的图 像中, 使用共同特征量, 提取多个估计对象部位的候选区域。 “共同特征量” 表示对于成对的 部位在未指定多个多关节物体中共同的形状的特征 ( 例如, 仅边缘、 或者边缘以及轮廓 )。 此外, 这里提取出的候选区域有包含存在噪声的候选区域的情况。再有,“估计对象部位” 是 部位的姿势的估计对象, 是成对的部位。 此外, 将成对的部位中的、 一方的部位称为 “第一部 位” , 将另一方的部位称为 “第二部位” 。 例如, 成对的部位是小臂的情况下, 将右小臂称为第 一部位, 将左小臂称为第二部位。 说 明 书 CN 104487999 A 6 4/。
25、20 页 7 0044 再有, 上述 “对于成对的部位在未指定多个多关节物体中共同的形状” , 例如由多 关节物体中的部位的可能存在范围、 或者部位的大小、 长度、 粗细、 或截面的形状、 拍摄多关 节物体的角度确定。 有关这样的部位的、 可能存在范围、 大小、 长度、 粗细、 截面的形状、 或拍 摄多关节物体的角度, 作为多关节物体的限制信息而被预先确定。 因而, 候选区域提取单元 110也可以基于上述限制信息提取候选区域。 由此, 候选区域提取单元110能够将估计对象 部位即可能性 ( 似然 ) 为最高的区域作为候选区域提取。 0045 部位区域提取单元 120 将在候选区域提取单元 11。
26、0 提取出的多个候选区域之中 的、 估计对象部位即似然为最高的区域, 作为第一部位的候选区域 ( 第一候选区域的一例 子 ) 提取。这里, 将第一部位的候选区域称为 “部位区域” 。另一方面, 将部位区域以外的候 选区域称为 “第二部位的候选区域” ( 第二候选区域的一例子 )。第二部位的候选区域也有 存在多个的情况。 0046 特征量计算单元 130 对于部位区域提取单元 120 中提取出的、 部位区域以及第二 部位的候选区域的各个区域, 计算固有特征量。这里算出的 “固有特征量” 表示对于成对的 部位在估计对象的多关节物体的个体中固有的特征 ( 例如, 颜色以及纹理中的至少一个 )。 00。
27、47 特征量校正单元 140 对于特征量计算单元 130 中算出的、 部位区域以及第二部位 的候选区域之中的任意一方的候选区域的固有特征量, 基于另一方的候选区域的长度、 宽 度、 以及角度中的至少一个进行校正 ( 再计算 )。即, 特征量校正单元 140 对部位区域的固 有特征量, 基于第二部位的候选区域的长度、 宽度、 以及角度中的至少一个进行校正。 或者, 特征量校正单元 140 对第二部位的候选区域的固有特征量, 基于部位区域的长度、 宽度、 以 及角度中的至少一个进行校正。前者的校正方法对似然较高的候选区域进行校正, 以使其 与似然较低的候选区域相匹配, 所以与从似然较低的候选区域对。
28、似然较高的候选区域的特 征量进行估计的后者的校正方法相比, 估计的精度提高。 0048 再有, 在第二部位的候选区域有多个的情况下, 特征量校正单元 140 对部位区域 和第二部位的候选区域的每个对进行固有特征量校正。 0049 此外, 特征量校正单元 140 在进行上述固有特征量的校正前, 也可以进行以下的 处理。首先, 特征量校正单元 140 计算在特征量计算单元 130 中算出的、 部位区域的固有特 征量和第二部位的候选区域的固有特征量之间的相似度。接着, 特征量校正单元 140 基于 算出的相似度, 判断是否存在能够估计为与部位区域成对的第二部位的候选区域。该判断 的结果, 在不存在能。
29、够估计为与部位区域成对的第二部位的候选区域的情况下, 特征量校 正单元 140 进行上述固有特征量的校正。 0050 判定单元150基于特征量校正单元140中校正后的固有特征量和另一方的候选区 域的固有特征量之间的相似度 ( 例如, 余弦相似度 ), 判定部位区域和第二部位的候选区域 是否为成对的部位。根据该判定, 估计部位的姿势。 0051 姿势估计装置 100 例如具有 CPU(Central Processing Unit ; 中央处理器 )、 存 储了控制程序的 ROM(Read Only Memory ; 只读存储器 ) 等的存储介质、 以及 RAM(Random Access Me。
30、mory ; 随机存取存储器 ) 等的工作用存储器。这种情况下, 上述各构成单元的功 能通过 CPU 执行控制程序来实现。 0052 具备这样的结构的姿势估计装置 100 具有以下的效果。 0053 在估计未指定多个多关节物体的姿势的情况下, 由于事先难以掌握各多关节物体 说 明 书 CN 104487999 A 7 5/20 页 8 为什么样的衣服或颜色, 所以一般是使用共同特征量(例如, 边缘、 轮廓、 轮廓等)进行部位 的估计。 在这样的部位的估计中, 在某个部位的周围没有其他部位的情况下, 由于仅该部位 的边缘信息被提取, 所以部位的估计比较容易。但是, 在进行部位的估计时, 假定在某。
31、个部 位的周围有其他部位的情况。即, 例如, 在某个部位的背后有其他部位的情况下, 由于不仅 某个部位, 而且位于其背后的其他部位的边缘信息也一并获取, 所以难以进行部位的估计。 而且, 在某个部位被其他部位遮挡的情况下, 图像上可看见的面积变少, 仅用上述共同特征 量, 难以进行部位的估计。 0054 在另一方面, 一般地, 在具有成对的部位的多关节物体中, 大多被认为成对的部位 的衣服、 颜色、 质感是相同的。例如, 在人的情况下, 右腿和左腿穿着单一的衣服, 所以能够 假定为成为相同的颜色, 右臂和左臂也大多被认为是相同花纹的衣服。 0055 因此, 姿势估计装置 100 首先使用共同特。
32、征量, 从图像中提取多个候选区域, 并分 成部位区域和第二部位的候选区域。接着, 姿势估计装置 100 分别对于部位区域以及第二 部位的候选区域计算固有特征量。接着, 姿势估计装置 100 对部位区域以及第二部位的候 选区域之中的、 任意一方的候选区域的固有特征量, 基于另一方的候选区域的长度、 宽度、 以及角度中的至少一个进行校正。接着, 姿势估计装置 100 基于校正后的固有特征量和另 一方的候选区域的固有特征量之间的相似度, 判定部位区域和第二部位的候选区域是否为 成对的部位。通过这样的动作, 即使在第二部位的候选区域的周围有其他部位的候选区域 的情况下, 姿势估计装置 100 也可缩窄。
33、第二部位的候选区域。因此, 即使在难以估计成对的 部位的一方的姿势的情况下, 甚至即使在事前该部位的颜色以及纹理的至少一方不明的情 况下, 姿势估计装置 100 也可高精度地估计具有成对的部位的多关节物体的姿势。 0056 ( 实施方式 2) 0057 本发明的实施方式 2 是将本发明适用于输入拍摄图像、 估计在该拍摄图像中包含 的人的姿势的装置的情况下的本发明的具体方式的一例子。 0058 首先, 说明包含本实施方式的姿势估计装置的姿势估计系统的概要。 0059 图 2 是表示一例本实施方式中的姿势估计系统的结构的系统结构图。在图 2 中, 姿势估计系统200具有对拍摄区域310进行拍摄的摄。
34、像机320、 以及与摄像机320可通信地 连接的姿势估计装置 100。摄像机 320 例如是数码摄像机, 对拍摄区域 310 从斜上方拍摄。 即, 摄像机 320 拍摄的图像是拍摄包含人 340 以及水平的地面 330 的实际空间所得的图像。 而且, 摄像机 320 将拍摄视频的视频数据发送到姿势估计装置 100。这里, 将拍摄区域 310 的地面 330 假设为作为姿势估计的对象的人 340 在步行的地面。 0060 姿势估计装置100例如是个人计算机, 基于从摄像机320接收到的视频数据, 估计 人 340 的姿势。 0061 通过以上, 结束有关姿势估计系统 200 的概要的说明。 00。
35、62 接着, 说明有关在本实施方式中作为估计的对象的人 340 的姿势。 0063 图 3 是表示一例人 340 的身体的结构模型 ( 以下称为 身体模型 )410 的图。身 体模型 410 是示意地表示用于姿势估计的身体的各部位的位置关系的模型。身体模型 410 至少包含躯干 411、 左大腿 412、 左小腿 413、 左脚 414、 右大腿 415、 右小腿 416、 右脚 417、 以 及头 418、 右大臂 419、 右小臂 420、 左大臂 422、 左小臂 423。 0064 这些各部位通过关节连接着。因此, 各部位的可动区域受到其他部位的限制。例 说 明 书 CN 104487。
36、999 A 8 6/20 页 9 如, 左小臂423只能够在以与左大臂422之间的连接点为中心的规定的角度范围内移动。 此 外, 例如在将头 418 和躯干 411 之间的连接点作为基准点时, 以基准点为中心的左小臂 423 的可存在区域 ( 也称为 可能存在范围 ) 受到左小臂 423 的连接源的部位即左大臂 422 和 躯干 411 的部位的物理的长度和可动区域的限制。将这样的多关节物体的构造上的连接关 系、 连接点的可动区域、 部位的长度、 粗细、 形状造成的限制称为限制信息。 0065 在本实施方式中, 除了使用各部位的限制信息表示对人共同的特征的信息以外, 假设姿势估计装置 100 。
37、还使用表示个人的部位的特征的信息, 从图像信息中提取身体模型 410中的各部位的区域的信息。 再有, 姿势估计装置100使用的身体模型不限定于图3所示 的例子。 0066 在身体模型 410 中, 成对的部位是左大腿 412 和右大腿 415、 左小腿 413 和右小腿 416、 左脚 414 和右脚 417、 左大臂 422 和右大臂 419、 左小臂 423 和右小臂 420。再有, 在本 实施方式中, 将成对的部位设为上述组合中的左小臂423和右小臂420的小臂来说明, 但不 限定于此。 0067 通过以上, 结束有关作为估计的对象的人 340 的姿势的说明。 0068 接着, 说明有关。
38、姿势估计装置 100 的结构。 0069 图1是表示一例姿势估计装置100的结构的框图。 本实施方式的姿势估计装置100 的结构与实施方式 1 相同。但是, 在本实施方式中, 将估计对象的多关节物体设为人 340 来 说明, 将成对的部位设为小臂 ( 左小臂 423 和右小臂 420) 来说明。 0070 候选区域提取单元 110 从包含作为估计对象的人的一部分或全部的图像中, 使用 共同特征量, 提取被估计为小臂的多个候选区域。这里所谓的共同特征量表示有关小臂在 未指定人数的人中共同的形状的特征(例如, 仅边缘、 或者边缘以及轮廓)。 再有, 这里所提 取的候选区域包含有干扰的候选区域的情况。
39、, 即, 有包含衣服的图案等被误估计是小臂的 候选区域的情况。 0071 再有, 上述 “有关小臂在未指定人数的人中共同的形状” , 例如根据人 340 中的小 臂的可能存在范围、 或者小臂的大小、 长度或粗细来确定。有关这样的小臂的可能存在范 围、 大小、 长度以及粗细, 作为人的限制信息被预先确定。再有, 人 340 中的小臂的可能存在 范围, 例如也可以用距人 340 上的某个基准点 ( 例如, 头 418 和躯干 411 的连接点 ) 的距离 来确定。而且, 候选区域提取单元 110 也可以基于上述限制信息, 提取候选区域。由此, 候 选区域提取单元 110 能够将是小臂的可能性 ( 。
40、似然 ) 为最高的区域作为候选区域提取。 0072 部位区域提取单元120将在候选区域提取单元110中提取出的多个候选区域之中 的、 是小臂的似然为最高的区域, 作为小臂之中的第一部位的候选区域 ( 第一候选区域的 一例子 ) 提取。这里, 将第一部位的候选区域称为 部位区域 。另一方面, 部位区域以外的 候选区域称为 第二部位的候选区域 ( 第二候选区域的一例子 )。还有存在多个第二部位 的候选区域的情况。 0073 特征量计算单元 130 对于由部位区域提取单元 120 提取出的、 各个部位区域和第 二部位的候选区域, 计算固有特征量。这里所谓的固有特征量表示对于小臂在估计对象的 人 34。
41、0 中固有的特征 ( 例如, 颜色以及纹理中的至少一个 )。 0074 特征量校正单元 140 将特征量计算单元 130 算出的、 部位区域以及第二部位的候 选区域之中任一方的候选区域的固有特征量, 基于另一方的候选区域的长度、 宽度、 以及角 说 明 书 CN 104487999 A 9 7/20 页 10 度中的至少一个进行校正 ( 再计算 )。即, 特征量校正单元 140 将部位区域的固有特征量, 基于第二部位的候选区域的长度、 宽度、 以及角度中的至少一个进行校正。再有, 特征量校 正单元 140 也可以将第二部位的候选区域的固有特征量, 基于部位区域的长度、 宽度、 以及 角度中的至。
42、少一个进行校正。前者的校正方法将似然较高的候选区域进行校正, 以与似然 较低的候选区域相匹配, 与后者的校正方法相比, 估计的精度提高, 因而被优选。 0075 再有, 在第二部位的候选区域有多个的情况下, 特征量校正单元 140 对每个部位 区域和第二部位的候选区域的对, 校正部位区域或第二部位的候选区域的固有特征量。 0076 此外, 特征量校正单元 140 在进行上述固有特征量的校正前, 也可以进行以下的 处理。首先, 特征量校正单元 140 计算由特征量计算单元 130 算出的、 部位区域的固有特 征量和第二部位的候选区域的固有特征量之间的相似度。接着, 特征量校正单元 140 基于 。
43、算出的相似度, 判断是否存在能够估计为与部位区域成对的小臂的第二部位的候选区域。 该判断的结果, 在不存在能够估计为与部位区域成对的小臂的第二部位的候选区域的情况 下, 特征量校正单元 140 进行上述固有特征量的校正。 0077 判定单元150基于由特征量校正单元140校正后的固有特征量和另一方的候选区 域的固有特征量之间的相似度 ( 例如, 余弦相似度 ), 判定部位区域和第二部位的候选区域 是否为成对的小臂。根据该判定, 估计小臂的姿势。 0078 姿势估计装置 100 例如具有 CPU(Central Processing Unit)、 存储了控制程序的 ROM(Read Only M。
44、emory ; 只读存储器)等存储介质、 以及RAM(Random Access Memory ; 随机 存取存储器 ) 等作业用的存储器。这种情况下, 上述各结构单元的功能, 通过 CPU 执行控制 程序来实现。 0079 具备这样的结构的姿势估计装置 100 具有以下的效果。 0080 在估计未指定许多人的姿势的情况下, 由于难以事先掌握各个人为什么样的衣服 或皮肤的颜色, 所以一般采用共同特征量(例如, 边缘、 轮廓、 轮廓等), 进行部位的估计。 在 这样的部位的估计中, 在某个部位的周围没有其他部位的情况下, 仅提取该部位的边缘信 息, 所以部位的估计比较容易。但是, 在进行部位的估。
45、计时, 假定在某个部位的周围有其他 部位的情况。即, 例如, 在左小臂 423 的背后有躯干 411 的情况下, 不仅左小臂 423, 而且躯 干 411 的边缘信息也被一并获取, 所以难以进行左小臂 423 的估计。而且, 还假定某个部位 被其他部位遮挡的情况。即, 例如, 在左小臂 423 的一部分隐藏在躯干 411 中的情况下, 左 小臂 423 在图像上可看见的面积较少, 仅用表示小臂的形状的特征的图像特征量, 难以进 行左小臂 423 的估计。 0081 在另一方面, 一般地, 人的衣服是左右对称的, 在成对的部位的图像上的颜色、 纹 理大多相同。例如, 在人的情况下, 右腿和左腿穿。
46、着单一的裤子, 所以能够假定为相同的长 度、 相同颜色, 并认为右臂和左臂也为相同的花纹、 相同的袖子长度的衣服居多。 0082 因此, 姿势估计装置 100 首先使用共同特征量从图像中提取多个候选区域, 并分 为部位区域和第二部位的候选区域。接着, 姿势估计装置 100 对于部位区域以及第二部位 的候选区域的各个区域, 计算固有特征量。接着, 姿势估计装置 100 将部位区域以及第二部 位的候选区域中的、 任意一方的候选区域的固有特征量, 基于另一方的候选区域的长度、 宽 度、 以及角度中的至少一个进行校正。接着, 姿势估计装置 100 基于校正后的固有特征量和 另一方的候选区域的固有特征量。
47、之间的相似度, 判定部位区域和第二部位的候选区域是否 说 明 书 CN 104487999 A 10 8/20 页 11 为成对的部位。通过这样的动作, 即使在第二部位的候选区域的周围有其他部位 ( 例如躯 干 411) 的候选区域的情况下, 姿势估计装置 100 也可缩窄第二部位的候选区域。因此, 即 使是难以估计小臂一方的姿势的情况下, 并且, 即使是在事先该部位的颜色以及纹理的至 少一方不明的情况下, 姿势估计装置 100 也可高精度地估计具有成对的部位的多关节物体 的姿势。 0083 接着, 说明有关姿势估计装置 100 的动作。图 4 是表示一例姿势估计装置的动作 的流程图。 008。
48、4 首先, 在步骤 S1100 中, 候选区域提取单元 110 进行候选区域提取处理。候选区域 提取处理是提取多个估计对象部位即小臂的候选区域的处理。 0085 这里, 说明有关步骤 S1100 的候选区域提取处理的细节。图 5 是表示一例候选区 域提取处理的动作的流程图。 0086 首先, 在步骤 S1101 的 图像输入 中, 候选区域提取单元 110 从摄像机 320 输入 图像。该图像是拍摄了人 340 的一部分或全部的图像。 0087 接着, 在步骤 S1102 的 近景提取 中, 候选区域提取单元 110 从输入的图像中, 提 取近景区域。具体地说, 候选区域提取单元 110 生成。
49、背景差分图像, 提取近景作为被估计为 人 340 的区域 ( 以下称为 人的候选区域 )。这里, 例如, 背景差分图像是表示在不存在人 340 的状态下拍摄到的背景图像和输入的图像之间的差分的图像。 0088 例如, 背景差分图像将输入的图像和背景图像的像素值不同的像素以白色表现, 将输入图像和背景图像的像素值相同的像素以黑色表现。即, 背景差分图像将人 340 存在 的区域以白色的区域表现, 将人 340 不存在的区域以黑色的区域表现。 0089 接着, 步骤 S1103 的 头提取 中, 候选区域提取单元 110 提取被估计为头 418 的 区域 ( 以下称为 头的候选区域 ), 并计算人 340 的基准点。在本实施方式中, 基准点设为 头 418 和躯干 411 之间的连接点, 但不限于此。 0090 候选区域提取单元 110 提取白色的区域作为人的候选区域, 其中, 。