《图像识别设备及其控制方法.pdf》由会员分享,可在线阅读,更多相关《图像识别设备及其控制方法.pdf(18页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102147856 A (43)申请公布日 2011.08.10 CN 102147856 A *CN102147856A* (21)申请号 201110035718.0 (22)申请日 2011.02.10 2010-028207 2010.02.10 JP G06K 9/00(2006.01) (71)申请人 佳能株式会社 地址 日本东京都大田区下丸子 3 丁目 30 番 2 号 (72)发明人 辻良介 (74)专利代理机构 北京林达刘知识产权代理事 务所 ( 普通合伙 ) 11277 代理人 刘新宇 (54) 发明名称 图像识别设备及其控制方法 (57) 摘要 。
2、本发明涉及一种图像识别设备及其控制方 法。该图像识别设备从要处理的图像中检测特定 被摄体图像, 计算该被摄体图像的被摄体可识别 性状态与登记图像信息中的被摄体的被摄体可识 别性状态之间的一致度, 并且计算该被摄体图像 的图像特征与登记图像信息中的图像特征之间的 类似度。 基于该类似度和一致度, 图像识别设备识 别被摄体图像的被摄体是否是登记图像信息的被 摄体。 当类似度低于第一阈值、 并且一致度等于或 高于第二阈值时, 图像识别设备识别出被摄体图 像的被摄体不同于登记图像信息的被摄体。 (30)优先权数据 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利。
3、要求书 2 页 说明书 9 页 附图 6 页 CN 102147858 A1/2 页 2 1. 一种图像识别设备, 用于在输入图像中识别被摄体, 所述图像识别设备包括 : 数据库, 在所述数据库中, 与被摄体的标识相关联地登记有通过对所述被摄体进行 摄像所获得的图像或图像特征、 以及所述被摄体的被摄体可识别性状态, 作为登记图像信 息 ; 第一计算部件, 用于计算所输入的被摄体图像的被摄体可识别性状态与所述登记图像 信息中的被摄体可识别性状态之间的一致度 ; 第二计算部件, 用于计算所输入的被摄体图像的图像特征与所述登记图像信息中的图 像特征之间的类似度 ; 以及 识别部件, 用于执行识别处理。
4、, 以基于所述类似度和所述一致度来识别所输入的被摄 体图像的被摄体是否是与所述登记图像信息的被摄体相同的被摄体, 其中, 当所述第二计算部件计算出所述类似度低于第一阈值、 并且所述第一计算部件 计算出所述一致度等于或高于第二阈值时, 所述识别部件识别出所输入的被摄体图像的被 摄体不同于所述登记图像信息的被摄体。 2. 根据权利要求 1 所述的图像识别设备, 其特征在于, 当所述第二计算部件计算出所 述类似度等于或高于所述第一阈值时, 所述识别部件识别出所述被摄体图像的被摄体与所 述登记图像信息的被摄体相同。 3.根据权利要求1或2所述的图像识别设备, 其特征在于, 当所述第二计算部件计算出 所。
5、述类似度低于所述第一阈值、 并且所述第一计算部件计算出所述一致度低于所述第二阈 值时, 所述识别部件判断为不能进行关于所述被摄体图像的被摄体是否是所述登记图像信 息的被摄体的判断。 4. 根据权利要求 1 或 2 所述的图像识别设备, 其特征在于, 还包括 : 输入部件, 用于输入形成运动图像的连续图像作为所述输入图像 ; 追踪部件, 用于在所述运动图像的至少两帧中追踪所输入的被摄体图像 ; 以及 确定部件, 用于确定所述识别部件是否要对所述追踪部件所追踪的所输入的被摄体图 像和所述数据库中登记的登记图像信息执行所述识别处理, 其中, 所述确定部件确定所述识别部件是否要使用在所述数据库中登记的。
6、登记图像信 息中、 除了被摄体已经被判断为与所输入的被摄体图像的被摄体不同的登记图像信息以外 的登记图像信息, 对所述追踪部件所追踪的被摄体图像执行所述识别处理。 5. 根据权利要求 4 所述的图像识别设备, 其特征在于, 所述数据库包含针对一个被摄体的多个登记图像信息, 以及 所述确定部件确定所述识别部件是否要使用在所述数据库中登记的登记图像信息中、 除了与已经被判断为与所输入的被摄体图像的被摄体不同的被摄体有关的所有的登记图 像信息以外的登记图像信息, 对所述追踪部件所追踪的所输入的被摄体图像的至少一帧执 行所述识别处理。 6. 根据权利要求 4 所述的图像识别设备, 其特征在于, 当已经。
7、判断为所有的登记图像 信息均具有与所输入的被摄体图像不同的被摄体时, 所述识别部件判断为所输入的被摄体 图像的被摄体是未登记的被摄体。 7. 根据权利要求 4 所述的图像识别设备, 其特征在于, 当已经判断为所输入的被摄体 图像的被摄体与所述登记图像信息的被摄体相同时, 所述确定单元确定所述识别部件将不 权 利 要 求 书 CN 102147856 A CN 102147858 A2/2 页 3 对所述追踪部件所追踪的被摄体图像执行所述识别处理。 8.根据权利要求1或2所述的图像识别设备, 其特征在于, 所述第二计算部件仅针对所 述一致度等于或高于所述第二阈值的登记图像信息计算与所输入的被摄体。
8、图像的类似度。 9.根据权利要求1或2所述的图像识别设备, 其特征在于, 所述被摄体可识别性状态包 括被摄体方向、 被摄体亮度、 被摄体隐蔽度以及在所述被摄体是面部的情况下的面部表情 至少之一。 10. 一种图像识别设备的控制方法, 所述图像识别设备在输入图像中识别被摄体, 所述 控制方法包括 : 登记步骤, 用于将通过对被摄体进行摄像所获得的图像或图像特征、 以及与所述被摄 体有关的被摄体可识别性状态作为登记图像信息与所述被摄体的标识相关联地登记在数 据库中 ; 第一计算步骤, 用于计算所输入的被摄体图像的被摄体可识别性状态与所述登记图像 信息中的被摄体可识别性状态之间的一致度 ; 第二计算。
9、步骤, 用于计算所输入的被摄体图像的图像或图像特征与所述登记图像信息 中的图像或图像特征之间的类似度 ; 以及 识别步骤, 用于执行识别处理, 以基于所述类似度和所述一致度来识别所述被摄体图 像的被摄体是否是与所述登记图像信息的被摄体相同的被摄体, 其中, 当计算出所述类似度低于第一阈值、 并且所述一致度等于或高于第二阈值时, 在 所述识别步骤中识别出所述被摄体图像的被摄体不同于所述登记图像信息的被摄体。 权 利 要 求 书 CN 102147856 A CN 102147858 A1/9 页 4 图像识别设备及其控制方法 技术领域 0001 本发明涉及一种适合于诸如摄像机等的摄像设备的图像识。
10、别设备及其控制方法。 背景技术 0002 近来已经提出了具有识别图像中包含的特定被摄体的被摄体识别功能的摄像设 备。利用被摄体识别功能, 摄像设备可以优先针对识别出的被摄体控制聚焦和曝光。具有 被摄体识别功能的摄像设备首先从该摄像设备通过被摄体识别处理所获得的图像数据检 测包含特定被摄体的被摄体图像区域。然后, 摄像设备从检测到的被摄体图像区域的图像 数据提取用以将被摄体区域识别为识别对象的特征信息。 摄像设备将提取出的特征信息与 数据库中预先登记的图像的特征信息进行比较。基于通过比较所获得的类似度, 摄像设备 识别与识别对象相对应的登记对象, 或者判断是否存在相应的登记对象。 0003 例如。
11、, 日本特开 2003-187352 号公报提出了进行用于将人物的面部检测为特定被 摄体区域的人物识别、 提取该面部的特征信息并判断具有该面部的人物的系统。在本说明 书中, 识别与诸如面部等的检测到的图像相对应的人物(被摄体)的处理将被称为 “识别” 。 0004 如上所述, 在被摄体识别时, 通过将识别对象与数据库中预先登记的对象进行比 较来计算类似度。对要计算的类似度设置预定阈值。如果计算出的类似度等于或高于预定 阈值, 则判断为识别对象与登记数据库中的对象一致。 0005 当从识别对象的图像和登记数据库中的对象的图像所获得的特征量几乎相等时, 类似度高。然而, 即使当识别对象和数据库中登。
12、记的对象表示同一被摄体时, 如果诸如被 摄体方向或亮度等的被摄体状态改变, 则从这些对象图像所获得的特征量 ( 即, 所比较的 被摄体和对象的特性 ) 彼此不同, 并且类似度变低。由于 (1) 识别对象与数据库中登记的 对象不一致、 或者 (2) 数据库中登记的对象的状态与用作为识别对象的被摄体的状态不一 致, 因此类似度低于预定阈值。 也就是说, 不能仅根据类似度值判断为识别对象是数据库中 未登记的被摄体。 发明内容 0006 期望解决以上问题, 并且本发明的实施例提供一种意图更精确地判断为从图像检 测到的被摄体未登记在数据库中的图像识别设备及其控制方法。 0007 根据本发明的一个方面, 。
13、提供一种图像识别设备, 用于在输入图像中识别被摄体, 所述图像识别设备包括 : 数据库, 在所述数据库中, 与被摄体的标识相关联地登记有通过对 所述被摄体进行摄像所获得的图像或图像特征、 以及所述被摄体的被摄体可识别性状态, 作为登记图像信息 ; 第一计算部件, 用于计算所输入的被摄体图像的被摄体可识别性状态 与所述登记图像信息中的被摄体可识别性状态之间的一致度 ; 第二计算部件, 用于计算所 输入的被摄体图像的图像特征与所述登记图像信息中的图像特征之间的类似度 ; 以及识别 部件, 用于执行识别处理, 以基于所述类似度和所述一致度来识别所输入的被摄体图像的 被摄体是否是与所述登记图像信息的被。
14、摄体相同的被摄体, 其中, 当所述第二计算部件计 说 明 书 CN 102147856 A CN 102147858 A2/9 页 5 算出所述类似度低于第一阈值、 并且所述第一计算部件计算出所述一致度等于或高于第二 阈值时, 所述识别部件识别出所输入的被摄体图像的被摄体不同于所述登记图像信息的被 摄体。 0008 此外, 根据本发明的另一方面, 提供一种图像识别设备的控制方法, 所述图像识别 设备在输入图像中识别被摄体, 所述控制方法包括 : 登记步骤, 用于将通过对被摄体进行摄 像所获得的图像或图像特征、 以及与所述被摄体有关的被摄体可识别性状态作为登记图像 信息与所述被摄体的标识相关联地。
15、登记在数据库中 ; 第一计算步骤, 用于计算所输入的被 摄体图像的被摄体可识别性状态与所述登记图像信息中的被摄体可识别性状态之间的一 致度 ; 第二计算步骤, 用于计算所输入的被摄体图像的图像或图像特征与所述登记图像信 息中的图像或图像特征之间的类似度 ; 以及识别步骤, 用于执行识别处理, 以基于所述类似 度和所述一致度来识别所述被摄体图像的被摄体是否是与所述登记图像信息的被摄体相 同的被摄体, 其中, 当计算出所述类似度低于第一阈值、 并且所述一致度等于或高于第二阈 值时, 在所述识别步骤中识别出所述被摄体图像的被摄体不同于所述登记图像信息的被摄 体。 0009 通过以下参考附图对典型实施。
16、例的说明, 本发明的其它特征将变得明显。 附图说明 0010 图 1 是示出根据第一实施例的摄像设备的配置的框图 ; 0011 图 2 是示出根据第一实施例的识别处理的流程图 ; 0012 图 3 是示出根据第一实施例的识别处理的图 ; 0013 图 4 是示出根据第二实施例的摄像设备的配置的框图 ; 0014 图 5 是示出根据第二实施例的识别处理的流程图 ; 以及 0015 图 6 是示出根据第二实施例的识别处理的图。 具体实施方式 0016 现在将参考附图来说明本发明的优选实施例。 0017 第一实施例 0018 图1是示出具有根据第一实施例的图像识别设备的摄像设备100的示意配置的框 。
17、图。摄像设备 100 具有进行以下的面部识别的功能 : 该面部识别用于从通过摄像所获得的 图像数据检测人物的面部作为特定被摄体区域, 提取该面部的特征信息, 并且识别具有该 面部的人物。 0019 表示被摄体图像的光束通过摄像镜头 101 会聚, 并且入射诸如 CCD( 电荷耦合器 件 ) 图像传感器或 CMOS( 互补金属氧化物半导体 ) 图像传感器等的摄像装置 102。摄像装 置 102 根据入射光束的强度而输出针对各像素的电信号。该电信号是视频信号。模拟信号 处理单元 103 对从摄像装置 102 输出的视频信号进行诸如相关双采样 (CDS) 等的模拟信号 处理。 0020 A/D转换单。
18、元104将从模拟信号处理单元103输出的视频信号转换成数字数据, 从 而生成数字图像。将该数字图像作为要处理的图像输入至摄像控制单元 105 和图像处理单 元 106。图像处理单元 106 对所输入的要处理的图像执行包括伽玛校正和白平衡处理的图 说 明 书 CN 102147856 A CN 102147858 A3/9 页 6 像处理。除了通常的图像处理以外, 图像处理单元 106 具有使用从 ( 后面要说明的 ) 被摄 体检测单元 109 和被摄体识别单元 111 供给的、 与图像中的特定被摄体区域有关的信息来 进行图像处理的功能。将从图像处理单元 106 输出的视频信号发送至显示单元 1。
19、07。显示 单元 107 是例如 LCD( 液晶显示器 ) 或有机 EL( 电致发光 ) 显示器, 并且显示视频信号。显 示单元 107 可以用作用以顺次显示按时间序列检测到的图像的电子取景器 (EVF)。将视频 信号记录在记录介质 108( 例如, 可拆卸存储卡 ) 上。注意, 记录目的地可以是照相机的内 置存储器、 插入至照相机中的存储器或可通信地连接的外部装置。 0021 还将从图像处理单元 106 输出的视频信号 ( 要处理的输入图像 ) 供给至被摄体检 测单元109。 被摄体检测单元109检测该图像中的特定被摄体, 并且指定被摄体的数量和被 摄体区域。如上所述, 本实施例中的目标被摄。
20、体可以是人物的面部。由此检测方法可以是 已知的面部检测方法。例如, 已知的面部检测技术包括使用与面部有关的知识 ( 肤色信息 以及诸如眼睛、 鼻子和嘴等的部位 ) 的方法、 以及基于以神经网络为代表的学习算法配置 面部检测用的识别单元的方法。对于高的检测精度, 通常组合多个面部检测方法来进行面 部检测。例子包括如日本特开 2002-251380 号公报所述的、 使用小波变换和图像特征量来 进行面部检测的方法。从被摄体检测单元 109 输出的信息包括如下数量的被摄体位置、 大 小、 倾斜和检测结果可靠性等, 该数量是检测到的被摄体的数量。 0022 状态判断单元 110 访问数据库 112, 以。
21、判断 ( 后面要说明的 ) 被摄体识别单元 111 中的识别对象的状态 ( 即, 可识别性 ) 与数据库 112 中预先登记的对象的状态彼此是否一 致, 或者判断一致度。后面将说明状态判断单元 110 的详细内容。 0023 被摄体识别单元 111 从被摄体检测单元 109 所检测到的被摄体的图像数据 ( 被摄 体图像 ) 提取特征信息以将被摄体区域识别为识别对象。被摄体识别单元 111 将提取出 的特征信息与数据库 112 中预先登记的被摄体图像的特征信息进行比较。更具体地, 被摄 体识别单元 111 将被摄体图像的图像特征与数据库 112 中登记的被摄体的图像特征进行 比较。例如, 通过使。
22、用与在面部检测时提取出的面部部位有关的信息, 被摄体识别单元 111 获得多个类型的项的值, 例如, 该多个类型的项包括右眼和左眼的中心 ( 例如, 瞳孔 ) 之间 的距离、 右眼和左眼的大小的平均值、 连接眼睛的中心和眼角的直线相对于连接右眼和左 眼的中心的直线的斜率、 嘴的宽度、 从右眼和左眼的中心之间的平分点到鼻尖的距离、 以及 从右眼和左眼的中心之间的平分点到下巴尖的距离。被摄体识别单元 111 使各项的值标准 化, 以使得任意项 ( 例如, 右眼和左眼的中心之间的距离 ) 的值与预定值一致。被摄体识别 单元 111 使用预先准备的表来将各项的值转换成点。被摄体识别单元 111 针对这。
23、些项的各 种组合, 计算不同项的点的比, 例如, 包括右眼和左眼的大小的平均值的点相对于右眼和左 眼的中心之间的距离的点的比、 以及从右眼和左眼的中心之间的平分点到下巴尖的距离的 点相对于嘴宽度的点的比。被摄体识别单元 111 在数据库 112 中预先登记的这些人物的比 数据中读出人物的比数据, 并且获得各计算出的比相对于所读出的比数据的百分比 ( )。 被摄体识别单元111获得针对项的各种组合所计算出的百分比()的平均值, 并且将该平 均值设置为该人物的识别评价值。技术人员将理解存在获得识别评价值的其它方式, 并且 以上给出的例子是几种可能性中的一个例子。 基于表示通过比较所获得的类似度的识。
24、别评 价值, 被摄体识别单元 111 识别与识别对象相对应的登记对象, 并且判断是否存在相应的 登记对象。例如, 对识别评价值设置预定阈值。当所获得的识别评价值等于或大于预定阈 说 明 书 CN 102147856 A CN 102147858 A4/9 页 7 值时, 可以判断为识别对象是数据库 112 中登记的对象。在以下两种情况下, 识别评价值小 于预定阈值 : 0024 (1) 识别对象不同于数据库 112 中登记的对象, 或者 0025 (2) 识别对象与登记数据库中的对象一致, 但不能获得等于或大于预定阈值的识 别评价值。 0026 当例如图像中的被摄体的状态(例如, 面部方向)不。
25、同时, 发生识别对象与数据库 112 中登记的对象一致、 但不能获得等于或大于预定阈值的识别评价值的现象。换言之, 所 输入的对象不可识别为与数据库中登记的对象相同。由于该原因, 当识别评价值小于预定 阈值、 并且状态判断单元 110 判断为这两个对象的状态彼此一致 ( 或状态一致度等于或高 于预定阈值, 这意味着被摄体的可识别性足够相似, 以使得如果这两个对象是同一被摄体, 则将检测到这两个对象是同一被摄体 ) 时, 被摄体识别单元 111 判断为识别对象是不同于 数据库中的被摄体的被摄体。换言之, 不会仅仅因为正在识别的面部中的一个面部转过脸 去而使得被摄体识别单元 111 没有发现所输入。
26、的面部和数据库的面部相同。相反, 更可靠 地得出面部实际上不同这一事实。 0027 状态判断单元110中的状态是由使被摄体识别单元111的精度下降的因素所限定 的。使被摄体识别单元 111 的精度下降的因素依赖于被摄体识别单元 111 的算法等, 因此 基于被摄体识别单元 111 的特性来定义状态判断单元 110 中的状态。状态或可识别性状态 的例子包括面部方向、 亮度、 表情、 隐蔽度(例如, 被摄体是否戴眼镜或蓄胡须)和被摄体区 域大小。 0028 在数据库 112 中, 与被摄体相关联地登记目标被摄体图像、 或者被摄体识别用的 图像特征量和被摄体可识别性状态。 “被摄体可识别性状态” 意。
27、味着登记了图像的构图。该 构图可以包括人物面对的方向 ( 即, 直接面向拍摄图像的照相机或面向一侧或面向侧面 )。 可选地, 被摄体可识别性状态可以表示正在摄像的被摄体是否部分模糊。 换言之, 被摄体可 识别性状态与以上所述的被摄体 “状态” 相同。可以将多个被摄体登记在数据库 112 中。此 外, 还可以将针对同一被摄体的多个数据登记在数据库中。 在这种情况下, 被摄体可以登记 有多个不同的状态。注意, 可以将被摄体识别图像登记在数据库 112 中。在本说明书中, 将 数据库 112 中与被摄体相关联地登记的图像特征量和被摄体可识别性状态、 或图像统称为 “登记图像信息” 。 0029 摄像。
28、控制单元105基于从A/D转换单元104输出的视频信号, 控制摄像镜头的(均 未示出的 ) 调焦控制机构和曝光控制机构。当控制调焦控制机构和曝光控制机构时, 摄像 控制单元 105 可以使用从被摄体检测单元 109 和被摄体识别单元 111 供给的目标被摄体区 域提取结果的信息。因此, 摄像设备 100 具有进行考虑到所拍摄图像中特定被摄体区域的 信息的摄像处理的功能。 摄像控制单元105还控制摄像装置102的输出定时和输出像素等。 0030 将参考图 2 来解释根据第一实施例的被摄体识别处理的序列。 0031 图像处理单元 106 读取通过利用 A/D 转换单元 104 对经由摄像装置 10。
29、2 所获得的 所拍摄图像进行数字化所获得的图像作为输入图像 ( 步骤 S201)。被摄体检测单元 109 检 测该输入图像中的被摄体区域 ( 步骤 S202)。状态判断单元 110 和被摄体识别单元 111 获 得被摄体检测单元 109 所检测到的被摄体区域的图像作为要识别的被摄体图像。作为被摄 体检测单元 109 的检测结果的信息, 获得检测结果的数量、 各检测结果在图像中的位置和 说 明 书 CN 102147856 A CN 102147858 A5/9 页 8 大小以及检测结果的可靠性等。状态判断单元 110 和被摄体识别单元 111 对被摄体检测单 元 109 所提取出的、 作为识别。
30、对象的各被摄体执行步骤 S203 S209 中的处理。还可以从 被摄体检测单元 109 所提取出的多个被摄体中选择主被摄体, 并且仅对作为识别对象的所 选择的被摄体进行步骤 S203 S209 中的处理。例如, 要选择的主被摄体是检测被摄体区 域 ( 被摄体图像 ) 时评价值最大的被摄体或被摄体区域的面积最大的被摄体。 0032 状态判断单元 110 计算用以判断被摄体检测单元 109 所提取出的被摄体的状态 与数据库 112 中登记的被摄体的状态一致的程度的状态一致度 ( 步骤 S203( 第一计算处 理 )。状态一致度越高意味着状态类似度越高。 0033 状态一致判断要素的例子是面部方向。。
31、在判断面部方向的一致度时, 从识别对象 的图像和数据库中登记的对象的图像提取诸如眼睛和嘴等的面部部位的特征点, 并且根据 提取出的特征点之间的几何关系来估计面部方向。比较识别对象 ( 即, 要识别的被摄体图 像 ) 的所估计的面部方向和数据库中登记的对象 ( 即, 被摄体 ) 的面部方向, 由此判断状态 一致度。注意, 状态一致度判断时的状态是影响被摄体识别单元 111 的精度的因素就可以 了, 并不限于面部方向。也就是说, 这里使用的状态是根据被摄体识别单元 111 的系统和算 法所定义的, 并且除了面部方向以外, 还包括 “亮度” 、“表情” 、“隐蔽度” 和 “大小” 。将例示 判断各状。
32、态的一致度的方法。当使用 “亮度” 作为状态时, 计算识别对象的图像中的亮度值 的平均值、 和数据库中登记的对象的图像中的亮度值的平均值, 并且在这两个平均值之间 的差是根据数据库图像计算出的平均值的 20以下的情况下, 判断为亮度状态彼此一致, 并且百分比越低, 状态一致度越高。随着图像变暗, 更难以提取被摄体识别单元 111 获得识 别评价值所使用的与面部部位有关的信息。 因而, 对于较低的数据库图像亮度, 基准值20 变为更加严格 ( 即, 更低 ) 的值。当使用 “表情” 时, 从识别对象的图像和数据库中登记的 对象的图像提取诸如眼睛和嘴等的面部部位的特征点, 并且根据眼睛张开 ( 眼。
33、高相对于眼 宽 ) 的程度、 嘴形 ( 嘴的两角是否比嘴的中央高 ) 和眼角的位置等来判断各图像中的面部 表情。例如, 当眼角向下、 眼睛张开的程度低、 并且嘴的两角向上时, 判断为人物正在微笑。 对于表情, 仅当所判断出的表情彼此一致时, 才判断为状态彼此一致。当使用 “隐蔽度” 时, 从识别对象的图像和数据库中登记的对象的图像检测诸如面具和眼镜等的隐蔽特征, 并且 在各个图像中检测到的隐蔽特征 ( 或者, 实际上为被摄体的隐蔽部位 ) 的面积相对于被摄 体(诸如面部等)的面积的比之间的差是数据库图像中的隐蔽特征的面积相对于该被摄体 ( 即, 面部 ) 的比的 5以下的情况下, 判断为隐蔽特。
34、征状态彼此一致, 并且百分比越低, 状 态一致度越高。当使用 “大小” 、 并且从被摄体检测单元 109 输出的面部大小是数据库中登 记的面部大小的一半以下时, 判断为大小状态彼此不一致。相反, 大小彼此越接近, 得出的 状态一致度越高。 0034 然后, 被摄体识别单元 111 将被摄体检测单元 109 提取出的被摄体图像的图像特 征与数据库 112 中登记的被摄体的图像特征进行比较, 从而计算第二计算处理中的识别评 价值 ( 步骤 S204)。该识别评价值表示要识别的被摄体图像和数据库 112 中登记的被摄体 之间的类似度。识别评价值越大表示识别对象和数据库 112 中登记的被摄体彼此一致。
35、的可 能性越高。当数据库 112 中存在多个被摄体时, 以数据库 112 中登记的被摄体的数量的次 数执行状态判断单元 110 的处理 ( 步骤 S203) 和被摄体识别单元 111 的处理 ( 步骤 S204)。 也就是说, 对于一个识别对象, 获得了如下数量的状态一致度和识别评价值, 该数量是数据 说 明 书 CN 102147856 A CN 102147858 A6/9 页 9 库 112 中登记的被摄体的数量。 0035 被摄体识别单元 111 将识别评价值与第一阈值进行比较, 并且如果识别评价值等 于或大于第一阈值, 则判断为识别对象是与数据库 112 中登记的被摄体一致的被摄体 。
36、( 步 骤 S205 中为 “是” 步骤 S206)。如果识别评价值小于第一阈值 (S205 中为 “否” ), 则被 摄体识别单元 111 将状态一致度与第二阈值进行比较。如果状态一致度等于或高于第二阈 值、 即要识别的被摄体的状态与数据库中登记的被摄体的状态一致, 则被摄体识别单元 111 判断为识别对象是与数据库 112 中登记的被摄体不同的被摄体 ( 步骤 S207 中为 “是” 步 骤 S208)。如果状态一致度低于预定阈值 ( 步骤 S207 中为 “否” ), 则在未判断出识别对象 是与数据库中的被摄体不同还是与数据库中的被摄体一致的情况下, 被摄体识别单元 111 判断为不能进。
37、行判断 ( 步骤 S207 中为 “否” 步骤 S209)。 0036 将参考图3来例示上述的根据第一实施例的被摄体识别处理。 在图3中, 状态判断 单元 110 判断面部方向的一致度。在图 3 中, 附图标记 301 表示数据库中登记的图像 ; 并且 附图标记 302 304 表示输入图像。输入图像 302 相对于登记图像 301 的识别评价值等于 或大于第一阈值, 因此判断为识别对象是与数据库中的被摄体相同的被摄体。 输入图像303 相对于登记图像 301 的识别评价值小于第一阈值, 状态一致度等于或高于第二阈值 ( 即, 这两个图像的面部面向同一方向, 因此识别评价值的差异不是由于状态的。
38、差异引起的 ), 由 此判断为识别对象是与数据库中登记的对象不同的被摄体。输入图像 304 相对于登记图像 301 的识别评价值小于第一阈值, 状态一致度小于第二阈值, 由此并未判断出识别对象是与 数据库中登记的对象一致的被摄体还是与数据库中登记的对象不同的被摄体。换言之, 不 能进行关于来自输入图像的被摄体与所存储的被摄体图像是否相同的判断。 0037 如上所述, 根据第一实施例, 对于要识别的被摄体图像, 在与数据库中登记的被摄 体比较时, 获得通过被摄体识别所获得的识别评价值、 和与被摄体状态有关的状态一致度。 当识别评价值小于预定阈值时, 通过参考状态一致度来判断识别对象是否不同于所登。
39、记的 被摄体。 换言之, 可以更加精确地判断为识别对象是被摄体识别数据库中未登记的被摄体。 0038 在如图2所示的步骤S207中, 仅使用状态一致度来进行判断, 但本发明不限于此。 例如, 当在步骤 S204 中获得的识别评价值小于第三阈值 ( 其中, 第三阈值小于第一阈值 )、 并且状态一致度高于第二阈值 (S207) 时, 可以判断为识别对象不同于数据库中登记的被 摄体 ( 步骤 S208)。同样, 仅当识别评价值等于或大于第一阈值、 并且状态一致度等于或高 于第四阈值时, 处理才可以从步骤 S205 进入步骤 S206, 其中, 第四阈值与第二阈值相同或 不同, 并且包括在必须满足 S。
40、205 和 S207 这两者为肯定才得到 S206 的实施例中。通过该设 置, 仅当类似度高、 并且状态在一定程度上一致时, 才可以判断为要识别的被摄体与数据库 中登记的被摄体一致。为了将被摄体图像登记在数据库 112 中, 对于用户而言, 向人物分配 ID, 从所获取的图像中选择与该ID相对应的图像, 并将该图像存储在数据库112中, 这就足 够了。还可以当被摄体识别单元 111 获得比第一阈值高出预定值以上的识别评价值时, 将 具有该识别评价值的图像自动添加至数据库 112, 作为具有该识别评价值的特定人物的图 像。 0039 第二实施例 0040 图 4 是示出根据第二实施例的摄像设备的。
41、框图。将主要解释根据第二实施例的摄 像设备 100 的配置和操作与第一实施例中摄像设备 100 的配置和操作的不同之处。在图 4 说 明 书 CN 102147856 A CN 102147858 A7/9 页 10 中, 与图 1 中的附图标记相同的附图标记表示具有与第一实施例中的配置相同的配置、 并 执行与第一实施例中的操作和处理相同的操作和处理的单元。 0041 被摄体追踪单元401基于对于连续帧从被摄体检测单元109供给的检测结果之间 的位置类似度和大小类似度来在这些连续帧之间追踪同一被摄体。 通过在运动图像中指定 同一被摄体, 可以保持并应用被摄体识别单元 111 的针对该被摄体的过。
42、去的结果。 0042 执行判断单元 402 判断被摄体识别单元 111 是否要对被摄体检测单元 109 提取出 的各被摄体执行识别处理。此外, 执行判断单元 402 从数据库 112 中登记的被摄体中, 选择 要进行针对识别对象的识别处理的被摄体。配置如图 4 所示的执行判断单元 402 使得可以 使用状态判断单元 110 的结果、 和被摄体识别单元 111 的过去的结果, 并且从数据库 112 中 登记的被摄体中选择 ( 由被摄体识别单元 111) 要进行识别处理的被摄体。 0043 如果被摄体追踪单元 401 可以在时间序列上连续的运动图像中指定同一被摄体, 则可以继承被摄体识别单元 11。
43、1 的过去的结果, 从而省略了被摄体识别单元 111 进一步进 行识别处理。 也就是说, 当识别评价值满足预定阈值、 并且判断为被摄体已被登记在数据库 112 中时, 可以通过利用被摄体追踪单元 401 在后续帧中指定被摄体来继承该判断。 0044 在以上所述的第一实施例中, 如果被摄体识别单元 111 所获得的识别评价值小于 预定阈值、 并且状态判断单元 110 所获得的一致度高, 则判断为识别对象不同于数据库 112 中登记的被摄体。在本实施例中, 对于连续帧中的同一识别对象, 可以省略利用数据库 112 中登记的被摄体的识别处理。假定在数据库 112 中针对同一被摄体 ( 即具有相同标识。
44、的被 摄体 ) 登记了多种类型的图像特征和状态, 并且根据与图像特征和 / 或状态中的一个的对 照, 判断为识别对象不同于登记对象。在这种情况下, 针对与该被摄体有关的、 数据库 112 中登记的所有的图像特征和状态, 可以省略识别对象的识别处理。 此外, 当没有剩余要由被 摄体识别单元 111 进行识别处理的被摄体时, 可以判断为识别对象是数据库中未登记的被 摄体。 0045 将参考图 5 来解释根据第二实施例的该被摄体识别处理的序列。 0046 在与图 2 中的步骤 S201 和 S202 相同的步骤 S501 和 S502 中, 被摄体检测单元 109 从通过对所拍摄图像进行数字化所获得。
45、的输入图像获得被摄体区域 ( 被摄体图像 )。针对 被摄体检测单元 109 提取出的各被摄体, 执行步骤 S503 S513。被摄体追踪单元 401 在 时间序列上连续的帧之间追踪同一被摄体 ( 步骤 S503)。更具体地, 如果在被摄体检测单 元 109 检测到的被摄体中存在连续帧之间的位置类似度和大小类似度满足预定标准的被 摄体, 则被摄体追踪单元 401 判断为存在同一被摄体。如果不存在连续帧之间的位置类似 度和大小类似度满足预定标准的被摄体, 则被摄体追踪单元 401 将被摄体看作为新出现的 被摄体。 0047 执行判断单元 402 针对由被摄体追踪单元 401 判断为不是新被摄体的被。
46、摄体 ( 识 别对象 ), 判断在过去的帧中是否已经判断为该被摄体与数据库 112 中登记的特定被摄体 一致、 或者在过去的帧中是否已经判断为该被摄体未登记在数据库中 ( 是否已经判断为该 被摄体不同于数据库112中登记的所有被摄体)(步骤S504)。 如果已经判断为识别对象与 特定被摄体一致、 或者识别对象未登记在数据库中, 则执行判断单元 402 使处理返回至步 骤S501(步骤S504中为 “是” ), 以跳过针对该被摄体的状态一致度判断和被摄体识别处理。 如果尚未判断为识别对象与数据库中登记的特定被摄体一致、 并且尚未判断为识别对象不 说 明 书 CN 102147856 A CN 1。
47、02147858 A8/9 页 11 同于数据库 112 中的登记的所有被摄体, 则被摄体识别单元 111 判断数据库 112 中是否剩 余要进行针对识别对象的被摄体识别的登记图像信息 ( 步骤 S504 中为 “否” 步骤 S505)。 如果数据库 112 中没有剩余要进行被摄体识别的登记图像信息, 则该识别对象不同于数据 库 112 中登记的所有被摄体。因而, 被摄体识别单元 111 判断为识别对象未登记在数据库 中 ( 步骤 S505 中为 “否” 步骤 S506)。之后, 处理返回至步骤 S501。 0048 相反, 如果数据库 112 中剩余要进行针对目标被摄体 ( 识别对象 ) 的。
48、被摄体识别 的登记图像信息, 则执行步骤 S507 S513 中的处理。注意, 针对在步骤 S505 中已经判断 为要进行针对识别对象的被摄体识别的、 数据库 112 中登记的所有图像 ( 步骤 S505 中为 “是” ), 执行步骤 S507 S513。首先, 状态判断单元 110 判断要进行被摄体识别的识别对 象的状态一致度 ( 步骤 S507)。步骤 S507 S513 中的处理与图 2 的步骤 S203 S209 中 的处理相同。通过步骤 S507 S513 中的处理, 获得以下结果之一 : 0049 识别对象与数据库中登记的被摄体一致 ( 步骤 S510), 0050 识别对象不同于。
49、数据库中登记的被摄体 ( 步骤 S512), 以及 0051 不能进行判断(步骤S513)。 如果在步骤S512中判断为识别对象不同于数据库 中登记的被摄体, 则从要进行针对该识别对象的识别的被摄体中排除与登记的该被摄体相 关联的登记图像信息。在步骤 S510 中, 可以从要进行针对其它识别对象的识别的登记图像 信息中排除与被判断为与识别对象一致的被摄体相关联的登记图像信息。例如, 如果在已 经进行了面部识别等的一个图像中不存在多个识别对象, 则可以消除不需要的识别处理。 这样, 结果被继承到下一帧 ( 步骤 S503), 判断是否执行被摄体识别 ( 步骤 S504), 并且选择 数据库中要进行被摄体识别的被摄体 ( 步骤 S505)。因此, 第二实施例可以缩短处理时间。 0052 将参考图 6 来例示根据第二实施例的被摄体识别的结果。在图 6 中, 状态判断单 元 110 判断面部方向的一致度。在图 6 中, 附图标记 601 603 表示数据库中登记的被摄 体的登记图像。登记图像 601 和 602 表示不。