人脸聚类方法及装置.pdf

摘要
申请专利号：	CN201510971798.9	申请日：	2015.12.22
公开号：	CN105426878A	公开日：	2016.03.23
当前法律状态：	实审	有效性：	审中
法律详情：	实质审查的生效IPC(主分类):G06K 9/00申请日:20151222\|\|\|公开
IPC分类号：	G06K9/00	主分类号：	G06K9/00
申请人：	小米科技有限责任公司
发明人：	陈志军; 李明浩; 侯文迪
地址：	100085北京市海淀区清河中街68号华润五彩城购物中心二期13层
优先权：
专利代理机构：	北京三高永信知识产权代理有限责任公司11138	代理人：	鞠永善
PDF下载：	PDF下载

内容摘要

本公开揭示了一种人脸聚类方法及装置，属于人脸识别领域。该人脸聚类方法包括：获取第一照片类和第二照片类；对第一照片类中的人脸照片进行聚类得到至少一个照片子类；将至少一个照片子类中的一个照片子类确定为正确人脸子类；计算正确人脸子类与第二照片类之间的距离；若距离大于阈值，则将第一照片类和第二照片类分别聚类至不同的照片类；解决了在人脸聚类时，若第二照片类中存在与第一照片类中错误人脸相对应的其他人脸照片，则有可能错误地将第一照片类与第二照片类聚类至同一个照片类的问题；达到了在聚类时避免出现一个照片类因为少数错误人脸照片时，引入更多错误人脸照片的聚类错误，提高人脸聚类的准确度的效果。

权利要求书

1.一种人脸聚类方法，其特征在于，所述方法包括：
获取第一照片类和第二照片类，所述第一照片类包括聚类得到的至少两张
人脸照片；
对所述第一照片类中的所述人脸照片进行聚类，得到至少一个照片子类；
将所述至少一个照片子类中的一个照片子类确定为正确人脸子类；
计算所述正确人脸子类与所述第二照片类之间的距离；
若所述距离大于阈值，则将所述第一照片类和所述第二照片类分别聚类至
不同的照片类。
2.根据权利要求1所述的方法，其特征在于，所述对所述第一照片类中的
所述人脸照片进行聚类，得到至少一个照片子类，包括：
对所述第一照片类中的每个所述人脸照片进行密度聚类，得到至少一个照
片子类。
3.根据权利要求2所述的方法，其特征在于，所述对所述第一照片类中的
每个所述人脸照片进行密度聚类，得到至少一个照片子类，包括：
获取所述第一照片类中每个所述人脸照片的特征向量；
通过预设的密度聚类算法计算每个所述人脸照片的特征向量在高维空间中
的密度分布；
根据所述密度分布，将所述人脸照片分别聚类至至少一个照片子类中。
4.根据权利要求2所述的方法，其特征在于，所述密度聚类算法包括：基
于高密度连接区域密度聚类算法DBSCAN、对象排序识别聚类结构算法
OPTICS、基于密度的增量算法IGDCA、基于最大不相含核心点集的聚类算法
LSNCCP中的至少一种。
5.根据权利要求1至3任一所述的方法，其特征在于，所述将所述至少一
个照片子类中的一个照片子类确定为正确人脸子类，包括：
计算每个所述照片子类中的人脸照片的数量；
将数量最大的所述照片子类确定为正确人脸子类。
6.一种人脸聚类装置，其特征在于，所述装置包括：
类获取模块，被配置为获取第一照片类和第二照片类，所述第一照片类包
括聚类得到的至少两张人脸照片；
第一聚类模块，被配置为对所述第一照片类中的所述人脸照片进行聚类，
得到至少一个照片子类；
确定模块，被配置为将所述至少一个照片子类中的一个照片子类确定为正
确人脸子类；
距离计算模块，被配置为计算所述正确人脸子类与所述第二照片类之间的
距离；
第二聚类模块，被配置为当所述距离大于阈值时，将所述第一照片类和所
述第二照片类分别聚类至不同的照片类。
7.根据权利要求6所述的装置，其特征在于，所述第一聚类模块，包括：
密度聚类子模块，被配置为对所述第一照片类中的每个所述人脸照片进行
密度聚类，得到至少一个照片子类。
8.根据权利要求7所述的装置，其特征在于，所述对密度聚类子模块，包
括：
获取子模块，被配置为获取所述第一照片类中每个所述人脸照片的特征向
量；
密度计算子模块，被配置为通过预设的密度聚类算法计算每个所述人脸照
片的特征向量在高维空间中的密度分布；
聚类子模块，被配置为根据所述密度分布，将所述人脸照片分别聚类至至
少一个照片子类中。
9.根据权利要求7所述的装置，其特征在于，所述密度聚类算法包括基于
高密度连接区域密度聚类算法DBSCAN、对象排序识别聚类结构算法OPTICS、
基于密度的增量算法IGDCA、基于最大不相含核心点集的聚类算法LSNCCP中
的至少一种。
10.根据权利要求6至8任一所述的装置，其特征在于，所述确定模块，
包括：
数量计算子模块，被配置为计算每个所述照片子类中的人脸照片的数量；
确定子模块，被配置为将数量最大的所述照片子类确定为正确人脸子类。
11.一种人脸聚类装置，其特征在于，所述装置包括：
处理器；
用于存储所述处理器可执行指令的存储器；
其中，所述处理器被配置为：
获取第一照片类和第二照片类，所述第一照片类包括聚类得到的至少两张
人脸照片；
对所述第一照片类中的所述人脸照片进行聚类，得到至少一个照片子类；
将所述至少一个照片子类中的一个照片子类确定为正确人脸子类；
计算所述正确人脸子类与所述第二照片类之间的距离；
若所述距离大于阈值，则将所述第一照片类和所述第二照片类分别聚类至
不同的照片类。

说明书

人脸聚类方法及装置

技术领域

本公开涉及人脸识别领域，特别涉及一种人脸聚类方法及装置。

背景技术

人脸聚类方法是一种基于人脸特征将相似人脸进行聚类的方法。在照片管
理程序中，可以通过人脸聚类方法将对应于不同人脸的照片进行聚类，从而形
成不同的相册。

相关技术中的一种人脸聚类方法，包括：第一，将每一张照片初始化为一
个照片类；第二，根据每张照片的特征向量，计算任意两个照片类之间的距离；
第三，若两个照片类之间的距离小于阈值，则将两个照片类聚类至同一个照片
类中；迭代上述第二步骤和第三步骤。但是在聚类过程中，若照片类A中存在
几张错误人脸照片，照片类B中存在多张与该错误人脸照片对应的其它人脸照
片，则在不断迭代过程中，有可能会错误地将照片类A和照片类B聚类至同一
个照片类中。

发明内容

为了解决在人脸聚类时，若照片类B中存在与照片类A中错误人脸相对应
的其他人脸照片，则有可能会错误地将照片类A与照片类B聚类至同一个照片
类中的问题，本公开提供一种人脸聚类方法及装置。所述技术方案如下：

根据本公开实施例的第一方面，提供一种人脸聚类方法，该方法包括：

获取第一照片类和第二照片类，第一照片类包括聚类得到的至少两张人脸
照片；

对第一照片类中的人脸照片进行聚类，得到至少一个照片子类；

将至少一个照片子类中的一个照片子类确定为正确人脸子类；

计算正确人脸子类与第二照片类之间的距离；

若距离大于阈值，则将第一照片类和第二照片类分别聚类至不同的照片类。

可选的，对第一照片类中的人脸照片进行聚类，得到至少一个照片子类，
包括：

对第一照片类中的每个人脸照片进行密度聚类，得到至少一个照片子类。

可选的，对第一照片类中的每个人脸照片进行密度聚类，得到至少一个照
片子类，包括：

获取第一照片类中每个人脸照片的特征向量；

通过预设的密度聚类算法计算每个人脸照片的特征向量在高维空间中的密
度分布；

根据密度分布，得到将人脸照片分别聚类至至少一个照片子类中。

可选的，密度聚类算法包括基于高密度连接区域密度聚类算法DBSCAN、
对象排序识别聚类结构算法OPTICS、基于密度的增量算法IGDCA、基于最大
不相含核心点集的聚类算法LSNCCP中的至少一种。

可选的，将至少一个照片子类中的一个照片子类确定为正确人脸子类，包
括：

计算每个照片子类中的人脸照片的数量；

将数量最大的照片子类确定为正确人脸子类。

根据本公开实施例的第二方面，提供一种人脸聚类装置，该装置包括：

类获取模块，被配置为获取第一照片类和第二照片类，第一照片类包括聚
类得到的至少两张人脸照片；

第一聚类模块，被配置为对第一照片类中的人脸照片进行聚类，得到至少
一个照片子类；

确定模块，被配置为将至少一个照片子类中的一个照片子类确定为正确人
脸子类；

距离计算模块，被配置为计算正确人脸子类与第二照片类之间的距离；

第二聚类模块，被配置为当距离大于阈值时，将第一照片类和第二照片类
分别聚类至不同的照片类。

可选的，第一聚类模块，包括：

密度聚类子模块，被配置为对第一照片类中的每个人脸照片进行密度聚类，
得到至少一个照片子类。

可选的，对密度聚类子模块，包括：

获取子模块，被配置为获取第一照片类中每个人脸照片的特征向量；

密度计算子模块，被配置为通过预设的密度聚类算法计算每个人脸照片的
特征向量在高维空间中的密度分布；

聚类子模块，被配置为根据密度分布，得到将人脸照片分别聚类至至少一
个照片子类中。

可选的，确定模块，包括：

数量计算子模块，被配置为计算每个照片子类中的人脸照片的数量；

确定子模块，被配置为将数量最大的照片子类确定为正确人脸子类。

根据本公开实施例的第三方面，提供一种人脸聚类装置，该装置包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，处理器被配置为：

获取第一照片类和第二照片类，第一照片类包括聚类得到的至少两张人脸
照片；

对第一照片类中的人脸照片进行聚类，得到至少一个照片子类；

将至少一个照片子类中的一个照片子类确定为正确人脸子类；

计算正确人脸子类与第二照片类之间的距离；

若距离大于阈值，则将第一照片类和第二照片类分别聚类至不同的照片类。

本公开的实施例提供的技术方案可以包括以下有益效果：

通过获取第一照片类和第二照片类，对第一照片类中人脸照片进行聚类，
得到至少一个照片子类，将至少一个照片子类中的一个照片子类确定为正确人
脸子类，计算正确人脸子类与第二照片类之间的距离，若距离小于阈值，则将
第一照片类和第二照片类聚类至同一个照片类；解决了在人脸聚类时，若第二
照片类中存在与第一照片类中错误人脸相对应的其他人脸照片，则有可能错误
地将第一照片类与第二照片类聚类至同一个照片类的问题；达到了在聚类时避
免出现一个照片类因为存在少数错误人脸照片时，引入更多错误人脸照片的聚
类错误，提高人脸聚类的准确度的效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能
限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开
的实施例，并于说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种人脸聚类方法的方法流程图；

图2A是根据另一示例性实施例示出的一种人脸聚类方法的方法流程图；

图2B是根据另一示例性实施例示出的一种人脸聚类方法的实施示意图；

图2C是根据另一示例性实施例示出的一种人脸聚类方法的方法流程图；

图2D是根据另一示例性实施例示出的DBSCAN算法的实施示意图；

图2E是根据另一示例性实施例示出的一种人脸聚类方法的实施示意图；

图2F是根据另一示例性实施例示出的一种人脸聚类方法的实施示意图；

图3是根据一示例性实施例示出的一种人脸聚类装置的框图；

图4是根据另一示例性实施例示出的一种人脸聚类装置的框图；

图5是根据另一示例性实施例示出的一种人脸聚类装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描
述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。
以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方
式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一
致的装置和方法的例子。

人脸聚类方法存在多种，比如：划分聚类方法、层次聚类方法、密度聚类
方法、网格聚类方法、模型聚类方法。其中，密度聚类方法的主要指导思想是
指当某一区域中的点的密度大于某个阈值时，就将该点添加到与该点相近的聚
类中去，点的密度由该点特定半径之内的点计数(包括该点本身)来估计。

密度聚类算法包括：DBSCAN(Gensity-basedSpatialClueteringofApplication
withNoise，基于高密度连接区域密度聚类算法)、OPTICS(OrderPointstoIdentify
theClueteringStructure，对象排序识别聚类结构算法)、IGDCA(IncrementalGrid
Density-BasedClueteringAlgorithm，基于密度的增量算法)、LSNCCP(theLargest
setofNov-CoredCorePoints，基于最大不相含核心点集的聚类算法)等。

在对人脸照片进行聚类时，可以采用全量聚类或者增量聚类的方法进行聚
类。

全量聚类的过程如下：

第一步、对所有需要聚类的人脸照片进行初始化处理，获取人脸照片中的m
个人脸信息，将获取到的m个人脸信息作为m个照片类；

第二步、计算m个照片类中任意两个照片类之间的距离；

第三步、将距离小于预定阈值的两个照片类合并成一个照片类；

第四步、重新执行第二步，直到所有照片类之间的距离都大于预定阈值，
也即到照片类的数量不再发生变化。

举例来说，假设手机中存储有人脸照片，获取人脸照片中的30个人脸信息，
将30个人脸信息作为30个照片类，计算30个照片类中任意两个照片类之间的
距离，将距离小于预定阈值的照片类聚类至同一个照片类中，当照片类的数量
有变化时，再重新计算照片类之间的距离，将照片类聚类至同一个类中，直到
照片类的数量不再变化，得到4个照片类，也即得到4个相册，每个相册对应
于一个人脸。

除第一次人脸聚类以外的人脸聚类，一般采用增量聚类的方法，增量聚类
的过程如下：

第一步、获取上一次聚类的结果，将新增的p个人脸信息作为p个照片类，
若上一次聚类后得到k个照片类，则共有k+p个照片类；

第二步、计算k+p个照片类中任意两个照片类之间的距离；

第三步、将距离小于预定阈值的两个照片类合并成一个照片类；

第四步、重新执行第二步，直到所有照片类之间的距离都大于预定阈值，
也即到照片类的数量不再发生变化。

在需要进行人脸聚类的人脸照片完成初始化处理后，对得到的所有的照片
类进行一次人脸聚类，得到聚类后的若干个照片类，经过一次聚类后，照片类
的数量小于初始化处理得到的照片类的数量，部分照片类中包含至少两张人脸
照片；不断对聚类得到的照片类进行再次聚类，直到照片类的数量不再发生变
化，即得到对应于不同人脸的相册。

请参考图1，其示出了本公开一个示例性实施例提供的人脸聚类方法的方法
流程图。该人脸聚类方法可由智能手机、平板电脑、个人电脑等电子设备的处
理器执行。该人脸聚类方法可以用于上述聚类过程中除经过全量聚类初始化处
理后的第一次迭代过程以外的任意一次迭代过程。如图1所示，该人脸聚类方
法可以包括如下步骤：

在步骤101中，获取第一照片类和第二照片类，第一照片类包括聚类得到
的至少两张人脸照片。

在步骤102中，对第一照片类中的人脸照片进行聚类，得到至少一个照片
子类。

在步骤103中，将至少一个照片子类中的一个照片子类确定为正确人脸子
类。

在步骤104中，计算正确人脸子类与第二照片类之间的距离。

在步骤105中，若距离大于阈值，则将第一照片类和第二照片类分别聚类
至不同的照片类。

综上所述，本公开实施例所提供的人脸聚类方法，通过获取第一照片类和
第二照片类，对第一照片类中人脸照片进行聚类，得到至少一个照片子类，将
至少一个照片子类中的一个照片子类确定为正确人脸子类，计算正确人脸子类
与第二照片类之间的距离，若距离大于阈值，则将第一照片类和第二照片类分
别聚类至不同的照片类；解决了在人脸聚类时，若第二照片类中存在与第一照
片类中错误人脸相对应的其他人脸照片，则有可能错误地将第一照片类与第二
照片类聚类至同一个照片类的问题；达到了在聚类时避免出现一个照片类因为
存在少数错误人脸照片时，引入更多错误人脸照片的聚类错误，提高人脸聚类
的准确度的效果。

请参考图2A，其示出了本公开一个示例性实施例提供的人脸聚类方法的方
法流程图。该人脸聚类方法可由智能手机、平板电脑、个人电脑等电子设备的
处理器执行。该人脸聚类方法可以用于上述聚类过程中除全量聚类初始化处理
后的第一次迭代过程以外的任意一次迭代过程。如图2A所示，该人脸聚类方法
可以包括如下步骤：

在步骤201中，获取第一照片类和第二照片类，第一照片类包括聚类得到
的至少两张人脸照片。

第一照片类和第二照片类是初始化后经过至少一次聚类得到的若干个照片
类中的任意两个照片类，第一照片类中包括聚类得到的至少两张人脸照片。

如图2B所示，从经过至少一次人脸聚类得到的若干个照片类中，获取两个
照片类，第一照片类21中包括聚类得到的七张人脸照片25、26、27、28、29、
30、31，第二照片类22中包括聚类得到的三张人脸照片，图2B中采用卡通人
脸照片来示意性地表示人脸照片。

在步骤202中，对第一照片类中的每个人脸照片进行密度聚类，得到至少
一个照片子类。

由于第一照片类中包括聚类得到的至少两张人脸照片，可以对第一照片类
中的人脸照片再次进行聚类。对第一照片类中的每个人脸照片进行密度聚类，
得到至少一个照片类。

该步骤由如下几个步骤实现，如图2C所示：

在步骤2021中，获取第一照片类中每个人脸照片的特征向量。

可选的，人脸照片的特征向量是高维特征向量，每个特征向量的维度都相
同，维度是指每个人脸照片的特征向量中的独立参数的数目，也即用于表征人
脸照片的特征的独立参数的数量相同。

在步骤2022中，通过预设的密度聚类算法计算每个人脸照片的特征向量在
高维空间中的密度分布。

可选的，高维空间是由至少三个独立的参数构成的空间；密度分布能够直
观地表现出人脸照片之间的相似程度，密度分布相同的特征向量一般属于同一
个照片类。

可选的，密度聚类算法是DBSCAN算法、OPTICS算法、IGDCA算法、
LSNCCP算法中的至少一种。

可选的，以密度算法是DBSCAN算法为例，将高维空间中的特征向量转化
为在二维平面上分布的对象，如图2D所示，从任意对象p开始，根据预定的半
径e，在以对象p为圆心，半径为e的区域内查找其他对象，如果对象p在预定
半径e的区域内找到的对象的数量大于密度阈值M，则称对象p为核心对象；
如果对象p是一个核心对象，对象q在以p为圆心，半径为e的区域内，则称p
直接密度可达q；从任意一个对象开始，确定核心对象，并找出每个核心对象的
直接密度可达对象。

在步骤2023中，根据密度分布，将人脸照片分别聚类至至少一个照片子类
中。

根据密度分布，将密度相同的人脸照片聚类至同一个人脸照片子类中，最
终聚类出至少一个照片子类。

可选的，若使用的密度聚类算法是DBSCAN算法，则提取每个核心对象，
及每个核心对象对应的直接密度可达对象，并将每个核心对象及其直接密度可
达对象作为一个类。

如图2E所示，第一照片类聚类出两个照片子类，第一照片类中的人脸照片
中的人脸照片25、26、27、28、29聚类至照片子类23，第一照片类中的人脸照
片30、31聚类至照片子类24。

在步骤203中，计算每个照片子类中的人脸照片的数量。

以图2E为例，照片子类23中人脸照片的数量为5，照片子类24中人脸照
片的数量为2。

在步骤204中，将数量最大的照片子类确定为正确人脸子类。

可选的，包含的人脸照片的数量最大的照片子类中的人脸照片的特征能够
最大程度地代表第一照片类中的大部分人脸照片的特征，因此将数量最大的照
片子类确定为正确人脸子类。

以图2E为例，照片子类23中人脸照片的数量最大，因此将照片子类23作
为正确人脸子类。

在步骤205中，计算正确人脸子类与第二照片类之间的距离。

可选的，用正确人脸子类代表第一照片类，计算与第二照片类之间的距离，
两个照片类之间的距离表示两个照片类中人脸照片的相似程度。

可选的，两个类之间的距离代表两个类中人脸照片的差异程度，距离越小
代表两个类中人脸照片的相似度越大，距离越大代表两个类中人脸照片的相似
度越小。

在步骤206中，若距离大于阈值，则将第一照片类和第二照片类分别聚类
至不同照片类。

可选的，阈值是根据实际需求预先设定的值，或者是经验值。

当正确人脸子类和第二照片类之间的距离大于阈值时，表示正确人脸子类
中的人脸照片和第二照片类中的人脸照片的相似程度不大，照片之间存在较大
的差异，正确人脸子类中的人脸照片属于一个照片类，第二照片类中的人脸照
片属于另一个照片类，正确人脸子类所属的照片类中的人脸照片和第二照片类
所属的照片类中的人脸照片分别对应于不同的人脸。

可选的，若距离小于阈值，则将第一照片类和第二照片类聚类至同一个照
片类。当正确人脸子类与第二照片类之间的距离小于阈值时，表示正确人脸子
类中的人脸照片与第二照片类中的人脸照片相似程度大，可将正确人脸子类中
的人脸照片和第二照片类中的人脸照片作为对应于同一个人脸的照片，由于正
确人脸子类是第一照片类中的照片子类，因此将第一照片类与第二照片类聚类
至同一个照片类中；当任意两个特征点之间的距离大于阈值时，表示正确人脸
子类中的人脸照片与第二照片类中的人脸照片相似程度不大，认为正确人脸子
类中的人脸照片和第二照片类中的人脸照片不是对应于同一个人脸的照片，因
此不将第一照片类与第二照片类聚类至同一个照片类中。

以图2F为例，计算正确人脸子类23与第二照片类22之间的距离，并将距
离与阈值比较，得到正确人脸子类23与第二照片类22之间的距离d小于阈值，
表示正确人脸子类中人脸照片与第二照片类中的人脸照片相似程度较大，认为
是对应于同一个人脸的人脸照片，因此，将第一照片类21和第二照片类22聚
类至同一个照片类31。

此外，本公开实施例所提供的人脸聚类方法，还通过对第一照片类中的每
个人脸照片进行密度聚类得到至少一个照片子类，将不同特征的人脸照片区分
开。

此外，本公开实施例所提供的人脸聚类方法，还通过将照片子类中人脸数
量最大的照片子类确定为正确人脸子类，选出最能代表第一照片类中的人脸照
片的特征的照片子类，使得后续人脸聚类的准确度提高。

需要说明的是，上述人脸聚类方法可重复执行，也即在每完成一次人脸聚
类，照片类中包含的人脸照片出现变动时，就可执行上述人脸聚类方法，确定
出正确人脸子类，利用正确人脸子类参与后续人脸聚类，最终得到聚类结果是
分别属于不同人脸的若干个照片类。

在一个示例性的例子中，采用全量聚类的方法对若干张人脸照片进行初始
化，得到n个照片类，计算n个照片类中任意两个照片类之间的距离，对该n
个照片类进行再次聚类后得到m个照片类，某些照片类中包含至少两张人脸照
片；获取第一照片类和第二照片类，第一照片类中包含至少两张人脸照片，采
用DBSCAN算法对第一照片类中的人脸照片进行密度聚类，得到三个照片子类，
将包含人脸照片数量最大的照片子类作为正确人脸子类A，将得到的正确人脸
子类A与第二照片类之间距离与阈值比较，小于阈值，将第一照片类与第二照
片类聚类至同一个照片类，当m个照片类都完成本次聚类后，得到k个照片类，
在次取出第一照片类和第二照片类，确定出第一照片类中的正确人脸子类，并
使用正确人脸子类完成聚类；如此迭代计算直到n张人脸照片被聚类成若干个
照片类，每个照片类都不能与任意一个照片类聚类至同一个照片类。形成的若
干个照片类即为分别对应不同人脸的若干个相册。

下述为本公开装置实施例，可以用于执行本公开方法实施例。对于本公开
装置实施例中未披露的细节，请参照本公开方法实施例。

请参考图3，其示出了本发明一个实施例提供的人脸聚类装置的结构方框
图。该人脸聚类装置可以通过软件、硬件或者两者的结合实现成为上述可提供
人脸聚类方法的电子设备的全部或者一部分。如图3所示，该装置包括：

类获取模块310，被配置为获取第一照片类和第二照片类，第一照片类包括
聚类得到的至少两张人脸照片。

第一聚类模块320，被配置为对第一照片类中的人脸照片进行聚类，得到至
少一个照片子类。

确定模块330，被配置为将至少一个照片子类中的一个照片子类确定为正确
人脸子类。

距离计算模块340，被配置为计算正确人脸子类与第二照片类之间的距离。

第二聚类模块350，被配置为当距离大于阈值时，将第一照片类和第二照片
类分别聚类至不同的照片类。

综上所述，本公开实施例所提供的人脸聚类装置，通过获取第一照片类和
第二照片类，对第一照片类中人脸照片进行聚类，得到至少一个照片子类，将
至少一个照片子类中的一个照片子类确定为正确人脸子类，计算正确人脸子类
与第二照片类之间的距离，若距离大于阈值，则将第一照片类和第二照片类分
别聚类至不同的照片类；解决了在人脸聚类时，若第二照片类中存在与第一照
片类中错误人脸相对应的其他人脸照片，则有可能错误地将第一照片类与第二
照片类聚类至同一个照片类的问题；达到了在聚类时避免出现一个照片类因为
少数错误人脸照片时，引入更多错误人脸照片的聚类错误，提高人脸聚类的准
确度的效果。

请参考图4，其示出了本发明一个实施例提供的人脸聚类装置的结构方框
图。该人脸聚类装置可以通过软件、硬件或者两者的结合实现成为上述可提供
人脸聚类方法的电子设备的全部或者一部分。如图4所示，该装置包括：

类获取模块410，被配置为获取第一照片类和第二照片类，第一照片类包括
聚类得到的至少两张人脸照片；

第一聚类模块420，被配置为对第一照片类中的人脸照片进行聚类，得到至
少一个照片子类；

确定模块430，被配置为将至少一个照片子类中的一个照片子类确定为正确
人脸子类；

距离计算模块440，被配置为计算正确人脸子类与第二照片类之间的距离；

第二聚类模块450，被配置为当距离大于阈值时，将第一照片类和第二照片
类分别聚类至不同的照片类。

可选的，第一聚类模块420，包括：

密度聚类子模块421，被配置为对第一照片类中的每个人脸照片进行密度聚
类，得到至少一个照片子类。

可选的，对密度聚类子模块421，包括：

获取子模块4211，被配置为获取第一照片类中每个人脸照片的特征向量；

密度计算子模块4212，被配置为通过预设的密度聚类算法计算每个人脸照
片的特征向量在高维空间中的密度分布；

聚类子模块4213，被配置为根据密度分布，将人脸照片分别聚类至至少一
个照片子类中。

可选的，确定模块430，包括：

数量计算子模块431，被配置为计算每个照片子类中的人脸照片的数量；

确定子模块432，被配置为将数量最大的照片子类确定为正确人脸子类。

综上所述，本公开实施例所提供的人脸聚类装置，通过获取第一照片类和
第二照片类，对第一照片类中人脸照片进行聚类，得到至少一个照片子类，将
至少一个照片子类中的一个照片子类确定为正确人脸子类，计算正确人脸子类
与第二照片类之间的距离，若距离大于阈值，则将第一照片类和第二照片类分
别聚类至不同的照片类；解决了在人脸聚类时，若第二照片类中存在与第一照
片类中错误人脸相对应的其他人脸照片，则有可能错误地将第一照片类与第二
照片类聚类至同一个照片类的问题；达到了在聚类时避免出现一个照片类因为
存在少数错误人脸照片时，引入更多错误人脸照片的聚类错误，提高人脸聚类
的准确度的效果。

此外，本公开实施例所提供的人脸聚类装置，还通过对第一照片类中的每
个人脸照片进行密度聚类得到至少一个照片子类，将不同特征的人脸照片区分
开。

此外，本公开实施例所提供的人脸聚类装置，还通过将照片子类中人脸数
量最大的照片子类确定为正确人脸子类，选出最能代表第一照片类中的人脸照
片的特征的照片子类，使得后续人脸聚类的准确度提高。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关
该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本公开一示例性实施例提供了一种人脸聚类装置，能够实现本公开提供的
人脸聚类方法，该人脸聚类装置包括：处理器、用于存储处理器可执行指令的
存储器；

其中，处理器被配置为：

获取第一照片类和第二照片类，第一照片类包括聚类得到的至少两张人脸
照片；

对第一照片类中的人脸照片进行聚类，得到至少一个照片子类；

将至少一个照片子类中的一个照片子类确定为正确人脸子类；

计算正确人脸子类与第二照片类之间的距离；

若距离大于阈值，则将第一照片类和第二照片类分别聚类至不同的照片类。

图5是根据一示例性实施例示出的一种人脸装置的框图。例如，装置500
可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板
设备，医疗设备，健身设备，个人数字助理等。

参照图5，装置500可以包括以下一个或多个组件：处理组件502，存储器
504，电源组件506，多媒体组件508，音频组件510，输入/输出(I/O)接口512，
传感器组件514，以及通信组件516，图像识别组件515。

处理组件502通常控制装置500的整体操作，诸如与显示，电话呼叫，数
据通信，相机操作和记录操作相关联的操作。处理组件502可以包括一个或多
个处理器518来执行指令，以完成上述的方法的全部或部分步骤。此外，处理
组件502可以包括一个或多个模块，便于处理组件502和其他组件之间的交互。
例如，处理组件502可以包括多媒体模块，以方便多媒体组件508和处理组件
502之间的交互。

存储器504被配置为存储各种类型的数据以支持在装置500的操作。这些
数据的示例包括用于在装置500上操作的任何应用程序或方法的指令，联系人
数据，电话簿数据，消息，图片，视频等。存储器504可以由任何类型的易失
性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，
电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，
可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，
磁盘或光盘。

电源组件506为装置500的各种组件提供电力。电源组件506可以包括电
源管理系统，一个或多个电源，及其他与为装置500生成、管理和分配电力相
关联的组件。

多媒体组件508包括在装置500和用户之间的提供一个输出接口的屏幕。
在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏
幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触
摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触
摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与触摸或滑动操作
相关的持续时间和压力。在一些实施例中，多媒体组件508包括一个前置摄像
头和/或后置摄像头。当装置500处于操作模式，如拍摄模式或视频模式时，前
置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置
摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件510被配置为输出和/或输入音频信号。例如，音频组件510包括
一个麦克风(MIC)，当装置500处于操作模式，如呼叫模式、记录模式和语音
识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进
一步存储在存储器504或经由通信组件516发送。在一些实施例中，音频组件
510还包括一个扬声器，用于输出音频信号。

I/O接口512为处理组件502和外围接口模块之间提供接口，上述外围接口
模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音
量按钮、启动按钮和锁定按钮。

传感器组件514包括一个或多个传感器，用于为装置500提供各个方面的
状态评估。例如，传感器组件514可以检测到装置500的打开/关闭状态，组件
的相对定位，例如组件为装置500的显示器和小键盘，传感器组件514还可以
检测装置500或装置500一个组件的位置改变，用户与装置500接触的存在或
不存在，装置500方位或加速/减速和装置500的温度变化。传感器组件514可
以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。
传感器组件514还可以包括光传感器，如CMOS或CCD图像传感器，用于在成
像应用中使用。在一些实施例中，该传感器组件514还可以包括加速度传感器，
陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件516被配置为便于装置500和其他设备之间有线或无线方式的通
信。装置500可以接入基于通信标准的无线网络，如Wi-Fi，2G或3G，或它们
的组合。在一个示例性实施例中，通信组件516经由广播信道接收来自外部广
播管理系统的广播信号或广播相关信息。在一个示例性实施例中，通信组件516
还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射
频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝
牙(BT)技术和其他技术来实现。

在示例性实施例中，装置500可以被一个或多个应用专用集成电路(ASIC)、
数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、
现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实
现，用于执行上述字体添加方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介
质，例如包括指令的存储器504，上述指令可由装置500的处理器518执行以完
成上述字体添加方法。例如，非临时性计算机可读存储介质可以是ROM、随机
存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公
开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，
这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开
的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性
的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结
构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的
权利要求来限制。