一种基于大数据处理的识别方法.pdf

摘要
申请专利号：	CN201610849018.8	申请日：	2016.09.26
公开号：	CN106446165A	公开日：	2017.02.22
当前法律状态：	实审	有效性：	审中
法律详情：	实质审查的生效IPC(主分类):G06F 17/30申请日:20160926\|\|\|公开
IPC分类号：	G06F17/30	主分类号：	G06F17/30
申请人：	厦门吉信德宠物用品有限公司
发明人：	卢孔知
地址：	361000 福建省厦门市湖里区禾山路368号7楼
优先权：
专利代理机构：	泉州市博一专利事务所 35213	代理人：	方传榜
PDF下载：	PDF下载

内容摘要

本发明公开了一种基于大数据处理的识别方法，涉及数据处理领域，包括以下步骤：（1）用户获取图像、声音和/或文字；（2）将图像、声音和/或文字与数据库中的已存资料进行对比识别；（3）若能识别，则将识别结果反馈给用户；（4）若无法识别，则服务器自动将图像、声音和/或文字发送给若干个其他用户，由其他用户对图像、声音和/或文字进行人工识别；（5）将所有人工识别结果汇总，并以数量占比最大的人工识别结果作为最终的识别结果存入数据库中，同时将这一识别结果反馈给用户。本发明的有益效果：可以让识别系统在使用过程中，能够结合和利用用户的人工识别功能来不断地改进和完善自身，以不断增强识别系统的识别能力。

权利要求书

1.一种基于大数据处理的识别方法，包括以下步骤：（1）用户获取图像、声音和/或文
字，并将图像、声音和/或文字发送至服务器；（2）由服务器将图像、声音和/或文字与数据库
中的已存资料进行对比识别；（3）若服务器能根据数据库中的已存资料识别图像、声音和/
或文字，则将识别结果反馈给用户；其特征在于：（4）若服务器无法根据数据库中的已存资
料识别图像、声音和/或文字，则服务器自动将图像、声音和/或文字发送给若干个其他用
户，由其他用户对图像、声音和/或文字进行人工识别；（5）将所有人工识别结果汇总，并以
数量占比最大的人工识别结果作为最终的识别结果存入数据库中，同时将这一识别结果反
馈给用户。
2.如权利要求1所述的一种基于大数据处理的识别方法，其特征在于：所述步骤（1）中，
用户通过智能手机获取图像、声音和/或文字，并通过手机APP将获取图像、声音和/或文字
发送至服务器，所述步骤（4）中，其他用户通过手机APP接收图像、声音和/或文字，并将人工
识别的结果发送至服务器。
3.根据权利要求1所述的一种基于大数据处理的识别方法，其特征在于：所述步骤（1）
中，用户通过计算机获取图像、声音和/或文字，并通过软件将获取图像、声音和/或文字发
送至服务器，所述步骤（4）中，其他用户通过计算机软件接收图像、声音和/或文字，并将人
工识别的结果发送至服务器。
4.根据权利要求1所述的一种基于大数据处理的识别方法，其特征在于：所述步骤（4）
中，将图像、声音和/或文字发送给m1个其他用户进行人工识别，服务器在规定时间h1内接
收到的人工识别数量为n1，若n1≥(50%×m1)，则执行步骤（5）,若n1<(50%×m1)，则将图像、
声音和/或文字每隔一时间段h2发送给(m1-n1)×3个新的其他用户，直至服务器接收到的
人工识别总数量N≥(50%×m1)时，执行步骤（5）；其中m1≥100。
5.根据权利要求5所述的一种基于大数据处理的识别方法，其特征在于： h1为5min，h2
为30s。
6.根据权利要求1所述的一种基于大数据处理的识别方法，其特征在于：所述步骤（2）
中，对比识别的内容包括人脸识别、语音识别、文字识别、图像中事物的名称和/或声音所属
事物的名称。

说明书

一种基于大数据处理的识别方法

技术领域

本发明涉及数据处理领域，尤其涉及一种基于大数据处理的识别方法。

背景技术

识别系统是利用电子仪器、计算机等设备构成的一种帮助人们识别某一类事物的
辅助系统。识别系统大体可分为图像识别类和声音识别类两种。随着科技的发达，识别系统
越来越多，越来越智能，但是现有识别系统无法利用和结合用户的人工识别方式进行自我
完善。

发明内容

本发明提供一种基于大数据处理的识别方法，以现有识别系统无法利用和结合用
户的人工识别方式进行自我完善的缺点。

本发明采用如下技术方案：

一种基于大数据处理的识别方法，包括以下步骤：（1）用户获取图像、声音和/或文字，
并将图像、声音和/或文字发送至服务器；（2）由服务器将图像、声音和/或文字与数据库中
的已存资料进行对比识别；（3）若服务器能根据数据库中的已存资料识别图像、声音和/或
文字，则将识别结果反馈给用户；（4）若服务器无法根据数据库中的已存资料识别图像、声
音和/或文字，则服务器自动将图像、声音和/或文字发送给若干个其他用户，由其他用户对
图像、声音和/或文字进行人工识别；（5）将所有人工识别结果汇总，并以数量占比最大的人
工识别结果作为最终的识别结果存入数据库中，同时将这一识别结果反馈给用户。

进一步，所述步骤（1）中，用户通过智能手机获取图像、声音和/或文字，并通过手
机APP将获取图像、声音和/或文字发送至服务器，所述步骤（4）中，其他用户通过手机APP接
收图像、声音和/或文字，并将人工识别的结果发送至服务器。

进一步，所述步骤（1）中，用户通过计算机获取图像、声音和/或文字，并通过软件
将获取图像、声音和/或文字发送至服务器，所述步骤（4）中，其他用户通过计算机软件接收
图像、声音和/或文字，并将人工识别的结果发送至服务器。

进一步，所述步骤（4）中，将图像、声音和/或文字发送给m1个其他用户进行人工识
别，服务器在规定时间h1内接收到的人工识别数量为n1，若n1≥(50%×m1)，则执行步骤
（5）,若n1<(50%×m1)，则将图像、声音和/或文字每隔一时间段h2发送给(m1-n1)×3个新的
其他用户，直至服务器接收到的人工识别总数量N≥(50%×m1)时，执行步骤（5）；其中m1≥
100。

进一步， h1为5min，h2为30s。

进一步，所述步骤（2）中，对比识别的内容包括人脸识别、语音识别、文字识别、图
像中事物的名称和/或声音所属事物的名称。

由上述对本发明结构的描述可知，和现有技术相比，本发明具有如下优点：

其一、本发明包括中，若服务器无法根据数据库中的已存资料识别图像、声音和/或文
字，则服务器自动将图像、声音和/或文字发送给若干个其他用户，由其他用户对图像、声音
和/或文字进行人工识别；再将所有人工识别结果汇总，并以数量占比最大的人工识别结果
作为最终的识别结果存入数据库中，同时将这一识别结果反馈给用户。可见，本发明可以让
识别系统在使用过程中，能够结合和利用用户的人工识别功能来不断地改进和完善自身，
以增强识别系统的识别能力。

其二、本发明步骤（4）中，将图像、声音和/或文字发送给m1个其他用户进行人工识
别，服务器在规定时间h1内接收到的人工识别数量为n1，若n1≥(50%×m1)，则执行步骤
（5）,若n1<(50%×m1)，则将图像、声音和/或文字每隔一时间段h2发送给(m1-n1)×3个新的
其他用户，直至服务器接收到的人工识别总数量N≥(50%×m1)时，执行步骤（5）；其中m1≥
100。通过上述方式提高人工识别结果的可信度，保证识别系统健康完善。

具体实施方式

下面对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例
仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术
人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种基于大数据处理的识别方法，包括以下步骤：（1）用户获取图像、声音和/或文
字，并将图像、声音和/或文字发送至服务器；（2）由服务器将图像、声音和/或文字与数据库
中的已存资料进行对比识别；（3）若服务器能根据数据库中的已存资料识别图像、声音和/
或文字，则将识别结果反馈给用户；（4）若服务器无法根据数据库中的已存资料识别图像、
声音和/或文字，则服务器自动将图像、声音和/或文字发送给若干个其他用户，由其他用户
对图像、声音和/或文字进行人工识别；（5）将所有人工识别结果汇总，并以数量占比最大的
人工识别结果作为最终的识别结果存入数据库中，同时将这一识别结果反馈给用户。

作为优选方案：上述步骤（1）中，用户通过智能手机获取图像、声音和/或文字，并
通过手机APP将获取图像、声音和/或文字发送至服务器，所述步骤（4）中，其他用户通过手
机APP接收图像、声音和/或文字，并将人工识别的结果发送至服务器。

作为另一种优选方案：上述步骤（1）中，用户通过计算机获取图像、声音和/或文
字，并通过软件将获取图像、声音和/或文字发送至服务器，所述步骤（4）中，其他用户通过
计算机软件接收图像、声音和/或文字，并将人工识别的结果发送至服务器。这里的计算机
可以是平板电脑、台式机或笔记本。

作为优选方案：上述步骤（4）中，将图像、声音和/或文字发送给m1个其他用户进行
人工识别，服务器在规定时间h1内接收到的人工识别数量为n1，若n1≥(50%×m1)，则执行
步骤（5）,若n1<(50%×m1)，则将图像、声音和/或文字每隔一时间段h2发送给(m1-n1)×3个
新的其他用户，直至服务器接收到的人工识别总数量N≥(50%×m1)时，执行步骤（5）；其中
m1≥100，h1可以为5min，h2可以为30s。m1、h1和h2的具体数值可以根据实际需要设定，并不
局限于此。

作为优选方案：上述步骤（2）中，对比识别的内容包括人脸识别、语音识别、文字识
别、图像中事物的名称和/或声音所属事物的名称等。对比识别的内容还可以是现有识别系
统所能识别的其他内容，并不仅仅局限于上述罗列的各内容。

上述仅为本发明的具体实施方式，但本发明的设计构思并不局限于此，凡利用此
构思对本发明进行非实质性的改动，均应属于侵犯本发明保护范围的行为。