一种基于大数据处理的识别方法技术领域
本发明涉及数据处理领域,尤其涉及一种基于大数据处理的识别方法。
背景技术
识别系统是利用电子仪器、计算机等设备构成的一种帮助人们识别某一类事物的
辅助系统。识别系统大体可分为图像识别类和声音识别类两种。随着科技的发达,识别系统
越来越多,越来越智能,但是现有识别系统无法利用和结合用户的人工识别方式进行自我
完善。
发明内容
本发明提供一种基于大数据处理的识别方法,以现有识别系统无法利用和结合用
户的人工识别方式进行自我完善的缺点。
本发明采用如下技术方案:
一种基于大数据处理的识别方法,包括以下步骤:(1)用户获取图像、声音和/或文字,
并将图像、声音和/或文字发送至服务器;(2)由服务器将图像、声音和/或文字与数据库中
的已存资料进行对比识别;(3)若服务器能根据数据库中的已存资料识别图像、声音和/或
文字,则将识别结果反馈给用户;(4)若服务器无法根据数据库中的已存资料识别图像、声
音和/或文字,则服务器自动将图像、声音和/或文字发送给若干个其他用户,由其他用户对
图像、声音和/或文字进行人工识别;(5)将所有人工识别结果汇总,并以数量占比最大的人
工识别结果作为最终的识别结果存入数据库中,同时将这一识别结果反馈给用户。
进一步,所述步骤(1)中,用户通过智能手机获取图像、声音和/或文字,并通过手
机APP将获取图像、声音和/或文字发送至服务器,所述步骤(4)中,其他用户通过手机APP接
收图像、声音和/或文字,并将人工识别的结果发送至服务器。
进一步,所述步骤(1)中,用户通过计算机获取图像、声音和/或文字,并通过软件
将获取图像、声音和/或文字发送至服务器,所述步骤(4)中,其他用户通过计算机软件接收
图像、声音和/或文字,并将人工识别的结果发送至服务器。
进一步,所述步骤(4)中,将图像、声音和/或文字发送给m1个其他用户进行人工识
别,服务器在规定时间h1内接收到的人工识别数量为n1,若n1≥(50%×m1),则执行步骤
(5),若n1<(50%×m1),则将图像、声音和/或文字每隔一时间段h2发送给(m1-n1)×3个新的
其他用户,直至服务器接收到的人工识别总数量N≥(50%×m1)时,执行步骤(5);其中m1≥
100。
进一步, h1为5min,h2为30s。
进一步,所述步骤(2)中,对比识别的内容包括人脸识别、语音识别、文字识别、图
像中事物的名称和/或声音所属事物的名称。
由上述对本发明结构的描述可知,和现有技术相比,本发明具有如下优点:
其一、本发明包括中,若服务器无法根据数据库中的已存资料识别图像、声音和/或文
字,则服务器自动将图像、声音和/或文字发送给若干个其他用户,由其他用户对图像、声音
和/或文字进行人工识别;再将所有人工识别结果汇总,并以数量占比最大的人工识别结果
作为最终的识别结果存入数据库中,同时将这一识别结果反馈给用户。可见,本发明可以让
识别系统在使用过程中,能够结合和利用用户的人工识别功能来不断地改进和完善自身,
以增强识别系统的识别能力。
其二、本发明步骤(4)中,将图像、声音和/或文字发送给m1个其他用户进行人工识
别,服务器在规定时间h1内接收到的人工识别数量为n1,若n1≥(50%×m1),则执行步骤
(5),若n1<(50%×m1),则将图像、声音和/或文字每隔一时间段h2发送给(m1-n1)×3个新的
其他用户,直至服务器接收到的人工识别总数量N≥(50%×m1)时,执行步骤(5);其中m1≥
100。通过上述方式提高人工识别结果的可信度,保证识别系统健康完善。
具体实施方式
下面对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例
仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术
人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于大数据处理的识别方法,包括以下步骤:(1)用户获取图像、声音和/或文
字,并将图像、声音和/或文字发送至服务器;(2)由服务器将图像、声音和/或文字与数据库
中的已存资料进行对比识别;(3)若服务器能根据数据库中的已存资料识别图像、声音和/
或文字,则将识别结果反馈给用户;(4)若服务器无法根据数据库中的已存资料识别图像、
声音和/或文字,则服务器自动将图像、声音和/或文字发送给若干个其他用户,由其他用户
对图像、声音和/或文字进行人工识别;(5)将所有人工识别结果汇总,并以数量占比最大的
人工识别结果作为最终的识别结果存入数据库中,同时将这一识别结果反馈给用户。
作为优选方案:上述步骤(1)中,用户通过智能手机获取图像、声音和/或文字,并
通过手机APP将获取图像、声音和/或文字发送至服务器,所述步骤(4)中,其他用户通过手
机APP接收图像、声音和/或文字,并将人工识别的结果发送至服务器。
作为另一种优选方案:上述步骤(1)中,用户通过计算机获取图像、声音和/或文
字,并通过软件将获取图像、声音和/或文字发送至服务器,所述步骤(4)中,其他用户通过
计算机软件接收图像、声音和/或文字,并将人工识别的结果发送至服务器。这里的计算机
可以是平板电脑、台式机或笔记本。
作为优选方案:上述步骤(4)中,将图像、声音和/或文字发送给m1个其他用户进行
人工识别,服务器在规定时间h1内接收到的人工识别数量为n1,若n1≥(50%×m1),则执行
步骤(5),若n1<(50%×m1),则将图像、声音和/或文字每隔一时间段h2发送给(m1-n1)×3个
新的其他用户,直至服务器接收到的人工识别总数量N≥(50%×m1)时,执行步骤(5);其中
m1≥100,h1可以为5min,h2可以为30s。m1、h1和h2的具体数值可以根据实际需要设定,并不
局限于此。
作为优选方案:上述步骤(2)中,对比识别的内容包括人脸识别、语音识别、文字识
别、图像中事物的名称和/或声音所属事物的名称等。对比识别的内容还可以是现有识别系
统所能识别的其他内容,并不仅仅局限于上述罗列的各内容。
上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此
构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。