一种人机识别方法及系统.pdf

上传人:111****11 文档编号:472142 上传时间:2018-02-18 格式:PDF 页数:20 大小:2.50MB
返回 下载 相关 举报
摘要
申请专利号:

CN201310068736.8

申请日:

2013.03.05

公开号:

CN104036780A

公开日:

2014.09.10

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G10L 17/04申请日:20130305|||公开

IPC分类号:

G10L17/04(2013.01)I; G10L17/22(2013.01)I; H04L29/06

主分类号:

G10L17/04

申请人:

阿里巴巴集团控股有限公司

发明人:

付颖芳; 张玉东

地址:

英属开曼群岛大开曼资本大厦一座四层847号邮箱

优先权:

专利代理机构:

北京安信方达知识产权代理有限公司 11262

代理人:

栗若木

PDF下载: PDF下载
内容摘要

本申请公开了一种人机识别方法及系统;方法包括:当收到用户的注册请求时,提供要求用户口述的注册验证信息;接收用户的语音数据,建立声纹特征模型并保存;当收到用户的登录请求时,提供要求用户口述的登录验证信息;接收用户的语音数据,建立声纹特征模型,并与该用户注册时的声纹特征模型进行比较;根据比较结果判断是否为用户本人登录。本申请能够提高人机识别的破解难度。

权利要求书

1.  一种人机识别方法,包括:
当收到用户的注册请求时,提供要求用户口述的注册验证信息;
接收用户的语音数据,建立声纹特征模型并保存;
当收到用户的登录请求时,提供要求用户口述的登录验证信息;
接收用户的语音数据,建立声纹特征模型,并与该用户注册时的声纹特征模型进行比较;
根据比较结果判断是否为用户本人登录。

2.
  如权利要求1所述的方法,其特征在于:
所述登录验证信息为所述注册验证信息的一个子集。

3.
  如权利要求2所述的方法,其特征在于,所述提供要求用户口述的注册验证信息的步骤包括:
随机产生由数字和字符组成的n个不同元素;
从n个不同元素中,取r个不重复的元素,按次数排列,排列的全体或部分组成注册验证码集合;
所述提供要求用户口述的登录验证信息的步骤包括:
从注册验证码集合中取t个不同子集组成新的子集;
从新的子集的全体或部分组成的集合中,随机抽取一个所述新的子集作为登录验证信息;
所述n、r、t均为正整数,其中r小于或等于n;t小于或等于所述注册验证码集合的子集总数。

4.
  如权利要求2所述的方法,其特征在于,所述提供要求用户口述的注册验证信息的步骤包括:
从问题库中随机抽取多个问题并推送给用户,要求用户口述对于所推送的所有问题的回答;
所述提供登录验证信息的步骤包括:
从该用户注册时推送的多个问题中随机抽取一个推送给用户,要求用户口述对于所推送的问题的回答。

5.
  如权利要求1~4中任一项所述的方法,其特征在于,当收到用户的注册请求后还包括:
保存用户输入的密码;
根据比较结果判断是否为用户本人登录的步骤前还包括:
接收用户输入的密码,并与该用户注册时输入的密码进行比较。
根据比较结果判断是否为用户本人登录的步骤包括:
如果声纹特征模型匹配和密码均匹配,则判断是用户本人登录;其余情况判断不是用户本人登录。

6.
  如权利要求1~4中任一项所述的方法,其特征在于,当收到用户的登录请求后、提供要求用户口述的注册验证信息的步骤前还包括:
判断同一用户或同一设备是否在预定时间内发送登录请求的次数超过次数阈值;
如果是,则判断该用户或该设备发送的登录请求非法;
如果不是,则进行所述提供要求用户口述的注册验证信息的步骤。

7.
  一种人机识别系统,其特征在于,包括:
声纹特征模型建立模块;
声纹身份注册模块,用于当收到用户的注册请求时,提供要求用户口述的注册验证信息;接收用户的语音数据,指示所述声纹特征模型建立模块建立声纹特征模型,保存所建立的声纹特征模型;
声纹身份验证模块,用于当收到用户的登录请求时,提供要求用户口述的登录验证信息;接收用户的语音数据,指示所述声纹特征模型建立模块建立声纹特征模型,并将建立的声纹特征模型与该用户注册时的声纹特征模型进行比较;
人机识别评估模块,用于根据比较结果判断是否为用户本人登录。

8.
  如权利要求7所述的系统,其特征在于:
所述登录验证信息为所述注册验证信息的一个子集。

9.
  如权利要求8所述的系统,其特征在于,所述声纹身份注册模块提供要求用户口述的注册验证信息是指:
所述声纹身份注册模块随机产生由数字和字符组成的n个不同元素;从n个不同元素中,取r个不重复的元素,按次数排列,排列的全体或部分组成注册验证码集合;
所述声纹身份验证模块提供要求用户口述的登录验证信息是指:
所述声纹身份验证模块从注册验证码集合中取t个不同子集组成新的子集;从新的子集的全体或部分组成的集合中,随机抽取一个所述新的子集作为登录验证信息;
所述n、r、t均为正整数,其中r小于或等于n;t小于或等于所述注册验证码集合的子集总数。

10.
  如权利要求8所述的系统,其特征在于,所述声纹身份注册模块提供要求用户口述的注册验证信息是指:
所述声纹身份注册模块从问题库中随机抽取多个问题并推送给用户,要求用户口述对于所推送的所有问题的回答;
所述声纹身份验证模块提供登录验证信息是指:
所述声纹身份验证模块从该用户注册时推送的多个问题中随机抽取一个推送给用户,要求用户口述对于所推送的问题的回答。

11.
  如权利要求7~10中任一项所述的系统,其特征在于,还包括:
密码身份注册模块,用于保存用户注册时输入的密码;
密码身份验证模块,用于接收用户登录时输入的密码,并与该用户注册时输入的密码进行比较;
所述人机识别评估模块根据比较结果判断是否为用户本人登录是指:
所述人机识别评估模块当声纹特征模型和密码均匹配时,判断是用户本人登录;其余情况判断不是用户本人登录。

12.
  如权利要求7~10中任一项所述的方法,其特征在于:
所述人机识别评估模块还用于当收到用户的登录请求后,先判断同一用户或同一设备是否在预定时间内发送登录请求的次数超过次数阈值;如果是,则判断该用户或该设备发送的登录请求非法;如果不是,则指示所述声纹身份验证模块进行所述提供要求用户口述的注册验证信息的操作。

说明书

一种人机识别方法及系统
技术领域
本发明涉及计算机领域,尤其涉及一种人机识别方法及系统。
背景技术
随着互联网的普及,各种网络服务日益成为人们日常生活的一部分,如电子商务、免费的电子邮箱服务、免费的资源下载等等。然而,这些面向人类用户的服务时常被非法用户攻击和一些恶意计算机程序滥用,它们占用服务资源,产生大量的网络垃圾,影响用户的网络体验,对网络服务的安全性造成极大威胁。
人机识别系统是一种全自动开放式人机区分图灵机测试(Completely Automated Public Turing test to tell computers and humans apart,CAPTCHA),利用进行问答式身份验证的安全措施来区分计算机与人为目标的系统。CAPTCHA的运行机制如下:一个专门的服务器负责产生和评估CAPTCHA测试,用户使用某个需验证的网络服务时,服务器提供给用户一个测试,用户做完后将测试结果提交给服务器,服务器根据结果进行评估,决定该用户能否通过测试。
目前CAPTCHA技术主要采用的技术有文本CAPTCHA、图像CAPTCHA、声音CAPTCHA技术,3类CAPTCHA技术基于AI领域的不同问题,具有不同的特性:
文本CAPTCHA利用人和机器在字符识别方面的差异,利用验证码技术来区别人和机器。所谓验证码,就是将一串随机产生的数字或符号,生成一幅扭曲字符串的图片,图片里加上一些干扰像素(防止光学字符识别),由用户肉眼识别其中的验证码信息,输入表单提交网站验证,验证成功后才能使用某项功能。如CSDN(Chinese software develop net,中国软件开发联盟) 网站用户登录用的是GIF格式+数字方式;QQ网站注册采用随机生成的汉字,登录采用PNG格式,图片用的随机数字+随机大写英文字母;MSN的hotmail申请时用的BMP格式,随机数字+随机大写英文字母+随机干扰像素+随机位;google的gmail注册的时候采用JPG格式,随机数字+随机颜色+随机位置+随机长度;某些大型论坛采用XBM格式,内容随机。
图像CAPTCHA利用人和机器在图像分类、目标识别、常见理解等方面的差异,通常独立于不同语言,无需用户文本输入、更难破解。如CMU设计的CAPTCHA BONGO,利用两组视觉模型(如线、圆、方块等),让用户判断新模式的类别,然而2选1的设计无法保证其安全性;再比如带标注的图像数据库,此类CAPTCHA的致命弱点是一旦用户拥有了这个数据库,算法不攻自破。google推出一种基于图像方向识别的CAPTCHA What’s up,一幅图像旋转到它的垂直方向。What’s up无需图像标注,通过在测试中加入候选图,利用用户反馈结果修正初始标注。此外,What’s up训练了一个自动图像方向检测器过滤掉能被机器识别的图像,根据反馈机制过滤掉不易被人类用户识别的图像,确保测试能被大多数人类用户通过而机器不能通过。与基于图像分类的CAPTCHA相比,What’s up利用更难的图像理解问题,需要用户对图像中的内容进行分析;可用图像的数量庞大,不受限于具体的物品图像;根据用户反馈自动标注图像,少了繁琐的人工参与。
声音CAPTCHA利用人和机器在语音识别上的差异,以随机间隔播放随机选择的一个或多个人播报的数字、字母或单词,并添加背景噪声以抵抗ASR(Automatic Speech Recognition,自动语音识别技术)的攻击,在声音CAPTCHA BYAN-I和BYAN-II中,用户被提示选择惯用语言,计算机据此随机选择6个数字生成测试音频,音频中添加另一个讲话者的声音作为背景噪声,用户需正确输入测试音频中的6个数字。其中,BYAN-I的背景噪声是相同的6个数字,BYAN-II的背景噪声是随机选取的词汇。
目前,主流CAPTCHA技术虽然某种程度避免了恶意计算机程序滥用网络服务,但易遭受各种攻击而被破解,用户的体验性也很差。具体分析如下:
文本CAPTCHA通过扭曲文字或字符来识别人和机器,在某种程度上防止了计算机程序的恶意注册或登录,但是随着字符分割和光学字符识别 (Optical Character Recognition,OCR)技术的发展,大多数文本CAPTCHA已被成功破解,简单的字符识别问题已不能阻止计算机程序,况且扭曲的文字让人也难以识别,使得用户体验很不好。
图像CAPTCHA利用人和机器在图像分类、目标识别、常见理解等方面的差异,通常独立于不同语言,无需用户文本输入、虽然比文本CAPTCHA难破解,但是这些图像CAPTCHA需要庞大的数据库支持,无法大规模产生,此外,易遭受机器学习算法的攻击,如:Golle设计了一个结合颜色和纹理特征的SVM(Support Vector Machine,支持向量机)分类器对猫狗图像进行分类,在单幅图像上获得82.7%的高正确率,对包含12幅图的Asirra破解成功率可达10.3%。
声音CAPTCHA利用人和机器在语音识别上的差异来区别人和机器,但是声音CAPTCHA同样容易受到机器学习算法的攻击。Tam等人用固定长度的窗口搜索音频,筛选出能量峰进行识别,在其上提取3种音频特征:梅尔倒谱系数、感知线性预测、相关频谱转换-感知线性预测,采用AdaBoost,SVM,k-NN三种机器学习算法分别训练,对Google,Digg和ReCAPTCHA的破解成功率分别为67%,71%和45%。也有人采用相似的方法破解了eBay的声音CAPTCHA,破解率达75%。
发明内容
本申请要解决的技术问题是如何提高人机识别的破解难度。
为了解决上述问题,本申请提供了一种人机识别方法,包括:
当收到用户的注册请求时,提供要求用户口述的注册验证信息;
接收用户的语音数据,建立声纹特征模型并保存;
当收到用户的登录请求时,提供要求用户口述的登录验证信息;
接收用户的语音数据,建立声纹特征模型,并与该用户注册时的声纹特征模型进行比较;
根据比较结果判断是否为用户本人登录。
进一步地,所述登录验证信息为所述注册验证信息的一个子集。
进一步地,所述提供要求用户口述的注册验证信息的步骤包括:
随机产生由数字和字符组成的n个不同元素;
从n个不同元素中,取r个不重复的元素,按次数排列,排列的全体或部分组成注册验证码集合;
所述提供要求用户口述的登录验证信息的步骤包括:
从注册验证码集合中取t个不同子集组成新的子集;
从新的子集的全体或部分组成的集合中,随机抽取一个所述新的子集作为登录验证信息;
所述n、r、t均为正整数,其中r小于或等于n;t小于或等于所述注册验证码集合的子集总数。
进一步地,所述提供要求用户口述的注册验证信息的步骤包括:
从问题库中随机抽取多个问题并推送给用户,要求用户口述对于所推送的所有问题的回答;
所述提供登录验证信息的步骤包括:
从该用户注册时推送的多个问题中随机抽取一个推送给用户,要求用户口述对于所推送的问题的回答。
进一步地,当收到用户的注册请求后还包括:
保存用户输入的密码;
根据比较结果判断是否为用户本人登录的步骤前还包括:
接收用户输入的密码,并与该用户注册时输入的密码进行比较。
根据比较结果判断是否为用户本人登录的步骤包括:
如果声纹特征模型匹配和密码均匹配,则判断是用户本人登录;其余情况判断不是用户本人登录。
进一步地,当收到用户的登录请求后、提供要求用户口述的注册验证信息的步骤前还包括:
判断同一用户或同一设备是否在预定时间内发送登录请求的次数超过次 数阈值;
如果是,则判断该用户或该设备发送的登录请求非法;
如果不是,则进行所述提供要求用户口述的注册验证信息的步骤。
本申请还提供了一种人机识别系统,包括:
声纹特征模型建立模块;
声纹身份注册模块,用于当收到用户的注册请求时,提供要求用户口述的注册验证信息;接收用户的语音数据,指示所述声纹特征模型建立模块建立声纹特征模型,保存所建立的声纹特征模型;
声纹身份验证模块,用于当收到用户的登录请求时,提供要求用户口述的登录验证信息;接收用户的语音数据,指示所述声纹特征模型建立模块建立声纹特征模型,并将建立的声纹特征模型与该用户注册时的声纹特征模型进行比较;
人机识别评估模块,用于根据比较结果判断是否为用户本人登录。
进一步地,所述登录验证信息为所述注册验证信息的一个子集。
进一步地,所述声纹身份注册模块提供要求用户口述的注册验证信息是指:
所述声纹身份注册模块随机产生由数字和字符组成的n个不同元素;从n个不同元素中,取r个不重复的元素,按次数排列,排列的全体或部分组成注册验证码集合;
所述声纹身份验证模块提供要求用户口述的登录验证信息是指:
所述声纹身份验证模块从注册验证码集合中取t个不同子集组成新的子集;从新的子集的全体或部分组成的集合中,随机抽取一个所述新的子集作为登录验证信息;
所述n、r、t均为正整数,其中r小于或等于n;t小于或等于所述注册验证码集合的子集总数。
进一步地,所述声纹身份注册模块提供要求用户口述的注册验证信息是 指:
所述声纹身份注册模块从问题库中随机抽取多个问题并推送给用户,要求用户口述对于所推送的所有问题的回答;
所述声纹身份验证模块提供登录验证信息是指:
所述声纹身份验证模块从该用户注册时推送的多个问题中随机抽取一个推送给用户,要求用户口述对于所推送的问题的回答。
进一步地,所述的系统还包括:
密码身份注册模块,用于保存用户注册时输入的密码;
密码身份验证模块,用于接收用户登录时输入的密码,并与该用户注册时输入的密码进行比较;
所述人机识别评估模块根据比较结果判断是否为用户本人登录是指:
所述人机识别评估模块当声纹特征模型和密码均匹配时,判断是用户本人登录;其余情况判断不是用户本人登录。
进一步地,所述人机识别评估模块还用于当收到用户的登录请求后,先判断同一用户或同一设备是否在预定时间内发送登录请求的次数超过次数阈值;如果是,则判断该用户或该设备发送的登录请求非法;如果不是,则指示所述声纹身份验证模块进行所述提供要求用户口述的注册验证信息的操作。
本申请的至少一个实施例采用口述验证码加声纹认证的方式设计出人机识别方案,这种方式与现前的文本、图像、声音CAPTCHA技术相比,难攻破,可以避免非法用户和恶意计算机程序滥用网络服务,从而有效保障互联网的安全,且能提高用户体验。本申请的一个优化方案中验证码采用动态文本,可实现文本部分相关的声纹识别,能兼顾可靠性和延迟性能。本申请的又一个优化方案中将声纹识别与手输密码的方式相结合,能保证隐私信息不被泄露,还能提高系统性能,且提高了网络服务的安全性、性能及用户体验,因为如果单纯采用手输密码和手输动态验证码的身份验证的方式,密码易忘记,且易遭密码截取伪冒攻击和验证码破解攻击而至的机器滥用网络服务。本申请的又一个优化方案中还引入人机识别评估控制功能,能甄别出不合常 理的情况,识别出非法用户或恶意计算机程序;该优化方案中密码身份验证功能、声纹身份验证功能、人机识别评估控制功能还可以采取三权分立的原则,互相牵制又互相独立的办法防止单点失效和内部攻击。本申请的又一个优化方案将接入人机识别服务功能集中或分布部署在路由器上,可以在网络边缘控制好恶意程序对网络服务资源的滥用,其中分别有如下优势:集中部署在某一台路由器上便于集中管理;分布部署在不同路由器上,可以利用负载平衡算法分布式管理,防止单点失效攻击,提高网络服务系统性能。
附图说明
图1是实施例一的人机识别方法的流程示意图;
图2是用户注册界面的示例;
图3是人机识别登录验证界面的示例;
图4是实现人机识别方法的架构示意图;
图5是人机识别服务集中式部署在边缘路由器上时的示意图;
图6是人机识别服务分布式部署在边缘路由器上时的示意图;
图7是实施例二的人机识别系统的结构示意图;
图8是实施例二中一个具体例子的结构示意图。
具体实施方式
下面将结合附图及实施例对本申请的技术方案进行更详细的说明。
需要说明的是,如果不冲突,本申请实施例以及实施例中的各个特征可以相互结合,均在本申请的保护范围之内。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例一,一种人机识别方法,如图1所示,包括:
S101、当收到用户的注册请求时,提供要求用户口述的注册验证信息;
S102、接收用户的语音数据,建立声纹特征模型并保存;
S103、当收到用户的登录请求时,提供要求用户口述的登录验证信息;
S104、接收用户的语音数据,建立声纹特征模型,并与该用户注册时的声纹特征模型进行比较;
S105、根据比较结果判断是否为用户本人登录。
本实施例将声纹识别与人机识别技术相结合,可以提高识别的可靠性、准确性。声纹识别属于生物识别技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。每个人,无论别人模仿多么相似,都具有独一无二的声纹,这是由每个人的发声器官在成长过程中形成的。
本实施例中,所述注册验证信息和登录验证信息可以采用文本或图片的形式进行呈现。可以是未经变形处理的字符(包括数字、字母、汉字等),这样能提高用户体验;也可以对注册验证信息和/或登录验证信息进行扭曲或加入干扰像素。
本实施例的一种实施方式中,所述登录验证信息为所述注册验证信息的一个子集。
声纹识别分文本无关声纹识别和文本相关声纹识别。文本无关声纹识别是指注册和测试可采用任意不同文本,而文本相关声纹识别是指注册与测试必须采用相同的文本。单纯采用文本无关的声纹特征模式,其延迟性能比单纯采用手输验证码和文本相关声纹验证的延迟性能要差,以致用户体验性差。而该实施方式中,登录验证信息为动态文本,进行的是文本部分相关的声纹识别,这样可以兼顾延时性能和人机识别的可靠性。
该实施方式的一种备选方案中,所述登录验证信息为注册验证信息在排列基础上的任意组合。
排列定义:从n个不同的元素中,取r个不重复的元素,按次序排列,称为从n个中取r个的无重排列,排列的全体组成的集合用P(n,r)表示:
Pnr=n(n-1)...(n-r+1).]]>
组合定义:从n个不同元素中取r个不重复的元素组成一个子集,而不考虑其元素的顺序,称为从n个中取r个的无重组合。组合的全体组成的集 合用C(n,r)表示:
Cnr=Pnrr!=n!r!(n-1)!;]]>
所述n、r均为正整数,其中r小于或等于n。
该备选方案中,所述提供要求用户口述的注册验证信息的步骤具体可以包括:
随机产生由数字和字符组成的n个不同元素;
从n个不同元素中,取r个不重复的元素,按次数排列,其排列的全体或部分组成注册验证码集合,该集合的元素的最大个数R为:
R=Pnr=n(n-1)...(n-r+1);]]>
所述提供要求用户口述的登录验证信息的步骤具体可以包括:
从注册验证码集合中取t个不同子集组成新的子集,新的子集的全体或部分组成的集合的元素的最大个数C为:
C=CRt=R!t!(R-t)!;]]>
从新的子集的全体或部分组成的集合中随机抽取一个所述新的子集作为登录验证信息;
所述n、r、t均为正整数,其中r小于或等于n;t小于或等于所述注册验证码集合的子集总数。
例如:一用户在注册时,随机产生由数字和字符组成的n=4个不同元素;系统从n=4个不同元素中,取r=2个不重复的元素,按次数排列;从注册验证码集合R中取t=3个不同子集组成新的子集,那么其注册验证信息和登录验证信息的获得过程如下:
(一)注册验证信息的产生:
随机产生4个字符:6、a、9、k,即n=4;
从以上4个元素中,取2个不重复的元素,按次数排列组成的注册验证码集合的元素个数为:
R=P42=4×3=12.]]>
具体元素为:{(6a)、(69)、(6k)、(a6)、(a9)、(ak)、(96)、(9a)、(9k)、(k6)、(ka)、(k9)};(这里是将排列的全体作为注册验证码集合,实施时也可以只用排列的部分作为注册验证码集合)
因此,显示在用户面前的注册验证信息为:
6a、69、6k、a6、a9、ak、96、9a、9k、k6、ka、k9。
(二)登录验证信息的产生:
从注册验证码集合的12个元素中取3个不同子集组成新的子集,新的子集的全体组成的登录验证码集合的元素个数C为:
C=C123=12!3!9!=220.]]>
具体元素为:{[(6a),(69),(6k)]、[(a6),(a9),(ak)]、[(96),(9a),(9k)]……[(k6),(ka),(k9)]}。
从新的子集的全体或部分组成的集合中随机抽取一个所述新的子集,如[(a6),(a9),(ak)]作为登录验证码,推送给用户。
该实施方式的另一种备选方案中,所述提供要求用户口述的注册验证信息的步骤具体可以包括:
从问题库中随机抽取多个问题并推送给用户,要求用户口述对于所推送的所有问题的回答;
该备选方案中,所述提供登录验证信息的步骤具体可以包括:
从该用户注册时推送的多个问题中随机抽取一个推送给用户,要求用户口述对于所推送的问题的回答。
例如:用户注册时,系统随机抽出4个问题,用户也做相应问答如下:
(一)注册验证信息的产生:
系统问题:你喜欢运动是?你最喜欢的人是?你最喜欢的动物是?
(二)登录验证信息的产生:
系统问题:你最喜欢的动物是?
本备选方案从人脑思维与计算思维的本质区别入手(电脑思维是对人脑 思维功能的模拟,它不可能具备由人类感情、想象、猜测等心理活动所构成的精神世界,也不具有社会性和人的意识所有特有的能动的创造性),改现有的手输验证码为口述文本有关动态验证码,使得设计的问题动态出现,并具有情感、思考和逻辑性,能很好的区别是人还是机器。
其它备选方案中,也可以在注册验证信息中随机任选部分内容作为登录验证信息。
其它实施方式中,也可以采用文本相关(即登录验证信息和注册验证信息完全相同)或文本无关(即登录验证信息和注册验证信息完全不同)的声纹识别。
本实施例的一种实施方式中,当收到用户的注册请求后还可以包括:
保存用户输入的密码;
步骤S105前还可以包括:
接收用户输入的密码,并与该用户注册时输入的密码进行比较。
步骤S105具体可以包括:
如果声纹特征模型与声纹特征模型和密码均匹配,则判断是用户本人登录;其余情况判断不是用户本人登录。
该实施方式中,手输密码可保证隐私安全(私人密码不宜于在公开场所语音讲出),还可以提高系统性能(手输密码验证性能比单纯采用声纹验证延迟性能要好)。如果用户密码丢失,还可以通过邮件地址或手机号找回。
该实施方式的一种备选方案中,注册过程包括密码身份注册和声纹身份注册,其注册界面的一个示例如图2所示。
其中密码身份注册采用通用的密码身份注册模式,即输入用户名和密码。
声纹身份注册时,口述注册验证码或对相关问题的答案。
提取出用户声纹特征建立声纹特征模型。
人机识别登录验证界面的一个示例如图3所示。
用户在需要获取网络服务的时候,进行登录验证,手工输入用户名和密码,口述登录验证码或相关问题的答案。
提取出用户声纹特征建立声纹特征模型,并与注册时的声纹特征模式进行模式匹配,如果密码和声纹特征模型均匹配,则允许其接入网络服务;只要密码和声纹特征模型中有一个不匹配,拒绝其接入网络服务,隔离并报警。
本实施例的一种实施方式中,当收到用户的登录请求后、所述提供要求用户口述的注册验证信息的步骤前还可以包括:
判断同一用户或同一设备是否在预定时间内发送登录请求的次数超过次数阈值;
如果是,则判断该用户或该设备发送的登录请求非法;
如果不是,则进行所述提供要求用户口述的注册验证信息的步骤。
所述时间阈值或次数阈值可根据经验值或试验值设定,能够将因为网络性能的问题而重复发送登录请求的情况排除在外。
本实施例的一个具体例子中,采用如图4所示的架构实现人机识别方法,该架构包括三层:
用户终端层,该层包括一个或多个带有语音通信装置的用户终端,用户终端设备可以是PC(包括台式机、笔记本、MAC一体机等)、智能手机、PDA、平板电脑等终端。
接入人机识别服务层,该层包括负责用户密码身份验证的一个或多个专门的密码验证服务器、负责用户声纹特征验证的一个或多个专门的声纹验证服务器、负责评估和控制合法用户终端访问网络服务的一个或多个人机识别评估控制服务器。密码验证服务器、声纹验证服务器及人机识别评估控制服务器采取互相监督又互相独立的“三权分立”原则来管理,即一个用户终端的登录请求首先由人机识别评估控制服务器判断是否合法,然后必须通过密码验证服务器、声纹验证服务器的合法验证后才能获得网络服务,密码验证服务器、声纹验证服务器又可监督人机识别评估控制服务器的判决结果。
网络服务层,该层包括一个或多个提供不同网络服务资源的服务器,包括但不限于以下中的任一个或其任意组合:数据库服务器、电子商务服务器、应用程序服务器、移动信息服务器、FTP服务器、Web服务器、电子邮件服务器等。
用户终端要使用某个需要验证的网络服务时,必须通过人机识别的密码验证、声纹验证及人机识别评估合法后,才能获取网络服务。
此外,人机识别服务功能也可以不由密码身份验证服务器、声纹身份验证服务器、人机识别评估控制服务器完成,它可以根据负载平衡算法,分布式部署在不同路由器上分布控制(如图5所示),或以集中放在某台路由器上集中控制(如图6所示)。集中部署在某一台路由器上便于集中管理;分布部署在不同路由器上,可以利用负载平衡算法分布式管理,防止单点失效攻击,提高网络服务系统性能。
实施例二,一种人机识别系统,如图7所示,包括:
声纹特征模型建立模块21;
声纹身份注册模块22,用于当收到用户的注册请求时,提供要求用户口述的注册验证信息;接收用户的语音数据,指示所述声纹特征模型建立模块21建立声纹特征模型,保存所建立的声纹特征模型;
声纹身份验证模块23,用于当收到用户的登录请求时,提供要求用户口述的登录验证信息;接收用户的语音数据,指示所述声纹特征模型建立模块21建立声纹特征模型,并将建立的声纹特征模型与该用户注册时的声纹特征模型进行比较;
人机识别评估模块24,用于根据比较结果判断是否为用户本人登录。
本实施例的一种实施方式中,所述登录验证信息为所述注册验证信息的一个子集。
该实施方式的一种备选方案中,所述声纹身份注册模块22提供要求用户口述的注册验证信息是指:
所述声纹身份注册模块22随机产生由数字和字符组成的n个不同元素;从n个不同元素中,取r个不重复的元素,按次数排列,其排列的全体或部分组成注册验证码集合;
所述声纹身份验证模块23提供要求用户口述的登录验证信息是指:
所述声纹身份验证模块23从注册验证码集合中取t个不同子集组成新的 子集;从新的子集的全体或部分组成的集合中,随机抽取一个所述新的子集作为登录验证信息;
所述n、r、t均为正整数,其中r小于或等于n;t小于或等于所述注册验证码集合的子集总数。
该实施方式的另一种备选方案中,所述声纹身份注册模块22提供要求用户口述的注册验证信息是指:
所述声纹身份注册模块22从问题库中随机抽取多个问题并推送给用户,要求用户口述对于所推送的所有问题的回答;
所述声纹身份验证模块23提供登录验证信息是指:
所述声纹身份验证模块23从该用户注册时推送的多个问题中随机抽取一个推送给用户,要求用户口述对于所推送的问题的回答。
本实施例的一种实施方式中,所述系统还可以包括:
密码身份注册模块,用于保存用户注册时输入的密码;
密码身份验证模块,用于接收用户登录时输入的密码,并与该用户注册时输入的密码进行比较;
所述人机识别评估模块24根据比较结果判断是否为用户本人登录是指:
所述人机识别评估模块24当声纹特征模型和密码均匹配时,判断是用户本人登录;其余情况判断不是用户本人登录。
本实施例的一种实施方式中,所述人机识别评估模块24还可以用于当收到用户的登录请求后,先判断同一用户或同一设备是否在预定时间内发送登录请求的次数超过次数阈值;如果是,则判断该用户或该设备发送的登录请求非法;如果不是,则指示所述声纹身份验证模块23进行所述提供要求用户口述的注册验证信息的操作。
所述时间阈值或次数阈值可根据经验值或试验值设定,能够将因为网络性能的问题而重复发送登录请求的情况排除在外。
本实施例的一个具体例子中的人机识别系统如图8所示,包括密码身份管理子系统31、声纹身份管理子系统32、人机识别评估与控制子系统33三 个子系统。密码身份管理子系统31和声纹身份管理子系统32为人机识别评估与控制子系统33分别提供用户密码身份和声纹身份是否合法的决策结果。另外人机识别评估与控制子系统33还可以进一步识别是否存在单人多机或多人单机等不合理现象。
(一)密码身份管理子系统31,可以但不限于为密码验证服务器,包括:
密码身份注册模块311:用于供用户终端向密码身份管理子系统31提出以密码登录方式提出身份注册请求。
密钥及证书分配模块312:用于接收到用户端密码身份注册请求后,验证其注册信息的合法性,如果合法,向其分配相应的密钥及证书。
密钥及证书存储模块313:用于对用户端的密钥及证书进行存储管理。
密钥及证书更新模块314:用于对用户端的密钥及证书进行修改或注销管理。
密码身份验证模块315:可包括密码身份验证请求子模块和密码身份验证响应子模块。其中密码身份验证请求子模块可部署在用户终端上,密码身份验证响应子模块可部署在密码身份验证服务器上。用户端向密码身份验证响应子模块提出密码身份验证请求,密码身份验证响应子模块对用户的密钥及证书进行合法性验证,并把验证结果传输给人机识别评估与控制子系统33。
(二)声纹身份管理子系统32,可以但不限于为声纹验证服务器,包括:
动态验证码管理模块321:该模块负责文本有关动态验证码产生、删除、添加。其它例子中也可以将该模块放在声纹身份注册模块322、声纹身份验证模块324中。
声纹身份注册模块322:用于当用户终端向声纹验证服务器提出以声纹特征登录方式提出身份注册请求后,响应请求,推送一连串由数字及字符随机组成的没变形处理的验证码;其它例子中也可以对验证码进行变形处理。
声纹特征提取模块323:用于接收用户终端口述的声纹验证服务器推送的验证码,采样用户语音,提取其声纹特征。
声纹特征模型建立模块323:用于在提取用户声纹特征基础上,建立用户声纹特征模型;其它例子中也可以将声纹特征提取模块323合并到声纹特 征模型建立模块324中。
声纹身份验证模块325:用于当用户终端在登录时,口述文本相关动态验证码或注册时的相关问题的答案,提出用户声纹特征建立声纹特征模型,与注册时的声纹特征模式进行模式匹配,并把匹配结果传输给人机识别评估与控制子系统33。
(三)人机识别评估与控制子系统33,可以但不限于为人机识别与控制服务器,包括:
人机识别评估模块331:接到密码身份验证和声纹身份验证两个服务器的验证结果后,评估出用户终端是合法的用户终端,还是非法的用户终端。
接入网络服务控制模块332:根据人机识别模块的评估结果,做出是否允许用户终端接入网络服务的决策;如果人机识别模块331评估出非法的用户终端(非法用户或恶意的计算机程序),则把评估结果传给报警隔离非法终端模块333。
报警隔离非法终端模块333:做出相应的报警并隔离非法终端的响应。
部署在三个服务器上的功能模块还可以集中或分布部署在边缘路由器上;该例子中,各功能模块分别部署在三个服务器的做法并不是唯一的,在其它例子里,属于一个子系统的功能模块也可以分布在不同的硬件里,属于三个子系统的功能模块也可以全部集中在一个硬件设备里,属于不同子系统的功能模块也可以有的在一个硬件设备里,有的在不同硬件设备里。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本申请不限制于任何特定形式的硬件和软件的结合。
当然,本申请还可有其他多种实施例,在不背离本申请精神及其实质的情况下,熟悉本领域的技术人员当可根据本申请作出各种相应的改变和变形,但这些相应的改变和变形都应属于本申请的权利要求的保护范围。

一种人机识别方法及系统.pdf_第1页
第1页 / 共20页
一种人机识别方法及系统.pdf_第2页
第2页 / 共20页
一种人机识别方法及系统.pdf_第3页
第3页 / 共20页
点击查看更多>>
资源描述

《一种人机识别方法及系统.pdf》由会员分享,可在线阅读,更多相关《一种人机识别方法及系统.pdf(20页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104036780A43申请公布日20140910CN104036780A21申请号201310068736822申请日20130305G10L17/04201301G10L17/22201301H04L29/0620060171申请人阿里巴巴集团控股有限公司地址英属开曼群岛大开曼资本大厦一座四层847号邮箱72发明人付颖芳张玉东74专利代理机构北京安信方达知识产权代理有限公司11262代理人栗若木54发明名称一种人机识别方法及系统57摘要本申请公开了一种人机识别方法及系统;方法包括当收到用户的注册请求时,提供要求用户口述的注册验证信息;接收用户的语音数据,建立声纹特征模型并。

2、保存;当收到用户的登录请求时,提供要求用户口述的登录验证信息;接收用户的语音数据,建立声纹特征模型,并与该用户注册时的声纹特征模型进行比较;根据比较结果判断是否为用户本人登录。本申请能够提高人机识别的破解难度。51INTCL权利要求书3页说明书11页附图5页19中华人民共和国国家知识产权局12发明专利申请权利要求书3页说明书11页附图5页10申请公布号CN104036780ACN104036780A1/3页21一种人机识别方法,包括当收到用户的注册请求时,提供要求用户口述的注册验证信息;接收用户的语音数据,建立声纹特征模型并保存;当收到用户的登录请求时,提供要求用户口述的登录验证信息;接收用户。

3、的语音数据,建立声纹特征模型,并与该用户注册时的声纹特征模型进行比较;根据比较结果判断是否为用户本人登录。2如权利要求1所述的方法,其特征在于所述登录验证信息为所述注册验证信息的一个子集。3如权利要求2所述的方法,其特征在于,所述提供要求用户口述的注册验证信息的步骤包括随机产生由数字和字符组成的N个不同元素;从N个不同元素中,取R个不重复的元素,按次数排列,排列的全体或部分组成注册验证码集合;所述提供要求用户口述的登录验证信息的步骤包括从注册验证码集合中取T个不同子集组成新的子集;从新的子集的全体或部分组成的集合中,随机抽取一个所述新的子集作为登录验证信息;所述N、R、T均为正整数,其中R小于。

4、或等于N;T小于或等于所述注册验证码集合的子集总数。4如权利要求2所述的方法,其特征在于,所述提供要求用户口述的注册验证信息的步骤包括从问题库中随机抽取多个问题并推送给用户,要求用户口述对于所推送的所有问题的回答;所述提供登录验证信息的步骤包括从该用户注册时推送的多个问题中随机抽取一个推送给用户,要求用户口述对于所推送的问题的回答。5如权利要求14中任一项所述的方法,其特征在于,当收到用户的注册请求后还包括保存用户输入的密码;根据比较结果判断是否为用户本人登录的步骤前还包括接收用户输入的密码,并与该用户注册时输入的密码进行比较。根据比较结果判断是否为用户本人登录的步骤包括如果声纹特征模型匹配和。

5、密码均匹配,则判断是用户本人登录;其余情况判断不是用户本人登录。6如权利要求14中任一项所述的方法,其特征在于,当收到用户的登录请求后、提供要求用户口述的注册验证信息的步骤前还包括判断同一用户或同一设备是否在预定时间内发送登录请求的次数超过次数阈值;如果是,则判断该用户或该设备发送的登录请求非法;权利要求书CN104036780A2/3页3如果不是,则进行所述提供要求用户口述的注册验证信息的步骤。7一种人机识别系统,其特征在于,包括声纹特征模型建立模块;声纹身份注册模块,用于当收到用户的注册请求时,提供要求用户口述的注册验证信息;接收用户的语音数据,指示所述声纹特征模型建立模块建立声纹特征模型。

6、,保存所建立的声纹特征模型;声纹身份验证模块,用于当收到用户的登录请求时,提供要求用户口述的登录验证信息;接收用户的语音数据,指示所述声纹特征模型建立模块建立声纹特征模型,并将建立的声纹特征模型与该用户注册时的声纹特征模型进行比较;人机识别评估模块,用于根据比较结果判断是否为用户本人登录。8如权利要求7所述的系统,其特征在于所述登录验证信息为所述注册验证信息的一个子集。9如权利要求8所述的系统,其特征在于,所述声纹身份注册模块提供要求用户口述的注册验证信息是指所述声纹身份注册模块随机产生由数字和字符组成的N个不同元素;从N个不同元素中,取R个不重复的元素,按次数排列,排列的全体或部分组成注册验。

7、证码集合;所述声纹身份验证模块提供要求用户口述的登录验证信息是指所述声纹身份验证模块从注册验证码集合中取T个不同子集组成新的子集;从新的子集的全体或部分组成的集合中,随机抽取一个所述新的子集作为登录验证信息;所述N、R、T均为正整数,其中R小于或等于N;T小于或等于所述注册验证码集合的子集总数。10如权利要求8所述的系统,其特征在于,所述声纹身份注册模块提供要求用户口述的注册验证信息是指所述声纹身份注册模块从问题库中随机抽取多个问题并推送给用户,要求用户口述对于所推送的所有问题的回答;所述声纹身份验证模块提供登录验证信息是指所述声纹身份验证模块从该用户注册时推送的多个问题中随机抽取一个推送给用。

8、户,要求用户口述对于所推送的问题的回答。11如权利要求710中任一项所述的系统,其特征在于,还包括密码身份注册模块,用于保存用户注册时输入的密码;密码身份验证模块,用于接收用户登录时输入的密码,并与该用户注册时输入的密码进行比较;所述人机识别评估模块根据比较结果判断是否为用户本人登录是指所述人机识别评估模块当声纹特征模型和密码均匹配时,判断是用户本人登录;其余情况判断不是用户本人登录。12如权利要求710中任一项所述的方法,其特征在于所述人机识别评估模块还用于当收到用户的登录请求后,先判断同一用户或同一设备是否在预定时间内发送登录请求的次数超过次数阈值;如果是,则判断该用户或该设备发送的登录请。

9、求非法;如果不是,则指示所述声纹身份验证模块进行所述提供要求用户口述权利要求书CN104036780A3/3页4的注册验证信息的操作。权利要求书CN104036780A1/11页5一种人机识别方法及系统技术领域0001本发明涉及计算机领域,尤其涉及一种人机识别方法及系统。背景技术0002随着互联网的普及,各种网络服务日益成为人们日常生活的一部分,如电子商务、免费的电子邮箱服务、免费的资源下载等等。然而,这些面向人类用户的服务时常被非法用户攻击和一些恶意计算机程序滥用,它们占用服务资源,产生大量的网络垃圾,影响用户的网络体验,对网络服务的安全性造成极大威胁。0003人机识别系统是一种全自动开放式。

10、人机区分图灵机测试COMPLETELYAUTOMATEDPUBLICTURINGTESTTOTELLCOMPUTERSANDHUMANSAPART,CAPTCHA,利用进行问答式身份验证的安全措施来区分计算机与人为目标的系统。CAPTCHA的运行机制如下一个专门的服务器负责产生和评估CAPTCHA测试,用户使用某个需验证的网络服务时,服务器提供给用户一个测试,用户做完后将测试结果提交给服务器,服务器根据结果进行评估,决定该用户能否通过测试。0004目前CAPTCHA技术主要采用的技术有文本CAPTCHA、图像CAPTCHA、声音CAPTCHA技术,3类CAPTCHA技术基于AI领域的不同问题,。

11、具有不同的特性0005文本CAPTCHA利用人和机器在字符识别方面的差异,利用验证码技术来区别人和机器。所谓验证码,就是将一串随机产生的数字或符号,生成一幅扭曲字符串的图片,图片里加上一些干扰像素防止光学字符识别,由用户肉眼识别其中的验证码信息,输入表单提交网站验证,验证成功后才能使用某项功能。如CSDNCHINESESOFTWAREDEVELOPNET,中国软件开发联盟网站用户登录用的是GIF格式数字方式;QQ网站注册采用随机生成的汉字,登录采用PNG格式,图片用的随机数字随机大写英文字母;MSN的HOTMAIL申请时用的BMP格式,随机数字随机大写英文字母随机干扰像素随机位;GOOGLE的。

12、GMAIL注册的时候采用JPG格式,随机数字随机颜色随机位置随机长度;某些大型论坛采用XBM格式,内容随机。0006图像CAPTCHA利用人和机器在图像分类、目标识别、常见理解等方面的差异,通常独立于不同语言,无需用户文本输入、更难破解。如CMU设计的CAPTCHABONGO,利用两组视觉模型如线、圆、方块等,让用户判断新模式的类别,然而2选1的设计无法保证其安全性;再比如带标注的图像数据库,此类CAPTCHA的致命弱点是一旦用户拥有了这个数据库,算法不攻自破。GOOGLE推出一种基于图像方向识别的CAPTCHAWHATSUP,一幅图像旋转到它的垂直方向。WHATSUP无需图像标注,通过在测试。

13、中加入候选图,利用用户反馈结果修正初始标注。此外,WHATSUP训练了一个自动图像方向检测器过滤掉能被机器识别的图像,根据反馈机制过滤掉不易被人类用户识别的图像,确保测试能被大多数人类用户通过而机器不能通过。与基于图像分类的CAPTCHA相比,WHATSUP利用更难的图像理解问题,需要用户对图像中的内容进行分析;可用图像的数量庞大,不受限于具体的物品图像;根据用户反馈自动标注图像,少了繁琐的人工参与。说明书CN104036780A2/11页60007声音CAPTCHA利用人和机器在语音识别上的差异,以随机间隔播放随机选择的一个或多个人播报的数字、字母或单词,并添加背景噪声以抵抗ASRAUTOM。

14、ATICSPEECHRECOGNITION,自动语音识别技术的攻击,在声音CAPTCHABYANI和BYANII中,用户被提示选择惯用语言,计算机据此随机选择6个数字生成测试音频,音频中添加另一个讲话者的声音作为背景噪声,用户需正确输入测试音频中的6个数字。其中,BYANI的背景噪声是相同的6个数字,BYANII的背景噪声是随机选取的词汇。0008目前,主流CAPTCHA技术虽然某种程度避免了恶意计算机程序滥用网络服务,但易遭受各种攻击而被破解,用户的体验性也很差。具体分析如下0009文本CAPTCHA通过扭曲文字或字符来识别人和机器,在某种程度上防止了计算机程序的恶意注册或登录,但是随着字符。

15、分割和光学字符识别OPTICALCHARACTERRECOGNITION,OCR技术的发展,大多数文本CAPTCHA已被成功破解,简单的字符识别问题已不能阻止计算机程序,况且扭曲的文字让人也难以识别,使得用户体验很不好。0010图像CAPTCHA利用人和机器在图像分类、目标识别、常见理解等方面的差异,通常独立于不同语言,无需用户文本输入、虽然比文本CAPTCHA难破解,但是这些图像CAPTCHA需要庞大的数据库支持,无法大规模产生,此外,易遭受机器学习算法的攻击,如GOLLE设计了一个结合颜色和纹理特征的SVMSUPPORTVECTORMACHINE,支持向量机分类器对猫狗图像进行分类,在单幅。

16、图像上获得827的高正确率,对包含12幅图的ASIRRA破解成功率可达103。0011声音CAPTCHA利用人和机器在语音识别上的差异来区别人和机器,但是声音CAPTCHA同样容易受到机器学习算法的攻击。TAM等人用固定长度的窗口搜索音频,筛选出能量峰进行识别,在其上提取3种音频特征梅尔倒谱系数、感知线性预测、相关频谱转换感知线性预测,采用ADABOOST,SVM,KNN三种机器学习算法分别训练,对GOOGLE,DIGG和RECAPTCHA的破解成功率分别为67,71和45。也有人采用相似的方法破解了EBAY的声音CAPTCHA,破解率达75。发明内容0012本申请要解决的技术问题是如何提高人。

17、机识别的破解难度。0013为了解决上述问题,本申请提供了一种人机识别方法,包括0014当收到用户的注册请求时,提供要求用户口述的注册验证信息;0015接收用户的语音数据,建立声纹特征模型并保存;0016当收到用户的登录请求时,提供要求用户口述的登录验证信息;0017接收用户的语音数据,建立声纹特征模型,并与该用户注册时的声纹特征模型进行比较;0018根据比较结果判断是否为用户本人登录。0019进一步地,所述登录验证信息为所述注册验证信息的一个子集。0020进一步地,所述提供要求用户口述的注册验证信息的步骤包括0021随机产生由数字和字符组成的N个不同元素;0022从N个不同元素中,取R个不重复。

18、的元素,按次数排列,排列的全体或部分组成注册验证码集合;说明书CN104036780A3/11页70023所述提供要求用户口述的登录验证信息的步骤包括0024从注册验证码集合中取T个不同子集组成新的子集;0025从新的子集的全体或部分组成的集合中,随机抽取一个所述新的子集作为登录验证信息;0026所述N、R、T均为正整数,其中R小于或等于N;T小于或等于所述注册验证码集合的子集总数。0027进一步地,所述提供要求用户口述的注册验证信息的步骤包括0028从问题库中随机抽取多个问题并推送给用户,要求用户口述对于所推送的所有问题的回答;0029所述提供登录验证信息的步骤包括0030从该用户注册时推送。

19、的多个问题中随机抽取一个推送给用户,要求用户口述对于所推送的问题的回答。0031进一步地,当收到用户的注册请求后还包括0032保存用户输入的密码;0033根据比较结果判断是否为用户本人登录的步骤前还包括0034接收用户输入的密码,并与该用户注册时输入的密码进行比较。0035根据比较结果判断是否为用户本人登录的步骤包括0036如果声纹特征模型匹配和密码均匹配,则判断是用户本人登录;其余情况判断不是用户本人登录。0037进一步地,当收到用户的登录请求后、提供要求用户口述的注册验证信息的步骤前还包括0038判断同一用户或同一设备是否在预定时间内发送登录请求的次数超过次数阈值;0039如果是,则判断该。

20、用户或该设备发送的登录请求非法;0040如果不是,则进行所述提供要求用户口述的注册验证信息的步骤。0041本申请还提供了一种人机识别系统,包括0042声纹特征模型建立模块;0043声纹身份注册模块,用于当收到用户的注册请求时,提供要求用户口述的注册验证信息;接收用户的语音数据,指示所述声纹特征模型建立模块建立声纹特征模型,保存所建立的声纹特征模型;0044声纹身份验证模块,用于当收到用户的登录请求时,提供要求用户口述的登录验证信息;接收用户的语音数据,指示所述声纹特征模型建立模块建立声纹特征模型,并将建立的声纹特征模型与该用户注册时的声纹特征模型进行比较;0045人机识别评估模块,用于根据比较。

21、结果判断是否为用户本人登录。0046进一步地,所述登录验证信息为所述注册验证信息的一个子集。0047进一步地,所述声纹身份注册模块提供要求用户口述的注册验证信息是指0048所述声纹身份注册模块随机产生由数字和字符组成的N个不同元素;从N个不同元素中,取R个不重复的元素,按次数排列,排列的全体或部分组成注册验证码集合;0049所述声纹身份验证模块提供要求用户口述的登录验证信息是指说明书CN104036780A4/11页80050所述声纹身份验证模块从注册验证码集合中取T个不同子集组成新的子集;从新的子集的全体或部分组成的集合中,随机抽取一个所述新的子集作为登录验证信息;0051所述N、R、T均为。

22、正整数,其中R小于或等于N;T小于或等于所述注册验证码集合的子集总数。0052进一步地,所述声纹身份注册模块提供要求用户口述的注册验证信息是指0053所述声纹身份注册模块从问题库中随机抽取多个问题并推送给用户,要求用户口述对于所推送的所有问题的回答;0054所述声纹身份验证模块提供登录验证信息是指0055所述声纹身份验证模块从该用户注册时推送的多个问题中随机抽取一个推送给用户,要求用户口述对于所推送的问题的回答。0056进一步地,所述的系统还包括0057密码身份注册模块,用于保存用户注册时输入的密码;0058密码身份验证模块,用于接收用户登录时输入的密码,并与该用户注册时输入的密码进行比较;0。

23、059所述人机识别评估模块根据比较结果判断是否为用户本人登录是指0060所述人机识别评估模块当声纹特征模型和密码均匹配时,判断是用户本人登录;其余情况判断不是用户本人登录。0061进一步地,所述人机识别评估模块还用于当收到用户的登录请求后,先判断同一用户或同一设备是否在预定时间内发送登录请求的次数超过次数阈值;如果是,则判断该用户或该设备发送的登录请求非法;如果不是,则指示所述声纹身份验证模块进行所述提供要求用户口述的注册验证信息的操作。0062本申请的至少一个实施例采用口述验证码加声纹认证的方式设计出人机识别方案,这种方式与现前的文本、图像、声音CAPTCHA技术相比,难攻破,可以避免非法用。

24、户和恶意计算机程序滥用网络服务,从而有效保障互联网的安全,且能提高用户体验。本申请的一个优化方案中验证码采用动态文本,可实现文本部分相关的声纹识别,能兼顾可靠性和延迟性能。本申请的又一个优化方案中将声纹识别与手输密码的方式相结合,能保证隐私信息不被泄露,还能提高系统性能,且提高了网络服务的安全性、性能及用户体验,因为如果单纯采用手输密码和手输动态验证码的身份验证的方式,密码易忘记,且易遭密码截取伪冒攻击和验证码破解攻击而至的机器滥用网络服务。本申请的又一个优化方案中还引入人机识别评估控制功能,能甄别出不合常理的情况,识别出非法用户或恶意计算机程序;该优化方案中密码身份验证功能、声纹身份验证功能。

25、、人机识别评估控制功能还可以采取三权分立的原则,互相牵制又互相独立的办法防止单点失效和内部攻击。本申请的又一个优化方案将接入人机识别服务功能集中或分布部署在路由器上,可以在网络边缘控制好恶意程序对网络服务资源的滥用,其中分别有如下优势集中部署在某一台路由器上便于集中管理;分布部署在不同路由器上,可以利用负载平衡算法分布式管理,防止单点失效攻击,提高网络服务系统性能。附图说明0063图1是实施例一的人机识别方法的流程示意图;说明书CN104036780A5/11页90064图2是用户注册界面的示例;0065图3是人机识别登录验证界面的示例;0066图4是实现人机识别方法的架构示意图;0067图5。

26、是人机识别服务集中式部署在边缘路由器上时的示意图;0068图6是人机识别服务分布式部署在边缘路由器上时的示意图;0069图7是实施例二的人机识别系统的结构示意图;0070图8是实施例二中一个具体例子的结构示意图。具体实施方式0071下面将结合附图及实施例对本申请的技术方案进行更详细的说明。0072需要说明的是,如果不冲突,本申请实施例以及实施例中的各个特征可以相互结合,均在本申请的保护范围之内。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。0073实施例一,一种人机识别方法,如图1所示,包括0074S101、当收到用户的注册请求时,提供要求。

27、用户口述的注册验证信息;0075S102、接收用户的语音数据,建立声纹特征模型并保存;0076S103、当收到用户的登录请求时,提供要求用户口述的登录验证信息;0077S104、接收用户的语音数据,建立声纹特征模型,并与该用户注册时的声纹特征模型进行比较;0078S105、根据比较结果判断是否为用户本人登录。0079本实施例将声纹识别与人机识别技术相结合,可以提高识别的可靠性、准确性。声纹识别属于生物识别技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。每个人,无论别人模仿多么相似,都具有独一无二的声纹,这是由每个人的发声器官在成长过程中形成的。00。

28、80本实施例中,所述注册验证信息和登录验证信息可以采用文本或图片的形式进行呈现。可以是未经变形处理的字符包括数字、字母、汉字等,这样能提高用户体验;也可以对注册验证信息和/或登录验证信息进行扭曲或加入干扰像素。0081本实施例的一种实施方式中,所述登录验证信息为所述注册验证信息的一个子集。0082声纹识别分文本无关声纹识别和文本相关声纹识别。文本无关声纹识别是指注册和测试可采用任意不同文本,而文本相关声纹识别是指注册与测试必须采用相同的文本。单纯采用文本无关的声纹特征模式,其延迟性能比单纯采用手输验证码和文本相关声纹验证的延迟性能要差,以致用户体验性差。而该实施方式中,登录验证信息为动态文本,。

29、进行的是文本部分相关的声纹识别,这样可以兼顾延时性能和人机识别的可靠性。0083该实施方式的一种备选方案中,所述登录验证信息为注册验证信息在排列基础上的任意组合。0084排列定义从N个不同的元素中,取R个不重复的元素,按次序排列,称为从N个中取R个的无重排列,排列的全体组成的集合用PN,R表示0085说明书CN104036780A6/11页100086组合定义从N个不同元素中取R个不重复的元素组成一个子集,而不考虑其元素的顺序,称为从N个中取R个的无重组合。组合的全体组成的集合用CN,R表示00870088所述N、R均为正整数,其中R小于或等于N。0089该备选方案中,所述提供要求用户口述的注。

30、册验证信息的步骤具体可以包括0090随机产生由数字和字符组成的N个不同元素;0091从N个不同元素中,取R个不重复的元素,按次数排列,其排列的全体或部分组成注册验证码集合,该集合的元素的最大个数R为00920093所述提供要求用户口述的登录验证信息的步骤具体可以包括0094从注册验证码集合中取T个不同子集组成新的子集,新的子集的全体或部分组成的集合的元素的最大个数C为00950096从新的子集的全体或部分组成的集合中随机抽取一个所述新的子集作为登录验证信息;0097所述N、R、T均为正整数,其中R小于或等于N;T小于或等于所述注册验证码集合的子集总数。0098例如一用户在注册时,随机产生由数字。

31、和字符组成的N4个不同元素;系统从N4个不同元素中,取R2个不重复的元素,按次数排列;从注册验证码集合R中取T3个不同子集组成新的子集,那么其注册验证信息和登录验证信息的获得过程如下0099一注册验证信息的产生0100随机产生4个字符6、A、9、K,即N4;0101从以上4个元素中,取2个不重复的元素,按次数排列组成的注册验证码集合的元素个数为01020103具体元素为6A、69、6K、A6、A9、AK、96、9A、9K、K6、KA、K9;这里是将排列的全体作为注册验证码集合,实施时也可以只用排列的部分作为注册验证码集合0104因此,显示在用户面前的注册验证信息为01056A、69、6K、A6。

32、、A9、AK、96、9A、9K、K6、KA、K9。0106二登录验证信息的产生0107从注册验证码集合的12个元素中取3个不同子集组成新的子集,新的子集的全体组成的登录验证码集合的元素个数C为01080109具体元素为6A,69,6K、A6,A9,AK、96,9A,9KK6,KA,K9。说明书CN104036780A107/11页110110从新的子集的全体或部分组成的集合中随机抽取一个所述新的子集,如A6,A9,AK作为登录验证码,推送给用户。0111该实施方式的另一种备选方案中,所述提供要求用户口述的注册验证信息的步骤具体可以包括0112从问题库中随机抽取多个问题并推送给用户,要求用户口述。

33、对于所推送的所有问题的回答;0113该备选方案中,所述提供登录验证信息的步骤具体可以包括0114从该用户注册时推送的多个问题中随机抽取一个推送给用户,要求用户口述对于所推送的问题的回答。0115例如用户注册时,系统随机抽出4个问题,用户也做相应问答如下0116一注册验证信息的产生0117系统问题你喜欢运动是你最喜欢的人是你最喜欢的动物是0118二登录验证信息的产生0119系统问题你最喜欢的动物是0120本备选方案从人脑思维与计算思维的本质区别入手电脑思维是对人脑思维功能的模拟,它不可能具备由人类感情、想象、猜测等心理活动所构成的精神世界,也不具有社会性和人的意识所有特有的能动的创造性,改现有的。

34、手输验证码为口述文本有关动态验证码,使得设计的问题动态出现,并具有情感、思考和逻辑性,能很好的区别是人还是机器。0121其它备选方案中,也可以在注册验证信息中随机任选部分内容作为登录验证信息。0122其它实施方式中,也可以采用文本相关即登录验证信息和注册验证信息完全相同或文本无关即登录验证信息和注册验证信息完全不同的声纹识别。0123本实施例的一种实施方式中,当收到用户的注册请求后还可以包括0124保存用户输入的密码;0125步骤S105前还可以包括0126接收用户输入的密码,并与该用户注册时输入的密码进行比较。0127步骤S105具体可以包括0128如果声纹特征模型与声纹特征模型和密码均匹配。

35、,则判断是用户本人登录;其余情况判断不是用户本人登录。0129该实施方式中,手输密码可保证隐私安全私人密码不宜于在公开场所语音讲出,还可以提高系统性能手输密码验证性能比单纯采用声纹验证延迟性能要好。如果用户密码丢失,还可以通过邮件地址或手机号找回。0130该实施方式的一种备选方案中,注册过程包括密码身份注册和声纹身份注册,其注册界面的一个示例如图2所示。0131其中密码身份注册采用通用的密码身份注册模式,即输入用户名和密码。0132声纹身份注册时,口述注册验证码或对相关问题的答案。0133提取出用户声纹特征建立声纹特征模型。0134人机识别登录验证界面的一个示例如图3所示。说明书CN10403。

36、6780A118/11页120135用户在需要获取网络服务的时候,进行登录验证,手工输入用户名和密码,口述登录验证码或相关问题的答案。0136提取出用户声纹特征建立声纹特征模型,并与注册时的声纹特征模式进行模式匹配,如果密码和声纹特征模型均匹配,则允许其接入网络服务;只要密码和声纹特征模型中有一个不匹配,拒绝其接入网络服务,隔离并报警。0137本实施例的一种实施方式中,当收到用户的登录请求后、所述提供要求用户口述的注册验证信息的步骤前还可以包括0138判断同一用户或同一设备是否在预定时间内发送登录请求的次数超过次数阈值;0139如果是,则判断该用户或该设备发送的登录请求非法;0140如果不是,。

37、则进行所述提供要求用户口述的注册验证信息的步骤。0141所述时间阈值或次数阈值可根据经验值或试验值设定,能够将因为网络性能的问题而重复发送登录请求的情况排除在外。0142本实施例的一个具体例子中,采用如图4所示的架构实现人机识别方法,该架构包括三层0143用户终端层,该层包括一个或多个带有语音通信装置的用户终端,用户终端设备可以是PC包括台式机、笔记本、MAC一体机等、智能手机、PDA、平板电脑等终端。0144接入人机识别服务层,该层包括负责用户密码身份验证的一个或多个专门的密码验证服务器、负责用户声纹特征验证的一个或多个专门的声纹验证服务器、负责评估和控制合法用户终端访问网络服务的一个或多个。

38、人机识别评估控制服务器。密码验证服务器、声纹验证服务器及人机识别评估控制服务器采取互相监督又互相独立的“三权分立”原则来管理,即一个用户终端的登录请求首先由人机识别评估控制服务器判断是否合法,然后必须通过密码验证服务器、声纹验证服务器的合法验证后才能获得网络服务,密码验证服务器、声纹验证服务器又可监督人机识别评估控制服务器的判决结果。0145网络服务层,该层包括一个或多个提供不同网络服务资源的服务器,包括但不限于以下中的任一个或其任意组合数据库服务器、电子商务服务器、应用程序服务器、移动信息服务器、FTP服务器、WEB服务器、电子邮件服务器等。0146用户终端要使用某个需要验证的网络服务时,必。

39、须通过人机识别的密码验证、声纹验证及人机识别评估合法后,才能获取网络服务。0147此外,人机识别服务功能也可以不由密码身份验证服务器、声纹身份验证服务器、人机识别评估控制服务器完成,它可以根据负载平衡算法,分布式部署在不同路由器上分布控制如图5所示,或以集中放在某台路由器上集中控制如图6所示。集中部署在某一台路由器上便于集中管理;分布部署在不同路由器上,可以利用负载平衡算法分布式管理,防止单点失效攻击,提高网络服务系统性能。0148实施例二,一种人机识别系统,如图7所示,包括0149声纹特征模型建立模块21;0150声纹身份注册模块22,用于当收到用户的注册请求时,提供要求用户口述的注册验证信。

40、息;接收用户的语音数据,指示所述声纹特征模型建立模块21建立声纹特征模型,保存所建立的声纹特征模型;说明书CN104036780A129/11页130151声纹身份验证模块23,用于当收到用户的登录请求时,提供要求用户口述的登录验证信息;接收用户的语音数据,指示所述声纹特征模型建立模块21建立声纹特征模型,并将建立的声纹特征模型与该用户注册时的声纹特征模型进行比较;0152人机识别评估模块24,用于根据比较结果判断是否为用户本人登录。0153本实施例的一种实施方式中,所述登录验证信息为所述注册验证信息的一个子集。0154该实施方式的一种备选方案中,所述声纹身份注册模块22提供要求用户口述的注册。

41、验证信息是指0155所述声纹身份注册模块22随机产生由数字和字符组成的N个不同元素;从N个不同元素中,取R个不重复的元素,按次数排列,其排列的全体或部分组成注册验证码集合;0156所述声纹身份验证模块23提供要求用户口述的登录验证信息是指0157所述声纹身份验证模块23从注册验证码集合中取T个不同子集组成新的子集;从新的子集的全体或部分组成的集合中,随机抽取一个所述新的子集作为登录验证信息;0158所述N、R、T均为正整数,其中R小于或等于N;T小于或等于所述注册验证码集合的子集总数。0159该实施方式的另一种备选方案中,所述声纹身份注册模块22提供要求用户口述的注册验证信息是指0160所述声。

42、纹身份注册模块22从问题库中随机抽取多个问题并推送给用户,要求用户口述对于所推送的所有问题的回答;0161所述声纹身份验证模块23提供登录验证信息是指0162所述声纹身份验证模块23从该用户注册时推送的多个问题中随机抽取一个推送给用户,要求用户口述对于所推送的问题的回答。0163本实施例的一种实施方式中,所述系统还可以包括0164密码身份注册模块,用于保存用户注册时输入的密码;0165密码身份验证模块,用于接收用户登录时输入的密码,并与该用户注册时输入的密码进行比较;0166所述人机识别评估模块24根据比较结果判断是否为用户本人登录是指0167所述人机识别评估模块24当声纹特征模型和密码均匹配。

43、时,判断是用户本人登录;其余情况判断不是用户本人登录。0168本实施例的一种实施方式中,所述人机识别评估模块24还可以用于当收到用户的登录请求后,先判断同一用户或同一设备是否在预定时间内发送登录请求的次数超过次数阈值;如果是,则判断该用户或该设备发送的登录请求非法;如果不是,则指示所述声纹身份验证模块23进行所述提供要求用户口述的注册验证信息的操作。0169所述时间阈值或次数阈值可根据经验值或试验值设定,能够将因为网络性能的问题而重复发送登录请求的情况排除在外。0170本实施例的一个具体例子中的人机识别系统如图8所示,包括密码身份管理子系统31、声纹身份管理子系统32、人机识别评估与控制子系统。

44、33三个子系统。密码身份管理子系统31和声纹身份管理子系统32为人机识别评估与控制子系统33分别提供用户密码身份和声纹身份是否合法的决策结果。另外人机识别评估与控制子系统33还可以进一步说明书CN104036780A1310/11页14识别是否存在单人多机或多人单机等不合理现象。0171一密码身份管理子系统31,可以但不限于为密码验证服务器,包括0172密码身份注册模块311用于供用户终端向密码身份管理子系统31提出以密码登录方式提出身份注册请求。0173密钥及证书分配模块312用于接收到用户端密码身份注册请求后,验证其注册信息的合法性,如果合法,向其分配相应的密钥及证书。0174密钥及证书存。

45、储模块313用于对用户端的密钥及证书进行存储管理。0175密钥及证书更新模块314用于对用户端的密钥及证书进行修改或注销管理。0176密码身份验证模块315可包括密码身份验证请求子模块和密码身份验证响应子模块。其中密码身份验证请求子模块可部署在用户终端上,密码身份验证响应子模块可部署在密码身份验证服务器上。用户端向密码身份验证响应子模块提出密码身份验证请求,密码身份验证响应子模块对用户的密钥及证书进行合法性验证,并把验证结果传输给人机识别评估与控制子系统33。0177二声纹身份管理子系统32,可以但不限于为声纹验证服务器,包括0178动态验证码管理模块321该模块负责文本有关动态验证码产生、删。

46、除、添加。其它例子中也可以将该模块放在声纹身份注册模块322、声纹身份验证模块324中。0179声纹身份注册模块322用于当用户终端向声纹验证服务器提出以声纹特征登录方式提出身份注册请求后,响应请求,推送一连串由数字及字符随机组成的没变形处理的验证码;其它例子中也可以对验证码进行变形处理。0180声纹特征提取模块323用于接收用户终端口述的声纹验证服务器推送的验证码,采样用户语音,提取其声纹特征。0181声纹特征模型建立模块323用于在提取用户声纹特征基础上,建立用户声纹特征模型;其它例子中也可以将声纹特征提取模块323合并到声纹特征模型建立模块324中。0182声纹身份验证模块325用于当用。

47、户终端在登录时,口述文本相关动态验证码或注册时的相关问题的答案,提出用户声纹特征建立声纹特征模型,与注册时的声纹特征模式进行模式匹配,并把匹配结果传输给人机识别评估与控制子系统33。0183三人机识别评估与控制子系统33,可以但不限于为人机识别与控制服务器,包括0184人机识别评估模块331接到密码身份验证和声纹身份验证两个服务器的验证结果后,评估出用户终端是合法的用户终端,还是非法的用户终端。0185接入网络服务控制模块332根据人机识别模块的评估结果,做出是否允许用户终端接入网络服务的决策;如果人机识别模块331评估出非法的用户终端非法用户或恶意的计算机程序,则把评估结果传给报警隔离非法终。

48、端模块333。0186报警隔离非法终端模块333做出相应的报警并隔离非法终端的响应。0187部署在三个服务器上的功能模块还可以集中或分布部署在边缘路由器上;该例子中,各功能模块分别部署在三个服务器的做法并不是唯一的,在其它例子里,属于一个子系统的功能模块也可以分布在不同的硬件里,属于三个子系统的功能模块也可以全部集中在一个硬件设备里,属于不同子系统的功能模块也可以有的在一个硬件设备里,有的在不同硬件设备里。说明书CN104036780A1411/11页150188本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储。

49、器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本申请不限制于任何特定形式的硬件和软件的结合。0189当然,本申请还可有其他多种实施例,在不背离本申请精神及其实质的情况下,熟悉本领域的技术人员当可根据本申请作出各种相应的改变和变形,但这些相应的改变和变形都应属于本申请的权利要求的保护范围。说明书CN104036780A151/5页16图1图2说明书附图CN104036780A162/5页17图3图4说明书附图CN104036780A173/5页18图5说明书附图CN104036780A184/5页19图6图7说明书附图CN104036780A195/5页20图8说明书附图CN104036780A20。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1