《使用说话能力作为人类交互证明.pdf》由会员分享,可在线阅读,更多相关《使用说话能力作为人类交互证明.pdf(20页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 (43)申请公布日 (21)申请号 201380040948.3(22)申请日 2013.08.0113/564722 2012.08.02 USH04L 29/06(2006.01)G06F 21/32(2006.01)G06Q 20/40(2006.01)(71)申请人 微软公司地址 美国华盛顿州(72)发明人 C. 米尔斯 R. 辛 S. 劳菲尔S. 钟(74)专利代理机构 中国专利代理(香港)有限公司 72001代理人 刘鹏 景军平(54) 发明名称使用说话能力作为人类交互证明(57) 摘要人类交互证明入口使用生物特征输入来确定用户是标准用户还是恶意行动者。人类交互。
2、证明入口从用户设备接收对在线数据服务的访问请求并且将证明询问发送到用户设备以用于呈现给用户。人类交互证明入口从用户设备接收具有基于来自用户的生物特征输入的生物特征元数据描述的证明响应。(30)优先权数据(85)PCT国际申请进入国家阶段日2015.02.02(86)PCT国际申请的申请数据PCT/US2013/053107 2013.08.01(87)PCT国际申请的公布数据WO2014/022602 EN 2014.02.06(51)Int.Cl.(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书1页 说明书9页 附图9页(10)申请公布号 CN 104509065 A(43。
3、)申请公布日 2015.04.08CN 104509065 A1/1 页21. 一种机器实施的方法,包括 :从用户设备接收对在线数据服务的访问请求 ;将证明询问发送到所述用户设备以用于呈现给用户 ;以及从所述用户设备接收具有基于来自所述用户的生物特征输入的生物特征元数据描述的证明响应。2. 根据权利要求 1 所述的方法,进一步包括 :发送用于由所述用户设备安装的转换小应用程序。3. 根据权利要求 1 所述的方法,进一步包括 :将所述生物特征输入与证明询问应答相比较。4. 根据权利要求 1 所述的方法,进一步包括 :接收基于音频输入的响应表示。5. 根据权利要求 4 所述的方法,进一步包括 :将。
4、所述音频输入的声纹与用户账户配置文件相比较。6. 根据权利要求 4 所述的方法,进一步包括 :将声纹标识为属于频繁的用户。7. 根据权利要求 1 所述的方法,进一步包括 :基于所述生物特征输入来许可对用户账户的访问。8. 一种有形计算机可读存储介质,其具有详述存储在其上的方法的一组指令,所述指令当被一个或多个处理器执行时使所述一个或多个处理器施行所述方法,所述方法包括 :将对在线数据服务的访问请求发送到人类交互证明入口 ;从所述人类交互证明入口接收证明询问以用于呈现给用户 ;响应于所述证明询问从所述用户接收音频输入 ;以及基于要被发送到所述人类交互证明入口的所述音频输入来创建生物特征元数据描述。
5、。9. 一种人类交互证明入口,包括 :通信接口,其从用户设备接收对在线数据服务的访问请求 ;以及处理器,其用来生成证明询问以用于呈现给用户并且用来基于来自所述用户的生物特征输入来检查证明响应以确定所述用户是否来自人类血汗工厂。10. 根据权利要求 9 所述的人类交互证明入口,其中所述处理器生成生物特征证明响应。权 利 要 求 书CN 104509065 A1/9 页3使用说话能力作为人类交互证明背景技术0001 数据服务可以在互联网上提供免费服务。恶意实体可以使用假装为人类用户的软件应用来利用这些服务。软件应用可以使得用于数据服务的服务器负担过重、劫持数据服务以用于不法使用,或者中断数据服务的。
6、正常使用。例如,软件应用可以建立伪造免费的电子邮件账户以便发出垃圾邮件、贮藏销售产品以用于不法目的,或者可以剥离挖掘(strip mine)公共数据库。发明内容0002 本发明内容被提供来以简化的形式引入在下面在具体实施方式中被进一步描述的概念的选择。本发明内容不旨在标识所要求保护的主题的关键特征或必要特征,其也不旨在被用来限制所要求保护的主题的范围。0003 在下面所讨论的实施例涉及使用生物特征(biometric)输入来确定用户是标准用户还是恶意行动者。人类交互证明入口可以从用户设备接收对在线数据服务的访问请求。人类交互证明入口可以将证明询问(challenge)发送到用户设备以用于呈现给。
7、用户。人类交互证明入口可以从用户设备接收具有基于来自用户的生物特征输入的生物特征元数据描述的证明响应。附图说明0004 为了描述能够以其获得上面记载的和其它优点及特征的方式,更特别的描述被阐述并且将通过参考被图示在附图中的其特定实施例而被呈示。理解这些附图描绘了仅典型的实施例并且因此将不被认为限制其范围,实施方案将通过使用附图利用附加的特性和细节进行描述和说明。0005 图 1 用框图图示数据网络的一个实施例。0006 图 2 用框图图示计算设备的一个实施例。0007 图 3 用流程图图示执行生物特征人类交互证明会话的一个实施例。0008 图 4 用框图图示元数据证明响应的一个实施例。0009。
8、 图 5 用流程图图示用于利用人类交互证明入口来进行人类交互证明会话的方法的一个实施例。0010 图 6 用流程图图示具有用户侧处理的用于利用人类交互证明入口来进行人类交互证明会话的方法的一个实施例。0011 图 7 用流程图图示用于分析生物特征元数据描述的方法的一个实施例。0012 图 8 用流程图图示用于利用用户设备来进行人类交互证明会话的方法的一个实施例。0013 图 9 用流程图图示具有用户侧处理的用于利用用户设备来进行人类交互证明会话的方法的一个实施例。说 明 书CN 104509065 A2/9 页4具体实施方式0014 实施例在下面被详细地讨论。虽然特定实施方案被讨论,但是应理解。
9、,这被做出仅用于图示目的。相关领域的技术人员将认识到,在不脱离本公开内容的主题的精神和范围的情况下可以使用其它组件和配置。实施方案可以是机器实施的方法、具有详述存储在其上的用于至少一个处理器的方法的一组指令的有形计算机可读存储介质,或人类交互证明入口。0015 人类交互证明入口可以通过将证明询问发送到用户设备来防护对在线数据服务的访问。证明询问是寻求从用户引出一组一个或多个动作中的一个以确定该用户是否是恶意行动者的一组文本、一数字图像或一组音频数据。证明响应是由用户通过施行如根据证明询问所确定的动作来解决证明询问的尝试。证明询问应答是正确地解决证明询问的用户的动作。用户设备可以从用户接收生物特。
10、征输入来创建对于证明询问的证明响应。生物特征输入是标识用户的人类产生的输入,诸如话音、指纹或面部图像。人类交互证明入口可以基于生物特征输入来确定用户是否是人类用户。0016 例如,人类交互证明入口可以选择要被发送到用户的证明询问以从用户引出音频响应作为证明响应。证明询问可以是供用户读取的一组文本或供用户解决的难题,诸如要求用户说出 124 和 54 的和。用户可以大声说出由证明询问引出的文本到用户设备的麦克风中。用户设备可以记录音频输入并且将该音频输入发送回到人类交互证明入口。人类交互证明入口可以处理音频记录以证实用户是人类。人类交互证明入口可以使用语音识别来验证文本被正确地说出。人类交互证明。
11、入口可以使用语音合成器检测来验证音频输入来自人类而不是生成响应的自动化系统。人类交互证明入口可以创建声纹来验证单个血汗工厂(sweatshop)用户未正在创建大量账户。人类交互证明入口可以确定用户是否已成功地解决人类交互证明。音频记录以及口语文本然后可以被用于做出更好的语音识别和语音合成系统。0017 人类交互证明入口可以将文本标识为供用户说出的证明询问。证明询问可以是从公共域作品、科学文献或文本的任何其它语料库中随机地选取的文本。可以选择文本来提供语音识别或话音合成系统处理时可能具有困难的音频数据。0018 人类交互证明入口可以将文本作为证明询问发送到用户。文本可以被显示在网站、客户端应用、。
12、电视或其它显示屏上的控件中。替换地,可以将文本作为音频文件进行播放,从而说出所选取的文本。人类交互证明入口可以指示用户开始说出文本。对文本的记录可以是自动的或者是由用户发起的。例如,用户可以点击按钮以便使文本显示并且预期该用户立即阅读文本。替换地,证明询问可以在访问在线数据服务时存在,其中每当用户选取时该用户开始阅读。0019 用户设备可以将这个音频数据的记录传送回到人类交互证明入口。用户设备可以将音频记录成运动图片专家组 -1 音频层 III 格式或 MP3,并且将记录作为文件发送回到人类交互证明入口。替换地,用户设备可以提取指定的特征,诸如作为时间的函数的频率或作为时间的函数的响度。用户设。
13、备可以将所指定的特征发送回到人类交互证明入口以减少带宽使用或服务器计算时间。人类交互证明入口或用户设备可以生成被称为生物特征元数据描述的所指定的特征。0020 人类交互证明入口可以确定所提供的音频输入或生物特征元数据描述是否表示说 明 书CN 104509065 A3/9 页5由人类大声说出的文本。进一步地,人类交互证明入口可以确定话音是否属于正在访问过度服务容量的用户。人类交互证明入口可以通过串行地、并行地或以两者的某种组合执行话音验证来确定用户是否是恶意行动者。0021 人类交互证明入口可以确定证明响应中记录的语音发言是证明询问中所提供的文本的口语版本。因为正被识别的特定文本为系统所知,所。
14、以闭域语音识别方法可以大大地简化语音识别组件。人类交互证明入口可以对接受可疑发言宽容以避免误报,因为附加的验证可以防止滥用。0022 人类交互证明入口可以验证口语文本是人类的而不是语音合成器的结果。人类交互证明入口可以使用分类器来做出这个验证。合成语音可以是非常单调的发声,使得语音与正常人类语音足够不同以致单独根据声音来标识正常人类语音是可能的。语音合成器可以频繁地使人类记录在说特定语言时使用的每个声音音素。语音合成器可以将文本译成一系列音素。语音合成器可以平滑地将相应地记录的音素级联在一起,以防止声音信号的颤动和失真以增加真实性。有限数目的记录声音和这个机器生成的平滑的存在可以帮助对合成语音。
15、的检测。0023 此外,分类器可以使用现有的语音合成器模型的知识。通过将语音输入对照针对要被验证的文本的来自已知合成器模型的预期输出进行比较,分类器可以检测由已知合成器中的一个所生成的输入源的类型。合成器模型的数据库可以随着新的模型被找到而被更新。多个分类方案的使用可以增加准确性。0024 滥用者可以解决人类交互证明的一个方式是雇佣血汗工厂来手动地解决证明询问。人类交互证明入口可以使用声纹甚至匿名的声纹来跟踪同一人类利用其来解决证明询问的频率。人类交互证明可以被用于创建账户并且用于压制对重要服务资源的访问,从而使同一用户得以被验证多次。然而,滥用者可以典型地利用对于证明询问的更多的证明响应在大。
16、得多的规模上操作。通过将通过声纹的验证的数目和频率限制到与服务的合法使用一致的数目,人类交互证明入口可以标识血汗工厂用户。0025 人类交互证明入口可以通过使声纹与用户账户相关联来保护免于牵涉人类发言者的血汗工厂式攻击。这样的关联可以被用于在用户账户被创建之后给出的证明询问。对于账户特定的人类交互证明会话而言,人类交互证明入口使用用户语音输入来构建表征用户声纹的用户模型。人类交互证明入口可以通过来自多个会话的聚合输入来增强用户模型。同时,人类交互证明入口可以使用该用户模型来验证每个人类交互证明输入。如果输入发言在验证期间不适合用户账户的用户模型,则人类交互证明入口可以确定发言者未能回应(fai。
17、l)询问。用户模型的数据库可以被用于其它目的,诸如用户认证。人类交互证明入口可以使用来自其它话音源(诸如话音消息传送)的语音输入来扩增用户模型。0026 附加地,人类交互证明入口可以执行平滑度核对、音频数据库核对或声纹一致性核对来验证来自其它源的多个音频片段未被拼接在一起以生成响应。随着新的滥用技术被发明,人类交互证明入口可以添加附加的核对以缓和滥用技术或者调整话音验证以计及滥用技术。0027 一旦人类交互证明入口已经验证用户,人类交互证明入口就可以确定用户是否被授权访问在线数据服务或在线数据资源。人类交互证明入口可以限制被消耗资源的量。如果证明响应成功地解决证明询问,则人类交互证明入口可以验。
18、证用户。替换地,人类交互证说 明 书CN 104509065 A4/9 页6明入口可以对生物特征元数据描述应用一系列逻辑规则。人类交互证明入口可以将置信分数分配给生物特征元数据描述的每个方面。人类交互证明入口可以对每个方面和置信分数应用机器学习分类器,并且预测用户是否是被授权访问在线数据服务的人类。0028 因此,在一个实施例中,人类交互证明入口可以使用生物特征输入来确定用户是标准用户还是恶意行动者。人类交互证明入口可以从用户设备接收对在线数据服务的访问请求。人类交互证明入口可以将证明询问发送到用户设备以用于呈现给用户。人类交互证明入口可以从用户设备接收具有基于来自用户的生物特征输入的生物特征。
19、元数据响应描述的证明响应。人类交互证明入口可以分析描述生物特征输入的生物特征元数据描述以标识人类血汗工厂。0029 图 1 用框图图示数据网络 100 的一个实施例。用户设备 110 可以经由数据网络连接 130(诸如互联网)连接到数据服务器 120。用户设备 110 可以访问由数据服务器 120 所执行的在线数据服务 122。在线数据服务 122 可以使用人类交互证明(HIP)入口 140 来保护对在线数据服务 122 的访问。人类交互证明入口 140 可以由数据服务器 120 或者由单独的人类交互证明服务器 150 执行。0030 人类交互证明入口140可以将由证明询问数据库160提供的一。
20、个或多个证明询问发送到用户设备 110。人类交互证明入口 140 可以生成证明询问以用于呈现给用户。证明询问可以从用户探寻生物特征输入作为证明响应。生物特征输入是标识人类的生物学上产生的输入,诸如用户的语音、指纹或图像。人类交互证明服务器 150 然后可以处理证明响应以验证用户是人类。人类交互证明入口 140 可以基于来自用户的生物特征输入进一步检查证明响应以确定该用户是否来自人类血汗工厂。0031 对于来自用户的音频输入,人类交互证明服务器 150 可以将该音频输入与证明询问应答相比较,同时处理音频输入的生物特征元数据描述以验证该音频输入不是计算机生成的或人类血汗工厂的产品。人类交互证明服务。
21、器 150 可以将音频输入转换为文本格式、音频格式或任何中间格式以确定与证明询问应答的匹配。生物特征元数据描述可以在人类交互证明服务器 150 处被从音频输入生成。替换地,人类交互证明入口可以将转换小应用程序(applet)112(小型基于 web 的应用)安装在用户设备 110 上以生成生物特征元数据描述。当网络带宽可能致使发送音频文件不切实际时可以使用转换小应用程序 112。0032 人类交互证明服务器150可以具有语音识别模块152以将音频输入转换成文本词或其它中间格式以用于与证明询问应答相比较。人类交互输入证明服务器 150 可以具有合成器检测模块 154 以验证音频输入是由人类而非音。
22、频合成器产生的。合成器检测模块 154可以分析音频输入的音调变化(被称为单调(flatness)方面)并且将音频输入与已知的音频合成器相比较。人类交互输入证明服务器 150 可以具有声纹分析模块 156 以确定同一人类是否正在产生音频输入。声纹分析模块 156 可以确定账户是否每次具有同一用户并且同一用户是否正在使用多个账户,这二者可以指示人类血汗工厂。0033 图2图示了可以作为用户设备110、数据服务器120或人类交互证明服务器150的示范性计算设备 200 的框图。计算设备 200 可以组合硬件、软件、固件以及片上系统技术中的一个或多个以实施用户设备 110、数据服务器 120 或人类交。
23、互证明服务器 150。计算设备200 可以包括总线 210、处理器 220、存储器 230、数据存储装置 240、输入 / 输出设备 250 以及通信接口 260。总线 210 或其它组件互连可以准许计算设备 200 的组件之间的通信。说 明 书CN 104509065 A5/9 页70034 处理器 220 可以包括解释并且执行一组指令的至少一个常规处理器或微处理器。存储器 230 可以是存储信息和指令以用于由处理器 220 执行的随机存取存储器(RAM)或另一类型的动态数据存储装置。存储器 230 还可以存储在通过处理器 220 执行指令期间使用的临时变量或其它中间信息。0035 数据存储。
24、装置 240 可以包括为处理器 220 存储静态信息和指令的常规 ROM 设备或另一类型的静态数据存储装置。数据存储装置 240 可以包括任何类型的有形计算机可读存储介质,诸如例如磁或光学记录媒体(诸如数字视频盘)及其对应的驱动器。与信号相反,有形计算机可读存储介质是存储机器可读代码或指令的物理介质。使指令存储在如本文中所描述的计算可读媒体上可与使指令传播或传送区分开,因为传播将指令进行转移,与诸如能够随着具有存储在其上的指令的计算机可读介质而发生的将指令进行存储相对。因此,除非另外指出,否则以这个形式或类似形式对具有存储在其上的指令的计算机可读媒体或介质的引用引用了数据可以被存储或保持在其上。
25、的有形媒体。数据存储装置 240 可以存储详述方法的一组指令,所述指令当被一个或多个处理器执行时使一个或多个处理器施行所述方法。数据存储装置 240 还可以是用于存储证明询问的数据库或数据库接口。0036 输入 / 输出设备 250 可以包括准许用户将信息输入到计算设备 200 的一个或多个常规机构,诸如键盘、鼠标、话音识别设备、麦克风、头戴式耳机、手势识别设备、触摸屏等。输入 / 输出设备 250 可以包括将信息输出给用户的一个或多个常规机构,包括显示器、打印机、一个或多个扬声器、头戴式耳机或介质,诸如存储器或磁盘或光盘以及对应的盘驱动器。通信接口 260 可以包括使得计算设备 200 能够。
26、与其它设备或网络进行通信的任何收发机类机构。通信接口260可以包括网络接口或收发机接口。通信接口260可以是无线接口、有线接口或光学接口。0037 计算设备 200 可以响应于处理器 220 执行包含在计算机可读存储介质(诸如,例如,存储器 230、磁盘或光盘)中的指令序列来施行这样的功能。这样的指令可以被从另一计算机可读存储介质(诸如数据存储装置 240)或者经由通信接口 260 从单独的设备读取到存储器 230 中。0038 图 3 用流程图图示执行生物特征人类交互证明会话 300 的一个实施例。用户设备110 可以将访问请求 302 发送到人类交互证明入口 140。人类交互证明入口 14。
27、0 可以将证明询问 304 返回给用户设备 110。证明询问 304 可以是文本段或音频词。文本段可以是失真文本词、被更改成呈示不可由光学字符识别读取的文本词的文本词。音频词是被用户设备 110 播放以供用户聆听的音频文件。替换地,证明询问可以描述供用户施行的动作,诸如将指尖施加到印迹阅读机或为数字图像捕获而微笑。0039 用户设备 110 可以将证明响应 306 提供给人类交互证明入口 140 以解决证明询问304。证明响应 306 可以是生物特征输入,诸如音频输入、指纹或面部的数字图像捕获。音频输入可以产生用户说出证明询问词的音频文件。如果隐私不是问题,则指纹或数字图像捕获可以具体地标识用。
28、户。人类交互证明入口 140 可以进一步确定生物特征元数据描述是否指示用户是否是恶意行动者,诸如人类血汗工厂或软件应用。0040 带宽问题可以明显地使用户放慢。人类交互证明入口 140 可以将转换小应用程序112 发送到用户设备 110 以从音频输入产生元数据证明响应,使得证明响应可以使用较少的带宽。虽然由转换小应用程序产生的元数据证明响应可以保存带宽,但是元数据证明响说 明 书CN 104509065 A6/9 页8应可能不太安全。0041 图 4 用框图图示针对音频输入的元数据证明响应 400 的一个实施例。元数据证明响应 400 可以具有指示人类交互证明入口 140 接收到元数据证明响应。
29、 400 的人类交互证明入口地址 410。元数据证明响应 400 可以具有响应表示 420,诸如文本词、音频文件,或通过转换小应用程序 112 的话音识别模块从音频输入生成的其它中间格式表示。元数据证明响应可以具有基于来自用户的生物特征输入的生物特征元数据描述 430。生物特征元数据描述 430 可以具有通过转换小应用程序 112 从音频输入生成的声纹 432。声纹 432 可以标识用户。生物特征元数据描述 430 可以具有通过转换小应用程序 112 从音频输入生成的电平434。电平 434 描述遍及音频输入的音量。生物特征元数据描述 430 可以具有通过转换小应用程序112从音频输入生成的音。
30、调436。音调436描述音频输入的随着时间推移的频率。生物特征元数据描述 430 可以具有通过转换小应用程序 112 从音频输入生成的速度 438。速度 438 可以描述用来创建音频输入的时间的长度。元数据证明响应 400 可以具有由转换小应用程序 112 附加到元数据证明响应 400 的数字签名 440。数字签名 440 可以指示元数据证明响应 400 来自转换小应用程序 112 并且不是来自恶意行动者的欺骗响应。元数据证明响应 400 可以具有设备地址 450(诸如互联网协议地址)以标识发送元数据证明响应 400的用户设备 110。元数据证明响应 400 可以具有帮助确定用户是否是恶意行动。
31、者的其它数据,诸如网络信誉数据、设备信誉数据以及帮助人类交互证明入口 140 标识恶意行动者的其它信息。0042 人类交互证明入口 140 可以接收生物特征输入作为证明响应 306。图 5 用流程图图示用于利用人类交互证明入口 140 来进行人类交互证明会话 300 的方法 500 的一个实施例。人类交互证明入口 140 可以从用户设备 110 接收对在线数据服务 122 的访问请求302(块 502)。人类交互证明入口 140 可以从证明询问数据库 160 中选择证明询问 304(块504)。人类交互证明入口 140 可以将证明询问 304 发送到用户设备 110 以用于呈现给用户(块 50。
32、6)。例如,人类交互证明入口 140 可以发送音频词作为证明询问 304。0043 人类交互证明入口 140 可以从用户设备 110 接收基于来自用户的生物特征输入的证明响应 306(块 508)。人类交互证明入口 140 可以从证明响应 306 生成生物特征元数据描述(块 510)。人类交互证明入口 140 可以将生物特征输入与证明询问应答相比较(块512)。人类交互证明入口 140 可以根据证明响应 306 来分析描述生物特征输入的生物特征元数据描述以标识恶意动作者,诸如人类血汗工厂(块 514)。0044 如果用户在不产生任何标志的情况下已通过证明询问 304(块 516),则人类交互证。
33、明入口 140 可以基于生物特征输入来许可对用户账户的访问 308(块 518)。如果用户在不产生任何标志的情况下尚未通过证明询问 304(块 516),则人类交互证明入口 140 可以拒绝对在线数据服务 122 的访问 308(块 520)。0045 人类交互证明入口140可以将由用户设备110所创建的生物特征输入的描述用作证明响应 306。图 6 用流程图图示具有用户侧处理的用于利用人类交互证明入口 140 来进行人类交互证明会话 300 的方法 600 的一个实施例。人类交互证明入口 140 可以从用户设备 110 接收对在线数据服务 122 的访问请求 302(块 602)。人类交互证。
34、明入口 140 可以发送用于由用户设备 110 安装的转换小应用程序 112(块 604)。人类交互证明入口 140 可以从证明询问数据库 160 中选择证明询问 304(块 606)。人类交互证明入口 140 可以将证明说 明 书CN 104509065 A7/9 页9询问 304 发送到用户设备 110 以用于呈现给用户(块 608)。例如,人类交互证明入口 140 可以发送文本段(诸如失真文本词)作为证明询问 304。0046 人类交互证明入口140可以从用户设备110接收具有响应表示和基于来自用户的生物特征输入的生物特征元数据描述的证明响应 306(块 610)。人类交互证明入口 14。
35、0 可以将生物特征输入与证明询问应答相比较(块 612)。人类交互证明入口 140 可以根据证明响应 306 来分析描述生物特征输入的生物特征元数据描述以标识恶意行动者,诸如人类血汗工厂(块 614)。0047 如果用户在不产生任何标志的情况下已通过证明询问 304(块 618),则人类交互证明入口 140 可以基于生物特征输入许可对用户账户的访问 308(块 620)。如果用户在不产生任何标志的情况下尚未通过证明询问 304(块 618),则人类交互证明入口 140 可以拒绝对在线数据服务 122 的访问 308(块 622)。0048 对于作为生物特征输入的音频输入,人类交互证明入口 14。
36、0 可以检查生物特征元数据描述(诸如音频元数据描述)以确定用户是否是恶意行动者。图 7 用流程图图示用于分析音频输入的生物特征元数据描述的方法 700 的一个实施例。人类交互证明入口 140 可以接收基于音频输入的响应表示 420(块 702)。人类交互证明入口 140 可以将音频输入与证明询问应答相比较(块 704)。如果音频输入和证明询问应答不匹配(块 706),则人类交互证明入口 140 可以将用标记为可能的恶意行动者(块 708)。0049 人类交互证明入口 140 可以确定音频输入是否来自语音合成器(块 710)。如果音频输入示出了来自语音合成器的迹象(块 712),则人类交互证明入。
37、口 140 可以将用户标记为可能的恶意行动者(块 708)。人类交互证明入口 140 可以测量音频输入的单调方面(块714)。单调方面描述音频输入的音调变化。如果音频输入比指定的单调门限更为单调(块716),则人类交互证明入口140可以将用户标记为可能的恶意行动者(块708)。人类交互证明入口140可以跟踪证明响应306的响应时间(块718)。如果响应时间指示可疑用户,诸如在响应于证明询问304或已在队列中的证明询问304时过度地实践的用户(块720),则人类交互证明入口 140 可以将用户标记为可能的恶意行动者(块 708)。0050 人类交互证明入口 140 可以将音频输入的声纹与用户账户。
38、配置文件相比较(块722)。如果人类交互证明入口针对单个用户账户标识不同的用户(块724),则人类交互证明入口 140 可以将用户标记为可能的恶意行动者(块 708)。人类交互证明入口 140 可以标识具有高于频繁使用门限的与人类交互证明入口的交互的用户,从而指示该用户正在为多个用户账户做出响应。如果人类交互证明入口 140 将声纹标识为属于频繁的用户(块 726),则人类交互证明入口 140 可以将用户标记为可能的恶意行动者(块 708)。人类交互证明入口 140 可以核对用户设备的网络地址,诸如互联网协议(IP)地址(块 728)。如果人类交互证明入口确定用户不在享有信誉的网络地址处(块 。
39、730),则人类交互证明入口 140 可以将用户标记为可能的恶意行动者(块 708)。0051 用户设备 110 可以从用户接收生物特征输入,诸如音频输入,并且将该生物特征输入发送到人类交互证明入口 140。图 8 用流程图图示用于利用用户设备 110 来进行人类交互证明会话 300 的方法 800 的一个实施例。用户设备 110 可以将对在线数据服务 120 的访问请求 302 发送到人类交互证明入口 140(块 802)。用户设备 110 可以从人类交互证明入口 140 接收证明询问 304(诸如音频词)以用于呈现给用户(块 804)。用户设备 110 可以说 明 书CN 10450906。
40、5 A8/9 页10将音频词作为证明询问 304 呈现给用户(块 806)。用户设备 110 可以响应于证明询问 304从用户接收生物特征输入。例如,用户设备 110 可以响应于证明询问 304 从用户接收音频输入(块 808)。用户设备 110 可以将证明响应 306 发送到人类交互证明入口 140(块 810)。0052 用户设备 110 可以在传送到人类交互证明入口 140 之前处理生物特征输入。图 9用流程图图示具有用户侧处理的用于利用用户设备110来进行人类交互证明会话300的方法 900 的一个实施例。用户设备 110 可以将对在线数据服务 120 的访问请求 302 发送到人类交。
41、互证明入口 140(块 902)。用户设备 110 可以从人类交互证明入口 140 接收转换小应用程序112以用于安装(块904)。用户设备110可以从人类交互入口140接收证明询问304(诸如文本段)以用于呈现给用户(块 906)。用户设备 110 可以将文本段(诸如失真文本词)作为证明询问 304 呈现给用户(块 908)。用户设备 110 可以响应于证明询问 304 从用户接收音频输入(块 910)。用户设备 110 可以基于音频输入来创建响应表示 420,诸如文本词、音频文件或其它中间格式表示(块 912)。用户设备 110 可以基于要被发送到人类交互证明入口 140 的音频输入来创建。
42、生物特征元数据描述 430(块 914)。用户设备 110 可以使用转换小应用程序来签名于证明响应以对证明响应 400 进行认证(块 916)。用户设备 110 可以将具有响应表示 420 和生物特征元数据描述 430 的证明响应 306 发送到人类交互证明入口140(块 918)。0053 尽管已经用特定于结构特征和 / 或方法学行为的语言描述了本主题,但是应当理解,所附权利要求中的主题未必限于上面所描述的特定特征或行为。相反,上面所描述的特定特征和行为作为用于实施权利要求的示例形式被公开。0054 在本发明的范围内的实施例还可以包括用于承载或者具有存储在其上的计算机可执行指令或数据结构的非。
43、暂时性计算机可读存储媒体。这样的非暂时性计算机可读存储媒体可以是能够被通用计算机或专用计算机存取的任何可用的媒体。作为示例而非限制,这样的非暂时性计算机可读存储媒体能够包括 RAM、ROM、EEPROM、CD-ROM 或其它光盘存储装置、磁盘存储装置或其它磁数据存储装置,或能够被用来以计算机可执行指令或数据结构的形式承载或者存储期望的程序代码构件的任何其它介质。以上所述的组合还应当被包括在非暂时性计算机可读存储媒体的范围内。0055 实施例还可以在其中任务由(通过硬连线链路、无线链路或通过其组合)经由通信网络而被链接的本地和远程处理设备施行的分布式计算环境中被实践。0056 计算机可执行指令包。
44、括例如使通用计算机、专用计算机或专用处理设备施行某个功能或一组功能的指令和数据。计算机可执行指令还包括由独立或网络环境中的计算机来执行的程序模块。一般地,程序模块包括施行特定任务或者实施特定抽象数据类型的例程、程序、对象、组件以及数据结构等。计算机可执行指令、相关联的数据结构以及程序模块表示用于执行本文中所公开的方法的步骤的程序代码装置的示例。这样的可执行指令或相关联的数据结构的特定顺序表示用于实施这样的步骤中所描述的功能的对应行为的示例。0057 尽管上述描述可以包含特定细节,但是它们不应当被解释为以任何方式限制权利要求。所描述的实施例的其它配置是本公开内容的范围的一部分。例如,本公开内容的原理可以被应用于每个单独的用户,其中每个用户可以单独地部署这样的系统。即使大量可能的应用中的任何一个不使用本文中所描述的功能性,这也使得每个用户能够利用本公开内容的益处。电子设备的多个实例每个都可以以各种可能的方式处理内容。实施方案未必说 明 书CN 104509065 A。