一种即时更新的声纹认证方法及系统.pdf

摘要
申请专利号：	CN201610909939.9	申请日：	2016.10.19
公开号：	CN106549947A	公开日：	2017.03.29
当前法律状态：	公开	有效性：	审中
法律详情：	公开
IPC分类号：	H04L29/06; H04L12/58	主分类号：	H04L29/06
申请人：	陆腾蛟
发明人：	吴博文; 陆腾蛟
地址：	226136 江苏省南通市海门市万年乡万盛村44组
优先权：
专利代理机构：		代理人：
PDF下载：	PDF下载

内容摘要

本发明涉及信息安全领域，特别是一种即时更新的声纹认证方法及系统。其特征是：其特征是，包括步骤：（1）建立包含通话日志的语言文件数据库；（2）获取通话日志中近期的语言文件A；（3）对语言文件A进行识别转化为文字，并将文字推送至客户端；（4）客户端录制推送文字的语言，并上传录制的语言文件B；（5）对语言文件B和语言文件A的声纹进行比较。有益效果是：本发明的目的是提供一种即时更新的声纹认证方法及系统，具体针对微信应用，则可以基于微信原来已有的语言通话记录实施声纹认证，这样就可以省略样本语言录制步骤，同时，微信用户对自己近期发生的语言通话语调一般记忆犹新，所以为语调认证打下基础，可以利用声纹、语调联合比对进行认证。

权利要求书

1.一种即时更新的声纹认证方法，设置服务器和客户端，其特征是，包括步骤：（1）建立包含通话日志的语言文件数据库；（2）提取通话日志中近期的语言文件A；（3）对语言文件A进行识别转化为文字，并将文字推送至客户端；（4）客户端录制推送文字的语言，并上传录制的语言文件B；（5）对语言文件B和语言文件A的声纹进行比较，如果一致则认证成功，允许客户端登录，如果不一致则认证失败。2.根据权利要求1所述的一种即时更新的声纹认证方法，其特征是，还包括：步骤（5）中对语言文件B和语言文件A的声纹进行比较外，还包括对语言声调进行识别。3.根据权利要求1或2所述的一种即时更新的声纹认证方法，其特征是，还包括：步骤（2）中获取通话日志中近期的语言文件A的播放时间大于5秒。4.一种即时更新的声纹认证系统，其特征是，至少包括：语言文件数据库，用于保存通话记录；语言文件提取单元，用于根据通话日志、文件大小对语言文件数据库中的语言文件进行提取；语言识别单元，用于将语言文件提取的语言文件转化为文字；文字推送单元，用于推送文字至客户端；声纹比较单元，用于声纹比较识别。5.根据权利要求4所述的一种即时更新的声纹认证系统，其特征是：还包括音调比较单元，用于识别语言文件的音调变化。 -->

说明书

一种即时更新的声纹认证方法及系统

技术领域

本发明涉及信息安全领域，特别是一种即时更新的声纹认证方法及系统。

背景技术

由于每个人说话都有相对稳定的频谱，这些频谱的特征就是声纹，目前声纹认证
已经有成熟的应用，如微信中预留声音样本“声音1、2、3、4、5、6”进行认证的方法，但这种认
证方法存在一个缺点，由于人说话是相对稳定的频谱，而预留的的声音样本可能是早期的，
随着时间的变化，有时由于声带变化而认证失败。

发明内容

本发明的目的是提供一种即时更新的声纹认证方法及系统。

本发明的技术方案是：

一种即时更新的声纹认证方法，设置服务器和客户端，其特征是，包括步骤：

（1）建立包含通话日志的语言文件数据库；

（2）提取通话日志中近期的语言文件A；

（3）对语言文件A进行识别转化为文字，并将文字推送至客户端；

（4）客户端录制推送文字的语言，并上传录制的语言文件B；

（5）对语言文件B和语言文件A的声纹进行比较，如果一致则认证成功，允许客户端登
录，如果不一致则认证失败。

所述的一种即时更新的声纹认证方法，其特征是，还包括：步骤（5）中对语言文件B
和语言文件A的声纹进行比较外，还包括对语言声调进行识别。

所述的一种即时更新的声纹认证方法，其特征是，还包括：步骤（2）中获取通话日
志中近期的语言文件A的播放时间大于5秒。

一种即时更新的声纹认证系统，其特征是，至少包括：

语言文件数据库，用于保存通话记录；

语言文件提取单元，用于根据通话日志、文件大小对语言文件数据库中的语言文件进
行提取；

语言识别单元，用于将语言文件提取的语言文件转化为文字；

文字推送单元，用于推送文字至客户端；

声纹比较单元，用于声纹比较识别。

所述的一种即时更新的声纹认证系统，其特征是：还包括音调比较单元，用于识别
语言文件的音调变化。

本发明的有益效果是：本发明的目的是提供一种即时更新的声纹认证方法及系
统，具体针对微信应用，则可以基于微信原来已有的语言通话记录实施声纹认证，这样就可
以省略样本语言录制步骤，同时，微信用户对自己近期发生的语言通话语调一般记忆犹新，
所以为语调认证打下基础，可以利用声纹、语调联合比对进行认证。

附图说明

图1为本发明流程图。

图2为本发明配置图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。

图1为本发明流程图，包括手机端和服务器，即时通讯登录服务器成功后进行正常
交流，服务器对语言文件进行记录，并形成语言文件数据库、及通话日志，本发明的步骤是：

101即时通讯登录请求；

102提取通话日志中近期的语言文件A；

103对语言文件A进行识别转化为文字，并将文字推送至客户端；

104录制推送文字的语言，由即时通讯用户根据推送文字并模仿当初通话时的情景录
制推送文字的语言；

105上传录制的推送文字的语言文件B；

106对语言文件B和语言文件A的声纹进行比较，如果一致则进行音调认证；

107对语言文件B和语言文件A的音调进行比较，如果一致则认证成功，允许客户端登
录，如果不一致则认证失败。

当然，如果认证失败，还包括继续提取通话日志中近期的其它语言文件的步骤，直
至认证成功。

图2为本发明配置图，包括：

语言文件数据库，用语保存通话记录，对于现有的即时通讯系统，如QQ、微信等均在服
务器端保存有客户的通话记录及通话日志，并以数据库的形式存在；

语言文件提取单元，用于根据通话日志、文件大小对语言文件数据库中的语言文件进
行提取，提取方式是提取通话日志中近期的语言文件，特别是最近的语言文件，另外，考虑
到完整获取一个人声纹的要求，可以只提取播放大于5秒的语言文件；

语言识别单元，用于将语言文件提取的语言文件转化为文字；

文字推送单元，用于推送文字至客户端；

待认证语言获取单元，用于获取来自客户端的待认证语言文件；

待认证语言文件存储单元，用于暂存获取待认证语言文件；

声纹比较单元，用于声纹比较识别，每个人说话所特有的频谱特征即声纹；

音调比较单元，用于识别语言文件的音调变化，一般普通话中有四个声调，通常叫四
声，即阴平（第一声），用ā表示，如妈 mā（阴平）；阳平第二声，用á表示，如麻 má（阳平）；上声
（第三声），用ǎ表示，如马 mǎ（上声）；去声（第四声），用à表示，如骂 mà（去声）；吗 mɑ（轻声
不标调）。所以，在具体通话中，比如“妈 mā妈 mā好”，也有可能是“马 mǎ马 mǎ好”，所以通
过识别音调还原当初的通话情景，从而可以进行音调认证。

本发明应用系统包括QQ、微信等即时通讯系统。