一种即时更新的声纹认证方法及系统技术领域
本发明涉及信息安全领域,特别是一种即时更新的声纹认证方法及系统。
背景技术
由于每个人说话都有相对稳定的频谱,这些频谱的特征就是声纹,目前声纹认证
已经有成熟的应用,如微信中预留声音样本“声音1、2、3、4、5、6”进行认证的方法,但这种认
证方法存在一个缺点,由于人说话是相对稳定的频谱,而预留的的声音样本可能是早期的,
随着时间的变化,有时由于声带变化而认证失败。
发明内容
本发明的目的是提供一种即时更新的声纹认证方法及系统。
本发明的技术方案是:
一种即时更新的声纹认证方法,设置服务器和客户端,其特征是,包括步骤:
(1)建立包含通话日志的语言文件数据库;
(2)提取通话日志中近期的语言文件A;
(3)对语言文件A进行识别转化为文字,并将文字推送至客户端;
(4)客户端录制推送文字的语言,并上传录制的语言文件B;
(5)对语言文件B和语言文件A的声纹进行比较,如果一致则认证成功,允许客户端登
录,如果不一致则认证失败。
所述的一种即时更新的声纹认证方法,其特征是,还包括:步骤(5)中对语言文件B
和语言文件A的声纹进行比较外,还包括对语言声调进行识别。
所述的一种即时更新的声纹认证方法,其特征是,还包括:步骤(2)中获取通话日
志中近期的语言文件A的播放时间大于5秒。
一种即时更新的声纹认证系统,其特征是,至少包括:
语言文件数据库,用于保存通话记录;
语言文件提取单元,用于根据通话日志、文件大小对语言文件数据库中的语言文件进
行提取;
语言识别单元,用于将语言文件提取的语言文件转化为文字;
文字推送单元,用于推送文字至客户端;
声纹比较单元,用于声纹比较识别。
所述的一种即时更新的声纹认证系统,其特征是:还包括音调比较单元,用于识别
语言文件的音调变化。
本发明的有益效果是:本发明的目的是提供一种即时更新的声纹认证方法及系
统,具体针对微信应用,则可以基于微信原来已有的语言通话记录实施声纹认证,这样就可
以省略样本语言录制步骤,同时,微信用户对自己近期发生的语言通话语调一般记忆犹新,
所以为语调认证打下基础,可以利用声纹、语调联合比对进行认证。
附图说明
图1为本发明流程图。
图2为本发明配置图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
图1为本发明流程图,包括手机端和服务器,即时通讯登录服务器成功后进行正常
交流,服务器对语言文件进行记录,并形成语言文件数据库、及通话日志,本发明的步骤是:
101即时通讯登录请求;
102提取通话日志中近期的语言文件A;
103对语言文件A进行识别转化为文字,并将文字推送至客户端;
104录制推送文字的语言,由即时通讯用户根据推送文字并模仿当初通话时的情景录
制推送文字的语言;
105上传录制的推送文字的语言文件B;
106对语言文件B和语言文件A的声纹进行比较,如果一致则进行音调认证;
107对语言文件B和语言文件A的音调进行比较,如果一致则认证成功,允许客户端登
录,如果不一致则认证失败。
当然,如果认证失败,还包括继续提取通话日志中近期的其它语言文件的步骤,直
至认证成功。
图2为本发明配置图,包括:
语言文件数据库,用语保存通话记录,对于现有的即时通讯系统,如QQ、微信等均在服
务器端保存有客户的通话记录及通话日志,并以数据库的形式存在;
语言文件提取单元,用于根据通话日志、文件大小对语言文件数据库中的语言文件进
行提取,提取方式是提取通话日志中近期的语言文件,特别是最近的语言文件,另外,考虑
到完整获取一个人声纹的要求,可以只提取播放大于5秒的语言文件;
语言识别单元,用于将语言文件提取的语言文件转化为文字;
文字推送单元,用于推送文字至客户端;
待认证语言获取单元,用于获取来自客户端的待认证语言文件;
待认证语言文件存储单元,用于暂存获取待认证语言文件;
声纹比较单元,用于声纹比较识别,每个人说话所特有的频谱特征即声纹;
音调比较单元,用于识别语言文件的音调变化,一般普通话中有四个声调,通常叫四
声,即阴平(第一声),用ā表示,如妈 mā(阴平);阳平第二声,用á表示,如麻 má(阳平);上声
(第三声),用ǎ表示,如马 mǎ(上声);去声(第四声),用à表示,如骂 mà(去声);吗 mɑ(轻声
不标调)。所以,在具体通话中,比如“妈 mā妈 mā好”,也有可能是“马 mǎ马 mǎ好”,所以通
过识别音调还原当初的通话情景,从而可以进行音调认证。
本发明应用系统包括QQ、微信等即时通讯系统。