《一种语音识别门禁系统.pdf》由会员分享,可在线阅读,更多相关《一种语音识别门禁系统.pdf(8页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN102005070A43申请公布日20110406CN102005070ACN102005070A21申请号201010549905622申请日20101117G07C9/00200601G10L15/0020060171申请人广东中大讯通信息有限公司地址528000广东省广州市番禺区小谷围街中一路60号国家数字家庭应用示范产业基地E301申请人东莞市聚川电子科技有限公司72发明人罗笑南刘宁刘广发薛凯军陈健民54发明名称一种语音识别门禁系统57摘要本发明提供了一种语音识别门禁系统,属于智能家居技术领域。包括用于语音采集、语音输出的声音输入输出系统;用于处理语音信号的语音信号处。
2、理系统;用于对识别结果进行处理的识别结果处理系统。通过各系统之间的协作,本发明实现了门禁控制更加方便、高效,安全。51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书4页附图2页CN102005083A1/1页21一种语音识别门禁系统,其特征在于包括用于语音采集、语音输出的声音输入输出系统;用于处理语音信号的语音信号处理系统;用于对识别结果进行处理的识别结果处理系统。2根据权利要求1所述的语音识别门禁系统,其特征在于所述的声音输入输出系统还包括负责接收用户的声音,然后传输到语音信号处理系统进行后续处理的麦克风;用于输出问答问题及告知用户识别结果的喇叭。3根据权利要。
3、求1所述的语音识别门禁系统,其特征在于所述的语音信号处理系统还包括预处理模块,话语端点检测模块、特征向量提取模块、模式匹配模块。4根据权利要求3所述的语音识别门禁系统,其特征在于所述预处理还包括数模转换模块,信号预加重模块及分帧加窗模块。5根据权利要求1所述的语音识别门禁系统,其特征在于所述的识别结果处理系统包括用于执行语音信号处理系统的命令的开关电路;用于控制着门锁的开合的控制电机;以及门锁。权利要求书CN102005070ACN102005083A1/4页3一种语音识别门禁系统技术领域0001本发明涉及数字家庭智能家居技术领域,具体涉及一种语音识别门禁系统。技术背景0002出入口门禁安全管。
4、理系统是新型现代化安全管理系统,它集微机自动识别技术和现代安全管理措施为一体,它涉及电子,机械,光学,计算机技术,通讯技术,生物技术等诸多新技术。它是解决重要部门出入口实现安全防范管理的有效措施。适用各种机要部门,如银行、宾馆、机房、军械库、机要室、办公间,智能化小区,工厂等。0003在数字技术网络技术飞速发展的今天门禁技术得到了迅猛的发展。门禁系统早已超越了单纯的门道及钥匙管理,它已经逐渐发展成为一套完整的出入管理系统。它在工作环境安全、人事考勤管理等行政管理工作中发挥着巨大的作用。0004随着科技的不断进步,语音识别技术逐渐的出现在我们的生活之中,如手机、个人电脑。智能家居发展的一个重要方。
5、面是让用户交互界面更加人性化,更加方便自然,做到老年人和残疾人可以无障碍地使用。0005目前,门禁系统采用较多的是非接触式RF卡IC卡密码输入等方式随着科学技术的发展,生物识别技术日趋成熟,如语音识别指纹识别虹膜识别红外识别等技术逐步成为门禁系统发展的主流技术。其中语音识别技术是一种非接触性识别技术,具有方便、安全、准确、反应速度快等优点,具有较好的发展前景。本发明就是利用语音识别技术,使得门禁系统的使用更加方便。0006对此,提出一种可得到更方便、安全,可靠的门禁管理方案。发明内容0007本发明的目的在于弥补现有技术的不足,提供一种对人声进行特征提取、对比、识别和确认,利用语音识别技术进行安。
6、全、准确、可靠的身份认证的一种语音识别门禁系统。0008本发明的采用基本原理是语音识别应用方向可分为特定人识别和非特定人识别。特定人识别的声学模型是针对某一特定用户训练的。一般来说用户需要先训练系统,然后才能识别该用户的发音。门禁系统由于是针对特定人员拥有开启和关闭的权限,所以属于特定人语音识别范畴。0009为了实现本发明目的,本发明所采用的技术方案如下0010本发明一种语音识别门禁系统,包括00111用于语音采集、语音输出的声音输入输出系统,包括0012负责接收用户的声音,然后传输到语音信号处理系统进行后续处理的麦克风;0013用于输出问答问题及告知用户识别结果的喇叭;00142用于处理语音。
7、信号的语音信号处理系统,包括0015预处理模块还包括A/D数模转换模块,分帧加窗模块以及信号预加重模块。0016所述A/D数模转换模块麦克风采集到的信号是模拟信号,模拟信号不利DSP芯片说明书CN102005070ACN102005083A2/4页4进行处理,所以首先在这里实现数模转换,把模拟信号转换成数字信号;0017所述信号预加重模块是提升信号的高频部分,使信号的频谱变得平坦,以保持信号在整个频带内具有同样的信噪比,便于声道参数分析;0018所述分帧加窗模块是在对语音信号进行分析和处理之前先将语音段分割成若干短的时间段,以保证每一个短的时间段内语音信号可近似看作具有固定特性的连续语音片段。。
8、0019话语端点检测模块,语音信号的端点检测是进行特征训练和识别的基础,一般采集到的语音信号都掺杂无声段和短时噪声等无用的信息,造成语音的数据量非常大,为了从语音波形中提取出反映语音特征的参数,须采用端点检测的方法来确定一段语音信号的起点和终点。0020特征向量提取模块,首先,原始的语音信号不能直接用于模版训练和模式匹配,这是因为原始信号的数据量太大,系统的运算和存储负担过重;其次,原始语音信号包含太多的随机因素,极大地影响了系统的识别率。特征提取就是对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,提取出对语音识别有用的信息。0021模式匹配模块,将待识别的语音经预处理以及特征提取以。
9、后得到的特征矢量序列称之为测试模版,将特征模版库中的各个模版称之为参考模版,计算测试模版和参考模版之间的相似度,然后得出识别结果。00223用于对识别结果进行处理的识别结果处理系统,包括0023用于执行语音信号处理系统的命令的开关电路。0024用于控制门锁的控制电机,控制着门锁的开合。0025门锁,本门禁系统的主要部分。0026本发明具有以下有益结果00271在日常生活及工作环境中,通过声音识别进行门禁身份验证,相比钥匙,感应卡,密码等方式,有无需携带,方便高效等特点。00282通过语音识别进行门禁身份识别验证,相比人脸识别技术,系统运算量更少,节省了系统的功耗,并且对系统的内存等硬件要求更低。
10、。附图说明0029图1是本发明的系统结构示意图;0030图2是本发明的语音识别系统原理图;0031图3是本发明的用户使用流程图。具体实施方式0032下面结合附图对本发明做进一步的说明。0033下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。0034本发明系统结构示意图如附图1所示,由声音输入输出系统语音信号处理系统,说明书CN102005070ACN102005083A3/4页5开关电。
11、路,控制电机,门锁组成。本实施例的语音识别门禁系统包括以下组件00351用于语音采集,语音输出的声音输入输出系统,包括0036麦克风,是负责接收用户的声音,然后传输到语音信号处理系统进行后续处理。0037喇叭,用于输出问答问题,以及告知用户识别结果。00382用于处理语音信号的语音信号处理系统,包括0039预处理模块,主要有以下功能A/D数模转换,麦克风采集到的信号是模拟信号,模拟信号不利处用DSP芯片进行处理,所以首先在这里实现数模转换,把模拟信号转换成数字信号。信号的预加重,预加重的目的是提升信号的高频部分,使信号的频谱变得平坦,以保持信号在整个频带内具有同样的信噪比,便于声道参数分析。分。
12、帧加窗,在对语音信号进行分析和处理之前先将语音段分割成若干短的时间段,以保证每一个短的时间段内语音信号可近似看作具有固定特性的连续语音片段。0040话语端点检测模块,语音信号的端点检测是进行特征训练和识别的基础,一般采集到的语音信号都掺杂无声段和短时噪声等无用的信息,造成语音的数据量非常大,为了从语音波形中提取出反映语音特征的参数,须采用端点检测的方法来确定一段语音信号的起点和终点。0041特征向量提取模块,首先,原始的语音信号不能直接用于模版训练和模式匹配,这是因为原始信号的数据量太大,系统的运算和存储负担过重;其次,原始语音信号包含太多的随机因素,极大地影响了系统的识别率。特征提取就是对语。
13、音信号进行分析处理,去除对语音识别无关紧要的冗余信息,提取出对语音识别有用的信息。0042模式匹配模块,将待识别的语音经预处理以及特征提取以后得到的特征矢量序列称之为测试模版,将特征模版库中的各个模版称之为参考模版,计算测试模版和参考模版之间的相似度,然后得出识别结果。00433用于对识别结果进行处理的识别结果处理系统,包括0044用于执行语音信号处理系统的命令的开关电路。0045用于控制门锁的控制电机,控制着门锁的开合。0046门锁,本门禁系统的主要部分。0047所述的语音识别系统原理图如图2所示,识别过程分为两个步骤第一步是系统的学习阶段,这一阶段的任务是建立识别单位的声学模型;第二步是测。
14、试阶段,根据识别系统的类型选择能够满足要求的一种识别方法,采用语音分析方法提出这种识别方法要求的特征参数,按照一定准则与系统模型进行比较,通过判决得出识别结果。具体步骤如下0048A/D数模转换采样人说话的信号频率范围主要集中在300HZ3000HZ,语音信号通过输入设备转化成电信号后,需要设计一个带通滤波器以便滤掉语音信号频率以外的干扰由A/D采样装置根据NYQUIST采样定理,以不小于语音信号频谱带宽2倍的采样频率进行采样。0049预加重,目的是提升信号的高频部分,使信号的频谱变得平坦,以保持信号在整个频带内具有同样的信噪比,便于声道参数分析通常是用一阶数字滤波器来实现。0050分帧加窗,。
15、在对语音信号进行分析和处理之前先将语音段分割成若干短的时间段,以保证每一个短的时间段内语音信号可近似看作具有固定特性的连续语音片段这样一个短的时间段称为一帧,对每一帧进行处理也就等效于对固定特性的一段连续语音进行处说明书CN102005070ACN102005083A4/4页6理将语音信号分成若干帧的常用手段是对语音信号进行加窗处理,即用一个有限长度的窗函数截取一段语音信号来进行分析在语音信号的数字处理中常用的是矩形窗和汉明窗。0051端点检测,语音信号的端点检测是进行特征训练和识别的基础,一般采集到的语音信号都掺杂无声段和短时噪声等无用的信息,造成语音的数据量非常大,为了从语音波形中提取出反。
16、映语音特征的参数,须采用端点检测的方法来确定一段语音信号的起点和终点端点监测涉及的信息包括短时能量过零碎。0052特征向量提取,本系统采用了不同说话人的分散程度与各说话人自身的分散程度之间的对比值作为特征参数的评价方法。对单个参数而言,可以取两种分布参数的方差比称为F比作为有效的度量准则。F比反映了不同说话人的分散程度与各说话人自身的分散程度之间的对比关系。0053模式匹配,说话人对同一个词的两个发音不可能完全相同,这些差异不仅包括音强的大小频谱的偏移,更重要的是发音时音节的长短就不可能完全相同,而且两次发音的音节往往不存在线性的对应关系,在语音识别过程中,用户进行训练或者识别时,即使每次尽量。
17、以同样的方式说同一个词汇,其持续时间的长度也会随机改变,因此,如果直接用特征矢量参数序列的模式来进行相似性的比较,其效果不是最佳的,需要对特征参数序列重新进行时间的校准,采用动态时间规整DTW方法可以有效地解决这个问题。为了进行相似度测量,将特征模版库中的各个模版称之为参考模版,用R来表示;将待识别的语音经预处理以及特征提取以后得到的特征矢量序列称之为测试模版,用T表示。计算测试模版和参考模版之间的相似度,可以计算它们之间的失真,失真度越小相似性越高测试模版和参考模版之间的总体失真表示为DT,R00540055判决器将测试信号相对于参考模版的失真度与系统设定的可靠阈值DTH进行比较,根据比较结。
18、果做出判决如果DINDTH,拒绝请求,如果DINDTH,接受请求,并驱动电磁设备进行开锁动作。0056用户使用流程图如图3所示,用户说出“开门”,系统接收到语音信号好,判断该声音信号是否属于指定的人群,如果不是,则忽略,如果是,则通过喇叭发出预先设定的问题。用户听到问题后经行回答,如果回答错误,系统则通过喇叭说“回答错误”,用户必须重新进行开门流程。如果回答正确,系统则启动开锁动作。0057以上对本发明实施例所提供的语音识别门禁系统进行了详细介绍,本文发明应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。说明书CN102005070ACN102005083A1/2页7图1图2说明书附图CN102005070ACN102005083A2/2页8图3说明书附图CN102005070A。