利用汽车喇叭声纹中断车机消息播报的方法及系统技术领域
本发明涉及建筑施工领域,特指一种利用汽车喇叭声纹中断车机消息播报的方法
及系统。
背景技术
语音交互方式在车载设备的广泛运用,涉及到的技术包括:语音识别、语音合成、
声纹识别等。用户通过语音交互系统,说话就能操控汽车上车机设备,实现打电话、导航、听
音乐等功能。同时,当设备收到消息时,如来电、来短信、微信消息、推送通知等,也会通过语
音合成技术,提示用户接收到新信息,是否需要播报内容或执行操作。
在车机设备上的消息播报系统进行消息播报时,当所播报的消息为私人信息,而
车内同乘有多人时,为避免私人信息被直接播报出来,车主需通过操作中断消息播报系统
的播报,中断操作一般通过车机设备的控制面板来实施,可能会存在操作不及时而导致播
报未及时终止的情形,即使及时终止了播报也会给车主带来尴尬的情境。
发明内容
本发明的目的在于克服现有技术的缺陷,提供一种利用汽车喇叭声纹中断车机消
息播报的方法及系统,解决现有技术中消息播报系统在消息播报时通过操作控制面板终止
播报而存在的操作不及时和为车主带来尴尬情境的问题。
实现上述目的的技术方案是:
本发明提供了一种利用汽车喇叭声纹中断车机消息播报的方法,包括如下步骤:
于车机设备上建立喇叭声纹模型;
在所述车机设备收到需进行消息播报的消息时,激活所述喇叭声纹模型;
通过所述车机设备上的麦克风连续不断地进行监听录音以获取录音信号;
对所述录音信号进行降噪处理并提取对应的声纹特征;以及
将所提取的声纹特征输入到所述喇叭声纹模型中进行匹配判断,
若所提取的声纹特征与喇叭声纹特征相匹配,则形成中断播报指令发送给所述车
机设备以中断消息播报进而使得所述消息播报结束;
若所提取的声纹特征与所述喇叭声纹特征不匹配,则继续进行匹配判断直至所述
消息播报结束。
本发明利用了喇叭声音来中断消息播报,在车机声波进行消息播报的过程中,始
终对车内的环境进行监听,当监听到喇叭声音时,立即中断消息播报并取消播报流程,对车
主的隐私起到了很好的保护。按喇叭的操作经常发生且极易操作,能够快速有效的中断消
息播报,另外,利用喇叭中断播报,按喇叭能够转移其他同乘人员的注意力,且按喇叭的动
作不会产生违和感,能够较好的化解尴尬情境,提升了语音产品的人文关怀。
本发明利用汽车喇叭声纹中断车机消息播报的方法的进一步改进在于,于车机设
备上建立喇叭声纹模型,包括:
采集多种环境下的喇叭声音信号,并从所采集的喇叭声音信号中提取出对应的喇
叭声纹特征;
利用所提取的喇叭声纹特征进行声学模型训练以得到对应的喇叭声纹模型。
本发明利用汽车喇叭声纹中断车机消息播报的方法的进一步改进在于,采集多种
环境下的喇叭声音信号,包括:
采集汽车在不同档位行驶的环境下的喇叭声音信号;
采集汽车在开、关窗的环境下的喇叭声音信号;以及
采集汽车内有、无背景声音的环境下的喇叭声音信号。
本发明利用汽车喇叭声纹中断车机消息播报的方法的进一步改进在于,在消息播
报结束时,释放所述喇叭声纹模型。
本发明还提供了一种利用汽车喇叭声纹中断车机消息播报的系统,包括:
装设于车机设备上的喇叭声纹模型,所述喇叭声纹模型与所述车机设备上的消息
播报系统连接,所述消息播报系统在收到需进行消息播报的消息时形成激活指令发送给所
述喇叭声纹模型,以激活所述喇叭声纹模型;
与所述喇叭声纹模型连接的音频获取模块,所述音频获取模块与所述车机设备上
的麦克风控制连接,所述喇叭声纹模型被激活后向所述音频获取模块发送录音获取指令,
所述音频获取模块根据所述录音获取指令控制所述麦克风连续不断地进行监听录音并获
取所形成录音信号,所述音频获取模块对所获取的所述录音信号进行降噪处理;
与所述音频获取模块和所述喇叭声纹模型连接的特征提取模块,所述特征提取模
块接收所述音频获取模块所获取的录音信号并对所述录音信号进行特征提取以获得对应
的声纹特征,所述特征提取模块将所提取的声纹特征发送给所述喇叭声纹模型;以及
与所述喇叭声纹模型和所述消息播报系统连接中断控制模块;
其中:
所述喇叭声纹模型对所提取的声纹特征与喇叭声纹特征进行匹配判断并输出匹
配判断结果给所述中断控制模块;
当所述匹配判断结果为所提取的声纹特征与喇叭声纹特征相匹配时,所述中断控
制模块形成中断播报指令发送给所述消息播报系统以中断消息播报进而使得消息播报结
束;
当所述匹配判断结果为所提取的声纹特征与喇叭声纹特征不匹配时,则中断控制
模块不处理。
本发明利用汽车喇叭声纹中断车机消息播报的系统的进一步改进在于,所述喇叭
声纹模型通过喇叭声纹特征进行声学模型训练得到,所述喇叭声纹特征通过对多种环境下
的喇叭声音信号进行提取获得。
本发明利用汽车喇叭声纹中断车机消息播报的系统的进一步改进在于,多种环境
下的喇叭声音信号包括汽车在不同档位行驶的环境下的喇叭声音信号,汽车在开、关窗的
环境下的喇叭声音信号以及汽车内有、无背景声音的环境下的喇叭声音信号。
本发明利用汽车喇叭声纹中断车机消息播报的系统的进一步改进在于,所述消息
播报系统在消息播报结束时,形成结束播报指令发送给所述喇叭声纹模型以释放所述喇叭
声纹模型。
本发明利用汽车喇叭声纹中断车机消息播报的系统的进一步改进在于,所述喇叭
声纹模型在接收到所述结束播报指令后形成关闭指令并发送至所述音频获取模块、所述特
征提取模块以及所述中断控制模块,以令所述音频获取模块、所述特征提取模块以及所述
中断控制模块停止运行。
附图说明
图1为本发明利用汽车喇叭声纹中断车机消息播报的方法及系统的流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
本发明提供了一种利用汽车喇叭声纹中断车机消息播报的方法及系统,为车机设
备在消息播报过程提供了一种中断播报的方法,即利用喇叭声音来中断车机设备的消息播
报流程。汽车喇叭声音是一种固定的声音信号,具有固定频谱和声域,通过采集、归纳、提取
汽车喇叭声音的声纹特征,并利用该声纹特征训练得到喇叭声纹模型,进而结合声纹识别
技术,在车机设备的消息播报流程中持续监听声音信号,当监听到声音信号匹配喇叭声纹
模型中的已知的喇叭声纹特征,就判断为喇叭声音,并且执行中断消息播报流程的操作,当
监听到的声音不匹配时,就继续监听直至消息播报流程结束。由于按喇叭操作经常发生且
极易操作,能够快速有效的中断消息播报流程,按喇叭还能够转移车内其他乘坐人的注意
力,且按喇叭动作不会产生违和感,化解尴尬情境,保护了用户的隐私信息不被播报,还提
升了语音产品的人文关怀。下面结合附图对本发明利用汽车喇叭声纹中断车机消息播报的
方法及系统进行说明。
本发明提供了一种利用汽车喇叭声纹中断车机消息播报的系统,该系统包括有喇
叭声纹模型、音频获取模块、特征提取模块、以及中断控制模块。该系统可集成到车机设备
的语音交互系统中,也可以作为单独的产品装设到车机设备上,并与语音交互系统通信连
接,语音交互系统内设置有消息播报系统,用于接收到的需要进行消息播报的消息进行语
音播报。本发明利用汽车喇叭声纹中断车机消息播报的系统中的喇叭声纹模型装设于车机
设备上,在系统集成于车机设备的语音交互系统中的情形下,该喇叭声纹模型可集成于车
机设备的语音交互系统中。该喇叭声纹模型与车机设备上的消息播报系统连接,喇叭声纹
模型还与音频获取模块、特征提取模块、以及中断控制模块连接,特征提取模块与音频获取
模块连接,中断控制模块与消息播报系统连接。
消息播报系统在收到需要进行消息播报的消息时形成激活指令,如图1所示,在收
到消息后形成激活指令发送给喇叭声纹模型以激活喇叭声纹模型。消息播报系统在收到消
息后,在发送激活指令的同时还进行tts播报新信息提示(tts,text to speech,从文本到
语音),利用语音交互系统询问用户是否需要对新信息进行语音播报,提示后等待用户反
馈。若用户反馈为播报,则该消息播报系统对新信息进行语音播报,即进入语音播报流程直
至完成播报,若用户反馈为不播报,则消息播报系统的播报流程结束,在播报流程结束后形
成结束播报指令给喇叭声纹模型以释放喇叭声纹模型。
在喇叭声纹模型被激活指令激活后,该喇叭声纹模型向音频获取模块发送录音获
取指令,音频获取模块根据录音获取指令开始运行。该音频获取模块与车机设备上的麦克
风控制连接,音频获取模块运行后控制车机设备上的麦克风连续不断地进行监听录音并获
取所形成的录音信号,该音频获取模块还用于对获取的录音信号进行降噪处理。具体地,麦
克风在被音频获取模块控制开启后,实时地进行录音,所形成的录音信号为模拟信号,该音
频获取模块中设有模数转换器,形成的录音信号经模数转换器转换为数字信号。在音频获
取模块中还设有降噪子模块,降噪子模块利用环境噪音对转换成数字信号的录音信号进行
降噪,该降噪子模块所利用的环境噪音可以是预先存储的,也可以是在车机设备开启后录
取的车内环境声音所形成的。
特征提取模块接收音频获取模块所获取的录音信号,音频获取模块对录音信号进
行降噪处理后,将处理后的录音信号发送给特征提取模块,该特征提取模块用于对录音信
号进行特征提取以获得对应的声纹特征,该特征提取模块所提取的声纹特征发送给喇叭声
纹模型,以令喇叭声纹模型进行识别。
喇叭声纹模型在接收到特征提取模块发送的提取的声纹特征后,对该提取的声纹
特征进行匹配判断,并输出匹配判断结果给中断控制模块。当匹配判断结果为所提取的声
纹特征与喇叭声纹特征相匹配时,该中断控制模块根据该匹配判断结果形成中断播报指令
发送给消息播报信息以中断消息播报进而使得消息播报结果;当匹配判断结果为所提取的
声纹特征与喇叭声纹特征不匹配时,则中断控制模块不作处理。匹配判断结果为提取的声
纹特征与喇叭声纹特征相匹配时,表示用户进行了按喇叭操作,在监听到喇叭声音时立即
中断消息播报流程,实现快速及时有效的中断,以保护用户隐私,解决现有通过操作面板操
作不及时的问题。
本发明中的喇叭声纹模型是通过喇叭声纹特征进行声学模型训练得到的,为了提
高喇叭声纹模型识别的准确率,需要采集大量的喇叭声纹特征进行声学模型训练,且喇叭
声纹特征还要通过多种环境下的喇叭声音信号进行提取获得。多种环境下的喇叭声音信号
包括有汽车在不同档位行驶的环境下的喇叭声音信号,汽车在开、关窗的环境下的喇叭声
音信号以及汽车内有、无背景声音的环境下的喇叭声音信号。采集喇叭声音信号时,在真实
场景的不同状态中进行,若是前装车机,则需要采集该汽车车型在各种状态的喇叭声音,包
括各档车速、开关窗、是否有背景声音的状态下。若是后装车机,则需要采集不同车型在各
种状态的喇叭声音,对车型和上述的各档车速、开关窗、是否有背景声音的状态进行组合采
集喇叭声音。
消息播报系统在消息播报结束时,形成结束播报指令发送给喇叭声纹模型以释放
喇叭声纹模型。该消息播报系统的消息播报结束包括完成播报消息、用户反馈不播报以及
中断控制模块发送中断播报指令而中断消息播报。该喇叭声纹模型在接收到结束播报指令
后形成关闭指令并发送给音频获取模块、特征提取模块以及中断控制模块,令音频获取模
块、特征提取模块以及中断控制模块停止运行,以待下次被激活。
本发明利用汽车喇叭声纹中断车机消息播报的系统的有益效果为:
本发明的系统针对车载场景且同乘车又有多个人的情况,为了避免私人信息被直
接播报,在语音播报消息过程中,进行实施监听,在监听到喇叭声音,立即中断语音播报,有
效保护用户隐私。
按喇叭操作在汽车使用过程中经常发生且极易操作,实现了快速及时有效的中断
消息播报,解决了现有操作面板操控不及时的问题。
按喇叭还能够转移其他乘坐人的注意力,同时按喇叭的动作不会产生违和感,化
解尴尬情境,提升了语音产品的人文关怀。
下面对本发明利用汽车喇叭声纹中断车机消息播报的方法进行说明。
本发明的利用汽车喇叭声纹中断车机消息播报的方法包括如下步骤:
在车机设备上建立喇叭声纹模型,该喇叭声纹模型用于识别喇叭声音;
在车机设备收到需进行消息播报的消息时,激活所建立的喇叭声纹模型,使得喇
叭声纹模型处于运行状态;
通过车机设备上的麦克风连续不断地进行监听录音以获取录音信号;
对所获取的录音信号进行降噪处理并提取对应的声纹特征;
将所提取的声纹特征输入到喇叭声纹模型中进行匹配判断,即通过喇叭声纹模型
对所提取的声纹特征进行识别;当所提取的声纹特征与喇叭声纹特征相匹配,则形成中断
播报指令发送给车机设备以中断消息播报进而使得消息播报结束;当所提取的声纹特征与
喇叭声纹特征不匹配,则继续进行匹配判断直至消息播报结束。
本发明的方法针对车机设备的语音交互系统,该语音交互系统内设置有消息播报
系统,用于接收到的需要进行消息播报的消息进行语音播报。本发明的方法对消息播报系
统实现控制,在消息播报的过程中,通过获取到了喇叭声音从而中断消息播报,避免了私人
信息被直接播报。下面结合图1,对本发明的利用汽车喇叭声纹中断车机消息播报方法的流
程进行说明。
如图1所示,消息播报系统接收到新信息时,即步骤S101,收到消息,消息播报系统
接着执行步骤S102和步骤S107。
执行步骤S102,激活喇叭声纹模型,该消息播报系统可以通过发送激活指令的方
式激活喇叭声纹模型,被激活的喇叭声纹模型处于运行状态。接着执行步骤S103。
执行步骤S103,监听录音,在喇叭声纹模型被激活后,开始持续地监听录音,可以
通过控制车机设备的麦克风开启进行监听录音,连续不断地录制以形成录音信号。接着执
行步骤S104。
执行步骤S104,降噪处理,对所录制的录音信号进行降噪处理,可以利用实现预存
的环境噪音进行降噪处理,也可以在车机设备启动时,对车内环境声音进行录制形成环境
噪音。接着执行步骤S105。
执行步骤S105,对经过降噪处理的录音信号进行声纹特征提取,以提取与录音信
号对应的声纹特征。接着执行步骤S106。
执行步骤S106,喇叭声纹模型对所提取的声纹特征进行匹配判断,即对所提取的
声纹特征进行识别,识别其是否为喇叭声音。喇叭声纹模型将所提取的声纹特征与喇叭声
纹特征进行匹配判断,若所提取的声纹特征与喇叭声纹特征相匹配,则接着执行步骤S109。
若所提取的声纹特征与喇叭声纹特征不匹配,则接着执行步骤S102,以继续进行监听录音。
执行步骤S107,tts播报新信息提示,即语音提示用户收到新信息是否需要播报,
接着执行步骤S108。
执行步骤S108,等待用户反馈。这步骤S107和步骤S108中接收到用户反馈后,若反
馈信息为播报,则执行步骤S110,若反馈信息为不播报,则执行步骤S109。
执行步骤S110,语音播报流程,对新信息进行语音播报。接着执行步骤S111。
执行步骤S109,中断当前播报流程,接着执行步骤S111。
执行步骤S111,流程结束,语音播报流程结束,接着执行步骤S112。
执行步骤S112,释放喇叭声纹模型。
在步骤S111的流程结束中,会有多种结束情况,在语音播报完成后进入到流程结
束,在用户反馈不播报而通过中断当前播报流程而进入流程结束,在喇叭声纹模型识别到
有喇叭声音而通过中断当前播报流程而进入流程结束。本发明利用了喇叭声音来中断消息
播报,在车机声波进行消息播报的过程中,始终对车内的环境进行监听,当监听到喇叭声音
时,立即中断消息播报并取消播报流程,对车主的隐私起到了很好的保护。按喇叭的操作经
常发生且极易操作,能够快速有效的中断消息播报,另外,利用喇叭中断播报,按喇叭能够
转移其他同乘人员的注意力,且按喇叭的动作不会产生违和感,能够较好的化解尴尬情境,
提升了语音产品的人文关怀。
本发明的方法的一较佳实施方式,在车机设备上建立喇叭声纹模型包括:
采集多种环境下的喇叭声音信号,并从所采集的喇叭声音信号中提取出对应的喇
叭声纹特征,为提高喇叭声纹模型的识别准确率,需采集大量的喇叭声音信号。利用所提取
的喇叭声纹特征进行声学模型训练以得到对应的喇叭声纹模型。
采集多种环境下的喇叭声音信号包括:采集汽车在不同档位行驶的环境下的喇叭
声音信号;采集汽车在开、关窗的环境下的喇叭声音信号;以及采集汽车内有、无背景声音
的环境下的喇叭声音信号。采集喇叭声音信号时,在真实场景的不同状态中进行,若是前装
车机,则需要采集该汽车车型在各种状态的喇叭声音,包括各档车速、开关窗、是否有背景
声音的状态下。若是后装车机,则需要采集不同车型在各种状态的喇叭声音,对车型和上述
的各档车速、开关窗、是否有背景声音的状态进行组合采集喇叭声音。
在消息播报结束时,释放喇叭声纹模型,可通过形成结束播报指令的方式来释放
喇叭声纹模型,以待下次被激活。
以上结合附图实施例对本发明进行了详细说明,本领域中普通技术人员可根据上
述说明对本发明做出种种变化例。因而,实施例中的某些细节不应构成对本发明的限定,本
发明将以所附权利要求书界定的范围作为本发明的保护范围。