一种应用于手机的语音增强方法和装置.pdf

上传人:00****42 文档编号:4327584 上传时间:2018-09-13 格式:PDF 页数:15 大小:2.05MB
返回 下载 相关 举报
摘要
申请专利号:

CN201210278704.6

申请日:

2012.08.07

公开号:

CN102801861A

公开日:

2012.11.28

当前法律状态:

授权

有效性:

有权

法律详情:

专利权人的姓名或者名称、地址的变更IPC(主分类):G10L 21/0208变更事项:专利权人变更前:歌尔声学股份有限公司变更后:歌尔股份有限公司变更事项:地址变更前:261031 山东省潍坊市高新技术产业开发区东方路268号变更后:261031 山东省潍坊市高新技术产业开发区东方路268号|||授权|||实质审查的生效IPC(主分类):H04M 1/725申请日:20120807|||公开

IPC分类号:

H04M1/725; G10L21/02

主分类号:

H04M1/725

申请人:

歌尔声学股份有限公司

发明人:

刘崧; 李波; 楼厦厦

地址:

261031 山东省潍坊市高新技术产业开发区东方路268号

优先权:

专利代理机构:

北京市隆安律师事务所 11323

代理人:

权鲜枝;何立春

PDF下载: PDF下载
内容摘要

本发明公开了一种应用于手机的语音增强方法和装置。本发明这种在用户说话时对用户的手机握持状态进行检测,根据用户的手机握持状态采用不同的降噪处理方案,在用户正常握持手机时采用多麦克风降噪和单麦克风降噪结合的方案对稳态噪声和非稳态噪声都进行有效的抑制,而在用户异常握持手机时采用单麦克风降噪方案只对稳态噪声进行抑制,避免了多麦克风降噪对语音的损伤,保证了语音质量。

权利要求书

1.一种应用于手机的语音增强方法,其特征在于,在手机的底部设置主麦克风,在手机的远离主麦克风的位置设置一个或多个辅麦克风,则该方法包括:根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态;当判断用户处于说话状态时,进一步检测用户的手机握持状态是正常握持手机还是异常握持手机;当检测到用户正常握持手机时,采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理;当检测到用户异常握持手机时,只采用单麦克风降噪方式进行语音增强处理。2.根据权利要求1所述的方法,其特征在于,所述根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态包括:计算主麦克风信号与辅麦克风信号之间的相关值,如果该相关值大于第一阈值则判断用户处于说话状态,如果该相关值小于或等于第一阈值则判断用户处于接听状态;计算主麦克风信号与辅麦克风信号之间的相关值为:计算主麦克风信号与每个辅麦克风信号之间的相关值,然后进行平均得到平均相关值,或者,计算主麦克风信号与其中一个辅麦克风信号之间的相关值。3.根据权利要求1所述的方法,其特征在于,所述检测用户的手机握持状态是正常握持手机还是异常握持手机包括:通过多麦克风检测语音的方向,若语音来自手机底部方向,则确定用户正常握持手机,若语音来自手机的侧向或顶部方向,则确定用户异常握持手机;或者,计算主麦克风信号能量与辅麦克风信号能量的比值,如果该比值大于第二阈值,则确定用户正常握持手机,如果该比值小于或等于第二阈值,则确定用户异常握持手机。4.根据权利要求1所述的方法,其特征在于,该方法进一步包括:在根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态之前,先对主麦克风信号和各辅助麦克风信号进行快速傅里叶变换处理;在进行语音增强处理之后,再对降噪后的信号进行逆快速傅里叶变换处理;所述采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理包括:先进行多麦克风降噪处理,然后进行单麦克风降噪处理;其中,先进行多麦克风降噪处理为:在每个频率子带上,计算主麦克风信号和辅麦克风信号在该频率子带上的能量比值,根据该能量比值确定抑噪函数在该频率子带上的取值;将抑噪函数与主麦克风信号进行相乘运算得到抑制非稳态噪声后的信号;然后进行单麦克风降噪处理为:在每个频率子带上,通过滑动平均算法计算出所述抑制非稳态噪声后的信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在该频率子带上的取值;将语音成分比例函数与所述抑制非稳态噪声后的信号进行相乘运算,得到抑制非稳态噪声后又抑制了稳态噪声的信号;所述只采用单麦克风降噪方式进行语音增强处理包括:在每个频率子带上,通过滑动平均算法计算出主麦克风信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在该频率子带上的取值;将语音成分比例函数与主麦克风信号进行相乘运算,得到抑制稳态噪声后的信号。5.根据权利要求1至4中任一项所述的方法,其特征在于,该方法进一步包括:当判断用户处于接听状态时,保持之前的语音增强处理方式不变。6.一种应用于手机的语音增强装置,其特征在于,在手机的底部设置有主麦克风,在手机的远离主麦克风的位置设置有一个或多个辅麦克风,则该装置包括:检测单元和降噪单元,其中:检测单元,用于根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态;当判断用户处于说话状态时,进一步检测用户的手机握持状态是正常握持手机还是异常握持手机,并通知给降噪单元;降噪单元,用于在接收到用户正常握持手机的通知时,采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理;用于在接收到用户异常握持手机的通知时,只采用单麦克风降噪方式进行语音增强处理。7.根据权利要求6所述的装置,其特征在于,所述检测单元包括:近场语音检测模块和握持状态检测模块;所述降噪单元包括:多麦克风降噪处理模块和单麦克风降噪处理模块;其中,近场语音检测模块,用于接收主麦克风信号和各辅助麦克风信号,并根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态,当判断用户处于说话状态时向握持状态检测模块发送通知,当判断用户处于接听状态时不向握持状态检测模块发送通知;握持状态检测模块,用于接收主麦克风信号和各辅助麦克风信号,在收到近场语音检测模块的通知时,检测用户的手机握持状态是正常握持手机还是异常握持手机,当检测到用户正常握持手机时,将主麦克风信号和各辅助麦克风信号发送给多麦克风降噪处理模块,当检测到用户异常握持手机时,将主麦克风信号发送给单麦克风降噪处理模块;多麦克风降噪处理模块,用于对所接收的信号进行多麦克风降噪处理后发送给单麦克风降噪处理模块;单麦克风降噪处理模块,用于对所接收的信号进行单麦克风降噪处理后输出。8.根据权利要求7所述的装置,其特征在于,所述近场语音检测模块,用于计算主麦克风信号与辅麦克风信号之间的相关值,如果该相关值大于第一阈值则判断用户处于说话状态,如果该相关值小于或等于第一阈值则判断用户处于接听状态;其中,所述近场语音检测模块,计算主麦克风信号与每个辅麦克风信号之间的相关值,然后进行平均得到平均相关值,或者,计算主麦克风信号与其中一个辅麦克风信号之间的相关值。9.根据权利要求7所述的装置,其特征在于,所述握持状态检测模块,用于通过多麦克风检测语音的方向,若语音来自手机底部方向,则确定用户正常握持手机,若语音来自手机的侧向或顶部方向,则确定用户异常握持手机;或者,所述握持状态检测模块,用于计算主麦克风信号能量与辅麦克风信号能量的比值,如果该比值大于第二阈值,则确定用户正常握持手机,如果该比值小于或等于第二阈值,则确定用户异常握持手机。10.根据权利要求7所述的装置,其特征在于,该装置还包括:快速傅里叶变换模块和逆快速傅里叶变换模块,其中:快速傅里叶变换模块,用于将主麦克风信号和各辅麦克风信号分别进行快速傅里叶变换处理后发送给近场语音检测模块和握持状态检测模块;所述多麦克风降噪处理模块,用于在每个频率子带上,计算主麦克风信号和辅麦克风信号在该频率子带上的能量比值,根据该能量比值确定抑噪函数在该频率子带上的取值;用于将抑噪函数与主麦克风信号进行相乘运算得到抑制非稳态噪声后的信号后输出给单麦克风降噪处理模块;所述单麦克风降噪处理模块,用于在每个频率子带上,通过滑动平均算法计算出所接收信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在该频率子带上的取值;将语音成分比例函数与所接收信号进行相乘运算得到抑制稳态噪声的信号后输出给逆快速傅里叶变换模块;逆快速傅里叶变换模块,用于对所接收的信号进行逆快速傅里叶变换处理后输出。

说明书

一种应用于手机的语音增强方法和装置

技术领域

本发明涉及语音信号处理技术领域,特别涉及一种应用于手机的语音增
强方法和装置。

背景技术

手机在人们的日常生活和工作中已经得到了广泛应用,解除了人们通讯
的时空约束,为人们的生活和工作提供了极大的便利。但是人们进行通讯的
环境是复杂多变的,其中包括吵杂的环境,噪声会使得通话的语音质量严重
下降,因此应用于手机的抑制噪声的语音增强技术有着重要的意义。

目前手机中常用的语音增强技术中有单麦克风谱减语音增强技术,也叫
单通道谱减语音增强技术,也可以成为单麦克风降噪技术,这种技术只能抑
制稳态的噪声,对非稳态的噪声,如商场超市或餐厅里的周围人的说话声等,
没有明显的抑制效果。

另一种更优的降噪技术是多麦克风阵列语音增强技术,也称为多麦克风
降噪技术,这种技术又分为两类:

第一类是通过多麦克风信号处理形成固定的指向性,即保留来自一个指
定方向的声音,抑制来自其它方向的声音,当处理形成的指向性指向使用者
的嘴则能达到保护语音抑制周围噪声的效果。

第二类是利用多麦克风接收到信号的能量差来区分语音噪声从而进行降
噪处理。图1是利用多麦克风接收到信号的能量差来区分语音噪声从而进行
降噪处理方案的多麦克风的安装位置示意图。如图1所示,这里有两个麦克
风,分别为主麦克风1和辅麦克风2,把主麦克风1安装到手机的底端靠近
人嘴的位置,主麦克风1接收到的使用者的语音信号能量很大,辅麦克风2
安装在手机的顶端远离人嘴的位置,辅麦克风2接收到的使用者的语音信号
能量小。如图1所示,对于外界环境噪声两个麦克风接收到的能量接近,因
此通过比较两个麦克风接收到的信号能量差异可以判断是语音信号还是噪声
信号,从而保留语音成分抑制噪声成分,达到提高信噪比的效果。

多麦克风降噪技术优于单麦克风降噪技术的是可以有效抑制非稳态的噪
声。但是多麦克风降噪技术对用户使用手机的方式会有严格约束,即用户握
持手机的方式要受到限制。对于所述第一类利用指向性的技术来说,用户必
须保持指向性对准人嘴的握持方式,否则若用户的握持方式有偏差就会导致
人嘴偏离被保护的方向,语音就会被作为来自其他方向的噪声抑制;同样对
于第二类利用能量差异的技术也要求用户保证主麦克靠近人嘴而辅麦克远离
嘴握持方式,如图2所示,图2是用户正常握持手机状态示意图;当用户异
常握持时,如手机被水平握持时,如图3所示,图3是用户异常握持手机状
态示意图,两个麦克风到人嘴的距离接近,语音到两个麦克风的能量接近,
语音同样会被当作噪声抑制。

发明内容

有鉴于此,本发明提供了一种应用于手机的语音增强方法和装置,以解
决只采用单麦克风降噪只能一致稳态噪声,而采用多麦克风降噪虽然能抑制
非稳态噪声但在用户异常握持手机时损伤语音信号的问题。

为达到上述目的,本发明的技术方案是这样实现的:

本发明公开了一种应用于手机的语音增强方法,在手机的底部设置主麦
克风,在手机的远离主麦克风的位置设置一个或多个辅麦克风,则该方法包
括:

根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于
接听状态;

当判断用户处于说话状态时,进一步检测用户的手机握持状态是正常握
持手机还是异常握持手机;

当检测到用户正常握持手机时,采用多麦克风降噪和单麦克风降噪相结
合的方式进行语音增强处理;

当检测到用户异常握持手机时,只采用单麦克风降噪方式进行语音增强
处理。

在上述方法中,所述根据主麦克风信号和各辅助麦克风信号判断用户处
于说话状态还是处于接听状态包括:

计算主麦克风信号与辅麦克风信号之间的相关值,如果该相关值大于第
一阈值则判断用户处于说话状态,如果该相关值小于或等于第一阈值则判断
用户处于接听状态;

计算主麦克风信号与辅麦克风信号之间的相关值为:计算主麦克风信号
与每个辅麦克风信号之间的相关值,然后进行平均得到平均相关值,或者,
计算主麦克风信号与其中一个辅麦克风信号之间的相关值。

在上述方法中,所述检测用户的手机握持状态是正常握持手机还是异常
握持手机包括:

通过多麦克风检测语音的方向,若语音来自手机底部方向,则确定用户
正常握持手机,若语音来自手机的侧向或顶部方向,则确定用户异常握持手
机;

或者,计算主麦克风信号能量与辅麦克风信号能量的比值,如果该比值
大于第二阈值,则确定用户正常握持手机,如果该比值小于或等于第二阈值,
则确定用户异常握持手机。

该方法进一步包括:在根据主麦克风信号和各辅助麦克风信号判断用户
处于说话状态还是处于接听状态之前,先对主麦克风信号和各辅助麦克风信
号进行快速傅里叶变换处理;在进行语音增强处理之后,再对降噪后的信号
进行逆快速傅里叶变换处理;

所述采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理
包括:先进行多麦克风降噪处理,然后进行单麦克风降噪处理;

其中,先进行多麦克风降噪处理为:在每个频率子带上,计算主麦克风
信号和辅麦克风信号在该频率子带上的能量比值,根据该能量比值确定抑噪
函数在该频率子带上的取值;将抑噪函数与主麦克风信号进行相乘运算得到
抑制非稳态噪声后的信号;

然后进行单麦克风降噪处理为:在每个频率子带上,通过滑动平均算法
计算出所述抑制非稳态噪声后的信号在该频率子带上的平稳噪声能量,进而
计算出语音成分比例函数在该频率子带上的取值;将语音成分比例函数与所
述抑制非稳态噪声后的信号进行相乘运算,得到抑制非稳态噪声后又抑制了
稳态噪声的信号;

所述只采用单麦克风降噪方式进行语音增强处理包括:在每个频率子带
上,通过滑动平均算法计算出主麦克风信号在该频率子带上的平稳噪声能量,
进而计算出语音成分比例函数在该频率子带上的取值;将语音成分比例函数
与主麦克风信号进行相乘运算,得到抑制稳态噪声后的信号

该方法进一步包括:

当判断用户处于接听状态时,保持之前的语音增强处理方式不变。

本发明还公开了一种应用于手机的语音增强装置,在手机的底部设置有
主麦克风,在手机的远离主麦克风的位置设置有一个或多个辅麦克风,则该
装置包括:检测单元和降噪单元,其中:

检测单元,用于根据主麦克风信号和各辅助麦克风信号判断用户处于说
话状态还是处于接听状态;当判断用户处于说话状态时,进一步检测用户的
手机握持状态是正常握持手机还是异常握持手机,并通知给降噪单元;

降噪单元,用于在接收到用户正常握持手机的通知时,采用多麦克风降
噪和单麦克风降噪相结合的方式进行语音增强处理;用于在接收到用户异常
握持手机的通知时,只采用单麦克风降噪方式进行语音增强处理。

在上述装置中,所述检测单元包括:近场语音检测模块和握持状态检测
模块;所述降噪单元包括:多麦克风降噪处理模块和单麦克风降噪处理模块;
其中,

近场语音检测模块,用于接收主麦克风信号和各辅助麦克风信号,并根
据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状
态,当判断用户处于说话状态时向握持状态检测模块发送通知,当判断用户
处于接听状态时不向握持状态检测模块发送通知;

握持状态检测模块,用于接收主麦克风信号和各辅助麦克风信号,在收
到近场语音检测模块的通知时,检测用户的手机握持状态是正常握持手机还
是异常握持手机,当检测到用户正常握持手机时,将主麦克风信号和各辅助
麦克风信号发送给多麦克风降噪处理模块,当检测到用户异常握持手机时,
将主麦克风信号发送给单麦克风降噪处理模块;

多麦克风降噪处理模块,用于对所接收的信号进行多麦克风降噪处理后
发送给单麦克风降噪处理模块;

单麦克风降噪处理模块,用于对所接收的信号进行单麦克风降噪处理后
输出。

在上述装置中,所述近场语音检测模块,用于计算主麦克风信号与辅麦
克风信号之间的相关值,如果该相关值大于第一阈值则判断用户处于说话状
态,如果该相关值小于或等于第一阈值则判断用户处于接听状态;

其中,所述近场语音检测模块,计算主麦克风信号与每个辅麦克风信号
之间的相关值,然后进行平均得到平均相关值,或者,计算主麦克风信号与
其中一个辅麦克风信号之间的相关值。

在上述装置中,

所述握持状态检测模块,用于通过多麦克风检测语音的方向,若语音来
自手机底部方向,则确定用户正常握持手机,若语音来自手机的侧向或顶部
方向,则确定用户异常握持手机;

或者,

所述握持状态检测模块,用于计算主麦克风信号能量与辅麦克风信号能
量的比值,如果该比值大于第二阈值,则确定用户正常握持手机,如果该比
值小于或等于第二阈值,则确定用户异常握持手机。

该装置还包括:快速傅里叶变换模块和逆快速傅里叶变换模块,其中:

快速傅里叶变换模块,用于将主麦克风信号和各辅麦克风信号分别进行
快速傅里叶变换处理后发送给近场语音检测模块和握持状态检测模块;

所述多麦克风降噪处理模块,用于在每个频率子带上,计算主麦克风信
号和辅麦克风信号在该频率子带上的能量比值,根据该能量比值确定抑噪函
数在该频率子带上的取值;用于将抑噪函数与主麦克风信号进行相乘运算得
到抑制非稳态噪声后的信号后输出给单麦克风降噪处理模块;

所述单麦克风降噪处理模块,用于在每个频率子带上,通过滑动平均算
法计算出所接收信号在该频率子带上的平稳噪声能量,进而计算出语音成分
比例函数在该频率子带上的取值;将语音成分比例函数与所接收信号进行相
乘运算得到抑制稳态噪声的信号后输出给逆快速傅里叶变换模块;

逆快速傅里叶变换模块,用于对所接收的信号进行逆快速傅里叶变换处
理后输出。

由上述可见,本发明这种在用户说话时对用户的手机握持状态进行检测,
根据用户的手机握持状态采用不同的降噪处理方案,在用户正常握持手机时
采用多麦克风降噪和单麦克风降噪结合的方案对稳态噪声和非稳态噪声都进
行有效的抑制,而在用户异常握持手机时采用单麦克风降噪方案只对稳态噪
声进行抑制,避免了多麦克风降噪对语音的损伤,保证了语音质量。

附图说明

图1是利用多麦克风接收到信号的能量差来区分语音噪声从而进行降噪
处理方案的多麦克风的安装位置示意图;

图2是用户正常握持手机状态示意图;

图3是用户异常握持手机状态示意图;

图4是本发明实施例中的一种应用于手机的语音增强装置的结构示意
图。

具体实施方式

本发明是应用于手机的语音增强技术,本发明中采用了手机握持状态检
测技术,对用户正常握持手机状态采用多麦克降噪与单麦克降噪结合处理的
方案,从而能够保证在用户正确握持手机时能达到最优的降噪效果,对用户
异常握持状态采用单通道降噪处理只对稳态噪声进行抑制以避免此时采用多
麦克降噪处理对语音造成伤害。也就是说,本发明在多麦克风降噪的基础上
加入用户手机握持状态的检测,从而能在不同的手机握持状态采用不同的降
噪技术,保证最优降噪的同时也避免语音失真。

下面对本发明的技术方案进行详细分析介绍。

在嘈杂的环境中使用手机通话时往往会遇到这样的情况,自己的说话声
被周围的噪声所掩盖导致对方难以听清,本发明所公开的就是一种消除这些
噪声,保留清晰的语音,使得通话即使在吵闹的环境中仍然能够通畅清晰进
行的多麦克风降噪技术,这里的多个麦克风包括两个或两个以上的麦克风。
因此本技术适用于安装有两个或两个以上麦克风的手机。如图1是一种双麦
克风手机示意图,其中安装在手机底部的是主麦克1,安装在手机背部上端
位置的是辅麦克2。在其他情况下也可以使用3个或3个以上的麦克风,其
中只有一个主麦克风安装在手机底部,其余多个辅麦克风安装在手机的远离
主麦克风的位置,如手机的顶部或背部上端位置。

用户在使用手机通话时通常会有两种握持方式:

1、正常握持,手机底部的主麦克风1挨近用户的嘴,如图2所示。此时
在本发明中采用多麦克风降噪和单麦克风降噪结合的降噪技术能够很好的消
除噪声,同时语音质量不会受到损害;

2、异常握持,手机底部的主麦克风1远远偏离用户的嘴,如图3所示。
此时若采用多麦克降噪技术在消除噪声的同时会把语音当作噪声消除,因此
在本发明中只采用单麦克风降噪处理。

本发明的技术方案主要包括两大单元:检测单元和降噪单元。检测单元
的作用是检测目前的通话状态,这些状态包括:用户在说话还是在接听,用
户正常握持手机还是异常握持手机。其中用户的说话或接听状态由近场语音
检测模块检测得到;用户的握持手机状态则进一步由握持状态检测模块检测
得到。

近场语音检测模块的原理是:当用户使用手机时,不管是正常握持还是
异常握持用户的嘴到手机上的麦克风距离都会小于20cm,可认为是近场声
源,而周围的噪声源一般都会距离手机50cm以上,可认为是远场声源,因
此可以通过检测声源的距离来判断是用户的说话还是用户没有说话只有周围
噪声。若是近场声源,两个麦克风接收到的信号间的相关性强,若是远场声
源,两个麦克风接收到的信号间的相关性弱。因此可以通过计算主辅麦克风
信号间的相关性来判断信号是用户语音还是周围噪声。具体的检测步骤可以
如下:

1、计算主麦克风信号与辅麦克风信号之间的相关值;可以计算主麦克风
信号与每个辅麦克风信号之间的相关值,然后进行平均得到平均相关值,或
者,也可以计算主麦克风信号与其中一个辅麦克风信号之间的相关值;

2、如该相关值小于或等于设定阈值则信号是远场噪声信号,用户处于接
听状态;若该相关值大于设定阈值则信号是近场语音信号,用户处于说话状
态。

若是用户处于说话状态,则进一步进行用户握持状态检测。在本发明中
提供检测用户握持状态的两种方法:

第一种方法:通过多麦克风检测语音的方向,通过语音的方向来判断用
户握持状态,若语音来自手机的底部则是正常握持,若语音来自手机的侧向
或顶部方向则是异常握持。

第二种方法:通过多麦克风信号能量的差异来判断用户握持状态:若主
麦克风信号能量与辅麦克风信号能量的比值大于设定的阈值,则是正确握持,
若能量比值小于或等于设定的阈值,则是异常握持。

经过检测单元的判定后,降噪单元根据不同的状态采用对应的降噪处理:

1、若是正常握持,采用多麦克风降噪模式:即首先经过多麦克风降噪处
理抑制大部分的噪声,然后再经过单麦克风降噪处理抑制残留的稳态噪声,
从而达到最优降噪;

2、若是异常握持,采用单麦克风降噪模式:不经过多麦克风降噪处理,
只经过单麦克风降噪处理抑制稳态噪声,从而保证最优的语音质量。

3、用户接听状态,保持降噪模式不变,即保持之前的语音增强处理方式
不变。由于用户不说话,此时不确定用户的握持状态,因此认为上一次检测
到的握持状态没有改变,所以降噪模式也不改变。

通过本发明可以根据用户使用手机时的握持状态采用不同的降噪模式,
从而有效消除噪声,同时能够保证语音信号不会受到损伤。

为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明
中的应用于手机的语音增强装置进行详细描述。

以图1所示的具有两个麦克风的手机为例,其中主麦克风1在手机的底
部,辅麦克风2在手机的背部上端位置,远离主麦克风1。当用户如图2所
示正常握持手机时,主麦克风1到嘴的距离小于5cm,辅麦克风2到嘴的距
离15cm~20cm。当用户如图3所示异常握持手机时,主麦克风1到嘴的距离
大于10cm,辅麦克风2到嘴的距离15cm~20cm。因此用户正常握持时,主
麦克风1接收到的语音能量与辅麦克风2接收到的语音能量的差异大于9dB
以上;用户异常握持时,主麦克风1接收到的语音能量与辅麦克风2接收到
的语音能量的差异在3dB以内。无论何种握持,主麦克风1接收到的噪声能
量与辅麦克风2接收到的噪声能量的接近,也在3dB以内。因此正常握持时,
能通过两个麦克风的能量差异来区分语音和噪声,采用多麦克风降噪能有效
抑制噪声不损伤语音。但异常握持时,不能通过两个麦克风的能量差异来区
分语音和噪声,采用多麦克风降噪会损伤语音,此时要保护语音只能采用单
麦克风降噪抑制稳态噪声。

在本发明的实施例中,也可以在手机的底部设置1个主麦克风,在手机
的远离主麦克风的位置,如在手机的顶部或背部上端设置2以上的多个辅麦
克风,多个辅助麦克风可以相距较近地分布在手机的顶部或背部上端。

在本实施例中设有P(P为大于1的自然数)个麦克风:首先把主麦克
风接收到的时域信号s1和多个辅麦克风接收到的时域信号s2,…,sP通过快
速傅里叶变换(FFT)变换为频域信号S1,…,SP。频域信号输入近场语音
检测模块,场语音检测模块通过主麦克风信号和辅麦克风信号的相关性判断
输入的信号是近场语音还是远场噪声。若近场语音检测模块检测到的是近场
语音信号,把频域信号输入到握持状态检测模块通过主麦克风信号和辅麦克
风信号的总能量差异判断用户是正常握持还是异常握持。若用户是正常握持,
M个麦克风的M路频域信号输入到多麦克风降噪处理模块进行降噪处理,
然后再经过单麦克风降噪处理,最后输出一路经过降噪后的频域信号。若用
户是异常握持,只把一路主麦克风的频域信号S1输入单麦克风降噪处理模块
进行降噪处理,输出一路经过降噪后的频域信号。若近场语音检测模块检测
到的是远场噪声信号,此时不能确定握持状态,因此保持此时的降噪模式。
最后把经过降噪处理后的频域信号进行逆快速傅里叶变换(IFFT)变换成时
域信号输出。详细的处理结构见图4。

图4是本发明实施例中的一种应用于手机的语音增强装置的结构示意
图。参见图4,该装置包括:快速傅里叶变换模块41、检测单元42、降噪单
元43和逆快速傅里叶变换模块44,其中:

快速傅里叶变换模块41、用于将主麦克风信号和各辅麦克风信号分别进
行快速傅里叶变换处理后发送给检测单元42;

检测单元42,用于根据主麦克风信号和各辅助麦克风信号判断用户处于
说话状态还是处于接听状态;当判断用户处于说话状态时,进一步检测用户
的手机握持状态是正常握持手机还是异常握持手机,并通知给降噪单元43;

降噪单元43,用于在接收到用户正常握持手机的通知时,采用多麦克风
降噪和单麦克风降噪相结合的方式进行语音增强处理;用于在接收到用户异
常握持手机的通知时,只采用单麦克风降噪方式进行语音增强处理;

逆快速傅里叶变换模块44,用于将降噪单元43输出的信号进行逆快速
傅里叶变换处理后输出。

如图4所示,检测单元42包括:近场语音检测模块421和握持状态检测
模块422;降噪单元43包括:多麦克风降噪处理模块431和单麦克风降噪处
理模块432;其中,

近场语音检测模块421,用于接收主麦克风信号和各辅助麦克风信号,
并根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接
听状态,当判断用户处于说话状态时向握持状态检测模块422发送通知;当
判断用户处于接听状态时近场语音检测模块421不向握持状态检测模块422
发送通知,这样握持状态检测模块422就会仍按照之前的握持状态判断结果
向降噪单元43输入对应的信号,则降噪单元43仍保持之前的降噪模式;

握持状态检测模块422,用于接收主麦克风信号和各辅助麦克风信号,
在收到近场语音检测模块421的通知时,检测用户的手机握持状态是正常握
持手机还是异常握持手机,当检测到用户正常握持手机时,将主麦克风信号
和各辅助麦克风信号发送给多麦克风降噪处理模块431,当检测到用户异常
握持手机时,只将主麦克风信号发送给单麦克风降噪处理模块432;

多麦克风降噪处理模块431,用于对所接收的信号进行多麦克风降噪处
理后发送给单麦克风降噪处理模块432;

单麦克风降噪处理模块432,用于对所接收的信号进行单麦克风降噪处
理后输出。

下面对各个模块的具体处理过程进行详细介绍:

快速傅里叶变换模块41:首先对si进行分帧处理(i=1,…,P),每帧N
个采样点,第m帧信号是di(m,n),其中0≤n<N,m≥0。相邻两帧有M个采样
点的混叠,即当前帧的前M个采样点是前一帧的最后M个采样点,每帧只
有L=N-M个采样点的新数据。因此第m帧数据为di(m,n)=si(m*L+n)。例如
在本实施方案中取帧长N=256,混叠M=128,即50%的混叠。分帧处理后对
每帧信号用窗函数win(n)进行加窗处理,加窗后的数据为
wi(m,n)=win(n)*di(m,n)。窗函数可选择汉明窗,汉宁窗等窗函数,本实施方案
选取汉宁窗:

win ( n ) = 0.5 ( 1 - cos ( 2 πn N - 1 ) ) , ]]>

加窗后的数据最后进行FFT转换到频域:

S i ( m , k ) = A i ( m , k ) e - j φ i ( m , k ) = Σ n = 0 N - 1 w i ( m , n ) e - j 2 πnk / N ]]>

其中,是频率子带,Ai(m,k)是幅度,φi(m,k)是相位。

近场语音检测模块421:用于计算主麦克风信号与各辅麦克风信号之间
的相关值,如果该相关值大于第一阈值则判断用户处于说话状态,如果该相
关值小于或等于第一阈值则判断用户处于接听状态;

在只有1个辅麦克风的情况下,可以直接计算主麦克风信号与辅麦克风
信号之间的相关值。在有2个以上辅麦克风的情况下,近场语音检测模块421
可以计算主麦克风信号与每个辅麦克风信号之间的相关值,然后进行平均得
到平均相关值,或者,计算主麦克风信号与其中一个辅麦克风信号之间的相
关值。

在本实施例中具体来说近场语音检测模块421在每个频率子带计算主麦
克风信号S1和一个辅麦克风信号如S2的相关函数Coh12(m,k):

coh 12 ( m , k ) = ( abs ( conj ( S 1 ( m , k ) ) S 2 ( m , k ) ) abs ( S 1 ( m , k ) ) * abs ( S 2 ( m , k ) ) ) 2 ]]>

其中,conj(●)是共轭运算,abs(●)是求模运算。然后计算全频带内相关函数
的均值Mcoh12(m):

MCoh 12 ( m ) = 1 N Σ k = 0 N - 1 Coh 12 ( m , k ) ]]>

同样可以计算计算主麦克风信号S1和其他辅麦克风信号如S3之间的相
关值Mcoh13(m),以此类推。最后再对主麦克风信号与各辅麦克风信号间的
相关值进行求和平均,得到最后的相关值MCoh(m)。

MCoh(m)越大声源到两个麦克风的距离越小,通过MCoh(m)与设定的阈
值Coh_th比较来确定声音是来自近场声源还是远场声源,进而确定声音是用
户语音还是环境噪声,例如在本实施方案中Coh_th设定为0.5。MCoh(m)>
Coh_th说明相关性足够大,信号是来自近场,是用户的语音,用户在讲话。
若MCoh(m)≤Coh_th说明相关性较小,信号是来自远场,是周围的环境噪声,
用户在接听。

握持状态检测模块422:用于计算主麦克风信号能量与辅麦克风信号能
量的比值,如果该比值大于第二阈值,则确定用户正常握持手机,如果该比
值小于或等于第二阈值,则确定用户异常握持手机。

具体来说握持状态检测模块422计算主麦克风信号S1和一个辅麦克风信
号的如S2的总能量P1(m)和P2(m):

P i ( m ) = Σ k = 0 N - 1 ( abs ( S i ( m , k ) ) ) 2 ; ]]>

然后计算两个总能量的比值同理可以计算主麦克风信号S1和
其他辅麦克风信号如S3的总能量比值以此类推。最后对这些
总能量比值进行求和平均得到最后的比值Pr(m)。在本发明的其他实施例中
也可以先对各辅麦克风信号的能量进行求和平均,然后再与主麦克风信号能
量相比得到比值Pr(m)。

Pr(m)越大表明主麦克风越接近人嘴,反之越小表明主麦克风距离人嘴越
远,通过Pr(m)与阈值Pr_th进行比较来确定手机的握持状态,例如在本实施
方案中Pr_th设定为2。Pr(m)>Pr_th为手机正常握持,Pr(m)≤Pr_th为手机
异常握持。

在本发明的其他实施例中,握持状态检测模块422也可以通过多麦克风
检测语音的方向,若语音来自手机底部方向,则确定用户正常握持手机,若
语音来自手机的侧向或顶部方向,则确定用户异常握持手机。

多麦克风降噪处理模块431:用于在每个频率子带上,计算主麦克风信
号和辅麦克风信号在该频率子带上的能量比值,根据该能量比值确定抑噪函
数在该频率子带上的取值;用于将抑噪函数与主麦克风信号进行相乘运算得
到抑制非稳态噪声后的信号后输出给单麦克风降噪处理模432。

具体来说多麦克风降噪处理模块431计算主麦克风信号S1和一个辅麦克
风信号的如S2的在每个频率子带上的能量比值同理可以
计算主麦克风信号S1和其他辅麦克风信号如S3的总能量比值
以此类推可以得到主麦克风信号S1和最后一个辅麦克风
信号SP的总能量比值最后对这些总能量比值进行求和平
均得到最后的比值Pb(m,k)。在其他实施例中也可以先对各辅麦克风信号的能
量进行求和平均,然后再与主麦克风信号能量相比得到比值Pb(m,k)。

Pb(m,k)越大表明第k个频率子带的信号成分是语音的几率越大,反之第
k个频率子带的信号成分是噪声的几率越小。根据本实施方案中Pb(m,k)与设
定的能量比值上限Pb_U(k)和能量比值下限Pb_L(k)进行比较,来判断第k个
频率子带的成分是语音的几率,例如在本实施方案中Pb_U(k)设定为4,
Pb_L(k)设定为2。若Pb(m,k)≥Pb_U(k),则此频率子带内的信号成分是语音
的几率为1,抑噪函数Gd(m,k)=1;若Pb(m,k)≤Pb_L(k),则此频率子带内的
信号成分是语音的几率为0,全是噪声,Gd(m,k)=RL,RL<1决定最大的降噪
量。若Pb_U(k)>Pb(m,k)>Pb_L(k),则此频率子带内的信号成分有语音也有噪
声不进行处理,此时RL<Gd(m,k)<1。最后通过Gd(m,k)*S1(m,k)运算抑制每个
频率子带中的噪声成分,得到降噪后的信号Sd(m,k)。

单麦克风降噪处理模块432:用于在每个频率子带上,通过滑动平均算
法计算出所接收信号在该频率子带上的平稳噪声能量,进而计算出语音成分
比例函数在该频率子带上的取值;将语音成分比例函数与所接收信号进行相
乘运算得到抑制稳态噪声的信号后输出给逆快速傅里叶变换模块44;

在本实施例中设单麦克风降噪处理模块432的输入是Ssi(m,k),此输入根
据降噪模式会不同,当是多麦克风降噪模式时,Ssi(m,k)是多麦克降噪处理模
块431降噪后的输出Sd(m,k);当是单麦克风降噪模式时,Ssi(m,k)是主麦克风
信号S1(m,k)。本模块通过滑动平均的方法计算Ssi(m,k)在每个频率子带中的
平稳噪声能量Pn(m,k):

Pn(m,k)=α*Pn(m,k)+(1-α)*Ps(m,k),

其中α是平滑参数,例如在本实施方案中α=0.98。Ps(m,k)是本模块输入信号
的能量谱,

Ps(m,k)=(abs(Ssi(m,k)))2。

因为平稳噪声的能量不会有大的变化,因此通过慢平滑平均可以估计出平稳
噪声的能量大小。因此每个频率子带内的语音成分所占的比例是

G s ( m , k ) = P s ( m , k ) - P n ( m , k ) P s ( m , k ) . ]]>

最后通过Gs(m,k)*Ssi(m,k)达到保留每个频率子带中的语音成分,得到抑
制噪声后的频域信号Sso(m,k)

逆快速傅里叶变换模块44:把单麦克风降噪处理模块432的输出频域信
号Sso(m,k)经过逆快速傅立叶变换(IFFT)变换回时域,就得到经过降噪处理后
的最终输出信号so(m,n):

S o ( m , n ) = 1 N Σ k = 0 N - 1 S so ( m , k ) e j 2 πnk / N ]]>

在本实施例中,当近场语音检测模块421检测出目前的信号中只有噪声
时,此时用户处于接听状态,没有说话,因此不能判断用户的握持方式,也
就不能准确判断目前应该采用何种降噪模式,因此本发明假设上一次检测到
的握持方式到目前没有改变,从而保持原来的降噪模式,直到下一次用户说
话能够准确判断用户的握持方式。

综上所述,本发明这种在用户说话时对用户的手机握持状态进行检测,
根据用户的手机握持状态采用不同的降噪处理方案,在用户正常握持手机时
采用多麦克风降噪和单麦克风降噪结合的方案对稳态噪声和非稳态噪声都进
行有效的抑制,而在用户异常握持手机时采用单麦克风降噪方案只对稳态噪
声进行抑制,避免了多麦克风降噪对语音的损伤,保证了语音质量。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范
围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均
包含在本发明的保护范围内。

一种应用于手机的语音增强方法和装置.pdf_第1页
第1页 / 共15页
一种应用于手机的语音增强方法和装置.pdf_第2页
第2页 / 共15页
一种应用于手机的语音增强方法和装置.pdf_第3页
第3页 / 共15页
点击查看更多>>
资源描述

《一种应用于手机的语音增强方法和装置.pdf》由会员分享,可在线阅读,更多相关《一种应用于手机的语音增强方法和装置.pdf(15页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102801861 A (43)申请公布日 2012.11.28 C N 1 0 2 8 0 1 8 6 1 A *CN102801861A* (21)申请号 201210278704.6 (22)申请日 2012.08.07 H04M 1/725(2006.01) G10L 21/02(2006.01) (71)申请人歌尔声学股份有限公司 地址 261031 山东省潍坊市高新技术产业开 发区东方路268号 (72)发明人刘崧 李波 楼厦厦 (74)专利代理机构北京市隆安律师事务所 11323 代理人权鲜枝 何立春 (54) 发明名称 一种应用于手机的语音增强方法和装。

2、置 (57) 摘要 本发明公开了一种应用于手机的语音增强方 法和装置。本发明这种在用户说话时对用户的手 机握持状态进行检测,根据用户的手机握持状态 采用不同的降噪处理方案,在用户正常握持手机 时采用多麦克风降噪和单麦克风降噪结合的方案 对稳态噪声和非稳态噪声都进行有效的抑制,而 在用户异常握持手机时采用单麦克风降噪方案只 对稳态噪声进行抑制,避免了多麦克风降噪对语 音的损伤,保证了语音质量。 (51)Int.Cl. 权利要求书3页 说明书10页 附图1页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 3 页 说明书 10 页 附图 1 页 1/3页 2 1.一种应用于。

3、手机的语音增强方法,其特征在于,在手机的底部设置主麦克风,在手机 的远离主麦克风的位置设置一个或多个辅麦克风,则该方法包括: 根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态; 当判断用户处于说话状态时,进一步检测用户的手机握持状态是正常握持手机还是异 常握持手机; 当检测到用户正常握持手机时,采用多麦克风降噪和单麦克风降噪相结合的方式进行 语音增强处理; 当检测到用户异常握持手机时,只采用单麦克风降噪方式进行语音增强处理。 2.根据权利要求1所述的方法,其特征在于,所述根据主麦克风信号和各辅助麦克风 信号判断用户处于说话状态还是处于接听状态包括: 计算主麦克风信号与辅麦。

4、克风信号之间的相关值,如果该相关值大于第一阈值则判断 用户处于说话状态,如果该相关值小于或等于第一阈值则判断用户处于接听状态; 计算主麦克风信号与辅麦克风信号之间的相关值为:计算主麦克风信号与每个辅麦克 风信号之间的相关值,然后进行平均得到平均相关值,或者,计算主麦克风信号与其中一个 辅麦克风信号之间的相关值。 3.根据权利要求1所述的方法,其特征在于,所述检测用户的手机握持状态是正常握 持手机还是异常握持手机包括: 通过多麦克风检测语音的方向,若语音来自手机底部方向,则确定用户正常握持手机, 若语音来自手机的侧向或顶部方向,则确定用户异常握持手机; 或者,计算主麦克风信号能量与辅麦克风信号能。

5、量的比值,如果该比值大于第二阈值, 则确定用户正常握持手机,如果该比值小于或等于第二阈值,则确定用户异常握持手机。 4.根据权利要求1所述的方法,其特征在于, 该方法进一步包括:在根据主麦克风信号和各辅助麦克风信号判断用户处于说话状 态还是处于接听状态之前,先对主麦克风信号和各辅助麦克风信号进行快速傅里叶变换处 理;在进行语音增强处理之后,再对降噪后的信号进行逆快速傅里叶变换处理; 所述采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理包括:先进行 多麦克风降噪处理,然后进行单麦克风降噪处理; 其中,先进行多麦克风降噪处理为:在每个频率子带上,计算主麦克风信号和辅麦克风 信号在该频率子。

6、带上的能量比值,根据该能量比值确定抑噪函数在该频率子带上的取值; 将抑噪函数与主麦克风信号进行相乘运算得到抑制非稳态噪声后的信号; 然后进行单麦克风降噪处理为:在每个频率子带上,通过滑动平均算法计算出所述抑 制非稳态噪声后的信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在 该频率子带上的取值;将语音成分比例函数与所述抑制非稳态噪声后的信号进行相乘运 算,得到抑制非稳态噪声后又抑制了稳态噪声的信号; 所述只采用单麦克风降噪方式进行语音增强处理包括:在每个频率子带上,通过滑动 平均算法计算出主麦克风信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例 函数在该频率子带上的取值;将。

7、语音成分比例函数与主麦克风信号进行相乘运算,得到抑 制稳态噪声后的信号。 5.根据权利要求1至4中任一项所述的方法,其特征在于,该方法进一步包括: 权 利 要 求 书CN 102801861 A 2/3页 3 当判断用户处于接听状态时,保持之前的语音增强处理方式不变。 6.一种应用于手机的语音增强装置,其特征在于,在手机的底部设置有主麦克风,在手 机的远离主麦克风的位置设置有一个或多个辅麦克风,则该装置包括:检测单元和降噪单 元,其中: 检测单元,用于根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处 于接听状态;当判断用户处于说话状态时,进一步检测用户的手机握持状态是正常握持手 机。

8、还是异常握持手机,并通知给降噪单元; 降噪单元,用于在接收到用户正常握持手机的通知时,采用多麦克风降噪和单麦克风 降噪相结合的方式进行语音增强处理;用于在接收到用户异常握持手机的通知时,只采用 单麦克风降噪方式进行语音增强处理。 7.根据权利要求6所述的装置,其特征在于,所述检测单元包括:近场语音检测模块 和握持状态检测模块;所述降噪单元包括:多麦克风降噪处理模块和单麦克风降噪处理模 块;其中, 近场语音检测模块,用于接收主麦克风信号和各辅助麦克风信号,并根据主麦克风信 号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态,当判断用户处于说话状 态时向握持状态检测模块发送通知,当判断用户处。

9、于接听状态时不向握持状态检测模块发 送通知; 握持状态检测模块,用于接收主麦克风信号和各辅助麦克风信号,在收到近场语音检 测模块的通知时,检测用户的手机握持状态是正常握持手机还是异常握持手机,当检测到 用户正常握持手机时,将主麦克风信号和各辅助麦克风信号发送给多麦克风降噪处理模 块,当检测到用户异常握持手机时,将主麦克风信号发送给单麦克风降噪处理模块; 多麦克风降噪处理模块,用于对所接收的信号进行多麦克风降噪处理后发送给单麦克 风降噪处理模块; 单麦克风降噪处理模块,用于对所接收的信号进行单麦克风降噪处理后输出。 8.根据权利要求7所述的装置,其特征在于, 所述近场语音检测模块,用于计算主麦克。

10、风信号与辅麦克风信号之间的相关值,如果 该相关值大于第一阈值则判断用户处于说话状态,如果该相关值小于或等于第一阈值则判 断用户处于接听状态; 其中,所述近场语音检测模块,计算主麦克风信号与每个辅麦克风信号之间的相关值, 然后进行平均得到平均相关值,或者,计算主麦克风信号与其中一个辅麦克风信号之间的 相关值。 9.根据权利要求7所述的装置,其特征在于, 所述握持状态检测模块,用于通过多麦克风检测语音的方向,若语音来自手机底部方 向,则确定用户正常握持手机,若语音来自手机的侧向或顶部方向,则确定用户异常握持手 机; 或者, 所述握持状态检测模块,用于计算主麦克风信号能量与辅麦克风信号能量的比值,如。

11、 果该比值大于第二阈值,则确定用户正常握持手机,如果该比值小于或等于第二阈值,则确 定用户异常握持手机。 权 利 要 求 书CN 102801861 A 3/3页 4 10.根据权利要求7所述的装置,其特征在于,该装置还包括:快速傅里叶变换模块和 逆快速傅里叶变换模块,其中: 快速傅里叶变换模块,用于将主麦克风信号和各辅麦克风信号分别进行快速傅里叶变 换处理后发送给近场语音检测模块和握持状态检测模块; 所述多麦克风降噪处理模块,用于在每个频率子带上,计算主麦克风信号和辅麦克风 信号在该频率子带上的能量比值,根据该能量比值确定抑噪函数在该频率子带上的取值; 用于将抑噪函数与主麦克风信号进行相乘运。

12、算得到抑制非稳态噪声后的信号后输出给单 麦克风降噪处理模块; 所述单麦克风降噪处理模块,用于在每个频率子带上,通过滑动平均算法计算出所接 收信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在该频率子带上的 取值;将语音成分比例函数与所接收信号进行相乘运算得到抑制稳态噪声的信号后输出给 逆快速傅里叶变换模块; 逆快速傅里叶变换模块,用于对所接收的信号进行逆快速傅里叶变换处理后输出。 权 利 要 求 书CN 102801861 A 1/10页 5 一种应用于手机的语音增强方法和装置 技术领域 0001 本发明涉及语音信号处理技术领域,特别涉及一种应用于手机的语音增强方法和 装置。 背景。

13、技术 0002 手机在人们的日常生活和工作中已经得到了广泛应用,解除了人们通讯的时空约 束,为人们的生活和工作提供了极大的便利。但是人们进行通讯的环境是复杂多变的,其中 包括吵杂的环境,噪声会使得通话的语音质量严重下降,因此应用于手机的抑制噪声的语 音增强技术有着重要的意义。 0003 目前手机中常用的语音增强技术中有单麦克风谱减语音增强技术,也叫单通道谱 减语音增强技术,也可以成为单麦克风降噪技术,这种技术只能抑制稳态的噪声,对非稳态 的噪声,如商场超市或餐厅里的周围人的说话声等,没有明显的抑制效果。 0004 另一种更优的降噪技术是多麦克风阵列语音增强技术,也称为多麦克风降噪技 术,这种技。

14、术又分为两类: 0005 第一类是通过多麦克风信号处理形成固定的指向性,即保留来自一个指定方向的 声音,抑制来自其它方向的声音,当处理形成的指向性指向使用者的嘴则能达到保护语音 抑制周围噪声的效果。 0006 第二类是利用多麦克风接收到信号的能量差来区分语音噪声从而进行降噪处理。 图1是利用多麦克风接收到信号的能量差来区分语音噪声从而进行降噪处理方案的多麦 克风的安装位置示意图。如图1所示,这里有两个麦克风,分别为主麦克风1和辅麦克风2, 把主麦克风1安装到手机的底端靠近人嘴的位置,主麦克风1接收到的使用者的语音信号 能量很大,辅麦克风2安装在手机的顶端远离人嘴的位置,辅麦克风2接收到的使用者。

15、的语 音信号能量小。如图1所示,对于外界环境噪声两个麦克风接收到的能量接近,因此通过比 较两个麦克风接收到的信号能量差异可以判断是语音信号还是噪声信号,从而保留语音成 分抑制噪声成分,达到提高信噪比的效果。 0007 多麦克风降噪技术优于单麦克风降噪技术的是可以有效抑制非稳态的噪声。但是 多麦克风降噪技术对用户使用手机的方式会有严格约束,即用户握持手机的方式要受到限 制。对于所述第一类利用指向性的技术来说,用户必须保持指向性对准人嘴的握持方式,否 则若用户的握持方式有偏差就会导致人嘴偏离被保护的方向,语音就会被作为来自其他方 向的噪声抑制;同样对于第二类利用能量差异的技术也要求用户保证主麦克靠。

16、近人嘴而辅 麦克远离嘴握持方式,如图2所示,图2是用户正常握持手机状态示意图;当用户异常握持 时,如手机被水平握持时,如图3所示,图3是用户异常握持手机状态示意图,两个麦克风到 人嘴的距离接近,语音到两个麦克风的能量接近,语音同样会被当作噪声抑制。 发明内容 0008 有鉴于此,本发明提供了一种应用于手机的语音增强方法和装置,以解决只采用 说 明 书CN 102801861 A 2/10页 6 单麦克风降噪只能一致稳态噪声,而采用多麦克风降噪虽然能抑制非稳态噪声但在用户异 常握持手机时损伤语音信号的问题。 0009 为达到上述目的,本发明的技术方案是这样实现的: 0010 本发明公开了一种应用。

17、于手机的语音增强方法,在手机的底部设置主麦克风,在 手机的远离主麦克风的位置设置一个或多个辅麦克风,则该方法包括: 0011 根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状 态; 0012 当判断用户处于说话状态时,进一步检测用户的手机握持状态是正常握持手机还 是异常握持手机; 0013 当检测到用户正常握持手机时,采用多麦克风降噪和单麦克风降噪相结合的方式 进行语音增强处理; 0014 当检测到用户异常握持手机时,只采用单麦克风降噪方式进行语音增强处理。 0015 在上述方法中,所述根据主麦克风信号和各辅助麦克风信号判断用户处于说话状 态还是处于接听状态包括: 0016。

18、 计算主麦克风信号与辅麦克风信号之间的相关值,如果该相关值大于第一阈值则 判断用户处于说话状态,如果该相关值小于或等于第一阈值则判断用户处于接听状态; 0017 计算主麦克风信号与辅麦克风信号之间的相关值为:计算主麦克风信号与每个辅 麦克风信号之间的相关值,然后进行平均得到平均相关值,或者,计算主麦克风信号与其中 一个辅麦克风信号之间的相关值。 0018 在上述方法中,所述检测用户的手机握持状态是正常握持手机还是异常握持手机 包括: 0019 通过多麦克风检测语音的方向,若语音来自手机底部方向,则确定用户正常握持 手机,若语音来自手机的侧向或顶部方向,则确定用户异常握持手机; 0020 或者,。

19、计算主麦克风信号能量与辅麦克风信号能量的比值,如果该比值大于第二 阈值,则确定用户正常握持手机,如果该比值小于或等于第二阈值,则确定用户异常握持手 机。 0021 该方法进一步包括:在根据主麦克风信号和各辅助麦克风信号判断用户处于说话 状态还是处于接听状态之前,先对主麦克风信号和各辅助麦克风信号进行快速傅里叶变换 处理;在进行语音增强处理之后,再对降噪后的信号进行逆快速傅里叶变换处理; 0022 所述采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理包括:先 进行多麦克风降噪处理,然后进行单麦克风降噪处理; 0023 其中,先进行多麦克风降噪处理为:在每个频率子带上,计算主麦克风信号和。

20、辅麦 克风信号在该频率子带上的能量比值,根据该能量比值确定抑噪函数在该频率子带上的取 值;将抑噪函数与主麦克风信号进行相乘运算得到抑制非稳态噪声后的信号; 0024 然后进行单麦克风降噪处理为:在每个频率子带上,通过滑动平均算法计算出所 述抑制非稳态噪声后的信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函 数在该频率子带上的取值;将语音成分比例函数与所述抑制非稳态噪声后的信号进行相乘 运算,得到抑制非稳态噪声后又抑制了稳态噪声的信号; 0025 所述只采用单麦克风降噪方式进行语音增强处理包括:在每个频率子带上,通过 说 明 书CN 102801861 A 3/10页 7 滑动平均算法。

21、计算出主麦克风信号在该频率子带上的平稳噪声能量,进而计算出语音成分 比例函数在该频率子带上的取值;将语音成分比例函数与主麦克风信号进行相乘运算,得 到抑制稳态噪声后的信号 0026 该方法进一步包括: 0027 当判断用户处于接听状态时,保持之前的语音增强处理方式不变。 0028 本发明还公开了一种应用于手机的语音增强装置,在手机的底部设置有主麦克 风,在手机的远离主麦克风的位置设置有一个或多个辅麦克风,则该装置包括:检测单元和 降噪单元,其中: 0029 检测单元,用于根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还 是处于接听状态;当判断用户处于说话状态时,进一步检测用户的手机握持。

22、状态是正常握 持手机还是异常握持手机,并通知给降噪单元; 0030 降噪单元,用于在接收到用户正常握持手机的通知时,采用多麦克风降噪和单麦 克风降噪相结合的方式进行语音增强处理;用于在接收到用户异常握持手机的通知时,只 采用单麦克风降噪方式进行语音增强处理。 0031 在上述装置中,所述检测单元包括:近场语音检测模块和握持状态检测模块;所 述降噪单元包括:多麦克风降噪处理模块和单麦克风降噪处理模块;其中, 0032 近场语音检测模块,用于接收主麦克风信号和各辅助麦克风信号,并根据主麦克 风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态,当判断用户处于说 话状态时向握持状态检测模块发。

23、送通知,当判断用户处于接听状态时不向握持状态检测模 块发送通知; 0033 握持状态检测模块,用于接收主麦克风信号和各辅助麦克风信号,在收到近场语 音检测模块的通知时,检测用户的手机握持状态是正常握持手机还是异常握持手机,当检 测到用户正常握持手机时,将主麦克风信号和各辅助麦克风信号发送给多麦克风降噪处理 模块,当检测到用户异常握持手机时,将主麦克风信号发送给单麦克风降噪处理模块; 0034 多麦克风降噪处理模块,用于对所接收的信号进行多麦克风降噪处理后发送给单 麦克风降噪处理模块; 0035 单麦克风降噪处理模块,用于对所接收的信号进行单麦克风降噪处理后输出。 0036 在上述装置中,所述近。

24、场语音检测模块,用于计算主麦克风信号与辅麦克风信号 之间的相关值,如果该相关值大于第一阈值则判断用户处于说话状态,如果该相关值小于 或等于第一阈值则判断用户处于接听状态; 0037 其中,所述近场语音检测模块,计算主麦克风信号与每个辅麦克风信号之间的相 关值,然后进行平均得到平均相关值,或者,计算主麦克风信号与其中一个辅麦克风信号之 间的相关值。 0038 在上述装置中, 0039 所述握持状态检测模块,用于通过多麦克风检测语音的方向,若语音来自手机底 部方向,则确定用户正常握持手机,若语音来自手机的侧向或顶部方向,则确定用户异常握 持手机; 0040 或者, 0041 所述握持状态检测模块,。

25、用于计算主麦克风信号能量与辅麦克风信号能量的比 说 明 书CN 102801861 A 4/10页 8 值,如果该比值大于第二阈值,则确定用户正常握持手机,如果该比值小于或等于第二阈 值,则确定用户异常握持手机。 0042 该装置还包括:快速傅里叶变换模块和逆快速傅里叶变换模块,其中: 0043 快速傅里叶变换模块,用于将主麦克风信号和各辅麦克风信号分别进行快速傅里 叶变换处理后发送给近场语音检测模块和握持状态检测模块; 0044 所述多麦克风降噪处理模块,用于在每个频率子带上,计算主麦克风信号和辅麦 克风信号在该频率子带上的能量比值,根据该能量比值确定抑噪函数在该频率子带上的取 值;用于将抑。

26、噪函数与主麦克风信号进行相乘运算得到抑制非稳态噪声后的信号后输出给 单麦克风降噪处理模块; 0045 所述单麦克风降噪处理模块,用于在每个频率子带上,通过滑动平均算法计算出 所接收信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在该频率子带 上的取值;将语音成分比例函数与所接收信号进行相乘运算得到抑制稳态噪声的信号后输 出给逆快速傅里叶变换模块; 0046 逆快速傅里叶变换模块,用于对所接收的信号进行逆快速傅里叶变换处理后输 出。 0047 由上述可见,本发明这种在用户说话时对用户的手机握持状态进行检测,根据用 户的手机握持状态采用不同的降噪处理方案,在用户正常握持手机时采用多麦克。

27、风降噪和 单麦克风降噪结合的方案对稳态噪声和非稳态噪声都进行有效的抑制,而在用户异常握持 手机时采用单麦克风降噪方案只对稳态噪声进行抑制,避免了多麦克风降噪对语音的损 伤,保证了语音质量。 附图说明 0048 图1是利用多麦克风接收到信号的能量差来区分语音噪声从而进行降噪处理方 案的多麦克风的安装位置示意图; 0049 图2是用户正常握持手机状态示意图; 0050 图3是用户异常握持手机状态示意图; 0051 图4是本发明实施例中的一种应用于手机的语音增强装置的结构示意图。 具体实施方式 0052 本发明是应用于手机的语音增强技术,本发明中采用了手机握持状态检测技术, 对用户正常握持手机状态采。

28、用多麦克降噪与单麦克降噪结合处理的方案,从而能够保证在 用户正确握持手机时能达到最优的降噪效果,对用户异常握持状态采用单通道降噪处理只 对稳态噪声进行抑制以避免此时采用多麦克降噪处理对语音造成伤害。也就是说,本发明 在多麦克风降噪的基础上加入用户手机握持状态的检测,从而能在不同的手机握持状态采 用不同的降噪技术,保证最优降噪的同时也避免语音失真。 0053 下面对本发明的技术方案进行详细分析介绍。 0054 在嘈杂的环境中使用手机通话时往往会遇到这样的情况,自己的说话声被周围的 噪声所掩盖导致对方难以听清,本发明所公开的就是一种消除这些噪声,保留清晰的语音, 使得通话即使在吵闹的环境中仍然能够。

29、通畅清晰进行的多麦克风降噪技术,这里的多个麦 说 明 书CN 102801861 A 5/10页 9 克风包括两个或两个以上的麦克风。因此本技术适用于安装有两个或两个以上麦克风的手 机。如图1是一种双麦克风手机示意图,其中安装在手机底部的是主麦克1,安装在手机背 部上端位置的是辅麦克2。在其他情况下也可以使用3个或3个以上的麦克风,其中只有一 个主麦克风安装在手机底部,其余多个辅麦克风安装在手机的远离主麦克风的位置,如手 机的顶部或背部上端位置。 0055 用户在使用手机通话时通常会有两种握持方式: 0056 1、正常握持,手机底部的主麦克风1挨近用户的嘴,如图2所示。此时在本发明中 采用多麦。

30、克风降噪和单麦克风降噪结合的降噪技术能够很好的消除噪声,同时语音质量不 会受到损害; 0057 2、异常握持,手机底部的主麦克风1远远偏离用户的嘴,如图3所示。此时若采用 多麦克降噪技术在消除噪声的同时会把语音当作噪声消除,因此在本发明中只采用单麦克 风降噪处理。 0058 本发明的技术方案主要包括两大单元:检测单元和降噪单元。检测单元的作用是 检测目前的通话状态,这些状态包括:用户在说话还是在接听,用户正常握持手机还是异常 握持手机。其中用户的说话或接听状态由近场语音检测模块检测得到;用户的握持手机状 态则进一步由握持状态检测模块检测得到。 0059 近场语音检测模块的原理是:当用户使用手机。

31、时,不管是正常握持还是异常握持 用户的嘴到手机上的麦克风距离都会小于20cm,可认为是近场声源,而周围的噪声源一般 都会距离手机50cm以上,可认为是远场声源,因此可以通过检测声源的距离来判断是用户 的说话还是用户没有说话只有周围噪声。若是近场声源,两个麦克风接收到的信号间的相 关性强,若是远场声源,两个麦克风接收到的信号间的相关性弱。因此可以通过计算主辅麦 克风信号间的相关性来判断信号是用户语音还是周围噪声。具体的检测步骤可以如下: 0060 1、计算主麦克风信号与辅麦克风信号之间的相关值;可以计算主麦克风信号与每 个辅麦克风信号之间的相关值,然后进行平均得到平均相关值,或者,也可以计算主麦。

32、克风 信号与其中一个辅麦克风信号之间的相关值; 0061 2、如该相关值小于或等于设定阈值则信号是远场噪声信号,用户处于接听状态; 若该相关值大于设定阈值则信号是近场语音信号,用户处于说话状态。 0062 若是用户处于说话状态,则进一步进行用户握持状态检测。在本发明中提供检测 用户握持状态的两种方法: 0063 第一种方法:通过多麦克风检测语音的方向,通过语音的方向来判断用户握持状 态,若语音来自手机的底部则是正常握持,若语音来自手机的侧向或顶部方向则是异常握 持。 0064 第二种方法:通过多麦克风信号能量的差异来判断用户握持状态:若主麦克风信 号能量与辅麦克风信号能量的比值大于设定的阈值,。

33、则是正确握持,若能量比值小于或等 于设定的阈值,则是异常握持。 0065 经过检测单元的判定后,降噪单元根据不同的状态采用对应的降噪处理: 0066 1、若是正常握持,采用多麦克风降噪模式:即首先经过多麦克风降噪处理抑制大 部分的噪声,然后再经过单麦克风降噪处理抑制残留的稳态噪声,从而达到最优降噪; 0067 2、若是异常握持,采用单麦克风降噪模式:不经过多麦克风降噪处理,只经过单麦 说 明 书CN 102801861 A 6/10页 10 克风降噪处理抑制稳态噪声,从而保证最优的语音质量。 0068 3、用户接听状态,保持降噪模式不变,即保持之前的语音增强处理方式不变。由于 用户不说话,此时。

34、不确定用户的握持状态,因此认为上一次检测到的握持状态没有改变,所 以降噪模式也不改变。 0069 通过本发明可以根据用户使用手机时的握持状态采用不同的降噪模式,从而有效 消除噪声,同时能够保证语音信号不会受到损伤。 0070 为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明中的应用 于手机的语音增强装置进行详细描述。 0071 以图1所示的具有两个麦克风的手机为例,其中主麦克风1在手机的底部,辅麦克 风2在手机的背部上端位置,远离主麦克风1。当用户如图2所示正常握持手机时,主麦克 风1到嘴的距离小于5cm,辅麦克风2到嘴的距离15cm20cm。当用户如图3所示异常握持 手机时,主。

35、麦克风1到嘴的距离大于10cm,辅麦克风2到嘴的距离15cm20cm。因此用户正 常握持时,主麦克风1接收到的语音能量与辅麦克风2接收到的语音能量的差异大于9dB 以上;用户异常握持时,主麦克风1接收到的语音能量与辅麦克风2接收到的语音能量的差 异在3dB以内。无论何种握持,主麦克风1接收到的噪声能量与辅麦克风2接收到的噪声 能量的接近,也在3dB以内。因此正常握持时,能通过两个麦克风的能量差异来区分语音和 噪声,采用多麦克风降噪能有效抑制噪声不损伤语音。但异常握持时,不能通过两个麦克风 的能量差异来区分语音和噪声,采用多麦克风降噪会损伤语音,此时要保护语音只能采用 单麦克风降噪抑制稳态噪声。。

36、 0072 在本发明的实施例中,也可以在手机的底部设置1个主麦克风,在手机的远离主 麦克风的位置,如在手机的顶部或背部上端设置2以上的多个辅麦克风,多个辅助麦克风 可以相距较近地分布在手机的顶部或背部上端。 0073 在本实施例中设有P(P为大于1的自然数)个麦克风:首先把主麦克风接收到的 时域信号s 1 和多个辅麦克风接收到的时域信号s 2 ,s P 通过快速傅里叶变换(FFT)变换 为频域信号S 1 ,S P 。频域信号输入近场语音检测模块,场语音检测模块通过主麦克风信 号和辅麦克风信号的相关性判断输入的信号是近场语音还是远场噪声。若近场语音检测模 块检测到的是近场语音信号,把频域信号输入。

37、到握持状态检测模块通过主麦克风信号和辅 麦克风信号的总能量差异判断用户是正常握持还是异常握持。若用户是正常握持,M个麦 克风的M路频域信号输入到多麦克风降噪处理模块进行降噪处理,然后再经过单麦克风降 噪处理,最后输出一路经过降噪后的频域信号。若用户是异常握持,只把一路主麦克风的频 域信号S 1 输入单麦克风降噪处理模块进行降噪处理,输出一路经过降噪后的频域信号。若 近场语音检测模块检测到的是远场噪声信号,此时不能确定握持状态,因此保持此时的降 噪模式。最后把经过降噪处理后的频域信号进行逆快速傅里叶变换(IFFT)变换成时域信 号输出。详细的处理结构见图4。 0074 图4是本发明实施例中的一种。

38、应用于手机的语音增强装置的结构示意图。参见图 4,该装置包括:快速傅里叶变换模块41、检测单元42、降噪单元43和逆快速傅里叶变换模 块44,其中: 0075 快速傅里叶变换模块41、用于将主麦克风信号和各辅麦克风信号分别进行快速傅 里叶变换处理后发送给检测单元42; 说 明 书CN 102801861 A 10 7/10页 11 0076 检测单元42,用于根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态 还是处于接听状态;当判断用户处于说话状态时,进一步检测用户的手机握持状态是正常 握持手机还是异常握持手机,并通知给降噪单元43; 0077 降噪单元43,用于在接收到用户正常握持手机。

39、的通知时,采用多麦克风降噪和单 麦克风降噪相结合的方式进行语音增强处理;用于在接收到用户异常握持手机的通知时, 只采用单麦克风降噪方式进行语音增强处理; 0078 逆快速傅里叶变换模块44,用于将降噪单元43输出的信号进行逆快速傅里叶变 换处理后输出。 0079 如图4所示,检测单元42包括:近场语音检测模块421和握持状态检测模块422; 降噪单元43包括:多麦克风降噪处理模块431和单麦克风降噪处理模块432;其中, 0080 近场语音检测模块421,用于接收主麦克风信号和各辅助麦克风信号,并根据主麦 克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态,当判断用户处于 说话状态。

40、时向握持状态检测模块422发送通知;当判断用户处于接听状态时近场语音检测 模块421不向握持状态检测模块422发送通知,这样握持状态检测模块422就会仍按照之 前的握持状态判断结果向降噪单元43输入对应的信号,则降噪单元43仍保持之前的降噪 模式; 0081 握持状态检测模块422,用于接收主麦克风信号和各辅助麦克风信号,在收到近 场语音检测模块421的通知时,检测用户的手机握持状态是正常握持手机还是异常握持手 机,当检测到用户正常握持手机时,将主麦克风信号和各辅助麦克风信号发送给多麦克风 降噪处理模块431,当检测到用户异常握持手机时,只将主麦克风信号发送给单麦克风降噪 处理模块432; 0。

41、082 多麦克风降噪处理模块431,用于对所接收的信号进行多麦克风降噪处理后发送 给单麦克风降噪处理模块432; 0083 单麦克风降噪处理模块432,用于对所接收的信号进行单麦克风降噪处理后输出。 0084 下面对各个模块的具体处理过程进行详细介绍: 0085 快速傅里叶变换模块41:首先对s i 进行分帧处理(i1,P),每帧N个采样 点,第m帧信号是d i (m,n),其中0nCoh_th说明相关性足够大,信号是来自 近场,是用户的语音,用户在讲话。若MCoh(m)Coh_th说明相关性较小,信号是来自远场, 是周围的环境噪声,用户在接听。 0098 握持状态检测模块422:用于计算主麦。

42、克风信号能量与辅麦克风信号能量的比 值,如果该比值大于第二阈值,则确定用户正常握持手机,如果该比值小于或等于第二阈 值,则确定用户异常握持手机。 0099 具体来说握持状态检测模块422计算主麦克风信号S 1 和一个辅麦克风信号的如 S 2 的总能量P 1 (m)和P 2 (m): 0100 0101 然后计算两个总能量的比值同理可以计算主麦克风信号S 1 和其 他辅麦克风信号如S 3 的总能量比值以此类推。最后对这些总能量比值进行 求和平均得到最后的比值Pr(m)。在本发明的其他实施例中也可以先对各辅麦克风信号的 能量进行求和平均,然后再与主麦克风信号能量相比得到比值Pr(m)。 0102 。

43、Pr(m)越大表明主麦克风越接近人嘴,反之越小表明主麦克风距离人嘴越远,通过 Pr(m)与阈值Pr_th进行比较来确定手机的握持状态,例如在本实施方案中Pr_th设定为 2。Pr(m)Pr_th为手机正常握持,Pr(m)Pr_th为手机异常握持。 0103 在本发明的其他实施例中,握持状态检测模块422也可以通过多麦克风检测语音 说 明 书CN 102801861 A 12 9/10页 13 的方向,若语音来自手机底部方向,则确定用户正常握持手机,若语音来自手机的侧向或顶 部方向,则确定用户异常握持手机。 0104 多麦克风降噪处理模块431:用于在每个频率子带上,计算主麦克风信号和辅麦 克风。

44、信号在该频率子带上的能量比值,根据该能量比值确定抑噪函数在该频率子带上的取 值;用于将抑噪函数与主麦克风信号进行相乘运算得到抑制非稳态噪声后的信号后输出给 单麦克风降噪处理模432。 0105 具体来说多麦克风降噪处理模块431计算主麦克风信号S 1 和一个辅麦克风信号 的如S 2 的在每个频率子带上的能量比值同理可以计算主麦克风信号 S 1 和其他辅麦克风信号如S 3 的总能量比值以此类推可以得到主麦克 风信号S 1 和最后一个辅麦克风信号S P 的总能量比值最后对这些总能 量比值进行求和平均得到最后的比值Pb(m,k)。在其他实施例中也可以先对各辅麦克风信 号的能量进行求和平均,然后再与主。

45、麦克风信号能量相比得到比值Pb(m,k)。 0106 Pb(m,k)越大表明第k个频率子带的信号成分是语音的几率越大,反之第k个频 率子带的信号成分是噪声的几率越小。根据本实施方案中Pb(m,k)与设定的能量比值上限 Pb_U(k)和能量比值下限Pb_L(k)进行比较,来判断第k个频率子带的成分是语音的几率, 例如在本实施方案中Pb_U(k)设定为4,Pb_L(k)设定为2。若Pb(m,k)Pb_U(k),则此频 率子带内的信号成分是语音的几率为1,抑噪函数G d (m,k)=1;若Pb(m,k)Pb_L(k),则此 频率子带内的信号成分是语音的几率为0,全是噪声,G d (m,k)=RL,R。

46、LPb(m,k)Pb_L(k),则此频率子带内的信号成分有语音也有噪声不进行处理,此 时RLG d (m,k)1。最后通过G d (m,k)*S 1 (m,k)运算抑制每个频率子带中的噪声成分,得到降 噪后的信号S d (m,k)。 0107 单麦克风降噪处理模块432:用于在每个频率子带上,通过滑动平均算法计算出 所接收信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在该频率子带 上的取值;将语音成分比例函数与所接收信号进行相乘运算得到抑制稳态噪声的信号后输 出给逆快速傅里叶变换模块44; 0108 在本实施例中设单麦克风降噪处理模块432的输入是S si (m,k),此输入根据。

47、降噪 模式会不同,当是多麦克风降噪模式时,S si (m,k)是多麦克降噪处理模块431降噪后的输出 S d (m,k);当是单麦克风降噪模式时,S si (m,k)是主麦克风信号S 1 (m,k)。本模块通过滑动平 均的方法计算S si (m,k)在每个频率子带中的平稳噪声能量P n (m,k): 0109 P n (m,k)=*P n (m,k)+(1-)*P s (m,k), 0110 其中是平滑参数,例如在本实施方案中=0.98。P s (m,k)是本模块输入信号 的能量谱, 0111 P s (m,k)=(abs(S si (m,k) 2 。 0112 因为平稳噪声的能量不会有大的变。

48、化,因此通过慢平滑平均可以估计出平稳噪声 的能量大小。因此每个频率子带内的语音成分所占的比例是 说 明 书CN 102801861 A 13 10/10页 14 0113 0114 最后通过G s (m,k)*S si (m,k)达到保留每个频率子带中的语音成分,得到抑制噪声 后的频域信号S so (m,k) 0115 逆快速傅里叶变换模块44:把单麦克风降噪处理模块432的输出频域信号 S so (m,k)经过逆快速傅立叶变换(IFFT)变换回时域,就得到经过降噪处理后的最终输出信 号s o (m,n): 0116 0117 在本实施例中,当近场语音检测模块421检测出目前的信号中只有噪声时。

49、,此时 用户处于接听状态,没有说话,因此不能判断用户的握持方式,也就不能准确判断目前应该 采用何种降噪模式,因此本发明假设上一次检测到的握持方式到目前没有改变,从而保持 原来的降噪模式,直到下一次用户说话能够准确判断用户的握持方式。 0118 综上所述,本发明这种在用户说话时对用户的手机握持状态进行检测,根据用户 的手机握持状态采用不同的降噪处理方案,在用户正常握持手机时采用多麦克风降噪和单 麦克风降噪结合的方案对稳态噪声和非稳态噪声都进行有效的抑制,而在用户异常握持手 机时采用单麦克风降噪方案只对稳态噪声进行抑制,避免了多麦克风降噪对语音的损伤, 保证了语音质量。 0119 以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在 本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1