一种语音信号降噪拾音处理方法和装置及冰箱.pdf

上传人:1****2 文档编号:4175334 上传时间:2018-09-03 格式:PDF 页数:18 大小:1,011.07KB
返回 下载 相关 举报
摘要
申请专利号:

CN201611046667.0

申请日:

2016.11.23

公开号:

CN106710601A

公开日:

2017.05.24

当前法律状态:

实审

有效性:

审中

法律详情:

专利申请权的转移IPC(主分类):G10L 21/0208登记生效日:20180206变更事项:申请人变更前权利人:合肥华凌股份有限公司变更后权利人:合肥美的智能科技有限公司变更事项:地址变更前权利人:230601 安徽省合肥市经济技术开发区锦绣大道变更后权利人:230601 安徽省合肥市高新区明珠大道198号G2号楼2楼变更事项:申请人变更前权利人:合肥美的电冰箱有限公司 美的集团股份有限公司|||实质审查的生效IPC(主分类):G10L 21/0208申请日:20161123|||公开

IPC分类号:

G10L21/0208(2013.01)I; G10L21/0232(2013.01)I; F25D29/00

主分类号:

G10L21/0208

申请人:

合肥华凌股份有限公司; 合肥美的电冰箱有限公司; 美的集团股份有限公司

发明人:

杨世清; 陈海雷; 王岩

地址:

230601 安徽省合肥市经济技术开发区锦绣大道

优先权:

专利代理机构:

北京路浩知识产权代理有限公司 11002

代理人:

李官

PDF下载: PDF下载
内容摘要

本发明实施例涉及一种语音信号降噪拾音处理方法和装置及冰箱,其中该方法包括:麦克风阵列采集当前环境的语音信号;对采集到的多路语音信号执行时间同步;对同步的多路语音信号加权求和得到降噪后的语音信号。本发明通过自带滤波方式再整带宽提升语音质量,通过权重相加的方式不会改变语音特性,可以有效消除回音,在提高信噪比的同时利用方向选择特性对感兴趣区域进行增强。

权利要求书

1.一种语音信号降噪拾音处理方法,其特征在于,包括:
麦克风阵列采集当前环境的多路语音信号;
对采集到的多路语音信号执行时间同步;
对同步的多路语音信号加权求和得到降噪后的语音信号。
2.根据权利要求1所述的语音信号降噪拾音处理方法,其特征在于,所述对采集到的多
路语音信号执行时间同步包括:
根据每个麦克风和参考点之间的到达时间差进行时间移动,得到时间同步后的语音信
号,同步后的语音信号按下式计算:
Yα,n(k)=Yn[k+Fn(τ)]
=αn×s(k-τ)+Vα,n(k)
=Xα,n(k)+Vα,n(k)
其中,Yα,n(k)表示延时处理后的语音信号,Yn(k)表示当前麦克风接收到的音频信号,Fn
(τ)是第一麦克风和第n麦克风之间音频信号到达时间差,Xn(k)当前麦克风接收到的语音
信号,Vn(k)表示当前麦克风接收到的噪声信号,αn是第n个麦克风的衰减因子,s(k)是未知
信号源的音频信号,k表示当前时刻,n为常数,n=1、2、…、N,τ是从未知信号源到当前麦克
风的延时。
3.根据权利要求1所述的语音信号降噪拾音处理方法,其特征在于,所示对同步的多路
语音信号加权求和得到降噪后的语音信号按下式计算:

其中,ZDS(k)表示降噪拾音处理后输出的语音信号,Yα,n(k)表示时间同步后的音频信
号,αn是第n个麦克风的衰减因子, s(k)是未知信号源的音频信号,k表示当
前时刻,τ是 从未知信号源到当前麦克风的时延,n为常数,n=1、2、…、N,N表示麦克风个
数,Vn(k)表示当前麦克风接收到的噪声信号。
4.根据权利要求1所述的语音信号降噪拾音处理方法,其特征在于,还包括:对采集的
多路语音信号自适应波束成型处理,包括:
对采集的多路语音信号自适应滤波处理,所述自适应滤波处理后的音频信号按下式计
算:
Zα,n(k)=αTYα,n(k)-ωTRYα,n(k)
其中,Zα,n(k)表示输出的音频信号,αTYα,n(k)是语音输出参考信号,ωTRYα,n(k)是噪声
参考信号,R是阻塞矩阵。
5.根据权利要求4所述的语音信号降噪拾音处理方法,其特征在于,所述阻塞矩阵R按
下式计算:

6.根据权利要求1所述的语音信号降噪拾音处理方法,其特征在于,还包括对采集到的
多路语音信号分子带滤波处理:包括:
对采集到的多路语音信号分解成多个频域的子带信号;
分别对分解的频域子带语音信号执行滤波处理;
对所述滤波处理后的频域子带信号求和得到多路滤波处理后的频域音频信号;
对所述多路滤波处理后的频域音频信号合成时域语音信号。
7.一种语音信号降噪拾音处理装置,其特征在于,包括:
语音信号采集单元,用于采集当前环境的多路语音信号;
同步单元:用于对采集到的多路语音信号执行时间同步;
降噪单元:用于对同步的多路语音信号加权求和得到降噪后的语音信号。
8.根据权利要求7所述的语音信号降噪拾音处理装置,其特征在于,还包括自适应波束
滤波单元,用于对采集的多路语音信号自适应滤波处理,利用到噪声参考信号,通过迭代算
法更新权重抑制噪声。
9.根据权利要求7所述的语音信号降噪拾音处理装置,其特征在于,还包括分子带滤波
处理单元,包括:
信号分解单元,用于对采集到的多路语音信号分解成多个频域的子带信号;
滤波单元,分别对分解的频域子带语音信号执行滤波处理;
信号合成单元,用于对所述滤波处理后的频域子带信号求和得到多路滤波处理后的频
域音频信号;
信号转换单元,用于对所述多路滤波处理后的频域音频信号合成时域语音信号。
10.一种冰箱,其特征在于,包括权利要求7-9所述的语音信号降噪拾音处理装置。

说明书

一种语音信号降噪拾音处理方法和装置及冰箱

技术领域

本发明实施例涉及语音信号处理技术领域,具体涉及一种语音信号降噪拾音处理
方法和装置及冰箱。

背景技术

本部分向读者介绍可能与本发明的各个方面相关的背景技术,相信能够向读者提
供有用的背景信息,从而有助于读者更好地理解本发明的各个方面。因此,可以理解,本部
分的说明是用于上述目的,而并非构成对现有技术的承认。

当前集成电路、人工智能、互联网技术的发展,传统的白家电业出现了新的定位,
冰箱不仅仅承载了保存食物的功能,也成为家庭网络的一部分,可为家庭成员提供更多的
智能化服务。在智能冰箱上,除了传统控制功能之外,多出了许多人机交互功能,语音控制
也变成了一种趋势。智能冰箱的很多场景会用到麦克风获取语音,由于房间内的回响很大,
环境噪声和信号是非稳态的,获取的语音信号质量的不到保证。如图1所示,冰箱放置的环
境(厨房、客厅等)通常有较大的噪声,除了目标说话人的声音之外,还有环境噪声(例如扬
声器正在播报的声音)干扰说话人的语音。传统的单麦克无论是录音还是用作识别都起不
到良好的效果。而基于单麦克的语音增强技术,如维纳滤波、卡尔曼滤波等,在抑制噪声的
情况下也会让语音造成畸变,并无法解决上述问题。

语音是宽带信号,传统的拾音方法无法在整带宽提升语音质量。房间内的回响很
大,传统的拾音方法没有有效的回音消除技术。环境和信号是非稳态的,传统的拾音方法无
法应对变化的噪声。噪音和语音有类似的频谱特性,传统的拾音方法在降低噪声的同时会
让语音造成畸变。在对话场景下,干扰说话人的语音可能会对人机交互造成影响。

发明内容

要解决的技术问题是如何消除房间内环境噪音对语音控制信号的干扰。

针对现有技术中的缺陷,本发明实施例提供一种语音信号降噪拾音处理方法和装
置及冰箱,可以提高信噪比(SNR),另一方面可以进行空间选择,对所关注方向的语音进行
增强,对其他方向的语音进行抑制。

第一方面,本发明实施例提供了一种语音信号降噪拾音处理方法,包括:

麦克风阵列采集当前环境的多路语音信号;

对采集到的多路语音信号执行时间同步;

对同步的多路语音信号加权求和得到降噪后的语音信号。

可选地,所述对采集到的多路语音信号执行时间同步包括:

根据每个麦克风和参考点之间的到达时间差进行时间移动,得到时间同步后的语
音信号,同步后的语音信号按下式计算:

Yα,n(k)=Yn[k+Fn(τ)]

=αn×s(k-τ)+Vα,n(k)

=Xα,n(k)+Vα,n(k)

其中,Yα,n(k)表示延时处理后的语音信号,Yn(k)表示当前麦克风接收到的音频信
号,Fn(τ)是第一麦克风和第n麦克风之间音频信号到达时间差,Xn(k)当前麦克风接收到的
语音信号,Vn(k)表示当前麦克风接收到的噪声信号,αn是第n个麦克风的衰减因子,s(k)是
未知信号源的音频信号,k表示当前时刻,n为常数,n=1、2、…、N,τ是从未知信号源到当前
麦克风的延时。

可选地,所示对同步的多路语音信号加权求和得到降噪后的语音信号按下式计
算:


其中,ZDS(k)表示降噪拾音处理后输出的语音信号,Yα,n(k)表示时间同步后的音频
信号,αn是第n个麦克风的衰减因子,s(k)是未知信号源的音频信号,k表示
当前时刻,τ是从未知信号源到当前麦克风的时延,n为常数,n=1、2、…、N,N表示麦克风个
数,Vn(k)表示当前麦克风接收到的噪声信号。

可选地,还包括:对采集的多路语音信号自适应波束成型处理,包括:

对采集的多路语音信号自适应滤波处理,所述自适应滤波处理后的音频信号按下
式计算:

Zα,n(k)=αTYα,n(k)-ωTRYα,n(k)

其中,Zα,n(k)表示输出的音频信号,αTYα,n(k)是语音输出参考信号,ωTRYα,n(k)是
噪声参考信号,R是阻塞矩阵。

可选地,所述阻塞矩阵R按下式计算:


可选地,还包括对采集到的多路语音信号分子带滤波处理:包括:

对采集到的多路语音信号分解成多个频域的子带信号;

分别对分解的频域子带语音信号执行滤波处理;

对所述滤波处理后的频域子带信号求和得到多路滤波处理后的频域音频信号;

对所述多路滤波处理后的频域音频信号合成时域语音信号。

另一方面,本发明还提供一种语音信号降噪拾音处理装置,包括:

语音信号采集单元,用于采集当前环境的多路语音信号;

同步单元:用于对采集到的多路语音信号执行时间同步;

降噪单元:用于对同步的多路语音信号加权求和得到降噪后的语音信号。

可选地,还包括自适应波束滤波单元,用于对采集的多路语音信号自适应滤波处
理,利用到噪声参考信号,通过迭代算法更新权重抑制噪声。

可选地,还包括分子带滤波处理单元,包括:

信号分解单元,用于对采集到的多路语音信号分解成多个频域的子带信号;

滤波单元,分别对分解的频域子带语音信号执行滤波处理;

信号合成单元,用于对所述滤波处理后的频域子带信号求和得到多路滤波处理后
的频域音频信号;

信号转换单元,用于对所述多路滤波处理后的频域音频信号合成时域语音信号。

再一方面,本发明还提供一种冰箱,包括上述的语音信号降噪拾音处理装置。

由上述技术方案可知,本发明实施例提供的语音信号降噪拾音处理方法和装置及
冰箱,通过自带滤波方式再整带宽提升语音质量,通过权重相加的方式不会改变语音特性,
可以有效消除回音,在提高信噪比的同时利用方向选择特性对感兴趣区域进行增强。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作一简单的介绍,显而易见地,下面描述中的附图是本发
明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根
据这些附图获得其他的附图。

图1为现有技术中设备噪声干扰环境示意图;

图2是本发明一个实施例中语音信号降噪拾音处理方法流程示意图;

图3是本发明一个实施例中语音信号降噪拾音处理方法流程示意图;

图4为本发明一个实施例中语音信号降噪拾音处理方法流程示意图;

图5为本发明一个实施例中麦克风阵列示意图;

图6为本发明一个实施例中语音信号降噪效果示意图;

图7为本发明一个实施例中语音信号降噪效果示意图;

图8为本发明一个实施例中语音信号降噪拾音处理方法流程示意图;

图9为本发明一个实施例中语音信号降噪拾音处理方法流程示意图;

图10为本发明一个实施示中语音信号降噪拾音处装置结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例
中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是
本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员
在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图2所示,本发明实施例提供一种语音信号降噪拾音处理方法,包括:麦克风阵
列采集当前环境的多路语音信号;对采集到的多路语音信号执行时间同步;对同步的多路
语音信号根据语音信号加权放大并求和得到降噪后的语音信号。下面对本发明和提供的语
音信号降噪拾音处理方法展开详细的说明。

如图2、图3所示,在麦克风阵列中每个麦克风接收到的音频信号记为Y(k),而该音
频信号Y(k)既包括语音信号X(k)也包括噪声信号V(k),麦克风阵列接收到的音频信号如式
(1)所示:

Y(k)=X(k)+V(k) (1)

其中,k表示当前时刻,Y(k)表示当前时刻k麦克风接收到的音频信号,X(k)当前时
刻k麦克风接收到的语音信号,V(k)表示当前时刻k麦克风接收到的噪声信号。

具体地,如图3所示,由于麦克风阵列中不同位置的麦克风与发出指令的目标位置
之间的距离不同导致不同位置的麦克风接收到的音频信号的强度不同,语音信号X(k)和噪
声信号V(k)均不同,因此需要将每个麦克风接收到语音信号执行时间同步。

麦克风阵列中每个麦克风接收到的语音信号如式(2)所示。

Yn(k)=Xn(k)+Vn(k) (2)

其中,k表示当前时刻,Yn(k)表示当前时刻k麦克风阵列中的当前麦克风接收到的
音频信号,Xn(k)表示当前时刻k麦克风阵列中的当前麦克风接收到的语音信号,Vn(k)表示
当前时刻k表示麦克风阵列中的当前麦克风接收到的噪声信号,n为常数,n=1、2、…、N,N表
示麦克风个数。

如图3、图4所示,对采集到的多路语音信号执行时间同步包括计算每个麦克风接
收到语音信号的时延和根据每个麦克风接收到语音信号对每个麦克风接收到的语音信号
执行时间同步。

具体地,同步过程是延时(或者提前)每个麦克风的输出,让感兴趣区域的信号同
步。每个麦克风接收到的语音信号的到达时间差(TDOA)是无法预知的,需要通过阵列的时
间延时估计来得到。

每个麦克风的时延可以通过现有的方法得到。对每个麦克风接收到语音信号的时
延估计方法有很多种。具体例如,通过各个信号之间的相关性,找到相关峰的位置。从统计
意义上说,相关值最大的地方是信号间同步的地方,基于这个思路可以得到信号间的时间
差。但由于房间中有混响存在,且语音信号是宽带信号,通过相关值估计误差较大。例如,对
每个麦克风接收到语音信号的时延估计方法还可以采用表现较好的有宽带空间谱估计算
法(MUSIC)得到。通过上述方法可以得到每个麦克风接收到的语音信号的时延τ。

根据每个麦克风接收到语音信号对每个麦克风接收到的语音信号执行时间同步。
由于不同位置的麦克风离指令发出的目标位置的距离不同导致同一音频信号到达不同位
置的麦克风的时间不同。使不同麦克风接收到的音频信号存在不同延时,麦克风实际接收
到的音频信号是按式(3)计算的:


其中,k表示当前时刻,Yn(k)表示当前时刻k麦克风阵列中的当前麦克风接收到的
音频信号,Xn(k)表示当前时刻k麦克风阵列中的当前麦克风接收到的语音信号,Vn(k)表示
当前时刻k表示麦克风阵列中的当前麦克风接收到的噪声信号,n为常数,n=1、2、…、N,N表
示麦克风个数;αn是第n个麦克风在时域的衰减因子;αn取值在0-1之间,s(k)表示未知信号
源的音频信号,τ是从未知信号源到当前麦克风的时延,Fn(τ)是第一麦克风和第n麦克风之
间音频信号到达时间差。

根据式(3)可知,麦克风实际接收到的语音信号是按式(4)计算的:

Xa,n(k)=Xn(k+Fn(τ)) (4)

其中,k表示当前时刻,Xa,n(k)麦克风实际接收到的语音信号,Xn(k)当前麦克风接
收到的语音信号,Fn(τ)是第一麦克风和第n麦克风之间音频信号到达时间差。

根据式(3)可知,麦克风实际接收到的噪音信号是按式(5)计算的:

Va,n(k)=Vn(k+Fn(τ)) (5)

其中,k表示当前时刻,Va,n(k)麦克风实际接收到的噪音信号,Vn(k)当前麦克风接
收到的语音信号,Fn(τ)是第一麦克风和第n麦克风之间音频信号到达时间差。

根据每个麦克风和参考点之间的到达时间差进行时间移动,得到时间同步后的语
音信号,同步后的语音信号按式(6)计算:


其中,k表示当前时刻,Yα,n(k)表示延时处理后的语音信号,Yn(k)表示当前麦克风
接收到的音频信号,Fn(τ)是第一麦克风和第n麦克风之间音频信号到达时间差,Xn(k)当前
麦克风接收到的语音信号,Vn(k)表示当前麦克风接收到的噪声信号,αn是第n个麦克风的在
时域的衰减因子,s(k)是未知信号源的音频信号,k表示当前时刻,n为常数,n=1、2、…、N,N
表示麦克风个数τ是从未知信号源到当前麦克风的延时。

如图3、图4所示,对时间同步后的多路语音信号根据语音信号加权放大并求和得
到降噪后的语音信号。将变换过的音频信号增加相应的权重值并相加,得到了得到降噪后
的语音信号Z。降噪后的语音信号Z是变换后的各个信号乘以权重,求和。

这里假设当前麦克风阵列中各个麦克风的权重相同,N组麦克风,每个麦克风接收
到的信号的权重为1/N。对每个变换后的结果Yα,n(k)求和。每个麦克风的权重值可以根据实
际需要设定。下面以各个麦克风接收信号权重相同的情况,降噪拾音处理后输出的语音信
号按式(7)计算:


其中,ZDS(k)表示降噪拾音处理后输出的语音信号,Yα,n(k)表示时间同步后的音频
信号,αn是第n个麦克风在时域的衰减因子,s(k)是未知信号源的音频信号,
k表示当前时刻,τ是从未知信号源到当前麦克风的时延,n为常数,n=1、2、…、N,N表示麦克
风个数,Vn(k)表示当前麦克风接收到的噪声信号。

整个麦克风阵列接收到的噪声为各个麦克风接收的噪声信号之和。麦克风阵列当
前时刻接收到的噪声如式(8)所示:


整个麦克风阵列接收到的语音信号为各个麦克风接收的语音信号之和。麦克风阵
列当前时刻接收到的语音信号如式(9)所示:


如图5所示,信号的性噪比(SNR,SIGNAL-NOISE RATIO)是衡量语音信号降噪能的
一个重要指标,对于麦克风接收到的噪比按式(10)计算:


其中,SNR表示噪声信号和语音信号的能量比,表示麦克风收到语音信号的能
量,表示麦克风收到的噪声信号的能量;表示麦克风收到的音频信号的能量,Xn(k)当
前麦克风接收到的语音信号;X代表语音信号,V代表噪声信号,s代表了未知信号源的音频
信号。通过式(10)表示变换后第一个传感器的SNR是原始SNR的倍。

假定噪声能量相同,所有的衰减因子=1,噪声不相关,所有噪声信号的相关系数
=1,噪声信号有类似的方差,可以推导出oSNR=N×SNR。通过上述可以得到在降噪处理后
噪声信号和语音信号的能量比有明显的提升。

权重相加的波束形成性能另一个表达方式是空间选择性,通过傅立叶变化,可以
得到对麦克风接收到的音频信号进行滤波处理的滤波系数如式(11)所示:


其中,q表示第n个麦克风在频域的滤波系数,f表示声波的频率,j表示虚部。Fn(τ)
是第一麦克风和第n麦克风之间音频信号到达时间差。n为常数,n=1、2、…、N,N表示麦克风
个数。

如图5所示,对于均匀间隔d的麦克风阵列,第n个麦克风(Yn)相对于参考的麦克风
(Y1)的时间差可以按式(12)计算:

Fn(τ)=(n-1)τ=d×cos(θ)/c (12)

其中,Fn(τ)是第一麦克风和第n麦克风之间音频信号到达时间差,τ是从未知信号
源到当前麦克风的时延,n为常数,n=1、2、…、N,N表示当前麦克风阵列中麦克风的个数,d
表示麦克风之间的间距,θ是波束方向和麦克风连线方向的夹角,c表示声音在空气中传播
的速度。

通过傅立叶变换,得到方向性的频率响应如式(13)所示:


其中,表示方向性的频率响应,n为常数,n=1、2、…、N,N表示当前麦克风阵
列中麦克风的个数,d表示麦克风之间的间距,θ是波束方向和麦克风连线方向的夹角,c表
示声音在空气中传播的速度。ψ表示需要增强方向和麦克风连线方向的夹角。

对麦克风整列中没个麦克风的放大系数是按式(14)计算的:

其中

其中,A表示对不同方向上的语音信号放大系数,方向性的频率响应,n为常
数,n=1、2、…、N,N表示当前麦克风阵列中麦克风的个数,d表示两个麦克风之间的间距,θ
是波束方向和麦克风连线方向的夹角,c表示声音在空气中传播的速度。ψ表示需要增强方
向和麦克风连线方向的夹角。

如图6示出了在麦克风数为8的麦克风阵列对不同角度语音信号的放大系数示意
图。如图6所示,对于不同角度传输的信号滤波器的增益不同,可以针对特定的角度进行增
强,具有空间选择性。可以达到选择特定方向声音的效果。如图6、图7所示,垂直于当前麦克
风所在连线上的语音信号有明显的增强。在其它方向上的音频信号增强不明显。可以明显
看出可以通过简单的权重相加的已经可以有较好的噪声抑制效果,以及具有方向选择性。
但是也可以看出,信噪比的提升和麦克风个数成正比,因此提升的效果有限,可以进一步进
行优化。

在执行上述方法抑制噪声的同时还可以对接收的多路音频信号执行自适应抵消
处理形成自适应波束,可以达到抑制波束形成器形成的噪声残留。同时在自适应波束形成
的基础上也可以进一步增加后置滤波器,通过调节滤波器系数,增强输出语音。具体地,如
图8所示,通过阻塞矩阵进行噪声估计,以达到更好的噪声抑制效果,具体实现是估计R的参
数。

将式(7)换一种更通用写法,如式(15)所示:

Z(k)=αTYα,n(k) (15)

其中,αT表示α的转置,α是麦克风在时域的衰减因子,αT=[α1,α2,…αn],可以通过α
的不同取值,让得到不同的输出。

如果公式(15)中示出的滤波系数都相同,则α1至αn都取1/N就得到式(7)。

接收的多路音频信号执行自适应抵消处理形成自适应波束的原理是利用到噪声
参考信号,通过迭代算法更新权重ω,抑制噪声。执行自适应抵消处理输出的音频信号如式
(16)所示。

Zα,n(k)=αTYα,n(k)-ωTRYα,n(k) (16)

其中,Zα,n(k)表示自适应抵消处理输出的音频信号,αTYα,n(k)是降噪拾音处理后
输出的语音信号,ωTRYα,n(k)是噪声参考信号。αT表示α的转置,α是麦克风在时域的衰减因
子,R是n×n的阻塞矩阵。阻塞矩阵如式(17)所示计算:


采用统计学的方法可以通过残差信号,根据误差最小的方法求解ω。其中该方法
可以包括最大SNR,最小化均方误差(MSE),LCMV(线性约束最小方差)等,可以根据实际的情
况选用。例如定义不同目标函数,根据目标函数最大化,求解权重ω,求解过程可以用迭代
法,如图8所示,采用不同的滤波器得到不同的算法,即不同通道的幅度加权值是根据特定
的最优准则进行调整和优化。

虽然上述方法可以提升的降噪效果,但降噪效果或有限。对于宽带信号,并不能生
成同样的波束序列。为解决该问题,可以通过将信号分解成若干个子带信号,分别进行滤波
的方式实现宽带信号的处理,在整个带宽下达到类似的效果。如图9所示,具体的方法包括:
对采集到的多路语音信号分子带滤波处理:包括:对采集到的多路语音信号分解成多个频
域的子带信号;分别对分解的频域子带语音信号执行滤波处理;对所述滤波处理后的频域
子带信号求和得到多路滤波处理后的频域音频信号;对所述多路滤波处理后的频域音频信
号合成时域语音信号。

具体的方法是对宽带语音信号分成不同频段的多个子带,对划分后的不同频段的
语音信号分别滤波处理,并对滤波后的多路语音信号求和,对多路语音信号合并成一路语
音信号,将频域域的恢复成时域信号。对宽带语音信号分成不同频段,优选可以进行离散傅
里叶变换DFT,将宽带语音信号分成不同频段的多个子带并将不同频段的语音信号由时域
信号变换为频域信号。对多路语音信号合并成一路语音信号优选进行傅里叶逆变换IDFT
(InverseDiscreteFourierTransform),将滤波后的不同频段的多个子带合并成一路语音
信号。

具体地,如图9所示,在时刻k,n个麦克风分的语音信号通过M点离散傅里叶变换
DFT分解成若干子带信号(例如:Y1(ω,M)、Y2(ω,M)、……、Yn(ω,M)),每个DFT得到M个输
出,称为M个子带。每个麦克风的输出的子带信号分别经过频域滤波器H(例如:H1(ω,M)、H2
(ω,M)、……、Hn(ω,M))进行滤波,结果还是得到n个M维矢量Zn(ω,M)(例如:Z1(ω,M)、Z2
(ω,M)、……、Zn(ω,M)),其中对Z做IDFT,得到时域输出Z
(k);其中,

为了进一步证明提供的语音信号降噪拾音处理方法的优越性,,本发明还提供一
种应用上述方法的语音信号降噪拾音处理装置,如图10所示,该装置包括:语音信号采集单
元,用于采集当前环境的多路语音信号;同步单元:用于对采集到的多路语音信号执行时间
同步;降噪单元:用于对同步的多路语音信号加权求和得到降噪后的语音信号。下面对本发
明实施例和提供的可信访问认证用户终端展开详细的说明。本发明实施例提供的语音信号
降噪拾音处理装置的工作原理和过程与上述的语音信号降噪拾音处理方法类似,可以参照
上述的可信访问认证处理方法,再此不再一一赘述了。

语音信号降噪拾音处理装置还包括自适应波束滤波单元,用于对采集的多路语音
信号自适应滤波处理,利用到噪声参考信号,通过迭代算法更新权重抑制噪声。

语音信号降噪拾音处理装置,还包括分子带滤波处理单元,包括:

信号分解单元,用于对采集到的多路语音信号分解成多个频域的子带信号;滤波
单元,分别对分解的频域子带语音信号执行滤波处理;信号合成单元,用于对所述滤波处理
后的频域子带信号求和得到多路滤波处理后的频域音频信号;信号转换单元,用于对所述
多路滤波处理后的频域音频信号合成时域语音信号。

为了进一步证明提供的语音信号降噪拾音处理装置的优越性,,本发明还提供一
种应用上述装置的冰箱,该冰箱包括上述的语音信号降噪拾音处理装置。

综上所述,本发明实施例提供的语音信号降噪拾音处理方法和装置及冰箱,通过
自带滤波方式再整带宽提升语音质量,通过权重相加的方式不会改变语音特性,可以有效
消除回音,在提高信噪比的同时利用方向选择特性对感兴趣区域进行增强。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序
产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实
施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机
可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产
品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程
图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流
程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序
指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产
生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实
现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特
定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指
令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或
多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计
算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或
其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一
个方框或多个方框中指定的功能的步骤。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实
体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存
在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖
非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要
素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备
所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在
包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指
示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化
描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操
作,因此不能理解为对本发明的限制。除非另有明确的规定和限定,术语“安装”、“相连”、
“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是
机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个
元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本
发明中的具体含义。

本发明的说明书中,说明了大量具体细节。然而能够理解的是,本发明的实施例可
以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技
术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各
个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特
征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解
释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更
多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实
施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,
其中每个权利要求本身都作为本发明的单独实施例。需要说明的是,在不冲突的情况下,本
申请中的实施例及实施例中的特征可以相互组合。本发明并不局限于任何单一的方面,也
不局限于任何单一的实施例,也不局限于这些方面和/或实施例的任意组合和/或置换。而
且,可以单独使用本发明的每个方面和/或实施例或者与一个或更多其他方面和/或其实施
例结合使用。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽
管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依
然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进
行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术
方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

一种语音信号降噪拾音处理方法和装置及冰箱.pdf_第1页
第1页 / 共18页
一种语音信号降噪拾音处理方法和装置及冰箱.pdf_第2页
第2页 / 共18页
一种语音信号降噪拾音处理方法和装置及冰箱.pdf_第3页
第3页 / 共18页
点击查看更多>>
资源描述

《一种语音信号降噪拾音处理方法和装置及冰箱.pdf》由会员分享,可在线阅读,更多相关《一种语音信号降噪拾音处理方法和装置及冰箱.pdf(18页珍藏版)》请在专利查询网上搜索。

本发明实施例涉及一种语音信号降噪拾音处理方法和装置及冰箱,其中该方法包括:麦克风阵列采集当前环境的语音信号;对采集到的多路语音信号执行时间同步;对同步的多路语音信号加权求和得到降噪后的语音信号。本发明通过自带滤波方式再整带宽提升语音质量,通过权重相加的方式不会改变语音特性,可以有效消除回音,在提高信噪比的同时利用方向选择特性对感兴趣区域进行增强。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 机械工程;照明;加热;武器;爆破 > 制冷或冷却;加热和制冷的联合系统;热泵系统;冰的制造或储存;气体的液化或固化


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1