用于双麦克风通信装置的降噪.pdf

上传人:b*** 文档编号:472477 上传时间:2018-02-18 格式:PDF 页数:19 大小:1.33MB
返回 下载 相关 举报
摘要
申请专利号:

CN201410299896.8

申请日:

2012.08.29

公开号:

CN104053092A

公开日:

2014.09.17

当前法律状态:

实审

有效性:

审中

法律详情:

著录事项变更IPC(主分类):H04R 3/00变更事项:申请人变更前:英特尔移动通信有限责任公司变更后:英特尔德国有限责任公司变更事项:地址变更前:德国诺伊比贝格变更后:德国诺伊比贝格|||实质审查的生效IPC(主分类):H04R 3/00申请日:20120829|||公开

IPC分类号:

H04R3/00

主分类号:

H04R3/00

申请人:

英特尔移动通信有限责任公司

发明人:

M.热伊布; C.内尔克; C.赫尔格罗茨; P.瓦里; C.博热安

地址:

德国诺伊比贝格

优先权:

2011.08.29 US 13/219,750

专利代理机构:

中国专利代理(香港)有限公司 72001

代理人:

徐红燕

PDF下载: PDF下载
内容摘要

本发明的名称为用于双麦克风装置的降噪。一种用于在降噪系统中管理噪声的方法、系统和计算机程序产品,包括:在第一麦克风处接收第一信号;在第二麦克风处接收第二信号;标识所述第一信号和所述第二信号中的噪声估计;使用所述第二信号的功率谱密度减去所述噪声估计与所述第一信号的功率谱密度的比值来标识所述降噪系统的传递函数,其中仅从所述第二信号的功率谱密度中去除所述噪声估计;以及使用所述传递函数来标识所述降噪系统的增益。

权利要求书

1.   一种用于在降噪系统中估计噪声的方法,所述方法包括:
在第一麦克风处接收第一信号;
在第二麦克风处接收第二信号;
标识所述第一信号的功率谱密度和所述第二信号的功率谱密度中的归一化的差;以及
使用所述差来标识噪声估计。

2.
   根据权利要求1所述的方法,其中标识所述第一信号的功率谱密度和所述第二信号的功率谱密度中的归一化的差的步骤使用下述方程:

其中是所述第一信号的功率谱密度和所述第二信号的功率谱密度中的归一化的差,
β是加权因子,
是所述第一信号的功率谱密度,并且
是所述第二信号的功率谱密度。

3.
   根据权利要求1所述的方法,其还包括:
使用所述第二信号的功率谱密度减去所述噪声估计与所述第一信号的功率谱密度的比值来标识所述降噪系统的传递函数,其中仅从所述第二信号的功率谱密度中去除所述噪声估计;以及
使用所述传递函数来标识所述降噪系统的增益。

4.
   一种用于在降噪系统中估计噪声的方法,所述方法包括:
在第一麦克风处接收第一信号;
在第二麦克风处接收第二信号;
标识所述第一信号与所述第二信号之间的相干性;以及
使用所述相干性来标识噪声估计。

5.
   根据权利要求4所述的方法,其中标识所述相干性的步骤使用下述方程:

其中是所述第一信号与第二信号之间的相干性,
是所述第一信号的功率谱密度,
是所述第二信号的功率谱密度,并且
是所述第一信号与所述第二信号的交叉功率谱密度。

6.
   根据权利要求4所述的方法,其中标识所述噪声估计的步骤使用下述方程:

其中是所述噪声估计,
是所述第一信号与第二信号之间的相干性,
是所述第一信号的功率谱密度,
是所述第二信号的功率谱密度,并且
是所述第一信号与所述第二信号的交叉功率谱密度。

7.
   根据权利要求4所述的方法,其还包括:
使用所述第二信号的功率谱密度减去所述噪声估计与所述第一信号的功率谱密度的比值来标识所述降噪系统的传递函数,其中仅从所述第二信号的功率谱密度中去除所述噪声估计;以及
使用所述传递函数来标识所述降噪系统的增益。

8.
   一种用于在降噪系统中估计噪声的系统,所述方法包括:
第一麦克风,其被配置为接收第一信号;
第二麦克风,其被配置为接收第二信号;
噪声估计模块,其被配置为标识所述第一信号的功率谱密度和所述第二信号的功率谱密度中的归一化的差;并且使用所述差来标识噪声估计。

9.
   根据权利要求8所述的系统,其还包括:
语音增强模块,其被配置为使用所述第二信号的功率谱密度减去所述噪声估计与所述第一信号的功率谱密度的比值来标识所述降噪系统的传递函数,其中仅从所述第二信号的功率谱密度中去除所述噪声估计;并且使用所述传递函数来标识所述降噪系统的增益。

10.
   一种用于在降噪系统中估计噪声的系统,所述方法包括:
第一麦克风,其被配置为接收第一信号;
第二麦克风,其被配置为接收第二信号;
噪声估计模块,其被配置为标识所述第一信号与所述第二信号之间的相干性并且使用所述相干性来标识噪声估计。

11.
   根据权利要求10所述的系统,其中标识所述相干性的噪声估计模块使用下述方程:

其中是所述第一信号与第二信号之间的相干性,
是所述第一信号的功率谱密度,
是所述第二信号的功率谱密度,并且
是所述第一信号与所述第二信号的交叉功率谱密度。

12.
   根据权利要求10所述的系统,其中标识所述噪声估计的噪声估计模块使用下述方程:

其中是所述噪声估计,
是所述第一信号与第二信号之间的相干性,
是所述第一信号的功率谱密度,
是所述第二信号的功率谱密度,并且
是所述第一信号与所述第二信号的交叉功率谱密度。

说明书

用于双麦克风通信装置的降噪
技术领域
本发明的各种实施例大体涉及举例来说诸如在通信装置中的降噪系统。具体地,本发明的各种实施例涉及双麦克风通信装置中的降噪。
背景技术
降噪是从信号中去除噪声的过程。噪声可以是存在于信号中的任何不期望的声音。无论被处理的信号如何,降噪技术在概念上非常相似,但是所预期的信号的特征的先验知识可能意味着这些技术的实现根据信号的类型而有非常大的变化。
所有记录装置,模拟和数字两种均具有使其易受噪声影响的特质。噪声可以是无相干性的随机噪声或白噪声,或者是由装置的机构或处理算法引入的相干噪声。
在电子记录装置中,一种形式的噪声是由随机电子引起的嘶嘶声,受热量严重影响的随机电子偏离其指定路径。这些偏离的电子可影响输出信号的电压并且因此产生可检测的噪声。
用于降低背景噪声的算法被用在许多语音通信系统中。移动电话和助听器具有集成的单通道或多通道算法来提高在不利环境下的语音质量。在这样的算法中,一种方法是谱减法技术,其通常需要估计不需要的背景噪声的功率谱密度(PSD)。不同的单通道噪声PSD估计器已被提出。用于带有两个或更多个麦克风的系统的多通道噪声PSD估计器尚未被深入研究。
发明内容
一种用于在降噪系统中管理噪声的方法、系统和计算机程序产 品,包括:在第一麦克风处接收第一信号;在第二麦克风处接收第二信号;标识所述第一信号和所述第二信号中的噪声估计;使用所述第二信号的功率谱密度减去所述噪声估计与所述第一信号的功率谱密度的比值来标识所述降噪系统的传递函数,其中仅从所述第二信号的功率谱密度中去除所述噪声估计;以及使用所述传递函数来标识所述降噪系统的增益。
一种用于在降噪系统中估计噪声的方法、系统和计算机程序产品,包括:在第一麦克风处接收第一信号;在第二麦克风处接收第二信号;标识所述第一信号的功率水平和所述第二信号的功率水平中的归一化的差;以及使用所述第一信号的功率水平和所述第二信号的功率水平中的差来标识噪声估计。
一种用于在降噪系统中估计噪声的方法、系统和计算机程序产品,包括:在第一麦克风处接收第一信号;在第二麦克风处接收第二信号;标识所述第一信号与所述第二信号之间的相干性;以及使用所述相干性来标识噪声估计。
附图说明
在附图中,相似的附图标记通常贯穿不同的视图指示相同的部分。附图不一定按比例绘制,代替地通常被布置在其上的重点示出本发明的原理。在下面的说明中,将参考下面的附图来描述本发明的各种实施例,其中:
图1是根据示意性的实施例的装置的视图;
图2是根据示意性的实施例的装置的视图;
图3是根据示意性的实施例的信号模型;
图4是根据示意性的实施例的语音增强系统的框图;
图5是根据示意性的实施例的降噪系统的框图;
图6是根据示意性的实施例的用于在降噪系统中降低噪声的流程图;
图7是根据示意性的实施例的用于在降噪系统中标识噪声的流程图;以及
图8是根据示意性的实施例的用于在降噪系统中标识噪声的流程图。
具体实施方式
下面的详细说明参考附图,所述附图通过示意的方式显示了具体细节以及可在其中实践本发明的实施例。词语“示例性”在此处被用于指“用作示例、实例或示意”。此处被描述为“示例性”的任何实施例或设计不必被解释为比起其他实施例或设计来是优选或有利的。
注意到,在本说明书中,对包括在“一个实施例”、“示例实施例”、“一实施例”、“另一实施例”、“某些实施例”、“各种实施例”、“其他实施例”、“不同实施例”、“备选实施例”等中的各种特征(例如元件、结构、模块、组件、步骤、操作、特征等)的提及意在指任何这样的特征被包括在本公开内容的一个或多个实施例中,并且可能是或可能不是必须在相同的实施例中被组合。
各种实施例考虑到并且意识到用于降噪的现有算法具有高计算复杂度、高存储开销以及在估计非平稳噪声方面的困难。此外,各种实施例考虑到并且意识到能够跟踪非平稳噪声的任何现有算法仅是单通道的。但是,即使单通道算法大多也不能够跟踪非平稳噪声。
此外,各种实施例提供了双通道噪声PSD估计器,其使用关于噪声场相干性的知识。并且,各种实施例提供了具有低计算复杂度的过程并且可将该过程与其他语音增强系统组合。
此外,各种实施例提供了通过利用第二麦克风通道得到更稳健的噪声估计来对现有的单通道噪声抑制系统进行可升级扩展的过程。各种实施例提供了通过使用噪声场相干性的先验知识以便在扩散噪声场条件下降低不需要的背景噪声的双通道语音增强系统。
前述内容已经相当广义地概述了不同的示意性实施例的特征和 技术优点以便使下面对本发明的详细描述更好地被理解。将在下文中描述不同的示意性实施例的附加特征和优点。本领域的技术人员应理解的是,所公开的概念和具体实施例可容易地被用作修改或重新设计用于实现不同示意性实施例的相同目的的其他结构或过程的基础。本领域的技术人员还应意识到的是,这样的等效构造并不背离如随附权利要求所阐述的本发明的精神和范围。
图1是根据示意性的实施例的装置的视图。装置2是带有麦克风4和6的用户设备。装置2可以是通信装置、移动电话或带有麦克风的某些其他合适的装置。在不同的实施例中,装置2可具有更多或更少的麦克风。装置2可以是智能手机、平板型个人电脑、头戴式耳机、个人电脑或使用麦克风来接收声音的某些其他类型的合适的装置。在这个实施例中,麦克风4和6被显示为大约相隔2cm。但是,可以在其他实施例中将所述麦克风布置在各种距离上。此外,麦克风4和6以及其他麦克风可被布置在装置2的任何表面上或者可以被无线连接并且远程定位。
图2是根据示意性的实施例的装置的视图。装置8是带有麦克风10和12的用户设备。装置8可以是通信装置、移动电话或带有麦克风的某些其他合适的装置。在不同的实施例中,装置8可具有更多或更少的麦克风。装置8可以是智能手机、平板型个人电脑、头戴式耳机、个人电脑或使用麦克风的某些其他类型的合适的装置。在这个实施例中,麦克风10和12大约相隔10cm。但是,可以在其他实施例中将所述麦克风定位在各种距离和位置上。此外,麦克风10和12以及其他麦克风可被布置在装置8的任何表面上或者可以被无线连接并且远程定位。
图3是根据示意性的实施例的信号模型。信号模型14是双通道信号模型。两个麦克风信号xp(k)和xs(k)是双通道语音增强系统的输入并且通过信号模型14与纯净的语音s(k)以及加性背景噪声信号n1(k)和n2(k)相关,其具有离散时间指数k。源与麦克风之间的声传递函数 由H1(ejΩ)和H2(ejΩ)来表示。由带有频率变量f和采样频率fs的Ω-2πf/fs给出归一化的角频率。每个麦克风处的源分别是s1(k)和s2(k)。一旦噪声被加入源,其被每个麦克风拾取为xp(k)和xs(k),此处也分另被称为x1(k)和x2(k)。
图4是根据示意性的实施例的语音增强系统的框图。语音增强系统16是双通道语音增强系统。在其他实施例中,语音增强系统16可具有多于两个的通道。
语音增强系统16包括分段加窗单元18和20。分段加窗单元16和18将输入信号xp(k)和xs(k)分割为长度为L的重叠帧。此处,xp(k)和xs(k)也可被称为x1(k)和x2(k)。分段加窗单元16和18可应用汉宁窗(Hann window)或其他合适的窗。在加窗之后,时频分析单元22和24将长度为M的帧变换至短期谱域。在一个或多个实施例中,时频分析单元22和24使用快速傅里叶变换(FFT)。在其他实施例中,可使用其他类型的时频分析。对应的输出谱由Xp(λ,μ)和Xs(λ,μ)表示。离散的频率槽和帧指数分别由μ和λ表示。
噪声功率谱密度(PSD)估计单元26计算频域语音增强系统的噪声功率谱密度估计噪声功率谱密度估计可通过使用xp(k)和xs(k)或在频域内通过Xp(λ,μ)和Xs(λ,μ)来计算。噪声功率谱密度也可被称为自功率谱密度。
谱增益计算单元28计算谱加权增益G(λ,μ)。谱增益计算单元28使用噪声功率谱密度估计以及输出谱Xp(λ,μ)和Xs(λ,μ)。
通过系数Xp(λ,μ)与谱加权增益G(λ,μ)相乘给出增强谱逆时频分析单元30对应用快速傅里叶逆变换,并且进而通过重叠相加单元32应用重叠相加来产生增强的时域信号逆时频分析单元30可使用快速傅里叶逆变换或某些其他类型的逆时频分析。
应注意到的是,借助滤波器组均衡器或使用任何种类的分析或合成滤波器组在时域内进行滤波也是可能的。
图5是根据示意性的实施例的降噪系统的框图。降噪系统34是 这样的系统:其中一个或多个装置可通过麦克风接收信号用于处理。降噪系统34可包括用户设备36、语音源38和多个噪声源40。在其他实施例中,降噪系统34包括多于一个的用户设备36和/或多于一个的语音源38。用户设备36可以是图2的用户设备8和/或图1的用户设备2的一种实现的一个示例。
语音源38可以是期望的可听见的源。该期望的可听见的源是产生所期望的可听信号的源。例如,语音源38可以是同时对第一麦克风42和第二麦克风44说话的人。相反,多个噪声源40可以是不期望的可听见的源。多个噪声源40可以是背景噪声。例如,多个噪声源40可以是汽车引擎、风扇或其他类型的背景噪声。在一个或多个实施例中,与第二麦克风44相比,语音源38可更接近第一麦克风42。在不同的有利实施例中,语音源38可与第一麦克风42和第二麦克风44等距,或者接近于第二麦克风44。
语音源38和多个噪声源40发出音频信号,其分别作为组合信号的一部分被第一麦克风42和第二麦克风44同时或以一定的时延接收,所述时延是由源与第一麦克风42和源与第二麦克风44之间不同的声波传播时间所引起的。第一麦克风42可以第一信号46的形式接收组合信号的一部分。第二麦克风44可以第二信号48的形式接收组合信号的一部分。
用户设备36可被用于接收来自人的语音,并且进而将该语音传送至另一件用户设备。在语音接收期间,也可从多个噪声源40接收不需要的背景噪声。多个噪声源40形成第一信号46和第二信号48的可能是不期望的声音的部分。从多个噪声源40产生的背景噪声可能是不期望的并且降低了语音的质量和清晰度。因此,降噪系统34提供了降低和/或去除由第一麦克风42和第二麦克风44接收的背景噪声的系统、方法和计算机程序产品。
背景噪声的估计可被标识并且用于去除和/或降低不期望的噪声。位于用户设备36中的噪声估计模块50通过使用功率水平均一(PLE) 算法来标识第一信号46和第二信号48中的噪声估计52,所述PLE算法利用第一麦克风42与第二麦克风44之间的功率谱密度差。该方程为:
方程1-Δφ(λ,μ)=|φX1X1(λ,μ)-βφX2X2(λ,μ)φX1X1(λ,μ)+βφX2X2(λ,μ)|,]]>
其中Δφ(λ,μ)是第一信号46的功率谱密度54和第二信号48的功率谱密度56中的归一化的差52,β是加权因子,φX1X1(λ,μ)是第一信号46的功率谱密度54,并且φX2X2(λ,μ)是第二信号48的功率谱密度56。φX1X1(λ,μ)和φX2X2(λ,μ)可分别表示x1(k)和x2(k)。在不同的实施例中,在方程1中可以取或可以不取绝对值。
归一化的差52可以是功率水平φX1X1(λ,μ)与φX2X2(λ,μ)的相对于φX1X1(λ,μ)与φX2X2(λ,μ)之和的差。第一信号46和第二信号48可以是来自不同源的不同音频信号和声音。功率谱密度54和功率谱密度56可以是与平稳随机过程关联的频率变量的正实函数,或者是时间的确定性函数,其具有每赫兹(Hz)功率或每赫兹能量的尺度。功率谱密度54和功率谱密度56也可被称为信号的谱。功率谱密度54和功率谱密度56可测量随机过程的频率含量并且帮助标识周期性。
不同的实施例考虑到不同的条件。例如,一个或多个实施例考虑到多个噪声源40产生均匀的噪声,其中噪声功率水平在两个通道上相等。在那些实施例中,噪声是相干的还是扩散的是不相关的。在其他实施例下,噪声是相干或是扩散的可以是相关的。
在各种输入F,所述方程将具有不同的结果。例如,当仅存在扩散背景噪声时,由于输入功率水平几乎相等,因此Δφ(λ,μ)将接近于0。因此,在第一麦克风42处的输入可以被用作噪声PSD。其次,就仅存在纯语音并且第二麦克风44中的语音的功率与第一麦克风42相比非常低的情况而言,Δφ(λ,μ)的值将接近于1。结果,对最后一帧的估计将被保持。当输入处于上文所示的这两个极值之间时,使用第二麦克风44的噪声估计将被用作噪声估计52的近似。基于指定范围53使用不同的方法。指定范围53处在φmin与φmax之间。在下面的方程 中显示了三种不同的方法,取决于归一化的差52落在指定范围53的哪里:
如果Δφ(λ,μ)<φmin,那么使用,
方程1.1-σN2(λ,μ)=α·σN2(λ-1,μ)+(1-α)·|X1|2(λ,μ),]]>其中|X1|2(λ,μ)是第一信号46与第二信号48的交叉功率谱密度58。
如果Δφ(λ,μ)>φmax,那么使用,
在不同的实施例中,可采用其他方法,其也在语音存在的周期中起作用。
如果φmin<Δφ(λ,μ)<φmax,那么使用,
方程1.2-σN2(λ,μ)=α·σN2(λ-1,μ)+(1-α)·|X2|2(λ,μ),]]>
其中X1是信号x1(k)的时域系数并且X2是信号x2(k)的时域系数。
固定值或适应值可被用于φmin、φmax和α。项可以是噪声估计52。α在方程1.1和方程1.2中的值可以不同或相同。项λ可被定义为离散帧指数。项μ可被定义为离散频率指数。项α可被定义为平滑因子。
在语音处理应用中,可将语音信号分割为帧(λ)。这些帧进而被变换至频域(μ)、短时谱X1。为了得到对信号的功率谱的更可靠的测量,在连续的帧上对短时谱递归地进行平滑。随时间进行平滑提供了方程1.3-1.5中的PSD估计。
在某些实施例中,在短期谱域中实现所述方程,并且借助于根据下述方程的离散短时估计来递归地估计方程1中所要求的PSD项。
方程1.3-φ^X1X1(λ,μ)=βφ^X1X1(λ-1,μ)+(1-β)|X1(λ,μ)|2;]]>
方程1.4-φ^X2X2(λ,μ)=βφ^X2X2(λ-1,μ)+(1-β)|X2(λ,μ)|2;]]>以及
方程1.5-φ^X1X2(λ,μ)=βφ^X1X2(λ-1,μ)+(1-β)X1(λ,μ)·X2*(λ,μ),]]>
其中β是固定的或适应的平滑因子并且0≤β≤1,并且*表示复共轭。
此外,在不同的实施例中,与备选的单通道或双通道噪声PSD估 计器的组合也是可能的。根据估计器,这种组合可基于最小值、最大值或任何种类的平均值、按频带和/或是由频率决定的组合。
在一个或多个实施例中,噪声估计模块50可使用用于标识噪声估计52的另一系统和方法。噪声估计模块50可标识第一信号46与第二信号48之间的相干性60,进而使用相干性60来标识噪声估计52。
不同的示意性实施例意识到并且考虑到当前方法使用基于噪声场相干性的针对语音PSD的估计器,所述噪声场相干性被导出并且并入维纳滤波器规则以降低扩散背景噪声。一个或多个示意性实施例为采用任何谱噪声抑制规则的通用应用提供了噪声PSD估计。由下述方程在频域中定义第一信号46与第二信号48之间的复相干性。
方程2-ΓX1X2(λ,μ)=φX1X2(λ,μ)φX1X1(λ,μ)×φX2X2(λ,μ)]]>
在不同的示意性实施例中,当来自图3的噪声源n1(k)和n2(k)与来自图3的语音信号s(k)不相关时,在语音增强系统的输入xp(k)和xs(k)处的自功率谱密度和交叉功率谱密度读出为:
φX1X1=φSSn1n2
φX2X2=φSSn2n2;以及
φX1X2=φSSn1n2
其中φSS=φS1S1=φS2S2,并且其中φSS是语音的功率谱密度,φn1n1是第一麦克风42处的噪声的自功率谱密度,φn2n2是第二麦克风44处的噪声的自功率谱密度,并且φn1n2是两个麦克风处的噪声的交叉功率谱密度。
当被应用于方程2时,语音信号的相干性为ΓX1X2(λ,μ)-1。在不同的实施例中,如果声源到麦克风的距离小于临界距离,则相干性60可以接近于1。可将临界距离定义为与源相距的在其处由信号的直接路径分量所引起的声能等于由信号的混响所引起的声能的距离。
此外,各种实施例可考虑到噪声场被表征为是扩散的,其中除了 低频之外,不需要的背景噪声nm(k)的相干性接近于0。此外,各种实施例可考虑到均匀的扩散噪声场导致在下述方程的某些中,为了清晰起见可省略帧和频率指数(λ和μ)。在各种实施例中,方程2可被重新整理如下:
φn1n2=Γn1n2φn1n1-φn2n2=Γn1n2-σN2,]]>
其中Γn1n2可以是任意的噪声场模型,诸如
在不相关的噪声场中,其中
ΓX1X2(λ,μ)=(),或者
在理想的均匀球状各向同性的噪声场中,其中
ΓX1X2(λ,μ)=sinc(2πfdmicc),]]>
其中dmic是在频率f和声速c下两个全方向麦克风之间的距离。
因此,自功率谱密度可用公式表示为:
φX1X1=φSS+σN2;]]>以及
φX2X2=φSS+σN2.]]>
并且,交叉功率谱密度可用公式表示为:
φX1X2=φSS+Γn1n2·σN2.]]>
其中两个自功率谱密度的几何平均为:
φX1X1·φX2X2=φSS+σN2,]]>
并且交叉功率谱密度重新整理为:
φSS=φX1X2-Γn1n2·σN2]]>
下面的方程可被写成公式:
φX1X1·φX2X2=φX1X2+σN2(1-Γn1n2).]]>
基于上述方程,实值噪声PSD估计为:
方程3-σN2(λ,μ)=φX1X2(λ,μ)×φX2X2(λ,μ)-Re{φX1X2(λ,μ)}1-Re{Γn1n2(λ,μ)}]]>
其中对于分母,1-Re{Γn1n2(λ,μ)}>0必须被保证,例如Γmax=0.99的相干性60的上限阈值。函数Re{·}返回其变元的实部。在不同的实施 例中,可不取在方程3中所取的实部。此外,此处在任何方程中所取的任何实部都可以是可选的。此外,在不同的实施例中,不同的PSD元件可分别被均匀或非均匀地加权。
一旦噪声估计模块50标识噪声估计52,语音增强模块62就可标识降噪系统34的增益64。增益64可以是在通过降噪系统34进行处理期间被应用于第一信号46和第二信号48的谱增益。用于增益64的方程使用两个麦克风之间的功率水平差,如下所示:
方程4-Δφ(λ,μ)=|φX1X1(λ,μ)-φX2X2(λ,μ)|。
当存在纯噪声时,上述方程结果为接近于0,而当存在纯语音时,得到大于0的绝对值。此外,不同的实施例可使用另一方程,如下所示:
方程5-Δφ(λ,μ)=max(φX1X1(λ,μ)-φX2X2(λ,μ),0)。
在方程5中,当第二信号的功率水平比第一信号的功率水平大时,功率水平差为0。这个实施例意识到并且考虑到第二麦克风44处的功率水平不应比第一麦克风42处的功率水平高。然而,在某些实施例中,可能期望的是使用4。例如,当两个麦克风与语音源38等距时。
使用上述方程,增益64可被计算为:
方程6-G(λ,μ)=Δφ(λ,μ)Δφ(λ,μ)+γ·|1-H2(λ,μ)|·σ^N2(λ,μ),]]>
其中H(λ,μ)是第一麦克风42与第二麦克风44之间的传递函数66,是噪声估计52,γ是加权因子,Δφ(λ,μ)是归一化的差52,并且G(λ,μ)是增益64。
在没有语音的情况下,语音源38没有输出,Δφ(λ,μ)将为0并且因此增益64将为0。当存在没有噪声的语音时,多个噪声源40没有输出,方程6的分母的右边部分将为0,并且相应地,该分数将变成1。
语音增强模块62可使用第二信号48的功率谱密度56减去噪声估计52与第一信号46的功率谱密度54的比值67来标识传递函数66。 仅从第二信号48的功率谱密度56中去除噪声估计52。传递函数66如下被计算:
方程7-H(λ,μ)=φX2X2(λ,μ)-σ^N2(λ,μ)φX1X1(λ,μ),]]>
其中H(λ,μ)是传递函数66,
φX1X1(λ,μ)是第一信号46的功率谱密度54,
φX2X2(λ,μ)是第二信号44的功率谱密度56,并且
是噪声估计54,此处其也可被称为φNN(λ,μ)。
在其他实施例中,传递函数66可以是另一方程,如下所示:
方程8-H(λ,μ)=φX2X2(λ,μ)-σ^N2(λ,μ)φX1X1(λ,μ)-σ^N2(λ,μ).]]>
在这种情况下,当语音低时,分子和分母两者均收敛为接近0。
此外,不同的有利实施例使用降低乐音量的方法。例如,在不同的实施例中,类似于对H(λ,μ)的估计起作用的判决指向方法的程序可如下被使用:
方程9-ξ(λ,μ)=α·S(λ-1,μ)2σ^N2(λ-1,μ)+(1-α)·G(λ,μ)1-G(λ,μ),]]>
以及
方程10-G(λ,μ)=ξ(λ,β)1-ξ(λ,μ),]]>
其中此处α在不同的方程中可以是不同的值。
此外,在频率上进行平滑的方法可进一步降低乐音量。此外,在不同的实施例中,增益平滑可仅在一定的频率范围之上进行。在其他实施例中,可不对任何频率或对所有频率应用增益平滑。
此外,用户设备34可包括一个或多个存储元件(例如存储元件24)以用于存储将在实现与如此处所概述的应用管理关联的操作时被使用的信息。这些装置还可将信息保持在任何合适的存储元件(例如随机存取存储器(RAM)、只读存储器(ROM)、现场可编程门阵列(FPGA)、可擦除可编程只读存储器(EPROM)、电可擦除可编程ROM(EEPROM) 等)、软件、硬件中或者保持在任何其他合适的组件、装置、元件或对象中,基于具体需要被保持在适当的地方。此处所讨论的任何存储器或存储项应被解释为涵盖在如此处在本说明书中所使用的广义术语“存储元件”之内。
在不同的示意性实施例中,可通过编码在一个或多个有形介质中的逻辑来实现此处所概述的用于降低和估计噪声的操作,所述有形介质可包括非暂时性的介质(例如在ASIC中提供的嵌入式逻辑、数字信号处理器(DSP)指令、潜在地包括由处理器或其他类似机器执行的目标代码和源代码的软件等)。在这些实例的某些中,一个或多个存储元件(例如存储元件68)可以存储用于此处所描述的操作的数据。这包括能够存储软件、逻辑、代码或被执行以实现在本说明书中所描述的活动的处理器指令的存储元件。
此外,用户设备36可包括处理元件70。处理器可执行任何类型的与数据关联的指令来完成此处在本说明书中所详述的操作。在一个实例中,处理器(如图5所示)可将元件或项目(例如数据)从一种状态或情况变换为另一种状态或情况。在另一示例中,可用固定逻辑或可编程逻辑(例如由处理器执行的软件/计算机指令)来实现此处所概述的活动,并且此处所标识的元件可以是某些类型的可编程处理器、可编程数字逻辑(例如FPGA、EPROM、EEPROM)或包括数字逻辑、软件、代码、电子指令,闪存,光盘、CD-ROM、DVD ROM、磁卡或光卡、适于存储电子指令的其他类型的机器可读介质的ASIC或者它们的任何合适的组合。
此外,用户设备36包括提供用于与其他装置进行通信的通信单元70。通信单元70可通过使用物理通信链路和无线通信链路两者中的任何一个或者使用这两者来提供通信。
在图5中对降噪系统34的示意并不意味着暗示对可以其来实现不同的示意性实施例的方式的物理或构架上的限制。可使用除所示出的组件之外的和/或代替所示出的组件的其他组件。某些组件在某些 示意性的实施例中可以是不必要的。并且,各个块被呈现以示出某些功能组件。这些块中的一个或多个当在不同的有利实施例中被实现时可被组合和/或被分成不同的块。
图6是根据示意性的实施例的用于在降噪系统中降低噪声的流程图。可在来自图5的降噪系统34中实现过程600。
过程600开始于用户设备在第一麦克风处接收第一信号(步骤602)。并且,用户设备在第二麦克风处接收第二信号(步骤604)。步骤602和604可以任何顺序或同时地发生。用户设备可以是通信装置、膝上型电脑、平板型个人电脑或使用麦克风的任何其他装置。
然后,噪声估计模块标识第一信号和第二信号中的噪声估计(步骤606)。噪声估计模块可标识第一信号的功率谱密度和第二信号的功率谱密度中的归一化的差并且基于该归一化的差在指定范围之下、之内还是之上来标识噪声估计。
接着,语音增强模块使用第二信号的功率谱密度减去噪声估计与第一信号的功率谱密度的比值来标识降噪系统的传递函数(步骤608)。仅从第二信号的功率谱密度中去除噪声估计。最后,语音增强模块使用传递函数来标识降噪系统的增益(步骤610)。其后,该过程终止。
图7是根据示意性的实施例用于在降噪系统中标识噪声的流程图。可在来自图5的降噪系统34中实现过程700。
过程700开始于用户设备在第一麦克风处接收第一信号(步骤702)。并且,用户设备在第二麦克风处接收第二信号(步骤704)。步骤702和704可以任何顺序或同时地发生。用户设备可以是通信装置、膝上型电脑、平板型个人电脑或使用麦克风的任何其他装置。
然后,噪声估计模块标识第一信号的功率谱密度和第二信号的功率谱密度中的归一化的差(步骤706)。最后,噪声估计模块使用所述差来标识噪声估计(步骤708)。其后,该过程终止。
图8是根据示意性的实施例的用于在降噪系统中标识噪声的流 程图。可在来自图5的降噪系统34中实现过程800。
过程800开始于用户设备在第一麦克风处接收第一信号(步骤802)。并且,用户设备在第二麦克风处接收第二信号(步骤804)。步骤802和804可以任何顺序或同时发生。用户设备可以是通信装置、膝上型电脑,平板型个人电脑或使用麦克风的任何其他装置。
然后,噪声估计模决标识第一信号与第二信号之间的相干性(步骤806)。最后,噪声估计模块使用所述相干性来标识噪声估计(步骤808)。其后,该过程终止。
不同的所描绘的实施例中的流程图和框图示出了装置、方法、系统和计算机程序产品的某些可能的实现的构架、功能和操作。就这点而言,流程图或框图中的每个块可表示模块、分段或者计算机可用或可读的程序代码的部分,其包括用于实现指定的一个或多个功能的一个或多个可执行指令。在某些备选的实现中,在所述块中提到的一个或多个功能可不按图中所指明的顺序发生。例如,在某些情况下,连续显示的两个块可大体上同时被执行,或者各个块有时可以相反的顺序来执行,这取决于所涉及的功能。

用于双麦克风通信装置的降噪.pdf_第1页
第1页 / 共19页
用于双麦克风通信装置的降噪.pdf_第2页
第2页 / 共19页
用于双麦克风通信装置的降噪.pdf_第3页
第3页 / 共19页
点击查看更多>>
资源描述

《用于双麦克风通信装置的降噪.pdf》由会员分享,可在线阅读,更多相关《用于双麦克风通信装置的降噪.pdf(19页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104053092A43申请公布日20140917CN104053092A21申请号201410299896822申请日2012082913/219,75020110829US201210313653620120829H04R3/0020060171申请人英特尔移动通信有限责任公司地址德国诺伊比贝格72发明人M热伊布C内尔克C赫尔格罗茨P瓦里C博热安74专利代理机构中国专利代理香港有限公司72001代理人徐红燕54发明名称用于双麦克风通信装置的降噪57摘要本发明的名称为用于双麦克风装置的降噪。一种用于在降噪系统中管理噪声的方法、系统和计算机程序产品,包括在第一麦克风处接收第一。

2、信号;在第二麦克风处接收第二信号;标识所述第一信号和所述第二信号中的噪声估计;使用所述第二信号的功率谱密度减去所述噪声估计与所述第一信号的功率谱密度的比值来标识所述降噪系统的传递函数,其中仅从所述第二信号的功率谱密度中去除所述噪声估计;以及使用所述传递函数来标识所述降噪系统的增益。30优先权数据62分案原申请数据51INTCL权利要求书3页说明书9页附图6页19中华人民共和国国家知识产权局12发明专利申请权利要求书3页说明书9页附图6页10申请公布号CN104053092ACN104053092A1/3页21一种用于在降噪系统中估计噪声的方法,所述方法包括在第一麦克风处接收第一信号;在第二麦克。

3、风处接收第二信号;标识所述第一信号的功率谱密度和所述第二信号的功率谱密度中的归一化的差;以及使用所述差来标识噪声估计。2根据权利要求1所述的方法,其中标识所述第一信号的功率谱密度和所述第二信号的功率谱密度中的归一化的差的步骤使用下述方程,其中是所述第一信号的功率谱密度和所述第二信号的功率谱密度中的归一化的差,是加权因子,是所述第一信号的功率谱密度,并且是所述第二信号的功率谱密度。3根据权利要求1所述的方法,其还包括使用所述第二信号的功率谱密度减去所述噪声估计与所述第一信号的功率谱密度的比值来标识所述降噪系统的传递函数,其中仅从所述第二信号的功率谱密度中去除所述噪声估计;以及使用所述传递函数来标。

4、识所述降噪系统的增益。4一种用于在降噪系统中估计噪声的方法,所述方法包括在第一麦克风处接收第一信号;在第二麦克风处接收第二信号;标识所述第一信号与所述第二信号之间的相干性;以及使用所述相干性来标识噪声估计。5根据权利要求4所述的方法,其中标识所述相干性的步骤使用下述方程其中是所述第一信号与第二信号之间的相干性,是所述第一信号的功率谱密度,是所述第二信号的功率谱密度,并且是所述第一信号与所述第二信号的交叉功率谱密度。6根据权利要求4所述的方法,其中标识所述噪声估计的步骤使用下述方程其中是所述噪声估计,是所述第一信号与第二信号之间的相干性,权利要求书CN104053092A2/3页3是所述第一信号。

5、的功率谱密度,是所述第二信号的功率谱密度,并且是所述第一信号与所述第二信号的交叉功率谱密度。7根据权利要求4所述的方法,其还包括使用所述第二信号的功率谱密度减去所述噪声估计与所述第一信号的功率谱密度的比值来标识所述降噪系统的传递函数,其中仅从所述第二信号的功率谱密度中去除所述噪声估计;以及使用所述传递函数来标识所述降噪系统的增益。8一种用于在降噪系统中估计噪声的系统,所述方法包括第一麦克风,其被配置为接收第一信号;第二麦克风,其被配置为接收第二信号;噪声估计模块,其被配置为标识所述第一信号的功率谱密度和所述第二信号的功率谱密度中的归一化的差;并且使用所述差来标识噪声估计。9根据权利要求8所述的。

6、系统,其还包括语音增强模块,其被配置为使用所述第二信号的功率谱密度减去所述噪声估计与所述第一信号的功率谱密度的比值来标识所述降噪系统的传递函数,其中仅从所述第二信号的功率谱密度中去除所述噪声估计;并且使用所述传递函数来标识所述降噪系统的增益。10一种用于在降噪系统中估计噪声的系统,所述方法包括第一麦克风,其被配置为接收第一信号;第二麦克风,其被配置为接收第二信号;噪声估计模块,其被配置为标识所述第一信号与所述第二信号之间的相干性并且使用所述相干性来标识噪声估计。11根据权利要求10所述的系统,其中标识所述相干性的噪声估计模块使用下述方程其中是所述第一信号与第二信号之间的相干性,是所述第一信号的。

7、功率谱密度,是所述第二信号的功率谱密度,并且是所述第一信号与所述第二信号的交叉功率谱密度。12根据权利要求10所述的系统,其中标识所述噪声估计的噪声估计模块使用下述方程其中是所述噪声估计,是所述第一信号与第二信号之间的相干性,是所述第一信号的功率谱密度,权利要求书CN104053092A3/3页4是所述第二信号的功率谱密度,并且是所述第一信号与所述第二信号的交叉功率谱密度。权利要求书CN104053092A1/9页5用于双麦克风通信装置的降噪技术领域0001本发明的各种实施例大体涉及举例来说诸如在通信装置中的降噪系统。具体地,本发明的各种实施例涉及双麦克风通信装置中的降噪。背景技术0002降噪。

8、是从信号中去除噪声的过程。噪声可以是存在于信号中的任何不期望的声音。无论被处理的信号如何,降噪技术在概念上非常相似,但是所预期的信号的特征的先验知识可能意味着这些技术的实现根据信号的类型而有非常大的变化。0003所有记录装置,模拟和数字两种均具有使其易受噪声影响的特质。噪声可以是无相干性的随机噪声或白噪声,或者是由装置的机构或处理算法引入的相干噪声。0004在电子记录装置中,一种形式的噪声是由随机电子引起的嘶嘶声,受热量严重影响的随机电子偏离其指定路径。这些偏离的电子可影响输出信号的电压并且因此产生可检测的噪声。0005用于降低背景噪声的算法被用在许多语音通信系统中。移动电话和助听器具有集成的。

9、单通道或多通道算法来提高在不利环境下的语音质量。在这样的算法中,一种方法是谱减法技术,其通常需要估计不需要的背景噪声的功率谱密度PSD。不同的单通道噪声PSD估计器已被提出。用于带有两个或更多个麦克风的系统的多通道噪声PSD估计器尚未被深入研究。发明内容0006一种用于在降噪系统中管理噪声的方法、系统和计算机程序产品,包括在第一麦克风处接收第一信号;在第二麦克风处接收第二信号;标识所述第一信号和所述第二信号中的噪声估计;使用所述第二信号的功率谱密度减去所述噪声估计与所述第一信号的功率谱密度的比值来标识所述降噪系统的传递函数,其中仅从所述第二信号的功率谱密度中去除所述噪声估计;以及使用所述传递函。

10、数来标识所述降噪系统的增益。0007一种用于在降噪系统中估计噪声的方法、系统和计算机程序产品,包括在第一麦克风处接收第一信号;在第二麦克风处接收第二信号;标识所述第一信号的功率水平和所述第二信号的功率水平中的归一化的差;以及使用所述第一信号的功率水平和所述第二信号的功率水平中的差来标识噪声估计。0008一种用于在降噪系统中估计噪声的方法、系统和计算机程序产品,包括在第一麦克风处接收第一信号;在第二麦克风处接收第二信号;标识所述第一信号与所述第二信号之间的相干性;以及使用所述相干性来标识噪声估计。附图说明0009在附图中,相似的附图标记通常贯穿不同的视图指示相同的部分。附图不一定按比例绘制,代替。

11、地通常被布置在其上的重点示出本发明的原理。在下面的说明中,将参考下说明书CN104053092A2/9页6面的附图来描述本发明的各种实施例,其中0010图1是根据示意性的实施例的装置的视图;0011图2是根据示意性的实施例的装置的视图;0012图3是根据示意性的实施例的信号模型;0013图4是根据示意性的实施例的语音增强系统的框图;0014图5是根据示意性的实施例的降噪系统的框图;0015图6是根据示意性的实施例的用于在降噪系统中降低噪声的流程图;0016图7是根据示意性的实施例的用于在降噪系统中标识噪声的流程图;以及0017图8是根据示意性的实施例的用于在降噪系统中标识噪声的流程图。具体实施。

12、方式0018下面的详细说明参考附图,所述附图通过示意的方式显示了具体细节以及可在其中实践本发明的实施例。词语“示例性”在此处被用于指“用作示例、实例或示意”。此处被描述为“示例性”的任何实施例或设计不必被解释为比起其他实施例或设计来是优选或有利的。0019注意到,在本说明书中,对包括在“一个实施例”、“示例实施例”、“一实施例”、“另一实施例”、“某些实施例”、“各种实施例”、“其他实施例”、“不同实施例”、“备选实施例”等中的各种特征例如元件、结构、模块、组件、步骤、操作、特征等的提及意在指任何这样的特征被包括在本公开内容的一个或多个实施例中,并且可能是或可能不是必须在相同的实施例中被组合。。

13、0020各种实施例考虑到并且意识到用于降噪的现有算法具有高计算复杂度、高存储开销以及在估计非平稳噪声方面的困难。此外,各种实施例考虑到并且意识到能够跟踪非平稳噪声的任何现有算法仅是单通道的。但是,即使单通道算法大多也不能够跟踪非平稳噪声。0021此外,各种实施例提供了双通道噪声PSD估计器,其使用关于噪声场相干性的知识。并且,各种实施例提供了具有低计算复杂度的过程并且可将该过程与其他语音增强系统组合。0022此外,各种实施例提供了通过利用第二麦克风通道得到更稳健的噪声估计来对现有的单通道噪声抑制系统进行可升级扩展的过程。各种实施例提供了通过使用噪声场相干性的先验知识以便在扩散噪声场条件下降低不。

14、需要的背景噪声的双通道语音增强系统。0023前述内容已经相当广义地概述了不同的示意性实施例的特征和技术优点以便使下面对本发明的详细描述更好地被理解。将在下文中描述不同的示意性实施例的附加特征和优点。本领域的技术人员应理解的是,所公开的概念和具体实施例可容易地被用作修改或重新设计用于实现不同示意性实施例的相同目的的其他结构或过程的基础。本领域的技术人员还应意识到的是,这样的等效构造并不背离如随附权利要求所阐述的本发明的精神和范围。0024图1是根据示意性的实施例的装置的视图。装置2是带有麦克风4和6的用户设备。装置2可以是通信装置、移动电话或带有麦克风的某些其他合适的装置。在不同的实施例中,装置。

15、2可具有更多或更少的麦克风。装置2可以是智能手机、平板型个人电脑、头说明书CN104053092A3/9页7戴式耳机、个人电脑或使用麦克风来接收声音的某些其他类型的合适的装置。在这个实施例中,麦克风4和6被显示为大约相隔2CM。但是,可以在其他实施例中将所述麦克风布置在各种距离上。此外,麦克风4和6以及其他麦克风可被布置在装置2的任何表面上或者可以被无线连接并且远程定位。0025图2是根据示意性的实施例的装置的视图。装置8是带有麦克风10和12的用户设备。装置8可以是通信装置、移动电话或带有麦克风的某些其他合适的装置。在不同的实施例中,装置8可具有更多或更少的麦克风。装置8可以是智能手机、平板。

16、型个人电脑、头戴式耳机、个人电脑或使用麦克风的某些其他类型的合适的装置。在这个实施例中,麦克风10和12大约相隔10CM。但是,可以在其他实施例中将所述麦克风定位在各种距离和位置上。此外,麦克风10和12以及其他麦克风可被布置在装置8的任何表面上或者可以被无线连接并且远程定位。0026图3是根据示意性的实施例的信号模型。信号模型14是双通道信号模型。两个麦克风信号XPK和XSK是双通道语音增强系统的输入并且通过信号模型14与纯净的语音SK以及加性背景噪声信号N1K和N2K相关,其具有离散时间指数K。源与麦克风之间的声传递函数由H1EJ和H2EJ来表示。由带有频率变量F和采样频率FS的2F/FS。

17、给出归一化的角频率。每个麦克风处的源分别是S1K和S2K。一旦噪声被加入源,其被每个麦克风拾取为XPK和XSK,此处也分另被称为X1K和X2K。0027图4是根据示意性的实施例的语音增强系统的框图。语音增强系统16是双通道语音增强系统。在其他实施例中,语音增强系统16可具有多于两个的通道。0028语音增强系统16包括分段加窗单元18和20。分段加窗单元16和18将输入信号XPK和XSK分割为长度为L的重叠帧。此处,XPK和XSK也可被称为X1K和X2K。分段加窗单元16和18可应用汉宁窗HANNWINDOW或其他合适的窗。在加窗之后,时频分析单元22和24将长度为M的帧变换至短期谱域。在一个或。

18、多个实施例中,时频分析单元22和24使用快速傅里叶变换FFT。在其他实施例中,可使用其他类型的时频分析。对应的输出谱由XP,和XS,表示。离散的频率槽和帧指数分别由和表示。0029噪声功率谱密度PSD估计单元26计算频域语音增强系统的噪声功率谱密度估计噪声功率谱密度估计可通过使用XPK和XSK或在频域内通过XP,和XS,来计算。噪声功率谱密度也可被称为自功率谱密度。0030谱增益计算单元28计算谱加权增益G,。谱增益计算单元28使用噪声功率谱密度估计以及输出谱XP,和XS,。0031通过系数XP,与谱加权增益G,相乘给出增强谱逆时频分析单元30对应用快速傅里叶逆变换,并且进而通过重叠相加单元3。

19、2应用重叠相加来产生增强的时域信号逆时频分析单元30可使用快速傅里叶逆变换或某些其他类型的逆时频分析。0032应注意到的是,借助滤波器组均衡器或使用任何种类的分析或合成滤波器组在时域内进行滤波也是可能的。0033图5是根据示意性的实施例的降噪系统的框图。降噪系统34是这样的系统其中说明书CN104053092A4/9页8一个或多个装置可通过麦克风接收信号用于处理。降噪系统34可包括用户设备36、语音源38和多个噪声源40。在其他实施例中,降噪系统34包括多于一个的用户设备36和/或多于一个的语音源38。用户设备36可以是图2的用户设备8和/或图1的用户设备2的一种实现的一个示例。0034语音源。

20、38可以是期望的可听见的源。该期望的可听见的源是产生所期望的可听信号的源。例如,语音源38可以是同时对第一麦克风42和第二麦克风44说话的人。相反,多个噪声源40可以是不期望的可听见的源。多个噪声源40可以是背景噪声。例如,多个噪声源40可以是汽车引擎、风扇或其他类型的背景噪声。在一个或多个实施例中,与第二麦克风44相比,语音源38可更接近第一麦克风42。在不同的有利实施例中,语音源38可与第一麦克风42和第二麦克风44等距,或者接近于第二麦克风44。0035语音源38和多个噪声源40发出音频信号,其分别作为组合信号的一部分被第一麦克风42和第二麦克风44同时或以一定的时延接收,所述时延是由源。

21、与第一麦克风42和源与第二麦克风44之间不同的声波传播时间所引起的。第一麦克风42可以第一信号46的形式接收组合信号的一部分。第二麦克风44可以第二信号48的形式接收组合信号的一部分。0036用户设备36可被用于接收来自人的语音,并且进而将该语音传送至另一件用户设备。在语音接收期间,也可从多个噪声源40接收不需要的背景噪声。多个噪声源40形成第一信号46和第二信号48的可能是不期望的声音的部分。从多个噪声源40产生的背景噪声可能是不期望的并且降低了语音的质量和清晰度。因此,降噪系统34提供了降低和/或去除由第一麦克风42和第二麦克风44接收的背景噪声的系统、方法和计算机程序产品。0037背景噪。

22、声的估计可被标识并且用于去除和/或降低不期望的噪声。位于用户设备36中的噪声估计模块50通过使用功率水平均一PLE算法来标识第一信号46和第二信号48中的噪声估计52,所述PLE算法利用第一麦克风42与第二麦克风44之间的功率谱密度差。该方程为0038方程10039其中,是第一信号46的功率谱密度54和第二信号48的功率谱密度56中的归一化的差52,是加权因子,X1X1,是第一信号46的功率谱密度54,并且X2X2,是第二信号48的功率谱密度56。X1X1,和X2X2,可分别表示X1K和X2K。在不同的实施例中,在方程1中可以取或可以不取绝对值。0040归一化的差52可以是功率水平X1X1,与。

23、X2X2,的相对于X1X1,与X2X2,之和的差。第一信号46和第二信号48可以是来自不同源的不同音频信号和声音。功率谱密度54和功率谱密度56可以是与平稳随机过程关联的频率变量的正实函数,或者是时间的确定性函数,其具有每赫兹HZ功率或每赫兹能量的尺度。功率谱密度54和功率谱密度56也可被称为信号的谱。功率谱密度54和功率谱密度56可测量随机过程的频率含量并且帮助标识周期性。0041不同的实施例考虑到不同的条件。例如,一个或多个实施例考虑到多个噪声源40产生均匀的噪声,其中噪声功率水平在两个通道上相等。在那些实施例中,噪声是相干的还说明书CN104053092A5/9页9是扩散的是不相关的。在。

24、其他实施例下,噪声是相干或是扩散的可以是相关的。0042在各种输入F,所述方程将具有不同的结果。例如,当仅存在扩散背景噪声时,由于输入功率水平几乎相等,因此,将接近于0。因此,在第一麦克风42处的输入可以被用作噪声PSD。其次,就仅存在纯语音并且第二麦克风44中的语音的功率与第一麦克风42相比非常低的情况而言,的值将接近于1。结果,对最后一帧的估计将被保持。当输入处于上文所示的这两个极值之间时,使用第二麦克风44的噪声估计将被用作噪声估计52的近似。基于指定范围53使用不同的方法。指定范围53处在MIN与MAX之间。在下面的方程中显示了三种不同的方法,取决于归一化的差52落在指定范围53的哪里。

25、0043如果,MIN,那么使用,0044方程11其中|X1|2,是第一信号46与第二信号48的交叉功率谱密度58。0045如果,MAX,那么使用,0046在不同的实施例中,可采用其他方法,其也在语音存在的周期中起作用。0047如果MIN,MAX,那么使用,0048方程120049其中X1是信号X1K的时域系数并且X2是信号X2K的时域系数。0050固定值或适应值可被用于MIN、MAX和。项可以是噪声估计52。在方程11和方程12中的值可以不同或相同。项可被定义为离散帧指数。项可被定义为离散频率指数。项可被定义为平滑因子。0051在语音处理应用中,可将语音信号分割为帧。这些帧进而被变换至频域、短。

26、时谱X1。为了得到对信号的功率谱的更可靠的测量,在连续的帧上对短时谱递归地进行平滑。随时间进行平滑提供了方程1315中的PSD估计。0052在某些实施例中,在短期谱域中实现所述方程,并且借助于根据下述方程的离散短时估计来递归地估计方程1中所要求的PSD项。0053方程130054方程14以及0055方程150056其中是固定的或适应的平滑因子并且01,并且表示复共轭。0057此外,在不同的实施例中,与备选的单通道或双通道噪声PSD估计器的组合也是可能的。根据估计器,这种组合可基于最小值、最大值或任何种类的平均值、按频带和/或是由频率决定的组合。0058在一个或多个实施例中,噪声估计模块50可使。

27、用用于标识噪声估计52的另一系统和方法。噪声估计模块50可标识第一信号46与第二信号48之间的相干性60,进而使用相干性60来标识噪声估计52。0059不同的示意性实施例意识到并且考虑到当前方法使用基于噪声场相干性的针对说明书CN104053092A6/9页10语音PSD的估计器,所述噪声场相干性被导出并且并入维纳滤波器规则以降低扩散背景噪声。一个或多个示意性实施例为采用任何谱噪声抑制规则的通用应用提供了噪声PSD估计。由下述方程在频域中定义第一信号46与第二信号48之间的复相干性。0060方程20061在不同的示意性实施例中,当来自图3的噪声源N1K和N2K与来自图3的语音信号SK不相关时,。

28、在语音增强系统的输入XPK和XSK处的自功率谱密度和交叉功率谱密度读出为0062X1X1SSN1N2;0063X2X2SSN2N2;以及0064X1X2SSN1N2,0065其中SSS1S1S2S2,并且其中SS是语音的功率谱密度,N1N1是第一麦克风42处的噪声的自功率谱密度,N2N2是第二麦克风44处的噪声的自功率谱密度,并且N1N2是两个麦克风处的噪声的交叉功率谱密度。0066当被应用于方程2时,语音信号的相干性为X1X2,1。在不同的实施例中,如果声源到麦克风的距离小于临界距离,则相干性60可以接近于1。可将临界距离定义为与源相距的在其处由信号的直接路径分量所引起的声能等于由信号的混响。

29、所引起的声能的距离。0067此外,各种实施例可考虑到噪声场被表征为是扩散的,其中除了低频之外,不需要的背景噪声NMK的相干性接近于0。此外,各种实施例可考虑到均匀的扩散噪声场导致在下述方程的某些中,为了清晰起见可省略帧和频率指数和。在各种实施例中,方程2可被重新整理如下00680069其中N1N2可以是任意的噪声场模型,诸如0070在不相关的噪声场中,其中0071X1X2,或者0072在理想的均匀球状各向同性的噪声场中,其中00730074其中DMIC是在频率F和声速C下两个全方向麦克风之间的距离。0075因此,自功率谱密度可用公式表示为0076以及00770078并且,交叉功率谱密度可用公式。

30、表示为00790080其中两个自功率谱密度的几何平均为0081说明书CN104053092A107/9页110082并且交叉功率谱密度重新整理为00830084下面的方程可被写成公式00850086基于上述方程,实值噪声PSD估计为0087方程30088其中对于分母,1REN1N2,0必须被保证,例如MAX099的相干性60的上限阈值。函数RE返回其变元的实部。在不同的实施例中,可不取在方程3中所取的实部。此外,此处在任何方程中所取的任何实部都可以是可选的。此外,在不同的实施例中,不同的PSD元件可分别被均匀或非均匀地加权。0089一旦噪声估计模块50标识噪声估计52,语音增强模块62就可标识。

31、降噪系统34的增益64。增益64可以是在通过降噪系统34进行处理期间被应用于第一信号46和第二信号48的谱增益。用于增益64的方程使用两个麦克风之间的功率水平差,如下所示0090方程4,|X1X1,X2X2,|。0091当存在纯噪声时,上述方程结果为接近于0,而当存在纯语音时,得到大于0的绝对值。此外,不同的实施例可使用另一方程,如下所示0092方程5,MAXX1X1,X2X2,0。0093在方程5中,当第二信号的功率水平比第一信号的功率水平大时,功率水平差为0。这个实施例意识到并且考虑到第二麦克风44处的功率水平不应比第一麦克风42处的功率水平高。然而,在某些实施例中,可能期望的是使用4。例。

32、如,当两个麦克风与语音源38等距时。0094使用上述方程,增益64可被计算为0095方程60096其中H,是第一麦克风42与第二麦克风44之间的传递函数66,是噪声估计52,是加权因子,是归一化的差52,并且G,是增益64。0097在没有语音的情况下,语音源38没有输出,将为0并且因此增益64将为0。当存在没有噪声的语音时,多个噪声源40没有输出,方程6的分母的右边部分将为0,并且相应地,该分数将变成1。0098语音增强模块62可使用第二信号48的功率谱密度56减去噪声估计52与第一信号46的功率谱密度54的比值67来标识传递函数66。仅从第二信号48的功率谱密度56中去除噪声估计52。传递函。

33、数66如下被计算0099方程70100其中H,是传递函数66,0101X1X1,是第一信号46的功率谱密度54,0102X2X2,是第二信号44的功率谱密度56,并且0103是噪声估计54,此处其也可被称为NN,。说明书CN104053092A118/9页120104在其他实施例中,传递函数66可以是另一方程,如下所示0105方程80106在这种情况下,当语音低时,分子和分母两者均收敛为接近0。0107此外,不同的有利实施例使用降低乐音量的方法。例如,在不同的实施例中,类似于对H,的估计起作用的判决指向方法的程序可如下被使用0108方程90109以及0110方程100111其中此处在不同的方程。

34、中可以是不同的值。0112此外,在频率上进行平滑的方法可进一步降低乐音量。此外,在不同的实施例中,增益平滑可仅在一定的频率范围之上进行。在其他实施例中,可不对任何频率或对所有频率应用增益平滑。0113此外,用户设备34可包括一个或多个存储元件例如存储元件24以用于存储将在实现与如此处所概述的应用管理关联的操作时被使用的信息。这些装置还可将信息保持在任何合适的存储元件例如随机存取存储器RAM、只读存储器ROM、现场可编程门阵列FPGA、可擦除可编程只读存储器EPROM、电可擦除可编程ROMEEPROM等、软件、硬件中或者保持在任何其他合适的组件、装置、元件或对象中,基于具体需要被保持在适当的地方。

35、。此处所讨论的任何存储器或存储项应被解释为涵盖在如此处在本说明书中所使用的广义术语“存储元件”之内。0114在不同的示意性实施例中,可通过编码在一个或多个有形介质中的逻辑来实现此处所概述的用于降低和估计噪声的操作,所述有形介质可包括非暂时性的介质例如在ASIC中提供的嵌入式逻辑、数字信号处理器DSP指令、潜在地包括由处理器或其他类似机器执行的目标代码和源代码的软件等。在这些实例的某些中,一个或多个存储元件例如存储元件68可以存储用于此处所描述的操作的数据。这包括能够存储软件、逻辑、代码或被执行以实现在本说明书中所描述的活动的处理器指令的存储元件。0115此外,用户设备36可包括处理元件70。处。

36、理器可执行任何类型的与数据关联的指令来完成此处在本说明书中所详述的操作。在一个实例中,处理器如图5所示可将元件或项目例如数据从一种状态或情况变换为另一种状态或情况。在另一示例中,可用固定逻辑或可编程逻辑例如由处理器执行的软件/计算机指令来实现此处所概述的活动,并且此处所标识的元件可以是某些类型的可编程处理器、可编程数字逻辑例如FPGA、EPROM、EEPROM或包括数字逻辑、软件、代码、电子指令,闪存,光盘、CDROM、DVDROM、磁卡或光卡、适于存储电子指令的其他类型的机器可读介质的ASIC或者它们的任何合适的组合。0116此外,用户设备36包括提供用于与其他装置进行通信的通信单元70。通。

37、信单元70可通过使用物理通信链路和无线通信链路两者中的任何一个或者使用这两者来提供通信。0117在图5中对降噪系统34的示意并不意味着暗示对可以其来实现不同的示意性实说明书CN104053092A129/9页13施例的方式的物理或构架上的限制。可使用除所示出的组件之外的和/或代替所示出的组件的其他组件。某些组件在某些示意性的实施例中可以是不必要的。并且,各个块被呈现以示出某些功能组件。这些块中的一个或多个当在不同的有利实施例中被实现时可被组合和/或被分成不同的块。0118图6是根据示意性的实施例的用于在降噪系统中降低噪声的流程图。可在来自图5的降噪系统34中实现过程600。0119过程600开。

38、始于用户设备在第一麦克风处接收第一信号步骤602。并且,用户设备在第二麦克风处接收第二信号步骤604。步骤602和604可以任何顺序或同时地发生。用户设备可以是通信装置、膝上型电脑、平板型个人电脑或使用麦克风的任何其他装置。0120然后,噪声估计模块标识第一信号和第二信号中的噪声估计步骤606。噪声估计模块可标识第一信号的功率谱密度和第二信号的功率谱密度中的归一化的差并且基于该归一化的差在指定范围之下、之内还是之上来标识噪声估计。0121接着,语音增强模块使用第二信号的功率谱密度减去噪声估计与第一信号的功率谱密度的比值来标识降噪系统的传递函数步骤608。仅从第二信号的功率谱密度中去除噪声估计。。

39、最后,语音增强模块使用传递函数来标识降噪系统的增益步骤610。其后,该过程终止。0122图7是根据示意性的实施例用于在降噪系统中标识噪声的流程图。可在来自图5的降噪系统34中实现过程700。0123过程700开始于用户设备在第一麦克风处接收第一信号步骤702。并且,用户设备在第二麦克风处接收第二信号步骤704。步骤702和704可以任何顺序或同时地发生。用户设备可以是通信装置、膝上型电脑、平板型个人电脑或使用麦克风的任何其他装置。0124然后,噪声估计模块标识第一信号的功率谱密度和第二信号的功率谱密度中的归一化的差步骤706。最后,噪声估计模块使用所述差来标识噪声估计步骤708。其后,该过程终。

40、止。0125图8是根据示意性的实施例的用于在降噪系统中标识噪声的流程图。可在来自图5的降噪系统34中实现过程800。0126过程800开始于用户设备在第一麦克风处接收第一信号步骤802。并且,用户设备在第二麦克风处接收第二信号步骤804。步骤802和804可以任何顺序或同时发生。用户设备可以是通信装置、膝上型电脑,平板型个人电脑或使用麦克风的任何其他装置。0127然后,噪声估计模决标识第一信号与第二信号之间的相干性步骤806。最后,噪声估计模块使用所述相干性来标识噪声估计步骤808。其后,该过程终止。0128不同的所描绘的实施例中的流程图和框图示出了装置、方法、系统和计算机程序产品的某些可能的。

41、实现的构架、功能和操作。就这点而言,流程图或框图中的每个块可表示模块、分段或者计算机可用或可读的程序代码的部分,其包括用于实现指定的一个或多个功能的一个或多个可执行指令。在某些备选的实现中,在所述块中提到的一个或多个功能可不按图中所指明的顺序发生。例如,在某些情况下,连续显示的两个块可大体上同时被执行,或者各个块有时可以相反的顺序来执行,这取决于所涉及的功能。说明书CN104053092A131/6页14图1图2说明书附图CN104053092A142/6页15图3图4说明书附图CN104053092A153/6页16图5说明书附图CN104053092A164/6页17图6说明书附图CN104053092A175/6页18图7说明书附图CN104053092A186/6页19图8说明书附图CN104053092A19。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1