用于与自适应波束形成组合 的回声抵消的方法和设备 本发明涉及一种方法,其中多个输入信号经受自适应波束形成和自适应回波抵消的组合处理过程。
本发明也涉及一个音频处理设备,该设备包括用于提供各个输入信号的至少一个并行声道,所述声道与波束形成器通道串联连接,同时包括一个自适应波束形成器和一个用于实现自适应回波抵消的自适应回波抵消器;本发明还涉及一个通信设备,该设备存在于例如音频广播系统,音频和/或视频会议系统,例如在电话如移动电话系统中的语音增强,语音识别系统,发言者鉴权系统,语音编码器和诸如此类的系统中,该通信设备配备有这样的音频处理设备。
这样一种方法和设备可以从:1997 IEEE InternationalConference on Acoustics,Speech,and Signal Processing,Vol I,April21-24,1997,“Strategies for Combining Acoustic Echo Cancellationand Adaptive Beamforming Microphone Arrays”by WalterKellermann,pp 219-222,Munich,Germany(1997年关于声学、语音和信号处理的IEEE国际会议,第一卷,第219-222页,1997年4月21-24日,由德国慕尼黑,怀特·凯勒曼所著的“组合回声抵消和自适应波束形成的话筒阵列的策略”)中了解到。特别是描述了一个策略,其中一个普通的波束形成方法被分解成一个时不变阶段,后面跟随以一个时变阶段以便避免计算的复杂性并防止在一个回声抵消设备中发生一个时变的波束形成。这样已知的策略就受限于应用可能发生的情况。此外,它没有解决这样一个基本问题,即将回声抵消技术和自适应波束形成技术组合起来,从而使得这两项技术能够同时被应用并彼此独立,而不管它们涉及的不同适配时标。
所以本发明地一个目的是提供这样一种将回波抵消和自适应波束形成组合起来的方法和设备,其中保留这两项技术的不同优点,并且尽管使用组合技术也将其中必要的计算减到一个可接受的级别。
另外按照本发明的方法其特征在于对每个输入的信号,它们各自的自适应回波抵消数据的处理历史被保存并与当前自适应波束形成数据相组合。
因此按照本发明的通信设备即音频处理设备其特征在于该自适应回波抵消器配备有存储装置,用于存储与每个输入信号相关的、各自的自适应回波抵消数据的处理历史以便与当前自适应波束形成数据相组合。
按照本发明的方法和设备的一个优点是通过分别存储每个输入信号的自适应回波抵消数据的处理历史并通过将这个数据与当前波束形成器数据组合起来,而使这些数据的组合使用显示出回波抵消处理过程增加的准确度。特别是波束形成器被更新的系数可用于为每个单独的输入信号精确地计算回波抵消数据,该系数的变化比自适应回声抵消滤波器最大的跟踪速度还要快。这样通常非常复杂并可能包含最多几千个系数的自适应回波抵消滤波器现在实现起来更容易,而必需的计算量被极大地减少了。
按照本发明的方法的一个实施方案其特征在于组合的自适应处理被设计成使得各个输入信号中的每个输入信号流经一个并行通道,该并行通道包含一个声道和一个波束形成器通道,随后并行通道中的信号被求和且之后被处理。因此该音频处理设备的特征在于该音频处理设备被设计成使得各个输入信号中的每个输入信号流经一个并行通道,该并行通道包含一个声道和一个波束形成器通道,随后并行通道中的信号被求和且之后被处理。有利地,一个用于实现自适应处理的自适应回波抵消器只需连到并行通道的求和结束处并连接在通往和来自通信线路远端的连接之间。有利地,不需要与单个输入通道的单独连接,从而节省了处理器容量。
按照本发明的方法的另一个实施方案其特征在于自适应波束形成涉及输入信号的滤波或加权。音频处理设备相应地也具有这样的特征。
当在波束形成器中所作的适配涉及滤波时,输入信号被例如用有限脉冲响应(FIR)滤波器或无限响应滤波器(IRF)滤波。在该情况下,可以说是一个滤波求和波束形成器(FSB),然而在其中一种特殊情况下,称为加权求和波束形成器(WSB),该滤波器被实增益或衰减所代替。
音频处理设备还有另一个实施方案其特征在于自适应回波抵消器包括一个变换域自适应滤波器,例如一个时域自适应滤波器(TDAF),或一个频域自适应滤波器(FDAF)。通常按它们计算的复杂性来说,FDAF是优选的,如果使用其输入的频谱归一化的话,FDAF会表现出更快速收敛的额外的优点。
按照本发明的音频处理设备的一个优选的实施方案其特征在于自适应回波抵消器包括第一部分,用于计算至少一个扬声器的输入频谱和一部分归一化的更新数据,以及第二部分,用于实现卷积并计算回波抵消系数的更新数据。在一个特定的实施方案中,如果波束形成器的输入信号的数量增加,那么尤其为节省大量计算,第二自适应回波抵消器部分包括一个自适应求和滤波器,该滤波器具有一个输入以接收波束形成器的滤波或加权系数,该求和滤波器包括存储装置,用于存储与每个输入信号相关的、各自的自适应回波抵消数据的处理历史以便与当前自适应波束形成数据相组合。
当前按照本发明的方法、音频处理和通信设备将参考附图结合它们额外的优点被进一步阐明,图中相同的参考数字指的是相似的部分。在附图中:
图-1示出按照本发明的一个音频处理设备的一个实施方案,该音频处理设备被装备有一个用于回声抵消的自适应装置和一个用于多个输入信号的波束形成的自适应装置;
图-2示意性示出代表一个频域自适应滤波器(FDAF)的一个预处理器部分和一个后处理器部分以实现在按照本发明的音频处理设备中应用的回声抵消器装置;以及
图-3示出在图-2设备中应用的一个自适应求和滤波器的一个自适应方案,其中回波抵消滤波器系数被存储并被更新。
图-1示出一个通信设备形式的音频处理设备1,该设备包括到远端(未示出)和来自远端(未示出)的连接。来自远端的连接接收一个信号x(n)(n=...-1,0,1,...,n是采样索引)提供给来自设备1的一个扬声器2。设备1可以包含一个以上的扬声器2。设备1还包括一个并行安排的话筒3-1,3-2,3-S以提供S个输入信号z1(n),z2(n),...。zS(n)。这些输入信号被馈送给一个波束形成器4。该波束形成器4可能具有一个所谓的滤波求和波束形成器(FSB)的形式,那么它就具有滤波器脉冲响应f1,f2,...fS,或者具有一个加权求和波束形成器(WSB)的形式,该WSB是一个FSB,只是该FSB的滤波器被实增益或衰减w1,w2,...wS所代替。这些响应和增益可以连续不断地适配,也就是及时地改变。波束形成器4的一个适配控制用来控制这个适配过程。这样的波束形成器的适配能够用来例如聚焦于一个不同发言者的位置,正如从EP-A-0954850中知道的那样。适配也可以用来减少总的信噪比。在波束形成器3中被修改的信号在一个内部求和装置5中被相加从而得到输出信号z(n),之后该信号被馈送给一个外部求和设备6。
音频处理设备1还包括一个耦合在远端连接之间用于实现自适应回波抵消的自适应回波抵消装置或滤波器7。另外,来自自适应波束形成器4的瞬时或当前滤波器响应或增益/衰减被馈送给自适应回波抵消滤波器7以便使用。同样,远端输入信号x(n)被馈送给滤波器7。滤波器7在考虑当前波束形成器的系数的同时模型化具有声脉冲响应h1,h2,...hS的各个声道,这样滤波器7的一个输出信号y(n)就与输出信号z(n)的回波成分大概相等。求和设备6给远端提供一个实际上没有回声的输出信号。自适应滤波器7实现信号x(n)和它的模型化的脉冲响应模型h之间的卷积以便得到想要的信号y(n)。在本领域中已知很多算法可以计算并自适应地优化自适应滤波器7的滤波器系数h,由于需要几千个系数来实现自适应滤波器7,所以这些算法通常会很复杂。回波抵消滤波器7可以在任何合适的域中实现,特别是例如时域,或频域。如果设备1包含一个以上的扬声器那么就需要相应数量的滤波器7以便补偿那个数量的回波。
图-2示意性示出代表一个频域自适应滤波器(FDAF)的一个预处理器(上面)部分和一个后处理器(下面)部分以实现音频处理设备1中的自适应滤波器7。在预处理器中,示意性地示出扬声器的信号x(n)被串并变换(S/P)成包含B个采样的块。接下来形成一个排列,包括居先的M-B个以前的采样和这B个采样。之后对并行数据的最后M个采样执行一个实数快速傅立叶变换(FFT)从而得到由X指示的x(n)的复数谱。预处理器还包括一个归一化器用于计算由X*指示的X的复共轭谱以便最终以一种没被进一步阐述的方式得到由它的输入功率谱PXX归一化的复数谱。这样归一化的这种特别算法在此示出了独立于输入功率的一种收敛行为。
后处理器(下面)部分将复数输入频谱X乘以频域FDAF的系数H并执行反FFT。IFFT结果中的前M-B个采样被丢弃,因为这些采样是被循环卷积误差所污染的。形成信号y(n)的剩下的B个采样被从形成信号z(n)的最新B个采样中减去以生成残余信号r(n)的B个采样,这些采样被反馈回后处理器。这个信号r(n)经并串变换(P/S)之后被送给远端。接下来反馈信号前面加适当的零,被变换(FFT)到频域并和归一化复数谱相乘以提供给FDAF系数一个更新的项。最后FDAF的系数在一个更新循环8中用这个更新项来更新。如果没有可编程的滤波器被使用,那么更新循环8就包含一个时域中的约束条件。该约束条件防止发生循环卷积误差。没有该约束条件则可省去每次升级的一个FFT和一个IFFT。见US 4 903 247,它在此被包含作为参考。
更新循环8包含一个自适应求和滤波器形式的构件9,该构件在图-3中被进一步阐明。波束形成器的系数,也就是说分别被波束形成器4持续不断地修改的增益、或脉冲响应、或它们的傅立叶变换:w1,w2,...wS,或f1,f2,...fS,或F1,F2,...FS被提供给自适应滤波器7,具体是提供给示于图-2中的构件9。构件9包含S个连续的循环10-1,...10-S,这样对于S个输入信号中的每一个信号,各个至少自适应的和/或被更新的自适应回波抵消系数的处理历史被存储在延时单元Z-1中以便在自适应回波抵消处理过程中使用。求和设备15和16提供求和的当前频域FDAF的系数H(k;lB),其中k是频带或分支(bin),K=0...M-1,具有M个频域自适应滤波器的系数,以及lB是迭代索引,该索引随每B个采样实例而增加一个单位。经FFT变换和被归一化的残余信号r(n)在求和设备Sm(见图-2)中更新被求和的当前系数并将新的自适应滤波器系数H(k;lB+1)提供给求和设备11以便与上面提到的求和的当前FDAF的系数相比较。在每单个循环10-1,...10-S中,这种比较的结果在乘法器12-1,...12-S中与μ1(k)F1(k;lB)...μ1Fs(k;lB)相乘,其中μ1是步长。在求和设备13-1,...13-S中,对每个单独的信号累加该乘积。该结果以更新数据的形式在下一个迭代中被存储在存储/延时单元Z-1中。之后在乘法器14-1,...14-S中与F1(k;lB)...FS(k;lB)相乘并分别在上面提到的两个求和设备15和16中求和。总之,可以看出在这种情况下,保持最新的组合的波束形成器和回波抵消更新模型可以表示如下:
p=S
Hm(k;lB+1)=Hm(k;lB)+μ1(k)Fm(k;lB){H(k;lB+1)-∑Fp(k;lB)Hp(k;lB)} p=1m=0,...S,其中S代表波束形成器的输入/话筒的总数量;k=0,1,...M-1,其中在第lB个迭代处有M个频域自适应滤波器系数,p代表涉及的波束形成器的输入以及;其中还有:lB是迭代索引,随每B个采样实例而增加一个单位;Hm(k;lB)是在从涉及的扬声器到话筒m(或波束形成器的输入m)的声音频域变换脉冲响应的第lB个迭代处第k个自适应滤波器的系数;
μ1是步长(在下文中将被阐明);
Fm(k;lB)是在第iB个迭代期间、在第k个频带内输入m的频域自适应波束形成器滤波器(增益/衰减)的系数;
H(k;lB+1)是在第iB个迭代期间,在第k个频带内对全部输入(从扬声器到波束形成器的输出)求和的更新频域变换脉冲响应。
FSB的一个较优值是:
m=S
μ1(k)=1/∑|Fm(k;lB)|2
m=1导致对所有K来说μ1(k)=1,因为在按照EP-A-0954850的一个FSB的情况下,分母(大约)等于1。类似地在FSB的一个特殊情况下,也就是说它是WSB,则可以选择:
m=S
μ1=1/∑wm2(lB)
m=1由于同样的原因,导致μ1=1。
虽然在上面描述的这些实施方案主要参考了优选的实施方案和最好的可能方式,应理解这些实施方案决不被解释成限制涉及设备的例子,因为落入附加的权利要求的范围内的不同修改、特点和特点的组合现在都在技术人员可达到的范围内。
上面的技术可以与一项实现多个扬声器的技术相结合,这样就存在与扬声器相同数量的构件9。立体声回波抵消器也能被提供。此外一个动态回波抑制器(DES)可以与设备1的远端输出相耦合以便提供额外的回波抑制。