主动话音抵消的方法和系统 【技术领域】
本发明涉及主动话音抵消的方法和系统。本发明特别适用于,但不限于,办公室等区域中的主动话音抵消,在所述区域中某人的电话呼叫可以被听到,或者混入相同环境中其它人的电话呼叫中。
背景技术
人们彼此讲话时或者是面对面或者是通过电话等设备。讲话时遇到的问题是话音不是单向的,并且往往在所有方向上扩散。因此,人们经常面对其讲话被周围其它人无意听到的困窘情况,此时不希望其讲话被他人无意听到或者当其它人不希望被讲话干扰。典型的例子是在开放式办公环境中,其中一个隔间中的某人不能避免无意听到隔壁隔间的对话,不管隔间主人是否希望如此。在不太正式的环境中,例如在公众交通环境中,也有相同的问题,其中一个乘客使用移动电话会使其周围的乘客感到厌烦。
主动噪声抵消是已知的技术,其目标是通过引入附加的电子方式产生的声场来″抵消″不希望的声音。此技术可以限制某个频率范围内的声波,或者减弱某一距离内地声波。虽然消声的思路可以追溯到60年以前,然而商业上的实现实际上仅限于某些只需要抵消单频或窄带噪声的非常特殊的情况。这些应用主要集中在工业噪声控制领域。例如,人们知道使用具有谐波的50Hz窄带信号抵消变压器的噪声。
【发明内容】
在本说明书和权利要求书中,术语″包括″或类似术语被用来表示非排它性的包含,使得包括一组单元的方法或装置不仅包含那些单元,而且可以包含未列出的其它单元。
根据本发明的一个方面,提供一种方法,用于降低来自第一位置的、可以在远离第一位置的第二位置上听到的第一声音的电平。该方法包括:根据第一声音在第一位置产生基准声音信号并且根据基准声音信号产生消声信号,在第三位置发出对应于消声信号的第二声音并且在第二位置根据接收的第一和第二声音的组合产生误差声音信号。还根据误差声音信号产生消声信号,使得在第二位置接收的第二声音至少部分地抵消在第二位置接收的第一声音。第一声音是频率范围在50到10000HZ内的宽频声音,并且最好是话音或音乐。
根据本发明的第二方面,提供一种方法,用于降低来自第一位置的、在远离第一位置的第二位置上可以听到的第一声音的电平。该方法包括:在第三位置产生消声信号并发出对应于消声信号的第二声音;在第二位置根据接收的第一和第二声音的组合产生误差声音信号。生消声信号的产生基于误差声音信号,使得在第二位置接收的第二声音至少部分地抵消在第二位置接收的第一声音。第一声音是频率范围在50到10000HZ内的宽频声音,并且最好是话音或音乐。
根据本发明的第三方面,提供一种系统,用于降低来自第一位置的、在远离第一位置的第二位置上可以听到的第一声音的电平。该系统包括:用于在第一位置根据第一声音产生基准声音信号的基准话筒,和从基准话筒接收基准声音信号并且根据基准声音信号产生消声信号的语音抵消控制器。该系统还包括从语音抵消控制器接收消声信号并且在第三位置发出对应于消声信号的第二声音的控制扬声器。此外,它包括在第二位置根据接收的第一和第二声音的组合产生误差声音信号的误差话筒。语音抵消控制器被构造成根据误差声音信号产生消声信号,使得在第二位置接收的第二声音至少部分地抵消在第二位置接收的第一声音。第一声音是频率范围在50到10000HZ内的宽频声音,并且最好是话音或音乐。
根据本发明的第四方面,提供一种系统,用于降低来自第一位置的、在远离第一位置的第二位置上可以听到的第一声音的电平的系统。该系统包括用于产生消声信号的语音抵消控制器,和从语音抵消控制器接收消声信号并且在第三位置发出对应于消声信号的第二声音的控制扬声器。它还包括在第二位置根据接收的第一和第二声音的组合产生误差声音信号的误差话筒。语音抵消控制器可以根据误差声音信号产生消声信号,使得在第二位置接收的第二声音至少部分地抵消在第二位置接收的第一声音。第一声音是频率范围在50到10000HZ内的宽频声音,并且最好是话音或音乐。
根据本发明的第五方面,提供一种自适应语音抵消控制器。控制器包括具有滤波算法的滤波器和调整滤波算法的自适应算法处理器。该控制器还包括:用于接收从来自第一位置的第一声音导出的基准信号的基准输入;输出抵消信号以产生抵消声音的抵消输出,以通过滤波器滤波输入基准信号以产生抵消信号;和接收从第一声音和抵消声音的组合导出的误差信号的误差输入。自适应算法处理器可以根据基准信号和误差信号调整滤波算法。第一声音是频率范围在50到10000HZ内的宽频声音,并且最好是话音或音乐。
根据本发明的第六方面,提供一种包括代码的软件,该代码一旦被装入处理器便允许处理器充当第五实施例的控制器。
例如,本发明覆盖了这样一种自适应噪声控制器,它被用来降低某人在第一位置发出的、在第二位置可以被无意听到的话音的音量。一个基准话筒在第一位置拾取话音并且馈送到控制器。控制器通过自适应格型滤波算法产生消声信号,消声信号导致第三位置上的扬声器发出要用来抵消第二位置某人的话音第二声音。误差话筒拾取第二位置上第一和第二声音的残留噪声,向控制器提供误差信号作为反馈。第二声音的音量也可以被第一位置的基准话筒拾取。
【附图说明】
为了方便理解和实施本发明,现在参照附图描述示例性的优选实施例,其中:
图1是基于本发明的一个实施例的主动语音抵消系统的结构的示意图;
图2是图1主动语音抵消系统的系统框图;
图3是图2系统一部分的示意图;
图4是图3滤波器的详细示意图;
图5的流程图示出了滤波回归信号的生成;
图6表示使用不同主动算法进行话音抵消的比较结果;
图7表示多音的主动抵消;而
图8的图表示话音的主动抵消。
【具体实施方式】
在所有附图中,同样的附图标记被用来表示相同的单元。
参照图1,其中图解示出了基于本发明实施例的结构的示意图。在第一位置12的人10(第一声源)正在对着其桌面上的电话讲话,其间产生第一讲话声音14(谈话过程中的他这一侧)。在第二位置18处的一组人16位于可以听到对着电话讲话的人10的声音的收听距离内。控制扬声器20形式的第二声源位于第三位置22上,并且产生导向第二位置18的第二抵消声音24。3个位置彼此远离,虽然第二和第三位置与第一位置相比彼此更加接近。
第一基准话筒26被置于第一位置12,在这种情况下,位于电话内部,虽然也可以位于其它位置,例如在桌面上。它根据第一声音14产生基准信号。该基准信号被自适应语音抵消控制器28接收。第二误差话筒30被置于第二位置18,并且根据在第二位置18接收的话音和抵消声音的组合产生误差信号。 误差信号也被传递到自适应语音抵消控制器28。扬声器20根据消声信号产生抵消声音24,其中所述消声信号由自适应语音抵消控制器28根据基准和误差信号产生。
在这个结构中,来自人10的讲话声音14到达第二位置18,在行程中经过空气、回声和环境的其它方面已被衰减。系统的目标是在第二位置18抵消或降低该声音,使得人群16不能听到它,或者使受其打扰的程度降低。这个相同的讲话声音14还在第一位置12处被基准话筒26以非衰减的方式拾取,并且被传递到产生消声信号的自适应语音抵消控制器28。这导致扬声器20发出抵消声音24,抵消声音24也到达第二位置18,并且在其间被衰减。
在第二位置18处,误差话筒30接收衰减的话音和抵消声音,并且根据残留噪声产生误差信号。这被反馈到自适应语音抵消控制器28,而自适应语音抵消控制器28调整消声信号以便得到最优的话音抵消。理想情况下,抵消声音和讲话声音会在第二位置18上彼此完全抵消,从而没有从误差话筒30向自适应语音抵消控制器28返回误差信号。
图2是图1的主动语音抵消系统的系统的框图,如图2所示,图1的这个结构可以被近似看作穿过不同通道的若干信号,这些通道以不同方式变换信号。
讲话声音14可以被视作人10产生的具有时间索引n的第一信号s(n)。第一和第二位置之间讲话声音14的衰减相当于第一信号穿过第一声波传播通道32,其作用相当于具有脉冲响应函数H1(z)的第一滤波器。于是,到达第二位置的讲话声音是初级噪声,初级噪声可以被视作初级噪声信号d(n),其中
d(n)=H1(z)*s(n)
(*是卷积计算)。
抵消声音24可被视作扬声器20发出的第二信号c(n)。第三和第二位置之间抵消声音24的衰减相当于第二信号穿过第二声波传播通道34,其作用相当于具有脉冲响应函数H2(z)的第二滤波器。于是,到达第二位置的抵消声音是次级噪声,次级噪声可以被视作次级噪声信号g(n),其中:
g(n)=H2(z)*c(n)
初级噪声和次级噪声被误差话筒30拾取为初级和次级噪声信号d(n)和g(n),以产生误差信号e(n),其中:
e(n)=d(n)+g(n)=H1(z)*s(n)+H2(z)*c(n)
被反馈给控制器28。
基准话筒26也拾取第一信号s(n)形式的讲话声音14。然而它不是唯一到达基准话筒26的声音。另外,类似于讲话声音14到达第二位置18的方式,某些来自扬声器20的抵消声音到达第一位置12并且被基准话筒26拾取。
第三和第一位置之间抵消声音24的衰减相当于第二信号穿过第三声波传播通道36,其作用相当于具有脉冲响应函数H3(z)的第三滤波器。于是,到达第三位置的抵消声音是第三级噪声,第三级噪声可以被视作第三级噪声信号t(n),其中:
t(n)=H3(z)*c(n)
讲话声音和第三级噪声分别被基准话筒26拾取作为第一信号s(n)和第三级噪声信号t(n),以产生基准信号x(n),其中:
x(n)=s(n)+t(n)=s(n)+H3(z)*c(n)
被转发给控制器28。由于它是对s(n)的衰减版本的响应的衰减版本,t(n)的电平通常远小于s(n)的电平。
控制器28产生消声信号y(n),消声信号y(n)作为抵消声音24被发出,相当于第二信号c(n)。由于没有其它到扬声器20的输入,因此
c(n)=y(n)
在产生消声信号y(n)时,控制器28的目的是抵消第三位置的初级噪声信号d(n)。于是,从扬声器到达第三位置的声音应当是具有相同量级的d(n)的反置(reverse)。因此,初级噪声信号d(n)可以被称作期望信号。如果要实现完全消声,则误差信号e(n)会为零。然而,由于在控制器接收和处理基准信号x(n)时总会有一些时间滞后,在信号随时间变化时不可能达到完全消声,就象在对话中那样。因此目标是保持e(n)最小。
在图3中更详细地示出了控制器28。它包括自适应滤波器42,该滤波器42以基准信号x(n)为其输入并且具有脉冲响应Hc(z)。基准信号x(n)还分流到正向路径模型44中,正向路径模型44的作用相当于具有脉冲响应函数H′2(z)的滤波器,脉冲响应函数H′2(z)近似于正向路径34中的脉冲响应函数H2(z)。因此正向路径模型44的输出p(n)为:
p(n)=H′2(z)*x(n)
它被输入到自适应算法处理器46。误差信号e(n)也被输入到处理器46,处理器46根据p(n)和e(n)产生对自适应滤波器42中的滤波系数的适配。
通常针对诸如主动噪声抵消的问题定义自适应滤波器,其中滤波器输出是对期望信号的估测。然而,在控制应用中,自适应滤波器充当控制器,控制包括激励器和放大器等的动态系统。在这种情况下,估测(反噪声或反相波)可以被视作来自动态系统,即来自正向路径34的输出信号g(n)。
本实施例使用格型自适应IIR(立即脉冲响应)滤波算法。其优点是针对由具有较大功率差异的窄带分量(例如语音信号)组成噪声,可得到相对快速的收敛。用于自适应格型IIR滤波的标准梯度格型算法(例如:P.A.Regalia在由Marcel Dekker公司出版的″Adaptive IIR Filtering in SignalProcessing and Control″中描述的)受限于大规模计算和存储负载要求,这使得在实时系统中的实现更加困难和昂贵。
在传统格型IIR滤波器中,假定得到对应于旋转参数的滤波回归系数需要M个附加格型滤波器,则对于计算和存储,复杂度的量级为M2。然而,其它可能的主动噪声控制算法(例如:FXLMS、FULMS和FVLMS)均只需要M阶计算和存储,并且易于通过DSP编程实现。
在沿着具有优化的抽头参数{vk}的降低误差水平检查对应于旋转参数的滤波回归信号{θk}的特性之后,可以导出M阶复杂度的部分梯度算法。推导类似于上述Regalia的著作中发现的推导,其中没有考虑到抵消路径传递函数。
因此,本实施例使用自适应格型形式IIR滤波结构的简化算法,其收敛结果优于传统的FULMS和FVLMS,并且没有增加计算和存储负载。
图4更详细地示出了图3的滤波器42。图中示出的通常是M阶滤波器,虽然在这个实施例中M=3。入站信号顺序通过若干旋转滤波器,并且接着沿相反方向返回。在返回时,在旋转滤波器之间抽取信号,并且信号并行通过若干抽头滤波器,累加结果信号以提供输出y(n)。
自适应算法处理器46中的算法确定滤波系数,不断地调整和更新它们。相关算法是:
vk(n+1)=vk(n)-μe(n)·Bk(z)H′2(z)×(n),k=0,1,...,M
θk(n+1)=θk(n)-μe(n)·γkBk-1(z)Hc(z)H′2(z)×(n)k=0,1,...,M
理想情况下,会使用H2(z),但实际不可能如此,所以使用H′2(z)。
图5示出了说明必要的滤波回归信号的生成的流程图,而对应的算法如下所示。
输入参数:
·格型滤波器的阶M
·更新步长μ
·假定IIR滤波器形式的抵消路径传递函数H′2(z)具有前馈权重aw0,...,awN和反馈权重bw1,...,bwL。
初始化:
·所有滤波系数和状态被设置成0。
在时间n可得到:
·滤波系数:
抽头参数vk(n),k=0,1,...,M;
旋转参数θk(n),k=1,...,M。
·滤波器状态:
bk(n-1),k=0,1,...,M-1;
·后置滤波器状态:
x(n-k),k=1,...,N;
c(n-k),k=1,...,M;
yc(n);
bck(n-1),k=0,1,...,M-1;
byk(n-1),k=0,...,M-1.
·新数据:
x(n)(基准信号)
e(n)(误差信号)
格型滤波器计算:
·令fM(n)=x(n)
·对k=M,M-1,...,1做0
fk-1(n)bk(n)=cosθk(n)-sinθk(n)sinθk(n)cosθk(n)fk(n)bk-1(n-1)]]>
结束
·b0(n)=f0(n),
·格型滤波器输出:
y(n)=Σk=0Mbk(n)υk(n)]]>
后置滤波器计算:
·令fcM(n)=c(n),其中
c(n)=Σi=0Nawi(n)x(n-i)+Σj=1Lbwi(n)c(n-j)]]>
·对k=M,M-1,...,1做
fck-1(n)bck(n)=cosθk(n)-sinθk(n)sinθk(n)cosθk(n)fck(n)bck-1(n-1)]]>
结束
·bc0(n)=fc0(n)。对应于vk的滤波回归信号为bck(n)。
滤波器回归:
·令γM=1.
·对k=M,M-1,...,1做
对应于θk的滤波回归信号:
bθk(n)=-γkbyk-1(n)
γk-1=γkcosθk(n)
结束
滤波系数更新:
vk(n+1)=vk(n)-μe(n)bck(n)
θk(n+1)=θk(n)-μe(n)bθk(n)
测试:
对k=1,...,M做
如果|θk(n+1)|>π/2设θk(n+1)=θk(n)
结束
后置滤波器计算:
yc(n)=Σk=0Mbck(n)υk(n)]]>
·令fyM(n)=yc(n),其中
·对k=M,M-1,...,1做
fyk-1(n+1)byk(n+1)=cosθk(n+1)-sinθk(n+1)sinθk(n+1)cosθk(n+1)fyk(n)byk-1(n-1)]]>
结束
·by0(n)=fy0(n)。
虽然这个是针对自适应格型IIR滤波器修改的算法,然而可以使用标准算法,但是计算要求更高。
自适应算法的一个可选方案是使用标准格型形式自适应IIR滤波算法。另一个可能性是通过基于LMS的算法,例如滤波x的LMS算法,该算法适于主动控制应用。它是从LMS算法发展而来的,其中滤波器输出y(n)和估测g(n)之间的动态系统模型,即正向路径34被引入到输入信号x(n)和适配滤波器42的系数向量的算法之间,其中对于滤波x的LMS算法的滤波器42是FIR滤波器。
这种算法不使用旋转滤波器。滤波系数更新只是:
vk(n+1)=vk(n)+μp(n)e(n)
由于正向路径模型44使用正向路径的脉冲响应估测,正向路径模型44的输出p(n)是近似值,正向路径估测和真实正向路径之间的差值影响算法的稳定性和收敛速率。然而算法对正向路径估测的误差是强壮的。
可以引入主频率上对应于正向路径的时间延迟。
基于LMS的可选算法包括FULMS和FVLMS。然而格型算法是优选的。图6提供了建议的简化梯度格型算法(下线),FVLMS算法(中线)和FVLMS算法(上线)之间的模拟比较结果。x轴表示计算迭代的次数,而y轴表示dB幅度。
根据图6的结果可以发现,简化梯度格型算法的收敛优于传统自适应IIR滤波算法。注意,简化梯度格型算法不仅在控制处理开始时快速收敛,而且在控制处理收敛时具有较优的抵消结果。
图7示出了多音信号(具有大特征值分布)的抵消结果。行(1)是初始信号,行(2)是使用简化格型梯度算法的抵消结果,而行(3)是使用FVLMS算法的抵消结果。图8示出了语音信号(具有大特征值分布)的抵消结果。行(1)是初始信号,行(2)是使用简化格型梯度算法的抵消结果,而行(3)是使用FVLMS算法的抵消结果。在图7和图8中,x轴表示计算的迭代次数,而y轴表示归仪化绝对值的幅度。根据结果,当基准信号具有大特征值分布时,传统自适应控制算法出现慢速收敛的问题,这与那些算法的推导相当符合。然而,由于输入格型结构的预白化特性,格型梯度算法大大降低了对基准信号特征值分布的灵敏度,于是收敛速度非常快。另外,由于简化格型梯度算法将计算和存储负载降低到M阶,则在DSP编程实现方面没有太大的困难。
在本发明的广泛方面,控制器可以是反馈或前馈控制器,并且可以是数字或模拟的。它可以是可编程的,例如是通过使用软件实现算法和处理的DSP。有利的是,可以在大范围频段中稳定,对于语音信号,通常为50到10,000Hz。
可以提供可选实施例,其中没有基准话筒,于是信号x(n)不被馈送到控制器28。提供对初级噪声信号d(n)的逼近以作为自适应滤波器42和前向路径模型44的输入,而不是将基准信号x(n)作为输入提供到自适应滤波器42和前向路径模型44。根据与次级噪声信号g(n)或次级噪声信号的逼近累加的误差信号e(n)导出这个初级噪声逼近。这个次级噪声逼近会导致第二信号c(n)分流并通过正向路径模型(类似于正向路径模型44)。
在本发明被用于诸如开放式办公室的环境时,各隔间可以配备一个基准话筒、一个误差话筒和一个扬声器。通过实验确定各个隔间之间和各个隔间中误差话筒和扬声器之间的频率响应。不需在隔间中安装各种部件,可以在天花板上安装它们,这会减少人们听到彼此的对话的可能性,即使人们希望如此。如果隔间或区域受来自其它隔间的不止一个噪声源的影响,可以将产生的抵消信号加在一起。
在公共建筑或公共交通等地方,话筒和扬声器可以以期望的间隔设置。可以通过实验确定频率响应,例如,根据不同的拥挤程度。如果在一个基准发话人处拾取噪声,可以在发话人周围产生适当的噪声消除。
如果人们正使用移动电话,可以将其话筒用作基准话筒。然而可能需要将来自电话的语音信号提供到本地噪声消除系统,并且在具体区域内部容易确定电话的位置。
虽然所描述的实施例主要用于减少无意听到话音的可能性,然而本发明也可用于减少音乐和其它不期望的任何宽频声源(例如具有50到10000Hz内的频率范围)的噪声污染。
前面的详细描述只提供了优选实施例,对本发明的范围、适用性或构造不产生任何限制。前面对优选实施例的详细描述只是为了使本领域的技术人员能够实现本发明的优选实施例。应当理解,在不偏离所附权利要求限定的本发明的宗旨和范围的前提下,可以在单元的功能和布局上进行各种改变。