《用于处理音频信号的方法和音频接收电路.pdf》由会员分享,可在线阅读,更多相关《用于处理音频信号的方法和音频接收电路.pdf(36页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104158990A43申请公布日20141119CN104158990A21申请号201410200217722申请日2014051313/892,42020130513USH04M9/0820060171申请人英特尔IP公司地址美国加利福尼亚72发明人C叶姆基L勒保卢C博热昂N埃文斯74专利代理机构永新专利商标代理有限公司72002代理人王英张立达54发明名称用于处理音频信号的方法和音频接收电路57摘要本发明描述了用于处理音频信号的方法和音频接收电路,该音频信号接收方法包括经由包括第一麦克风的第一接收路径接收第一音频信号;经由包括第二麦克风的第二接收路径接收第二音频信号;。
2、并且基于所述第一音频信号和所述第二音频信号来执行所述第一音频信号的回声抑制。30优先权数据51INTCL权利要求书2页说明书20页附图13页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书20页附图13页10申请公布号CN104158990ACN104158990A1/2页21一种用于处理音频信号的方法,包括经由包括第一麦克风的第一接收路径接收第一音频信号;经由包括第二麦克风的第二接收路径接收第二音频信号;基于所述第一音频信号和所述第二音频信号来执行所述第一音频信号的回声抑制。2如权利要求1所述的方法,进一步包括经由一个或多个其它的接收路径接收一个或多个其它的音频信号,并且。
3、基于所述第一音频信号、所述第二音频信号和所述一个或多个其它的音频信号来执行所述第一音频信号的回声抑制。3如权利要求2所述的方法,其中,每一个其它的接收路径包括其它的麦克风。4如权利要求1所述的方法,其中,所述麦克风是相同通信设备的一部分。5如权利要求1所述的方法,其中,基于所述第一音频信号和所述第二音频信号来执行所述第一音频信号的回声抑制包括基于所述第一音频信号和所述第二音频信号来确定回声抑制增益并且基于所确定的回声抑制增益来执行所述第一音频信号的回声抑制。6如权利要求1所述的方法,包括基于所述第一音频信号与所述第二音频信号的比较来执行所述第一音频信号的回声抑制。7如权利要求6所述的方法,包括。
4、确定表示所述第一音频信号和所述第二音频信号之间的电平差的值并且基于所述值来执行所述第一音频信号的回声抑制。8如权利要求7所述的方法,其中,所述电平差是功率电平差、电压电平差或能量电平差。9如权利要求7所述的方法,将所述电平差与阈值进行比较并且基于比较的结果来执行所述第一音频信号的所述回声抑制。10如权利要求6所述的方法,包括基于比较的结果来检测双端通话情景。11如权利要求1所述的方法,其中,执行回声抑制包括自适应回声滤波。12如权利要求11所述的方法,其中,基于所述第一音频信号和所述第二音频信号来执行所述第一音频信号的回声抑制包括基于所述第一音频信号和所述第二音频信号来设置回声滤波的适应性。1。
5、3如权利要求1所述的方法,其中,执行回声抑制包括回声后滤波。14如权利要求1所述的方法,其中,基于所述第一音频信号和所述第二音频信号来执行所述第一音频信号的回声抑制包括基于所述第二音频信号来确定滤波器系数并且使用所述滤波器系数来对所述第一音频信号进行滤波。15如权利要求1所述的方法,其中,基于所述第一音频信号和所述第二音频信号来执行回声抑制包括基于第一接收到的音频信号和第二接收到的音频信号来确定回声抑制增益,并且基于第一接收到的音频信号和所述回声抑制增益来对回声抑制进行滤波。16一种其上具有记录的指令的计算机可读介质,所述指令在由处理器执行时使所述处理器执行根据权利要求1到15中的任意一项的用。
6、于执行无线电通信的方法。17一种音频接收电路,包括第一接收路径,包括配置为接收第一音频信号的第一麦克风;第二接收路径,包括配置为接收第二音频信号的第二麦克风;回声抑制电路,配置为基于所述第一音频信号和所述第二音频信号来执行所述第一音频信号的回声抑制。权利要求书CN104158990A2/2页318如权利要求17所述的音频接收电路,包括配置为接收一个或多个其它的音频信号的一个或多个其它的接收路径,其中,所述回声抑制电路配置为基于所述第一音频信号、所述第二音频信号和所述一个或多个其它的音频信号来执行所述第一音频信号的回声抑制。19如权利要求18所述的音频接收电路,其中,每一个其它的接收路径包括其它。
7、的麦克风。权利要求书CN104158990A1/20页4用于处理音频信号的方法和音频接收电路技术领域0001本公开涉及用于处理音频信号的方法和音频接收电路。背景技术0002在物理学中,可以将回声定义为由其周围环境中的波的反射所产生的复制。这样的现象会在语音远程通信中发生。在电话终端中,声学回声是由于扬声器和终端的麦克风之间的耦合。结果,电话的麦克风不仅包含有用的语音信号,而且还包含回声。如果没有在麦克风路径上执行处理,则回声信号以及近端语音信号被传输到远端扬声器,并且远端扬声器听到他/她自己的话音的延迟版本。当回声信号的电平为高时且当原始信号和其回声之间的延迟为高时,由于听到他/她自己的话音而。
8、产生的烦恼增加。0003为了保证良好的语音质量,可以在能够发生传输之前在麦克风路径上实现一些处理。近年大量地研究了声学回声消除算法。声学回声消除的方案可以包括自适应滤波器,后面是回声后滤波器。自适应滤波器产生声学路径的复制。这一回声路径估计然后用于估计由麦克风拾取的回声信号。实际上,自适应回声消除AEC的性能被环境噪声和/或近端语音信号的存在干扰。为了限制这样的干扰对AEC的影响,可以使用双端通话检测器DTD和/或仅噪声检测器。0004双端通话检测器可能典型地相当复杂。情景分类算法可以例如利用语音存在概率和/或信号相干性。DTD的典型使用在于在双端通话DT时段双端通话时段指代其间远端和近端扬声。
9、器都是活动的时段期间冻结AEC的适应性。然而,即使在使用DTD的情况下,一些残余回声典型地存在于自适应滤波器的输出端处。后滤波器可以用于使回声变得不可闻。回声后滤波器可以由应用于来自自适应回声消除的误差信号的衰减增益构成。为了更好的双端通话性能,能够在子带或频域中计算这一衰减。然而,单通道回声消除的性能仍然受限,特别是在免提配置中,对于免提配置,近端与回声比为低。这一受限的性能会导致在双端通话时段期间在经处理的近端语音信号中的高失真并且因此导致差的通信质量。在仅回声时段期间的回声抑制和在DT时段期间的近端语音的低电平失真之间可以产生折衷。在低的近端与回声比的情况下提高语音质量的方案可以基于用于。
10、回声处理的多个麦克风的使用。0005进而,可以使用基于波束成形方案的多通道回声消除,以便在低的近端与回声比的情况下提高语音质量。0006回声后滤波或回声抑制的有效方法仍然是期望的。发明内容0007提供一种用于处理音频信号的方法,包括经由包括第一麦克风的第一接收路径接收第一音频信号;经由包括第二麦克风的第二接收路径接收第二音频信号;并且基于所述第一音频信号和所述第二音频信号来执行所述第一音频信号的回声抑制。0008进而,提供一种根据上述方法的用于处理音频信号的音频接收电路。说明书CN104158990A2/20页5附图说明0009在附图中,类似的附图标记通常在不同的视图中指代相同的部件。附图不一。
11、定按比例绘制,相反通常强调说明本发明的原理。在下面的描述中,参照下面的附图来描述各种方面,在附图中0010图1示出了配备有一个扬声器和两个麦克风的示例。0011图2示出了具有用于换能器配置的示例的移动终端。0012图3示出了与位于如图1所述的系统的声源和换能器之间的物理交互相匹配的信号模型的示意性表示。0013图4示出了根据在HF免提模式中执行的示例性测量位于扬声器和麦克风之间的声学路径的频率响应。0014图5示出了根据在HF模式中执行的示例性测量位于人造头部的嘴部和麦克风之间的频率响应。0015图6示出了在HF模式中的示例性情景中记录的麦克风信号的光谱图。0016图7示出了说明用于处理音频信。
12、号的方法的流程图。0017图8示出了音频接收电路。0018图9示出了包括自适应滤波器部分的回声消除或抑制/处理电路,该自适应滤波器部分包括跟随有回声后滤波器的一个自适应滤波器。0019图10示出了包括自适应滤波器部分的回声消除电路,该自适应滤波器部分包括跟随有回声后滤波器的一个自适应滤波器。0020图11示出了包括双端通话检测器的误差消除电路。0021图12示出了说明标准化功率电平差PLD的值分布的图。0022图13示出了过高估计因子设置函数的给定示例的图。具体实施方式0023下面的详细描述参照通过说明的方式示出其中可以实践本发明的本公开的具体细节和方面的附图。可以利用其它方面,并且在不偏离本。
13、发明的范围的情况下,可以做出结构、逻辑和电气改变。本公开的各种方面不必是相互排他的,因为可以将本公开的一些方面与本公开的一个或多个其它方面进行组合以便形成新的方面。0024用于提高移动终端中的语音质量的方案可以包括多麦克终端的使用。多麦克风终端隐含地提供关于近端声学环境的空间信息。例如,对来自双麦克风移动终端的麦克风信号的观察表明,根据当前是否存在仅回声、双端通话或仅近端时段,存在明显的电平差。0025如下面进一步描述的,为了提高的回声消除目的,可以利用这一电平差。0026图1示出了配备有一个扬声器101和两个麦克风102、103的终端100的示例。0027术语“扬声器”可以指代耳机和免提扬声。
14、器。0028可以将麦克风观察中的一个考虑为主要观察并且将另一个麦克风观察考虑为辅助观察。如图1所示,远端扬声器话音由扬声器101播放到近端扬声器104。这一扬声器信号的一部分可以在近端环境105中反射并且可以稍后被两个麦克风102、103拾取作为回声106。扬声器101和每一个麦克风之间的耦合可以限定一个声学路径针对两个麦克风102、说明书CN104158990A3/20页6103的两个声学路径。每一个麦克风102、103具有可能的随后处理部件形成接收路径。0029麦克风102、103可以记录近端扬声器话音或语音信号107并且最终记录背景噪声108。近端扬声器话音107也可以在被麦克风102、。
15、103拾取之前在环境105中反射。因为两个麦克风102、103可能不一定被放置在相同的位置处,因此可能必须对近端扬声器和每一个麦克风之间的声学路径进行建模。应该认识到,图1并不提供麦克风的位置的限制性示例,而且麦克风102、103可以被不同地放置在终端100上。0030图2中给出了用于换能器的定位的示例。术语“换能器”指代扬声器和麦克风二者。0031图2示出了移动终端201、202。0032第一移动终端201具有底部底部配置,其中麦克风203、204都被放置在电话的底部处且距离扬声器205大致是等距的。0033第二移动终端202具有底部顶部配置,其中麦克风205、206被放置为使得一个麦克风相。
16、当接近扬声器207而另一麦克风相当远离扬声器207。0034在底部顶部配置中,将较接近扬声器207的麦克风206称为辅助麦克风,而将较远离扬声器的麦克风称为主要麦克风。应该注意,辅助麦克风和/或主要麦克风也可以布置在移动终端202的后侧处。进而,免提扬声器可以布置在移动终端201、202的后侧处。0035移动终端201、202可以是配备有一个扬声器和两个或更多个麦克风的远程通信终端。0036进而,下面的功能和方案也可以应用于也可能经历回声的其它通信设备,例如膝上型或平板计算机。0037图3中说明了双通道DC回声问题的信号模型。0038图3示出了与如在图1中描述的系统的声源和换能器之间的物理交互。
17、相匹配的信号模型的示意性表示,说明了如何对主要麦克风信号和辅助麦克风信号进行建模。0039主要麦克风信号300和辅助麦克风信号301由麦克风102、103提供,并且分别由YPN和YSN表示。信号DPN302和DSN303表示分别由主要麦克风102和辅助麦克风103拾取的回声信号。这两个信号都由扬声器101的扬声器信号XN304生成,其中HP|SN由说明扬声器101和相应的麦克风102、103之间的声学路径的卷积块305、306表示。0040信号SPN307和信号SSN308表示分别由主要麦克风102和辅助麦克风103拾取的近端语音信号。这两个信号都由近端语音信号SN309或107生成,其中GP。
18、|SN由说明近端扬声器101和主要麦克风102或辅助麦克风103之间的声学路径的卷积块310、311表示。0041主要麦克风信号YPN300由通过加和块312提供的SPN307和DPN302的和给出。辅助麦克风信号YSN301由通过加和块313提供的SSN308和DSN303的和给出。0042关于图3中的信号模型,可以导出下面的等式0043YPNGPNSNHPNXN0044YSNGSNSPHSNXN等式10045其中0046XN是扬声器信号304,0047YP|SN分别表示主要麦克风信号300或辅助麦克风信号301。它们包括回声信说明书CN104158990A4/20页7号和近端语音信号。00。
19、48HP|SN305、306表示扬声器101和主要麦克风102或辅助麦克风103之间的声学路径。0049SN309是近端扬声器信号。0050GP|SN310、311表示近端扬声器104和主要麦克风102或辅助麦克风103之间的声学路径。0051表示卷积操作。0052应该注意,在下文中,也使用附标1、2来代替P、S都作为上标和下标,这两个使用分别表示对主要麦克风和辅助麦克风或接收路径的指代。0053为了查验图3中说明的信号模型,可以执行针对耳机和免提模式二者使用双麦克风设备记录的信号的分析。将来自移动设备的记录与来自样机MOCKUP电话的记录进行比较,用于信号模型的验证和查验。0054记录的分析。
20、允许研究麦克风信号之间的电平差。可以将信号的电平测量为其幅度、能量或功率。在下文中,使用功率谱密度。在下文中,主要麦克风指代放置得距离扬声器更远,即,在仅回声时段期间具有较少功率,的麦克风。将主要麦克风和辅助麦克风的功率谱密度分别表示为和。附标K和I分别表示帧和频率二元附标。0055免提情况0056在下文中,示出了在不同的声学环境工作间、办公室、会议室中利用样机电话的脉冲响应的测量结果。样机电话配备有一个扬声器和两个麦克风。将麦克风放置在电话的相对角处。将扬声器放置为稍微靠近麦克风之一。具有嘴部模拟器的人造头部用于模拟近端扬声器。使用电话的两个不同位置一个位置是将电话放置在人造头部的嘴部正前方。
21、30CM处,另一位置是将电话放置在桌上。在所有记录中,将电话放置为使得电话的两个麦克风大致在人造嘴部的相等距离处。0057图4示出了根据针对主要麦克风的第一曲线401和针对第二麦克风的第二曲线402中的示例性测量在扬声器和麦克风之间的声学路径的频率响应。可以看到,对于每一个麦克风,由麦克风接收的扬声器信号没有被声学环境相等地衰减。这暗示在仅回声时段期间,辅助麦克风上的信号的功率将高于主要麦克风上的信号的功率。0058图5示出了根据针对主要麦克风的第一曲线501和针对第二麦克风的第二曲线502中的示例性测量在人造头部的嘴部和麦克风之间的声学路径的频率响应。可以看到,这两个频率响应非常相似。这些相。
22、似性可以由与人造头部的嘴部相比较的麦克风的位置进行解释。图4和图5一起示出0059在仅回声时段期间,主要麦克风上的信号的PSD低于辅助麦克风上的信号的PSD。0060等式20061在仅近端时段期间,这两个麦克风信号的PSD大致相等0062等式30063通过内插,可以说,在双端通话时段期间,主要麦克风功率将低于辅助麦克风功率。然而,在双端通话情况中观察到的功率电平差PLD将明显小于在仅回声中观察到的。说明书CN104158990A5/20页80064如上所述,K是时间或帧附标,而I是频率附标。0065在下文中,讨论在耳机位置中麦克风信号的工作情况。为此,考虑具有一个扬声器和如在移动终端201的情。
23、况中放置在终端的相对角处的两个麦克风的移动电话。0066图6示出了在这样的情景中记录的麦克风信号的光谱图601、602。0067高强度点指示高能量颜色越暗,在该点处的功率就越高。图6中说明的麦克风信号由跟随有仅回声时段9S到结束的仅近端时段从0到9S构成。基于光谱图601、602,可以看到下面的内容0068在仅近端时段期间,与辅助麦克风上的信号的PSD相比较,主要麦克风上的信号的PSD非常高。0069等式40070在仅回声时段期间,主要麦克风上的信号的PSD低于辅助麦克风上的信号的PSD。0071等式50072通过内插,可以看到在双端通话时段期间,主要麦克风的PSD低于辅助麦克风的PSD。然而。
24、,在双端通话情况中观察到的差值明显小于在仅回声中观察到的。0073从麦克风信号的分析中可以看到,对于免提和耳机这两种情景,在仅回声时段期间,0074等式60075这一PSD差值主要是由于终端上麦克风的位置,并且不是非常依赖于声学环境。实际上,只要使用配备有具有按照底部顶部配置放置的换能器的两个麦克风的终端,在仅回声时段中,主要麦克风的电平就将总是低于辅助麦克风的电平。将换能器按照底部顶部配置进行放置可以被看作在移动设计中引入的约束,然而这一约束仍然给设计者留下一些自由度。0076因此,对于麦克风的底部顶部配置,可以观察到下面的不同情景0077仅回声这里,作为源的扬声器接近辅助麦克风。结果是辅助。
25、麦克风电平高于主要麦克风的电平。这对于耳机和免提二者都适用。0078仅近端0079耳机近端扬声器的嘴部在主要麦克风附近。结果,主要麦克风电平高于辅助麦克风的电平。0080免提近端嘴部远离两个麦克风并且可以假设处于距离麦克风的相等距离处。典型地,这两个麦克风具有相等的电平。然而,由于HF扬声器和辅助麦克风的接近度,在仅回声时段期间,辅助麦克风电平高于主要麦克风的电平。0081双端通话通过从仅回声和仅近端功率差进行外插,可以推断出,在DT期间,取决于信号与回声比并且取决于通信终端是免提还是耳机配置,在两个麦克风之间存在电平差。然而,由于近端语音的存在,在DT期间观察到的功率差将不如在仅回声中观察到。
26、的功率差一样极端。0082在下文中,描述了用于处理音频信号的方法,可以例如基于上面描述的功率差来执行回声抑制。例如,可以使用基于不同麦克风的功率差的DT检测规则或回声抑制增益规说明书CN104158990A6/20页9则。可以将上述方案看作是基于硬件的,因为主要利用麦克风在通信终端上的位置。0083图7示出了流程图700。0084流程图700说明了用于处理音频信号的例如由音频处理电路执行的方法。0085在701,音频接收电路经由包括第一麦克风的第一接收路径接收第一音频信号。0086在702,音频接收电路经由包括第二麦克风的第二接收路径接收第二音频信号。0087在703,音频接收电路基于所述第一。
27、音频信号和所述第二音频信号执行所述第一音频信号的回声抑制。0088换句话说,基于如经由不同的接收路径接收到的音频信号的两个版本,例如借助于不同的麦克风,执行针对音频信号的回声抑制或消除。例如,双端通话检测和/或回声抑制规则可以基于经由两个接收路径接收到的音频信号,例如基于这些信号的功率电平差。0089换句话说,可以利用不同麦克风之间的电平差。可以将信号的电平测量或计算为其能量幅度或功率。例如,麦克风信号功率谱密度PSD可以用作信号电平,但是也可以使用信号能量。主要麦克风和辅助麦克风的PSD在下面的示例中分别被表示为和,其中K和I分别表示帧和频率二元附标。0090第一音频信号和第二音频信号可以分。
28、别包括期望音频信号例如,语音输入、输出信号例如,扬声器信号和噪声的组合。由第一音频信号的回声抑制产生的信号可以具有被抑制的回声例如,来自输出信号,并且可以类似于期望信号。0091该方法可以进一步包括经由一个或多个其它的接收路径接收一个或多个其它的音频信号例如,每其它的接收路径一个其它的音频信号并且基于该第一音频信号、第二音频信号以及一个或多个其它的音频信号来执行第一音频信号的回声抑制。0092例如,每一个其它的接收路径包括其它的麦克风。0093麦克风例如是相同通信设备的一部分例如,容纳诸如在图8中说明的音频处理电路800的音频处理电路。0094基于第一音频信号和第二音频信号来执行第一音频信号的。
29、回声抑制可以包括基于第一音频信号和第二音频信号来确定回声抑制增益并且基于所确定的回声抑制增益来执行第一音频信号的回声抑制。0095该方法可以包括基于第一音频信号与第二音频信号的比较来执行第一音频信号的回声抑制。0096例如,该方法包括确定表示第一音频信号和第二音频信号之间的电平差的值并且基于该值来执行第一音频信号的回声抑制。0097电平差例如是功率电平差、电压电平差或能量电平差。0098该方法可以包括将电平差与阈值进行比较并且基于比较的结果来执行第一音频信号的回声抑制。0099该方法可以包括基于比较的结果来检测双端通话情景。0100执行回声抑制例如包括自适应回声滤波。0101基于第一音频信号和。
30、第二音频信号来执行第一音频信号的回声抑制例如包括基于第一音频信号和第二音频信号来设置回声滤波的适应性。0102执行回声抑制例如包括回声后滤波。说明书CN104158990A7/20页100103基于第一音频信号和第二音频信号来执行第一音频信号的回声抑制可以例如包括基于第二音频信号来确定滤波器系数并且使用该滤波器系数来对第一音频信号进行滤波。0104基于第一音频信号和第二音频信号来执行回声抑制可以例如包括基于第一接收到的音频信号和第二接收到的音频信号来确定回声抑制增益并且基于第一接收到的音频信号和回声抑制增益来对回声抑制进行滤波。0105图7中说明的方法例如由如图8中说明的音频接收电路例如是诸如。
31、移动终端的通信设备的一部分执行。0106图8示出了音频接收电路800。0107音频接收电路800包括第一接收路径801和第二接收路径802,第一接收路径801包括配置为接收第一音频信号的第一麦克风802,并且第二接收路径802包括配置为接收第二音频信号的第二麦克风804。0108音频接收电路800进一步包括配置为基于第一音频信号和第二音频信号来执行第一音频信号的回声抑制的回声抑制电路805。0109应该注意,在图7中说明的用于处理音频信号的方法的背景中描述的实施例对于音频接收电路800类似地有效,并且反之亦然。0110音频接收电路的部件例如,接收路径和回声抑制电路可以例如由一个或多个电路实现。。
32、“电路”可以被理解为任何种类的逻辑实现实体,其可以是专用电路或执行存储在存储器中的软件、固件、或其任何组合的处理器。因而,“电路”可以是硬连线逻辑电路或诸如可编程处理器的可编程逻辑电路,例如微处理器例如复杂指令集计算机CISC处理器或精简指令集计算机RISC处理器。“电路”也可以是处理器执行的软件,例如任何种类的计算机程序。可以将下面更详细描述的相应功能的任何其它种类的实现理解为“电路”。0111在下文中,给出了根据在图7中说明的方法用于双通道终端中的回声消除的示例。在下面的示例中,回声消除由跟随有回声后滤波的自适应滤波构成,如在图9中说明的。在下文中解释每一个回声消除模块的选择和位置。011。
33、2图9示出了回声消除或回声抑制电路900。0113回声消除电路900包括自适应滤波器部分,该自适应滤波器部分包括两个自适应滤波器901、902每麦克风路径一个自适应滤波器,后面是回声后滤波器903。0114回声消除电路900处理从声源即,近端语音905、噪声907、引起回声906的扬声器909的信号和换能器即,扬声器909和两个麦克风908、910的系统904接收的音频信号。系统904可以与图1的系统100相对应,并且可以由如图3中说明的信号模型表示。0115对于每一个麦克风908、910,可以认为回声的效果与在SC回声消除中的相同。因此,对于每一个麦克风信号YP|SN911、912,回声信号。
34、913、914的估计可以通过使用自适应滤波器901、903来获得,与在SC情况中的相同。0116应该注意,可以应用任何自适应回声消除处理,例如,任何自适应回声消除算法。例如,LMS最小均方或NLMS标准化LMS算法可以用于估计回声信号。0117出于相同的原因,在SC情况中,一些残余回声会存在于声学回声消除AEC的输出端处的误差信号EP|SN915、916中。误差信号EP|SN915、916可以通过由相应的加和块说明书CN104158990A108/20页11917、918提供的、麦克风信号YP|SN911、912和回声信号913、914的相应估计之间的差值来获得。后滤波器903可以用于实现进一。
35、步的回声抑制。后滤波器903可以包括滤波器更新块919和回声后滤波块920。滤波器更新块919基于EP|SN915、916和扬声器909的扬声器信号XN922来产生输出921。例如在图9中,将这一输出921和EPN915输入到回声后滤波块920中以便给出回声抑制信号或923。0118电路900可以被看作是图8的音频接收电路800的示例。0119在下文中描述的示例中,使用DC回声处理,以便使用仅应用于一个麦克风路径的回声后滤波器来输出近端语音信号的估计。AEC要求大量存储器和高计算能力。因此,通过使用一个AEC而不是两个AEC,可以降低电路800的计算复杂度。这在图10中进行说明,其中将辅助麦克。
36、风直接输出到回声后滤波器。按照这种方式,能够将计算复杂度保持为低。0120图10示出了包括自适应滤波器部分的回声消除电路1000,该自适应滤波器部分包括跟随有回声后滤波器1002的一个自适应滤波器1001。0121电路1000仅使用一个自适应回声滤波器来回声消除地处理音频信号。电路1000从声源即,近端语音1004、扬声器1007的信号和噪声1006和换能器即,扬声器1007和两个麦克风1008、1009的系统1003接收音频信号。系统1003可以与附图的系统100相对应,并且可以由如图3中说明的信号模型表示。0122在图10中,可以通过由加和块1011提供的、主要麦克风信号Y1N1013和回。
37、声信号1012的估计之间的差值来获得误差信号E1N1010。可以通过使扬声器信号XN1014经过自适应滤波器1001来获得回声信号1012的估计。后滤波器1002可以用于实现进一步的回声抑制。后滤波器1002可以包括滤波器更新块1015和回声后滤波块1016。滤波器更新块1015基于E1N1010、辅助麦克风信号Y2N1018和扬声器1007的扬声器信号XN1014产生输出1017例如,回声后滤波增益WK,I。例如在图10中,将这一输出1017和E1N1010输入到回声后滤波块1016中以便给出回声抑制信号,其也可以被理解为近端语音信号SN1004的估计。应该注意,滤波器更新块1015可以等效。
38、于如图9中示出的滤波器更新块919。0123电路1000可以例如与图8的电路800相对应。0124通常,电路1000可以按照与图9的电路900类似的方式起作用,除了在电路1000中仅使用一个自适应滤波器1001以外。仅使用一个自适应滤波器1001可以降低多通道回声后滤波器的计算复杂度。0125可以将电路900、1000扩展到多通道M。在多通道中包括多个接收路径。0126在下面的示例中,执行频域回声后滤波。在SC情况中,频域回声后滤波器目的在于估计近端语音信号。为此,SC回声后滤波器使用其输入信号扬声器和麦克风信号来计算衰减增益。然后将这一衰减增益应用于频域中的麦克风路径以便完全抑制残余回声。0。
39、127在电路900、1000中,回声抑制仅应用于主要麦克风路径。这意味着可以仍然使用现有的SC回声抑制增益规则。增益规则的计算可能通常要求残余回声PSD和近端PSD的估计。例如,可以使用下面的增益规则说明书CN104158990A119/20页120128等式70129等式80130其中,是近端语音的PSD,是主要麦克风存在于EP中处的残余回声的PSD,并且是主要麦克风处的信号与回声比SER。0131上面的等式在数学上是等效的。然而,它们的实际实现并不一定导致相同的结果和语音质量。这是因为,估计PSD或SER的手段不一定是在数学上等效的。SER可以例如通过下面的EPHRAIM和MALAH形式体。
40、系来计算0132等式90133这些等式给出仅要求残余回声PSD的估计而不要求如对W1K,I的情况的残余回声和近端PSD的估计的SER估计的示例。0134如上所述,取决于有源声源远端扬声器或近端扬声器,能够观察主要麦克风和辅助麦克风的接收路径之间的功率电平差。在下文中,使用利用双端通话检测器DTD的示例,该双端通话检测器DTD利用PLD。这在图11中进行说明。0135图11示出了回声消除电路1100。0136与回声消除电路1000类似,回声消除电路1100从系统1103接收音频信号,包括自适应滤波器1101以及具有滤波器更新块1115和回声后滤波块1116的后滤波器1102。0137进而,回声消。
41、除电路1100包括双端通话检测器1120,其接收误差信号E1N和辅助麦克风信号Y2N1018并且基于这些信号来执行双端通话检测。双端通话检测器1120也可以执行这些信号之间的PLD的确定,并且可以向滤波器更新块1115和/或自适应滤波器1101提供PLD以及双端通话检测的结果,并且因而控制这些模块中的一个或两个。0138上面示出了可以在仅回声时段中观察麦克风信号之间的功率电平差0139等式100140因此,在这一示例中,双端通话检测器1120在得到每一个麦克风信号的PSD之后计算PLD的度量并且针对DTD使用它。可以经过不同的方式获得PLDPLDK,I0141给出关于麦克风信号之间的电平差的解。
42、释,可以按照下面来定义PLD0142等式110143可以将可选PLD定义为说明书CN104158990A1210/20页130144等式120145这一PLD包括额外的参数BIASCOMP,其能够补偿可能存在于硬件中的每一个麦克风的增益之间的任何偏差或不匹配。因而,BIASCOMP是用于放大或衰减辅助麦克风通道的调整因子。0146可以将这一PLD的标准化版本定义为0147等式130148这一PLD定义具有在1和1之间的值。标准化允许避免依赖于扬声器话音水平或扬声器信号电平和音量。可以通过使用如在上面的可选PLD中的偏差补偿器来定义这一标准化PLD的另一变形。0149进而,可以在来自AEC的误差。
43、信号和辅助麦克风之间定义PLD。如果在自适应滤波之后进行测量,则主要麦克风路径和辅助麦克风路径之间的电平差值甚至更加突出,假设AEC不放大我们可以更好地聚焦于DT时段的回声0150等式140151给出这一观察,可以可选地在频域中按照下面来定义标准化PLDNPLD0152等式150153AEC目的在于消除由主要麦克风拾取的回声信号。由此得到,误差信号的功率必定低于或等于麦克风信号的功率。如在上面的等式中定义的PLD被标准化即,具有在1和1之间的值并且利用AEC来甚至更多地突出辅助麦克风路径和主要麦克风路径之间的功率差。0154在下文中,基于等式15的定义来解释PLD的使用。然而,也可以使用如上所。
44、述的其它PLD定义。0155如上面提及的,标准化允许避免依赖于扬声器话音水平并且使用包括在1和1之间的量。0156在图12中说明了标准化PLD的值分布。0157图12示出了图1201、1202。0158第一个图1201说明了如上面针对耳机情况定义的标准化PLD的值。0159第一个图1202说明了如上面针对免提情况定义的标准化PLD的值。0160在表1中总结了PLD的典型值。0161说明书CN104158990A1311/20页140162表1标准化PLD的典型值0163由此可以看到,通过对PLD值应用阈值,能够区分仅回声时段01640165其中THI是阈值。0166阈值THI例如被选择为在09。
45、和099之间。阈值针对所有频率带或频带不必具有相同的值。可以使用任何常规的语音活动检测器来检测远端语音活动。一个简单的语音活动检测器在于对扬声器能量设定阈值。0167双端通话检测可以用于提高语音质量输出。例如,双端通话检测器1120作为可以用于AEC和/或回声后滤波的控制模块进行操作。0168可以例如在自适应AEC滤波器1101内使用关于双端通话检测的结果的信息以便在检测到双端通话时冻结适应性,即,将步长可以是可变的或固定的N设置为0。在这一示例中,双端通话检测器1120在频域中进行操作。然而,基于PLD通过做出针对一组频率或频带的双端通话决策来执行可选的双端通话检测。下面的等式是基于PLD的。
46、可选决策做出的示例01690170其中,N表示感兴趣的一组频率带或频带。0171这一可选的DT决策也会对产生可能与AEC的时间频率分辨率不同的PLD的时间频率分辨率之间的相对应性感兴趣。最后,可以经过任何语音活动检测器来检测远端语音活动。一个简单的语音活动检测器在于对扬声器能量设定阈值。0172在基准线或扬声器信号上使用语音活动检测的情况下可以区分开双端通话与近端时段。基于频带的决策也会对产生可能与AEC或后滤波的时间频率分辨率不同的PLD的时间频率分辨率之间的相对应性感兴趣。0173如在图11中说明的,双端通话检测器1120可以用于控制回声后滤波。例如,可以通过在仅回声时段期间将回声抑制增益。
47、设置到其最小值而对该回声抑制增益进行后处理在根据我们的选择的形式体系被更新之后。0174如果PLDK,I1。0180诸如上述基于双端通话检测的硬决策的硬决策系统的主要限制典型地归因于假阳性即,当不是这种情况时检测到DT和假阴性当实际上是这种情况时未检测到DT的误差。这可以利用软决策方案来克服。0181上面引入的PLD度量也可以直接用于回声消除控制,即,在不执行双端通话检测的情况下。PLD的这样的使用被称为软决策控制。0182为了说明如何在软决策中使用PLD,首先假设PLDPLDK,I具有包括在和之间的值。PLD的最大值和最小值取决于所使用的PLD定义,并且被适当地选择。例如,对于标准化PLD,。
48、可以将和分别设置为1和1。PLD可以用于通过将步长定义为PLD的函数来控制AEC的适应性。01830184其中F1是在设计者方便时定义的函数,例如PLDK,I的任何单调和递减函数。回声PSD过高估计因子也可以按照与步长类似的方式被监测01850186控制函数F2例如是PLDK,I的单调和递减函数。图13中示出了控制函数的示例。在产品内这样的控制的典型使用例如用于将F2定义为分段函数。0187图13示出了给出过高估计因子设置函数F2的示例的图1301、1302。0188第一个图1301说明了控制函数F2的第一示例,过高估计因子根据该控制函数而在1和1之间的两个步长中递减。0189第二个图1302。
49、说明了控制函数F2的第二示例,过高估计因子根据该控制函数而在和之间的区域中线性递减。0190说明了图13中的控制函数的示例用于残余回声过高估计控制。然而,类似的函数能够用于控制在回声消除中涉及的其它量,例如步长或回声抑制增益。为了AEC的步长的正确控制,可以将这一函数选择为PLDK,I的单调和递减函数。对于回声抑制增益,可以将这一函数选择为PLDK,I的单调递增函数。0191上面描述了麦克风信号之间的电平差如何用于检测双端通话。上面描述了按照PLD形式的这一差异的可能度量。上面的示例示出了这一PLD如何用于控制和提高AEC和残余回声抑制。例如,可以使用两种控制方法。PLD可以用于检测DT,并且DTD输出接着用说明书CN104158990A1513/20页16于控制不同的模块,以及PLD度量可以直接用于控制回声消除模块。0192当按照底部顶部配置来放置换能器时,基于PLD的控制利用在仅回声时段中观察到的电平差。这意味着上述方案与终端上的换能器的位置相关。给定终端,可以确保最大PLD在仅回声时段期间发生。这通过适当地选择换能器位置是可能的。例如,将辅助麦克风放置得尽可能接近扬声器,以使得这一麦克风在仅回声时段中拾取最大功率。例如将主要麦克风放置得尽可能远离扬声器,以便在仅回声时段期间具有最小电平转移。换能器的这样的。