从已编码参数估计话音能量 【技术领域】
本发明总体涉及通信。更具体地,本发明涉及对通信的估计帧能量进行确定。
背景技术
通信系统(如无线通信系统)是可用的,并提供了多种类型的通信。例如,无线和有线系统允许语音和数据通信。通信服务提供商不断努力提供增强的通信能力。
当前取得进步的一个领域包括基于分组的网络和互联网协议网络。使用这种网络,通过例如消除对级联编码的需要,无代码转换器的操作可以提供具有低延迟的更高质量的话音。在无代码转换器的操作环境中,很多话音处理应用程序应当能够在已编码参数的域内进行操作。在编码激励线性预测(CELP)话音编码(现代网络中最普遍的话音编码范例)中,有若干个有用的编码参数,包括例如固定和自适应码本参数、基音周期、线性预测编码合成滤波器参数。例如,对通信(如,语音通信)的帧或分组的话音能量进行估计针对诸如增益控制或回波抑制之类的技术提供了有用的信息。开发一种在不执行完全解码过程的情况下从已编码参数估计帧能量的高效方法以避免级联编码并降低计算复杂度,这种开发是有益的。
【发明内容】
处理通信的示例性方法包括:确定已编码帧的子帧的估计激励能量分量。还确定了子帧的估计滤波器能量分量。根据估计激励能量分量和估计滤波器能量分量来确定子帧的估计能量。
从以下详细描述中,所公开的示例的各种特征和优点将变得显而易见。该详细描述的附图可以简要描述如下。
【附图说明】
图1示意性地示出了示例通信布置的所选部分。
图2是总结了一个示例方式的流程图。
图3是示出了通信的估计子帧能量和实际话音能量之间的关系的图解说明。
图4以图表方式示出了线性预测编码合成滤波器的响应。
图5以图表方式示出了估计帧能量与实际帧能量的相关性同用于确定估计帧能量的多个采样之间的关系。
【具体实施方式】
下面公开的示例提供了确定通信的估计帧能量而无需对通信进行完全解码的能力。例如,对于可用于诸如通信系统中的增益控制或回波抑制之类的目的的话音帧能量进行估计来说,本描述的帧能量估计技术是有用的。
图1示意性地示出了通信布置20的所选部分。在一个示例中,布置20表示诸如用于无线通信的移动台之类的通信设备的所选部分。本发明不限于任何特定类型的通信设备,并且图1的图示是示意性的并用于讨论的目的。
示例通信布置20包括能够至少从另一设备接收通信的收发器22。激励部分24和线性预测编码(LPC)合成滤波器部分26均提供了输出,帧能量估计器28使用该输出来估计与接收到的通信相关联的能量。在一个示例中,激励部分24的输出是基于自适应码本增益g
p和固定码本增益g
c的,这些术语要在增强型可变速率CODEC(EVRC)处理的上下文中理解。激励部分24的输出是激励能量分量。在本示例中,激励部分24的输出是LPC合成滤波器部分26的输入信号。在本描述中,LPC滤波器部分26的输出被称为滤波器能量分量。
在一个示例中,帧能量估计器28确定接收到的话音或语音通信的已编码话音帧的每一个子帧的估计帧能量。帧能量估计器28提供帧能量估计,而无需对已编码帧进行完全解码。通过使用LPC合成滤波器部分26和激励部分24提供的编码参数以及下面将要描述的技术,帧能量估计器28提供对接收到的通信(如,话音或语音通信)的帧能量的有用估计。
图2包括总结了一个示例方式的流程图30。在32处,接收通信的已编码帧。接收到的已编码帧包括多个子帧。在34处,估计子帧的激励能量分量。36处的步骤包括确定子帧的估计滤波器能量分量。在38处,根据估计激励能量分量与估计滤波器能量分量的乘积来确定子帧的能量。在一个示例中,获得所确定的子帧能量和估计能量分量,而无需对已编码通信(如,语音通信的已编码帧)进行完全解码。
估计激励能量分量与估计滤波器能量分量的乘积提供了对帧能量的有用估计,并可以由下面的等式来描述:
P(m)≈λ
e(m)λ
h(M)(等式1)
其中,λ
e(m)和λ
h(m)分别是估计激励能量分量和估计滤波器能量分量。通过在不执行完全解码过程的情况下使用已编码参数,这种关系提供了帧能量的估计P(m)。
在考虑使用上述关系的示例方式之前,考虑在使用了完全解码过程的情况下可以如何确定帧能量是有益的。例如,第m个帧的已解码话音信号可以表示如下:
x(m;n)=h(m;n)*e
T(m;n)(等式2)
其中,h(m;n)是LPC合成滤波器的滤波器,e
T(m;n)是总激励信号。
CELP编码帧的实际能量可以描述如下:
P(m)=Σnx2(m;n)]]> =Σn[h(m;n)*eT(m;n)]2]]>(等式3)
=Σk[H(m;k)ET(m;k)]2]]> 其中,H(m;k)和E
T(m;k)分别是h(m;n)和e
T(m;n)的FFT表示。
与计算P(m)相关联的一个缺点是必须执行完全CELP解码过程。这包括导出激励信号以及如下描述的LPC合成滤波器:
H(z)=1A(z)=11-Σk=110akz-k]]>(等式4)
此外,激励信号必须通过H(z)进行滤波。
使用关系P(m)≈λ
e(m)λ
h(m)允许估计帧能量而无需完全解码过程。
在一个示例中,估计子帧的激励能量分量包括:利用可从EVRC得到的两个码本参数。在一个示例中,EVRC以已知的方式从接收到的子帧中找到自适应码本增益g
p和固定码本增益g
c。在一个示例中,根据以下关系使用自适应码本增益g
p和固定码本增益g
c:
e
T(n)=g
pe(n)=g
cc(n)(等式5)
其中e(n)是自适应码本贡献,以及c(n)是固定码本贡献。相应地,总激励可以近似为
e
T(n)≈g
pe(n-τ)+g
cc(n)
(等式6)
≈g
pe
T(n-τ)+g
cc(n)
其中,τ是感兴趣的通信的基音周期。激励的子帧能量可以表示为
ΣneT2(n)≈Σn[gpeT(n-τ)=gcc(n)]2]]> =gp2ΣneT2(n-τ)=gc2Σnc2(n)]]>(等式7)
+2gpgcΣneT(n-τ)c(n)]]> 在一个示例中,对L个采样进行以上等式中的求和。
一个示例包括:基于前一子帧能量来对自适应码本贡献e(n)的能量进行近似。这种近似可以描述如下:
ΣneT2(n-τ)≈λe(m-1)]]>(等式8)
将其代入等式7中,得到
λe(m)=gp2(m)λ(m-1)+Cgc2(m)]]>(等式9)
其中,λ(m-1)是前一子帧能量,C是针对码本贡献c
2(n)而使用的恒定能量项。在一个示例中,在EVRC中,子帧中的c
2(n)的八个采样具有幅度+1或-1,其余采样具有零值,使得将C的值设置为8。
所公开的技术的一个示例使用是用于估计话音或语音通信的话音能量。图3包括曲线图40,曲线图40示出了42处的实际话音能量以及使用等式9的关系获得的估计激励子帧能量分量。从图3中可以看出,当使用等式9的方式时,在估计激励能量分量与实际话音能量之间有显著的相关性。
另一个示例包括:利用至少两个先前子帧来对自适应码本贡献的能量进行近似。认识到自适应码本贡献至少有点周期性允许从通信中与感兴趣的子帧相距大致一个基音周期的部分选择至少两个先前子帧,以使得所选先前子帧来自通信的对应先前部分。一个示例包括:使用两个连续的先前子帧,以使得自适应码本贡献被近似视为两个连续先前子帧的内插如下:
ΣneT2(n-τ)=ωλe(m-i)+(1-ω)λe(m-i+1)]]>(等式10)
其中,i是根据通信的基音周期而选择的。使用该估计技术得到针对激励能量分量的以下估计:
λe(m)≈gp2(m)[ωλe(m-i)+(1-ω)λe(m-i+1)]]]>(等式11)
+Cgc2(m)]]> 使用该后一种方式而不是与等式9相关联的方式得到对于很多情况至少与图3所示的结果一样好的结果。在一些示例中,与使用等式9获得的估计相比,与等式11相关联的方式提供了对激励能量分量的更精确估计。
在一个示例中,估计滤波器能量分量包括:使用LPC合成滤波器的参数。一般地,第m个子帧处的LPC合成滤波器的能量可以表示为
Σk|H(m;k)|2=Σn∞h2(m;n)]]>(等式12)
当然,对无限数目的采样求和是不实际的,本示例包括认识到LPC合成滤波器是最小相位稳定系统,并且,假定大多数信号能量集中在滤波器响应的初始部分中是合理的。图4以图表方式示出了LPC滤波器的示例脉冲响应50。从图4可以看出,脉冲响应50的最显著幅度出现在脉冲响应的开始处(如,逼近图的左边)。
在一个示例中,以如下关系使用减少数目的采样来估计LPC合成滤波器能量分量:
λh(m)≈Σn=0L-1-Kh2(m;n)]]>(等式13)
其中,K>0是用于确定滤波器能量的减少的采样的数目(如,丢弃或忽略多少采样)。只要利用了充分数目的采样,与使用等式12相比,使用减少数目的采样,可以获得所确定的估计LPC合成滤波器能量分量之间的充分精确的相关性。
图5以图表方式示出了针对多种不同通信(如,不同类型的话音、语音通信或其他可听通信)的估计能量和实际能量之间的相关性。曲线60和曲线62中的每一个对应于不同的通信。在一个示例中,图5中的曲线中的每一个对应于不同类型的语音通信(如,不同的内容)。从图5可以看出,随着所丢弃的采样的数目增加,相关性降低。在一个示例中,已经经验性地确定了,利用LPC合成滤波器响应的最多前10个采样提供充分的相关性和足够的信息以估计滤波器响应能量分量。一个特定示例通过仅使用LPC合成滤波器响应的前6或7个采样来得到有效的结果。给定了本描述,本领域技术人员将能够确定对于其特定情况来说多少采样将是有用的或必需的。
使用等式9或11之一已确定估计激励分量并使用等式13已确定估计滤波器能量分量后,使用以下关系来确定感兴趣的子帧的估计帧能量λ(m):
λ(m)=λe(m)λh(m)]]> =[gp2(m)λ(m-1)+Cgc2(m)]]]>(等式14)
Σn=0L-1-Kh2(m;n)]]> 使用以上技术允许估计通信(如,话音或语音通信)的帧能量而不必对通信进行完全解码。这种估计技术降低了计算复杂度并更快地提供了有用的能量估计,这两者都促进了增强型语音通信能力。
在一些示例中,使用所确定的估计帧能量来控制后续通信。在一个示例中,估计帧能量用于增益控制。在另一个示例中,估计帧能量用于回波抑制。
实际上,前面的描述是示例性的而非限制。对本领域技术人员来说,所公开的示例的变体和修改可变得显而易见,而不必然脱离本发明的实质。对本发明的合法保护范围仅可通过研究权利要求来确定。