音频解码设备和方法.pdf

上传人:r7 文档编号:161898 上传时间:2018-01-31 格式:PDF 页数:36 大小:1.84MB
返回 下载 相关 举报
摘要
申请专利号:

CN03801779.2

申请日:

2003.09.11

公开号:

CN1606687A

公开日:

2005.04.13

当前法律状态:

授权

有效性:

有权

法律详情:

专利实施许可合同备案的生效IPC(主分类):G10L 19/02合同备案号:2014990000616让与人:Via许可公司受让人:广州华多网络科技有限公司发明名称:音频解码设备和方法申请日:20030911申请公布日:20050413授权公告日:20090527许可种类:普通许可备案日期:20140804|||授权|||实质审查的生效|||公开

IPC分类号:

G01L21/02; H04B1/66; G10L19/02

主分类号:

G01L21/02; H04B1/66; G10L19/02

申请人:

松下电器产业株式会社; 日本电气株式会社

发明人:

田中直也; 嶋田修; 津岛峰生; 则松武志; 张国成; 柯金汉; 梁世丰; 野村俊之; 高见泽雄一郎; 芹泽昌宏

地址:

日本大阪府

优先权:

2002.09.19 JP 273557/2002; 2002.09.27 JP 283722/2002; 2002.10.15 JP 300490/2002

专利代理机构:

中科专利商标代理有限责任公司

代理人:

朱进桂

PDF下载: PDF下载
内容摘要

一种音频解码设备,使用产生多个高频子带信号的带宽扩展器,从划分为多个子带的低频子带信号解码高频分量信号,并传输高频编码的信息。设备装置有混叠现象检测器和混叠现象去除器。混叠现象检测器检测在由带宽扩展器产生的多个高频子带信号中出现混叠信号分量的程度。混叠现象去除器调整通常产生高频子带信号的增益,抑止在高频子带信号中的混叠信号分量。因此,即使当为了降低运算数量使用实数值子带信号时,可以抑止混叠现象的出现,并降低产生的声音质量的退化。

权利要求书

1.  一种音频解码设备,用于从包含窄带音频信号的编码信息的比特流解码宽带音频信号,包括:
比特流多路分解器,用于从比特流中多路分解编码的信息;
解码器,用于从多路分解的编码信息解码窄带音频信号;
分析滤波器组,用于划分解码的窄带音频信号为多个第一子带信号;
带宽扩展器,从至少一个第一子带信号产生多个第二子带信号,各第二子带信号有比第一子带信号的频带更高的频带;
混叠现象去除器,为了抑止出现在第二子带信号中的混叠信号分量,调整第二子带信号的增益;
实数值计算合成滤波器组,合成第一子带信号和第二子带信号,获得宽带音频信号。

2.
  一种音频解码设备,用于从包含窄带音频信号的编码信息的比特流解码宽带音频信号,包括:
比特流多路分解器,用于从比特流中多路分解编码的信息;
解码器,用于从多路分解的编码信息解码窄带音频信号;
分析滤波器组,用于划分解码的窄带音频信号为多个第一子带信号;
带宽扩展器,从至少一个第一子带信号产生多个第二子带信号,各第二子带信号有比第一子带信号的频带更高的频带;
混叠现象检测器,检测由带宽扩展器产生的多个第二子带信号中出现的混叠信号分量的程度;
混叠现象去除器,基于检测的出现混叠信号分量的程度,调整第二子带信号的增益,抑止混叠信号分量;
实数值计算合成滤波器组,合成第一子带信号和第二子带信号,获得宽带音频信号。

3.
  根据权利要求2所述的音频解码设备,其特征在于混叠信号分量包含至少在由执行复数值计算的合成滤波器组合成后抑止的分量。

4.
  根据权利要求2所述的音频解码设备,其特征在于第一子带信号是低频子带信号,第二子带信号是高频子带信号。

5.
  根据权利要求4所述的音频解码设备,其特征在于混叠现象检测器使用表示第一子带信号的频率分布的斜率的参数,检测出现混叠信号分量的程度。

6.
  根据权利要求5所述的音频解码设备,其特征在于混叠现象检测器评估表示两个相邻子带的频率分布的斜率的参数,并检测在两个子带中出现混叠信号分量的程度。

7.
  根据权利要求5所述的音频解码设备,其特征在于混叠现象检测器评估表示三个相邻子带的频率分布的斜率的参数,并检测在三个子带中出现混叠信号分量的程度。

8.
  根据权利要求5所述的音频解码设备,其特征在于表示频率分布的斜率的参数是反射系数。

9.
  根据权利要求2所述的音频解码设备,其特征在于:
比特流包含窄带音频信号的编码信息和使得窄带到宽带的附加信息;
附加信息,包含描述比第一子带信号的频带更高频带的信号特性的高频分量信息;
比特流多路分解器,还从比特流多路分解附加信息;
带宽扩展器,从至少一个第一子带信号和在附加信息中的高频分量信息产生比第一子带信号的频带更高的频带中的多个第二子带信号。

10.
  根据权利要求9所述的音频解码设备,其特征在于:
高频分量信息包含比第一子带信号的频带更高的频带的增益信息;
带宽扩展器,基于增益信息从第一子带信号产生第二子带信号;
混叠现象去除器,为了抑止混叠信号分量,基于检测的出现混叠信号分量的程度和增益信息,调整第二子带信号的增益。

11.
  根据权利要求9所述的音频解码设备,其特征在于:
高频分量信息包含在比第一子带信号的频带更高的频带中的信号的能量信息;
带宽扩展器,基于从能量信息计算的增益信息,从第一子带信号产生第二子带信号;
混叠现象去除器,为了抑止混叠信号分量,基于检测的出现混叠信号分量的程度和增益信息,调整第二子带信号的增益。

12.
  根据权利要求11所述的音频解码设备,其特征在于混叠现象去除器调整第二子带信号的增益,使得有调整的增益的多个第二子带信号的总能量等于相应的第二子带信号的能量信息提供的总能量。

13.
  根据权利要求11所述的音频解码设备,其特征在于:
带宽扩展器把附加信号加到产生的第二子带信号;
能量信息包含第二子带信号的能量R及能量R与附加信号的能量之间的比率Q;
带宽扩展器,计算第一子带信号的能量E,基于能量R,能量E和由能量比率Q表示的附加信号的能量,计算相应的第二子带信号的增益g。

14.
  根据权利要求13所述的音频解码设备,其特征在于第二子带信号的增益g是
    g=sqrt(R/E/(1+Q))
其中sqrt表示平方根算子。

15.
  一种音频解码方法,从包含窄带音频信号的编码信息的比特流解码宽带音频信号,包括:
从比特流中多路分解编码的信息;
从多路分解的编码信息解码窄带音频信号;
划分解码的窄带音频信号为多个第一子带信号;
从至少一个第一子带信号产生多个第二子带信号,各第二子带信号有比第一子带信号的频带更高的频带;
为了抑止出现在第二子带信号中的混叠信号分量,调整第二子带信号的增益;
用实数值滤波计算合成第一子带信号和第二子带信号,获得宽带音频信号。

16.
  一种音频解码方法,从包含窄带音频信号的编码信息的比特流解码宽带音频信号,包括:
从比特流中多路分解编码的信息;
从多路分解的编码信息解码窄带音频信号;
划分解码的窄带音频信号为多个第一子带信号;
从至少一个第一子带信号产生多个第二子带信号,各第二子带信号有比第一子带信号的频带更高的频带;
在产生第二子带信号前检测在各产生的多个第二子带信号中的出现混叠信号分量的程度;
为了抑止混叠信号分量,基于检测的出现混叠信号分量的程度,调整第二子带信号的增益;
用实数值滤波计算合成第一子带信号和第二子带信号,获得宽带音频信号。

17.
  根据权利要求16所述的音频解码方法,其特征在于混叠信号分量包含至少在用复数值滤波计算合成后抑止的分量。

18.
  根据权利要求16所述的音频解码方法,其特征在于第一子带信号是低频子带信号,第二子带信号是高频子带信号。

19.
  根据权利要求18所述的音频解码方法,其特征在于使用表示第一子带信号的频率分布的斜率的参数检测出现混叠信号分量的程度。

20.
  根据权利要求19所述的音频解码方法,其特征在于评估表示在两个相邻子带中的频率分布的斜率的参数,检测在两个子带中出现混叠信号分量的程度。

21.
  根据权利要求19所述的音频解码方法,其特征在于评估表示在三个相邻子带中的频率分布的斜率的参数,检测在三个子带中出现混叠信号分量的程度。

22.
  根据权利要求19所述的音频解码方法,其特征在于表示频率分布的斜率的参数是反射系数。

23.
  根据权利要求16所述的音频解码方法,其特征在于:
比特流包含窄带音频信号的编码信息,和用于使得窄带到宽带的附加信息;
附加信息包含描述比第一子带信号的频带更高频带的信号特性的高频分量信息;
在多路分解编码的信息时,从比特流多路分解附加信息;
在产生多个第二子带信号时,从至少一个第一子带信号和在附加信息中的高频分量信息中产生比第一子带信号的频带更高频带的多个第二子带信号。

24.
  根据权利要求23所述的音频解码方法,其特征在于:
高频分量信息包含比第一子带信号的频带更高频带的增益信息;
在产生多个第二子带信号时,基于增益信息从第一子带信号产生第二子带信号;
在调整增益时,为了抑止混叠信号分量基于检测的出现混叠信号分量的程度调整第二子带信号的增益。

25.
  根据权利要求23所述的音频解码方法,其特征在于:
高频分量信息包含在比第一子带信号的频带更高频带的信号的能量信息;
在产生多个第二子带信号时,基于从能量信息计算的增益信息从第一子带信号产生第二子带信号;
在调整增益时,为了抑止混叠信号分量基于检测的出现混叠信号分量的程度,调整第二子带信号的增益。

26.
  根据权利要求25所述的音频解码方法,其特征在于在调整增益时,调整第二子带信号的增益,使得有调整的增益的多个第二子带信号的总能量等于由相应第二子带信号的能量信息提供的总能量。

27.
  根据权利要求25所述的音频解码方法,其特征在于:
产生多个第二子带信号,包括附加信号加到产生的第二子带信号;
能量信息包含第二子带信号的能量R及能量R与附加信号的能量之间的比率Q;
产生多个第二子带信号还包括,计算第一子带信号的能量E,基于能量R,能量E和由能量比率Q表示的附加信号的能量,计算相应的第二子带信号的增益g。

28.
  根据权利要求27所述的音频解码方法,其特征在于第二子带信号的增益g是
   g=sqrt(R/E/(1+Q))
其中sqrt表示平方根算子。

29.
  一种以编程语言编码的软件,提供根据权利要求15到28之一所述的音频解码方法完成的功能。

30.
  一种数据记录介质,存储根据权利要求29所述的软件。

说明书

音频解码设备和方法
技术领域
本发明涉及使用少量的附加信息,从窄带音频信号产生宽带音频信号的音频带宽扩展系统的音频解码设备和解码方法,并涉及用很少计算能得到解码高音频质量的技术。
背景技术
带宽划分编码是编码低比特率音频信号而同时获得高质量的回放信号通常的方法。使用频带划分滤波器把输入音频信号划分为多个频带(子带),或用傅立叶变换或其它时间频率变换算法变换输入信号为频域信号,然后,将信号划分为频域的多个子带,并分配合适的代码位给各带宽部分。使用带宽划分编码能从低比特率数据获得高质量的回放信号的原因是在编码处理中基于人类的听觉特性处理信号。
在近似10KHz或更高频率人类的听觉灵敏度通常下降,低音电平变得难于听见。此外,称为“频率屏蔽”的现象是众所周知的。由于频率屏蔽,当在特定频带有高电平声音时,在附近频带的低电平声音成为难于听见的。由于此听觉特性对回放质量没有实质性的影响,分配比特和编码信号是难于感觉的,因此编码此信号是无意义的。相反,取分配给此听觉无意义的代码位并重分配此代码位给听觉敏感的子带,可更详细的编码听觉敏感的信号,因此有效地改善回放信号的质量。
此用带宽划分的编码例子是国际标准的MPEG-4 AAC(ISO/IEC14496-3),这使得能在近似96Kbps比特率上高质量的编码16KHz或更宽带宽的立体声信号。
如果比特率是低的,例如,近似48Kbps,只是10KHz或更低的带宽可以高质量编码,产生压抑的声音。一种补偿此带宽限制产生的声音质量退化的方法称为SBR(谱带复制),并在欧洲电信标准学会(ETSI)出版的数字无线电世界范围的(DRM)系统规范中描述。类似的技术也在AES(音频工程协会)会议论文5553,5559,5560(112届会议,2002年五月10-13,Munich,Germany)中公开。
SBR寻找由音频编码处理,如AAC或同等的频带限制处理所损失的高频带信号(涉及高频分量)的补偿。在低于SBR补偿的频带(也称为低频分量)的频带中的信号必须由其它装置传输。基于由其它装置传输的低频分量产生伪高频分量的信息包含在SBR-编码的数据中,由伪高频分量加到低频分量上可补偿由于带宽限制的声音的退化。
图7是根据现有技术的SBR带宽扩展的解码器的原理图。输入比特流106被1分离为低频分量信息107,高频分量信息108,和加信息109。例如,低频分量信息107是用MPEG-4 AAC或其它编码方法编码的信息,并解码产生表示低频分量的时间信号。由分析滤波器组103划分此表示低频分量的时间信号为多个子带。
分析滤波器组103通常是使用复数值系数的滤波器组,划分的子带信号表示为低复数值信号。由复制表示低频分量的低频子带信号到高频子带中,带宽扩展器104补偿由于带宽限制的高频分量损失。输入到带宽扩展器104的高频分量信息108包含偿频高频子带的增益信息,因此调整各个产生的高频子带的增益。
带宽扩展器104产生的高频子带信号随低频子带信号输入到带宽合成的合成滤波器组105,并产生输出信号110。因为输入到合成滤波器组105的子带信号通常是复数值信号,使用复数值系数滤波器组为合成滤波器组105。
如上面配置的带宽扩展的解码器在解码处理中要求许多操作,因为包括分析滤波器组和合成滤波器组的两个滤波器组执行复数值计算。因此,当用集成电路实现解码器时,存在的问题是功耗增加和用给定的电源容量可能的回放时间减小。
实际上从合成滤波器组输出地解码的信号是实数值信号,因此为了降低执行解码的运算数量,合成滤波器组可以配置为实数值滤波器组。然而,因为只执行实数值运算的合成滤波器组(实数值系数合成滤波器组)的特性不同于如在现有技术中的执行复数值运算的合成滤波器组(复数值系数合成滤波器组)的特性,复数值合成滤波器组不能简单的由实数值合成滤波器组替代。
图8A到图8E显示复数值系数合成滤波器组和实数值系数合成滤波器组的特性。任何给定频率的音调信号有如在图8A中显示的单线谱。当包含此音调信号201的输入信号由分析滤波器组分离为多个子带时,表示音调信号201的线谱包含在单个特定子带信号中,理想的,例如,包含在子带m中的信号只表示频带从mπ/M到(m+1)π/M的信号。
然而,用现行的分析滤波器组,从相邻子带到给定子带的信号包含在根据频带划分滤波器的频率特性的给定子带中。图8B显示用作分析滤波器组的复数值系数滤波器组的例子。在此例子中,音调信号201作为复数值信号,包含在如图中由实线显示的子带m信号203和如由虚线显示的子带m-1信号204中。注意,包含在两个子带中的音调信号占有频率轴上同样位置。高频子带信号产生过程复制两个子带信号到高频子带中,并调整各子带的增益,但如果各子带增益不同,音调信号201在各子带也有不同的幅度。
在合成滤波后,音调信号幅度的变化保留为信号误差,但因为音调信号的两个子带在频率轴上占有同样位置,此信号误差的影响只表现为用复数值系数滤波器组作为合成滤波器组的常规方法的音调信号201的幅度变化。因此,此误差对输出信号质量有小的影响。
然而,当使用实数值系数滤波器组作为合成滤波器组时,由复数值系数分析滤波器组输出的复数值子带信号首先必须转换为实数值子带信号。例如,这可以由旋转复数值子带信号的实数值轴和虚数值轴π/4做到,这是从DFT导出DCT同样的运作。包含在子带中的信号的形状随此变换处理改变为实数值子带信号。
图8C显示由虚线表示的(m-1)子带信号的变化。作为变换为实数值子带信号的结果,包含在子带(m-1)中的信号的谱是对子带边界202的轴对称的。因此,包含在原来复数值子带信号中的音调信号201的称为“镜像频率信号”的信号出现在与子带边界202的轴对称的位置。在子带m的信号也出现类似的镜像频率分量205,至于子带(m-1)和子带m的增益没有变化,在合成滤波处理中这些镜像频率分量互相抵消,在输出信号中不出现。
然而,如在图8D中所示,当在高频子带信号产生过程中各子带中有增益差206时,镜像频率分量205在输出信号中不完全抵消并出现为误差信号,称为混叠现象。如在图8E中所示,此混叠分量207出现在信号通常不应该在的位置(即,对原始音调信号跨过子带边界202的对称位置上),因此对输出信号的声音质量有大的影响。特别是,当音调信号接近于频带划分滤波器的衰减是不足的子带边界时,产生的混叠分量的幅度增加,因此,引起输出信号的声音质量的严重退化。
发明内容
因此,本发明致力于解决当前技术的这些问题,提供使用实数值系数合成滤波器组减少解码处理中执行的运算数量的技术,抑止混叠现象,改善输出信号的声音质量。
本发明的音频解码设备是从包含窄带音频信号的编码信息的比特流中解码宽带音频信号的设备。
在本发明的第一方面中,设备包括:比特流多路分解器,用于从比特流中多路分解编码信息;解码器,用于从多路分解的编码信息中解码窄带音频信号;分析滤波器组,用于划分解码的窄带音频信号为多个第一子带信号;带宽扩展器,用于从至少一个第一子带信号产生多个第二子带信号,各第二子带信号有比第一子带信号的频带更高频带;混叠现象去除器,为了抑止在第二子带信号中产生的混叠信号分量,调整第二子带信号的增益;实数值计算合成滤波器组,用于合成第一子带信号和第二子带信号获得宽带音频信号。
在本发明的第二方面中,设备包括:比特流多路分解器,用于从比特流中多路分解编码信息;解码器,用于从多路分解的编码信息中解码窄带音频信号;分析滤波器组,用于划分解码的窄带音频信号为多个第一子带信号;带宽扩展器,从至少一个第一子带信号产生多个第二子带信号,各第二子带信号有比第一子带信号的频带更高频带;混叠现象检测器,用于检测在由带宽扩展器产生的多个第二子带信号中出现混叠分量的程度;混叠现象去除器,基于检测的混叠分量的电平,调整第二子带信号的增益,抑止混叠分量;实数值计算合成滤波器组,合成第一子带信号和第二子带信号获得宽带音频信号。
因此,由于在从低频子带信号产生高频子带信号的处理中,对各高频子带作用不同的增益,本发明抑止了在实数值子带信号中的混叠分量,并抑止由于混叠的声音退化。
附图说明
图1是显示本发明的音频解码设备的一个例子的原理框图(第一实施例);
图2是显示本发明的音频解码设备的一个例子的原理框图(第二实施例);
图3描述在本发明的音频解码设备中检测混叠现象的方法的一个例子;
图4A和图4B描述在本发明的音频解码设备中检测混叠现象的方法;
图5是显示本发明的音频解码设备的一个例子的原理框图(第四实施例);
图6是显示本发明的音频解码设备的一个例子的原理框图(第五实施例);
图7是显示现有技术的音频解码设备的原理框图;
图8A到图8E描述混叠分量如何产生的视图。
具体实施方式
下面,参考附图描述本发明的音频解码设备和音频解码方法的优选实施例。
实施例1
图1是显示本发明第一实施例的音频解码设备的原理框图。
此解码设备有比特流多路分解器101,低频解码器102,分析滤波器组103,带宽扩展器104,合成滤波器组105,混叠现象去除器113,和附加信号发生器111。
比特流多路分解器101接收输入比特流106并多路分解比特流106为低频分量信息107、高频分量信息108和附加信号信息109。低频分量信息107使用MPEG-4 AAC编码方法编码。低频解码器102解码低频分量信息107并产生表示低频分量的时间信号。
然后,表示低频分量的产生的时间信号由分析滤波器组103分成多个(M)子带,并输入到带宽扩展器104。分析滤波器组103是复数值计算系数滤波器组,分析滤波器组103产生的子带信号用复数值信号表示。
带宽扩展器104复制表示低频分量的低频子带信号到高频子带,补偿由带宽限制损失的高频分量。输入到带宽扩展器104的高频分量信息108包含要补偿的高频子带的增益信息,并调整各个产生的高频子带的增益。
附加信号发生器111根据附加信息109产生增益控制的附加信号112,并把它加到各高频子带信号上。使用正弦音调信号或噪声信号作为由附加信号发生器111产生的附加信号。
由带宽扩展器104产生的高频子带信号随低频子带信号输入到进行频带合成的合成滤波器组105,得到输出信号110。此合成滤波器组105是实数值系数滤波器组。在合成滤波器组105中使用的子带数不需要与在分析滤波器组103中的子带数匹配。例如,在图1中,如果N=2M,输出信号的采样频率是输入到分析滤波器组的时间信号的采样频率的两倍。
因为关系到增益控制的信息仅包含在高频分量信息108或附加信号信息109中,与包含谱信息的低频分量信息107相比可以使用相当低的比特率。因此,此配置适合于编码低比特率的宽带信号。
在图1所示的解码设备也有混叠现象去除器113。混叠现象去除器113输入高频分量信息108,并调整高频分量数据的增益信息,由实数值系数合成滤波器组105抑止混叠现象。带宽扩展器104使用调整的增益产生高频子带信号。
在此实施例中,输入到合成滤波器组105的子带信号必须是实数值信号,但可以使用现有技术中已知的方法由相位旋转操作,从复数值信号变换到实数值信号。
下面详细的描述混叠现象去除器113的运行。
如上面描述的,当实数值系数滤波器组用作为合成滤波器组时,混叠现象的一个原因是在高频信号产生过程中,调整相邻子带信号具有不同的增益水平。如果对所有相邻子带信号使用同样的增益,可以完全去除混叠信号分量。然而,在此情况中,不反射作为高频分量传输的增益信息,高频分量增益不匹配,输出信号质量退化。因此混叠现象去除器113必须参考作为高频分量信息传输的增益信息调整增益,使得混叠信号分量下降到听不见的水平,因此防止了由混叠信号分量引起的声音退化和由在高频分量中不匹配的增益引起的声音退化。
根据相邻子带之间的增益差增加时混叠信号分量增加,在本发明实施例中的混叠现象去除器113设置了对相邻子带之间的增益差的限制,降低产生混叠信号分量的影响。
例如,混叠现象去除器113调整所有m的g[m]满足下面的关系
g[m]≤a*g[m-1]
g[m]≤a*g[m+1]
其中g[m-1],g[m]和g[m+1]是三个连续的子带m-1,1,m+1的增益,“a”确定相邻子带之间的增益比率的上限,并近似的为2.0。系数“a”的值对所有子带m可以是相同的,或对不同的子带m使用不同的“a”。例如相对低的“a”可作用到混叠现象的听觉影响是强的低频子带,相对高的“a”可作用到混叠现象的听觉影响是相对弱的高频子带。
这个增益调整抑止混叠信号分量的影响,因此,因为限制相邻子带之间的增益,所以改善了可听的声音的质量。此外,高频分量子带信号的增益分布不同于基于增益信息传输的增益分布,但受影响的子带只是那些对相邻子带增益比率是相当高的子带。此外,因为同样的子带增益关系也维持在调整的增益水平,可以抑止由于高频子带信号不匹配的增益的声音质量退化。
除了限制相邻子带之间的增益比率,增益调节也可以用多子带的平均增益调整增益。下面用例子的方式描述使用三个子带的平均增益。在此情况中,可从获得在增益调节后子带m的增益g1[m],满足以下关系获得
g1[m]=(g[m-1]+g[m]+g[m+1])/3
其中g[m-1],g[m]和g[m+1]是接收为高频分量的三个连续的子带m-1,1,m+1的增益。
此外,因为可顺序的使用调整的子带m-1的增益g1[m-1]调整从低频子带开始的增益水平,增益g1[m]可从以下公式获得。
g1[m]=(g1[m-1]+g[m]+g[m+1])/3
因为子带之间的增益变化可以是平滑过渡的,并且由如上面描述的调整增益,可以降低相邻子带之间的增益差,可以抑止混叠信号分量,可以改善听觉声音质量。此外,此平滑过渡处理使得高频子带信号的增益分布不同于基于传输的增益信息的增益分布,但在平滑过渡处理前增益分布的形状在平滑过渡处理后是保持的,可以抑止由于高频子带信号的不匹配的增益的声音质量退化。
应该注意到在上面描述的增益平滑过渡处理中使用多子带的增益的简单平均,但在使用计算平均值前,预先确定其加权系数的加权平均先作用到各增益水平。
为了防止即使原来的增益水平是很低的,平滑过渡处理产生变得太高的增益水平,当原来的增益水平小于预先确定的阈值,不使用平滑过渡处理,使用原来的、不调整的增益设置是可能的。
实施例2
图2是本发明第二实施例的音频解码设备的原理图。此实施例不同于示于图1的配置,加上混叠现象检测装置(混叠现象检测器)315,检测有引入高可能性混叠信号分量的子带。从混叠现象检测器315输出的检测数据316输入到混叠现象去除器313,然后,基于检测数据316调整高频分量的增益。
除了涉及混叠现象检测装置315和混叠现象去除器313外,本发明第二实施例的解码设备的运行是与第一实施例相同。因此下面只描述混叠现象检测装置315和混叠现象去除器313的运行。
首先描述混叠现象检测装置315的运行原理。
使用实数值子带信号逻辑上不能避免混叠现象,但由混叠现象引起的声音退化的量大大不同于包含在子带信号中的信号的特性。如参考图8描述的,混叠现象出现在不同于原始信号的位置,但如果在相同范围的原始信号是错误的,屏蔽了混叠信号分量的影响,混叠信号分量对声音质量有较少的实际影响。相反,如果混叠信号分量出现在信号不是原始存在的地方,仅混叠信号分量是听得见的,它们对声音质量的影响是大的。因此,由检测混叠信号分量出现附近的信号的强度,了解混叠信号分量的影响是多大是可能的。
然而,为了检测产生的混叠信号分量的位置和原始的信号周围的强度,必须用傅立叶变换或其它的频率变换处理确定子带信号的频率分布。问题是由于要求的计算运算是不实际的。因此,本发明使用表示子带信号频率的斜率的参数检测具有少量计算的混叠现象的影响。这个方法的前提是忽略在给定子带中有宽频率分布的信号(噪声信号)的影响,因为即使出现混叠现象,由于上面描述的屏蔽现象影响是小的。
音调信号的位置和任何产生的混叠信号分量之间的关系是如上面参考图8对有频率分布限制的信号(音调信号)描述的,当音调信号接近子带边缘时混叠现象的影响是大的。
图3显示音调信号的位置和包含音调信号的子带的频率分布的斜率之间的关系。在图3中,音调信号401和它的镜像频率402包含在子带m-1信号403和子带m信号404中,音调信号401和它的镜像频率402对称的位于子带边缘405。
当音调信号401接近子带边缘405时,音调信号401和它的镜像频率402在子带m-1的高频侧。因此,子带m-1的频率分布的斜率406是正的。如果音调信号401从子带边缘405向高频侧偏移时,它的镜像频率402在相反方向移动(即在低频方向),子带m-1的频率分布的斜率变得更渐进的并最后是负的。子带m的频率分布的斜率407同样从负变为正。这意味着如果子带m-1的频率分布的斜率是正的,子带m的频率分布的斜率是负的,音调信号401和它的对称的镜像频率402可能在接近子带边缘405出现。
线性预测系数(LPC)和反射系数可用作为能容易计算的参数,并表示子带信号频率分布的斜率。由下面的公式获得的一阶反射系数可用作为例子的此参数。
K 1 [ m ] = - Σ i { x ( m , i ) · x * ( m , i - 1 ) } Σ i { x ( m , i ) · x * ( m , i ) } ]]>
其中X(m,i)表示子带m的信号,i表示时间取样,X*(m,i)表示X(m,i)的复数共轭,K1[m]表示子带m的一阶反射系数。
因为当频率分布的斜率是正的时主反射系数是正的,当斜率是负的时主反射系数是负的,如果K1[m-1]是正的和K[m]是负的,可以确定在子带m-1和m之间的边缘出现混叠现象的可能性是高的。
然而,如果使用公共的QMF(积分镜像滤波器)作为子带划分滤波器,由于滤波器的特性,偶数子带和奇数子带之间的频率分布倒转。考虑此,可以设置检测混叠现象的条件如下。
当m是偶数:K1[m-1]<0,K1[m]<0
当m是奇数:K1[m-1]>0,K1[m]>0
下面此条件涉及为“检测条件1”。检测条件1定义通常检测两个相邻子带之间是否有任何混叠现象的条件。当使用检测条件1时,对连续的子带m和m-1混叠现象不检测两次,因为对偶数m和奇数m条件不可能同时满足。
QMF的通带通常展开到三个子带,即,要求的子带和其两侧的子带。在此情况中,如果有接近要求的子带的中心的音调信号,或有在要求的子带的高频和低频范围两侧的音调信号,在要求的子带两侧的子带上出现镜像频率分量。
图4A和图4B显示当在给定子带的高频和低频范围有音调信号时的频率分布。在图4A中在子带m-1的高频和低频范围的两侧有音调信号501和502,在图4B有音调信号511和512。在子带m-2中,子带m-1的低频范围的音调信号501和511的镜像频率分量分别出现为信号503和513,在子带m中,子带m-1的高频范围的音调信号502,512的镜像频率分量分别出现为信号504和514。
如在图4A中频率分布506和图4B中频率分布516显示的,由高频和低频音调信号的能量比率确定子带m-1的频率分布的斜率。因此不可能用检测条件1检测跨过三个子带的混叠现象,这是使用子带m-1的反射系数的符号用于检测两个子带之间的混叠现象。另一方面,在子带m-2和子带m中,由镜像频率分量稳定的确定频率分布的斜率的符号,如在图4A中的频率分布505和507和在图4B中的频率分布515和517所显示的,不管在子带m-1中的低频和高频音调信号之间的能量比率。
这能使用子带m-2和子带m中的反射系数用于建立检测跨越三个子带的混叠现象的条件。
当m是偶数时:K1[m-2]>0,K1[m]<0
当m是奇数时:K1[m-2]<0,K1[m]>0
下面此条件称为“检测条件2”。
然而,当在子带m-2和子带m中的频率分布的斜率是高的时,跨越三个子带的混叠现象成为问题,当只使用检测条件2时,检测误差增加。在子带m-2和子带m中的频率分布的斜率变化依赖于子带m-1的低频和高频范围的音调信号之间的能量比率。
即,如果在子带m-1的低频范围中的音调信号的能量相比于在高频范围中(显示在图4A中的情况)的音调信号的能量是低的,子带m-2的反射系数K1[m-2]的绝对值小于子带m的反射系数K1[m]的绝对值。相反,当在子带m-1中的低频音调信号的能量高于高频音调信号的能量(显示在图4B中的情况)时,子带m-2的反射系数K1[m-2]的绝对值大于子带m的反射系数K1[m]的绝对值。此特性下面称为“特性1”。
因此能同时考虑在子带m-2和子带m中的频率分布的斜率。此外,使用反射系数的绝对值是从0到1,检测跨越三个子带的条件优选的首先满足上面的检测条件2,也满足下面的条件。
当m是偶数时:K1[m-2]-K1[m]>T
当m是奇数时:K1[m]-K1[m-2]>T
其中T是预先确定的阈值,如近似的值T=1.0。这些下面称为“检测条件3”。检测条件3的检测范围比检测条件2的检测范围窄。注意因为条件
-1<K1[m]<1
涉及反射系数的范围,当使用检测条件2或检测条件3时,在连续的三个子带m,m+1和m+2中的条件不重叠,因此不检测在连续的三个子带中的混叠现象。此外,即使检测条件1联合于检测条件2或检测条件3一起使用,不在连续的三个子带中检测混叠现象。使用三个子带m-2,m-1和m的反射系数可以建立连续的三个子带的混叠现象检测条件是显而易见的。
从混叠现象检测装置315输出检测条件是真的子带数作为混叠现象检测数据316。然后混叠现象去除器313调整仅由混叠现象检测数据316表示的子带的增益,从而限制混叠现象。例如,如果混叠现象检测数据316根据检测条件1指出跨过两个子带出现混叠现象,可由匹配子带m-1和m的增益或由限制两个子带之间的增益差或增益比率到预先确定的阈值或更小,从而调整增益。当对两个子带建立同样的增益水平时,增益可以建立为两个子带的较低增益水平,较高增益水平,或较高和较低增益水平之间的中间水平(如平均值)。
为了防止由混叠现象检测装置315的检测误差,混叠现象去除器313可使用组合方法。例如,混叠现象去除器313可适用于匹配到检测到混叠现象的子带的增益,适用于对限制增益差或增益比率到或低于预先确定的阈值的其它子带限制增益。
此外,当混叠现象检测数据316基于检测条件2或检测条件3指出跨过三个子带出现混叠现象时,混叠现象去除器313可由匹配所有三个子带的增益调整增益。作为选择,如上面描述的方法匹配两个子带增益可用于从m-2的升序,即,在调整子带m-2和m-1的增益后,可匹配子带m的增益和增益水平。也可使用降序匹配从子带m开始的两个子带之间的增益。此外,作为选择,可使用如上面描述的升序和降序匹配的两个子带增益,然后可以确定并使用增益水平的中间值。当建立两个子带的相同增益水平时,增益可以建立为较低增益水平,较高增益水平,或较高和较低增益水平之间的中间水平(如平均值)。
此外,作为选择,代替建立两个子带相同的增益水平,可以建立两个子带之间的增益差或增益比率为预先确定的阈值或更小。
还是作为选择,为了防止由混叠现象检测装置315的检测误差,混叠现象去除器313可适用于组合方法。例如,混叠现象去除器313可适用于匹配到检测到混叠现象的增益,适用于对限制增益差或增益比率到或低于预先确定的阈值的其它子带限制增益。
用上面的配置,只是调整影响声音质量的混叠现象的子带的增益,可对其它子带使用在接收的比特流中指出的增益水平。因此可以防止由于混叠现象的声音质量的退化,也可以防止由于增益不匹配的声音退化。例如,当混叠现象去除器313使用如上面描述的增益匹配的方法时,如果混叠现象检测装置315使用检测条件1,增益可调整到在至少两个子带的单元中传输的增益水平。如果混叠现象检测装置315使用检测条件2或检测条件3,增益可调整到在至少四个子带的单元中接收的增益水平。
应该注意,表示子带信号的频率分布的斜率的参数可由计算涉及时间基的多个参数确定,然后平滑处理这些参数。
此外,当用作为表示子带信号的频率分布的斜率的参数的线性预测系数或反射系数用作为在常规带宽扩展装置的中间参数时,可以分享这些参数的全部或部分,因此降低处理要求的运算数量。
实施例3
在上面第二实施例中的混叠现象检测装置315中,预先确定的阈值与各子带的反射系数比较,并基于这些值之间的关系检测并输出为混叠现象是否出现的二进制值。当用二进制值检测方法估计值接近阈值变化时,出现/不出现混叠现象的检测值频繁地变化。调整或不调整增益的复杂跟踪不利的影响声音的质量。
因此,在本实施例中,混叠现象检测装置315检测混叠现象的出现度。即,胜于使用二进制值简单的指出是否检测出混叠现象,由表示混叠现象的出现度的连续值指出混叠现象的出现。因此基于此连续值调整增益获得光滑的转变。可以抑止由增益调整和不调整的转换引起的突然变化,因此降低产生的声音质量的退化。应该注意到根据第三实施例的音频解编设备的配置是与显示在图2中的第二实施例的配置是相同的。
下面描述表示混叠现象的出现度的值。
当检测两个子带之间的混叠现象时,可以从下面的关系计算在子带m中的混叠度d[m]。
i)当m是偶数和K1[m]<q,K1[m-1]<q时:
  如果K1[m]>K1[m-1],
      则d[m]=(-K1[m]+q)/p
  如果K1[m]≤K1[m-1],
      则d[m]=(-K1[m-1]+q)/p
ii)当m是奇数和K1[m]>-q,K1[m-1]>-q时:
  如果K1[m]>K1[m-1],
      则d[m]=(K1[m-1]+q)/p
  如果K1[m]≤K1[m-1],
      则d[m]=(K1[m]+q)/p
iii)否则
    d[m]=0
其中p和q是预先确定的阈值,优选的p=q=近似0.25。d[m]的上限也优选的限制到1.0。
用混叠现象度d[m]调整子带m和子带m-1的增益g[m]和g[m-1]如下。
当[m]>g[m-1]时,
g[m]=(1.0-d[m])·g[m]+d[m]·g[m-1]当g[m]<g[m-1]时,
g[m-1](1.0-d[m])·g[m-1]+d[m]·g[m]
当用检测条件2或检测条件3检测在三个子带之间的混叠现象联合用检测条件1检测在两个子带之间的混叠现象时,可以用下面的方法计算混叠现象出现度d[m]。
首先,对所有的m,设置d[m]为0.0。然后,使用下面的方法以升序确定m的d[m]和d[m-1]。
首先,如果检测条件1是真,然后d[m]=1.0。其次,只是如果检测条件2或检测条件3是真,混叠现象度d[m]设置如下。
i)当m是偶数时:
  如果,d[m]=0.0,
      则d[m]=(K1[m-2]-K1[m]-T)/s
  如果,d[m-1]=0.0,
  则d[m-1]=(K1[m-2]-K1[m]-T)/s
ii)当m是奇数时:
   如果d[m]=0.0,
      则d[m]=(K1[m]-K1[m-2]-T)/s
  如果d[m-1]=0.0,
则d[m-1]=(K1[m]-K1[m-2]-T)/s
其中T和s是预先确定的阈值,优选的近似T=0.8和s=0.4。d[m]的上限也优选的限制到1.0。
用下面的方法也可计算混叠现象出现度d[m]。
首先,对所有的m,设置d[m]为0.0。然后,使用下面的方法以升序确定m的d[m]和d[m-1]。
首先,如果检测条件1是真,然后d[m]=1.0。其次,只是如果检测条件2或检测条件3是真,混叠现象出现度d[m]和d[m-1]设置如下。
i)当m是偶数时:
  如果,d[m]=0.0,
      则d[m]=(K1[m-2]-K1[m]-abs(K1[m-1]))
  如果,d[m-1]=0.0,
      则d[m-1]=(K1[m-2]-K1[m]-abs(K1[m-1]))
ii)当m是奇数时:
  如果d[m]=0.0,
      则d[m]=(K1[m]-K1[m-2]-abs(K1[m-1]))
  如果d[m-1]=0.0,
      则d[m-1]=(K1[m]-K1[m-2]-abs(K1[m-1]))
注意abs()表示提供绝对值的函数。
例如,当使用如上面描述的以升序匹配两个子带之间的增益调整三个子带之间的增益时,根据子带m和m-1的混叠现象出现度d[m]增益,增益g[m]和g[m-1]可调整如下。
当g[m]>g[m-1]时:
  g[m]=(1.0-d[m])·g[m]+d[m]·g[m-1]
当g[m]<g[m-1]时:
  g[m-1]=(1.0-d[m])·g[m-1]+d[m]·g[m]
使用由上面描述确定的混叠现象出现度d[m]调整增益,当基于简单指出是否检测出出现混叠现象的二进制值调整增益时,可以抑止由增益调整处理的转换引起的声音退化。
此外考虑参考图4A和图4B描述的特性1,为了降低在连续子带中的多路混叠失真,可以使用特性1计算调整增益的混叠现象出现度d[m]。
更特殊的是,如在图4A中显示的情况中,在子带m中的镜像频率分量的幅度大于子带m-2的镜像频率分量的幅度,因此在子带m中混叠现象出现度大于在子带m-2中的出现度。相反,如在图4B中显示的情况中,在子带m-2中的混叠现象出现度大于在子带m中的出现度。因此,考虑特性1根据设置混叠现象出现度d[m]的失真度减少混叠失真是可能的。可以从下面的公式获得根据此特性设置的混叠现象出现度d[m]。
     d[m]=1-K1[m-1]·K1[m-1]
  或
     d[m]=1-abs(K1[m-1])
因为当K1[m-1]]=0时混叠现象出现度d[m]成为1(或最大值)时,此方法是优选的。这是因为当在图4A和图4B中的子带m-1中的低频音调和高频音调的幅度是相同的时,子带m-1的频率分布的斜率成为零,即,反射系数K1[m-1]成为零,在子带m-1和子带m中的镜像频率分量是相同的水平,因此其混叠现象出现度必须是相同的。
下面描述基于由特性1确定的优先次序计算混叠现象出现度d[m]的方法的例子。注意下面描述的方法基于检测条件2或检测条件3在三个子带上用作叠现象检测,并于检测条件1检测两个子带之间的混叠现象
首先从下面的公式确定混叠现象出现度d[m]。
i)当m是偶数时:
  如果K1[m]<0和K1[m-1]<0,
      则d[m]=S,
  如果K1[m]<0和K1[m-1]<0和K1[m-2]>0,
      则d[m-1]=1-K1[m-1]·K1[m-1],
  如果K1[m]<0和K1[m-1]≥0和K1[m-2]>0,
      则d[m]=1-K1[m-1]·K1[m-1]
ii)当m是奇数时:
  如果K1[m]>0和K1[m-1]>0,
      则d[m]=S,
  如果K1[m]>0和K1[m-1]>0和K1[m-2]<0,
      则d[m-1]=1-K1[m-1]·K1[m-1]
  如果K1[m]>0和K1[m]≤0和K1[m-2]<0,
      则d[m]=1-K1[m-1]·K1[m-1]
iii)否则
  d[m]=0
其中S是预先确定的值,优选的近似S=1.0。注意用目标子带的反射系数可以合适的建立S值。
例如,如果使用正像上面描述的方法如上面描述的在升序的两个子带之间匹配增益,根据子带m和m-1的混叠现象出现度d[m]调整三个子带之间的增益,子带m和子带m-1的增益g[m]和g[m-1]可调整如下。
当g[m]>g[m-1]时:
  g[m]=(1.0-d[m])·g[m]+d[m]·g[m-1]
当g[m]<g[m-1]时:
  g[m-1]=(1.0-d[m])·g[m-1]+d[m]·g[m]
应注意到,任何特性可用作为表示混叠现象出现度的d[m],只要当根据混叠现象出现度d[m]出现混叠时平滑的改变增益调整的最大量,并且当根据混叠现象出现度d[m]不出现混叠时平滑的改变增益调整的最小量。
此外,参考时间基准可以计算并平滑表示混叠现象出现度的多个值,用作为混叠现象出现度d[m]。
实施例4
图5是显示本发明第四实施例的音频解码设备的原理框图。在除了来自分析滤波器组103的低频子带信号617外来自比特流多路分解器101的高频分量信息输入到混叠现象检测器,此解码设备不同于上面描述的本发明第二和第三实施例。
此配置使得混叠现象检测器615能用低频子带信号617和包含在高频分量信息108中的增益信息检测混叠现象。
如上面描述的,当相邻子带之间的增益差是大的时,混叠现象成为问题。此外,如果接近出现混叠现象的原始信号水平是低的,只有混叠信号分量是听得见的,因此产生声音质量的严重退化。
考虑此事实,因而,此实施例的混叠现象检测器615首先参考在高频分量信息108中的增益信息检测相邻子带之间的增益差大于预先确定的水平的子带,然后参考复制到检测的子带中的低频子带信号,并评估各低频子带的水平。如果作为此评估结果的给定子带和相邻子带之间的水平差大于或等于预先确定的阈值,确定此子带是混叠现象可能发生的子带。可以使用子带信号能量,最大幅度,总的幅度,平均幅度或其它值指出各子带的水平。
混叠现象检测器615输出满足以上条件的子带数作为混叠现象检测数据616。然后混叠现象去除器613调整只是由混叠现象检测数据616指出的子带的增益从而抑止混叠现象。
由设置相邻子带同样的增益水平,或限制子带之间的增益差或增益比率到预先确定的阈值或更低能调整增益。当对两个子带设置相同的增益水平时,增益可设置为两个子带的较低增益水平,较高增益水平,或高和低增益水平之间的平均水平(如平均值)。
此外,通常可以用组合的方法防止混叠现象检测器615的检测误差。例如,增益匹配可以适用于检测到混叠现象的子带,增益限制适用于限制增益差或增益比率到或低于预先确定的值其它的子带。
因而此配置只调整认为影响声音质量的混叠现象的子带的增益,并使用其它的子带接收的比特流指出的增益水平。因此能防止由于混叠现象声音质量的退化,也能防止由于不匹配的增益的声音的退化。
实施例5
在上面第一到第四实施例描述的音频解码设备假设高频子带的增益信息包含在高频分量数据中,并只直接调整增益信息。然而,由发送实际的增益信息,或由传送解码的高频子带信号的能量可以传输增益信息。由确定解码后的信号能量和复制到高频子带的低频子带的信号能量之间的比率,在此情况中的解码处理得到增益信息。然而,这需要计算在去除混叠现象前高频子带信号的增益。因此本发明的实施例描述能使用在高频子带解码后发送能量水平的增益信息传输方法的音频解码设备
图6是显示根据本发明的此实施例的音频解码设备的原理框图。如在图中所示的,对显示在第一实施例中的音频解码设备的配置,此音频解码设备加上计算去除混叠现象处理前的高频子带信号增益的增益计算器718。
传输解码高频子带的增益水平的信息108包括两个值:解码后高频子带的能量R,能量R和由加上附加信号的能量之间的比率Q。增益计算器718识别为带宽扩展器104的增益计算部分。此增益计算器718从这两个值计算高频子带的增益g,即,能量R和比率Q,和低频子带信号617的能量E。
  g=sqrt(R/E/(1+Q))
其中sqrt表示平方根算子。
然后计算的各子带的增益信息719与由在第一实施例中描述的同样处理的去除混叠现象的其它高频信息一起发送到混叠现象去除器713,。应该注意到,此增益信息720与附加信号信息发送到附加信息发生器711。此配置使得当代替高频子带增益信息传输高频子带能量值时,能使用本发明的混叠现象去除器(去除装置)。
此外,甚至当传输高频子带能量值时,实施例的混叠现象去除器也能用到第二到第四实施例中计算去除混叠现象前的高频子带信号的增益,并且计算的高频子带的增益输入到混叠现象去除器113。
应该注意到,因为在此实施例中可以使用低频子带信号的能量,可以调整两个相邻子带之间的增益g如下。
用下面的公式首先计算在增益调整前子带m-1和m的总能量Et[m]
   Et[m]=g[m]2·E[m]+g[m-1]2·E[m-1]
其中g[m-1]和g[m]是在增益调整前子带m-1和m的增益,E[m]和E[m-1]分别是相应低频子带信号的能量。
因此,总能量Et[m]设置为目标能量,计算获得目标能量要求的对参考能量(即,低频子带信号能量)的增益。因为此增益表示为目标能量和参考能量的比率的平方根,用下面的公式计算子带m-1和子带m的平均增益Gt[m]
  Gt[m]=sqrt(Et[m]/(E[m]+E[m-1]))
然后用平均增益Gt[m]和在子带m的混叠现象出现度d[m]计算在增益调整后子带m的增益g1[m]。
  g1[m]=d[m]·Gt[m]+(1.0-d[m])·g[m]
子带m的能量变化作为增益调整的结果。可以从下面的公式计算在调整后子带m-1的增益g1[m-1],因为子带m-1的能量等于Et[m]减子带m的能量,防止子带m-1和子带m的总能量Et[m]改变。
  g1[m-1]=sqrt((Et[m]-g1[m]2·E[m])/E[m-1])
如果子带m-1和子带m的增益如上面描述的调整,在增益调整前子带m-1和子带m的总能量和增益调整后子带m-1和子带m的总能量是相同的。换言之,因为不改变两个子带的总能量可以调整各子带的增益,伴随增益调整可以抑止由信号能量的改变引起的声音退化。
此外,子带m-1和子带m的总能量Et[m]从相应低频子带复制的信号计算,并不包含由能量比率Q表示的并加上附加信号的能量分量。因为可以维持从低频子带复制的子带信号的能量分布,不受附加信号的影响,因此可以防止声音质量的退化。
当此增益调整方法用到三个子带上时,计算建立相同增益水平的各子带I(I=m-2,m-1,m)的g[I]2·E[I]值,然后三个值的和用作为Et[m]。调整两个子带之间的增益时,从下面的公式获得平均增益Gt[m],增益调整装置目标子带的增益为匹配Gt[m]。
   Gt[m]=sqrt(Et[m]/(E[m-2]+E[m-1]+E[m]))
当调整增益的子带数是4或更多时也使用此方法。
也注意到,可如前面描述的参考混叠现象去除器113以升序或降序使用此两个子带增益调整处理。
可使用对如下的两个或多个子带的混叠现象出现度d[m]选择性的调整增益。例如,假设在三个子带上调整增益,计算各要调整增益的子带m-2,m-1,m的能量,获得总能量Et[m]如下。
  Et[m]=g[m-2]2·E[m-2]+g[m-1]2·E[m-1]+g[m]2·E[m]然后用此总能量Et[m]从下面的公式计算平均增益的平方G2t[m]。
  G2t[m]=Et[m]/(E[m-2]+E[m-1]+E[m])
然后用G2t[m],临时的计算目标子带I(I=m-2,m-1,m)的增益如下。注意在此实施例中使用平方值内插增益。
  g2[I]=f[I]·G2t[m]+(1.0-f[I])·g2[I]2
其中f[I]是d[I]和d[I+1]的较大值。用此临时的增益g2[I]获得总能量E1t[m]如下。
  E1t[m]=g2[m-2]2·E[m-2]+g2[m-1]2·E[m-1]+g2[m]2·E[m]
注意总能量E1t[m]不是必须等于上面描述的总能量Et[m]。因此,为了防止总能量由于增益调整的变化,可以设置目标子带I(I=m-2,m-1,m)的调整的增益g1[I]为
  g1[I]=sqrt(b·g2[I])
  b=Et[m]/E1t[m]。
不管增益调整的子带数是2或4或更多也可以使用此方法。
如果使用此增益调整方法,当在两个子带之间调整增益时,即使当使用混叠现象出现度d[m]在多于两个的更多子带上调整增益时,在增益调整前的总能量和在增益调整后的总能量是相同的。这意味着,因为不改变总的信号能量可以调整各子带的增益,可以防止伴随增益调整信号能量的变化产生的声音质量的退化。当如上面描述的在两个子带上调整增益时,声音质量也不受附加信号的影响。
当从分析滤波器组103输出的复数值低频子带信号转换为在带宽扩展器104中的实数值低频子带信号,由实数运算产生高频子带信号时,也可以使用在上面的实施例中描述的音频解码设备配置。混叠现象检测处理也可以作用到在带宽扩展器104中转换的实数值低频子带信号。不改变根据本发明的音频解码设备的配置或处理方法,完成这两种情况,由转换从复数值信号到实数值信号的信号处理,即,复数值信号的虚部是0的信号。当使用混叠现象去除处理产生实数值高频子带信号时,此配置用实数运算降低带宽扩展器104执行的运算数量。因此可以抑止由于混叠现象的声音质量的退化。
此外,当分析滤波器组103是实数值系数滤波器组时,也可使用上面描述的音频解码设备配置。由实数值系数分析滤波器组103从频带划分产生的子带信号是实数值信号,因此,在如复数值信号转换为实数值信号时同样的方式产生高频子带信号时,混叠现象成为问题。可以抑止混叠现象的产生,因此用上面任何实施例中描述的音频解码设备的配置可以防止混叠现象引起的声音质量的退化。因为所有的解码运算用实数做的,用此配置能大大的减少执行的运算数量。
由上面本发明的实施例中描述的音频解码设备实现的处理也能用预先确定的编程语言编码的软件程序完成。此软件应用程序也可记录在用作销售的计算机可读的数据记录介质中。
虽然结合特定的实施例描述了本发明,对本领域的技术人员来说许多其它的修正,修改和应用是显见的。因此,本发明不受公开的内容所限制,仅受限于所附的权利要求的范围。
还应注意到,本发明涉及2002年10月15日注册的日本专利申请2002-300490,该专利的内容合并在此作为参考。

音频解码设备和方法.pdf_第1页
第1页 / 共36页
音频解码设备和方法.pdf_第2页
第2页 / 共36页
音频解码设备和方法.pdf_第3页
第3页 / 共36页
点击查看更多>>
资源描述

《音频解码设备和方法.pdf》由会员分享,可在线阅读,更多相关《音频解码设备和方法.pdf(36页珍藏版)》请在专利查询网上搜索。

一种音频解码设备,使用产生多个高频子带信号的带宽扩展器,从划分为多个子带的低频子带信号解码高频分量信号,并传输高频编码的信息。设备装置有混叠现象检测器和混叠现象去除器。混叠现象检测器检测在由带宽扩展器产生的多个高频子带信号中出现混叠信号分量的程度。混叠现象去除器调整通常产生高频子带信号的增益,抑止在高频子带信号中的混叠信号分量。因此,即使当为了降低运算数量使用实数值子带信号时,可以抑止混叠现象的出。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 测量;测试


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1