用于对宽带信号进行有效的编码的感觉加权设备与方法.pdf

上传人:00****42 文档编号:6242904 上传时间:2019-05-25 格式:PDF 页数:39 大小:1.57MB
返回 下载 相关 举报
摘要
申请专利号:

CN99813602.6

申请日:

1999.10.27

公开号:

CN1328682A

公开日:

2001.12.26

当前法律状态:

授权

有效性:

有权

法律详情:

专利实施许可合同备案的生效IPC(主分类):G10L 21/02合同备案号:2018990000105让与人:圣劳伦斯通信公司受让人:高清编解码科技有限责任公司发明名称:用于对宽带声音信号进行有效的编码的感觉加权设备与方法以及使用该设备的蜂窝通信系统申请日:19991027申请公布日:20011226授权公告日:20031105许可种类:独占许可备案日期:20180424|||专利权的转移IPC(主分类):G10L 21/02登记生效日:20170119变更事项:专利权人变更前权利人:沃斯艾格公司变更后权利人:圣劳伦斯通信公司变更事项:地址变更前权利人:加拿大魁北克变更后权利人:美国得克萨斯|||授权|||公开|||实质审查的生效

IPC分类号:

G10L21/02

主分类号:

G10L21/02

申请人:

沃斯艾格公司;

发明人:

布鲁诺·贝塞特; 雷德温·萨拉米; 罗奇·勒福雷

地址:

加拿大魁北克

优先权:

1998.10.27 CA 2,252,170

专利代理机构:

中国国际贸易促进委员会专利商标事务所

代理人:

付建军

PDF下载: PDF下载
内容摘要

用于对一个宽带信号作出响应,产生一个感觉加权的信号的一个感觉加权设备,包括一个信号预加重滤波器,一个合成滤波器计算器,和一个感觉加权滤波器。这个信号预加重滤波器增强这个宽带信号的高频分量,由此产生一个预加重的信号。这个信号预加重滤波器的转移函数的形式为P(z)=1-μz-1,其中μ是值为在0和1之间的一个预加重因子。这个合成滤波器计算器对这个预加重信号作出响应,用于产生合成滤波器系数。最后,这个感觉加权滤波器相对于合成滤波器系数来对这个预加重信号进行滤波,由此产生感觉加权的信号。这个感觉加权滤波器的转移函数的形式为W(z)=A(z/γ1)/(1-γ2z-1),其中0<γ2<γ1≤1,并且γ1,γ2是加权控制值,其转移函数的分母是固定的,由此在一个共振峰区域中对这个宽带信号进行加权基本上可以与对这个宽带信号的一个频谱倾斜分开。

权利要求书

1: 一个感觉加权设备,用于对一个宽带信号作出响应,产生一个 感觉加权的信号,以减少在一个加权宽带信号和一个随后被合成的加 权宽带信号之间的差异,所述感觉加权设备包括: a)一个信号预加重滤波器,对这个宽带信号作出响应,用于增强 这个宽带信号的高频分量,由此产生一个预加重的信号; b)一个合成滤波器计算器,对这个预加重信号作出响应,用于产 生合成滤波器系数;和 c)一个感觉加权滤波器,对这个预加重信号和合成滤波器系数作 出响应,用于相对于合成滤波器系数来对这个预加重信号进行滤波, 由此产生感觉加权的信号,这个感觉加权滤波器的转移函数的分母是 固定的,由此在一个共振峰区域中对这个宽带信号进行加权基本上可 以与对这个宽带信号的一个频谱倾斜分开。
2: 如权利要求1的感觉加权设备,其中所述信号预加重滤波器的 转移函数的形式如下: P(z)=1-μz -1 其中μ是值为在0和1之间的一个预加重因子。
3: 如权利要求2的感觉加权设备,其中所述预加重因子μ是0.7。
4: 如权利要求2的感觉加权设备,其中所述感觉加权滤波器的转 移函数的形式如下: W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
5: 如权利要求4的感觉加权设备,其中γ 2 的值被设置为等于等 于μ。
6: 如权利要求1的感觉加权设备,其中所述感觉加权滤波器的转 移函数的形式如下: W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
7: 如权利要求6的感觉加权设备,其中γ 2 的值被设置为等于等 于μ。
8: 用于对一个宽带信号作出响应,产生一个感觉加权的信号以减 少在一个加权宽带信号和一个随后被合成的加权宽带信号之间的差异 的感觉加权方法,所述感觉加权方法包括: a)对这个宽带信号进行滤波,以产生其高频分量被增强的一 个预加重的信号; b)从这个预加重的信号计算出合成滤波器系数;和 c)相对于合成滤波器系数来对这个预加重信号进行滤波,由 此产生一个感觉加权的语音信号,这个滤波过程包括通过其转移 函数的分母是固定的一个感觉加权滤波器对这个预加重信号进行 处理,由此在一个共振峰区域中对这个宽带信号进行加权基本上 可以与对这个宽带信号的一个频谱倾斜分开。
9: 如权利要求8的用于产生一个感觉加权的信号的方法,其中对 这个宽带信号进行滤波包括使用转移函数为如下形式的滤波器对其进 行滤波: P(z)=1-μz -1 其中μ是值为在0和1之间的一个预加重因子。
10: 如权利要求9的用于产生一个感觉加权的信号的方法,其中 所述预加重因子μ是0.7。
11: 如权利要求9的用于产生一个感觉加权的信号的方法,其中 所述感觉加权滤波器的转移函数的形式如下: W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
12: 如权利要求11的用于产生一个感觉加权的信号的方法,其中 γ 2 的值被设置为等于等于μ。
13: 如权利要求8的用于产生一个感觉加权的信号的方法,其中 所述感觉加权滤波器的转移函数的形式如下: W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
14: 如权利要求13的用于产生一个感觉加权的信号的方法,其中 γ 2 的值被设置为等于等于μ。
15: 用于对一个宽带信号进行编码的一个编码器,这个编码器包 括: a)一个如权利要求1所述的感觉加权设备; b)一个音调码本搜寻设备,对所述感觉加权信号作出响应,用于 产生音调码本参数和一个新的搜寻目标矢量; c)一个新的码本搜寻设备,对所述合成滤波器系数与所述新搜寻 目标矢量作出响应,用于产生新的码本参数;和 d)一个信号形成设备,用于产生包括所述音调码本参数,所述新 的码本参数,和所述合成滤波器系数的一个编码宽带信号。
16: 如权利要求15的编码器,其中所述信号预加重滤波器的转移 函数的形式如下: P(z)=1-μz -1 其中μ是值为在0和1之间的一个预加重因子。
17: 如权利要求16的编码器,其中所述预加重因子μ是0.7。
18: 如权利要求16的编码器,其中所述感觉加权滤波器的转移函 数的形式如下: W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),    其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
19: 如权利要求18的编码器,其中γ 2 的值被设置为等于等于μ。
20: 如权利要求15的编码器,其中所述感觉加权滤波器的转移函 数的形式如下: W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
21: 如权利要求20的编码器,其中γ 2 的值被设置为等于等于μ。
22: 用于向被划分为多个小区的一个大的地理区域提供服务的一 个蜂窝通信系统,包括: a)移动发送器/接收器单元; b)蜂窝基站,相应地位于所述小区中; c)一个控制终端,用于控制在这些蜂窝基站之间的通信; d)在位于一个小区中的每一个移动单元与所述一个小区的这个蜂 窝基站之间的一个双向无线通信子系统,在这个移动单元与这个蜂窝 基站中,所述双向无线通信子系统包括: i)一个发送器,包括一个如权利要求15的对一个宽带信号进行编 码的一个编码器和用于发送这个被编码宽带信号的一个发送电路;和 ii)一个接收器,包括用于接收一个被发送的被编码宽带信号的一 个接收器电路和用于对所接收的被编码宽带信号进行解码的一个解码 器。
23: 如权利要求22的蜂窝通信系统,其中所述信号预加重滤波器 的转移函数的形式如下: P(z)=1-μz -1 其中μ是值为在0和1之间的一个预加重因子。
24: 如权利要求23的蜂窝通信系统,其中所述预加重因子μ是0.7。
25: 如权利要求23的蜂窝通信系统,其中所述感觉加权滤波器的 转移函数的形式如下: W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
26: 如权利要求25的蜂窝通信系统,其中μ被设置为等于γ 2 。
27: 如权利要求22的蜂窝通信系统,其中所述感觉加权滤波器的 转移函数的形式如下: W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
28: 如权利要求27的蜂窝通信系统,其中γ 2 的值被设置为等于μ。
29: 一个蜂窝移动发送器/接收器单元,包括: a)一个发送器,包括如权利要求15的用于对一个宽带信号进行编 码的编码器和用于发送这个被编码宽带信号的一个发送电路;和 b)一个接收器,包括用于接收一个被发送的被编码宽带信号的一 个接收器电路和用于对所接收的被编码宽带信号进行解码的一个解码 器。
30: 如权利要求29的蜂窝移动发送器/接收器单元,其中所述信 号预加重滤波器的转移函数的形式如下: P(z)=1-μz -1 其中μ是值为在0和1之间的一个预加重因子。
31: 如权利要求30的蜂窝移动发送器/接收器单元,其中所述预 加重因子μ是0.7。
32: 如权利要求30的蜂窝移动发送器/接收器单元,其中所述感 觉加权滤波器的转移函数的形式如下: W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),    其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
33: 如权利要求32的蜂窝移动发送器/接收器单元,其中γ 2 的值 被设置为等于μ。
34: 如权利要求29的蜂窝移动发送器/接收器单元,其中所述感 觉加权滤波器的转移函数的形式如下: W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
35: 如权利要求34的蜂窝移动发送器/接收器单元,其中γ 2 的值 被设置为等于μ。
36: 一个蜂窝网络部件,包括 a)一个发送器,包括如权利要求15的用于对一个宽带信号进行编 码的一个编码器和用于发送这个被编码宽带信号的一个发送电路;和 b)一个接收器,包括用于接收一个被发送的被编码宽带信号的一 个接收器电路和用于对所接收的被编码宽带信号进行解码的一个解码 器。
37: 如权利要求36的蜂窝网络部件,其中所述信号预加重滤波器 的转移函数的形式如下: P(z)=1-μz -1 其中μ是值为在0和1之间的一个预加重因子。
38: 如权利要求37的蜂窝网络部件,其中所述预加重因子μ是0.7。
39: 如权利要求37的蜂窝网络部件,其中所述感觉加权滤波器的 转移函数的形式如下: W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
40: 如权利要求39的蜂窝网络部件,其中γ 2 的值被设置为等于μ。
41: 如权利要求36的蜂窝网络部件,其中所述感觉加权滤波器的 转移函数的形式如下: W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
42: 如权利要求41的蜂窝网络部件,其中γ 2 的值被设置为等于μ。
43: 用于向被划分为多个小区的一个大的地理区域提供服务的一 个蜂窝通信系统,包括:移动发送器/接收器单元;蜂窝基站,相应地 位于所述小区中;一个控制终端,用于控制在这些蜂窝基站之间的通 信: 在位于一个小区中的每一个移动单元与所述一个小区的这个蜂窝 基站之间的一个双向无线通信子系统,在这个移动单元与这个蜂窝基 站中,所述双向无线通信子系统包括: a)一个发送器,包括如权利要求15的用于对一个宽带信号进行编 码的一个编码器和用于发送这个被编码宽带信号的一个发送电路;和 b)一个接收器,包括用于接收一个被发送的被编码宽带信号的一 个接收器电路和用于对所接收的被编码宽带信号进行解码的一个解码 器。
44: 如权利要求43的双向无线通信子系统,其中所述信号预加重 滤波器的转移函数的形式如下: P(z)=1-μz -1 其中μ是值为在0和1之间的一个预加重因子。
45: 如权利要求44的双向无线通信子系统,其中所述预加重因子 μ是0.7。
46: 如权利要求44的双向无线通信子系统,其中所述感觉加权滤 波器的转移函数的形式如下:  W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),    其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
47: 如权利要求46的双向无线通信子系统,其中γ 2 的值被设置 为等于μ。
48: 如权利要求43的双向无线通信子系统,其中所述感觉加权滤 波器的转移函数的形式如下: W(z)=A(z/γ 1 )/(1-γ 2 z -1 ),其中0<γ 2 <γ 1 ≤1,并且γ 1 ,γ 2 是加权控制 值。
49: 如权利要求48的双向无线通信子系统,其中γ 2 的值被设置 为等于μ。

说明书


用于对宽带信号进行有效的编码的感觉加权设备与方法

    1本发明的背景

    本发明涉及用于对一个宽带信号(0-7000Hz)作出响应,产生一个感觉加权的信号的一个感觉加权设备与方法,用于减少在一个加权宽带信号和一个随后被合成的加权宽带信号之间的差异。

    2现有技术的简单描述

    很多应用,例如音频/视频电话会议,多媒体,和无线应用,以及互联网和分组网络应用迫切要求高效的数字宽带语音/音频编码技术,并且具有一个好的主观质量/比特速率之间的折衷。直到最近,在语音编码应用中主要是使用在范围为200到3400赫兹内被滤波的电话带宽。但是,为了增加语音信号的清晰度与自然性,迫切要求进行宽带语音应用。在范围为50-7000赫兹内地一个带宽被发现对传送一个面对面语音质量的信号来说是足够的。对音频信号来说,这个频率范围可以给出一个可接受的语音质量,但是这个语音的音频质量仍然比CD质量要差,CD质量的频率范围在20到20000赫兹内。

    一个语音编码器将一个语音信号转换为一个数字比特流,这个数字比特流经过一个通信信道被传送(或者被保存在一个存储媒质中)。这个语音信号被量化(被采样,并且通常被使用每采样16比特来进行量化),并且这个语音编码器的作用是用一个数目较少的比特来表示这些数字采样,而保持一个好的主观语音质量。语音解码器或者合成器对被发送的或者被保存的比特流进行操作,并且将它转换为一个声音信号。

    能够实现一个好的质量/比特速率折衷的最佳现有技术中的一个是所谓的码激励线性预测(CELP)技术。根据这个技术,被采样的语音信号被以连续的L个采样块为单位进行处理,这L个采样通常被称作帧,其中L是某个预定的数目(与10-30毫秒语音相应)。在CELP中,每帧计算一个线性预测(LP)滤波器,并且发送这个线性预测滤波器。然后,这L个采样的帧被划分为更小的块,称作大小为N个采样的子帧,其中L=kN,并且k是一个帧中子帧的数目(N通常与4-10毫秒语音相应)。在每一个子帧中确定一个激励信号,它通常包括两个部分:一个是来自过去的激励(也称作音调的贡献或者适应性码本)和,另一个是来自一个新的码本(也称作固定的码本)。这个激励信号被发送,并且在解码器被使用作为LP合成滤波器的输入来获得被合成的语音。

    在CELP上下文中一个新的码本是一个可以被索引的、N个采样长的序列集合,也被称作N维码矢量。每一个码本序列被一个整数k进行索引,k的范围是1到M,其中M表示码本的大小,通常被表示为一个比特数目b,其中M=2b。

    为了根据这个CELP技术来合成语音,通过使用对语音信号的频谱特征进行建模的、随时间变化的滤波器,从一个码本中滤波出一个合适的码矢量,就可以合成每一个N个采样的块。在编码器的末端,对码本中的所有码矢量或者其一个子集计算被合成的输出(码本搜索)。保留的码矢量是一个根据感觉权重畸变度量,能产生最靠近原始语音信号的合成输出的码矢量。使用一个所谓的感觉加权滤波器来执行这个感觉加权,感觉加权滤波器通常是从LP合成滤波器推导出来的。

    在对电话频带声音信号进行编码中,CELP模型是非常成功的,并且几个基于CELP的编码标准已经被用于很多应用中,并且这个声音信号是带宽限制在200-3400赫兹内的带限信号,并且以每秒8000个采样的速率进行采样。在宽带语音/音频应用中,声音信号的带宽限制在50-7000赫兹,并且以每秒16000个采样的速率被采样。

    当将针对电话频带信号而进行优化的CELP模型应用到宽带信号时,就产生了某些困难,并且需要在这个模型中增加附加的特征来获得高质量的宽带信号。与电话频带的信号相比,宽带信号的动态范围宽得多,当要求用定点运算实现这个算法时(在无线应用中,这是一个基本要求),这就产生了精度的问题。另外,这个CELP模型通常在低频部分(它通常具有较高比例的能量)消耗了大部分编码比特,这通常导致产生一个低通的输出信号。为了克服这个问题,需要对这个感觉加权滤波器进行修改,来适合这个宽带信号,并且为了减少这个动态范围,能够增强高频区域的预加重技术就变得重要了,这能够实现一个较简单的定点实现方式,并且能够确保对这个信号的高频部分进行一个更好的编码。

    在CELP-类型的编码器中,通过使输入语音与在一个感觉加权域内被合成的语音之间的均方误差最小,来搜寻最佳的音调与新的参数。这等价于使加权输入语音与加权合成语音之间的差异最小,其中使用其转移函数W(z)的形式为下述的一个滤波器来执行加权:

    W(z)=A(z/g1)/A(z/g2)    其中0<Γ2<Γ1≤1

    在一个综合分析(AbS)编码器中,分析显示量化误差被加权滤波器的逆,W(z)-1进行加权,这在输入信号中显示了某些共振峰结构。这样,通过对误差整形而利用了人耳的屏蔽特性,以使它在共振峰区域内有更多的能量,其中它将被这些区域中强信号能量所屏蔽。由因子Γ1和Γ2来控制加权的数量。

    这个滤波器在电话信号频带内工作得很好。但是,发现这个滤波器不适合于对宽带信号进行有效的感觉加权。也发现,这个滤波器在对共振峰结构和所需要的并发频谱倾斜结构进行建模时存在内在的缺陷。在宽带信号中,频谱倾斜是很大的,因为低频与高频信号之间具有较宽的动态范围。人们已经建议在滤波器W(z)中增加一个倾斜滤波器,来分别控制倾斜加权与共振峰加权。

    本发明的目的

    本发明的一个目的是提供一个能够适合于宽带信号的感觉加权设备与方法,它使用一个被修改的感觉加权滤波器来获得一个高质量的重构信号,这些设备与方法能够被使用定点算法来进行实现。

    本发明的概述

    更详细地,根据本发明,提供了用于对一个宽带信号作出响应,产生一个感觉加权的信号的一个感觉加权设备,用于减少在一个加权宽带信号和一个随后被合成的加权宽带信号之间的差异。这个感觉加权设备包括:

    a)一个信号预加重滤波器,对这个宽带信号作出响应,用于增强这个宽带信号的高频分量,由此产生一个预加重的信号;

    b)一个合成滤波器计算器,对这个预加重信号作出响应,用于产生合成滤波器系数;和

    c)一个感觉加权滤波器,对这个预加重信号和合成滤波器系数作出响应,用于相对于合成滤波器系数来对这个预加重信号进行滤波,由此产生感觉加权的信号。这个感觉加权滤波器的转移函数的分母是固定的,由此在一个共振峰区域中对这个宽带信号进行加权基本上可以与对这个宽带信号的一个频谱倾斜分开。

    本发明也涉及用于对一个宽带信号作出响应,产生一个感觉加权的信号的一个感觉加权方法,用于减少在一个加权宽带信号和一个随后被合成的加权宽带信号之间的差异。这个感觉加权方法包括:对这个宽带信号进行滤波,以产生其高频分量被增强的一个预加重的信号;从这个预加重的信号计算出合成滤波器系数;和相对于合成滤波器系数来对这个预加重信号进行滤波,由此产生一个感觉加权的语音信号。这个滤波过程包括通过其转移函数的分母是固定的一个感觉加权滤波器对这个预加重信号进行处理,由此在一个共振峰区域中对这个宽带信号进行加权基本上可以与对这个宽带信号的一个频谱倾斜分开。

    根据本发明的优选实施方式:

    -减少这个动态范围包括通过其转移函数的形式为如下的一个加权滤波器对这个宽带信号进行滤波:

    P(z)=1-μz-1

    其中μ是值为在0和1之间的一个预加重因子;

    -这个预加重因子μ是0.7;

    -这个感觉加权滤波器的转移函数的形式为如下:

    W(z)=A(z/γ1)/(1-γ2z-1),其中0<γ2<γ1≤1,并且γ1,γ2是加权控制值;并且

    -这个变量γ2的值被设置为等于等于μ。

    所以,通过组合一个预加重滤波器和一个被修改的加权滤波器来将高主观质量的解码宽带声音信号送入到滤波器W(z)中,由此分别控制倾斜加权与共振峰加权,而获得对量化误差的整体感觉加权。

    相应地,对现有技术的简单描述中存在的问题的解决方法就是在输入引入一个预加重滤波器,根据这个预加重信号来计算合成滤波器系数,并且通过固定其分母来使用一个被修改的感觉加权滤波器,这个预加重滤波器将这个宽带信号修改成更适合定点实现,并且改善了频谱的高频部分的编码。

    本发明进一步涉及用于对一个宽带信号进行编码的一个编码器,这个编码器包括:a)一个感觉加权设备,如上面所描述的;b)一个音调码本搜寻设备,对感觉加权信号作出响应,用于产生音调码本参数和一个新的搜寻目标矢量;c)一个新的码本搜寻设备,对这个合成滤波器系数与这个新搜寻目标矢量作出响应,用于产生新的码本参数;和d)一个信号形成设备,用于产生包括这个音调码本参数,新的码本参数,和合成滤波器系数的一个编码宽带信号。

    另外,根据本发明,提供了:

    -用于向被划分为多个小区的一个大的地理区域提供服务的一个蜂窝通信系统,包括:a)移动发送器/接收器单元;b)蜂窝基站,相应地位于这个小区中;c)一个控制终端,用于控制在这些蜂窝基站之间的通信;d)在位于一个小区中的每一个移动单元与这个小区的这个蜂窝基站之间的一个双向无线通信子系统,在这个移动单元与这个蜂窝基站中,这个双向无线通信子系统包括:

    i)一个发送器,包括用于如上面所描述的、对一个宽带信号进行编码的一个编码器和用于发送这个被编码宽带信号的一个发送电路;和

    ii)一个接收器,包括用于接收一个被发送的被编码宽带信号的一个接收器电路和用于对所接收的被编码宽带信号进行解码的一个解码器。

    -一个蜂窝移动发送器/接收器单元,包括:

    a)一个发送器,包括用于如上面所描述的、对一个宽带信号进行编码的一个编码器和用于发送这个被编码宽带信号的一个发送电路;和

    b)一个接收器,包括用于接收一个被发送的被编码宽带信号的一个接收器电路和用于对所接收的被编码宽带信号进行解码的一个解码器。

    -一个蜂窝网络部件,包括

    a)一个发送器,包括用于如上面所描述的、对一个宽带信号进行编码的一个编码器和用于发送这个被编码宽带信号的一个发送电路;和

    b)一个接收器,包括用于接收一个被发送的被编码宽带信号的一个接收器电路和用于对所接收的被编码宽带信号进行解码的一个解码器。

    -在位于一个小区中的每一个移动单元与这个小区的这个蜂窝基站之间的一个双向无线通信子系统,在这个移动单元与这个蜂窝基站中,这个双向无线通信子系统包括:

    a)一个发送器,包括用于如上面所描述的、对一个宽带信号进行编码的一个编码器和用于发送这个被编码宽带信号的一个发送电路;和

    b)一个接收器,包括用于接收一个被发送的被编码宽带信号的一个接收器电路和用于对所接收的被编码宽带信号进行解码的一个解码器。

    通过示例并且参考附图,并且在阅读下面关于其一个优选实施方式的非限制性描述的基础上,就可以更清楚本发明的目的,优点,和其它特征。

    图的简单描述

    在附图中:

    图1是宽带编码设备的一个优选实施方式的一个示意图框图;

    图2是宽带解码设备的一个优选实施方式的一个示意图框图;

    图3是音调分析设备的一个优选实施方式的一个示意图框图;和

    图4是一个蜂窝通信系统的一个简化的、示意图框图,其中图1的宽带编码设备与图2的宽带解码设备可以被使用。

    如该领域内普通技术人员众所周知的,一个蜂窝通信系统,例如401(见图4)通过将一个范围很大的地理区域划分为数目C的、面积较小的小区,而在这个范围很大的地理区域上提供了一个电信服务。这C个面积较小的小区分别被相应的蜂窝基站4021,4022,…,402C来提供服务,这些基站向每一个小区提供无线信令,音频和数据信道。

    无线信令信道被用于向在这个蜂窝基站402的覆盖区域(小区)的限度内的移动无线电话(移动发送器/接收器单元),例如403发送寻呼消息,并且发起到位于这个基站的小区内或者外面的其它无线电话403的电话呼叫,或者发起到另一个网络,例如公众交换电话网络(PSTN)404的电话呼叫。

    一旦一个无线电话403已经成功地发起了一个电话呼叫,或者成功地接收到一个呼叫,就在这个无线电话403和与这个无线电话403所处小区相应的蜂窝基站402之间建立一个音频或者数据信道,并且经过这个音频或者数据信道,在这个基站402与无线电话403之间进行通信。这个无线电话403也可能在正在进行一个呼叫的同时经过一个信令信道接收控制或者定时信息。

    如果当一个呼叫正在进行时,一个无线电话403已经离开一个小区,并且进入另一个相邻的小区,这个无线电话403将这个呼叫越区切换到新小区基站402的一个可用音频或者数据信道。如果没有呼叫正在进行时,一个无线电话403离开一个小区并且进入另一个相邻的小区,这个无线电话403经过这个信令信道发送一个控制消息来登录到这个新小区的基站402。使用这个方法,可用在一个范围很宽的地理范围内提供移动通信服务。

    这个蜂窝通信系统401进一步包括一个控制终端405,这个控制终端用于控制在蜂窝基站402与PSTN 404,例如在一个无线电话403和PSTN 404之间进行一个通信的期间,之间的通信,或者用于控制在位于一第一小区内无线电话403与位于一第二小区内无线电话403之间的通信。

    当然,为了在一个小区的基站402与位于这个小区内的一个无线电话403之间建立一个音频或者数据信道,就需要一个双向无线通信子系统。如图4的很简单形式所显示的,这样一个双向无线通信子系统典型地在无线电话403中包括:

    -一个发送器406,包括:

    -一个编码器407,用于对语音信号进行编码;和

    -一个发送电路408,用于通过一个天线,例如409来发送来自编码器407的这个被编码语音信号;和

    -一个接收器410,包括:

    -一个接收器电路411,用于通常通过相同的天线409接收一个被发送的编码语音信号;和

    -一个解码器412,用于对来自接收电路411的所接收被编码语音信号进行解码。

    这个无线电话进一步包括编码器407和解码器412均连接到其上、并且用于处理其上的信号的其它传统无线电话电路413,该领域内的普通技术人员对这个电路413是很熟悉的,并且相应地,将不在本发明的说明中进行进一步的描述。

    另外,典型地,这样一个双向无线射频通信子系统在基站402中包括:

    -一个发送器414,包括:

    -一个编码器415,用于对这个语音信号进行编码;和

    -一个发送电路416,用于通过一个天线,例如417发送来自编码器415的这个被编码语音信号;和

    -一个接收器418,包括:    

    -一个接收电路419,用于通过相同的天线417或者通过另一个天线(没有显示)来接收一个被发送的编码语音信号;和

    -一个解码器420,用于对来自这个接收电路419的这个被接收编码语音信号进行解码。

    典型地,这个基站402进一步包括一个基站控制器421及其相关数据库422,用于控制在控制终端405与发送器414和接收器418之间的通信。

    如该领域内的技术人员众所周知的,为了减少通过双向无线射频通信子系统,即在一个无线电话403与一个基站402之间,发送声音信号,例如语音,所需要的带宽,就需要语音编码。

    典型地,工作在13k比特/秒并且低于码激励线性预测(CELP)的LP语音编码器(例如415,和407)通常使用一个LP合成滤波器来建立关于这个语音信号的短期频谱包络的模型。典型地,这个LP信息被以每10或者20毫秒的间隔发送到这个解码器(例如420和412),并且在解码器的末端被提取出来。

    本发明说明中所公开的新技术可以被用于不同的基于LP的编码系统中。但是,一个CELP类型的编码系统被用于本发明的优选实施方式中,以提供这些技术的一个非限制性描述。以相同的方式,这样的技术可以被用于除声音和语音信号以外的其它声响信号以及其它类型的宽带信号。

    图1显示了被修改成能够更好地容纳宽带信号的一个CELP类型的语音编码设备100的一个一般框图。

    被采样的输入语音信号114被划分成连续的L个采样模块,称作“帧”。在每一个帧中,表示这个帧中语音信号的不同参数被计算,被编码,并且被发送。表示LP合成滤波器的LP参数通常在每一个帧被计算一次。这个帧被进一步分成更小的、N个采样的块(块的长度为N),其中激励参数(音调和不同(pitch and innovation))被定义。在这个CELP结构中,这些长度为N的块被称作子帧,并且子帧中的N个采样信号被称作一个N维的矢量。在这个优选实施方式中,这个长度N与5毫秒相应,而长度L与20毫秒相应,这意味着一个帧包括4个子帧(采样率为16kHz时N=80,下采样到12.8kHz时,N=64)。在这个编码过程中,可以出现各种N维的矢量。在图1和2中可能将出现的矢量列表和被发送参数的一个列表被给出,如下:

    主N维矢量的列表

    s宽带信号输入语音矢量(在下采样,预处理,和预加重后);

    sw被加权的语音矢量;

    s0加权合成滤波器的零输入响应;

    sp被下采样的预处理信号;

    被过采样的合成语音信号;

    s′在去加重前的合成信号;

    sd被去加重的合成信号;

    sh在去加重和后处理后的合成信号;

    x音调搜寻的目标矢量;

    x′新搜寻的目标矢量;

    h加权合成滤波器脉冲响应;

    vT延迟T后的适应(音调)码本矢量;

    yT被滤波的音调码本矢量(vT与h进行卷积);

    ck在索引k(新码本中的第k个表目)处的新码矢量;

    cf被增强的、被伸缩的(scaled)新码矢量;

    u激励信号(被伸缩的新和音调码矢量);

    u′增强的激励;

    z带通噪声序列;

    w′白噪声序列;和

    w被伸缩的噪声序列。

    被发送参数的列表:

    STP短期预测参数(定义了A(z));

    T音调延迟(或者音调码本索引);

    b音调增益(或者音调码本增益);

    j音调码矢量上所使用低通滤波器的阶数;

    k码矢量索引(新码本表目);和

    g新码本增益。

    在这个优选实施方式中,STP参数被每帧传送一次,余下的参数在每帧被发送4次(每子帧被发送一次)。

    编码器侧

    被采样的语音信号被图1的这个编码设备100一块接一块地进行编码,其中编码设备100被分成11个模块,其编号从101到111。

    输入的语音被处理成上面所描述的L个采样块,称作帧。

    参考图1,被采样的输入语音信号114在一个下采样模块101中被进行下采样。例如,这个信号被16kHz下采样到12.8kHz,所使用的技术是该领域内技术人员众所周知的。当然,也可以设想,将其下采样到另一个频率。下采样增加了编码效率,因为仅需要编码一个更小带宽的频带。这也降低了算法的复杂程度,因为一个帧中的采样数目减少了。当比特速率下降到16kbit/s时,下采样的使用就变得非常重要了,尽管在16kbit/s以上时,下采样不是必不可少的。

    在进行下采样后,20毫秒的320个采样被减少到256个采样的帧(下采样的比例为4/5)。

    然后,输入帧被提供到可选的预处理块102。预处理块102可能包括其截止频率为50赫兹的一个高通滤波器。高通滤波器102去除在50赫兹以下的、不希望有的声音部分。

    下采样的预处理信号被表示为sp(n),n=0,1,2,…,L-1,其中L是帧的长度(在采样速率为12.8kHz时,为256)。在预加重滤波器103的一个优选实施方式中,这个信号sp(n)被使用具有下述转移函数的一个滤波器进行预加重:

    P(z)=1-μz-1

    其中μ是值为在0和1之间的一个预加重因子(典型的值为0.7)。也可以使用一个高阶的滤波器。应指出的是,高通滤波器102和预加重滤波器103可以被进行交换来获得更有效的定点实施方式。

    预加重滤波器103的功能是增强输入信号的高频分量。它也减少了输入语音信号的动态范围,这使它更能够适合于进行定点运算实现方式。如果没有进行预加重,使用单精度算法的定点LP分析是难以实现的。

    预加重也在实现一个量化错误的合适整体感觉加权上起到了重要的作用,这能够改善声音质量。下面,将更详细地解释这一点。

    预加重滤波器103的输出被表示为s(n)。这个信号被用于在计算器模块104中执行LP分析。LP分析是该领域内一个普通技术人员众所周知的一个技术。在这个优选实施方式中,使用了自相关的方法。在这个自相关的方法中,这个信号s(n)首先被使用一个汉明窗(通常,长度为30-40毫秒的量级)进行加窗处理。自相关是从加窗的信号计算出来的,并且Levinson-Durbin递归方法被使用来计算LP滤波器系数,ai,其中i=1,…,p,并且p是LP的阶数,在宽带编码中其典型的值是16。参数ai是LP滤波器的转移函数的系数,它由下述关系给出:A(z)=1+Σi=1Paiz-1]]>

    LP分析是在计算器模块104中被执行的,计算器模块104也执行LP滤波器系数的量化与内插。LP滤波器系数首先被变换为另一个等价的域,以更适合于进行量化和进行内插处理。这个线谱对(LSP)和导抗频谱对(ISP)域是两个可以在其中进行有效的量化和内插处理的域。16个LP滤波器系数,ai,可以被使用分隔或者多级量化,或者它们的组合来量化为30-50个比特的量级。内插的目的是能够在每一个子帧更新LP滤波器的系数,而在每一个帧才发送一次,这改善了编码器的性能而没有增加比特速率。LP滤波器系数的量化与内插也应是该领域内普通技术人员众所周知的,所以,在本发明的说明中不详细描述它。

    下面的段落将描述在一个子帧上执行的编码操作的余下部分。在下面的描述中,滤波器A(z)表示子帧没有被量化与内插的LP滤波器,而滤波器表示子帧的被量化与内插LP滤波器。

    感觉加权:

    在一个基于综合分析的编码器中,通过在一个感觉加权域中对输入语音和被合成的语音之间的均分误差最小,来搜寻最佳的音调与新参数。这等价于将在被加权的输入语音与被加权的合成语音之间的误差最小化。

    在一个感觉加权滤波器105中,计算被加权的信号sw(n)。传统地,通过如下转移函数的加权滤波器来计算这个被加权的信号sw(n):

    W(z)=A(z/γ1)/A(z/γ2),    其中0<γ2<γ1≤1

    如该领域内普通技术人员众所周知的,在现有技术的综合分析(AbS)编码器中,分析显示量化误差被一个转移函数w-1(z)所加权,这个转移函数是感觉加权滤波器105的转移函数的逆。这个结果被B.S.Atal和M.R.Schroeder在1979年6月,在IEEE TransactionASsP,Vol.27,no.3的第247-254页上进行了很好的描述。转移函数w-1(z)显示了输入语音信号的某些共振峰结构。这样,通过对量化误差进行整形,以使它在共振峰区域中具有更有的能量,就利用了人耳的屏蔽特性利用,在共振峰区域中,它将被这些区域中的强信号能量所屏蔽(masked)。加权的数量是用因子γ1和γ2所控制的。

    上面的传统感觉加权滤波器105在电话频带信号上工作得很好。但是,发现这个传统的感觉加权滤波器105不适合于对宽带信号进行有效的加权。同时,也发现,传统的感觉加权滤波器105在对共振峰结构和同时需要的频谱倾斜进行建模时存在内在的缺陷。因为低频与高频之间的宽动态范围,这个频谱倾斜在宽带信号中是更显著的。现有技术已经建议在W(z)中增加一个倾斜滤波器,来分别控制宽带输入信号的倾斜与共振峰加权。

    对这个问题的一个新的解决方法是,根据本发明,在输入引入预加重滤波器103,根据预加重的语音s(n)来计算这个LP滤波器A(z),并且通过固定其分母使用一个被修改的滤波器W(z)。

    在模块104中,对被预加重的信号s(n)进行LP分析,来获得LP滤波器A(z)。另外,一个新的、具有固定分母的感觉加权滤波器105被使用。这个感觉加权滤波器104的转移函数的一个示例的关系如下:

    W(z)=A(z/γ1)/(1-γ2z-1),其中0<γ2<γ1≤1

    一个更高的阶可以用于分母。这个结构基本上消除了共振峰加权与倾斜之间的相互影响。

    注意,因为A(z)是根据这个预加重语音信号s(n)而计算出来的,所以与当根据这个原始语音计算A(z)时的情形相比,滤波器1/A(z/γ1)的倾斜就不太明显了。因为使用具有下面的转移函数的一个滤波器来在解码器末端进行去加重的:

    P-1(z)=1/(1-μz-1)

    量化误差频谱被其转移函数为W-1(z)P-1(z)的一个滤波器进行整形。当γ2被设置成与μ相等时,典型地就是这样的情形,量化误差的频谱被其转移函数为1/A(z/γ1)的一个滤波器进行整形,并且A(z)是根据预加重的语音信号而计算出来的。主观的听显示,除了能够容易用定点算法实现方式来实现的优点外,用于通过预加重和修改的加权滤波的组合来获得对误差的整形的这个结构在对宽带信号进行编码时是非常有效的。

    音调分析:

    为了简化这个音调分析,首先使用加权语音信号sw(n)在开环音调搜寻模块106中估计一个开环音调延迟TOL。然后,对每一个子帧,在闭环音调搜寻模块107中执行这个闭环音调分析,并且这个闭环音调分析被限制在开环音调延迟TOL的附近,这大大减少了LTP参数T和b(音调延迟和音调增益)的搜寻复杂程度。通常,开环音调分析是每10毫秒(两个子帧)在模块106中被执行一次,所使用的技术是该领域内普通技术人员众所周知的。

    首先计算LTP(长期预测)分析的目标矢量x。这通常是从被加权语音信号sw(n)中减去加权合成滤波器W(z)(z)的零输入响应s0来完成的。这个零输入响应s0是通过一个零输入响应计算器模块108来计算的。更详细地,使用下面的关系来计算这个目标矢量x:

    x=sw-s0

    其中x是N维目标矢量,sw是子帧中被加权的语音矢量,s0是滤波器W(z)/(z)的零输入响应,因为其初始状态,s0是组合滤波器W(z)(z)的输出。零输入响应计算器108对来自LP分析的量化内插LP滤波器(z)作出响应,对量化与内插计算器104和被保存在存储器模块111中的加权合成滤波器W(z)(z)的初始状态作出响应,来计算滤波器W(z)(z)的零输入响应s0(通过将输入设置为零而确定的初始状态所产生的这部分响应)。这个操作对该领域内的普通技术人员来说是众所周知的,所以,将不进行进一步的描述。

    当然,可以使用替代的但是在数学上等价的方法来计算目标矢量x。

    加权合成滤波器W(z)(z)的一个N维脉冲响应矢量h被使用来自模块104的LP滤波器系数A(z)和(z)在脉冲响应产生器109中进行计算。另外,这个操作对该领域内的普通技术人员来说是众所周知的,所以,在本发明的说明中将不进行进一步的描述。

    闭环音调(或者音调码本)参数b,T和j是在闭环音调搜寻模块107中被计算的,它使用了目标矢量x,脉冲响应矢量h和开环音调延迟TOL作为输入。传统地,这个音调预测已经被具有下面的转移函数的一个音调滤波器所表示:

    1/(1-bz-T)

    其中,b是音调的增益,而T是音调的延迟或者延迟。在这个情形下,音调对激励信号u(n)的音调贡献被表示为bu(n-T),其中总的激励为:

    u(n)=bu(n-T)+gck(n)

    其中g是新的码本增益,ck(n)是在索引k处的新的码矢量。

    如果这个音调延迟T比子帧程度N小,那么这个表达式就具有局限性。在另一个表达式中,这个音调的贡献可以被看作包括过去激励信号的一个音调码本。一般来说,在这个音调码本中的每一个矢量是前一个矢量的一个移位1的版本(丢弃了一个采样并且增加了一个采样)。对音调延迟T>N来说,这个音调码本与滤波器结构(1/1-bz-T)等价,并且音调延迟为T的一个音调码本矢量vT(n)如下:

    vT(n)=u(n-T),n=0,…,N-1

    对音调延迟T比N小的情形,一个矢量vT(n)通过从过去激励起直到这个矢量被完成这段期间重复可用采样而建立(这并不与滤波器的结构等价)。

    在最近的编码器结构中,一个高阶的音调分辨率被使用,它能够大大改善浊音声响段(voiced sound segment)的质量。这个是通过多相内插滤波器对过去的激励信号进行过采样而实现的。在这个情形下,矢量vT(n)通常与过去激励的一个内插版本相应,其音调延迟T为一个非整数延迟(例如,50.25)。

    这个音调搜寻包括寻找最近的音调延迟T和增益b,来使在目标矢量x与被缩放的被滤波过去建立之间的均方加权误差E最小。误差E可以表示为:

    E=‖x-byT‖2

    其中yT是音调延迟为T的被滤波音调码本矢量:yT(n)=vT(n)*h(n)=Σi=0nvT(i)h(n-i),n=0,...,N-1]]>

    可以证明,通过使搜寻准则最大,就可以使误差E最小:C=xtyTytTyT]]>

    其中t表示矢量转置。

    在本发明的这个优选实施方式中,使用了一个1/3的子采样音调分辨率,并且这个音调(音调码本)搜寻包括3个阶段。

    在第一个阶段,对被加权语音信号sw(n)作出响应,一个开环音调延迟TOL被在开环音调搜寻模块106中进行估计。如在前面描述中所指出的,这个开环音调分析通常是每10毫秒(两个子帧)执行一次,并且使用了为该领域内普通技术人员众所周知的技术。

    在第二个阶段,对在被估计的开环音调延迟TOL附近的整数音调延迟(通常是±5),在闭环音调搜寻模块107中搜寻这个搜寻准则C,这大大简化了这个搜寻过程。一个简单的过程被用于来更新被滤波的码矢量yT,而不需要对每一个音调延迟均计算卷积。

    一旦在第二阶段找到一个最佳的整数音调延迟,这个搜寻的一第三阶段(模块107)就测试在这个最佳整数音调延迟附近的小数。

    当这个音调预测器用一个形式为(1/1-bz-T)的一个滤波器进行表示时,这对音调延迟T>N是一个合理的假设,音调滤波器的频谱在整个频谱范围内显示出一个共振峰结构,其一个谐振频率与1/T相关。在宽带信号的情形下,这个结构并不是非常有效的,因为宽带信号中的谐振结构不覆盖整个被延伸的频谱。这个谐振结构仅在到一特定频率的范围内存在,这个特定频率取决于浊音段。这样,为了实现对宽带语音的浊音段内的语音贡献进行有效的表示,这个音调预测滤波器需要具有能够在这个宽带频谱内改变周期性数量的灵活性。

    一个新的、实现对宽带信号的语音频谱谐振结构进行有效地建模的方法已经在本发明说明中被公开,由此,几个形式的低通滤波器被应用到过去的激励,并且选择了具有较高预测增益的那个低通滤波器。

    当使用了子采样音调分辨率时,这些低通滤波器可以被集成在用于获得更高音调分辨率的内插滤波器中。在这个情形下,音调搜寻的第三阶段,即在被选择整数音调延迟附近的小数被测试的阶段,对具有不同低通滤波器特性的几个内插滤波器进行重复,并且选择使搜寻准则C最大的小数和滤波器阶数。

    一个更简单的方法是在上面所描述的3个阶段中完成这个搜寻,来使用具有一特定频率响应的一个内插滤波器确定这个最佳的小数音调延迟,并且通过将不同的预定低通滤波器施加到被选择的音调码本矢量来在末端选择最佳的低通滤波器形状,并且选择使这个音调预测误差最小的低通滤波器。这个方法在下面将被详细地讨论。

    图3显示了所提出这个方法的一个优选实施方式的一个示意图框图。

    在存储器模块303中,过去的激励信号u(n),n<0被保存。这个音调码本搜寻模块301对这个目标矢量x作出响应,对开环音调延迟TOL作出响应,对存储器模块303中的过去的激励信号u(n),n<0作出响应,来进行一个音调码本(音调码本)搜寻来使上面所定义的准则C最小。从模块301中所进行的这个搜寻的结果,模块302产生最佳的音调码本矢量vT。注意,因为使用了一个子采样音调分辨率(小数音调),过去的激励信号u(n),n<0被进行内插,并且这个音调码本矢量vT与被进行内插的过去激励信号相应。在这个优选实施方式中,这个内插滤波器(在模块301中,但是没有显示)具有一个能够去除在7000赫兹以上频率分量的低通滤波器特性。

    在一个优选实施方式中,K滤波器特性被使用;这些滤波器特性可以是低通的,或者带通滤波器特性。一旦这个最佳码矢量vT被这个音调码矢量产生器302所确定和提供,并且分别使用K个不同频率形状的滤波器,例如305(j),其中j=1,2,…,K,来计算K个被滤波的vT矢量版本。这些被滤波的版本分别表示为vf(j),其中j=1,2,…,K。不同的矢量vf(j)在相应的模块304(j)中,其中j=1,2,…,K,被与脉冲响应h进行卷积,来获得矢量y(j),其中j=1,2,…,K。为了对每一个矢量y(j)计算均方音调预测误差,值y(j)通过一个相应的放大器307(j)被乘以增益b,并且通过一个相应的减法器308(j)从目标矢量x中减去值by(j)。选择器309选择能够使均方音调预测误差最小的频率形状的滤波器305(j)。

    e(j)=‖x-b(j)y(j)‖2,j=1,2,…,K

    为了对每一个值y(j)计算均方音调预测误差e(j),值y(j)通过一个相应的放大器307(j)被乘以增益b,并且通过一个相应的减法器308(j)从目标矢量x中减去值b(j)y(j)。使用下面的关系,在与索引为j的频率形状滤波器相关的一个相应增益计算器306(j)中计算每一个增益b(j):

    b(j)=xty(j)/‖y(j)‖2

     在选择器309中,参数b,T,和j被根据使均方音调预测误差e最小的vT或者vf(j)来进行选择。

    现在参考图1,这个音调码本索引T被进行编码,并且被发送到复用器112。这个音调增益b被进行量化,并且被发送到复用器112。使用这个新的方法,就需要额外的信息来在复用器112中对具有被选择频率形状滤波器的索引j进行编码。例如,如果使用了3个滤波器(j=0,1,2,3),就需要两个比特来表示这个信息。这个滤波器索引信息j也可以被与音调增益b一起进行编码。

    新的码本搜寻

    一旦这个音调,或者LTP(长期预测)参数b,T,和j被确定了,下一个步骤就是通过图1的搜寻模块110来搜寻最佳的新激励。首先,通过减去这个LTP的贡献来更新这个目标矢量x:

    x′=x-byT

    其中b是音调增益,yT是被滤波的音调码本矢量(被延迟T的过去激励被使用选择的低通滤波器进行滤波,并且被与上面参考图3所描述的脉冲响应h进行卷积)。

    通过发现使在这个目标矢量与被缩放的被滤波码矢量之间的均方误差最小的最佳激励码矢量ck和增益g,来执行CELP中的这个搜寻过程

    E=‖x′-gHck‖2

    其中H是从这个脉冲响应矢量h推导出来的一个下三角卷积矩阵。

    在本发明的优选实施方式中,通过如美国专利中所描述的一个代数码本,在模块110中执行这个新的码本搜寻,这些美国专利包括:1995年8月22日授权的5,444,816(Adoul等人);在1997年12月17日被授权给Adoul等人的美国专利号5,699,482;在1998年5月19日被授权给Adoul等人的5,754,976;和在1997年12月23日授权的5,701,392(Adoul等人)。

    一旦这个模块110选择了最佳激励码矢量ck和其增益g,这个码本索引k和增益g就被进行编码并且被发送给复用器112。

    现在参考图1,在通过一个通信信道被发送以前,参数b,T,j,,k和g通过复用器112被复用。

    存储器更新

    在存储器模块111(图1)中,通过使用加权合成滤波器对这个激励信号u=gck+bvT进行滤波,来更新被加权合成滤波器W(z)/的状态。在这个滤波后,这个滤波器的状态被记住,并且在下一个子帧时作为初始状态使用来在计算器模块108中计算零输入响应。

    与在目标矢量x的情形相同,可以使用其它替代的、但是在数学上与对该领域内普通技术人员众所周知的方法等价的方法来更新这个滤波器的状态。

    解码器侧

    图2的语音解码设备200显示了在数字输入222(到解复用器217的输入流)和输出采样语音223(加法器221的输出)之间执行的各种步骤。

    解复用器217从在一个数字输入信道上接收的二进制信息中提取这些合成模型参数。从每一个接收的二进制帧中,被提取的参数是:

    -短期预测参数(STP)(每帧一次);

    -长期预测参数(LTP)T,b,和j(对每一个子帧);和

    -新的码本索引k和增益g(对每一个子帧)。

    目前的语音信号是基于这些参数而被合成的,这在下面将更详细地描述。

    新码本218对这个索引k作出响应,来产生通过一个放大器224被放大了解码增益因子g倍的新码矢量ck。在这个优选实施方式中,如在上面所提到的美国专利号5,444,816;5,699,482;5,754,976;和5,701,392中所描述的一个新的码本218被用于表示这个新的码矢量ck。

    在放大器224的输出所产生的被缩放的码矢量ck通过一个新的滤波器205被进行处理。

    周期性的增强:

    在放大器224的输出所产生的被缩放的码矢量通过一个与频率相关的音调增强器205进行处理。

    增强这个激励信号u的周期性改善了浊音段的质量。在过去,这是通过使用形式为1/(1-εbz-T)的一个滤波器对来自新码本(固定码本)218的新矢量进行滤波而实现的,其中ε是在0.5以下的一个因子,它控制了所引入周期性的数目。在宽带信号的情形下,这个方法不是很有效,因为它在整个频谱范围内引入了周期性。一个新的替代方法被公开了,它是本发明的一部分,由此通过使用一个新的滤波器205(F(z))来对来自新码本(固定码本)的新码矢量ck进行滤波,而实现其周期性的增强,这个新滤波器205的频率响应对高频分量的加重比低频分量高。F(z)的系数与激励信号u的周期性的数目相关。

    可以使用对该领域内普通接收人员众所周知的很多方法来获得有效的周期性系数。例如,增益b的值提供了一个周期性的指示。即,如果增益b的值接近1,激励信号u的周期性就高,并且如果增益b的值比0.5小,然后周期性就低。

    在一个优选实施方式中所使用的、用于推导滤波器F(z)系数的另一个有效的方法是将它们与音调对总激励信号u的贡献进行相关。这导致了与子帧周期性相关的一个频率响应,其中对更高的音调增益来说,高频分量被极大的加强(整体斜率更强)。当这个激励信号u的周期性更强时,新滤波器205具有降低新码矢量ck在低频分量上的能量的效果,与高频分量相比,这增强了激励信号u在低频部分的周期性。所建议的新滤波器205的形式是

    (1)F(z)=1-σz-1或者(2)F(z)=-αz+1-αz-1

    其中σ或者α是从激励信号u的周期性程度推导出来的周期性因子。

    第二个3项形式的F(z)被用于一个优选实施方式。在浊音因子产生器204中计算这个周期性因子α。可以使用几个方法来根据激励信号u的周期性推导出周期性因子α。下面显示了两个方法。

    方法1:

    首先,在浊音因子(voicing factor)产生器204中通过下面的关系计算音调对总激励信号u的贡献的比值Rp=b2vTtvTutu=b2Σn=0N-1vT2(n)Σn=0N-1u2(n)]]>

    其中vT是音调码本矢量,b是音调增益,和u是在加法器219由下面的关系所给出的激励信号u:

    u=gck+bvT

    注意项bvT在音调码本(音调码本)201中的源与音调延迟T和被保存在存储器203中的u的过去值相应。然后,使用一个低通滤波器202来处理来自这个音调码本201的音调码矢量vT,这个低通滤波器202的截止频率可以通过来自解复用器217的索引j进行调节。然后,所产生的码矢量vT被一个放大器226乘以来自解复用器217的增益b,以获得信号bvT。

    在浊音因子产生器204中使用下面的关系产生因子α

    α=qRp其约束条件是α<q

    其中q是控制增强数量的一个因子(在这个优选实施方式中,q被设置为0.25)。

    方法2:

    在本发明的一个优选实施方式中所使用的、用于计算周期性因子α的另一个方法在下面将被讨论。

    首先,使用下面的关系来在浊音因子产生器204中产生一个浊音因子rv

    rv=(Ev-Ec)/(Ev+Ec)

    其中Ev是被缩放的音调码矢量bvT的能量,而Ec是被缩放的新码矢量gck的能量。即Ev=b2vTtvT=b2Σn=0N-1vT2(n)]]>和Ec=g2cktck=g2Σn=0N-1ck2(n)]]>

    注意,rv的值在-1和1之间(1相应于纯浊音信号(purely voicedsignal),-1相应于纯清音(purely unvoiced)信号)。

    在这个优选实施方式中,然后使用下面的关系来在浊音因子产生器204中产生一个浊音因子α

    α=0.125(1+rv)

    对纯清音信号来说,这相应于一个值0,对纯浊音信号来说,这相应于值0.25。

    首先,在上面所描述的方法1和2中的,F(z)的两个项形式,周期性因子σ可以被使用σ=2α来进行近似。在这样一个情形下,在上面所描述的方法1中,如下面来计算周期性因子σ:

    σ=2q Rp其约束条件是σ<2q。

    在方法2中,如下面的来计算周期性因子σ:

    σ=0.25(1+rv)

    所以,通过使用新滤波器205(F(z))来对被缩放的新码矢量gck进行滤波,来计算这个被增强的信号cf。

    加法器220这样来计算被增强的激励信号u′:

    u′=cf+bvT

    注意,在编码器100中不执行这个过程。这样,就需要使用没有增强的这个激励信号u来更新音调码本201的内容,来在编码器100与解码器200之间保持同步。所以,这个激励信号u被用于更新音调码本201的存储器203,并且被增强的激励信号u′被用于LP合成滤波器206的输入。

    合成与去加重

    通过其形式为的LP合成滤波器206来对被增强的激励信号u′进行滤波,来计算被合成的信号s′,其中是当前子帧中的内插LP滤波器。如从图2中可以看出的,来自解复用器217的、在线225上的被量化LP系数被提供到LP合成滤波器206,来相应地调节这个LP合成滤波器206的参数。去加重滤波器207是图1中预加重滤波器103的逆。去加重滤波器207的转移函数如下:

    D(z)=1/(1-μz-1)

    其中μ是一个预加重因子,其值为0到1之间(一个典型的值是μ=0.7)。一个高阶的滤波器也可以被使用。

    矢量s′被通过去加重滤波器D(z)(模块207)进行滤波,来获得这个矢量sα,这个矢量通过高通滤波器208,来去除在50赫兹以下的、不希望有的频率分量,并且进一步获得sh。

    过采样与高频再生

    过采样模块209执行图1下采样模块101的逆过程。在这个优选实施方式中,过采样将12.8kHz的采样速率转换为初始的16kHz的采样速率,所使用的技术是该领域内普通技术人员众所周知的。过采样的合成信号被表示为。信号也可以被称作被合成的宽带中间信号。

    过采样合成信号不包括在编码器100中进行下采样过程中(图1的模块101)时所丢失的高频分量。这给出了一个合成语音信号的低通感知。为了恢复原始信号的全频带,公开了一个高频产生过程。这个过程是在模块210到216,和加法器221中被执行的,并且需要来自浊音因子产生器204的输入(图2)。

    在这个新方法中,通过使用在一个激励域中被合适放大的一个白噪声填充在频谱的上部分,来产生高频分量,然后高频分量被转换到语音域,优选使用用于合成下采样信号的相同LP合成滤波器来对这个信号进行整形。

    下面,描述根据本发明的这个高频产生过程。

    这个随机噪声产生器213产生其频谱在整个频谱带宽内是平坦的一个白噪声序列w′,所使用的技术是该领域内普通技术人员众所周知的。所产生的序列的长度是N′,这是初始域中子帧的长度。注意,N是下采样域内子帧的长度。在这个优选实施方式中,N=64和N′=80,这相应于5毫秒。

    在增益调节模块214中,白噪声序列被正确地放大。增益调节包括下面的步骤。首先,所产生的噪声序列w′的能量被设置成与一个能量计算模块210计算的增强激励信号u′的能量相等,并且所产生的放大噪声序列如下:w(n)=w′(n)Σn=0N-1u′2(n)Σn=0N′′-1w′2(n),n=0,...,N′-1]]>

    在增益伸缩中的第二步骤需要考虑在浊音因子产生器204的输出上的被合成信号的高频分量,以减少在浊音段的情形下(与清音段(unvoiced segment)相比,其中较少的能量出现在高频分量上)所产生的噪声能量。在这个优选实施方式中,通过使用一个频谱倾斜计算器212来测量合成信号的倾斜,并且相应地减少其能量来实现对高频分量的测量。其它步骤,例如零交叉步骤可以被平均地使用。当这个倾斜很强时,这与浊音段相应,就可以进一步减少噪声能量。在模块212中,倾斜因子被计算并且被作为合成信号sh的第一相关系数,表示为如下:

    条件是倾斜≥0和倾斜≥rv

    其中浊音因子rv如下

    rv=(Ev-Ec)/(Ev+Ec)

    其中Ev是被放大的音调码矢量bvT的能量,并且Ec是被放大的新码矢量gck的能量,如前面所描述的。浊音因子rv通常是比倾斜小的,但是这个条件被引入作为一个预防高频音调的措施,其中这个倾斜值是负的并且rv的值比较大。所以,这个条件减少了这种音调信号的噪声能量。

    在平坦频谱的情形下,倾斜值是0,在强浊音信号的情形下,倾斜的值是1,并且在大多数能量在高频分量上的清音信号的情形下时,倾斜值是负的。

    可以使用不同的方法来从高频分量的数量推导伸缩因子gt。在本发明中,根据上面所描述的信号的倾斜,给出了两个方法。

    方法1

    伸缩因子gt是使用下面的关系从这个倾斜推导出的

    gt=1-倾斜  约束条件是0.2≤gt≤1.0

    对这个倾斜接近1的强浊音信号,gt是0.2,对强清音信号,gt是1.0。

    方法2

    首先,这个倾斜gt被限制到大于0或者等于0,然后使用下面的关系从这个倾斜推导出这个伸缩因子

    gt=10-0.6倾斜

    所以,在增益调节模块214中被产生的被缩放噪声序列wg如下:

    wg=gtw

    当这个倾斜接近0时,伸缩因子gt接近0,这不产生能量压缩。当倾斜值是1时,伸缩因子gt能够导致所产生的噪声能量减少2dB。

    一旦这个噪声被正确的放大(wg),它被使用频谱整形器215而转换到语音域中。在这个优选实施方式中,这是通过使用在下采样域(1/A(z/0.8)^)]]>中所使用的相同LP合成滤波器的一个带宽被扩展的版本对噪声Wg进行滤波而实现的。在频谱整形器215中计算相应的带宽扩展LP滤波器系数。

    然后,被滤波的、被缩放的噪声序列wf被进行带通滤波到所需要的频率范围,以使用带通滤波器216被恢复。在这个优选实施方式中,带通滤波器216将噪声序列的频率范围限制到5.6-7.2kHz。所产生的带通滤波噪声序列z被在加法器221中相加到过采样合成语音信号上,以在输出223上获得最后的重构声音信号sout。

    尽管,这里已经通过本发明的一个优选实施方式,在上面对本发明进行了描述,但是可以在后附权利要求书的范围内对本发明的这个实施方式进行修改,而不会偏离本发明的精神与本质。尽管这个优选实施方式讨论了宽带语音信号的使用,但是该领域内的技术人员很清楚,本发明也可以一般地用于使用宽带信号的其它实施方式,并且这不需要局限于语音应用。

用于对宽带信号进行有效的编码的感觉加权设备与方法.pdf_第1页
第1页 / 共39页
用于对宽带信号进行有效的编码的感觉加权设备与方法.pdf_第2页
第2页 / 共39页
用于对宽带信号进行有效的编码的感觉加权设备与方法.pdf_第3页
第3页 / 共39页
点击查看更多>>
资源描述

《用于对宽带信号进行有效的编码的感觉加权设备与方法.pdf》由会员分享,可在线阅读,更多相关《用于对宽带信号进行有效的编码的感觉加权设备与方法.pdf(39页珍藏版)》请在专利查询网上搜索。

用于对一个宽带信号作出响应,产生一个感觉加权的信号的一个感觉加权设备,包括一个信号预加重滤波器,一个合成滤波器计算器,和一个感觉加权滤波器。这个信号预加重滤波器增强这个宽带信号的高频分量,由此产生一个预加重的信号。这个信号预加重滤波器的转移函数的形式为P(z)=1z1,其中是值为在0和1之间的一个预加重因子。这个合成滤波器计算器对这个预加重信号作出响应,用于产生合成滤波器系数。最后,这个感觉加权滤。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 乐器;声学


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1