ImageVerifierCode 换一换
格式:PDF , 页数:40 ,大小:5.99MB ,
资源ID:4328584      下载积分:30 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zhuanlichaxun.net/d-4328584.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(语音处理装置、语音处理方法和程序.pdf)为本站会员(1***)主动上传,专利查询网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知专利查询网(发送邮件至2870692013@qq.com或直接QQ联系客服),我们立即给予删除!

语音处理装置、语音处理方法和程序.pdf

1、(10)申请公布号 CN 102792369 A (43)申请公布日 2012.11.21 C N 1 0 2 7 9 2 3 6 9 A *CN102792369A* (21)申请号 201180013301.2 (22)申请日 2011.03.08 2010-061170 2010.03.17 JP G10L 19/00(2006.01) H04S 3/00(2006.01) (71)申请人索尼公司 地址日本东京都 (72)发明人户栗康裕 铃木志朗 松本淳 前田祐儿 松村祐树 (74)专利代理机构北京集佳知识产权代理有限 公司 11227 代理人王萍 李春晖 (54) 发明名称 语音处理装

2、置、语音处理方法和程序 (57) 摘要 本发明涉及一种当多声道音频信号被下混合 和编码时在音频信号解码时防止延迟和计算量增 加的语音处理装置、语音处理方法和程序。逆复 用单元(101)获取在其上复用BC参数的编码数 据。不相关频率-时间变换单元(102)执行根据 这一编码数据获得的单耳信号(X M )的频域系数的 IMDCT变换和IMDST变换,以生成单耳信号(X M ) (该信号是时域信号)和与这一单耳信号(X M )基 本上不相关的信号(X D )。立体声合成单元(103) 通过使用BC参数合成单耳信号(X M )和信号(X D ) 来生成立体声信号。本发明例如适用于一种对下 混合和编码的

3、立体声信号进行解码的语音处理装 置。 (30)优先权数据 (85)PCT申请进入国家阶段日 2012.09.10 (86)PCT申请的申请数据 PCT/JP2011/055293 2011.03.08 (87)PCT申请 的公布数据 WO2011/114932 JA 2011.09.22 (51)Int.Cl. 权利要求书3页 说明书19页 附图17页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 3 页 说明书 19 页 附图 17 页 1/3页 2 1.一种语音处理装置,包括: 获取单元,获取从作为多个声道的语音时域信号的语音信号生成、数目比多个声道少 的声道的语

4、音信号的频域系数,和表示多个声道之间的关系的参数; 第一变换单元,将所述获取单元获取的所述频域系数变换成第一时域信号; 第二变换单元,将所述获取单元获取的所述频域系数变换成第二时域信号;以及 合成单元,通过使用所述参数合成所述第一时域信号和所述第二时域信号来生成所述 多个声道的所述语音信号, 其中所述第一变换单元执行的变换的基底与所述第二变换单元执行的变换的基底正 交。 2.根据权利要求1所述的语音处理装置,还包括: 划分单元,根据频率将所述获取单元获取的所述频域系数划分成多个组; 第三变换单元,将划分成所述多个组中的第一组的所述频域系数变换成第三时域信 号;以及 加法单元,按照每个声道将所述

5、第三时域信号与所述合成单元生成的所述多个声道的 所述语音信号相加,并且生成整个频率频带中的所述多个声道的所述语音信号,所述第三 时域信号是所述第一组的频率频带中的相应声道的语音信号,其中: 所述获取单元获取第二组的频率频带中的所述参数和所述频域系数,所述第二组是除 了所述第一组之外的组, 所述第一变换单元将划分成所述第二组的所述频域系数变换成所述第一时域信号, 所述第二变换单元将划分成所述第二组的所述频域系数变换成所述第二时域信号,并 且 所述合成单元通过使用所述参数合成所述第一时域信号和所述第二时域信号来生成 所述第二组的频率频带中的所述多个声道的所述语音信号。 3.根据权利要求1所述的语音

6、处理装置,还包括: 第三变换单元,将所述获取单元获取的并且根据频率划分成多个组的所述频域系数之 中的第一组的频域系数变换成第三时域信号;以及 加法单元,按照每个声道将所述第三时域信号与所述合成单元生成的所述多个声道的 所述语音信号相加,并且生成整个频率频带中的所述多个声道的所述语音信号,所述第三 时域信号是所述第一组的频率频带中的相应声道的语音信号,其中: 所述获取单元获取每组的所述频域系数和第二组的频率频带的参数,所述第二组是所 述多个组之中除了所述第一组之外的组, 所述第一变换单元将划分成所述第二组的所述频域系数变换成所述第一时域信号, 所述第二变换单元将划分成所述第二组的所述频域系数变换

7、成所述第二时域信号,并 且 所述合成单元通过使用所述参数合成所述第一时域信号和所述第二时域信号来生成 所述第二组的频率频带中的所述多个声道的所述语音信号。 4.根据权利要求1所述的语音处理装置,其中根据所述多个声道的所述语音信号的频 域系数生成所述频域系数。 5.根据权利要求4所述的语音处理装置,还包括: 权 利 要 求 书CN 102792369 A 2/3页 3 分离单元,分离所述获取单元获取的预定频率频带中的所述频域系数,以及除了所述 预定频率频带之外的频率频带中的多个声道的所述语音信号的所述频域系数; 第三变换单元,将所述分离单元分离的所述多个声道的所述语音信号的所述频域系数 变换成所

8、述多个声道的第三时域信号;以及 加法单元,按照每个声道将所述多个声道的所述第三时域信号与所述合成单元生成的 所述多个声道的所述语音信号相加,并且生成整个频率频带中的所述多个声道的所述语音 信号,所述多个声道的第三时域信号是除了所述预定频率频带之外的所述频率频带中的所 述多个声道的所述语音信号,其中: 所述获取单元获取所述预定频率频带中的所述频域系数、除了所述预定频率频带之外 的所述频率频带中的所述多个声道的所述语音信号的所述频域系数和所述预定频率频带 中的所述参数, 所述第一变换单元将所述分离单元分离的所述预定频率频带中的所述频域系数变换 成所述第一时域信号; 所述第二变换单元将所述分离单元分

9、离的所述预定频率频带中的所述频域系数变换 成所述第二时域信号,并且 所述合成单元通过使用所述参数合成所述第一时域信号和所述第二时域信号来生成 所述预定频率频带中的所述多个声道的所述语音信号。 6.根据权利要求1至5中的任一权利要求所述的语音处理装置,其中: 所述频域系数是改进型离散余弦变换MDCT系数, 所述第一变换单元执行的变换是逆改进型离散余弦变换IMDCT,并且 所述第二变换单元执行的变换是逆改进型离散正弦变换IMDST。 7.根据权利要求1至5中的任一权利要求所述的语音处理装置,其中: 所述第二变换单元包括: 频谱反转单元,反转所述频域系数使得频率按照逆序; IMDCT单元,通过执行作

10、为所述频谱反转单元的反转的结果而获得的所述频域系数的 逆改进型离散余弦变换IMDCT来获得时域信号;以及 符号反转单元,每隔一个符号反转所述IMDCT单元获得的所述时域信号的每个采样的 符号,并且 所述频域系数是改进型离散余弦变换MDCT系数,并且所述第一变换单元执行的变换 是逆改进型离散余弦变换。 8.一种由语音处理装置执行的语音信号处理方法,所述方法包括: 获取步骤,获取从作为多个声道的语音时域信号的语音信号生成、数目比多个声道少 的声道的语音信号的频域系数,和表示多个声道之间的关系的参数; 第一变换步骤,将通过所述获取步骤中的处理而获取的所述频域系数变换成第一时域 信号; 第二变换步骤,

11、将通过所述获取步骤中的处理而获取的所述频域系数变换成第二时域 信号;以及 合成步骤,通过使用所述参数合成所述第一时域信号和所述第二时域信号来生成所述 多个声道的所述语音信号, 权 利 要 求 书CN 102792369 A 3/3页 4 其中所述第一变换步骤的处理中的变换的基底与所述第二变换步骤的处理中的变换 的基底正交。 9.一种程序,用于使计算机执行: 获取步骤,获取从作为多个声道的语音时域信号的语音信号生成、数目比多个声道少 的声道的语音信号的频域系数,和表示多个声道之间的关系的参数; 第一变换步骤,将通过所述获取步骤中的处理而获取的所述频域系数变换成第一时域 信号; 第二变换步骤,将通

12、过所述获取步骤中的处理而获取的所述频域系数变换成第二时域 信号;以及 合成步骤,通过使用所述参数合成所述第一时域信号和所述第二时域信号来生成所述 多个声道的所述语音信号, 其中所述第一变换步骤的处理中的变换的基底与所述第二变换步骤的处理中的变换 的基底正交。 权 利 要 求 书CN 102792369 A 1/19页 5 语音处理装置、 语音处理方法和程序 技术领域 0001 本发明涉及一种语音处理装置、语音处理方法和程序,且更具体地涉及一种当多 声道音频信号被下混合(downmix)和编码时在音频信号解码时防止延迟和计算量增加的语 音处理装置、语音处理方法和程序。 背景技术 0002 对多声

13、道音频信号编码的编码装置可以通过利用声道之间的关系执行高度有效 的编码。这一编码例如包括强度编码、M/S立体声编码和空间编码。执行空间编码的编码 装置将n声道音频信号下混合成m(m 0105 根据第一实施例的语音处理装置的配置例子 0106 图9是图示了根据第一实施例应用本发明的语音处理装置的配置例子的框图。 0107 对与图4和图5中所示配置相同的图9中所示配置分配相同标号。将适当省略重 复描述。 0108 图9中的语音处理装置100的配置与图4中所示解码装置40(该解码装置具有图 5中的音频信号解码单元42和图7中的立体声信号生成单元44)的配置不同主要在于设 置了逆复用单元101而不是逆

14、复用单元41和逆复用单元51,设置了不相关频率-时间变 换单元102而不是IMDCT单元54和混响信号生成单元71,并且设置了立体声合成单元103 和生成参数计算单元104而不是立体声合成单元72和生成参数计算单元43。 0109 语音处理装置100例如对图1中的编码装置10(该编码装置具有图2中的音频信 号编码单元13)空间编码的编码数据进行解码。在这一情况下,语音处理装置100使用单 耳信号X M 的频率频谱系数来生成与在生成立体声信号时使用的单耳信号X M 不相关的信号 X D 。 0110 更具体而言,语音处理装置100的逆复用单元101(获取单元)对应于图4中的逆 复用单元41和图5

15、中的逆复用单元51。也就是说,逆复用单元101逆复用从图1中的编码 说 明 书CN 102792369 A 11 8/19页 12 装置10提供的复用编码数据,并且获取编码数据和BC参数。此外,虽然在编码数据上复用 的BC参数可以是所有帧的BC参数或者可以是预定帧的BC参数,但是BC参数这里指代预 定帧的BC参数。 0111 另外,逆复用单元101逆复用编码数据并且获得量化和熵编码的频率频谱系数和 量化信息。另外,逆复用单元101将量化和熵编码的频率频谱系数提供给熵解码单元52,并 将量化信息提供给频谱逆量化单元53。另外,逆复用单元101将BC参数提供给生成参数计 算单元104。 0112

16、不相关频率-时间变换单元102根据作为频谱逆量化单元53的逆量化的结果而 获得的单耳信号X M 的频率频谱系数生成单耳信号X M 和信号X D (这些信号是两个不相关的 时域信号)。另外,不相关频率-时间变换单元102将单耳信号X M 和信号X D 提供给立体声 合成单元103。将参照下文将描述的图10和图11具体描述该不相关频率-时间变换单元 102。 0113 立体声合成单元103(合成单元)使用从生成参数计算单元104提供的生成参数 来合成从不相关频率-时间变换单元102提供的单耳信号X M 和信号X D 。另外,立体声合 成单元103输出作为合成的结果而获得的左音频信号X L 和右音频

17、信号X R 作为立体声信号。 将参照下文描述的图12具体描述该立体声合成单元103。 0114 生成参数计算单元104插值从逆复用单元101提供的预定帧的BC参数并且计算 每帧的BC参数。生成参数计算单元104使用当前处理目标帧的BC参数生成所述的生成参 数,并且将生成参数提供给立体声合成单元103。 0115 不相关频率-时间变换单元的具体配置例子 0116 图10是图示了图9中的不相关频率-时间变换单元102的具体配置例子的框图。 0117 图10中的不相关频率-时间变换单元102包括IMDCT单元54和IMDST单元111。 0118 图10中的IMDCT单元54(第一变换单元)与图5中

18、的IMDCT单元54相同,并且 执行从频谱逆量化单元53提供的单耳信号X M 的频率频谱系数的IMDCT。另外,IMDCT单元 54将所得单耳信号X M (该信号是时域信号(第一时域信号)提供给立体声合成单元103(图 9)。 0119 IMDST(Inverse Modified Discrete Sine Transform,逆改进型离散正弦变换) 单元111(第二变换单元)执行从矢量逆量化单元53提供的单耳信号X M 的频率频谱系数的 IMDST。另外,IMDST单元111将所得信号XD(该信号是时域信号(第二时域信号)提供给 立体声合成单元103(图9)。 0120 如上文描述的那样,

19、IMDCT单元54执行的变换是逆余弦变换,而IMDST单元111执 行的变换是逆正弦变换,并且IMDCT单元54执行的变换的基底与IMDST单元111执行的变 换的基底正交。因而有可能认为单耳信号X M 和信号X D 基本上相互不相关。 0121 此外,根据下式(1)至(3)限定MDCT、IMDCT和IMDST。 0122 式1 0123 说 明 书CN 102792369 A 12 9/19页 13 0124 式2 0125 0126 式3 0127 0128 在式(1)至(3)中,x(n)是时域信号,w(n)是变换窗,w(n)是逆变换窗,而y(n) 是逆变换信号。另外,Xc(k)是MDCT

20、系数,并且Xs(k)是MDST系数。 0129 不相关频率-时间变换单元的具体配置例子 0130 图11是图示了图9中的不相关频率-时间变换单元102的另一具体配置例子的 框图。 0131 对与图10中的配置相同的图11中所示配置分配相同标号。将适当省略重复描述。 0132 图11中的不相关频率-时间变换单元102的配置与图10中的配置不同主要在于 设置了频谱反转单元121、IMDCT单元122和符号反转单元123而不是IMDST单元111。 0133 图11中的不相关频率-时间变换单元102的频谱反转单元121反转从频谱逆量 化单元53提供的频率频谱系数使得频率按照逆序,并且向IMDCT单元

21、122提供频率频谱系 数。 0134 IMDCT单元122执行从频谱反转单元121提供的频率频谱系数的IMDCT,并且获得 时域信号。IMDCT单元122将该时域信号提供给符号反转单元123。 0135 符号反转单元123反转从IMDCT单元122提供的时域信号的奇数采样的符号,并 且获得信号X D 。 0136 同时,当Xs(k)在限定IMDST的上式3中替换为Xs(N-k-1)时,如果N是4的公倍 数,则式3可以修改成下式4。 0137 式4 0138 0139 0140 因此,作为执行来自频谱逆量化单元53的频率频谱系数的IMDST的结果而获得的 信号与作为反转频率频谱系数并且执行频率频

22、谱系数的IMDST使得频率按照逆序并且反 转奇数采样的符号的结果而获得的信号是相同信号X D 。也就是说,图10中的IMDST单元 111与图11中的频谱反转单元121、IMDCT单元122和符号反转单元123是等同的。 0141 符号反转单元123向图9中的立体声合成单元103提供获得的信号X D 。 0142 如上文描述的那样,图11中的不相关频率-时间变换单元102仅需设置有IMDCT 说 明 书CN 102792369 A 13 10/19页 14 单元,以便将时域信号变换成频率频谱系数,从而与其中需要设置图9中的IMDCT单元和 IMDST单元的情况相比有可能减少制造成本。 0143

23、 立体声合成单元的具体配置例子 0144 图12是图示了图9中的立体声合成单元103的具体配置例子的框图。 0145 图12中的立体声合成单元103包括乘法器141至144以及加法器145和加法器 146。 0146 乘法器141将从不相关频率-时间变换单元102提供的单耳信号X M 与系数h 11 (该系数是从生成参数计算单元104提供的生成系数之一)相乘。乘法器141将所得相乘值 h 11 X M 提供给加法器145。 0147 乘法器142将从不相关频率-时间变换单元102提供的单耳信号X M 与系数h 21 (该系数是从生成参数计算单元104提供的生成系数之一)相乘。乘法器141将所得

24、相乘值 h 21 X M 提供给加法器146。 0148 乘法器143将从不相关频率-时间变换单元102提供的信号X D 与系数h 12 (该系数 是从生成参数计算单元104提供的生成系数之一)相乘。乘法器141将所得相乘值h 12 X D 提供给加法器145。 0149 乘法器144将从不相关频率-时间变换单元102提供的信号X D 与系数h 22 (该系数 是从生成参数计算单元104提供的生成系数之一)相乘。乘法器141将所得相乘值h 22 X D 提供给加法器146。 0150 加法器145将从乘法器141提供的相乘值h 11 X M 与从乘法器143提供的相乘值 h 12 X D 相加

25、,并且输出所得相加值作为左音频信号X L 。 0151 加法器146将从乘法器142提供的相乘值h 21 X M 与从乘法器143提供的相乘值 h 22 X D 相加,并且输出作为右音频信号X R 而获得的所得相加值。 0152 如上文描述的那样,立体声合成单元103如图13中所示通过使用单耳信号X M 、信 号X D 、左音频信号X L 和右音频信号X R 作为矢量来执行如下式5中所示使用生成参数的加 权加法。 0153 式5 0154 X L h 11 X M +h 12 X D 0155 X R h 21 X M +h 22 X D (5) 0156 此外,系数h 11 、h 12 、h

26、 21 和h 22 由以下等式(6)表示。 0157 式6 0158 h 11 g L cos( L ) 0159 h 12 g L sin( L ) 0160 h 21 g R cos( R ) 0161 h 22 g R sin( R )(6) 0162 其中: 0163 式7 说 明 书CN 102792369 A 14 11/19页 15 0164 0165 在式6中,角度 L 是在左音频信号X L 的矢量与单耳信号X M 的矢量之间形成的角 度,并且角度 R 是在右音频信号X R 的矢量与单耳信号X M 的矢量之间形成的角度。 0166 同时,生成参数计算单元104计算系数h 11

27、、h 12 、h 21 和h 22 作为生成参数。更具体而 言,生成参数计算单元104根据BC参数计算g L 、g R 、 L 和 R ,并且根据g L 、g R 、 L 和 R 计 算系数h 11 、h 12 、h 21 和h 22 作为生成参数。此外,例如在公开号为2006-325162的日本专利申 请中公开了根据BC参数计算g L 、g R 、 L 和 R 的方法的细节。 0167 此外,对于BC参数,也可以使用g L 、g R 、 L 和 R ,并且也可以使用压缩编码的g L 、 g R 、 L 和 R 。另外,对于BC参数,也可以直接使用或者也可以压缩和编码并且使用系数 h 11 、

28、h 12 、h 21 和h 22 。 0168 语音处理装置的处理的描述 0169 图14是用于描述图9中的语音处理装置100的解码处理的流程图。当向语音处 理装置100输入从图1中的编码装置10提供的复用编码数据时开始这一解码处理。 0170 在图14中的步骤S11中,逆复用单元101逆复用从图1中的编码装置10提供的 复用编码数据,并且获得编码数据和BC参数。另外,逆复用单元101还逆复用该编码数据, 以及量化和熵编码的频率频谱系数和量化信息。另外,逆复用单元101向熵解码单元52提 供量化和熵编码的频率频谱系数并且向频谱逆量化单元53提供量化信息。另外,逆复用单 元101向生成参数计算单

29、元104提供BC参数。 0171 在步骤S12中,熵解码单元52执行从逆复用单元101提供的频率频谱系数的熵解 码(比如霍夫曼解码或者算术解码),并且恢复量化频率频谱系数。熵解码单元52向频谱逆 量化单元53提供频率频谱系数。 0172 在步骤S13中,频谱逆量化单元53基于从逆复用单元101提供的量化信息逆量化 从熵解码单元52提供的量化的频率频谱系数,并且恢复频率频谱系数。另外,频谱逆量化 单元53将频率频谱系数提供给不相关频率-时间变换单元102。 0173 在步骤S14中,不相关频率-时间变换单元102根据作为频谱逆量化单元53的逆 量化的结果而获得的单耳信号X M 的频率频谱系数生成

30、单耳信号X M 和信号X D (这些信号是 两个不相关时域信号)。另外,不相关频率-时间变换单元102将单耳信号X M 和信号X D 提 供给立体声合成单元103。 0174 在步骤S15中,立体声合成单元103使用从生成参数计算单元104提供的生成参 数来合成从不相关频率-时间变换单元102提供的单耳信号X M 和信号X D 。 0175 在步骤S16中,生成参数计算单元104插值从逆复用单元101提供的预定帧的BC 参数并且计算每帧的BC参数。 0176 在步骤S17中,生成参数计算单元104使用当前处理目标帧的BC参数来生成系数 h 11 、h 12 、h 21 和h 22 作为生成参数

31、,并且向立体声合成单元103提供生成参数。 0177 在步骤S18中,立体声合成单元103使用从生成参数计算单元104提供的生成参 数来合成从不相关频率-时间变换单元102提供的单耳信号X M 和信号X D ,并且生成立体 说 明 书CN 102792369 A 15 12/19页 16 声信号。另外,立体声合成单元103输出立体声信号,并且处理结束, 0178 如上文描述的那样,语音处理装置100通过执行两个类型的变换使得基底与单耳 信号X M 的频率频谱系数正交来生成单耳信号X M 和信号X D 。也就是说,语音处理装置100 可以使用单耳信号X M 的频率频谱系数来生成信号X D 。因而

32、,与图4中的常规解码装置40 相比(该装置具有图5中的音频信号解码单元42和图7中的立体声信号生成单元44),语音 处理装置100可以防止图7中的混响信号生成单元71引起的延迟以及计算量和缓冲资源 的增加。 0179 另外,可以作为不相关频率-时间变换单元102的一部分再利用常规解码装置40 的IMDCT单元54,从而有可能使新功能的添加最少并且防止电路规模和所需资源的增加。 0180 0181 根据第二实施例的语音处理装置的配置例子 0182 图15是图示了根据第二实施例应用本发明的语音处理装置的配置例子的框图。 0183 对与图9中的配置相同的图15中所示配置分配相同标号。将适当省略重复描

33、述。 0184 图15中的语音处理装置200的配置与图9中的配置不同主要在于还设置了频带 划分单元201、IMDCT单元202、加法器203和加法器204。 0185 语音处理装置200例如解码如下编码数据,针对该编码数据执行与图1中的编码 装置10(该编码装置具有图2中的音频信号编码单元13)中相同的空间编码,并且在该编 码数据上复用高频带的BC参数,并且仅对高频带中的单耳信号X M 进行立体声编码。 0186 更具体而言,语音处理装置200的频带划分单元201(划分单元)根据频率将频谱 逆量化单元53获得的频率频谱系数划分成两组高频带频率频谱系数和低频带频率频谱系 数。另外,频带划分单元2

34、01将低频带频率频谱系数提供给IMDCT单元202,并将高频带频 率频谱系数提供给不相关频率-时间变换单元102。 0187 IMDCT单元202(第三变换单元)执行从频带划分单元201提供的低频带频率频谱 系数的IMDCT,并且获得单耳信号X M low (第三时域信号),该信号是低频带时域信号。IMDCT 单元202向加法器203提供低频带单耳信号X M low 作为低频带左音频信号,并且向加法器204 提供低频带单耳信号X M low 作为低频带右音频信号。 0188 加法器203接收作为在不相关频率-时间变换单元102和立体声合成单元103中 处理从频带划分单元201输出的高频带频率频

35、谱系数的结果而获得的高频带左音频信号 X L High 的输入。加法器203将高频带左音频信号X L High 与作为低频带左音频信号从IMDCT单 元202提供的低频带单耳信号X M low 相加,并且生成整个频率频带左音频信号X L 。 0189 加法器204接收作为在不相关频率-时间变换单元102和立体声合成单元103中 处理从频带划分单元201输出的高频带频率频谱系数的结果而获得的高频带右音频信号 X R High 的输入。加法器204将高频带右音频信号X R High 与作为低频带右音频信号从IMDCT单 元202提供的低频带单耳信号X M low 相加,并且生成整个频率频带右音频信

36、号X R 。 0190 语音处理装置的处理的描述 0191 图16是用于描述图15中的语音处理装置200的解码处理的流程图。当向语音处 理装置200输入如下编码数据时,开始这一解码处理,针对上述编码数据执行与图1中的编 码装置10(该编码装置具有图2中的音频信号编码单元13)中相同的空间编码,并且在该 编码数据上复用高频带的BC参数。 说 明 书CN 102792369 A 16 13/19页 17 0192 图16中的步骤S31至S33与图14中的步骤S11至S13中的处理相同,不再重复 说明。 0193 在步骤S34中,频带划分单元201根据频率将频谱逆量化单元53获得的频率频谱 系数划分

37、成两组高频带频率频谱系数和低频带频率频谱系数。另外,频带划分单元201向 IMDCT单元202提供低频带频率频谱系数,并且向不相关频率-时间变换单元102提供高频 带频率频谱系数。 0194 在步骤S35中,IMDCT单元202执行从频带划分单元201提供的低频带频率频谱 系数的IMDCT,并且获得单耳信号X M low (该信号是低频带时域信号)。IMDCT单元202向加法 器203提供低频带单耳信号X M low 作为低频带左音频信号,并且向加法器204提供低频带单 耳信号X M low 作为低频带右音频信号。 0195 在步骤S36中,通过不相关频率-时间变换单元102、立体声合成单元1

38、03和生成 参数计算单元104针对从频带划分单元201提供的高频带频率频谱系数执行立体声信号生 成处理。更具体而言,不相关频率-时间变换单元102、立体声合成单元103和生成参数计 算单元104执行图14中的步骤S14至S18中的处理。分别向加法器203和加法器204输 入所得高频带左音频信号X L High 和高频带右音频信号X R High 。 0196 在步骤S37中,加法器203将作为低频带左音频信号从IMDCT单元202提供的低 频带单耳信号X M low 与从不相关频率-时间变换单元102提供的高频带左音频信号X L High 相 加,并且生成整个频率频带左音频信号X L 。另外,

39、加法器203输出整个频率频带左音频信号 X L 。 0197 在步骤S38中,加法器204将作为低频带右音频信号从IMDCT单元202提供的低 频带单耳信号X M low 与从不相关频率-时间变换单元102提供的高频带右音频信号X R High 相 加,并且生成整个频率频带右音频信号X R 。另外,加法器204输出这一整个频率频带右音频 信号X R 。 0198 如上文描述的那样,语音处理装置200对整个频率频带单耳信号X M 的编码数据进 行解码,并且仅对高频带进行立体声编码。因而,有可能防止声音由于低频带单耳信号X M 的 立体声编码而不自然。 0199 此外,虽然对语音处理装置200而言

40、频带划分单元201将频率频谱系数划分成高 频带频率频谱系数和低频带频率频谱系数,但是频带划分单元201可以将频率频谱系数划 分成预定频率频带的频率频谱系数和其它频率频带的频率频谱系数。也就是说,可以根据 频率频带是预定频率频带还是其它频率频带、而不是频率频带是低频带还是高频带来选择 是否执行立体声编码。 0200 0201 根据第三实施例的语音处理装置的配置例子 0202 图17是图示了根据第三实施例应用本发明的语音处理装置的配置例子的框图。 0203 对与图4、图6和图9中的配置相同的图17中所示配置分配相同标号。将适当省 略重复描述。 0204 图17中的语音处理装置300的配置与图4中的

41、解码装置40(该解码装置具有图 6中的音频信号解码单元42和图7中的立体声信号生成单元44)的配置不同主要在于设 置了逆复用单元301而不是逆复用单元41和逆复用单元61,设置了IMDCT单元304-1至 说 明 书CN 102792369 A 17 14/19页 18 304-(N-1)而不是IMDCT单元64-1至IMDCT单元64-(N-1),设置了立体声编码单元305而 不是IMDCT单元64-N和立体声信号生成单元44,并且设置了生成参数计算单元104和合成 滤波器组306而不是生成参数计算单元43和合成滤波器组65。 0205 图17中的语音处理装置300例如对如下编码数据进行解码

42、,针对该编码数据执行 与图1中的编码装置10(该编码装置具有图3中的音频信号编码单元13)中相同的空间编 码,并且在该编码数据上复用预定子频带信号的BC参数。 0206 更具体而言,语音处理装置300的逆复用单元301对应于图4中的逆复用单元41 和图6中的逆复用单元61。也就是说,逆复用单元301接收编码数据(针对该编码数据执行 与图1中的编码装置10(该编码装置具有图3中的音频信号编码单元13)中相同的空间编 码,并且在该编码数据中复用预定子频带信号的BC参数)的输入。逆复用单元301逆复用 输入的编码数据,并且获得编码数据和预定子频带信号的BC参数。另外,逆复用单元301 向生成参数计算

43、单元104提供预定子频带信号的BC参数。 0207 另外,逆复用单元301逆复用编码数据,并且获得N个子频带信号的量化和熵编码 的频率频谱系数以及量化信息。逆复用单元301向熵解码单元62提供N个子频带信号的 量化和熵编码的频率频谱系数,并且向频谱逆量化单元63提供量化信息。 0208 IMDCT单元304-1至304-(N-1)(第三变换单元)和立体声编码单元305逐个接收 频谱逆量化单元63恢复的N个子频带信号的频率频谱系数的输入。 0209 IMDCT单元304-1至304-(N-1)各自执行输入频率频谱系数的IMDCT,并且将频率 频谱系数变换成单耳信号X M (该信号是时域信号)的子

44、频带信号X M i (i=1,2,.和N-1)。 IMDCT单元304-1至304-(N-1)各自向合成滤波器组306提供子频带信号X M i 作为左音频 信号X L i 和右音频信号X R i 。 0210 立体声编码单元305包括图9中的不相关频率-时间变换单元102和立体声合成 单元103。立体声编码单元305使用生成参数计算单元104生成的生成参数根据从频谱逆 量化单元63输入的预定子频带信号的频率频谱系数生成左音频信号的子频带信号X L A 和右 音频信号的子频带信号X R A (这些信号是时域信号)。另外,立体声编码单元305向合成滤波 器组306提供左子频带信号X L A 和右子

45、频带信号X R A 。 0211 合成滤波器组306(加法单元)包括用于合成左音频信号的子频带信号的左合成 滤波器组,和用于合成右音频信号的子频带信号的右合成滤波器组。合成滤波器组306的 左合成滤波器组合成来自IMDCT单元304-1至304-(N-1)的左子频带信号X L 1 至X L N-1 以及 来自立体声编码单元305的左子频带信号X L A 。另外,左合成滤波器组输出作为合成的结果 而获得的整个频率频带左音频信号X L 。 0212 另外,合成滤波器组306的右合成滤波器组合成来自IMDCT单元304-1至 304-(N-1)的右子频带信号X R 1 至X R N-1 以及来自立体

46、声编码单元305的右子频带信号X R A 。 另外,右合成滤波器组输出作为合成的结果而获得的整个频率频带右音频信号X R 。 0213 此外,虽然图17中的语音处理装置300仅对一个子频带信号进行立体声编码,但 是语音处理装置300可以对多个子频带信号进行立体声编码。另外,可以在编码侧上动态 设置而不是预先设置被立体声编码的子频带信号。在这一情况下,例如在BC参数中包括用 于指定子频带信号(该信号是立体声编码对象)的信息。 0214 语音处理装置的处理的描述 说 明 书CN 102792369 A 18 15/19页 19 0215 图18是用于描述图17中的语音处理装置300的解码处理的流程

47、图。例如当向语 音处理装置300输入编码数据(针对该编码数据执行与图1中的编码装置10(该编码装置 具有图3中的音频信号编码单元13)中相同的空间编码,并且在该编码数据上复用预定子 频带信号的BC参数)时开始这一解码处理。 0216 在图18中的步骤S51中,逆复用单元301逆复用输入的复用编码数据并且获得编 码数据和预定子频带信号的BC参数。另外,逆复用单元301向生成参数计算单元104提供 预定子频带信号的BC参数。另外,逆复用单元301逆复用编码数据,并且获得N个子频带 信号的量化和熵编码的频率频谱系数以及量化信息。逆复用单元301向熵解码单元62提 供N个子频带信号的量化和熵编码的频率

48、频谱系数,并且向频谱逆量化单元63提供量化信 息。 0217 在步骤S52中,熵解码单元62对从逆复用单元101提供的N个子频带信号的频率 频谱系数进行熵解码,并且向频谱逆量化单元63提供频率频谱系数。 0218 在步骤S53中,频谱逆量化单元63基于从逆复用单元301提供的量化信息逆量化 从熵解码单元62提供的并且作为熵解码的结果而获得的N个子频带信号的频率频谱系数。 另外,频谱逆量化单元63向IMDCT单元304-1至304-(N-1)和立体声编码单元305逐个提 供N个子频带信号的所得到的恢复的频率频谱系数。 0219 在步骤S54中,IMDCT单元304-1至304-(N-1)各自执行从频谱逆量化单元63提 供的频率频谱系数的IMDCT。另外,IMDCT单元304-1至304-(N-1)各自向合成滤波器组 306提供单耳信号的所得子频带信号X M i (i=1,2,和N-1)作为左音频信号的子频带信号 X L i 和右音频信号的子频带信号X L i 。 0220 在步骤S55中,立体声编码单元305使用从生成参数计算单元104提供的生成参 数来执行从频谱逆量化单元63提供的预定子频带信号的频率频谱系数的立体声信号生成 处理。另外,立体声编码单元305向合成滤波器组306提供所得到的左音频信号的

copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1