高效率编码方法、高效率编码的译码方法、高效率 编码的编码装置、高效率编码的译码装置、 高效率编码-译码系统和记录媒体 技术领域
本发明涉及数字声音信号的编码和/或译码,特别是涉及对于多通道的数字声音信号利用人的听觉特性进行高效率编码和/或译码。具体地说,本发明涉及广播、通信、电影、录像机、或唱盘机的立体声音响系统或者由3个声道以上地声道构成的多路环绕音响系统。
另外,还涉及极适合于在这些系统中使用的减小位速率的高效率编码方法和与其对应的高效率编码的译码方法以及高效率编码的译码重放方法。
另外,还涉及记录利用该高效率编码方法编码的信号的高效率编码信号记录方法和进行记录的记录媒体。
另外,还涉及传送利用该高效率编码方法编码的信号的高效率编码信号传送方法。
背景技术
对于音乐信号或声音信号等声频信号的高效率编码方法及高效率编码装置,已知有很多技术。
例如,方法之一是将时间域的声频信号沿时间轴按指定的单位时间进行块化,并将该每块的时间域的信号进行正交变换变换为频率域的信号。还有,将多个频带块化后对各个频带进行再量化及编码的块化频带分割方式。通常,称为变换编码方法(Transform Coding)。
该方法有本发明人和本申请人的专利申请,例如,美国专利说明书第5301205号公开的就是这种方法。
另外,作为别的方法,有将时间域的声频信号不按时间单位进行块化、而分割为20个左右的多个频带进行编码的非块化频带分割方法。我们知道通常称为频带分割编码(Sab Band Coding:SBC)。例如,美国专利说明书第4896362号和美国专利说明书第5105463号公开的就是这种方法。
另外,还提出了将上述频带分割编码与变换编码相组合的高效率编码的方法及装置。这时,是用上述频带分割编码进行频带分割后,将各频带的信号进行正交变换,变换为频率域的信号,对经过该正交变换的各频带的信号进行编码的方法。
作为该方法,例如,已由美国专利说明书第4972484号公开。
这里,作为上述频带分割编码的频带分割用滤波器,例如有正交密勒滤波器(Quadrature Mirror Filter:QMF)等滤波器。1976年R.E.Crochiere在“Digital coding of speech in sabbandsBell Syst.”(Tech.J.Vol.55,No.8(1976))论文中对此已有描述。
另外,Joseph H.Rothweiler在“ICASSP 83,BOSTONPolyphase Quadrature filters-A new subband coding technique”中阐述了等带宽的滤波器分割方法及装置。
另外,作为上述正交变换的方法,已知的有通过将输入声频信号按指定的单位时间(帧)进行块化,并对每个块进行高速付立叶变换(Fast Fourier Transform:FFT)、离散余弦变换(DiscreteCosine Tramsform:DCT)、改良型离散余弦变换(ModifiedDiscrete Cosine Transform:MDCT)等将时间轴变换为频率轴的方法。
在本申请的实施例中,作为正交变换使用了MDCT,关于MDCT在“ICASSP 1987 Subband/Transform Coding Using Filter BankDesigns Based on Time Domain Aliasing Cancellation J.P.Princen A.B.Bradley Univ.of Surrey Royal MelbourneInst.of Tech”中已有阐述。
另外,作为使各频率成分量化时的频率分割宽度,考虑人的听觉特性而确定频带分割宽度是有效的。具体地说,使用称为临界频带的越是高频区带宽越宽的频带宽度,0~20KHz的声频信号分割为多个(例如,25个频带)频带。
所说临界频带指的是考虑人的听觉特性后分割的频带,也就是利用某一单音的频率附近的相同强度的窄频带噪音使该单音掩蔽时的该噪音具有的频带。
另外,对这时的各频带的数据进行编码时,对各频带使用由指定的或自适应的位分配确定的位量(比特量)进行编码。例如,对通过上述MDCT得到的MDCT系数数据进行编码时,使用确定的位量进行编码。
关于上述位分配,如下2篇文献是人们熟知的。即,
在“IEEE Transactions of Accoustics,Speech,and SignalProcessing,Vol,ASSP-25,No.4,August 1977”中介绍了根据各频带的信号的大小进行适当的位分配的技术。
另外,在“ICASSP 1980 The critical band code-digitalencoding of the perceptual requirements of the auditorysystem M.A.Kransner MIT”中介绍了通过利用听觉掩蔽得到各频带所需要的信杂比进行固定的位分配的技术。
但是,在记录媒体中由记录密度所决定的和在广播及通信中由传送通道容量或送递速度所决定的位速率对单位时间内的位量有所限制。因此,为了满足位速率,使用上述那样的高效率编码方法。
但是,上述先有的位分配技术是分别独立地考虑各通道的位分配的(以后,为了简单起见,简称为独立分配:IndependentAllocation)。换言之,各通道的位量是某一固定量。因此,不考虑横跨多个通道间的位分配。
与此相反,本发明人在先前作为日本专利申请的平成5年专利第15492号和与该申请对应的美国专利申请08/184471号的说明书和附图中提出了在确保可在多个通道中使用的共同的位的前提下对需要位的通道分配适当数量的位的方案。
由于这种方法不是对各个通道独立地进行位分配的,所以,称为通道间位分配(以后,为了简单起见,简称为从属分配:DependentAllocation)。
本发明者的先前的提案,通过确保共同的位,对提高音质有作用。但是,由于总是要确保共同的位,所以,也显得冗长。
通常,有多个通道时,各个通道所要求的位量随各通道的信息量而不同。
例如,当声频信号为立体声信号时,设右通道要求的位量为基准的120%,而左通道要求的位量为基准的50%。这时,右通道能容许的位量最大为基准的100%,由于相差20%,所以将使音质变坏。
与此相反,在左通道中有基准的50%的富余的位量,作为所谓的超音质,有基准的50%的冗余位量使用于左通道。当然,冗余的位对提高音质有作用,但是,对于人的听觉而言,这一点提高是感觉不出来的。
但是,在本例中,设想了将左通道中基准的50%的冗余位量使用于右通道中不足的20%(以后,为了简单起见,简称为辅助分配:Sabsidiary Allocation)。
如果能实现这一设想,则能使两个通道都保持着高音质,并可满足指定的位速率。
特别是,音乐及电影等的声频信号与电话不同,多数情况是由多个通道的组合构成1个信息。因此,当多个通道中的某一个通道有冗余的位时,就可以认为进行从属分配是有效的。
但是,这时,又产生了另一个问题。即,在先有的译码器(高效率译码装置)中,是对记录有基于独立分配的编码信号的记录媒体进行译码的。
因此,对记录有基于从属分配的编码信号的记录媒体,不能用先有的译码器(译码装置)进行译码。
另外,为了对记录有按照从属分配来编码的信号的记录媒体进行译码的译码装置,如果不能对现在市售的记录媒体即记录有仅按照独立分配来编码的信号的记录媒体进行编码,这对使用者是非常不利的。
发明的公开
因此,本发明的目的旨在提供可以利用从属分配获得高音质的压缩信号的技术。
本发明的第2个目的旨在提出一种高效率编码技术,可以使用该从属分配技术进行高音质的重放,并且,即使进行先有的独立分配,在进行译码时也可以进行不产生较大的音质恶化的重放。
本发明的第3个目的在于提供利用本发明的技术的编码方法和编码信号的译码方法。
本发明的第4个目的旨在提供利用本发明的技术的编码装置、编码信号的译码装置和由编码装置和译码装置构成的系统。
本发明的第5个目的旨在提供记录由利用本发明的技术的编码方法和编码装置形成的编码信号的记录媒体。
本发明的第6个目的旨在提供传送由利用本发明的技术的编码方法和编码装置形成的编码信号的传送方法和传送装置。
为了达到上述目的而提出的本发明的高效率编码方法,是对多个通道的信号的时间域内的采样数据或频率域内的采样数据进行通道间的自适应的位分配的高效率编码方法。即,将对位量的要求比一定的基准量还大的通道的位分配量分解为最多不超过一定的基准值的第1位分配量和其余的第2位分配量。
第1位分配量是为与先有的独立分配时数据所使用的位量相当的一定的基准值的范围,是考虑了与先有的系统的互换性。
第2位分配量是超出先有的独立分配时数据所使用的位量的部分,这是考虑了通道的音质。
本发明的高效率编码方法由以下步骤构成。
即,在某一同步块(单位块)中,全部通道的总位分配量基本上一定。
根据与上述第1位分配量有关的采样数据所用的比例系数和字长,求与上述第2位分配置有关的采样数据所用的比例系数。
上述第1位分配量取为考虑了辅助信息用的位量的量。
上述第2位分配量是从该通道要求的位分配量减去上述第1位分配量后得到的量。
对于对时间轴和频率轴细分割的小块中的采样数据,在上述小块内进行相同的量化处理。为了得到上述小块中的采样数据,在进行非块化频率特性分析后,对上述非块化频率特性分析的输出进一步进行块化频率特性分析。
上述非块化频率特性分析的频带宽度至少在最低频区的2个频带中是相同的。上述非块化频率特性分析是使用PQF(PolyphaseQuadrature filter)。上述非块化频率特性分析的频带宽度,高频区比低频区宽。上述非块化频率特性的分析也可以使用QMF(Quadrature Mirror filter)。
上述块化频率特性的分析是使用MDCT。在上述块化频率特性的分析中,根据输入信号的时间特性适当地改变块尺寸。上述块尺寸的改变至少对每2个上述非块化频率特性分析的输出是独立地进行的。
各通道的上述第1位分配部分和上述第2位分配部分之和随各通道的比例系数或采样数据的最大值而变化。
从属分配随各通道的信号的能量值、峰值或平均值等的振幅随时间的变化而变化。或者,随各通道的比例系数随时间的变化而变化。
可以在辅助分配中使用的位量,最大是其他通道的剩余位的位量之和。
下面,本发明的高效率编码的译码方法,是为了对在编码时对多个通道的信号的时间域或频率域内的采样数据进行适当的从属分配的编码信号进行译码的高效率编码的译码方法,其特征在于:在进行上述编码时,将向位量要求比一定的基准量大的通道分配的位分配量分解为最多不超过上述一定的基准量的第1位分配量和其余的第2位分配量。
这时,本发明的高效率编码的译码方法也可以按如下所示的办法进行。
上述第1位分配量和上述第2位分配量之和的全部通道的总位量基本上是一定的。与上述第2位分配量有关的采样数据用的比例系数根据与上述第1位分配量有关的采样数据用的比例系数和字长求出。
上述第1位分配量是不包含辅助分配位的位分配量,上述第2位分配量是包含辅助位分配的位分配量。
将对时间轴和频率轴细分割的小块中的进行了相同的量化的采样数据进行译码。在将上述小块中的采样数据进行块化频率合成后,将上述块化频率合成的输出作为非块化频率合成的输入,得到非块化频率合成的输出。上述非块化频率合成的频带宽度至少在最低频区的2个频带中是相同的。
上述非块化频率合成采用PQF。上述非块化频率合成的频带宽度,设定为高频区比低频区宽。上述非块化频率合成也可以采用QMF。上述块化频率合成是反MDCT。在上述块化频率合成中,根据输入信号的时间特性适当地改变块尺寸。上述块尺寸的改变至少对每2个上述非块化频率合成的输入频率独立地进行。
各通道的上述第1位分配量与上述第2位分配量之和基本上由各通道的比例系数或采样最大值决定。另外,通过检测向通道分配的分配位量大于还是等于比上述一定的基准量小的第2基准量来检测多个通道中已分配了比一定的基准量大的位量的通道。
另外,本发明的高频率编码的译码重放方法,1个同步块(按指定时间单位将连续信号块化的块)由分开记录并读出的至少2个样块群构成。即,由分配比多个通道用的一定的基准量还大的位量的第1位分配的样品群和多个通道用的上述第1位分配二样品群以外的第2位分配的样品群构成。
这里,在各通道中,根据分配比各通道的一定的基准量还大的位量的第1位分配样品群和该第1位分配样品群以外的第2位分配样品群进行译码重放。
本发明的高效率编码信号记录方法的特征在于:在1个同步块中,将分配比多个通道用的一定的基准量还大的位量的第1位分配样品群和多个通道用的上述第1位分配样品群以外的第2位分配采样群分离开来进行记录。
并且,在1个同步块中,将上述第1位分配样品群和上述第2位分配样品群对各通道交替地进行记录。
另外,本发明的记录媒体,用于记录利用本发明的高效率编码方法已进行编码了的信号。
该记录媒体,是电影胶片、磁盘、磁带、以及内装半导体存储器的磁卡。
即,在本发明中,求包含用于从属分配的辅助分配位的位分配和不包含辅助分配位的位分配。上述不包含辅助分配位的位分配可以对各通道独立地求,基本上每个通道都具有一定的位分配量。
这里,对于包含上述辅助分配位的位分配量比不包含辅助分配位的位分配置还大的通道,将辅助分配的时间域或频率域的信息样品分割为基于不包含辅助分配位的位分配的信息样品(A)和其余的信息样品(B)。
上述其余的信息样品(B),可以作为具有基于包含辅助分配位的位分配的信息样品(C)与基于不包含辅助分配位的位分配的信息样品(A)之差的大小的信息样品而求出。
另一方面,对于包含辅助分配位的位分配量与不包含辅助分配位的位分配量相同或比其小的通道,将辅助分配位的时间 域或频率域的样品信息(C)作为该通道的位分配使用。
这样,当使用对仅按独立分配已进行位分配的编码信号进行译码的译码器时,在该译码器中,对于包含辅助分配位的位分配量比不包含辅助分配位的位分配量还大的通道,重放基于不包含辅助分配位的位分配的信息样品(A)。
相反,对于包含辅助分配位的位分配量与不包含辅助分配位的位分配量相同或比其还小的通道,可以重放辅助分配的信息样品(C)。
另外,进行完全的重放时,对于包含辅助分配位的位分配量比不包含辅助分配位的位分配量还大的通道,利用基于不包含辅助分配位的信息样品(A)和其余的信息样品(B)可以将辅助分配位的样品信息重放出更高音质的重放声音。为此,只要将分别对信息样品(A)和信息样品(B)进行译码后的数据进行加法运算就可以了。
另外,通过使上述信息样品(A)的位分配量和上述信息样品(B)的位分配置之和的所有通道的总位分配量基本上保持一定,就可以期望以一定的位速率向记录媒体上进行记录。
对于上述情况,通过根据上述信息样品(A)的采样数据用的比例系数和字长求出与上述信息样品(B)的位分配有关的采样数据标准化用的比例系数,可以不从编码一侧向译码一侧发送与上述信息样品(B)的位分配有关的比例系数,而由译码一侧产生,从而,可以减少记录及传送所需要的信息量。
另外,为了得到基于不包含辅助分配位的位分配的采样信息(A),进行包括四舍五入处理在内的量化处理,对减少量化噪音是有效的。
为了在译码器一侧知道进行用于上述信息样品(B)的位分配的通道是哪1个通道,通过使向通道分配的位分配量比小于上述一定的基准量的第2基准量大来实现,从而不必从编码一侧向译码一侧传送专用数据,这是很有利的。
另外,在本发明中,对于对时间轴和频率轴已进行细分的小块中的样品,在该小块内进行相同的量化处理。为了得到上述小块中的样品,在进行滤波器等的非块化频率特性的分析之后,对该滤波器等的非块化频率特性的分析输出进行正交变换等的块化频率特性的分析。
这时,上述非块化频率特性分析的频带宽度至少在最低频的2个频带内相同,这对于降低成本是有效的。另外,上述非块化频率特性分析的频带宽度在高频区比低频区宽,这对利用基于临界频带的听觉效果是重要的。
上述块化频率特性的分析,通过根据输入信号的时间特性自适应地改变其块尺寸,可以进行与输入信号的时间特性对应的最佳处理。将上述块尺寸的改变至少对2个上述非块化频率特性分析的输出频带独立地进行,对于防止频率成分间的相互干涉、各频带成分独立地进行最佳的处理是有效的。
分配给各通道的位分配量由各通道的比例系数或采样最大值决定,这对减少运算是有效的。
另外,根据由各通道的比例尺寸所代表的振幅信息随时间的变化来改变分配给各通道的位分配量,这对于减少量化噪音是有益的。并且,在包含用于同步的信息在内的1个同步块中,把多个通道用的上述第1位分配样品群和多个通道用的上述第2位分配样品群分离开来进行记录。
按照本发明,对于多个通道的信号,将向分配比一定的基准量还大的位置的通道分配的位分配量分解为最多不超过一定的基准量的第1位分配量和其余的第2位分配量,通过对多个通道的时间域内的采样数据或频率域内的采样数据在通道之间进行可变位分配,可以进行利用从属分配的高音质重放。通常,对于经常使用的各个通道分别使用小于固定的位速率,即使是应用了在频率域和时间域内的自适应位分配技术的译码器也可以进行无音质恶化的重放。因此,具有互换性,可以在不同的记录媒体之间进行信息的收送。
另外,特别是在放映装置中,使之有可能使用对各通道分别使用小于固定值的位速率、对每个通道使用频率域和时间域内的自适应位分配技术的译码器。因此,可以提供需要高品质的音质的声频系统和电影的非常适合于声音记录重放的系统。
这时,通过根据关于上述第1位分配量的采样数据用的比例尺寸和字长求关于上述第2位分配量的采样数据用的比例系数,可以不必从编码一侧向译码一侧发送关于上述第2位分配的采样数据用的比例系数而在译码一侧形成,从而可以减少记录及传送所需要的信息量。
另外,通过使不包含最多不超过上述一定的基准量的辅助分配位的位分配的第1位分配量的位量比小于上述一定的基准量的第2基准量大,在译码一侧就可以知道进行上述第2位分配的通道,从而不必从编码一侧向译码一侧发送专用的数据。
为了得到基于不包含辅助分配位的位分配的采样信息进行包括四舍五入处理在内的量化处理,这在对于对各通道分别使用小于固定值的位速率、对每个通道使用频率域和时间域的自适应位分配技术的译码方面,可以有效地减少量化噪音。
进而,为了得到将时间轴和频率轴细分割后的小块中的样品,在进行滤波器等的非块化频率特性的分析之后,利用正交变换等对该滤波器等的非块化频率特性分析的输出进行块化频率特性的分析,由此可以求出在时间域及频率域产生听觉掩蔽的量化噪音,从而可以获得听觉上理想的频率特性的分析。
这时,上述非块化频率特性分析的频带宽度至少在最低频区的2个频带内相同,这对降低成本是有效的。
通过使上述非块化频率特性分析的频带宽度至少在最高频段是频率越高频带越宽,可以有效地利用基于临界频带的听觉效果。
上述块化频率特性的分析,通过根据输入信号的时间特性自适应地改变其块尺寸,可以进行与输入信号的时间特性对应的最佳处理。
上述块尺寸的改变至少对2个上述非块化频率特性分析的输出频带独立地进行,这对于防止频率成分间的相互干涉、各频带成分独立地进行最佳的处理是有效的。
在进行辅助位分配时,通过利用各通道的比例系数进行计算,可以使其位分配计算简单化。
附图的简单说明
图1是本发明高效率编码装置的结构例子的电路框图。
图2A和图2B是本发明高效率编码装置中的信号的频率和时间分割图。
图3是用于求本发明高效率编码装置的多通道位分配用的参量的电路构成例子的电路框图。
图4A~图4H是在通道间根据频谱的大小进行位分配的示意图。
图5A~图5H是考虑了通道间的信号的时间特性的位分配用的求参量的方法的示意图。
图6是位分配(1)的位分配量与音调间的关系图。
图7是位分配(1)的位分配置与时间变化率间的关系图。
图8是均匀分配时的噪音频谱图。
图9是为了得到与信号的频谱及电平相关的听觉效果而进行的位分配的噪音频谱的例子。
图10是实现利用信号的大小和听觉允许的噪音频谱的位分配方法的电路构成的电路框图。
图11是用于求允许噪音电平的电路构成的电路框图。
图12是各频带的信号电平的掩蔽临界值的例子。
图13是信息频谱、掩蔽临界值、最小可听极限的图。
图14是对于音调低的信号与信号电平和听觉允许噪音电平相关的位分配的图。
图15是对于音调高的信号与信号电平和听觉允许噪音电平相关的位分配的图。
图16是音调低的信号的量化噪音电平。
图17是音调高的信号的量化噪音电平。
图18A和图18B是多通道中位分配的关系图。
图19是表示第1与第2量化电路的关系的电路框图。
图20是同步块中数据排列的模式图。
图21是本发明高效率编码的译码装置的结构例子的电路框图。
图22是本发明高效率编码方法的位分配的流程图。
实施发明的最好形式
下面,参照附图说明应用本发明的高效率编码方法的高效率编码装置(编码器)、应用本发明的高效率编码的译码方法(高效率编码的译码重放方法)的高效率编码的译码装置(译码器)的实施例。
在本实施例中,利用频带分割编码(SBC)、自适应变换编码(ATC)和自适应位分配(APC-AB)的各种技术对音频PCM信号等的输入数字信号进行高效率编码。下面,参照图1说明该技术。
图1是应用本发明的实施例的高效率编码装置。
简而言之,利用MF将时间 域的输入数字信号分割为多个频带,对各频带进行正交变换,得到作为频率域的频谱数据的频谱数据,将该频谱数据对每个临界频带自适应地进行位分配后再编码,就是这样一种高效率编码装置。
这时,在高频区使用进一步分割了临界频带的频带。当然,也可以将利用QMF而非块化的频率分割宽度取为等分割宽度。
在本发明实施例中,在进行正交变换之前,根据输入信号自适应地改变块尺寸(块长),同时,按临界频带单位或者在高频区按进一步细分割了临界频带的频带进行浮点处理。
所谓浮点处理,就是根据1的指标对多个数据值进行标准化处理。
下面,详细说明图1的高效率编码装置。
例如,将0~22KHz的声频PCM信号输给输入端子10。通常的声频频带,使用0~20KHz就足够了,但是,通过将高频端扩展到22KHz,可以处理更高品位的声频信号。
该输入信号首先利用由QMF构成的频带分割滤波器11分割为0~11KHz频带和11~22KHz频带。进而将0~11KHz频带的信号利用由相同的QMF构成的频带分割滤波器12分割为0~5.5KHz和5.5~11KHz频带。
从频带分割滤波器11,12输出的各频带的信号传送给正交变换电路即MDCT电路13~15,分别变换为MDCT系数。由各MDCT电路13~15对各频带根据由块决定电路19~21决定的块尺寸进行MDCT。
这里,由上述块决定电路19~21决定的各MDCT电路13~15中的块尺寸的具体例子示于图2A和图2B。图2A是在时间轴上正交变换块尺寸长的情况(称为长模式),图2B是在时间轴上正交变换块尺寸短的情况(称为短模式)。
在该图2的具体例子中,上述3个滤波器的输出分别具有2个正交变换块尺寸。
即,如图2A所示,在长的块长(11.6msec)的情况下,对于低频区的0~5.5KHz频带的信号和中频区的5.5~11KHz频带的信号,将1块内的采样数取为128个采样点。相反,如图2B所示在短的块长(2.9msec)的情况下,将1块内的采样数取为32个采样点。
对于高频区的11~22KHz频带的信号,在长的块长的情况下(图2A),将1块内的采样数取为256个采样点,在短的块长(1.45msec)的情况(图2B)下,将1块内的采样数取为32个采样。
这样,当选择短的块时,使各频带的正交变换块的采样数相同,从而提高了高频区的时间分辨率,同时减少了进行MDCT用的窗口的种类。
表示由上述块决定电路19~21决定的块尺寸的信号输给各MDCT电路13~15来切换其窗口,另外,还传送给后面所述的自适应位分配编码电路16~18,同时,从输出端子25~27输出,用于记录及传送。
再回到图1中,由各MDCT电路13~15进行MDCT处理后得到的频率区域的频谱数据即MDCT系数数据汇集到临界频带内或者在高频区汇集到进一步分割临界频带后的每个频带内,然后传送给自适应位分配编码电路16~18。
由自适应位分配编码电路16~18对上述块尺寸的信息和每个临界频带或者在高频区进一步分割临界频带后的每个频带,根据分配的位量将各MDCT系数数据进行标准化和再量化处理。
这时,由自适应位分配编码电路16~18将对各通道指定的位量作为上限,对各个块进行位量的分配。
表示各通道的频谱分布的数字信号(MDCT系数)通过端子29传送给自适应位分配电路30,另一方面,通过端子28将可在各通道的块中使用的位量从自适应位分配电路30输给自适应位分配编码电路16~18。
这样,按指定的位量编码的数据通过输出端子22~24被取出。同时,从该自适应位分配编码电路16~18可以得到关于标准化的比例系数信号和表示以什么字长进行再量化的字长信号,这些信号作为辅助信号也从输出端子22~24输出。
另外,图1中的各MDCT电路13~15的输出,可以把将上述临界频带或者在高频区进一步分割临界频带后的每个频带的能量通过计算每个该频带的各振幅值的均方根求出来。
当然,也可以不用上述的能量而将上述比例系数直接应用于以后的位分配。这时,由于不需要进行计算能量的运算,所以,可以节约硬件规模。另外,也可以不使用各频带的能量而使用振幅值的峰值或平均值。
下面,使用图3说明用于进行上述位分配的自适应分配电路30的具体结构及其动作。还有在图3的例子中,以电影为例,而且取声频信号的通道数为8(CH1~CH8)。
在图3中,对于各通道中共同的部分,利用通道CH1进行说明(对于其他通道,标以相同的指示符号,并省略其说明。)。
各通道的输入信号输给对应的各通道的输入端子31。该端子31与图1的端29对应。该输入信号利用映射电路32可以得到输入信号的频率分析(频谱分布)。
这里,当使用滤波器作为映射电路时,作为辅助频带信号,可以得到时间域采样数据。另外,当使用正交变换时和在滤波后使用正交变换时,可以得到频率域采样数据。
这些采样数据由块化电路33将多个采样数据分块地汇集在一起。如前所述,当使用滤波器时,则汇集时间区域的多个采样数据,当使用正交变换和在滤波之后使用正交变换时,则汇集频率区域的多个采样数据。
另外,在本实施例中,利用时间变化计算电路34计算根据输入信号逐次映射的采样数据的时间变化(V)。通过将输入信号的过渡变化反映在位分配上,可以得到更高品位的信号。
利用上述块化电路33将多个样点汇集的各采品由标准化电路37进行标准化。这里,用于标准化的系数即比例系数(SF)可以由比例系数计算电路35得到。对多个样点通过使用共同的比例系数1,可以有效地压缩数字信号。
同时,音调可以用音调计算电路36进行计算。所谓音调(T),表示输入信号的频谱分布的起伏,起伏大的输入信号称为音调高的信号。详细情况,后面介绍。
上面求的采样数据的时间变化(V)、比例系数(SF)和音调(T)等参量,在位分配电路38中用于位分配计算。
位分配计算,基本上是与输入信号对应的自适应的位分配。详细地说,就是有与各通道的输入信号的频谱分布及过渡特性对应的独立分配和利用各通道间的相关性的从属分配。此外,还根据各通道的重要程度、使用目的和信号的频带宽度等对分配进行调整。
这里,将表现MDCT系数的并且可以用于传送或记录的位量在全部通道中取为800kbps,利用本实施例的位分配电路38求包含从属分配位的第1位分配(第1位分配量)和不包含从属分配位的第2位分配(第2位分配量)。
这些位分配对于各通道通过端子39(在图1中为端子28)输给自适应位分配编码电路。
下面,先说明包含从属分配位的第1位分配。在这里,根据比例系数(SF)的频率域的分布进行自适应位分配。
这时,通过根据全部通道的比例系数(SF)的频率 域的分布进行从属分配,由此可以进行有效的位分配。
这时,多个通道的信号信息,如利用扬声器进行重放时那样,考虑在同一个声场中混合后到达左右耳的情况。这时,考虑根据全部通道信号进行加法运算的结果来达到掩蔽效果。
因此,如图4A、图4H所示的那样,使在同一频带内各通道的噪声电平相同这样来进行位分配是有效的。
因为当某一通道与其他通道相比噪声电平大时,在该通道中就会感知噪声。另外,即使某一通道与其他通道相比噪声电平小,结果总体的噪声电平还是由其他通道的噪声电平来决定。
因此,作为1个方法,只要进行与比例系数指标的大小成正比的位分配就行了。即,按照下式进行位分配:
Bm=B*(∑SFn)/St
St=∑(∑SFn)
这里,Bm为向各通道的位分配量,B为向全部通道的位分配量,SFn为比例系数指标,基本上与峰值的对数对应。n为各通道的块浮动频带序号,m为通道序号,St为全部通道的比例系数指标之和。在图4A和图4H中,只示出了通道CH1和通道CH8,通道CH2~通道CH7省略了。
另外,位分配电路38还具有检测各通道的信号的时间变化特性(V)并利用该指标改变独立分配量的处理。下面,参照图5A~图5H说明求表示该时间变化的指标的方法。
如图5A~图5H所示,假设有8个通道,分别对各通道的信息输入信号从时间上将位分配的时间单位即位分配时间块一分为四,分别得到各个小时间块(子块)的峰值。
并且,根据各子块的峰值从小向大变化时的差分的大小在通道间进行相应的位分配。这里,假定用于位分配的位量在总共8个通道中可以使用C个位时,假定各通道的各子块的峰值从小向大变化时的差分的大小分别为a(图5A)、b(图5B)、……h(图5H)分贝(dB),则可分别分配为
C*a/T、C*bT、……C*h/T位(bit)
(其中,T=a+b+c+d+e+f+g+h)。
峰值的变化越大,对该通道的位分配量越大。在图5A~图5H中,只示出了与通道CH1、CH2、CH8对应的图5A、图5B、图5H,与通道CH3~CH7对应的图5C~图5G省略了。
下面,说明不包含从属位分配的第2位分配方法。作为第2位分配方法,进一步说明2个位分配方法。
设这2个位分配方法分别为位分配(2-1)和位分配(2-2)。在下面的位分配中,假定分配给各通道的位量在各通道中为固定的值。
例如,在8个通道中,向承担声音等重要部分的2个通道分配147kbps这样比较大的位量,对于副低音通道最多分配2kbps,对除此以外的通道分配100kbps。
首先,确定位分配(2-1)应使用的位量。为此,在信号信息(a)的频谱信息中使用音调信息(T)和信号信息(b)的时间变化信息(V)。
这里,先说明音调信息(T)。使用将用信号频谱数除信号频谱的相邻值之间的差值的绝对值之和而得到的值作为指标。为了更简单起见,使用块浮动用的每个块的比例系数的相邻比例系数指标间的差值的平均值。比例系数指标基本上与比例系数的对数值对应。
在本实施例中,将位分配(2-1)应使用的位量与表示该音调的值对应地设定为最大80kbps、最小10kbps。这里,为了简单,对所有通道均等地取为100kbps。
音调的计算按下式进行。即
T=(1/WLmax)(∑ABS(SFn-1))
WLmax为字长最大值=16,SFn是比例系数指标、基本上与峰值的对数对应。n是块浮动频带序号。
这样求出的音调信息(T)和位分配(2-1)的位分配量如图6所示的那样对应。
与此同时,在本实施例中,位分配(2-1)与其附加的其他的至少1个位分配的分割比例与信号的时间变化特性(V)有关。在本实施例中,在进一步分割正交变换时间块尺寸的每个时间区间,对每个相邻的块比较信号信息的峰值。借此,在时间轴和频率轴的2维坐标系统中进行比较,检测信号的振幅急剧增大的部分,利用该状态确定分割比例。
时间变化率的计算,按下式进行。即
Vt=∑Vm
Vav=(1/Vmax)*(1/Ch)Vt
其中,Vt是将各通道的时间子块的峰值从小到大的变化用dB值表示的各通道之和,Vm是将各通道的时间子块的峰值从小到大的变化用dB值表示的量,最大的变化值的大小(这里,将最大值限制为30dB)用Vmax表示。m是通道序号,Ch是通道数,Vav是将时间子块的峰值从小到大的变化用dB值表示的通道平均值。
这样求出的时间变化率Vav和位分配(2-1)的分配量如图7所示的那样对应。最终,位分配(2-1)的分配量可以按下式求出。即
B=1/2(Bf+Bt)
其中,B是最终的位分配(2-1)的分配量,Bf是根据Tav求出的位分配量,Bt是根据Vav求出的位分配置。
这里的位分配(2-1),是进行与比例系数有关的频率、时间域上的分配。
这样,如果决定了位分配(2-1)使用的位量,然后就决定不在位分配(2-1)中使用的位的分配,即决定位分配(2-2)。在位分配(2-2)中,进行如下所示的各种位分配。
第1,使用能在 位分配(2-2)中使用的位的一部分,进行对所有的采样值的平均分配。
这时的量化噪音频谱的一个例子示于图8。这时,噪音电平在整个频带内均匀地减小。即,通过均匀分配,第1位分配中的噪音电平(虚线NL1)均匀地减小为用虚线NL2表示的噪音电平。
这样的均匀分配,在输入信号为音调低的平滑的信号时是有效的。
第2,使用能在位分配(2-2)中使用的其余的位,进行为了得到与信号信息的频谱及电平相关的听觉效果的位分配。
与这时的位分配对应的量化噪音频谱的一个例子示于图9。在本例中,进行与信号的频谱相关的位分配,特别是在信号频谱的低频区进行加权的位分配,用以补偿与高频区相比产生的低频区的掩蔽效果的减小。这是考虑了相邻临界频带间的掩蔽,基于侧重于频谱的低频区的掩蔽曲线的非对称性而采用的。
这样,在图9的例子中,进行侧重于低频区的位分配。即,通过进行为了获得与上述频谱及电平相关的听觉效果的位分配,把第1位分配中的噪音电平(虚线NL1)减小为用虚线NL2表示的噪音电平。
图8和图9中用SS表示的粗线表示连接信号频谱的峰值的线。
并且,最后位分配(2-1)和附加在位分配(2-2)上的位分配之和可以由图3的位分配电路38得到。最后的位分配则以上述各位分配之和而给出。
下面,说明不包含从属分配位的位分配的其他方法。
利用图10说明这时的自适应位分配电路800的动作。
在图10的实施例中,输入信号作为MDCT电路13~15的输出(MDCT系数)之和而给出。MDCT系数输给输入端子801。供给该输入端子801的MDCT系数输给每个频带的能量计算电路803。在每个频带的能量计算电路803中计算关于临界频带或者在高频区进一步再分割临界频带后的各个频带的信号能量。由每个频带的能量计算电路803计算出的各个频带的能量供给与能量相关的位分配电路804。
由与能量相关的位分配电路804进行位分配,从而使用按从可使用总位发生器802输出的可使用总位量的某一比例的位量产生白色量化噪音,在本实施例中,是使用按128kbps的某一比例的位量,例如100kbps。这时,输入信号的音调越高,即输入信号的频谱的凸凹越大,该位量占上述128kbps的比例越大。
为了检测输入信号的频谱的凸凹,使用相邻块的块浮点系数之差的绝对值之和作为指标。并且,根据求出的可使用的位量,进行与各频带的能量的对数值成正比的位分配。
与听觉允许噪音电平相关的位分配计算电路805,首先根据分配给上述每个临界频带的频谱数据计算考虑了所谓掩蔽效果的各临界频带的允许噪音量。然后,分配出从可使用总位量中减去与能量相关的位量后的位量,用以给出听觉允许噪音频谱。将这样求出的与能量相关的位量与听觉允许噪音电平相关的位量进行加法运算后,作为位分配信号从输出端子807输出。
位分配信号在图1的自适应位分配编码电路16~18中根据分配给各临界频带或者在高频区进一步将临界频带分割为多个频带的频带的位量,对各频谱数据(或者MDCT系数数据)进行再量化处理。这样编码的数据通过图1的输出端子22~24取出。
若进一步详细地说明上述与听觉允许噪音频谱相关的位分配电路805中的听觉允许噪音频谱计算电路,就是由MDCT电路13~15得到的MDCT系数输给上述允许噪音计算电路。
图11是已经把上述允许噪音计算电路归纳起来说明了的一个具体例子的简要构成的电路框图。在图11中,从MDCT电路13~15输出的频率域的频谱数据输给输入端子521。
该频率域的输入数据,传送给每个频带的能量计算电路522,上述每个临界频带的能量可以通过计算例如该频带内的各振幅值平方的总和而求出。有时也可以不使用各频带的能量而使用振幅值的峰值、平均值等。作为该能量计算电路522的输出,例如各频带的总和值的频谱,通常称为伯克频谱。图12就是这种各临界频带的伯克频谱SB。只是,在图12中,为了简化图示,用12个频带(B1~B12)表示上述临界频带的频带数。
这里,为了考虑上述伯克频谱SB的所谓掩蔽的影响,对该伯克频谱SB进行乘以指定的加权函数后再进行加法运算的卷积处理。所以,上述每个频带的能量计算电路522的输出即该伯克频谱SB的各个值传送给卷积滤波电路523。该卷积滤波电路523例如由使输入数据顺序延迟的多个延迟元件、将这些延迟元件的输出乘以滤波系数(加权函数)的多个乘法器(例如与各频带对应的25个乘法器)和求各乘法器输出的总和的总和加法器构成。
上述所谓掩蔽,是指由于人的听觉特性某一信号将其他信号掩盖而听不到的现象。该掩蔽效应有由于时间域的声频信号引起的时间轴掩蔽效应和由于频率域的信号引起的同时刻掩蔽效应。由于这些掩蔽效应,即使被掩蔽的部分有噪音,也听不到这些噪音。所以,在实际的声频信号中,将该掩蔽范围内的噪音定为可允许的噪音。
这里,示出上述卷积滤波电路523的各个乘法器的乘法系数(滤波系数)的一个具体例子,当取与任意的频带对应的乘法器M的系数为1时,则通过在乘法器M-1中以系数0.15、在乘法器M-2中以系数0.0019、在乘法器M-3中以系数0.0000086、在乘法器M+1中以系数0.4、在乘法器M+2中以系数0.06、在乘法器M+3中以系数0.007分别与各延迟元件的输出相乘,进行上述伯克频谱SB的卷积处理。其中,M为1~25的任意整数。
然后,将上述卷积滤波电路523的输出传送给减法器524。该减法器524计算与上述卷积区域内的后面所述的可允许的噪音电平对应的电平α。与该可允许的噪音电平(允许噪音电平)对应的电平α,如后所述是通过进行反卷积处理后成为各临界频带的允许噪音电平的电平。这里,将用于求上述电平α的允许函数(表示掩蔽电平的函数)输给上述减法器524。通过增减该允许函数来控制上述电平α。该允许函数是从下面说明的(n-ai)函数发生电路525供给的。
即,设从临界频带的频带低频区顺次给出的序号为i,则与允许噪音电平对应的电平α可根据下式求出。
α=S-(n-ai)
式中,n,a为常数,a>0,S是经过卷积处理的伯克频谱的强度,式中的(n-ai)为允许函数。作为例子,可以使用n=38,a=-0.5。
这样,求出上述电平α后,将该数据传送给除法器526。该除法器526用于对上述卷积区域内的上述电平α进行反卷积处理。因此,通过进行该反卷积处理,可以根据上述电平α得到掩蔽临界值。即,该掩蔽临界值成为允许噪音频谱。上述反卷积处理需要进行复杂的计算,但是,在本实施例,使用简化的除法器526进行反卷积处理。
然后,上述掩蔽临界值通过合成电路527传送给减法器528。这里,上述每个频带的能量检测电路522的输出即上述伯克频谱SB通过延迟电路529输给该减法器528。
因此,由该减法器528进行上述掩蔽临界值与伯克频谱SB的减法运算,因此如图13所示的那样,上述伯克频谱SB被掩蔽在由该掩蔽临界值MS的电平所示的电平以下。延迟电路529是考虑了上述合成电路527以前的各电路的延迟量、为了使从能量检测电路522输出的伯克频谱SB延迟而设置的。
该减法器528的输出,通过允许噪音修正电路530从输出端子531取出,传送给例如预先存储了分配位量信息的ROM等(图中未示出)内。该ROM等根据从上述减法电路528通过允许噪音修正电路530得到的输出(上述各频带的能量与上述噪音电平设定装置的输出的差分电平),输出各频带的分配位量信息。
这样,将与能量相关的位量与听觉允许噪音电平相关的位量相加后所得到的分配位量信息通过图1的端子28传送给上述自适应位分配编码电路16~18,这里,从MDCT电路13~15输出的频率域的各频谱数据分别以分配给各频带的位量进行量化处理。
即,简言之,自适应位分配编码电路16~18,以与上述临界频带的各频带区域(临界频带)或在高频区将临界频带进一步分割为多个频带的频带的能量或者峰值和上述噪音电平设定装置的输出的差分电平相对应而分配的位量,对上述各频带的频谱数据进行量化处理。
在由上述合成电路527进行合成时,可以将表示由最小可听曲线发生电路532供给的图13所示的人的听觉特性即所谓的最小可听曲线RC的数据与上述掩蔽临界值MS进行合成。在该最小可听曲线中,只要噪音绝对电平在最小可听曲线以下,就听不到该噪音。
即使编码方法相同,该最小可听曲线也因重放时的重放音量不同而不同。但是,实际上在以音乐为声源的数字声频系统中,例如在利用16位量化处理的数字记录中,最小可听曲线没有太大差别。
因此,只要听不到4KHz附近的听觉最容感知的频带的量化噪音,就可以认为在其他频带的最小可听曲线电平以下的量化噪音也听不到。
因此,假定采用例如听不到系统所具有的动态范围内的4KHz附近的噪音的使用方法,并且,假定将该最小可听曲线RC与掩蔽临界值MS都合成得到允许噪音电平,则可使这时的允许噪音电平达到图13中斜线表示的部分。在本实施例中,使上述最小可听曲线的4KHz的电平与例如相当于20位的最低电平一致。该图13还同时示出了信号谱SS。
另外,在上述允许噪音修正电路530中,根据从修正信息输出电路533传送来的例如等响度曲线的信息修正上述减法器528的输出中的允许噪音电平。这里,所谓等响度曲线是与人的听觉特性有关的特性曲线,例如是把能听到与1KHz的纯音相同大小的各频率的声音的声压求出后用曲线连接而成的曲线,也称为响度的等灵敏度曲线。
另外,该等响度曲线是与图13所示的最小可听曲线RC基本上相同的曲线。在该等响度曲线中,例如在4KHz附近,即使声压比1KHz时下降8~10dB,也可听到与1KHz相同大小的声音,相反,在50KHz附近,如果不比1KHz的声压高约15dB,就不能听到相同大小的声音。
所以,可见使越过上述最小可听曲线的电平的噪音(允许噪音)具有由与该等响度曲线对应的曲线给定的频率特性为好。由此可知,考虑上述等响度曲线来修正上述允许噪音电平是适合于人的听觉特性的。
上面说明了以可使用的总位量128kbps内的某一比例的位分配形成与听觉允许噪音电平相关的频谱形状。该比例随着输入信号的音调增高而减小。
下面,说明2个位分配方法之间的位量分割方法。
再回到图10,由MDCT电路输出供给的从输入端子801来的信号也输给频谱的平滑度计算电路808,由该电路计算频谱的平滑度。在本实施例中,把信号频谱的绝对值的相邻值之间的差值的绝对值之和除以信号频谱的绝对值之和而得到的值作为上述频谱的平滑度计算出来。
上述频谱的平滑度计算电路808的输出送给位分割率决定电路809,由该电路决定与能量相关的位分配和与听觉允许噪音频谱相关的位分配之间的位分割率。考虑到频谱的平滑度计算电路808的输出值越大越没有频谱的平滑度,在进行位分配时位分割率的重点放在与听觉允许噪音频谱相关的位分配上,而不是放在与能量相关的位分配上。位分割率决定电路809向分别控制与能量相关的位分配和与听觉允许噪音频谱相关的位分配的大小的乘法器811和812传送控制信号。这里,假定频谱是平滑的,为了给与能量相关的位分配加权,将向乘法器811传送的位分割率决定电路809的输出取为0.8的值时,将向乘法器812传送的位分割率决定电路809的输出取为
1-0.8=0.2
这两个乘法器的输出由加法器806相加后成为最终的位分配信息,从输出端子807输出。
这时的位分配的情况示于图14和图15。另外,与其对应的量化噪音的情况示于图16和图17。
图14是信号频谱为低音调的情况,图15是信号频谱为高音调的情况。另外,在图14和图15中,用斜线表示的QS是与信号电平相关部分的位量。
另外,图中用白框表示的QN是与听觉允许噪音电平相关部分的位量。在图16和图17中,SS表示信号电平,NS表示由与信号电平相关部分的位分配引起的噪音降低的部分,NN表示由与听觉允许噪音电平相关的位分配引起的噪音降低的部分。
首先,在信号的频谱比较平坦的图14中,与听觉允许噪音电平相关的位分配遍及全频带,这对于获得大的信噪比有作用。但是,在低频区和高频区,使用比较少的位分配。这是为了在听觉上对该频带区的噪音的灵敏度小。虽然与信号能量电平相关的位分配的部分数量不多,但是,为了产生白色噪音频谱,这时,分配重点放在中低频区的信号电平高的频率区域。
与此相反,如图15所示,在信号频谱为高音调的情况下,与信号能量电平相关的位分配量增多,量化噪音的降低只使用于降低很窄的频带的噪音。与听觉允许噪音电平相关的位分配的集中没有如此强烈。
如图10所示,利用这两种位分配之和达到提高孤立频谱输入信号的特性。
使用以上得到的包含从属分配位的位分配和不包含从属分配位的位分配,按如下方式进行第1和第2量化处理。
图18A和图18B是对于8通道的声频信号各通道要求的位数,换言之,不降低各通道的音质所需要的位数。
在图18A中,示出了用只画格子的部分(CH2,CH4,CH5,CH7,CH8)或者用画格子的部分和画斜线的部分两者之和(CH1,CH3,CH6)来表示的各通道所要求的位量。其中,画斜线的部分是与辅助分配位对应的位量。画点的部分表示剩余的位(R),是位速允许的各通道的上限位量(147kbps)与各通道实际要求的位量(将各通道内的允许位量规定为很小的值例如2kbps时的情况是其上限)之差。
在图18A的例子中,全部8个通道中要求的位量超过147kbps的通道为通道CH1、通道CH3、通道CH6。
首先,对于输入信号所要求的包含辅助分配位的位分配量超过147kbps的通道,例如对于通道CH1,考虑分为以某一恒定的位量例如147kbps为最大的部分(I)和超过147kbps的部分(S)。
即,将输入信号分割为以与独立分配对应的147kbps的位量进行量化处理的部分和以辅助分配的位量进行量化处理的部分,分别以其位量进行量化处理。
例如,将16位的数字-字的输入信号分解为包含MSB的10位部分和包含LSB的6位部分,考虑用独立分配对10位部分进行量化处理,用辅助分配对6位部分进行量化处理。
进行该处理的结构示于图19。
在图19的结构中,对于位量超过147kbps的位分配的各采样点,进行关于每一多个采样点的块的标准化处理,即,进行块浮动处理。这时,作为表示进行了何种程度的块浮动处理的系数,可以得到比例系数。
在图19中,供给输入端子900的信号,由增益调整器905进行增益调整。
然后,量化器901根据上述不包含辅助分配位的位分配的位量(147kbps)以各采样字长进行再量化处理。这时,为了减少量化噪音,进行采用四舍五入的再量化处理。
另外,MSB一侧的几位定为采样字长。也可以将这时的采样字长固定。这时,很难取与上述位量(147kbps)接近的位量。
因此,最好是根据输入信号自适应地改变采样字长。为此,例如对从上述量化器901输出的数据量进行乘法运算,对上述量化器901进行反馈控制,以使接近于147kbps。
然后,由差分器902取出量化器901的输入与输出之差,由增益调整器906对其进行增益调整后,输给第2量化器903。
由该量化器903可以得到上述输入信号的采样字长与利用上述不包含辅助分配位的位分配的采样字长之差的采样字长。即,可以得到上述输入信号的LSB一侧的几位。
这时的浮动系数根据第1量化器901使用的浮动系数和字长自动地决定。即,当第1量化器901使用的字长为N位时,利用(2**N)可以得到第2量化器903使用的浮动系数。
在第2量化器903中,和第1量化器901一样,进行利用位分配的包括四舍五入的再量化处理。
这样,通过2个量化处理,将要求位量超过147kbps的通道的数据,分为小于147kbps并且尽可能接近147kbps的位分配的数据和其余的位分配的数据。
另外,对要求的位分配为小于147kbps的位分配的通道,直接使用该位分配。
在以上的例子中,上述从属分配的位,即包含在与用画格子的部分(I)表示的独立分配对应的位中,也包含在用画斜线的部分表示的辅助分配位(S)中。
即,各通道的总位与有无辅助位无关,定为独立分配位与从属分配位之和。
因此,例如,对于上述通道CH1,将画格子的部分(I)的70%定为进行独立分配的位,将其余的30%定为进行从属分配的位。另外,对于辅助位(画斜线的部分(S)),同样将70%定为进行独立分配的位,将其余的30%定为进行从属分配的位。这时,也可以将辅助位的50%定为进行独立分配的位,将其余的50%定为进行从属分配的位。
另外,为了使处理简单,对于用画格子的部分(I)表示的小于147kbps的部分定为按独立分配进行分配的位,对于用画斜线部分表示的辅助分配位(S)定为按从属分配进行分配的位。即,对于各通道的总位,辅助位定为全是从属分配位。
因此,例如,在上述图18A的例子中,只对通道CH1、通道CH3、通道CH6使用考虑通道间的相关性的位分配即从属分配进行位分配,定为辅助分配位。该方法的优点是位分配的计算容易。
如前所述,上述其余的位分配的成分的大小,如图19所示的那样,可以根据位分配(1)的比例系数和字长计算出比例系数,所以,只有字长对译码器是必须的。
进行上述值分配的流程图的例子示于图22。
首先,计算各通道的要求位量(S10)。然后,特别指定要求超过基准量的位量的通道(S11)。接着,计算各通道的剩余位(R)的总和(∑R)(S12)。然后,对于要求超过基准量的位置的通道,计算超过基准量的部分的位量(S)的总和(∑S)(S13)。
将剩余位(R)之和与超过基准量的部分的位量(S)之和进行比较(S14),如果超过基准量的部分的位量(S)之和大于剩余位(R)之和,则使超过各通道的基准量的部分的位置(S)减少,直至超过基准量的部分的位量(S)之和小于剩余位(R)之和(S15)。
当确定了向各通道的位分配时,先以分配位量的一部分进行独立分配(S16),然后以其余的分配位量进行从属分配(S17)。
当向各通道的分配结束时,对各通道进行是否进行辅助分配的判断(S18),对于进行超过基准量的位分配的通道,进行辅助分配(S19)。对于进行不超过基准量的位分配的通道,不进行辅助分配(S20)。
在图18A的例子中,未涉及辅助信息。但是,实际上不仅需要考虑数据用的位,而且还必须考虑将该数据进行译码所用的辅助信息的位。
因此,图18B中示出了考虑辅助信息的例子。
首先,设置128kbps和147kbps这两个临界值。根据经验,只要大约19kbps用于辅助信息就足够了。因此,考虑该位量和数据用的位量,将147kbps设定为最下限。
另外,当某一通道要求的位分配量大于128kbps、小于147kbps时,由于数据部分超过128kbps所以可用于辅助信息的位将减少。这时,该通道在上述不包含辅助分配位的位分配中便进行小于128kbps但尽可能接近128kbps的位分配。通过这样处理,音质会降低一些,但是,作为位削减量最大为19kbps、即为辅助信息的量,若考虑到互换性,这样处理是有其优点的。
下面,参照图18B说明某一通道要求的位分配量超过147kbps的情况。
例如,对于通道CH1,考虑分为以某一恒定的位量例如128kbps为最大的部分(Ia)和超过128kbps的部分(Ib,S)。
即,将输入信号分割为以与独立分配对应的128kbps进行量化处理的部分和以超过128kbps的分配进行量化处理的部分,分别以各自分配的位量进行量化处理。
和图18A一样,在图19中,利用第1量化器901和第2量化器903进行包括四舍五入处理的位分配。
利用2个量化器,对于高位的位利用小于128kbps并且接近于128kbps的位分配进行量化处理和编码。
另一方面,对于低位的位,利用超过128kbps的部分的位分配进行量化处理和编码。
应该注意的是不论图18A还是图18B的情况,能使用于辅助分配的位量是有限的。
所以,对于能使用于辅助分配的位量,必须注意有限制。例如,在上述图18A的例子中,辅助分配所需要的总位量是CH1、CH3、CH6画斜线的部分(S)之和,更详细地说,就是还必须考虑各通道的辅助信息。
与此相对,如果使所有通道的位速率固定,在图18A中,则CH2、CH4、CH5、CH7和CH8各通道的剩余位(R)之和相当于能使用于辅助分配的最大位量。如本实施例那样,如果位速率的上限为800kbps,则能使用于辅助位分配的位量将大大减少。
因此,当剩余位不足时,根据优先顺序,必须对使用辅助分配的位加以限制。如上述图22的例子所示的那样,削减分配位量(S15)。此外,不论是一律削减分配量还是优先特定的通道进行分配,都是有效的。
如前所述,对于利用上述辅助分配的数据的比例系数,可以根据与独立分配对应的位分配的数据的比例系数和字长进行计算,所以,可以只传送字长。
这样,由量化器901和903得到的各通道的数据排列成以指定的时间为单位的同步块。各通道的数据的排列方法示意地示于图20。
在图20中,示出了上述图18B的例子的数据排列。即,在同步块中,首先,
(1)不使用上述辅助分配的通道数据即小于128kbps的位分配的通道数据(CH2、CH4、CH5、CH7、CH8)用画格子的图案表示;
(2)使用上述辅助分配的通道数据内以某一恒定的位量例如128kbps为最大的部分的通道数据(CH1、CH3、CH6)用空白表示;
(3)使用上述辅助分配的通道数据中超过128kbps的辅助分配部分的通道数据(CH1、CH3、CH6)用画斜线表示。通过这样排列,可以进行如下处理。
首先,在不使用辅助分配的译码器中,只使用(1)、(2)部分的通道数据。因此,对于所有的通道,可以进行和不使用辅助分配的数据一样的处理。由于不使用辅助分配的数据,所以,辅助分配的通道数据(CH1、CH3、CH6)例如只进行MSB部分的译码。因此,成为以大的量化步长进行再量化处理,音质有所降低。但是,只降低到听觉上不会有什么问题的程度。
在使用辅助分配的译码器中,使用所有的数据。所以,辅助分配的通道数据(CH1、CH3、CH6)构成为将MSB部分与LSB部分合成后的完全的字。因此,可以译码出极高品质的声音信号。
在本例中,示出了使用辅助分配位的通道数为3的例子。实际上,如果决定只对音质重要的前2个通道使用辅助分配位,同步块的处理就会变得简单。相反,当不决定使用辅助分配位的通道,即根据输入信号自适应地切换使用辅助分配位的通道时,通过给各数据附加上通道ID,便可简单地对应起来。该ID只使每个通道增加3位的数据。
在图19中,在与编码器对应的译码器中,与增益调整器906对应地设置增益调整器907,与增益调整器905对应地设置增益调整器908,这些增益调整器907 908的输出由加法器904进行加法运算。该加法运算的输出从输出端子910取出。
加法运算的输出是独立分配的数据与辅助分配的数据的加法运算输出,构成完全的数据。
图21是用于将这样高效率编码的信号再次进行译码的本发明的基本实施例的译码装置。
在图21中,各频带的经过量化处理的MDCT系数输给译码装置输入端子122~124,使用的块尺寸信息输给输入端子125~127。在译码电路116~118中,使用自适应位分配信息来解除位分配。
然后,由I-MDCT电路113~115将频率域的信号变换为时间域的信号。这些部分频带的时间域信号由I-QMF电路112、111译码为全频带信号。
这里,进行了上述小于128kbps的位分配(1)的通道和进行了上述大于147kbps的位分配(2)的通道中以128kbps为最大的部分与辅助分配位的部分分别由上述译码电路116~118进行译码。
但是,使用辅助位分配的在分别进行译码后,以LSB部分和MSB部分构成1个字,成为1个精度高的采样点。
本发明实施例的记录媒体,用于记录由上述本发明实施例的高效率编码装置编码的信号。除了上述电影胶片外,上述编码信号还可以记录到光盘、光磁盘、磁盘等盘状的记录媒体上,或者将上述编码信号记录到磁带等媒体上,或者还可以举出存储编码信号的半导体存储器、I-C磁卡等。
另外,向本发明实施例的记录媒体上记录的本发明实施例的高效率编码信号的记录方法,在1个同步块中,把与第1位分配量相关的采样群和与第2位分配采样群分离开来进行记录,第1位分配量分配比多个通道用的一定的基准量大的位量;第2位分配采样群是与多个通道用的上述第1位分配量相关的采样群以外的其余的采样群。另外,这一记录对各通道交替地进行。
在本发明中,以数字声音信号的压缩编码-译码装置或方法为实施例进行了详细说明。
但是,本发明不限于数字声音信号,当然还可以应用于未作为实施例详细说明的数字图像信号。
即,在以并列通道传送和记录多个活动图像的装置中,对于要求的位分配数量大的复杂图案的图像通道,对超过指定值的部分,同样可以作为辅助分配进行处理。
产业上使用的可能性
根据以上的说明可知,本发明的高效率编码方法、与其对应的高效率编码的译码方法、高效率编码的译码重放方法、记录利用该高效率编码方法编码的信号的高效率编码信号记录方法和进行记录的记录媒体,可以将对于多通道系统的压缩使用从属分配技术已提高了音质的压缩信号利用从属分配以高音质进行重放。
另外,即使在对于通常经常使用的各通道使用小于固定值的位速率进行每个通道的位分配的译码器中,也可以以音质变化不大的品质进行重放。这样,例如电影胶片上的声音信号便可很容易地同时转录到其他光盘媒体上。另外,胶片上的信号的重放装置,即使用对于通常经常使用的各通道使用小于固定值的位速率进行每个通道的位分配的廉价的译码器也可以做出来。