基于能量的自适应DCT/IDCT装置及其控制方法 【技术领域】
本发明涉及MPEG4/H.263视频信号编码器的编码单元,特别涉及基于能量的自适应DCT/IDCT(离散余弦变换/逆离散余弦变换),用于通过模块单元中的输入图象的能量计算来处理DCT和IDCT的具有高速的高图象质量的操作,以及其控制方法。
背景技术
移动通信服务开始于第一代模拟服务,并已经从第二代地数字通信服务发展到了第三代的IMT-2000服务。IMT-2000服务是一种通信服务,以用于采用ITU-T(国际电信联盟-电信)提出的标准技术的下一代移动通信终端。IMT-2000服务使得用户能够在世界的任何地方接收诸如语音电话服务、电传服务、寻呼服务以及电子邮件服务等的各种服务。当前的主要向用户提供语音服务的移动通信服务,诸如蜂窝或PCS电话服务正在向支持诸如高速数据、信息包或图象的多媒体个人通信的IMT-2000服务发展。
IMT-2000移动终端向用户提供高速的全球宽带漫游服务,在其自己的具有VOD(视频点播)配置的屏幕上显示活动图象,并且使得用户经过装在终端上的摄象机交换他们的图象。
因此,IMT-2000终端是重要的多媒体应用服务处理器而不仅是调制解调器功能。所以需要调制解调器芯片之外的处理多媒体应用服务的芯片和附加的存储器来实现具有最优的处理能力和最少的错误的无线视频移动通信服务。
需要用于存储/发射大量的数据的压缩技术的发展及其标准化来实现上述的音频和活动图象服务。数字图象技术已经从静态图象向着活动图象发展了,并且因此已经建立了多媒体服务的基础。
同时,MPEG(活动图象专家组)标准已经开始在存储介质中压缩存储活动图象。
已经提出了各种建立的标准,例如ITU提出的H.261,以及ITU提出的MPEG-1、MPEG-2和H.263。H.261用于传输速率在64bps~2Mbps之间的视频电话或视频会议服务。MPEG-1用于传输速率在1.5Mbps的数字存储介质。MPEG-2用于传输速率在3Mbps~15Mbps之间的数字TV或HDTV。H.263适用于非常低的传输速率在64bps以下的短期标准。
具体讲,H.263使用与运动位移补偿和DCT的混合方法几乎相同的方法,该混合方法用作H.261、MPEG-1、或MPEG-2的活动图象压缩方法。因此其缺点是,在传统的H.261、MPEG-1、或MPEG-2系统中高度压缩图象的情况下产生块化现象并且再现的图象的图象质量迅速地下降。
用于在IMT-2000的LCD屏幕上显示MPEG-4/H.263格式的活动图象的视频信号编码方法采用具有8×8大小的图象块的DCT执行编码或解码操作,并且采用IDCT执行解码操作。此时,解码操作是采用整个8×8大小的频率系数块来执行的。在这种方式中,提供了采用整个8×8大小的频率系数块来执行的IDCT,从而可以获得清晰的再现的图象。
但是,当采用整个8×8大小的频率系数块来执行IDC并且随后执行解码操作时,尽管最终的再生图象具有高质量,但是需要太多的计算和高度复杂的计算结果,因此上述的传统的视频编码方法不可避免地需要大量的存储器和长的处理时间。
【发明内容】
因此,鉴于上述的问题,提出了本发明,并且本发明的目的是提供一种自适应DCT/IDCT装置和方法,用于通过将图象划分成为预定的块来计算能量,进行在图象的8×8块上的的DCT,比较整个图象的平均能量与每个块的能量,在收到比较结果时基于图象块的左上端自适应地只选择对应于1×1、3×3和4×4之一的DCT系数,使剩余的DCT系数等于零,并且进行解码操作以建立图象恢复。
本发明的另一个目的是提供一种自适应DCT/IDCT装置,它包括:能量计算器,用于将输入图象分成预定的块并计算每个块的能量值;DCT单元,用于当收到输入图象时在8×8-块单元内执行DCT;图象系数处理器,用于根据每个8x8-块单元的能量值自适应地处理DCT系数;以及IDCT单元,用于采用图象处理器重建的频率系数执行IDCT并建立图象恢复,当编码MPEG4/H.263-格式活动图象时,自适应DCT/IDCT装置根据输入图象的能量执行自适应DCT/IDCT操作。
根据本发明的一个方面,上述的和其他的目的能够通过提供一种基于MPEG4/H.263视频编码器的编码单元中的能量的自适应DCT/IDCT(离散余弦变换/逆离散余弦变换)装置来实现,该装置包括:能量计算器,用于接收输入图象,将输入图象划分为预定大小的块,为各自的块计算能量值并且为输入图象计算平均能量值,并且比较块的能量值和平均能量值;DCT单元,用于将输入图象划分为对应于能量计算器的块的块,并在划分的块上执行DCT操作;图象系数处理器,用于根据块的能量值和平均能量值的比较结果从DCT单元接收各自块的DCT系数,并且重算DCT系数;以及IDCT单元,用于从图象系数处理器接收重算的DCT系数,在重算的DCT系数上执行IDCT操作,并产生恢复的图象。
根据本发明的另一方面,提供了一种在MPEG4/H.263视频编码器的编码单元执行图象处理操作的情况下的基于能量的自适应DCT/IDCT方法,包括步骤:a)接收图象;b)将图象划分为预定的块,并且计算块的能量值;c)计算图象的平均能量值;d)当接收到图象时,在预定的块单元中执行DCT操作,计算DCT系数,并且存储计算的DCT系数;e)将各个块的能量值与平均能量值进行比较;f)为对应的块接收DCT系数并且根据步骤(e)的比较结果重算DCT系数;以及g)在重算的DCT系数上执行IDCT操作,并且产生恢复的图象。
【附图说明】
本发明的上述的和其他的目的、特点和优点将通过下面结合附图的说明而变的更加明了,其中:
图1示出了根据本发明的优选实施例的MPEG4或H.263视频信号编码器的编码单元的块图;
图2示出了根据本发明的优选实施例的基于能量的自适应DCT/IDCT过程;
图3示出了根据本发明的另一个优选实施例的基于能量的自适应DCT/IDCT过程;
图4示出了根据本发明的再一个优选实施例的基于能量的自适应DCT/IDCT过程;以及
图5示出了根据本发明的根据能量值重置的DCT系数的结构。
【具体实施方式】
现在,将参照附图详细地说明本发明的优选实施例,在图中,相同的参考编号用于指出相同的或相近似的部分,尽管它们位于不同的图中。在下面的说明中,为了简明说明本发明,省略了对于公知的功能和在此引用的配置的详细说明。
图1示出了根据本发明的优选实施例的MPEG4视频信号编码器或H.263视频信号编码器的编码单元40的块图。
参照图1,输入单元20接收图象,能量计算器24从输入单元20接收图象,将其划分成预定大小的块,为每个块计算能量值,并计算整个图象的平均能量值,并且将平均能量值与每个块的能量值进行比较。DCT单元22也将输入图象划分为预定大小的块,并且通过在块上执行DCT操作来执行编码操作。图象系数处理器26从能量计算器24接收平均能量值和每个块的能量值的比较结果,从DCT单元22接收预定大小的块的DCT系数。图象系数处理器26基于对应的块的能量值为每个块执行DCT系数的重置。IDCT单元28采用图象系数处理器26重置的DCT系数执行IDCT,并且执行解码操作以产生恢复的图象。输出单元30从IDCT单元28输出恢复的图象。
在这种方法中,本发明获得输入图象的每个块的能量,计算输入图象的总的平均能量,并且在接收每个块的能量和总的平均能量时用从DCT单元22产生的部分DCT系数来重新构造图象,以这样的方式建立图象恢复。
同时,用于获得在与输入图象有关的能量计算器24中处理的能量值的数学等式表示为下面的等式1:
[等式1]
PMB=1R2Σx=0R-1Σy=0R-1SlogS]]>
其中PMB是图象的能量值,S是|f(x,y)-E(f)|,f(x,y)是图象的象素值,E(f)是图象象素的平均值,并且R是图象块的大小。
8×8大小的图象块的平均值E(f)是如下定义的:
E(f)=1R2Σx=0R-1Σy=0R-1f(x,y)]]>
等式1用于计算在整个的图象中的每个块(8×8大小)的能量值,换句话讲,PMB是整个图象中的8×8大小的图象块的能量值。为了计算在整个图象中的所有8x8大小的平均值PMB_mean,
PMB_mean=1(Q/R)2Σx=0Q/R-1Σy=0Q/R-1PMB(x,y)]]>
其中Q=整个图象的大小
R=8,图象块的大小
x,y=水平和垂直轴的各自的参数
PMB(x,y)=在整个图象中(x,y)参数位置的图形块的能量
此外,用于将从DCT单元22收到的输入图象划分为预定块,在块上执行DCT,并且在能量计算器24执行编码操作的数学等式表示为下面的等式2:
[等式2]
F(u,v)=2NC(u)C(v)Σx=0N-1Σy=0N-1f(x,y)cos(2x+1)uπ2Ncos(2y+1)vπ2N]]>
其中u,v,x,y=0,1,2,......N-1(其中N是图象块的大小,即,8),x,y分别是水平和垂直轴(其中水平轴对应于8行8列的图形方块的列参数,并且垂直轴对应于行参数),u,v是变换区域的轴,并且
C(u),C(v)=12u,v=01othercases]]>
此外,用于在IDCT单元28中执行IDCT并在其中执行解码操作的数学等式表示为下面的等式3:
[等式3]
f(x,y)=2NΣu=0N-1Σv=0N-1C(u)C(v)F(u,v)cos(2x+1)uπ2Ncos(2y+1)vπ2N]]>
图2示出了根据本发明的优选实施例的在图1所示的MPEG4/H.263视频信号编码器的编码单元40的基于能量的输入图象的自适应处理过程的流程图。
参照图2,如果在步骤S50,输入单元20接收到了图象,则能量计算器24在输入图象的左上端建8×8-块,并且如等式1所示计算能量值。根据图象的大小可以提供多个8×8-块,并且在步骤S52能量计算器24计算每个8×8块的能量值。
DCT单元22使用等式2执行在位于输入图象的左上端的8×8块上的DCT,在经DCT处理的8×8块上执行编码操作,并且存储DCT系数。采用与能量计算器24相同的方法,DCT单元22将整个图象划分成为8×8块,在块上执行DCT,并在步骤S54为每个块计算DCT系数。
在步骤S56,能量计算器24计算整个图象的平均能量值以将平均能量值与每个8×8块的能量值进行比较。
能量计算器24将整个图象的平均能量值与每个8×8块的能量值进行比较,并且在步骤S58分别将8×8块分成每个块具有大于平均能量值的能量的8×8-块和每个块具有小于平均能量值的能量的8×8块。
在步骤S58,在能量计算器24为特定的块确定的8×8块的能量高于平均能量值的情况下,图象系数处理器26基于从对应于特定块的DCT单元22收到8×8块的左上端选择对应于4×4-大小的块的DCT系数,并且使其余的系数为零。即,图象系数处理器26只接收对应于位于对应的块的左上端的4×4-块的DCT系数,并且在步骤S60使得其余的块的DCT系数为零。
当在步骤S62,8×8块的能量为正值(+)但是小于平均能量值时,图象系数处理器26基于8×8块的左上端选择对应于3×3-大小的块的DCT系数,并且使得选择的一个系数之外的其余的系数等于零。即,图象系数处理器26只接收对应于位于对应的块的左上端的3×3-块的DCT系数,并在步骤S64使得其余的块的DCT系数等于零。
当在步骤S52,8×8块的能量由于对数函数的特性为负值(-)时,图象系数处理器26基于8×8块的左上端选择对应于1×1-大小的块的DCT系数,并且使得其余的系数等于零。即,图象系数处理器26只接收对应于位于对应的块的左上端的1×1-块的DCT系数,并在步骤S66使得其余的块的DCT系数等于零。
当接收到上述的整个图象的平均能量值和每个块的能量值的比较结果重新构造的DCT系数时,IDCT单元28在步骤S68执行如上述的等式3所示的IDCT,以便获得新的恢复的图象并且在步骤S70将其发送到输出单元30。
如上所述,本发明将输入图象划分成为8×8块,并且计算每个块的能量值。此外,本发明将输入图象划分成为8×8块,计算每个块的DCT系数,并且将整个图象的平均能量与每个8×8块的能量进行比较。此时,当8×8块的能量高于平均能量时,用4×4DCT系数来执行图象恢复,当8×8块的能量是正值但是小于平均能量时,用3×3DCT系数来执行图象恢复,或者当8×8块的能量是负值(-)时,用1×1DCT系数来执行图象恢复。然后,执行IDCT操作来形成新的图象。
图3示出了根据本发明的另一个优选实施例在图1所示的MPEG4/H.263视频信号编码器的编码单元40的基于能量的输入图象的自适应处理过程的流程图。
参照图3,如果输入单元20在步骤S80接收到了输入图象,则能量计算器24在步骤S82执行子采样(sub-sampling)操作以将输入图象的大小减小一半。
能量计算器24在一半大小的图象的左上端设置4×4-块,并且如等式1所示计算能量值。根据图象的大小可以提供多个4×4-块,并且能量计算器24在步骤S84计算每个4×4块的能量值。
DCT单元22在位于原始输入图象的左上端的8×8-块上采用等式2执行DCT,在经过DCT处理的8×8-块上执行编码操作,并且存储DCT系数。即,DCT单元22将整个图象划分成为8×8块,在划分的块上执行DCT,并且在步骤S86计算每个块的DCT系数。
能量计算器24在步骤S88计算子采样的图象的平均能量值以将该平均能量值与每个4×4块的能量值进行比较。(因此,子采样的4×4块对应于DCT单元中的8×8块)
能量计算器24将整个图象的平均能量值和每个4×4块的能量值进行比较,并且在步骤S90,在每个具有大于平均能量值的4×4块和其他的每个具有小于平均能量值的4×4块之间进行识别。
在步骤S90,当4×4块的能量高于平均能量值的情况下,图象系数处理器26基于8×8块的左上端选择对应于4×4-大小的块的DCT系数,并且使其余的系数为零。即,图象系数处理器26只接收对应于位于对应的块的左上端的4×4-块的DCT系数,并且在步骤S92使得其余的块的DCT系数为零。
当在步骤S94,当4×4块的能量为正值(+)但是小于平均能量值时,图象系数处理器26基于8×8块的左上端选择对应于3×3-大小的块的DCT系数,并且使得其余的系数等于零。即,图象系数处理器26只接收对应于位于对应的块的左上端的3×3-块的DCT系数,并在步骤S96使得其余的块的DCT系数等于零。
当在步骤S84,4×4块的能量由于对数函数的特性为负值(-)时,图象系数处理器26基于8×8块的左上端选择对应于1×1-大小的块的DCT系数,并且使得其余的系数等于零。即,图象系数处理器26只接收对应于位于对应的块的左上端的1×1-块的DCT系数,并在步骤S98使得其余的块的DCT系数等于零。
当接收到上述的整个图象的平均能量值和每个块的能量值的比较结果重新构造的DCT系数时,IDCT单元28在步骤S100执行如上述的等式3所示的IDCT,以便获得新的恢复的图象并且在步骤S102将其发送到输出单元30。
如上所述,本发明执行子采样操作以将输入图象的大小减小一半,将输入图象划分成为4×4块,并且计算每个块的能量值。此外,本发明将原始的输入图象划分成为8×8块,计算每个块的DCT系数,并且将减半的图象的平均能量与每个4×4块的能量进行比较。此时,当4×4块的能量高于平均能量时,用4×4DCT系数来执行图象恢复,当4×4块的能量是正值但是小于平均能量时,用3×3DCT系数来执行图象恢复,或者当4×4块的能量是负值(-)时,用1×1DCT系数来执行图象恢复。然后,执行IDCT操作来形成新的图象。
如图3所示的方法使编码和解码的速度提高了,因为它执行了用于将输入图象的大小减半的子采样操作。
图4示出了根据本发明的再一个优选实施例在图1所示的MPEG4/H.263视频信号编码器的编码单元40的基于能量的输入图象的自适应处理过程的流程图。
参照图4,如果输入单元20在步骤S110接收到了输入图象,则能量计算器24在步骤S112执行子采样以将输入图象的大小减小一半。
能量计算器24在一半大小的图象的左上端设置8×8-块,并且如等式1所示计算能量值。根据图象的大小可以提供多个8×8-块,并且能量计算器24在步骤S114计算每个8×8块的能量值。
DCT单元22在位于原始输入图象的左上端的8×8-块上采用等式2执行DCT,在经过DCT处理的8×8-块上执行编码操作,并且存储DCT系数。即,DCT单元22将整个图象划分成为8×8块,在划分的块上执行DCT,并且在步骤S116计算每个块的DCT系数。
能量计算器24在步骤S118计算子采样的图象的平均能量值以将该平均能量值与每个8×8块的能量值进行比较。此时,在步骤S118,平均能量值是在将每个块的能量值都加在一起,并且相加的结果被块的数量除的条件下获得的。
能量计算器24将子采样的图象的平均能量值和每个8×8块的能量值进行比较,并且在步骤S120,在每个具有大于平均能量值的8×8块和其他的每个具有小于平均能量值的8×8块之间进行识别。
在步骤S120,当8×8块的能量高于平均能量值的情况下,图象系数处理器26基于8×8块的左上端选择对应于4×4-大小的块的DCT系数,并且使其余的系数等于零。即,图象系数处理器26只接收对应于位于对应的块的左上端的4×4-块的DCT系数,并且在步骤S122使得其余的块的DCT系数等于零。
当在步骤S124,当8×8块的能量为正值(+)但是小于平均能量值时,图象系数处理器26基于8×8块的左上端选择对应于3×3-大小的块的DCT系数,并且在步骤126使得其余的系数等于零。
当在步骤S114,8×8块的能量由于对数函数的特性为负值(-)时,图象系数处理器26基于8×8块的左上端选择对应于1×1-大小的块的DCT系数,并且使得其余的系数等于零。即,图象系数处理器26只接收对应于位于对应的块的左上端的1×1-块的DCT系数,并在步骤S128使得其余的块的DCT系数等于零。
当接收到上述的子采样图象的平均能量值和每个块的能量值的比较结果重新构造的DCT系数时,IDCT单元28在步骤S130执行如上述的等式3所示的IDCT,以便获得新的恢复的图象并且在步骤S132将其发送到输出单元30。
如上所述,本发明执行子采样操作以将输入图象减小一半,将输入图象划分成为8×8块,并且计算每个块的能量值。此外,本发明将原始的输入图象划分成为8×8块,计算每个块的DCT系数,并且将减半的图象的平均能量与每个8×8块的能量进行比较。此时,当8×8块的能量高于平均能量时,用4×4DCT系数来执行图象恢复,当8×8块的能量是正值但是小于平均能量时,用3×3DCT系数来执行图象恢复,或者当8×8块的能量是负值(-)时,用1×1DCT系数来执行图象恢复。然后,执行IDCT操作来形成新的图象。
图5示出了根据本发明的根据能量值重置的DCT系数的结构。如图5所示,在执行图象恢复时,当每个块的能量值高于平均能量值时,则基于8×8块的左上端使用4×4DCT系数并且使得其他象素的DCT系数等于零,当每个块的能量值为正值但是小于平均能量值时,则使用3×3DCT系数并且使得其他象素的DCT系数等于零,或者当每个块的能量为负值(-)时,则使用1×1DCT系数(由每个8×8DCT块的第一行的第一列的标量值(scalar value)组成)并且使得其他象素的DCT系数等于零。
本发明将输入图象划分成为块,并且计算每个块的能量值。此外,本发明将输入图象划分成为块,计算每个块的DCT系数,并且将整个图象的平均能量与每个块的能量进行比较。此时,在接收到整个图象的平均能量值与每个块的能量值比较的结果时,用基于8×8块的4×4、3×3和1×1DCT块中的一个来执行图象恢复。然后执行IDCT来形成新恢复的图象。
上述的说明显示出,与现有技术相比,本发明显著地降低了计算的复杂性程度并且减少了执行图象处理操作所需的计算的数量。因此,本发明可以用更少的存储器在高速度下实现,向无线通信终端提供了优良的图象质量,降低了制造成本,并且能够向终端增加另外的功能。
此外,本发明根据输入图象的平均能量值与每个块的平均能量值的比较结果,通过自适应地只采用1×1、3×3和4x4—大小的DCT系数来执行IDCT,用这种方法来产生恢复的图象。因此,从PSNR(峰值信-噪比)的角度来看,本发明获得了优良的结果,并且显著地减少了存储器的数量和处理时间的长度,从而增加了系统效率。
此外,本发明适用于IMT-2000终端的窄带中的无线移动通信区域,并且有效地用于活动图象传输服务和无线视频电话服务。
尽管以说明为目的公开了本发明的优选实施例,但是本领域中的普通技术人员可以理解,在不脱离所附的权利要求所限定的本发明的精神和范围内,可以对本发明进行各种修改、添加和替换。