用于提供适用于降低复杂度的解码的单层视频编码比特流的系统和方法.pdf

上传人:1*** 文档编号:683368 上传时间:2018-03-04 格式:PDF 页数:18 大小:893.20KB
返回 下载 相关 举报
摘要
申请专利号:

CN03808976.9

申请日:

2003.04.15

公开号:

CN1647540A

公开日:

2005.07.27

当前法律状态:

终止

有效性:

无权

法律详情:

专利权的视为放弃|||实质审查的生效|||公开

IPC分类号:

H04N7/30

主分类号:

H04N7/30

申请人:

皇家飞利浦电子股份有限公司;

发明人:

Y·陈; Z·钟

地址:

荷兰艾恩德霍芬

优先权:

2002.04.22 US 10/127,528

专利代理机构:

中国专利代理(香港)有限公司

代理人:

傅康;王勇

PDF下载: PDF下载
内容摘要

提供一种通过改变视频处理系统中的编码算法来降低MPEG解码器的计算负荷的方法和系统(10)。在编码模式期间,接收数据块流并为每个宏块产生(12)至少一个运动矢量和至少一个运动补偿预测值。该预测值被变换(14)为一组DCT系数。在量化步骤之前,根据预定标准修改(14)该组DCT系数。为此,计算除最低2×2 DCT系数以外的DCT系数的总能级,并交替舍弃最后列和最后行的DCT系数,直到DCT系数的总能级达到预定能级。其后,给该舍弃的列或行分配预定值。然后,经修改的DCT系数被量化(16)和编码(20),从而产生编码的宏块比特流,随后根据常规解码处理对其解码。

权利要求书

1: 一种用于对具有至少一个宏块的输入视频图像流进行编码的 方法(10),该方法包括如下步骤: -为所述输入视频图像的每个宏块产生(12)运动矢量; -根据所述运动矢量产生(12)所述输入视频图像的预测图像信号; -将所述预测图像信号变换(14)为DCT系数的二维阵列; -根据预定标准,将所述的DCT系数阵列修改(14)为一组新的DCT 系数; -将所述新DCT系数量化(16)为量化的DCT值; -执行(18)Z字形扫描以将所述新DCT系数的每行读成串行链; 和, -对来自所述Z字形扫描的所述串行链和所述运动矢量进行编码 (20),以生成编码的宏块。
2: 根据权利要求1的方法,其中修改所述DCT系数阵列的步骤 包括如下步骤: -交替舍弃最后列的DCT系数和最后行的DCT系数,直到所述DCT 系数的能级达到预定能级;和, -给所述舍弃的列或行分配预定值。
3: 根据权利要求1的方法,其中DCT系数阵列为一个8×8矩阵。
4: 根据权利要求1的方法,其中将所述预测图像信号变换成所 述DCT系数阵列的步骤,包括对所述DCT系数的从时域到频域的转换。
5: 根据权利要求1的方法,其中修改所述DCT系数阵列的步骤 包括如下步骤: -计算除最低2×2DCT系数以外的所述DCT系数的总能级; -交替舍弃最后列和最后行的所述DCT系数,直到所述DCT系数的 总能级达到预定能级;和, -给所述舍弃的列和行分配预定值。
6: 根据权利要求1的方法,其中根据预定编码配置表执行编码 步骤。
7: 根据权利要求1的方法,进一步包括如下步骤: -将量化的DCT值去量化以产生去量化的、解码的数据; -将所述去量化的、解码的数据从频域变换到空间域,以生成基准 数据;和, -对所述基准数据执行运动补偿以生成运动补偿图片。
8: 根据权利要求1的方法,进一步包括步骤:在将所述预测图 像信号变换成所述DCT系数阵列的步骤之前,对所述输入视频图像的 预测(P)图片执行全像素运动补偿。
9: 根据权利要求1的方法,进一步包括将所述编码的宏块转发 至解码处理的步骤。
10: 一种用于对具有至少一个宏块的输入视频图像进行编码的方 法(10),该方法包括如下步骤: (a)为所述输入视频图像的每个宏块产生(12)至少一个运动矢量 和至少一个运动补偿预测值; (b)将所述预测值变换(14)成一组DCT系数; (c)根据预定标准,将该组所述DCT系数修改为(14)一组新的 DCT系数; (d)将该组所述DCT系数进行量化(16);和, (e)对所述量化的该组所述系数和所述运动矢量进行编码(20), 以生成编码的宏块。
11: 根据权利要求10的方法,进一步包括从所述输入视频图像中 确定(102)图片类型的步骤。
12: 根据权利要求11的方法,其中,如果从所述输入视频图像中 检测到预测图片,在执行将所述预测值变换成该组所述DCT系数的所 述步骤(b)之前,对所述输入视频图像执行全像素运动补偿。
13: 根据权利要求11的方法,进一步包括,当从所述输入视频图 像中检测到预测图片时,将所述运动矢量转换为全运动矢量。
14: 一种对输入视频图像进行编码的编码系统(10),包括: -运动估计预测模块(12),它被配置用来接收所述输入视频图像 和产生至少一个运动矢量与至少一个预测误差信号; -离散余弦变换器(DCT)(14)模块,它被耦合至所述运动估计模 块(12)的输出端,用于将所述预测误差信号变换为DCT系数的二维 阵列,其中根据对来自所述输入视频图像中的图片类型的分类来修改 所述DCT系数; -量化模块(16),它被耦合至所述DCT模块,用于对所述修改的 DCT系数进行量化,以生成量化的系数; -Z字形扫描模块(18),它被耦合至所述量化模块,被配置用来 将所述量化的系数转换为串行表示;和, -编码模块(20),用于对所述量化的该组所述系数和所述运动矢 量进行编码,以生成编码的宏块。
15: 权利要求14的编码系统,进一步包括: -反量化模块(22),它被耦合来从所述量化模块接收量化的系数并 对其求反; -反离散余弦变换器(IDCT)(24),它被耦合至所述反量化模块 (22)的输出端,用于将去量化的系数从频域变换到空间域;和, -基准帧缓存器(26),用于从所述IDCT接收输出信号以形成运 动补偿的图片。
16: 一种具有存储于其上的表示指令序列的数据的机器可读性介 质,当指令序列被处理器执行时,导致处理器: -为所述输入视频图像的每个宏块产生(12)运动矢量; -根据所述运动矢量,产生(12)所述输入视频图像的预测图像信 号; -将所述预测图像信号变换(14)为DCT系数的二维阵列; -根据预定标准,将所述DCT系数阵列修改(14)为一组新的DCT系 数; -将所述新DCT系数量化(16)为量化的DCT值; -执行(18)Z字形扫描以将所述新DCT系数的每一行读成串行链; 和, -对来自所述Z字形扫描的所述串行链和所述运动矢量进行编码 (20),以生成编码的宏块。

说明书


用于提供适用于降低复杂度的 解码的单层视频编码比特流的系统和方法

    本发明涉及数字视频信息压缩,更具体来说,涉及用于提供不同的编码策略以在解码期间获得效率的方法和设备。

    单层视频编码被广泛用于各种应用,比如数字-视频录像和数字电视。将视频按照一定的比特率编码,然后解码器将比特流解码并以编码的全品质输出每张图片。为减少计算负载,已经采用了单层比特流的降低复杂度的解码。然而,由于按照部分品质将图片解码,所以在解码器一侧用于运动补偿的基准图片经常与编码期间使用的基准图片不匹配。结果,在基准图片中发生的错误传播到其它的图片。这又称为预测漂移或错误传播。

    分层视频编码或比特率可缩放方法是单层视频编码的替换方案。首先,以低比特率对视频进行编码以产生基本层。然后,对原始视频与基本层重建视频之间的差异进行编码,以产生一个或多个增强层。在解码器一侧,基本层总是被解码,但是对增强层的完全或部分解码取决于可用的处理能力。如果仅有基本层被解码,由于低质量基准图片被用于编码,则不存在预测漂移。如果完全的增强层与基本层都被解码,则为了解码目地,每层在编码期间采用自己对应的基准图片,从而也不存在预测漂移。然而,如果增强层仅仅被部分地解码且在增强层图片中存在运动预测,则增强层中会发生预测漂移。此外,因为增强层中使用的基准图片无益于有效的运动预测,所以在压缩期间,这种编码其本身效率较低。此外,如果要产生相同的品质,多分层编码中的额外开销要比解码单层比特流更为复杂。因此,需要获得相对简单以利于实际实现的最优的解码性能。

    本发明涉及通过改变单层编码算法以获得适用于可变复杂度解码的编码的数字视频信号、从而提高MPEG数字视频解码器系统的解码效率的方法与系统。

    根据本发明的一个方面,提供了对具有至少一个宏块的输入视频图像流进行编码的方法。该方法包括如下步骤:为输入视频图像的每个宏块产生运动矢量;根据该运动矢量产生输入视频图像的预测图像信号;将该预测图像信号变换为二维阵列的DCT系数;根据预定标准,将该DCT系数阵列修改为一组新的DCT系数;将所述新DCT系数量化为量化的DCT值;执行Z字形扫描,以将每一行新DCT系数读成一个串行链;以及对来自Z字形扫描的串行链和运动矢量进行编码以生成编码的宏块。修改DCT系数阵列的步骤包括如下步骤:交替舍弃最后列的DCT系数和最后行的DCT系数,直到DCT系数的能级到达预定能级;以及给所舍弃的列或行分配预定值。修改DCT系数阵列的步骤包括如下步骤:计算除最低2×2 DCT系数以外的DCT系数的总能级;交替舍弃最后列和最后行的DCT系数,直到DCT系数的总能级达到预定能级;以及给所舍弃的列和行分配预定值。该方法进一步包括如下步骤:将量化的DCT值去量化以产生去量化的、解码的数据;将去量化的、解码的数据从频域变换到空间域,以生成基准数据;以及对基准数据执行运动补偿以生成运动补偿图片。在该实施例中,在将预测图像信号变换为DCT系数阵列的步骤之前,对输入视频图像的预测(P)图片执行全像素(full-pel)运动补偿。

    根据本发明的另一方面,对具有至少一个宏块的输入视频图像进行编码的方法包括如下步骤:(a)为输入视频图像的每个宏块产生至少一个运动矢量和至少一个运动补偿预测值;(b)将该预测值变换为一组DCT系数;(c)根据预定标准,将该组DCT系数修改为一组新的DCT系数;(d)对该组DCT系数进行量化;和,(e)对量化的该组DCT系数和运动矢量进行编码,以生成编码的宏块。该方法进一步包括如下步骤:将编码的宏块转发至解码处理;确定来自输入视频图像的图片的类型,其中,如果从输入视频图像中检测到预测图片,则在执行将预测值变换为该组DCT系数的步骤(b)之前对输入视频图像执行全像素运动补偿。当从输入视频图像中检测到预测图片时,将运动矢量变换成全运动矢量。通过计算除最低2×2 DCT系数以外的DCT系数的总能级来修改DCT系数阵列;交替舍弃最后列和最后行的DCT系数、直到DCT系数的总能级达到预定能级;以及给所舍弃的列和行分配预定值。该方法进一步包括如下步骤:将量化的DCT值去量化以产生去量化的、解码的数据;将去量化的、解码的数据从频域变换到空间域,以生成基准数据;和,对基准数据执行运动补偿以生成运动补偿图片。

    根据本发明的另一方面,用于对输入视频图像进行编码的编码系统包括:运动估计预测模块,它被配置用来接收输入视频图像和产生至少一个运动矢量与至少一个预测误差信号;离散余弦变换器(DCT)模块,它被耦合至运动估计模块的输出端,以用于将预测误差信号变换为二维阵列的DCT系数。根据对来自输入视频图像的图片类型的分类来修改所述DCT系数;量化模块,它被耦合至DCT模块,以用于对经修改的DCT系数进行量化,以生成量化的系数;Z字形扫描模块,它被耦合至量化模块,并被配置用来将量化的系数转换为串行表示;和编码模块,用于对量化的该组系数和运动矢量进行编码,以生成编码的宏块。该系统进一步包括:反量化模块,其被耦合以便从量化模块接收量化的系数并对其求反;反离散余弦变换器(IDCT),其被耦合至反量化模块的输出端,以用于将去量化的系数从频域变换到空间域;和基准帧缓存器,用于从IDCT接收输出信号以形成运动补偿的图片。

    还有另一个方面是,可以为了所希望的特定应用,以硬件、软件或硬件与软件的组合的形式实现本发明。

    此外,本发明可以用简易、可靠并且廉价的方式实现。

    对于本领域技术人员而言,当结合附图阅读下列详细说明时,这些及其它的优点将变得明显。

    通过结合附图参照下列详细说明,将可以更全面地理解本发明的方法与设备,其中:

    图1示出用于压缩视频信息的编码器的示例性实施例;

    图2示出根据本发明修改DCT系数以用于降低解码期间的计算负荷的图示;

    图3示出根据本发明在执行量化之前修改DCT系数的图示;和,

    图4是说明根据本发明降低解码期间的计算负荷的处理流程图。

    为了提供对本发明的彻底了解,在下列描述中(为了说明而不是为了限制)阐明了诸如特定的体系结构、接口、技术等之类的具体细节。然而,对于本领域技术人员而言,显然可脱离这些细节而在其它实施例中实践本发明。为简单明了,公知的设备、电路和方法的详细说明从略,以免不必要的细节使本发明的说明变得模糊。

    为了便于理解本发明,下文将简要描述依照MPEG标准的压缩与解码视频数据的常规方法。

    为了减少视频压缩编解码器的高成本和实现在不同厂商之间提供设备互操作性的方法,根据运动图像专家组(MPEG)标准建立了压缩标准,以用于视频的编码与解码。MPEG标准在国际标准ISO/IEC11172-1(即“信息技术-以高达大约1.5Mbit/s的速率对用于数字存储介质的运动图像和有关音频进行编码”)的1993年8月1日第一版第1、2和3部分中定义,在此全面引入作为参考。

    存在MPEG标准下的三类视频信息帧:帧内编码帧(I帧)、前向预测帧(P帧)和双向预测帧(B帧)。I帧被周期性地编码,即为每组帧而独立编码一个帧。通过合成位于前向的特定数量帧处的、在下一个基准帧之前的一个视频帧(P帧)来进行预测。在两个基准帧之间,或通过对过去基准帧内的宏块与未来基准帧中的宏块进行内插(求平均),来预测B帧。指定基准帧内部宏块相对于当前帧内部该宏块的相对位置的运动矢量也被编码。可基于先前帧与后续帧对当前帧进行编码。同样,需要基于MPEG编码惯例对一个帧进行编码,然后除了总是与其它帧无关地被编码的I帧以外,与该帧相关的其它帧基于与该帧的差异而被编码。

    在基于运动补偿的视频编码中,运动矢量可以具有整数值(即全像素编码),其中按照基准帧中的实际像素值指定当前帧中的像素值,或具有半整数值(即半像素编码)、四分之一整数值(即四分之一像素编码)与分数值(即分数像素编码),其中根据从基准帧内现存像素中内插的“虚拟”像素指定当前帧中的像素值。半像素运动补偿以及四分之一像素与分数像素运动补偿的计算规模比全像素运动补偿更大,这是因为解码器必须从分别由使用半、四分之一、分数像素网格的运动矢量所参照的先前宏块中内插出宏块。

    使用离散余弦变换(DCT)编码方案对帧进行编码,该方案将系数编码为特定的余弦基(cosine-basis)函数的振幅。使用可变或游程长度编码对DCT系数进行量化和进一步的编码。当接收压缩编码帧时,解码器通过执行运动补偿将当前P帧宏块解码,该运动补偿利用了施加给过去基准帧的对应宏块的运动矢量。解码器还通过执行运动补偿将B帧的宏块解码,该运动补偿利用了分别施加给过去与未来基准帧的运动矢量。一个帧中的像素宏块可以通过平移先前或后续帧中的像素宏块而获得。平移量又称为运动矢量。由于I帧被作为单个图像编码而不用参考任何过去或未来的帧,所以当对I帧进行解码时不必进行运动处理。

    如上所述,在许多常见的视频解压缩方法中,运动补偿是计算最密集的操作之一,尤其当采用分数运动矢量时更是如此。这样,无法满足上述解压缩负载的计算要求的视频系统就会经常丢掉整个帧。有时这是可看得见的,如视频重放中的短时停滞,跟着是图像的突变或抖动。为了降低与解压缩方法有关的对解码端的处理要求,已开发了各种解码复杂度降低方法。本发明提供一种构造压缩视频比特流的新颖方法,从而可以降低解码复杂度,而同时保持最终视频图像的质量。

    图1说明根据本发明一个实施例的用于编码视频信号的编码器10的简化框图。编码器10包括:运动估计与预测模块12,DCT模块14,量化模块16,Z字形扫描模块18,游程长度编码模块20,反量化模块22,反DCT模块24和基准帧缓存器模块26。在本发明优选实施例中,编码器10可在下述设备中实现:个人电脑、工作站、个人数字助理(PDA)、手提式电脑中的中央处理器,和/或诸如微处理器、数字信号处理器、微控制器、微型电脑之类的集成电路和/或任何其它根据编程指令处理数字信息的设备。基准帧缓存器26可以是硬驱动存储器、随机存取存储器、只读存储器、外部存储器和/或任何其它存储数字信息的设备。注意,包括运动补偿与预测模块12、反量化模块22、和反DCT模块24的该组模块通常称为“嵌入式解码器”。对于本领域普通技术人员而言,已经熟知这类解码模块;因此,其描述从略以免累赘。

    编码器10接收的输入视频信号(V)可以是来自下述设备的信号:摄录一体机,DVD播放机,VCR,电视调谐器和/或任何其它接收数字信息的设备。该视频信息流被从模拟信号变换成数字信号,然后被施加给编码器10。输入视频信号进一步被分成多个层,从而对应于一片图像(帧)的每个图片被分成多个片段,并且每个片段由依从左至右、自上而下顺序的多个宏块组成。每个宏块包括六个分量:Y1到Y4的四个亮度分量,其表示构成16×16像素宏块的四个8×8像素块的亮度,以及构成用于相同宏块的8×8像素块的差异分量Cb与Cr的两个颜色(U,V)。将图片划分为块单元,提高了平滑两个连续图片之间变化的能力。

    如图1所示,运动估计与预测模块12适于接收输入视频信号(V),以用于估计运动矢量以提供从当前图片块坐标到基准帧坐标的偏移量。随后,运动矢量可被用来从先前基准帧中重建当前帧,因为运动信息降低了存在于视频序列中的连续帧之间的高冗余度。另外,可以通过使用先前解码帧与运动矢量获得当前帧的估计量。运动补偿涉及预测,该预测使用运动矢量来向过去和/或未来基准帧提供偏移量,所述基准帧包括被用来形成预测误差的先前解码的样本值。

    然后,宏块的每个8×8像素块经离散余弦变换(DCT)以为其中64个频带中的每个频带产生一组8×8块的DCT系数。注意,可以独立处理每个系数而不损失压缩效率。最终的8×8块DCT系数由量化模块16接收。在本发明的优选实施例中,为每个宏块编码的信息量也通过根据量化前的预定标准处理某些高频DCT系数而被调整(下文将参照图2和3说明)。然后,将8×8像素块内的DCT系数除以对应的编码参数(即量化权重)。用于给定的8×8像素块的量化权重以8×8量化矩阵的形式表示。其后,附加计算在DCT系数上受影响,以便为每个宏块考虑量化器的标度值。注意,量化标度值对应于量化精度的空间调整程度,该量化精度可以不同于宏块。该调整经常利用人眼,其基于每一宏块视觉内容的特性而对于加载伪像灵敏地变化。通过用这种量化值量化DCT系数,许多DCT系数被变换为零,因此提高图像压缩效率。

    最终的经量化的DCT系数的8×8块由Z字形扫描模块18接收,其中按照“Z字形”次序扫描经量化的系数的二维块,以便将其变换为经量化的DCT系数的一维串。其后,游程长度编码模块20使用游程编码而对该串经量化的DCT系数、宏块类型、和运动矢量进行编码,以便通过用单个符号对一连串符号进行编码来提高编码效率。注意,该编码方案已是本领域众所周知的,而且可以根据本发明的技术,采用其它众所周知的编码方案,例如霍夫曼(Huffman)编码。游程长度编码模块20的输出为比特流BS。

    现在将详细说明根据本发明通过在量化之前调整高频DCT系数中的信息来提供适于可变复杂度的解码的编码。

    参照图2,图片被分成8×8像素矩阵块,在块单元中由DCT模块14执行DCT,以便获得8×8变换系数。然后,最终得到的DCT系数的矩形8×8块经历掩码变换(以下称为“DCT掩码”),其中分析DCT系数以获得包括DCT系数能量的特定百分比(α1)的矩形。通过首先计算除最低2×2 DCT系数以外的全部DCT块的总能量来获得该矩形。然后,如图2(a)所示,在能级计算期间舍弃最后列或第八列的频率分量,并且再次计算除最低2×2 DCT系数以外的能级。与此同时,确定新计算的能级是否超过预定百分比,例如:总能量的85%。如果未超过,如图2(b)所示,当计算除最低2×2 DCT系数以外的DCT块的剩余能级时,舍弃最后行或第八行的频率分量。如果新计算的能级不低于预定的百分比,则舍弃第七列的频率分量,如图2(c)所示,然后再次计算除最低2×2 DCT系数以外的剩余DCT块的新能级。按照这样的方式,交替舍弃附加的列与行频率分量,直到获得所期望的能级。

    参照图3,一旦所期望的能级被获得,在计算期望能级时所舍弃的列与行频率分量,被赋予相对高的量化矩阵权重,例如:255。通过用这种高值量化DCT系数,DCT系数在量化期间被有效地变换为零。由于在编码期间执行类似的操作,所以舍弃高频DCT系数不会引起重大的预测漂移。

    注意,用降低的复杂度所解码的图片不具有与编码器一侧的图片一样多的高频信息,但是降低的复杂度往往造成预测漂移。如果可以使编码器一侧使用的基准图片更接近于由部分质量解码所得到的图片,则该预测漂移可以被降低。因此,在本发明的优选实施例中,由于某些图片不大会造成预测漂移,有必要对此类被编码的图片类型给出不同的权重。本领域技术人员将理解,由于在下一帧内编码的图片之前只有较少的帧用于误差传播,在当前图片组(GOP)中的P图片比I图片更不易造成预测漂移。这样,在根据本发明执行降低复杂度的解码时,必须以较少的考虑设计用于GOP内稍后图片的量化矩阵或DCT掩码。类似地,如果是部分质量解码,则在设计用于I图片(GOP内的第一张图片)的量化矩阵或DCT掩码时应当最大限度地考虑预测漂移。进一步地,由于B图片不被用作基准图片,故不需要DCT掩码。因此,在编码期间,用于B图片的量化矩阵可以保持与用于最优化的单层编码的量化矩阵一样。

    进一步注意,由于运动补偿往往是计算密集的操作,另一个降低解码复杂度的方法是通过简化运动补偿。因此,在本发明的优选实施例中,可以在编码期间应用较粗精度的MC,以便进一步利于可变复杂度的解码。例如,如果1/2像素MC被用于编码(如同在MPEG-2中),当非整数运动矢量在计算高峰负荷周期期间被用于当前宏块时,可强制解码器只应用全像素运动补偿而不用内插1/2像素位置的像素值。类似地,如果1/4像素MC被用于编码,则1/2像素MC、全像素MC或其任何组合可被用于解码。因此,如果在只针对P图片的编码期间使用了简化的运动预测,来自降低复杂度的解码的预测偏移可被消除或降低。然而,没有针对I图片执行运动预测,因此不适于I图片。另外,因为B图片不被用作未来基准图片,所以可用全复杂度、较高精度的运动补偿来编码B图片。

    鉴于上述考虑,图4的下列流程图示出根据本发明实施例的能够降低解码复杂度的编码操作过程。

    参照图4,在步骤100中由编码器10接收输入视频信息时,在步骤102检测图片的类型,以便可以如下所述地根据图片分类来应用不同的编码方式。

    I.当前图片被编码为帧内编码(I)的图片。

    I帧图片被分割成8×8块,然后在步骤104执行DCT,其中每个系数用Ci,j表示,i和j的范围从0到7。在步骤106,分析DCT系数,来获得包含除最低2×2 DCT系数以外的DCT系数能量的α1的矩形。

    按照数学的形式,获得矩形(iα1,jα1)如下:

    首先,计算除最低2×2系数以外的全部DCT块的总能量:

    接着,计算Eα=α1E。接着,设置初始行与列号:i=j=7。接着,通过下列步骤进行迭代:

    计算(此步舍弃最右列的频率分量),

    如果E⇐Eα,]]>停止并输出(i,j-1);否则继续下一步;

    计算(此步舍弃最低一行的频率分量),

    如果E⇐Eα,]]>停止并输出(i-1,j-1);否则继续下一步i=i-1;j=j-1。

    在获得矩形产生的期望能级以后,在步骤108计算对应矩形的量化矩阵。假设用于完全编码的量化矩阵是其中i,j的范围从0到7。这种矩阵的一个示例为常规的用于帧内编码图片的MPEG编码方案(即测试模型5(TM5))矩阵,其中通过比较预测残差(residuals)(误差信号)的能量来选择用于每个宏块的编码方式。即,通过将宏块像素的方差与用于每种编码方式的预测残差的方差进行比较,来确定intrade-方式的决定。

    计算用于当前帧内编码图片的部分编码的量化矩阵如下:

    如果i⇐iα1]]>且j⇐jα1,]]>Wi,j=Wi,j‾]]>

    否则Wi,j=255

    最后,在步骤110,修改后的量化矩阵被编码,并且编码的信号被转发到解码一侧。

    II.当前图片被编码为预测(P)图片。

    如果在步骤102检测到P图片,则在步骤120对P图片进行全像素(降低的分辩率)的运动预测。步骤122到步骤128的操作基本与上述相对应的步骤104到步骤110所述相同。仅有的显著差别在于αP的设置取决于该P图片在当前GOP中的位置。因此,在前面段落中描述的类似部分的讨论从略以免累赘。αP的设置取决于该P图片在当前GOP中的位置。由于P图片处于GOP中稍后位置,在I图片复位预测周期之前,在后续帧中将导致较低的预测漂移。我们表示GOP的尺寸大小(图片组中图片的数量)为N,并且GOP中P图片的相对位置为n。计算αP如下:

    αp=α1(1-n/N),]]>其中n范围从M-1到N-1。

    III.当前图片被编码为双向预测图片。

    如果当前图片被编码为双向图片,由于B图片不会造成解码器一侧的预测漂移,所以执行普通的编码;因此不需要编码时间复杂度降低的准备。

    上文已经公开了通过适应地改变视频编码器中的编码方式、从而降低与解压缩方法学有关的处理要求的方法和系统。对于本领域技术人员而言,通过提高解压缩效率而不过分降级最终视频图像来实现该系统和方法的优点应显而易见。通过设计编码处理以在编码期间保持一定的压缩效率,当与为固定的全品质解码而优化的普通编码处理相比,可实现具用较少品质降级的复杂度的降低,以便减少解码期间的预测漂移。

    虽然已经说明和描述了本发明的优选实施例,但对于本领域技术人员而言,在不脱离本发明的真实范围的情况下,显然可以作出各种改变与修改并用等效元件替换其中的元件。因此,我们的意图在于:本发明并不局限于作为被设想用于实现本发明的最佳方式而公开的具体实施例,相反地,本发明包括落在所附权利要求书范围中的全部实施例。

用于提供适用于降低复杂度的解码的单层视频编码比特流的系统和方法.pdf_第1页
第1页 / 共18页
用于提供适用于降低复杂度的解码的单层视频编码比特流的系统和方法.pdf_第2页
第2页 / 共18页
用于提供适用于降低复杂度的解码的单层视频编码比特流的系统和方法.pdf_第3页
第3页 / 共18页
点击查看更多>>
资源描述

《用于提供适用于降低复杂度的解码的单层视频编码比特流的系统和方法.pdf》由会员分享,可在线阅读,更多相关《用于提供适用于降低复杂度的解码的单层视频编码比特流的系统和方法.pdf(18页珍藏版)》请在专利查询网上搜索。

提供一种通过改变视频处理系统中的编码算法来降低MPEG解码器的计算负荷的方法和系统(10)。在编码模式期间,接收数据块流并为每个宏块产生(12)至少一个运动矢量和至少一个运动补偿预测值。该预测值被变换(14)为一组DCT系数。在量化步骤之前,根据预定标准修改(14)该组DCT系数。为此,计算除最低22 DCT系数以外的DCT系数的总能级,并交替舍弃最后列和最后行的DCT系数,直到DCT系数的总能级。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1