使用用于并行处理的统一语法的视频编码方法和设备以及视频解码方法和设备.pdf

上传人:xia****o6 文档编号:473027 上传时间:2018-02-18 格式:PDF 页数:41 大小:6.12MB
返回 下载 相关 举报
摘要
申请专利号:

CN201380015767.5

申请日:

2013.01.21

公开号:

CN104205848A

公开日:

2014.12.10

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):H04N 19/70申请日:20130121|||公开

IPC分类号:

H04N19/70(2014.01)I; H04N19/44(2014.01)I; H04N19/42(2014.01)I; H04N19/176(2014.01)I; H04N19/33(2014.01)I

主分类号:

H04N19/70

申请人:

三星电子株式会社

发明人:

郑丞洙; 朴永五; 金赞烈; 朴正辉; 金宰贤

地址:

韩国京畿道水原市

优先权:

2012.01.20 US 61/588,690

专利代理机构:

北京铭硕知识产权代理有限公司 11286

代理人:

苏银虹;曾世骁

PDF下载: PDF下载
内容摘要

提供使用用于并行处理的统一语法的一种视频编码方法和设备以及一种视频解码方法和设备。所述视频解码方法包括:从第一数据单元头获得指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志,其中,第一数据单元头包括构成在比特流中包括的视频的第一数据单元的编码信息;基于第一数据单元并行处理标志来确定第一数据单元中是否包括可并行处理数据;当确定第一数据单元中包括可并行处理数据时,从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志,其中,第二数据单元的级别低于第一数据单元的级别。

权利要求书

1.  一种视频解码方法,包括:
从第一数据单元头获得指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志,其中,第一数据单元头包括构成在比特流中包括的视频的第一数据单元的编码信息;
基于第一数据单元并行处理标志来确定第一数据单元中是否包括可并行处理数据;
当确定第一数据单元中包括可并行处理数据时,从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志,其中,第二数据单元的级别低于第一数据单元的级别。

2.
  如权利要求1所述的视频解码方法,其中,第一数据单元是序列,第二数据单元是画面,第一数据单元头是序列参数集(SPS),第二数据单元头是画面参数集(PPS)。

3.
  如权利要求1所述的视频解码方法,还包括:
基于第二数据单元并行处理标志来确定第二数据单元中是否包括可并行处理数据;
当确定第二数据单元中包括可并行处理数据时,从包括第三数据单元的编码信息的第三数据单元头获得指示第三数据单元中是否包括可并行处理数据的第三数据单元并行处理标志,其中,第三数据单元的级别低于第二数据单元的级别。

4.
  如权利要求3所述的视频解码方法,其中,第二数据单元是画面,第三数据单元是条带。

5.
  如权利要求1所述的视频解码方法,其中,第一数据单元头和第二数据单元头中的每一个包括附加并行处理信息,
其中,当第一数据单元头和第二数据单元头中包括相同的并行处理信息时,第二数据单元头中包括的并行处理信息具有比第一数据单元头中包括的并行处理信息更高的优先级,并且第二数据单元头的并行处理信息替换第一数据单元头的并行处理信息。

6.
  如权利要求1所述的视频解码方法,其中,可并行处理数据是与从并 行块、波前并行处理(WPP)和条带中选择的至少一个有关的数据。

7.
  一种视频解码设备,包括:
并行处理信息获得器,从第一数据单元头获得指示构成在比特流中包括的视频的第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志,当基于第一数据单元并行处理标志确定第一数据单元中包括可并行处理数据时,从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志,其中,第一数据单元头包括第一数据单元的编码信息,第二数据单元的级别低于第一数据单元的级别;
并行处理确定器,基于获得的第一数据单元并行处理标志和获得的第二数据单元并行处理标志来确定视频中包括的可并行处理数据单元。

8.
  如权利要求7所述的视频解码设备,其中,第一数据单元是序列,第二数据单元是画面,第一数据单元头是序列参数集(SPS),第二数据单元头是画面参数集(PPS)。

9.
  如权利要求7所述的视频解码设备,其中,并行处理信息获得器基于第二数据单元并行处理标志来确定第二数据单元中是否包括可并行处理数据,当确定第二数据单元中包括可并行处理数据时,从包括第三数据单元的编码信息的第三数据单元头获得指示第三数据单元中是否包括可并行处理数据的第三数据单元并行处理标志,其中,第三数据单元的级别低于第二数据单元的级别。

10.
  如权利要求9所述的视频解码设备,其中,第二数据单元是画面,第三数据单元是条带。

11.
  如权利要求7所述的视频解码设备,其中,第一数据单元头和第二数据单元头中的每一个包括附加并行处理信息,当第一数据单元头和第二数据单元头中包括相同的并行处理信息时,第二数据单元头中包括的并行处理信息具有比第一数据单元头中包括的并行处理信息更高的优先级,
其中,并行处理信息获得器用第二数据单元头的并行处理信息替换第一数据单元头的并行处理信息。

12.
  如权利要求7所述的视频解码设备,其中,可并行处理数据是与从并行块、波前并行处理(WPP)和条带中选择的至少一个有关的数据。

13.
  一种视频编码方法,包括:
获得构成视频的第一数据单元和第二数据单元的编码数据,其中,第二数据单元的级别低于第一数据单元的级别;
对指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志进行编码,并将编码后的第一数据单元并行处理标志输出到包括第一数据单元的编码信息的第一数据单元头;
当第一数据单元中包括可并行处理数据时,对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码,并将编码后的第二数据单元并行处理标志输出到第二数据单元头。

14.
  如权利要求13所述的视频编码方法,其中,第一数据单元头和第二数据单元头中的每一个包括附加并行处理信息,当第一数据单元头和第二数据单元头中包括相同的并行处理信息时,第二数据单元头中包括的并行处理信息具有比第一数据单元头中包括的并行处理信息更高的优先级,
其中,第二数据单元头的并行处理信息替换第一数据单元头的并行处理信息。

15.
  一种视频编码设备,包括:
并行处理确定器,获得构成视频的第一数据单元和第二数据单元的编码数据,并确定第一数据单元和第二数据单元中是否包括可并行处理数据,其中,第二数据单元的级别低于第一数据单元的级别;
并行处理信息输出单元,对指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志进行编码,并将编码后的第一数据单元并行处理标志输出到包括第一数据单元的编码信息的第一数据单元头,当第一数据单元中包括可并行处理数据时,对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码,并将编码后的第二数据单元并行处理标志输出到第二数据单元头。

说明书

使用用于并行处理的统一语法的视频编码方法和设备以及视频解码方法和设备
技术领域
本发明涉及用于平行处理的视频编码和解码。
背景技术
由于最近已开发出数字显示技术并且高清晰度数字TV时代已到来,因此提出了用于处理大视频数据的新编解码器。此外,由于硬件性能最近得到了提高,因此执行视频图像处理的中央处理单元(CPU)或图形处理单元(GPU)被配置为包括多个核,并能够执行并行图像数据处理。
发明内容
技术问题
本发明提供使用并行处理信息的一种视频编码方法和设备以及一种视频解码方法和设备,其中,所述并行处理信息根据用于对视频数据进行并行处理的视频数据单元被统一。
解决方案
将用于系统地执行并行处理的标志信息添加到具有更高级别和更低级别的数据单元。
有益效果
根据本发明的实施例,可通过按照从更高数据层到更低数据层的顺序使用统一和系统的并行处理信息,预先确定当在解码器中数据按照从更高数据单元到更低数据单元的顺序被解析时可被并行处理的数据(在下文中,被称为可并行处理数据)是否存在于每个数据单元中。因此,根据本发明的实施例,通过检测可并行处理数据、划分数据并将数据分配给解码器的多个核,可进行并行图像处理。
附图说明
图1是示出根据本发明的实施例的视频编码设备的框图。
图2是示出根据本发明的实施例的视频解码设备的框图。
图3是用于解释根据本发明的实施例的编码单元的概念的示图。
图4是示出根据本发明的实施例的基于编码单元的图像编码器的框图。
图5是示出根据本发明的实施例的基于编码单元的图像解码器的框图。
图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。
图7是用于解释根据本发明的实施例的编码单元与变换单元之间的关系的示图。
图8是用于解释根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。
图9是示出根据本发明的实施例的根据深度的较深层编码单元的示图。
图10至图12是用于解释根据本发明的实施例的编码单元、预测单元和频率变换单元之间的关系的示图。
图13是用于解释根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。
图14是用于解释根据本发明的实施例的对视频数据单元的并行处理的构思的参考示图。
图15是示出根据本发明的实施例的熵编码设备的框图。
图16是用于解释根据本发明的实施例的条带单元的参考示图。
图17是用于解释根据本发明的另一实施例的条带单元的参考示图。
图18是用于解释根据本发明的实施例的并行块(tile)单元的参考示图。
图19是用于解释根据本发明的实施例的波前并行处理(WPP)的参考示图。
图20是示出根据本发明的实施例的由并行处理信息输出单元1520执行的用于设置标志的处理的流程图,其中,所述标志指示可被并行处理的数据(在下文中,被称为可并行处理数据)是否存在于每个数据单元中。
图21是示出根据本发明的实施例的序列参数集(SPS)的示图。
图22是示出根据本发明的实施例的画面参数集(PPS)的示图。
图23是示出根据本发明的实施例的并行处理信息parallel_processing_param()的示图。
图24是示出根据本发明的实施例的视频编码方法的流程图。
图25是示出根据本发明的实施例的熵解码设备的框图。
图26是示出根据本发明的实施例的视频解码方法的流程图。
图27是示出根据本发明的实施例的用于并行处理的视频解码方法的详细流程图。
最佳实施方式
根据本发明的实施例的用于解决前述技术问题的一种视频解码方法包括:从第一数据单元头获得指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志,其中,第一数据单元头包括构成在比特流中包括的视频的第一数据单元的编码信息;基于第一数据单元并行处理标志来确定第一数据单元中是否包括可并行处理数据;当确定第一数据单元中包括可并行处理数据时,从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志,其中,第二数据单元的级别低于第一数据单元的级别。
根据本发明的实施例的一种视频解码设备包括:并行处理信息获得器,从第一数据单元头获得指示构成在比特流中包括的视频的第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志,当基于第一数据单元并行处理标志确定第一数据单元中包括可并行处理数据时,从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志,其中,第一数据单元头包括第一数据单元的编码信息,第二数据单元的级别低于第一数据单元的级别;并行处理确定器,基于获得的第一数据单元并行处理标志和获得的第二数据单元并行处理标志来确定视频中包括的可并行处理数据单元。
根据本发明的实施例的一种视频编码方法包括:获得构成视频的第一数据单元和第二数据单元的编码数据,其中,第二数据单元的级别低于第一数据单元的级别;对指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志进行编码,并将编码后的第一数据单元并行处理标志输出到包括第一数据单元的编码信息的第一数据单元头;当第一数据单元中包括 可并行处理数据时,对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码,并将编码后的第二数据单元并行处理标志输出到第二数据单元头。
根据本发明的实施例的一种视频编码设备包括:并行处理确定器,获得构成视频的第一数据单元和第二数据单元的编码数据,并确定第一数据单元和第二数据单元中是否包括可并行处理数据,其中,第二数据单元的级别低于第一数据单元的级别;并行处理信息输出单元,对指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志进行编码,并将编码后的第一数据单元并行处理标志输出到包括第一数据单元的编码信息的第一数据单元头,当第一数据单元中包括可并行处理数据时,对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码,并将编码后的第二数据单元并行处理标志输出到第二数据单元头。
具体实施方式
现在将参照附图更充分地解释本发明,其中,本发明的示例性实施例在附图中示出。
将参照图1至图13解释根据本发明的实施例的基于在空间上分层的数据单元的视频编码和视频解码。将参照图14至图27解释根据本发明的实施例的使用用于并行处理的统一语法的视频编码和视频解码。
图1是示出根据本发明的实施例的视频编码设备100的框图。
视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元130。
最大编码单元划分器110可基于图像的当前画面的最大编码单元划分当前画面。如果当前画面大于最大编码单元,则可将当前画面的图像数据划分为至少一个最大编码单元。根据实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元,其中,数据单元的形状是宽度和长度为2的若干次方的正方形。图像数据可根据至少一个最大编码单元被输出到编码单元确定器120。
根据实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元空间被划分的次数,并且随着深度加深,根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最 高深度,最小编码单元的深度为最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根据实施例的最大编码单元进行划分,因此可根据深度分层地对包括在最大编码单元中的空间域的图像数据进行分类。
可预先设置编码单元的最大深度和最大尺寸,所述最大深度和最大尺寸限制最大编码单元的高度和宽度被分层划分的总次数。
编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换言之,编码单元确定器120通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码,并选择具有最小编码误差的深度,来确定编码深度。确定的编码深度和根据最大编码单元的图像数据被输出到输出单元130。
基于与等于或小于最大深度的至少一个深度相应的较深层编码单元,对最大编码单元中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对与较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
随着编码单元根据深度而被分层地划分,最大编码单元的尺寸被划分并且编码单元的数量增加。另外,即使在一个最大编码单元中编码单元与同一深度相应,仍通过估计每个编码单元的数据的编码误差来确定是否将与同一深度相应的每个编码单元划分为更低深度。因此,即使数据被包括在一个最大编码单元中,在一个最大编码单元中编码误差根据区域而不同,因此在数据中编码深度可根据区域而不同。因此,可在一个最大编码单元中设置一个或更多个编码深度,并且可根据至少一个编码深度的编码单元来对最大编码单元的数据进行划分。
因此,根据实施例的编码单元确定器120可确定包括在当前最大编码单元中的具有树结构的编码单元。根据实施例的“具有树结构的编码单元”包括在当前最大编码单元中包括的所有较深层编码单元中的与确定为编码深度的 深度相应的编码单元。可根据最大编码单元的相同区域中的深度来分层地确定编码深度的编码单元,并可在不同区域中独立地确定编码深度的编码单元。类似地,可从另一区域的编码深度独立地确定当前区域中的编码深度。
根据实施例的最大深度是与从最大编码单元到最小编码单元所执行划分的次数有关的索引。根据实施例的第一最大深度可表示从最大编码单元到最小编码单元所执行的划分的总次数。根据实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如,当最大编码单元的深度是0时,对最大编码单元划分一次的编码单元的深度可被设置为1,对最大编码单元划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是对最大编码单元划分四次的编码单元,则存在深度0、1、2、3和4的5个深度等级,并因此第一最大深度可被设置为4,第二最大深度可被设置为5。
可根据最大编码单元执行预测编码和频率变换。还根据最大编码单元,基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和频率变换。
由于每当根据深度对最大编码单元进行划分时,较深层编码单元的数量增加,因此将对随着深度加深而产生的所有较深层编码单元执行包括预测编码和频率变换的编码。为了便于解释,在至少一个最大编码单元中,现在将基于当前深度的编码单元来解释预测编码和频率变换。
根据实施例的视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、频率变换和熵编码的操作,此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
为了在最大编码单元中执行预测编码,可基于与编码深度相应的编码单元(即,基于不再被划分为与更低深度相应的编码单元的编码单元)来执行预测编码。以下,不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元获得的分区可包括预测单元以及通过对预测单元的高度和宽度中的至少一个进行划分而获得的数据单元。
例如,当尺寸为2N×2N(其中,N是正整数)的编码单元不再被划分,并且成为尺寸为2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。根据实施例的分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如,1:n或n:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。
预测单元的预测模式可以是从帧内模式、帧间模式和跳过模式中选择的至少一个。例如,可对尺寸为2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。另外,可仅对尺寸为2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元,来对编码单元中的图像数据执行频率变换。
为了在编码单元中执行频率变换,可基于具有小于或等于编码单元的尺寸的数据单元来执行频率变换。例如,用于变换的数据单元可包括帧内模式的数据单元和帧间模式的数据单元。
现在将用作频率变换的基础的数据单元称为“变换单元”。类似于编码单元,编码单元中的变换单元可被递归地划分为更小尺寸的区域,因此可基于根据变换深度的具有树结构的变换单元,对编码单元中的残差数据进行划分。
还可在变换单元中设置变换深度,其中,变换深度表示通过对编码单元的高度和宽度进行划分以达到变换单元所执行的划分的次数。例如,在尺寸为2N×2N的当前编码单元中,当变换单元的尺寸是2N×2N时,变换深度可以是0,当变换单元的尺寸是N×N时,变换深度可以是1,当变换单元的尺寸是N/2×N/2时,变换深度可以是2。也就是说,还可根据变换深度设置具有树结构的变换单元。
根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需要关于与预测编码和频率变换相关的信息的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式和用于频率变换的变换单元的尺寸。
以下将参照图3至图12详细解释根据实施例的最大编码单元中的具有树结构的编码单元以及确定分区的方法。
编码单元确定器120可通过使用基于拉格朗日乘数的率失真(RD)优化,来测量根据深度的较深层编码单元的编码误差。
输出单元130在比特流中输出最大编码单元的图像数据和关于根据编码深度的编码模式的信息,其中,所述最大编码单元的图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。
可通过对图像的残差数据进行编码来获得编码图像数据。
关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于在预测单元中的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。
可通过使用根据深度的划分信息来定义关于编码深度的信息,其中,根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则对当前编码单元中的图像数据进行编码并输出,因此可定义划分信息以不将当前编码单元划分到更低深度。可选地,如果当前编码单元的当前深度不是编码深度,则必需对更低深度的编码单元执行编码,并因此可定义划分信息以对当前编码单元进行划分来获得更低深度的编码单元。
如果当前深度不是编码深度,则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复执行编码,并因此可对具有相同深度的编码单元递归地执行编码。
由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编码单元确定关于至少一个编码模式的信息,所以可针对一个最大编码单元确定关于至少一个编码模式的信息。另外,由于根据深度对图像数据进行分层划分,因此最大编码单元的数据的编码深度可根据位置而不同,因此可针对数据设置关于编码深度和编码模式的信息。
因此,输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
根据实施例的最小单元是通过将构成最低深度的最小编码单元划分为4份而获得的矩形数据单元。可选择地,最小单元可以是可包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大矩形数据单元。
例如,通过输出单元130输出的编码信息可被分类为根据编码单元的编码信息和根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。此外,根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头。
根据视频编码设备100的最简单实施例,较深层编码单元是通过将更高深度的编码单元(更高一层)的高度或宽度划分成两份而获得的编码单元。换言之,当当前深度的编码单元的尺寸是2N×2N时,更低深度的编码单元的尺寸是N×N。另外,尺寸为2N×2N的具有当前深度的编码单元可包括最多4个所述更低深度的尺寸为N×N的编码单元。
因此,根据实施例的视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度,通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外,由于可通过使用各种预测模式和频率变换中的任意一个对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的图像特征来确定最优编码模式。
因此,如果以传统宏块对具有非常高的分辨率或大数据量的图像进行编码,则每个画面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩的信息,并且数据压缩效率降低。然而,通过使用根据实施例的视频编码设备100,由于考虑图像的特征来调整编码单元,并且考虑图像的尺寸来增加编码单元的最大尺寸,因此可提高图像压缩效率。
图2是示出根据本发明的实施例的视频解码设备200的框图。
根据实施例的视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据解码器230。用于根据实施例的视频解码设备200的各种操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图1和视频编码设备100解释的定义相同。
接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流,针对每个编码单元提取编码图像数据,并将提取的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个最大编码 单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头提取关于当前画面的编码单元的最大尺寸的信息。
另外,图像数据和编码信息提取器220从解析的比特流,根据每个最大编码单元,提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换言之,比特流中的图像数据被划分为最大编码单元,使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。
可针对关于与编码深度相应的至少一个编码单元的信息设置关于根据最大编码单元的编码深度和编码模式的信息,关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外,根据深度的划分信息可被提取为关于编码深度的信息。
关于由图像数据和编码信息提取器220提取的根据每个最大编码单元的编码深度和编码模式的信息是关于在以下情况下被确定为产生最小编码误差的编码深度和编码模式的信息,即,在编码器(诸如,视频编码设备100)根据最大编码单元对根据深度的每个较深层编码单元重复地执行编码的时候。因此,视频解码设备200可通过根据产生最小编码误差的编码方法对数据进行解码来恢复图像。
由于关于根据实施例的编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单元,提取关于编码深度和编码模式的信息。当关于相应最大编码单元的编码深度和编码模式的信息根据预定数据单元被编写时,可将具有相同的关于编码深度和编码模式的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。
图像数据解码器230基于关于根据最大编码单元的编码深度和编码模式的信息,通过对每个最大编码单元中的图像数据进行解码,来恢复当前画面。换言之,图像数据解码器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息,对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆频率变换。
图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的 分区类型和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
此外,图像数据解码器230可基于关于根据深度的编码单元的变换单元的尺寸的信息,根据编码单元中的每个变换单元执行逆频率变换,以根据最大编码单元执行逆频率变换。
图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是编码深度。因此,图像数据解码器230可通过使用关于与编码深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息,对当前最大编码单元中的与编码深度相应的编码单元的图像数据进行解码。
换言之,可通过观察针对编码单元、预测单元和最小单元中的预定数据单元设置的编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。
根据实施例的视频解码设备200可获得关于当对每个最大编码单元迭代地执行编码时产生最小编码误差的编码单元的信息,并使用所述信息来对当前画面进行解码。换言之,可对在每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元进行解码。
因此,即使图像数据具有高分辨率和过大数据量,也可通过使用编码单元的尺寸和编码模式,有效地对图像数据进行解码和恢复,其中,通过使用从编码器接收到的关于最优编码模式的信息,根据图像的特征自适应地确定所述编码单元的尺寸和编码模式。
现在将参照图3至图13解释根据本发明的实施例的确定具有树结构的编码单元、预测单元和变换单元的方法。
图3是用于解释根据本发明的实施例的分层编码单元的构思的视图。
编码单元的尺寸可被表示为宽度×高度,并可以是64×64、32×32、16×16和8×8。尺寸为64×64的编码单元可被划分为尺寸为64×64、64×32、32×64或32×32的分区,尺寸为32×32的编码单元可被划分为尺寸为32×32、32×16、16×32或16×16的分区,尺寸为16×16的编码单元可被划分为尺寸为16×16、16×8、8×16或8×8的分区,尺寸为8×8的编码单元可被划分为尺寸为8×8、 8×4、4×8或4×4的分区。
在视频数据310中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是2。在视频数据320中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是3。在视频数据330中,分辨率是352×288,编码单元的最大尺寸是16,最大深度是1。图3中示出的最大深度表示从最大编码单元到最小编码单元的划分总次数。
如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可被选为64。
由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。同时,由于视频数据330的最大深度是1,因此由于通过对最大编码单元划分一次,深度增加至一层,因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。
由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度增加至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深,详细信息可被精确地表示。
图4是示出根据本发明的实施例的基于编码单元的图像编码器400的框图。
根据实施例的图像编码器400执行视频编码设备100的编码单元确定器120的操作来对图像数据进行编码。换言之,帧内预测器410在帧内模式下对当前帧405中的编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495,在帧间模式下对编码单元执行帧间估计和运动补偿。
从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过频率变换器430和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆频率变换器470被恢复为空间域中的数据,恢复的空间域中的数据在通过去块单元480和环路滤波单元490后处理之后被输出为参考帧495。量化后的变换系数可通过熵编码器450被输出为比特流455。
为了将图像编码器400应用到根据实施例的视频编码设备100中,图像编码器400的所有元件(即,帧内预测器410、运动估计器420、运动补偿器425、频率变换器430、量化器440、熵编码器450、反量化器460、逆频率变换器470、去块单元480和环路滤波单元490)必需考虑每个最大编码单元的最大深度,基于具有树结构的编码单元中的每个编码单元执行操作。
具体地,帧内预测器410、运动估计器420和运动补偿器425考虑当前最大编码单元的最大尺寸和最大深度来确定具有树结构的编码单元中的每个编码单元的分区和预测模式,频率变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。
图5是根据本发明的实施例的基于编码单元的图像解码器500的框图。
解析器510从比特流505解析将被解码的编码图像数据和解码所需的关于编码的信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据,反量化的数据通过逆频率变换器540被恢复为空间域中的图像数据。
针对空间域中的图像数据,帧内预测器550在帧内模式下对编码单元执行帧内预测,运动补偿器560通过使用参考帧585在帧间模式下对编码单元执行运动补偿。
通过帧内预测器550和运动补偿器560的空间域中的数据可在通过去块单元570和环路滤波单元580后处理之后被输出为恢复帧595。另外,通过去块单元570和环路滤波单元580后处理的数据可被输出为参考帧585。
为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,根据实施例的图像解码器500可执行在解析器510的操作被执行之后执行的操作。
为了将图像解码器500应用到根据实施例的视频解码设备200中,图像解码器500的所有元件(即,解析器510、熵解码器520、反量化器530、逆频率变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)需针对每个最大编码单元基于具有树结构的编码单元执行操作。
具体地,帧内预测器550和运动补偿器560针对具有树结构的每个编码单元确定分区和预测模式,逆频率变换器540针对每个编码单元确定变换单元的尺寸。
图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区 的示图。
根据实施例的视频编码设备100和根据实施例的视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
在根据实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,最大深度是4。由于沿着根据实施例的分层结构600的垂直轴深度增加,因此较深层编码单元的高度和宽度均被划分。另外,预测单元和分区沿着分层结构600的水平轴被示出,其中,所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
换言之,在分层结构600中,编码单元610是最大编码单元,其中,深度为0,尺寸(即,高度乘宽度)为64×64。随着深度沿着垂直轴增大,存在尺寸为32×32和深度为1的编码单元620、尺寸为16×16和深度为2的编码单元630、尺寸为8×8和深度为3的编码单元640、尺寸为4×4和深度为4的编码单元650。尺寸为4×4和深度为4的编码单元650是最小编码单元。
编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之,如果尺寸为64×64和深度为0的编码单元610是预测单元,则可将预测单元划分成包括在编码单元610中的分区,即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。
类似地,可将尺寸为32×32和深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区,即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。
类似地,可将尺寸为16×16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区,即,包括在编码度单元630中的尺寸为16×16的分区、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。
类似地,可将尺寸为8×8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区,即,包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。
尺寸为4×4和深度为4的编码单元650是最小编码单元和最低深度的编码单元。编码单元650的预测单元仅被分配给尺寸为4×4的分区。
为了确定最大编码单元610的编码深度,根据实施例的视频编码设备100的编码单元确定器120需对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。
随着深度增大,包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,与深度1相应的编码单元和四个与深度2相应的编码单元均需被编码。
为了针对深度之中的当前深度执行编码,可沿着分层结构600的水平轴,通过对与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深度选择作为最小编码误差的代表性误差。可选地,随着深度沿着分层结构600的垂直轴增大,可通过比较根据深度的代表性误差并针对每个深度执行编码,来搜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。
图7是用于解释根据本发明的实施例的在编码单元710和变换单元720之间的关系的示图。
根据实施例的视频编码设备100或根据实施例的视频解码设备200针对每个最大编码单元,根据具有小于或等于最大编码单元的尺寸的编码单元,对图像进行编码或解码。可基于不大于每个编码单元的数据单元,来选择用于在编码期间进行频率变换的变换单元的尺寸。
例如,在根据实施例的视频编码设备100或根据实施例的视频解码设备200中,如果编码单元710的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行频率变换。
此外,可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的每个变换单元执行频率变换,来对尺寸为64×64的编码单元710的数据进行编码,然后可选择具有最小编码误差的变换单元。
图8是用于解释根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。
根据实施例的视频编码设备100的输出单元130可对与编码深度相应的 每个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行编码,并将信息800、信息810和信息820作为关于编码模式的信息来发送。
信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。这里,关于当前编码单元的分区类型的信息800被设置来指示尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808中的一个。
信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
此外,信息820指示当对当前编码单元执行频率变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826和第二帧内变换单元828中的任意一个。
根据实施例的视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元,提取并使用用于解码的信息800、810和820。
图9是示出根据本发明的实施例的根据深度的较深层编码单元的示图。
划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。
用于对深度为0和尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916和尺寸为N_0×N_0的分区类型918。图9仅示出了通过对称地划分预测单元910而获得的分区类型912至918,但是分区类型不限于此,并且预测单元910的分区可包括非对称分区、具有任意形状的分区和具有几何形状的分区。
根据每种分区类型,需对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。可仅 对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。
如果在尺寸为2N_0×2N_0、2N_0×N_0和N_0×2N_0的分区类型912至916中的一个分区类型中编码误差最小,则可不将预测单元910划分到更低深度。
如果在尺寸为N_0×N_0的分区类型918中编码误差最小,则深度从0改变到1以在操作920中划分分区类型918,并对深度为2和尺寸为N_0×N_0的编码单元930重复地执行编码来搜索最小编码误差。
用于对深度为1和尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进行预测编码的预测单元940可包括以下分区类型的分区:尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946以及尺寸为N_1×N_1的分区类型948。
如果在尺寸为N_1×N_1的分区类型948中编码误差最小,则深度从1改变到2以在操作950中划分分区类型948,并对深度为2和尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。
当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成d-1,并且划分信息可被编码直到深度是0到d-2中的一个。换句话说,当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-1时,用于对深度为d-1和尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-1)×2N(d-1)的分区类型992、尺寸为2N_(d-1)×N(d-1)的分区类型994、尺寸为N_(d-1)×2N(d-1)的分区类型996和尺寸为N_(d-1)×N(d-1)的分区类型998。
可对分区类型992至998中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区类型。
即使当尺寸为N_(d-1)×N_(d-1)的分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-1的编码单元CU_(d-1)也不再被划分到更低深度,构成当前最大编码单元900的编码单元的编码深度被确定为d-1,并且当前最大编码单元900的分区类型可被确定为N_(d-1)×N(d-1)。此外,由于最大深度是d,因此不设置深度为d-1的最小编码单元980的划分信息。
数据单元999可被称为用于当前最大编码单元的“最小单元”。根据实施例的最小单元可以是通过将具有最低编码深度的最小编码单元划分成4份而获得的矩形数据单元。通过重复地执行编码,根据实施例的视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度,并将相应分区类型和预测模式设置为编码深度的编码模式。
这样,在所有深度1至d中对根据深度的最小编码误差进行比较,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码并发送。另外,由于编码单元需从0的深度被划分到编码深度,因此仅编码深度的划分信息被设置为0,并且除了编码深度以外的深度的划分信息被设置为1。
根据实施例的视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度和预测单元的信息,来对编码单元912进行解码。根据实施例的视频解码设备200可通过使用根据深度的划分信息,将划分信息为0的深度确定为编码深度,并且使用关于相应深度的编码模式的信息来进行解码。
图10至图12是用于解释根据本发明的实施例的编码单元1010、预测单元1060和频率变换单元1070之间的关系的示图。
编码单元1010是最大编码单元中的与由根据实施例的视频编码设备100确定的编码深度相应的编码单元。预测单元1060是每个编码单元1010中的预测单元的分区,变换单元1070是每个编码单元1010的变换单元。
当在编码单元1010中最大编码单元的深度是0时,编码单元1012和编码单元1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
在预测单元1060中,通过划分编码单元来获得一些分区1014、1016、1022、1032、1048、1050、1052和1054。换句话说,分区1014、1022、1050和1054中的分区类型的尺寸是2N×N,分区1016、1048和1052中的分区类型的尺寸是N×2N,分区1032的分区类型的尺寸就N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。
在小于变换单元1052的数据单元中的变换单元1070中,对变换单元 1052的图像数据执行频率变换或逆频率变换。另外,在尺寸和形状方面,变换单元1070中的变换单元1014、1016、1022、1032、1048、1050和1052不同于预测单元1060中的变换单元1014、1016、1022、1032、1048、1050和1052。换句话说,根据实施例的视频编码设备100和根据实施例的视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测/运动估计/运动补偿和频率变换/逆频率变换。
因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元,从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由根据实施例的视频编码设备100和根据实施例的视频解码设备200设置的编码信息。
[表1]

根据实施例的视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息,根据实施例的视频解码设备200的图像数据和编码信息提取器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。
划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0,则当前编码单元不再被划分成更低深度的深度是编码深度,从而可针对所述编码深度来定义关于分区类型、预测模式和变换 单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分,则需对更低深度的四个划分编码单元独立地执行编码。
预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可针对所有分区类型定义帧内模式和帧间模式,可仅在尺寸为2N×2N的分区类型中定义跳过模式。
关于分区类型的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型,以及通过非对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的非对称分区类型。可通过按1:3和3:1来划分预测单元的高度来分别获得尺寸为2N×nU和2N×nD的非对称分区类型,可通过按1:3和3:1来划分预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的非对称分区类型。
可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换句话说,如果变换单元的划分信息是0,则变换单元的尺寸被设置为2N×2N,即当前编码单元的尺寸。如果变换单元的划分信息是1,则可通过对当前编码单元进行划分来设置变换单元。另外,如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型时,则变换单元的尺寸可被设置为N×N,如果当前编码单元的分区类型是非对称分区类型,则变换单元的尺寸可被设置为N/2×N/2。
关于具有树结构的编码单元的编码信息可被分配给与编码深度相应的编码单元、预测单元和最小单元中的至少一个。与编码深度相应的编码单元可包括包含相同编码信息的预测单元和最小单元中的至少一个。
因此,通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与编码深度相应的同一编码单元中。另外,通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元,并因此可确定最大编码单元中的编码深度的分布。
因此,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。
可选地,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则使用数据单元的编码信息来搜索与较深层编码单元中的当前编码单元邻近的数据单元,并可参考搜索到的邻近编码单元以对当前编码单元进行预测。
图13是用于解释根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。
最大编码单元1300包括多个编码深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里,由于编码单元1318是一个编码深度的编码单元,因此划分信息可以被设置成0。可将关于尺寸为2N×2N的编码单元1318的分区类型的信息设置成以下分区类型中的一种:尺寸为2N×2N的分区类型1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326、尺寸为N×N的分区类型1328、尺寸为2N×nU的分区类型1332、尺寸为2N×nD的分区类型1334、尺寸为nL×2N的分区类型1336以及尺寸为nR×2N的分区类型1338。
当关于分区类型的信息被设置成对称分区类型(即,分区类型1322、1324、1326或1328)时,如果变换单元的划分信息(TU尺寸标志)是0,则可设置尺寸为2N×2N的变换单元1342,如果TU尺寸标志是1,则可设置尺寸为N×N的变换单元1344。
当关于分区类型的信息被设置成非对称分区类型(即,分区类型1332、1334、1336或1338)时,如果TU尺寸标志是0,则可设置尺寸为2N×2N的变换单元1352,如果TU尺寸标志是1,则可设置尺寸为N/2×N/2的变换单元1354。
现在将详细解释由根据本发明的实施例的图4的图像编码器400的熵编码器450和图5的图像解码器500的熵解码器520执行的对用于并行处理的统一语法进行编码和解码的处理。
图14是用于解释根据本发明的实施例的对视频数据单元的并行处理的构思的参考示图。
参照图14,当假设比特流1410的数据单元D1至D4不彼此依赖,并可被独立地编码和解码时,数据单元D1至D4可被分配给在视频编码/解码设备中设置的中央处理单元(CPU)或图形处理单元(GPU)的多个核1421至1424,并可被并行处理。为了这种并行处理,需要用于确定数据单元D1至D4中的每个数据单元是否是可被并行处理的数据单元(在下文中,被称为可并行处理数据单元)的信息。
为此,根据本发明的实施例,设置指示预定数据单元的并行处理是否可能的标志。根据本发明的实施例,通过在更高级别定义的指示并行处理是否 是可能的标志来确定在更低级别定义的指示并行处理是否可能的标志的存在。换句话说,仅当更高级别的指示并行处理是否可能的标志被设置为1时,才可设置更低级别的指示并行处理是否可能的标志。当更高级别的指示并行处理是否可能的标志被设置为0时,可跳过更低级别的指示并行处理是否可能的标志。以下将详细解释设置指示每个数据单元的并行处理是否可能的标志的处理。
图15是示出根据本发明的实施例的熵编码设备1500的框图。图15的熵编码设备1500与图4的熵编码器450相应。
参照图15,熵编码设备1500包括并行处理确定器1510和并行处理信息输出单元1520。
并行处理确定器1510获得构成视频的第一数据单元和第二数据单元的编码数据,并确定第一数据单元和第二数据单元中是否包括可被并行处理的数据(在下文中,被称为可并行处理数据),其中,第二数据单元的级别低于第一数据单元的级别。
并行处理信息输出单元1520对指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志进行编码,并将第一数据单元并行处理标志输出到第一数据单元头。如果第一数据单元中包括可并行处理数据,并且第二数据单元中也包括可并行处理数据,则并行处理信息输出单元1520对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码,并将第二数据单元并行处理标志输出到第二数据单元头。如果第一数据单元中不包括可并行处理数据,则并行处理信息输出单元1520可将第一数据单元并行处理标志设置为0,并且可不对第二数据单元并行处理标志进行编码,并可跳过第二数据单元并行处理标志。
现在将详细解释本发明的实施例中使用的可并行处理数据单元。
图16是用于解释根据本发明的实施例的条带单元的参考示图。
参照图16,可将一个画面划分为条带1610、1620和1630。一个条带可包括根据光栅扫描顺序连续的一个或更多个最大编码单元LCU。在图16中,按照条带分界线将一个画面划分为三个条带1610、1620和1630。此外,假设在图16中被阴影化的条带1610和1630是不依赖于其他条带并可被独立处理的条带。在此情况下,并行处理信息输出单元1520对指示是否存在可并行处理条带的标志slice_enabled_flag进行编码,并将标志slice_enabled_flag输 出到包括条带的画面的头,即,输出到画面参数集(PPS)。也就是说,当存在可并行处理条带时,并行处理信息输出单元1520将标志slice_enabled_flag设置为1,并将标志slice_enabled_flag添加到PPS。另外,当标志slice_enabled_flag被设置为1时,并行处理信息输出单元1520可将指示可并行处理条带的数量的语法num_of_slice添加到条带头或PPS。
指示每个条带是否是可并行处理条带的标志可包括在三个条带1610、1620和1630的头中。此外,当当前画面中存在可并行处理条带时,并行处理信息输出单元1520可将当前画面的PPS中的指示是否存在可并行处理数据的标志parallel_processing_param_enabled_pps_flag设置为1,并可输出标志parallel_processing_param_enabled_pps_flag。此外,当存在可并行处理条带时,并行处理信息输出单元1520可将指示序列中是否存在可并行处理数据的标志parallel_processing_param_enabled_sps_flag设置为1,并将标志parallel_processing_param_enabled_sps_flag输出到作为最上层数据单元的序列的头,即,输出到序列参数集(SPS)。
图17是用于解释根据本发明的另一实施例的条带单元的参考示图。
参照图17,假设按照条带分界线将一个图像划分为两个条带。此外,假设按照条带片段分界线将上方的条带划分为三个条带片段1710、1720和1730。此外,假设在图17中被阴影化的条带1740和条带片段1710是可在不参考其他条带或其他条带片段的情况下被独立处理的数据单元。在这种情况下,并行处理信息输出单元1520对指示是否存在可并行处理条带的标志slice_enabled_flag进行编码,并将标志slice_enabled_flag输出到PPS,并且对指示通过划分条带而获得的片段(即,条带片段)是否被使用的标志dependent_slice_segments_enabled_flag进行编码并输出标志dependent_slice_segments_enabled_flag。此外,并行处理信息输出单元1520将指示当前图像中是否存在可并行处理数据的标志parallel_processing_param_enabled_pps_flag设置为1,并将标志parallel_processing_param_enabled_pps_flag输出到当前画面的PPS。此外,并行处理信息输出单元1520将指示序列中是否存在可并行处理数据的标志parallel_processing_param_enabled_sps_flag设置为1,并将标志parallel_processing_param_enabled_sps_flag输出到SPS。
作为指示条带是否被使用的语法的标志slice_enabled_flag以及作为关于 条带数量的信息的语法num_of_slice可包括在条带数据单元或条带数据单元的更高数据单元的头(诸如SPS、PPS、自适应参数集(APS)或条带头)中。
图18是用于解释根据本发明的实施例的并行块单元的参考示图。
参照图18,可将一个画面划分为多个并行块1810、1820、1830、1840、1850和1860。每个并行块是按照列分界线1845和行分界线1855分开的一组最大编码单元LCU,并且是指运动估计或上下文预测不能超过列分界线1845或行分界线1855的独立数据处理单元。也就是说,每个并行块是不参考其他并行块的信息并可被并行处理的独立数据处理单元。当可将当前画面划分为并行块时,并行处理信息输出单元1520将指示是否存在可并行处理并行块的标志tile_enabled_flag设置为1,并将标志tile_enabled_flag输出到PPS。此外,并行处理信息输出单元1520将指示当前画面中是否存在可并行处理数据的标志parallel_processing_param_enabled_pps_flag设置为1,并将标志parallel_processing_param_enabled_pps_flag输出到PPS。此外,并行处理信息输出单元1520将指示序列中是否存在可并行处理数据的标志parallel_processing_param_enabled_sps_flag设置为1,并将标志parallel_processing_param_enabled_sps_flag输出到SPS。
图19是用于解释根据本发明的实施例的波前并行处理(WPP)的参考示图。
WPP包括为了并行编码/并行解码的目的而将每一行的第一最大编码单元LCU的上下文自适应二进制算术编码(CABAC)概率重置为通过处理上一行的第二最大编码单元而获得的概率的处理。例如,参照图19,可通过使用通过处理第一行(即,线程1)的第二最大编码单元1910而获得的CABAC概率1911来重置第二行(即,用于熵编码/熵解码的线程2)的第一最大编码单元1920的CABAC概率。此外,根据WPP,由于每一行的第一最大编码单元在上一行的第二最大编码单元被完全处理之后被处理,因此,每一行最大编码单元可通过使用上一行的最大编码单元来获得运动估计信息(例如,预测的运动矢量信息)。因此,图19的第一行至第四行(即,线程1至线程4)可在上一行的第二最大编码单元被完成时被并行处理。
当WPP方法用于对当前画面进行编码时,并行处理信息输出单元1520将指示WPP是否被使用的标志cabac_istate_reset_flag设置为1,并将标志cabac_istate_reset_flag输出到PPS。此外,并行处理信息输出单元1520将指 示当前画面中是否存在可并行处理数据的标志parallel_processing_param_enabled_pps_flag设置为1,并将标志parallel_processing_param_enabled_pps_flag输出到PPS。此外,并行处理信息输出单元1520将指示序列中是否存在可并行处理数据的标志parallel_processing_param_enabled_sps_flag设置为1,并将标志parallel_processing_param_enabled_sps_flag输出到SPS。
图20是示出根据本发明的实施例的由并行处理信息输出单元1520执行的用于设置指示每个数据单元中是否存在可并行处理数据的标志的处理的流程图。
参照图20,在操作2010,并行处理确定器1510确定当前序列中是否存在可并行处理数据单元。如上所述,当当前序列中存在通过使用独立条带、通过使用并行块或WPP方法编码的数据时,在操作2015,并行处理信息输出单元1520将指示序列中是否存在可并行处理数据的标志parallel_processing_param_enabled_sps_flag设置为1,并将标志parallel_processing_param_enabled_sps_flag输出到SPS。当在操作2010确定当前序列中不存在可并行处理数据单元时,在操作2020,并行处理信息输出单元1520将标志parallel_processing_param_enabled_sps_flag设置为0,并且可不设置并可跳过指示更低数据单元中是否存在可并行处理数据的标志。
在操作2025,并行处理确定器1510确定所述序列中存在的多个画面中的每个画面中是否存在可并行处理数据。在操作2030,仅针对被确定为其中具有可并行处理数据的画面,并行处理信息输出单元1520将指示当前画面中是否存在可并行处理数据的标志parallel_processing_param_enabled_pps_flag设置为1,并将标志parallel_processing_param_enabled_pps_flag输出到相应画面的PPS。在操作2035,当当前画面中不存在可并行处理数据时,并行处理信息输出单元1520将指示当前画面中是否存在可并行处理数据的标志parallel_processing_param_enabled_pps_flag设置为0,并将标志parallel_processing_param_enabled_pps_flag输出到PPS,并且可不设置并跳过用于更低数据单元的标志。
在操作2040,针对被确定为其中具有可并行处理数据的画面,并行处理确定器1510确定是否存在可并行处理条带或并行块。在操作2045,当存在可并行处理条带或并行块时,并行处理信息输出单元1520将标志 slice_enabled_flag或tile_enabled_flag设置为1。在操作2050,当不存在可并行处理条带或并行块时,并行处理信息输出单元1520将标志slice_enabled_flag或tile_enabled_flag设置为0,并输出标志slice_enabled_flag或tile_enabled_flag。
图21是示出根据本发明的实施例的SPS 2100的示图。
参照图21,指示序列中是否存在可并行处理数据单元的标志parallel_processing_param_enabled_sps_flag 2110包括在SPS 2100中。当标志parallel_processing_param_enabled_sps_flag为1时,指示相应序列中存在可并行处理数据单元,当标志parallel_processing_param_enabled_sps_flag为0时,指示相应序列中不存在可并行处理数据单元。当标志parallel_processing_param_enabled_sps_flag为1时,可在序列级别获得并行处理信息parallel_processing_param()2120。并行处理信息parallel_processing_param()2120可包括与条带、WPP和并行块有关的附加信息。
图22是示出根据本发明的实施例的PPS 2200的示图。
参照图22,指示画面中是否存在可并行处理数据单元的标志parallel_processing_param_enabled_pps_flag 2210包括在PPS 2200中。当标志parallel_processing_param_enabled_pps_flag为1时,指示相应画面中存在可并行处理数据单元,当标志parallel_processing_param_enabled_pps_flag为0时,指示相应画面中不存在可并行处理数据单元。当标志parallel_processing_param_enabled_pps_flag为1时,可在画面级别获得并行处理信息parallel_processing_param()2220。并行处理信息parallel_processing_param()2220可包括与条带、WPP和并行块有关的附加信息。在画面级别获得的并行处理信息parallel_processing_param()2220替换在序列级别获得的并行处理信息parallel_processing_param()2120。换句话说,在作为更低级别的画面级别获得的并行处理信息parallel_processing_param()2220具有比在序列级别获得的并行处理信息parallel_processing_param()2120更高的优先级。指示当前画面是否使用WPP方法的标志cabac_istate_reset_flag 2130可包括在PPS 2200中。
图23是示出根据本发明的实施例的并行处理信息parallel_processing_param()2300的示图。
参照图23,并行处理信息parallel_processing_param()2300可包括指示并行块是否被使用的标志tile_enabled_flag 2310、与并行块有关的附加信息的语法2320、与WPP有关的附加信息的语法2330以及指示可并行处理条带是否被使用的标志slice_enabled_flag 2340。当标志tile_enabled_flag为1时,指示画面或序列被划分为并行块并被独立处理。当标志slice_enabled_flag为1时,指示在画面或序列中使用可被独立处理的条带。如上所述,可在作为更高数据单元级别的序列级别和作为更低数据单元级别的画面级别均获得并行处理信息。当在序列中的画面中分开地定义并行处理信息时,在作为更低级别的画面级别定义的并行处理信息具有比在序列级别获得的并行处理信息更高的优先级。也就是说,当在作为更高级别的序列级别定义的并行处理信息parallel_processing_param()和在作为更低级别的画面级别定义的并行处理信息parallel_processing_param()彼此不同时,在作为更低级别的画面级别定义的并行处理信息parallel_processing_param()实际上以更高的优先级被使用。
图24是示出根据本发明的实施例的视频编码方法的流程图。
参照图24,在操作2410,并行处理确定器1510获得构成视频的第一数据单元和第二数据单元的编码数据,其中,第二数据单元的级别低于第一数据单元的级别。之后,并行处理确定器1510确定第一数据单元中是否存在可并行处理数据单元,并确定第一数据单元中包括的第二数据单元中是否存在可并行处理数据单元。
在操作2420,并行处理信息输出单元1520对指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志进行编码,并将编码后的第一数据单元并行处理标志输出到包括第一数据单元的编码信息的第一数据单元头。如上所述,当当前序列中存在通过使用独立条带、通过使用并行块或通过使用WPP方法编码的数据时,并行处理信息输出单元1520可将指示序列中是否存在可并行处理数据的标志parallel_processing_param_enabled_sps_flag设置为1,并将标志parallel_processing_param_enabled_sps_flag输出到SPS。
当第一数据单元中不包括可并行处理数据时,跳过设置第二数据单元并行处理标志的处理。在此情况下,被跳过的第二数据单元并行处理标志可被设置为0(操作2440)。
仅当第一数据单元中包括可并行处理数据时,设置指示第二数据单元中 是否包括可并行处理数据的并行处理标志,其中,第二数据单元的级别低于第一数据单元的级别。也就是说,当第一数据单元中包括可并行处理数据时,并行处理信息输出单元1520对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码,并将第二数据单元并行处理标志输出到第二数据单元头(操作2450)。如上所述,针对被确定为其中具有可并行处理数据的画面,并行处理信息输出单元1520将指示当前画面中是否存在可并行处理数据的标志parallel_processing_param_enabled_pps_flag设置为1,并将标志parallel_processing_param_enabled_pps_flag输出到相应画面的PPS。
图25是示出根据本发明的实施例的熵解码设备2500的框图。图26是示出根据本发明的实施例的视频解码方法的流程图。图25的熵解码设备2500与图5的熵解码器520相应。
参照图25和图26,在操作2610,并行处理信息获得器2510从第一数据单元头获得指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志,其中,第一数据单元头包括构成在比特流中包括的视频的第一数据单元的编码信息。当在操作2620,基于第一数据单元并行处理标志确定第一数据单元中包括可并行处理数据时,在操作2630,并行处理信息获得器2510从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志,其中,第二数据单元的级别低于第一数据单元的级别。并行处理确定器2520可基于每个获得的数据单元并行处理标志来确定每个数据单元是否可被并行处理,并可通过将可并行处理数据分配到多个图像处理核(未示出)来使并行处理被执行。
图27是示出根据本发明的实施例的用于并行处理的视频解码方法的详细流程图。
参照图27,在操作2710,并行处理信息获得器2510从比特流的SPS中获得指示当前序列中是否存在可并行处理数据的标志parallel_processing_param_enabled_sps_flag。
当在操作2720,并行处理确定器2520确定标志parallel_processing_param_enabled_sps_flag为1时,即,当并行处理确定器2520确定当前序列中存在可并行处理数据单元时,在操作2730,并行处理信息获得器2510获得指示序列中存在的多个画面中的每个画面中是否存在可 并行处理数据的标志parallel_processing_param_enabled_pps_flag。
在操作2740,并行处理确定器2520确定标志parallel_processing_param_enabled_pps_flag是否为1,也就是说,是否存在可并行处理单元。在操作2750,针对被确定为其中具有可并行处理数据单元的画面,并行处理信息获得器2510获得指示是否存在使用条带或并行块的可并行处理数据的标志(即,slice_enabled_flag或tile_enabled_flag)。并行处理确定器2520基于每个获得的标志来确定每个数据单元是否可被并行处理,并通过将可并行处理数据单元分配给多个核(未示出)来使并行处理被执行。
前面所描述的本发明的实施例可被实现为可执行程序,并可由通用数字计算机来执行,其中,通用数字计算机通过使用计算机可读记录介质运行程序。计算机可读介质的示例包括存储介质,诸如,磁性存储介质(例如,只读存储器(ROM)、软盘或硬盘)、光学可读介质(例如,致密盘只读存储器(CD-ROM)或数字多功能盘(DVD))等。
虽然已参照本发明的示例性实施例具体示出并解释了本发明,但是本领域普通技术人员将理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可在示例性实施例中做出形式和细节上的各种改变。示例性实施例应仅被认为是描述性意义,而不用于限制的目的。因此,本发明的范围不由本发明的详细描述来限定,并且所述范围内的所有差异将被解释为包括在本发明中。

使用用于并行处理的统一语法的视频编码方法和设备以及视频解码方法和设备.pdf_第1页
第1页 / 共41页
使用用于并行处理的统一语法的视频编码方法和设备以及视频解码方法和设备.pdf_第2页
第2页 / 共41页
使用用于并行处理的统一语法的视频编码方法和设备以及视频解码方法和设备.pdf_第3页
第3页 / 共41页
点击查看更多>>
资源描述

《使用用于并行处理的统一语法的视频编码方法和设备以及视频解码方法和设备.pdf》由会员分享,可在线阅读,更多相关《使用用于并行处理的统一语法的视频编码方法和设备以及视频解码方法和设备.pdf(41页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104205848A43申请公布日20141210CN104205848A21申请号201380015767522申请日2013012161/588,69020120120USH04N19/70201401H04N19/44201401H04N19/42201401H04N19/176201401H04N19/3320140171申请人三星电子株式会社地址韩国京畿道水原市72发明人郑丞洙朴永五金赞烈朴正辉金宰贤74专利代理机构北京铭硕知识产权代理有限公司11286代理人苏银虹曾世骁54发明名称使用用于并行处理的统一语法的视频编码方法和设备以及视频解码方法和设备57摘要提供使用。

2、用于并行处理的统一语法的一种视频编码方法和设备以及一种视频解码方法和设备。所述视频解码方法包括从第一数据单元头获得指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志,其中,第一数据单元头包括构成在比特流中包括的视频的第一数据单元的编码信息;基于第一数据单元并行处理标志来确定第一数据单元中是否包括可并行处理数据;当确定第一数据单元中包括可并行处理数据时,从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志,其中,第二数据单元的级别低于第一数据单元的级别。30优先权数据85PCT国际申请进入国家阶段日2014092286。

3、PCT国际申请的申请数据PCT/KR2013/0004912013012187PCT国际申请的公布数据WO2013/109125KO2013072551INTCL权利要求书2页说明书21页附图17页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书21页附图17页10申请公布号CN104205848ACN104205848A1/2页21一种视频解码方法,包括从第一数据单元头获得指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志,其中,第一数据单元头包括构成在比特流中包括的视频的第一数据单元的编码信息;基于第一数据单元并行处理标志来确定第一数据单元中是否包括可并。

4、行处理数据;当确定第一数据单元中包括可并行处理数据时,从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志,其中,第二数据单元的级别低于第一数据单元的级别。2如权利要求1所述的视频解码方法,其中,第一数据单元是序列,第二数据单元是画面,第一数据单元头是序列参数集SPS,第二数据单元头是画面参数集PPS。3如权利要求1所述的视频解码方法,还包括基于第二数据单元并行处理标志来确定第二数据单元中是否包括可并行处理数据;当确定第二数据单元中包括可并行处理数据时,从包括第三数据单元的编码信息的第三数据单元头获得指示第三数据单元中是否包括可并行。

5、处理数据的第三数据单元并行处理标志,其中,第三数据单元的级别低于第二数据单元的级别。4如权利要求3所述的视频解码方法,其中,第二数据单元是画面,第三数据单元是条带。5如权利要求1所述的视频解码方法,其中,第一数据单元头和第二数据单元头中的每一个包括附加并行处理信息,其中,当第一数据单元头和第二数据单元头中包括相同的并行处理信息时,第二数据单元头中包括的并行处理信息具有比第一数据单元头中包括的并行处理信息更高的优先级,并且第二数据单元头的并行处理信息替换第一数据单元头的并行处理信息。6如权利要求1所述的视频解码方法,其中,可并行处理数据是与从并行块、波前并行处理WPP和条带中选择的至少一个有关的。

6、数据。7一种视频解码设备,包括并行处理信息获得器,从第一数据单元头获得指示构成在比特流中包括的视频的第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志,当基于第一数据单元并行处理标志确定第一数据单元中包括可并行处理数据时,从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志,其中,第一数据单元头包括第一数据单元的编码信息,第二数据单元的级别低于第一数据单元的级别;并行处理确定器,基于获得的第一数据单元并行处理标志和获得的第二数据单元并行处理标志来确定视频中包括的可并行处理数据单元。8如权利要求7所述的视频解码设备,其中,。

7、第一数据单元是序列,第二数据单元是画面,第一数据单元头是序列参数集SPS,第二数据单元头是画面参数集PPS。9如权利要求7所述的视频解码设备,其中,并行处理信息获得器基于第二数据单元并行处理标志来确定第二数据单元中是否包括可并行处理数据,当确定第二数据单元中包括可并行处理数据时,从包括第三数据单元的编码信息的第三数据单元头获得指示第三数据单元中是否包括可并行处理数据的第三数据单元并行处理标志,其中,第三数据单元的权利要求书CN104205848A2/2页3级别低于第二数据单元的级别。10如权利要求9所述的视频解码设备,其中,第二数据单元是画面,第三数据单元是条带。11如权利要求7所述的视频解码。

8、设备,其中,第一数据单元头和第二数据单元头中的每一个包括附加并行处理信息,当第一数据单元头和第二数据单元头中包括相同的并行处理信息时,第二数据单元头中包括的并行处理信息具有比第一数据单元头中包括的并行处理信息更高的优先级,其中,并行处理信息获得器用第二数据单元头的并行处理信息替换第一数据单元头的并行处理信息。12如权利要求7所述的视频解码设备,其中,可并行处理数据是与从并行块、波前并行处理WPP和条带中选择的至少一个有关的数据。13一种视频编码方法,包括获得构成视频的第一数据单元和第二数据单元的编码数据,其中,第二数据单元的级别低于第一数据单元的级别;对指示第一数据单元中是否包括可并行处理数据。

9、的第一数据单元并行处理标志进行编码,并将编码后的第一数据单元并行处理标志输出到包括第一数据单元的编码信息的第一数据单元头;当第一数据单元中包括可并行处理数据时,对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码,并将编码后的第二数据单元并行处理标志输出到第二数据单元头。14如权利要求13所述的视频编码方法,其中,第一数据单元头和第二数据单元头中的每一个包括附加并行处理信息,当第一数据单元头和第二数据单元头中包括相同的并行处理信息时,第二数据单元头中包括的并行处理信息具有比第一数据单元头中包括的并行处理信息更高的优先级,其中,第二数据单元头的并行处理信息替换第一数据单元。

10、头的并行处理信息。15一种视频编码设备,包括并行处理确定器,获得构成视频的第一数据单元和第二数据单元的编码数据,并确定第一数据单元和第二数据单元中是否包括可并行处理数据,其中,第二数据单元的级别低于第一数据单元的级别;并行处理信息输出单元,对指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志进行编码,并将编码后的第一数据单元并行处理标志输出到包括第一数据单元的编码信息的第一数据单元头,当第一数据单元中包括可并行处理数据时,对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码,并将编码后的第二数据单元并行处理标志输出到第二数据单元头。权利要求书CN1042。

11、05848A1/21页4使用用于并行处理的统一语法的视频编码方法和设备以及视频解码方法和设备技术领域0001本发明涉及用于平行处理的视频编码和解码。背景技术0002由于最近已开发出数字显示技术并且高清晰度数字TV时代已到来,因此提出了用于处理大视频数据的新编解码器。此外,由于硬件性能最近得到了提高,因此执行视频图像处理的中央处理单元CPU或图形处理单元GPU被配置为包括多个核,并能够执行并行图像数据处理。发明内容0003技术问题0004本发明提供使用并行处理信息的一种视频编码方法和设备以及一种视频解码方法和设备,其中,所述并行处理信息根据用于对视频数据进行并行处理的视频数据单元被统一。0005。

12、解决方案0006将用于系统地执行并行处理的标志信息添加到具有更高级别和更低级别的数据单元。0007有益效果0008根据本发明的实施例,可通过按照从更高数据层到更低数据层的顺序使用统一和系统的并行处理信息,预先确定当在解码器中数据按照从更高数据单元到更低数据单元的顺序被解析时可被并行处理的数据在下文中,被称为可并行处理数据是否存在于每个数据单元中。因此,根据本发明的实施例,通过检测可并行处理数据、划分数据并将数据分配给解码器的多个核,可进行并行图像处理。附图说明0009图1是示出根据本发明的实施例的视频编码设备的框图。0010图2是示出根据本发明的实施例的视频解码设备的框图。0011图3是用于解。

13、释根据本发明的实施例的编码单元的概念的示图。0012图4是示出根据本发明的实施例的基于编码单元的图像编码器的框图。0013图5是示出根据本发明的实施例的基于编码单元的图像解码器的框图。0014图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。0015图7是用于解释根据本发明的实施例的编码单元与变换单元之间的关系的示图。0016图8是用于解释根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。0017图9是示出根据本发明的实施例的根据深度的较深层编码单元的示图。说明书CN104205848A2/21页50018图10至图12是用于解释根据本发明的实施例的编码单元、预。

14、测单元和频率变换单元之间的关系的示图。0019图13是用于解释根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。0020图14是用于解释根据本发明的实施例的对视频数据单元的并行处理的构思的参考示图。0021图15是示出根据本发明的实施例的熵编码设备的框图。0022图16是用于解释根据本发明的实施例的条带单元的参考示图。0023图17是用于解释根据本发明的另一实施例的条带单元的参考示图。0024图18是用于解释根据本发明的实施例的并行块TILE单元的参考示图。0025图19是用于解释根据本发明的实施例的波前并行处理WPP的参考示图。0026图20是示出根据本发明的实施例的由并。

15、行处理信息输出单元1520执行的用于设置标志的处理的流程图,其中,所述标志指示可被并行处理的数据在下文中,被称为可并行处理数据是否存在于每个数据单元中。0027图21是示出根据本发明的实施例的序列参数集SPS的示图。0028图22是示出根据本发明的实施例的画面参数集PPS的示图。0029图23是示出根据本发明的实施例的并行处理信息PARALLEL_PROCESSING_PARAM的示图。0030图24是示出根据本发明的实施例的视频编码方法的流程图。0031图25是示出根据本发明的实施例的熵解码设备的框图。0032图26是示出根据本发明的实施例的视频解码方法的流程图。0033图27是示出根据本发。

16、明的实施例的用于并行处理的视频解码方法的详细流程图。0034最佳实施方式0035根据本发明的实施例的用于解决前述技术问题的一种视频解码方法包括从第一数据单元头获得指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志,其中,第一数据单元头包括构成在比特流中包括的视频的第一数据单元的编码信息;基于第一数据单元并行处理标志来确定第一数据单元中是否包括可并行处理数据;当确定第一数据单元中包括可并行处理数据时,从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志,其中,第二数据单元的级别低于第一数据单元的级别。0036根据本发明。

17、的实施例的一种视频解码设备包括并行处理信息获得器,从第一数据单元头获得指示构成在比特流中包括的视频的第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志,当基于第一数据单元并行处理标志确定第一数据单元中包括可并行处理数据时,从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志,其中,第一数据单元头包括第一数据单元的编码信息,第二数据单元的级别低于第一数据单元的级别;并行处理确定器,基于获得的第一数据单元并行处理标志和获得的第二数据单元并行处理标志来确定视频中包括的可并行处理数据单元。说明书CN104205848A3/21页。

18、60037根据本发明的实施例的一种视频编码方法包括获得构成视频的第一数据单元和第二数据单元的编码数据,其中,第二数据单元的级别低于第一数据单元的级别;对指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志进行编码,并将编码后的第一数据单元并行处理标志输出到包括第一数据单元的编码信息的第一数据单元头;当第一数据单元中包括可并行处理数据时,对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码,并将编码后的第二数据单元并行处理标志输出到第二数据单元头。0038根据本发明的实施例的一种视频编码设备包括并行处理确定器,获得构成视频的第一数据单元和第二数据单元的编码数。

19、据,并确定第一数据单元和第二数据单元中是否包括可并行处理数据,其中,第二数据单元的级别低于第一数据单元的级别;并行处理信息输出单元,对指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志进行编码,并将编码后的第一数据单元并行处理标志输出到包括第一数据单元的编码信息的第一数据单元头,当第一数据单元中包括可并行处理数据时,对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码,并将编码后的第二数据单元并行处理标志输出到第二数据单元头。具体实施方式0039现在将参照附图更充分地解释本发明,其中,本发明的示例性实施例在附图中示出。0040将参照图1至图13解释根据本。

20、发明的实施例的基于在空间上分层的数据单元的视频编码和视频解码。将参照图14至图27解释根据本发明的实施例的使用用于并行处理的统一语法的视频编码和视频解码。0041图1是示出根据本发明的实施例的视频编码设备100的框图。0042视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元130。0043最大编码单元划分器110可基于图像的当前画面的最大编码单元划分当前画面。如果当前画面大于最大编码单元,则可将当前画面的图像数据划分为至少一个最大编码单元。根据实施例的最大编码单元可以是尺寸为3232、6464、128128、256256等的数据单元,其中,数据单元的形状是宽度和长。

21、度为2的若干次方的正方形。图像数据可根据至少一个最大编码单元被输出到编码单元确定器120。0044根据实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元空间被划分的次数,并且随着深度加深,根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度,最小编码单元的深度为最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。0045如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。。

22、由于根据深度对根据实施例的最大编码单元进行划分,因此可根据深度分层地对包括在最大编码单元中的空间域的图像数据进行分类。说明书CN104205848A4/21页70046可预先设置编码单元的最大深度和最大尺寸,所述最大深度和最大尺寸限制最大编码单元的高度和宽度被分层划分的总次数。0047编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换言之,编码单元确定器120通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码,并选择具有最小编码误差的深度,来确定编码深度。。

23、确定的编码深度和根据最大编码单元的图像数据被输出到输出单元130。0048基于与等于或小于最大深度的至少一个深度相应的较深层编码单元,对最大编码单元中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对与较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。0049随着编码单元根据深度而被分层地划分,最大编码单元的尺寸被划分并且编码单元的数量增加。另外,即使在一个最大编码单元中编码单元与同一深度相应,仍通过估计每个编码单元的数据的编码误差来确定是否将与同一深度相应的每个编码单元划分为更低深度。因此,即使数据被。

24、包括在一个最大编码单元中,在一个最大编码单元中编码误差根据区域而不同,因此在数据中编码深度可根据区域而不同。因此,可在一个最大编码单元中设置一个或更多个编码深度,并且可根据至少一个编码深度的编码单元来对最大编码单元的数据进行划分。0050因此,根据实施例的编码单元确定器120可确定包括在当前最大编码单元中的具有树结构的编码单元。根据实施例的“具有树结构的编码单元”包括在当前最大编码单元中包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。可根据最大编码单元的相同区域中的深度来分层地确定编码深度的编码单元,并可在不同区域中独立地确定编码深度的编码单元。类似地,可从另一区域的编码深度。

25、独立地确定当前区域中的编码深度。0051根据实施例的最大深度是与从最大编码单元到最小编码单元所执行划分的次数有关的索引。根据实施例的第一最大深度可表示从最大编码单元到最小编码单元所执行的划分的总次数。根据实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如,当最大编码单元的深度是0时,对最大编码单元划分一次的编码单元的深度可被设置为1,对最大编码单元划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是对最大编码单元划分四次的编码单元,则存在深度0、1、2、3和4的5个深度等级,并因此第一最大深度可被设置为4,第二最大深度可被设置为5。0052可根据最大编码单元。

26、执行预测编码和频率变换。还根据最大编码单元,基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和频率变换。0053由于每当根据深度对最大编码单元进行划分时,较深层编码单元的数量增加,因此将对随着深度加深而产生的所有较深层编码单元执行包括预测编码和频率变换的编码。为了便于解释,在至少一个最大编码单元中,现在将基于当前深度的编码单元来解释预测编码和频率变换。0054根据实施例的视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、频率变换和熵编码的说明书CN104205848A5/21页8操作,此时,可针对所有操作使用相同。

27、的数据单元,或者可针对每个操作使用不同的数据单元。0055例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。0056为了在最大编码单元中执行预测编码,可基于与编码深度相应的编码单元即,基于不再被划分为与更低深度相应的编码单元的编码单元来执行预测编码。以下,不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元获得的分区可包括预测单元以及通过对预测单元的高度和宽度中的至少一个进行划分而获得的数据单元。0057例如,当尺寸为2N2N其中,N是正整数的编码单元不再被划分,并。

28、且成为尺寸为2N2N的预测单元时,分区的尺寸可以是2N2N、2NN、N2N或NN。根据实施例的分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分诸如,1N或N1而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。0058预测单元的预测模式可以是从帧内模式、帧间模式和跳过模式中选择的至少一个。例如,可对尺寸为2N2N、2NN、N2N或NN的分区执行帧内模式或帧间模式。另外,可仅对尺寸为2N2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。0059视。

29、频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元,来对编码单元中的图像数据执行频率变换。0060为了在编码单元中执行频率变换,可基于具有小于或等于编码单元的尺寸的数据单元来执行频率变换。例如,用于变换的数据单元可包括帧内模式的数据单元和帧间模式的数据单元。0061现在将用作频率变换的基础的数据单元称为“变换单元”。类似于编码单元,编码单元中的变换单元可被递归地划分为更小尺寸的区域,因此可基于根据变换深度的具有树结构的变换单元,对编码单元中的残差数据进行划分。0062还可在变换单元中设置变换深度,其中,变换深度表示通过对编码单元的高度和宽度进行划分以达到。

30、变换单元所执行的划分的次数。例如,在尺寸为2N2N的当前编码单元中,当变换单元的尺寸是2N2N时,变换深度可以是0,当变换单元的尺寸是NN时,变换深度可以是1,当变换单元的尺寸是N/2N/2时,变换深度可以是2。也就是说,还可根据变换深度设置具有树结构的变换单元。0063根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需要关于与预测编码和频率变换相关的信息的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式和用于频率变换的变换单元的尺寸。0064以下将参照图3至图12详细解释根据实施例的最大编码单元中的具有。

31、树结构的编码单元以及确定分区的方法。0065编码单元确定器120可通过使用基于拉格朗日乘数的率失真RD优化,来测量根据深度的较深层编码单元的编码误差。说明书CN104205848A6/21页90066输出单元130在比特流中输出最大编码单元的图像数据和关于根据编码深度的编码模式的信息,其中,所述最大编码单元的图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。0067可通过对图像的残差数据进行编码来获得编码图像数据。0068关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于在预测单元中的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。0069可通过使用根据。

32、深度的划分信息来定义关于编码深度的信息,其中,根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则对当前编码单元中的图像数据进行编码并输出,因此可定义划分信息以不将当前编码单元划分到更低深度。可选地,如果当前编码单元的当前深度不是编码深度,则必需对更低深度的编码单元执行编码,并因此可定义划分信息以对当前编码单元进行划分来获得更低深度的编码单元。0070如果当前深度不是编码深度,则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复执行编码,并因此可。

33、对具有相同深度的编码单元递归地执行编码。0071由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编码单元确定关于至少一个编码模式的信息,所以可针对一个最大编码单元确定关于至少一个编码模式的信息。另外,由于根据深度对图像数据进行分层划分,因此最大编码单元的数据的编码深度可根据位置而不同,因此可针对数据设置关于编码深度和编码模式的信息。0072因此,输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。0073根据实施例的最小单元是通过将构成最低深度的最小编码单元划分为4份而获得的矩形数据单元。可选择地,最。

34、小单元可以是可包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大矩形数据单元。0074例如,通过输出单元130输出的编码信息可被分类为根据编码单元的编码信息和根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。此外,根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头。0075根据视频编码设备100的最简单实施。

35、例,较深层编码单元是通过将更高深度的编码单元更高一层的高度或宽度划分成两份而获得的编码单元。换言之,当当前深度的编码单元的尺寸是2N2N时,更低深度的编码单元的尺寸是NN。另外,尺寸为2N2N的具有当前深度的编码单元可包括最多4个所述更低深度的尺寸为NN的编码单元。0076因此,根据实施例的视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度,通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外,由于可通过使用各种预测模式和频率变换中的任意一个对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的图像说明书CN10420。

36、5848A7/21页10特征来确定最优编码模式。0077因此,如果以传统宏块对具有非常高的分辨率或大数据量的图像进行编码,则每个画面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩的信息,并且数据压缩效率降低。然而,通过使用根据实施例的视频编码设备100,由于考虑图像的特征来调整编码单元,并且考虑图像的尺寸来增加编码单元的最大尺寸,因此可提高图像压缩效率。0078图2是示出根据本发明的实施例的视频解码设备200的框图。0079根据实施例的视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据解码器230。用于根据实施例的视频解码设备200。

37、的各种操作的各种术语诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息的定义与参照图1和视频编码设备100解释的定义相同。0080接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流,针对每个编码单元提取编码图像数据,并将提取的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头提取关于当前画面的编码单元的最大尺寸的信息。0081另外,图像数据和编码信息提取器220从解析的比特流,根据每个最大编码单元,提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编。

38、码深度和编码模式的信息被输出到图像数据解码器230。换言之,比特流中的图像数据被划分为最大编码单元,使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。0082可针对关于与编码深度相应的至少一个编码单元的信息设置关于根据最大编码单元的编码深度和编码模式的信息,关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外,根据深度的划分信息可被提取为关于编码深度的信息。0083关于由图像数据和编码信息提取器220提取的根据每个最大编码单元的编码深度和编码模式的信息是关于在以下情况下被确定为产生最小编码误差的编码深度和编码。

39、模式的信息,即,在编码器诸如,视频编码设备100根据最大编码单元对根据深度的每个较深层编码单元重复地执行编码的时候。因此,视频解码设备200可通过根据产生最小编码误差的编码方法对数据进行解码来恢复图像。0084由于关于根据实施例的编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单元,提取关于编码深度和编码模式的信息。当关于相应最大编码单元的编码深度和编码模式的信息根据预定数据单元被编写时,可将具有相同的关于编码深度和编码模式的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。0085图像数据解。

40、码器230基于关于根据最大编码单元的编码深度和编码模式的信息,通过对每个最大编码单元中的图像数据进行解码,来恢复当前画面。换言之,图像数据解码器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息,对编码的图像数据进行解码。解码处理可包括预测包含帧内预测和运动补偿和逆频率变换。0086图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类说明书CN104205848A108/21页11型和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。0087此外,图像数据解码器230可基于关于根。

41、据深度的编码单元的变换单元的尺寸的信息,根据编码单元中的每个变换单元执行逆频率变换,以根据最大编码单元执行逆频率变换。0088图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是编码深度。因此,图像数据解码器230可通过使用关于与编码深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息,对当前最大编码单元中的与编码深度相应的编码单元的图像数据进行解码。0089换言之,可通过观察针对编码单元、预测单元和最小单元中的预定数据单元设置的编码信息集来收集包含包括相同划分信息的编码信息的数据单。

42、元,并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。0090根据实施例的视频解码设备200可获得关于当对每个最大编码单元迭代地执行编码时产生最小编码误差的编码单元的信息,并使用所述信息来对当前画面进行解码。换言之,可对在每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元进行解码。0091因此,即使图像数据具有高分辨率和过大数据量,也可通过使用编码单元的尺寸和编码模式,有效地对图像数据进行解码和恢复,其中,通过使用从编码器接收到的关于最优编码模式的信息,根据图像的特征自适应地确定所述编码单元的尺寸和编码模式。0092现在将参照图3至图13解释根。

43、据本发明的实施例的确定具有树结构的编码单元、预测单元和变换单元的方法。0093图3是用于解释根据本发明的实施例的分层编码单元的构思的视图。0094编码单元的尺寸可被表示为宽度高度,并可以是6464、3232、1616和88。尺寸为6464的编码单元可被划分为尺寸为6464、6432、3264或3232的分区,尺寸为3232的编码单元可被划分为尺寸为3232、3216、1632或1616的分区,尺寸为1616的编码单元可被划分为尺寸为1616、168、816或88的分区,尺寸为88的编码单元可被划分为尺寸为88、84、48或44的分区。0095在视频数据310中,分辨率是19201080,编码单。

44、元的最大尺寸是64,最大深度是2。在视频数据320中,分辨率是19201080,编码单元的最大尺寸是64,最大深度是3。在视频数据330中,分辨率是352288,编码单元的最大尺寸是16,最大深度是1。图3中示出的最大深度表示从最大编码单元到最小编码单元的划分总次数。0096如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可被选为64。0097由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度加深至两层,因此视频数据310的编码单元315。

45、可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。同时,由于视频数据330的最大深度是1,因此由于通过对最大编码单元划分一次,深度增加至一层,因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。说明书CN104205848A119/21页120098由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度增加至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深,详细信息可被精确地表示。0099图4是示出根据本发明的实施例的基于编码单元的图像编码。

46、器400的框图。0100根据实施例的图像编码器400执行视频编码设备100的编码单元确定器120的操作来对图像数据进行编码。换言之,帧内预测器410在帧内模式下对当前帧405中的编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495,在帧间模式下对编码单元执行帧间估计和运动补偿。0101从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过频率变换器430和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆频率变换器470被恢复为空间域中的数据,恢复的空间域中的数据在通过去块单元480和环路滤波单元490后处理之后被输。

47、出为参考帧495。量化后的变换系数可通过熵编码器450被输出为比特流455。0102为了将图像编码器400应用到根据实施例的视频编码设备100中,图像编码器400的所有元件即,帧内预测器410、运动估计器420、运动补偿器425、频率变换器430、量化器440、熵编码器450、反量化器460、逆频率变换器470、去块单元480和环路滤波单元490必需考虑每个最大编码单元的最大深度,基于具有树结构的编码单元中的每个编码单元执行操作。0103具体地,帧内预测器410、运动估计器420和运动补偿器425考虑当前最大编码单元的最大尺寸和最大深度来确定具有树结构的编码单元中的每个编码单元的分区和预测模式。

48、,频率变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。0104图5是根据本发明的实施例的基于编码单元的图像解码器500的框图。0105解析器510从比特流505解析将被解码的编码图像数据和解码所需的关于编码的信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据,反量化的数据通过逆频率变换器540被恢复为空间域中的图像数据。0106针对空间域中的图像数据,帧内预测器550在帧内模式下对编码单元执行帧内预测,运动补偿器560通过使用参考帧585在帧间模式下对编码单元执行运动补偿。0107通过帧内预测器550和运动补偿器560的空间域中的数据可在通过去块单。

49、元570和环路滤波单元580后处理之后被输出为恢复帧595。另外,通过去块单元570和环路滤波单元580后处理的数据可被输出为参考帧585。0108为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,根据实施例的图像解码器500可执行在解析器510的操作被执行之后执行的操作。0109为了将图像解码器500应用到根据实施例的视频解码设备200中,图像解码器500的所有元件即,解析器510、熵解码器520、反量化器530、逆频率变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580需针对每个最大编码单元基于具有树结构的编码单元执行操作。0110具体地,。

50、帧内预测器550和运动补偿器560针对具有树结构的每个编码单元确定分区和预测模式,逆频率变换器540针对每个编码单元确定变换单元的尺寸。说明书CN104205848A1210/21页130111图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。0112根据实施例的视频编码设备100和根据实施例的视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。0113在根据实施例的编码单元的分层结。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 >


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1