用于高效率视频译码的统一分割结构和信令方法.pdf

上传人:大师****2 文档编号:663102 上传时间:2018-03-02 格式:PDF 页数:20 大小:3.49MB
返回 下载 相关 举报
摘要
申请专利号:

CN201280058881.1

申请日:

2012.11.29

公开号:

CN104126303A

公开日:

2014.10.29

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):H04N 19/119申请日:20121129|||公开

IPC分类号:

H04N19/119(2014.01)I; H04N19/13(2014.01)I; H04N19/463(2014.01)I; H04N19/70(2014.01)I; H04N19/176(2014.01)I; H04N19/159(2014.01)I; H04N19/61(2014.01)I; H04N19/60(2014.01)I

主分类号:

H04N19/119

申请人:

华为技术有限公司

发明人:

杨海涛; 高文; 于浩平

地址:

518129 广东省深圳市龙岗区坂田华为总部办公楼

优先权:

2011.11.29 US 61/564,685

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

一种用于视频译码的方法包括经由一串位用信号通知译码单元的预测模式和分区模式,其中所述串中的一个位指示所述译码单元的分区大小是否等效于所述整个译码单元,且所述串中的另一位指示所述译码单元分区是水平带还是垂直带,且其中,当所述译码单元的切片类型是预测或双向预测时,所述串中的一个位指示所述预测类型是帧内还是帧间。

权利要求书

1.  一种视频编解码器,其包括:
处理器,其用于针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分区模式,其中该组分区模式包含至少一个非正方形分区。

2.
  根据权利要求1所述的视频编解码器,其特征在于该组分区模式包含:第一分区模式,其由具有2N×2N的大小的一个分区组成;第二分区模式,其由各自具有2N×N的大小的两个分区组成;第三分区模式,其由各自具有N×2N的大小的两个分区组成;第四分区模式,其由各自具有N×N的大小的四个分区组成;第五分区模式,其由两个分区组成,第一分区具有2N×(N/2)的大小且第二分区具有2N×(3N/2)的大小;第六分区模式,其由两个分区组成,第一分区具有2N×(3N/2)的大小且第二分区具有2N×(N/2)的大小;第七分区模式,其由两个分区组成,第一分区具有(N/2)×2N的大小且第二分区具有(3N/2)×2N的大小;以及第八分区模式,其由两个分区组成,第一分区具有(3N/2)×2N的大小且第二分区具有(N/2)×2N的大小,且其中2N×2N的大小等效于整个译码单元,其中所述大小的在“×”符号之前的部分指示分区的宽度,且所述大小的在“×”符号之后的部分指示分区的高度。

3.
  根据权利要求1所述的视频编解码器,其特征在于该组分区模式包含:第一分区模式,其由具有2N×2N的大小的一个分区组成;第二分区模式,其由各自具有2N×N的大小的两个分区组成;第三分区模式,其由各自具有N×2N的大小的两个分区组成;以及第四分区模式,其由各自具有N×N的大小的四个分区组成,且其中2N×2N的大小等效于整个译码单元,其中所述大小的在“×”符号之前的部分指示分区的宽度,且所述大小的在“×”符号之后的部分指示分区的高度。

4.
  根据权利要求1所述的视频编解码器,其特征在于该组分区模式包 含:第一分区模式,其由具有2N×2N的大小的一个分区组成;第二分区模式,其由各自具有2N×N的大小的两个分区组成;第三分区模式,其由各自具有N×2N的大小的两个分区组成;第四分区模式,其由各自具有N×N的大小的四个分区组成;第五分区模式,其由各自具有2N×(N/2)的大小的四个分区组成;以及第六分区模式,其由各自具有(N/2)×2N的大小的四个分区组成,且其中2N×2N的大小等效于整个译码单元,其中所述大小的在“×”符号之前的部分指示分区的宽度,且所述大小的在“×”符号之后的部分指示分区的高度。

5.
  根据权利要求1所述的视频编解码器,其特征在于经由一串位用信号通知译码单元的预测模式和分区模式,且其中所述串中的一个位指示所述译码单元的分区大小是否等效于所述整个译码单元,且所述串中的另一位指示所述译码单元分区是水平带还是垂直带,且其中,当所述译码单元的切片类型是预测或双向预测时,所述串中的一个位指示所述预测类型是帧内还是帧间。

6.
  根据权利要求5所述的视频编解码器,其特征在于在所述译码单元被分割为两个分区时,所述串中的另一位指示所述两个分区是否具有相同大小,在所述译码单元被分割为不同大小的两个分区的情况下,所述串中的另一位指示较小的分区的位置,且在所述译码单元分区是水平带或垂直带时,所述串中的另一位指示所述相同大小的所述分区的数目是2还是4。

7.
  根据权利要求1所述的视频编解码器,其中变换单元分区的大小是由译码单元分区的大小隐式地指示。

8.
  一种用于视频译码的方法,其包括:
经由一串位用信号通知译码单元的预测模式和分区模式,其中所述串中的一个位指示所述译码单元的分区大小是否等效于所述整个译码单元,且所述串中的另一位指示所述译码单元分区是水平带还是垂直带,且其中,当所述译码单元的切片类型是预测或双向预测时,所述串中的一个位 指示所述预测类型是帧内还是帧间。

9.
  根据权利要求8所述的方法,其特征在于在所述译码单元被分割为两个分区时,所述串中的另一位指示所述两个分区是否具有相同大小,在所述译码单元被分割为不同大小的两个分区的情况下,所述串中的另一位指示较小的分区的位置,且在所述译码单元分区是水平带或垂直带时,所述串中的另一位指示所述相同大小的所述分区的数目是2还是4。

10.
  根据权利要求8所述的方法,其进一步包括针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分区模式,其中该组分区模式包含至少一个非正方形分区。

11.
  根据权利要求10所述的方法,其特征在于该组分区模式包含:第一分区模式,其由具有2N×2N的大小的一个分区组成;第二分区模式,其由各自具有2N×N的大小的两个分区组成;第三分区模式,其由各自具有N×2N的大小的两个分区组成;第四分区模式,其由各自具有N×N的大小的四个分区组成;第五分区模式,其由两个分区组成,第一分区具有2N×(N/2)的大小且第二分区具有2N×(3N/2)的大小;第六分区模式,其由两个分区组成,第一分区具有2N×(3N/2)的大小且第二分区具有2N×(N/2)的大小;第七分区模式,其由两个分区组成,第一分区具有(N/2)×2N的大小且第二分区具有(3N/2)×2N的大小;以及第八分区模式,其由两个分区组成,第一分区具有(3N/2)×2N的大小且第二分区具有(N/2)×2N的大小,且其中2N×2N的大小等效于整个译码单元,其中所述大小的在“×”符号之前的部分指示分区的宽度,且所述大小的在“×”符号之后的部分指示分区的高度。

12.
  根据权利要求11所述的方法,其特征在于所述第一分区模式指示各自具有N×N的大小的四个变换单元分区,所述第二分区模式指示各自具有2N×(N/2)的大小的四个变换单元分区,所述第三分区模式指示各自具有(N/2)×2N的大小的四个变换单元分区,所述第四分区模式指示各自具有 N×N的大小的四个变换单元分区,所述第五分区模式指示各自具有2N×(N/2)的大小的四个变换单元分区,所述第六分区模式指示各自具有2N×(N/2)的大小的四个变换单元分区,所述第七分区模式指示各自具有(N/2)×2N的大小的四个变换单元分区,且所述第八分区模式指示各自具有(N/2)×2N的大小的四个变换单元分区。

13.
  根据权利要求10所述的方法,其特征在于该组分区模式包含:第一分区模式,其由具有2N×2N的大小的一个分区组成;第二分区模式,其由各自具有2N×N的大小的两个分区组成;第三分区模式,其由各自具有N×2N的大小的两个分区组成;以及第四分区模式,其由各自具有N×N的大小的四个分区组成,且其中2N×2N的大小等效于整个译码单元,其中所述大小的在“×”符号之前的部分指示分区的宽度,且所述大小的在“×”符号之后的部分指示分区的高度。

14.
  根据权利要求13所述的方法,其特征在于所述第一分区模式指示各自具有N×N的大小的四个变换单元分区,所述第二分区模式指示各自具有2N×(N/2)的大小的四个变换单元分区,所述第三分区模式指示各自具有(N/2)×2N的大小的四个变换单元分区,且所述第四分区模式指示各自具有N×N的大小的四个变换单元分区。

15.
  根据权利要求10所述的方法,其特征在于该组分区模式包含:第一分区模式,其由具有2N×2N的大小的一个分区组成;第二分区模式,其由各自具有2N×N的大小的两个分区组成;第三分区模式,其由各自具有N×2N的大小的两个分区组成;第四分区模式,其由各自具有N×N的大小的四个分区组成;第五分区模式,其由各自具有2N×(N/2)的大小的四个分区组成;以及第六分区模式,其由各自具有(N/2)×2N的大小的四个分区组成,且其中2N×2N的大小等效于整个译码单元,其中所述大小的在“×”符号之前的部分指示分区的宽度,且所述大小的在“×”符号之后的部分指示分区的高度。

16.
  根据权利要求15所述的方法,其特征在于所述第一分区模式指示各自具有N×N的大小的四个变换单元分区,所述第二分区模式指示各自具有2N×(N/2)的大小的四个变换单元分区,所述第三分区模式指示各自具有(N/2)×2N的大小的四个变换单元分区,所述第四分区模式指示各自具有N×N的大小的四个变换单元分区,所述第五分区模式指示各自具有2N×(N/2)的大小的四个变换单元分区,且所述第六分区模式指示各自具有(N/2)×2N的大小的四个变换单元分区。

17.
  一种设备,其包括:
处理器,其用于针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分区模式对视频进行编码,其中变换单元分区的大小是由译码单元分区的大小来隐式地指示;以及
发射机,其耦合到所述处理器,其中所述发射机用于将经编码的视频发射到另一设备。

18.
  根据权利要求17所述的设备,其特征在于该组分区模式包含至少一个非正方形分区。

19.
  根据权利要求18所述的设备,其特征在于该组分区模式包含:第一分区模式,其由具有2N×2N的大小的一个分区组成;第二分区模式,其由各自具有2N×N的大小的两个分区组成;第三分区模式,其由各自具有N×2N的大小的两个分区组成;第四分区模式,其由各自具有N×N的大小的四个分区组成;第五分区模式,其由两个分区组成,第一分区具有2N×(N/2)的大小且第二分区具有2N×(3N/2)的大小;第六分区模式,其由两个分区组成,第一分区具有2N×(3N/2)的大小且第二分区具有2N×(N/2)的大小;第七分区模式,其由两个分区组成,第一分区具有(N/2)×2N的大小且第二分区具有(3N/2)×2N的大小;以及第八分区模式,其由两个分区组成,第一分区具有(3N/2)×2N的大小且第二分区具有(N/2)×2N的大小, 且其中2N×2N的大小等效于整个译码单元,其中所述大小的在“×”符号之前的部分指示分区的宽度,且所述大小的在“×”符号之后的部分指示分区的高度。

20.
  根据权利要求19所述的设备,其特征在于所述第一分区模式指示各自具有N×N的大小的四个变换单元分区,所述第二分区模式指示各自具有2N×(N/2)的大小的四个变换单元分区,所述第三分区模式指示各自具有(N/2)×2N的大小的四个变换单元分区,所述第四分区模式指示各自具有N×N的大小的四个变换单元分区,所述第五分区模式指示各自具有2N×(N/2)的大小的四个变换单元分区,所述第六分区模式指示各自具有2N×(N/2)的大小的四个变换单元分区,所述第七分区模式指示各自具有(N/2)×2N的大小的四个变换单元分区,且所述第八分区模式指示各自具有(N/2)×2N的大小的四个变换单元分区。

21.
  根据权利要求18所述的设备,其特征在于该组分区模式包含:第一分区模式,其由具有2N×2N的大小的一个分区组成;第二分区模式,其由各自具有2N×N的大小的两个分区组成;第三分区模式,其由各自具有N×2N的大小的两个分区组成;以及第四分区模式,其由各自具有N×N的大小的四个分区组成,且其中2N×2N的大小等效于整个译码单元,其中所述大小的在“×”符号之前的部分指示分区的宽度,且所述大小的在“×”符号之后的部分指示分区的高度。

22.
  根据权利要求21所述的设备,其特征在于所述第一分区模式指示各自具有N×N的大小的四个变换单元分区,所述第二分区模式指示各自具有2N×(N/2)的大小的四个变换单元分区,所述第三分区模式指示各自具有(N/2)×2N的大小的四个变换单元分区,且所述第四分区模式指示各自具有N×N的大小的四个变换单元分区。

23.
  根据权利要求18所述的设备,其特征在于该组分区模式包含:第一分区模式,其由具有2N×2N的大小的一个分区组成;第二分区模式, 其由各自具有2N×N的大小的两个分区组成;第三分区模式,其由各自具有N×2N的大小的两个分区组成;第四分区模式,其由各自具有N×N的大小的四个分区组成;第五分区模式,其由各自具有2N×(N/2)的大小的四个分区组成;以及第六分区模式,其由各自具有(N/2)×2N的大小的四个分区组成,且其中2N×2N的大小等效于整个译码单元,其中所述大小的在“×”符号之前的部分指示分区的宽度,且所述大小的在“×”符号之后的部分指示分区的高度。

24.
  根据权利要求23所述的设备,其特征在于所述第一分区模式指示各自具有N×N的大小的四个变换单元分区,所述第二分区模式指示各自具有2N×(N/2)的大小的四个变换单元分区,所述第三分区模式指示各自具有(N/2)×2N的大小的四个变换单元分区,所述第四分区模式指示各自具有N×N的大小的四个变换单元分区,所述第五分区模式指示各自具有2N×(N/2)的大小的四个变换单元分区,且所述第六分区模式指示各自具有(N/2)×2N的大小的四个变换单元分区。

25.
  根据权利要求18所述的设备,其特征在于经由一串位用信号通知译码单元的预测模式和分区模式,其中所述串中的一个位指示所述译码单元的分区大小是否等效于所述整个译码单元,所述串中的另一位指示所述译码单元分区是水平带还是垂直带,在所述译码单元被分割为两个分区时,所述串中的另一位指示所述两个分区是否具有相同大小,在所述译码单元被分割为不同大小的两个分区的情况下,所述串中的另一位指示较小的分区的位置,且在所述译码单元分区是水平带或垂直带时,所述串中的另一位指示所述相同大小的所述分区的数目是2还是4,且其中,当所述译码单元的切片类型是预测或双向预测时,所述串中的一个位指示所述预测类型是帧内还是帧间。

说明书

用于高效率视频译码的统一分割结构和信令方法
相关申请案的交叉参考
本申请案要求杨海涛(Haitao Yang)等人于2011年11月29日申请的发明名称为“用于高效率视频译码的统一分割结构和信令方法(Unified Partitioning Structures and Signaling Methods for High Efficiency Video Coding)”的第61/564,685号美国临时专利申请案的优先权,所述申请案以全文引用的方式并入本文中。
关于联邦赞助的研究或开发的声明
不适用
对缩微胶片附录的参考
不适用
技术领域

背景技术
即使是叙述相对短的影片所需的视频数据的量也可能相当大,这可能导致难以经由带宽容量有限的通信网络流式传输或以其他方式传送数据。因此,视频数据一般要经过压缩,随后才经由如今的电信网络进行传送。视频压缩装置常常在源处使用软件和/或硬件对视频数据进行译码,然后进行传输,从而减少表示数字视频图像所需的数据量。随后通过视频解压缩装置在目的地处接收经压缩的数据,视频解压缩装置对所述视频数据进行解码。在网络资源有限且对更高视频质量的需求日益增长的情况下,能提高压缩比但又很少甚至没有牺牲图像质量的压缩和解压缩技术是所希望的。
发明内容
在一个实施例中,本发明包含一种视频编解码器,所述视频编解码器包括处理器,所述处理器用于针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分区模式,其中该组分区模式包含至少一个非正方形分区。
在另一实施例中,本发明包含一种用于视频译码的方法,所述方法包括经由一串位用信号通知译码单元的预测模式和分区模式,其中所述串中的一个位指示译码单元的分区大小是否等效于整个译码单元,且所述串中的另一位指示译码单元分区是水平带还是垂直带,且其中,当译码单元的切片类型是预测或双向预测时,所述串中的一个位指示预测类型是帧内还是帧间。
在又一实施例中,本发明包含一种包括处理器和发射器的设备。所述处理器用于针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分区模式来对视频进行编码,其中变换单元分区的大小是由译码单元分区的大小隐式地指示。所述发射器耦合到所述处理器且用于将经编码的视频发射到另一设备。
从结合附图和权利要求书进行的以下详细描述将更清楚地理解这些和其他特征。
附图说明
为了更完整地理解本发明,现在参考以下结合附图和详细描述进行的简要描述,其中相同参考标号表示相同部分。
图1是编码方案的实施例的示意图。
图2是解码方案的实施例的示意图。
图3是视频译码的方法的示意图。
图4是计算机系统的示意图。
具体实施方式
一开头应理解,尽管下文提供一个或多个实施例的说明性实施方 案,但可使用任何数目的技术,不管是当前已知还是现有的,来实施所揭示的系统和/或方法。本发明决不应限于下文所说明的说明性实施方案、图式和技术,包含本文所说明并描述的示范性设计和实施方案,而是可在所附权利要求书的范围以及其均等物的完整范围内进行修改。
视频媒体可涉及相对快地连续显示静态图像或帧的序列,进而让观看者感觉到运动。每一帧可包括多个图片样本或像素,其中的每一图片样本或像素可表示帧中的单个参考点。在数字处理期间,可向每一像素指派一个整数值(例如,0、1,…,或255),所述整数值表示对应的参考点处的图像质量或特性,例如亮度(亮度或Y)或色度(色度包含U和V)。在使用中,图像或视频帧可包括大量像素(例如,1920×1080帧中的2,073,600个像素),因此独立地编码和解码(下文简称为译码)每一像素可为繁琐和低效的。为了提高译码效率,通常将视频帧分解为多个矩形块或宏块,所述矩形块或宏块可用作例如预测、变换和量化等处理的基本单元。例如,典型的N×N块可包括N2个像素,其中N是整数且常常是4的倍数。
在由国际电信联盟(ITU)电信标准化部门(ITU-T)和国际标准化组织(ISO)/国际电工技术委员会(IEC)颁布并且将成为未来的视频标准的高效率视频译码(HEVC)的工作草案中,已经引入新的块概念。例如,译码单元(CU)可指代将视频帧再分割为相等或可变大小的方块。在HEVC中,CU可取代先前标准中的宏块结构。取决于帧间预测(inter-frame prediction)(简称为帧间预测(inter prediction))或帧内预测(intra-frame prediction)(简称为帧内预测(intra prediction))的模式,CU可包括一个或多个预测单元(PU),每个预测单元可用作预测的基本单元。例如,对于帧内预测,64×64CU可被对称地分裂为四个32×32PU。作为另一实例,对于帧间预测,64×64CU可被非对称地分裂为16×64预测单元(PU)和48×64PU。类似地,PU可包括一个或多个变换单元(TU),每个变换单元可用作变换和/或量化的基本单元。例如,32×32PU可被对 称地分裂为四个16×16TU。一个PU的多个TU可共享同一预测模式,但可单独地进行变换。本文中,术语块可一般指代宏块、CU、PU或TU中的任一者。
可使连续的视频帧或切片大体上相关,使得帧中的块与先前经译码帧中的对应块大体上没有变化。帧间预测可利用帧序列中的时间冗余,例如连续帧的对应块之间的类似性,来减少压缩数据。在帧间预测中,可实施运动补偿算法,以基于根据编码次序在当前帧前面的一个或多个参考帧中的对应块来计算当前帧中的当前块的运动向量。
类似地,在一个视频帧内,像素可与同一帧内的其他像素相关,使得一个块内或一些块间的像素值可仅有略微变化且/或展现出重复性纹理。为了利用同一帧中的相邻块之间的空间相关性,可通过视频编码器/解码器(编解码器)实施帧内预测以从一个或多个先前译码的相邻块内插预测块(或经预测块),进而产生当前块的估计。编码器和解码器可独立地内插预测块,进而使得能够通过传送相对少量的参考块(例如,位于帧的左上角(以及从左上角延伸)的块)来重建帧和/或图像的大部分。
为了利用这些译码效率,视频/图像译码标准可通过在帧内预测期间利用多个预测模式来提高预测准确度,其中每个预测模式可产生唯一纹理。在帧内预测之后,编码器可计算预测块与原始块之间的差值(例如,通过从原始块减去预测块),从而产生残余块。由于表示残余块所需的数据量通常可能小于表示原始块所需的数据量,因此可编码残余块而不是原始块以实现更高的压缩比。在现有的HEVC软件模型(HM)中,可将空间域中的残余块的预测残差转换为频域中的变换矩阵的变换系数。可通过二维变换,例如与离散余弦变换(DCT)很类似或相同的变换,来实现所述转换。在变换矩阵中,例如对应于具有低空间频率分量的大空间特征的低索引变换系数(例如,在左上部分中)可具有相对高的量值,而例如对应于具有高空间频率分量的小空间特征的高索引变换系数(例如,在右下 部分中)可具有相对小的量值。
可由编码器接收包括视频帧(或切片)序列的输入视频。本文中,帧可指代经预测帧(P帧)、经帧间译码帧(I帧)或双向预测帧(B帧)中的任一者。同样,切片可指代P切片、I切片或B切片中的任一者。在I切片中,所有块都被帧内译码。在P切片或B切片中,块可被帧内译码或帧间译码。使用单个参考块来对P切片进行预测。对于B切片,基于来自两个可能不同的参考帧的两个块来进行预测,且将来自两个参考块的预测进行组合。
图1说明可在视频编码器中实施的编码方案100的实施例。编码方案100可包括RDO模块110、预测模块120、变换模块125、量化模块130、熵编码器140、解量化模块150、反变换模块155,和重建模块160。
编码方案100可实施于视频编码器中,所述视频编码器可接收包括视频帧序列的输入视频。RDO模块110可用于控制其他模块中的一者或一者以上。基于由RDO模块110作出的逻辑决策,预测模块120可利用参考像素来产生当前块的预测像素。可从当前块中的对应原始像素减去每一预测像素,进而产生残余像素。在已经计算出所有残余像素而获得残余块之后,残余块可经历变换模块125且随后经历量化模块130。可更改残差值的标度,例如每一残差值可除以因子5。结果,一些非零残差值可被转换为零残差值(例如,小于某一阈值的值可被视为零)。
图2说明可在视频解码器中实施的解码方案200的实施例。解码方案200可对应于编码方案100,且可包括熵解码器210、解量化模块220、反变换模块225、预测模块230和重建模块240,如图2所示般布置。在操作中,可由熵解码器210接收含有视频帧序列的信息的经编码位流,熵解码器210可将所述位流解码为未压缩的格式。可通过熵解码器210对非零经量化经编码残差值进行解码。
对于正被解码的当前块,可在执行熵解码器210之后产生残余块。 为了将每一非零经量化残余像素恰当地放置到残余块中,可使用由熵解码器210解码的全有效图。随后,可将经量化的残差值馈送到解量化模块220中,解量化模块220可恢复残差值的标度(例如,使每一残差值乘以因子5)。随后可将经量化的残差值馈送到反变换模块225中。应注意,在量化和解量化之后,残差值可能未完全恢复到其原始值,因此在译码过程中可能会发生一些信息损失。
另外,还可通过熵解码器210对含有预测模式的信息进行解码。基于预测模式,预测模块230可产生预测块。如果经解码的预测模式是帧间模式,那么可使用一个或多个先前经解码的参考帧来产生预测块。如果经解码的预测模式是帧内模式,那么可使用多个先前经解码的参考像素来产生预测块。随后,重建模块240可将残余块与预测块进行组合,从而产生经重建的块。另外,为了促进对视频帧的连续解码,可在参考帧中使用经重建的块来对未来帧进行帧间预测。经重建的块的一些像素还可用作对同一帧中的未来块的帧内预测的参考像素。
如上文所提及,HEVC模型(HM)中的基本译码单元是CU,其类似于H.264/AVC(高级视频译码)标准中的宏块。然而,与宏块不同的是,CU的大小是可变的,并且CU可以具有不同的预测类型:帧内类型或帧间类型。PU是用于向解码器用信号通知预测模式的基本单元。一个CU可具有一个PU或多个PU。TU是变换的基本单元。一个CU可具有一个或多个TU。当前在HEVC工作草案(WD)中,经帧内译码的CU中所支持的PU分区是PART_2N×2N和PART_N×N。经帧间译码的CU中所支持的PU分区是PART_2N×2N、PART_2N×N、PART_N×2N、PART_N×N、PART_2N×nU、PART_2N×nD、PART_nL×2N、PART_nR×2N。
可观察到,可用分区模式对于帧内和帧间是不同的。具体来说,帧内译码仅使用正方形分区,而帧间译码可使用正方形或非正方形分区。归因于用于帧内译码或帧间译码的分区模式的差异,当前可将不同的信令方 法用于经帧内译码的CU和经帧间译码的CU。
在本文中所揭示的实施例中,提供一种统一分割结构。也就是说,将同一组分区模式用于帧内译码和帧间译码,这导致统一分割结构。具体来说,实施例为经帧内译码的CU提供非正方形分区。相应地修改用于分区模式的熵译码并在本文中进行描述。另外,实施例为经帧内译码的CU和经帧间译码的CU提供用信号通知预测和分区信息的一致方法。在所揭示的方案中,从预测类型和PU分区模式得到TU分区模式,因此编码器不需要向解码器明确地用信号通知TU分区模式。可使用HM中的现有方法来进行用于每一PU的预测操作和用于每一TU的变换和熵译码操作。
现在将依次描述与统一分割结构相关的三个方面:用于帧内和帧间译码的统一一组分区模式、用信号通知预测类型和分区模式的方法,以及隐式TU分区模式。
分区模式(下文表示为PartMode)指定CU内的PU分区。在本文中所揭示的分割结构中,在帧内译码和帧间译码两者中使用同一组PartMode。在一个实施例中,一组PartMode可以是{PART_2N;PART_2N×N、PART_N×2N、PART_N×N、PART_2N×nU、PART_2N×nD、PART_nL×2N、PART_nR×2N}。对于这组PartMode,在表1中指定大小(宽度×高度),这表示矩形块的大小。CU的大小是2N×2N。在当前HEVC设计中,N的确切值可以是4、8、16或32,且可以进一步扩展到64或更大。此大小表示法用于描述CU内的一个或多个PU分区的相对大小和形状。
表1


在另一实施例中,该组PartMode可以是{PART_2N×2N、PART_2N×N、PART_N×2N、PART_N×N}。对于这组PartMode,在表2中指定大小(宽度×高度)。
表2

在另一实施例中,该组PartMode可以是{PART_2N×2N、PART_2N×N、PART_N×2N、PART_2N×hN、PART_hN×2N、PART_N×N}。对于这组PartMode,在表3中指定大小(宽度×高度)。
表3

可以注意到,PART_N×N仅用于具有最小大小的CU。
现在将考虑用信号通知预测模式和分区模式的方法。预测模式(下文表示为PredMode)指定CU是被帧内译码还是被帧间译码。可对预测模 式和分区模式进行联合译码。通过使用CABAC,将二进制码字或二进位串指派给预测模式和分区模式的每一组合。编码器对预测模式和分区模式的选定组合的二进位串进行编码,且将经编码的二进位串写入到位流中。随后将具有用于每一CU的经编码的预测模式和分区模式信息的位流发送到解码器。解码器可因此从经解码的二进位串得到预测模式和分区模式。
对于表1中所列出的分区模式,在表4中展示预测模式和分区模式的信令方法的实例。在表4中,cLog2CUSize是指定当前CU的大小的变量。例如,如果CU的大小是8×8,那么cLog2CUSize=log2(8)=3。虽然表1中所指定的所有帧内分区模式用于表4中所示的帧内和帧间预测类型两者,但有可能在一些情况下仅可使用该组的一部分。在这里,一种情况表示切片类型、预测类型和cLog2CUSize值的特定组合。如上文所提到的,切片类型可以是帧内(I)、预测(P)或双向预测(B),且预测模式可以是帧内或帧间。cLog2CUSize是指示当前CU的大小的变量。例如,当cLog2CUSize>3时,PART_N×N不可用,如表4中所示。作为另一实例,当cLog2CUSize=3时,仅PART_2N×2N、PART_2N×N、PART_N×2N、PART_N×N可用,如表4中所示。对于另一实例,当cLog2CUSize>3且切片类型是P或B时,仅PART_2N×2N、PART_2N×N、PART_N×2N可用,如表4中所示。
I、P和B表示不同的切片类型。I切片中的所有CU都被帧内译码。P或B切片中的CU可以被帧内译码或帧间译码。或者等效地,I切片中的CU的预测类型可以仅是帧内,而P或B切片中的CU的预测类型可以是帧内或帧间。在P或B切片的情况下,二进位串的第一二进位用于指示预测类型是帧内还是帧间。在I切片的情况下,由于所有块仅可以被帧内译码,因此可以不需要使用二进位来用信号通知预测类型。
在一些情况下(例如,对于切片类型和cLog2CUSize的特定组合),表示同一分区模式的二进位串的至少一部分可为相同的。例如,在两种情 况下,用于PART_N×2N的二进位串的一部分是001。在切片类型是I的情况下,PredMode是帧内,且cLog2CUSize>3,二进位串是001。在切片类型是P或B的情况下,PredMode是帧间,且cLog2CUSize>3,二进位串是0001。这两种情况之间的差异在于,第二种情况中开头的“0”指示PredMode是帧间。这开头的“0”在第一种情况下是不需要的,因为已经知道PredMode是帧内。
应注意,还有其他二值化方法可以获得用于表示表4中的所有情况的不同二进位串设计,例如Exp-Golomb码二值化、截短的一元码二值化、固定长度码二值化等。还可通过连接一个以上码字来获得二进位串。例如,可以连接两个固定长度码来得到二进位串,与二值化方法一样。
还应注意,二进位串中的二进位通常用于用信号通知两个事件。例如,当切片类型是P或B时,使用第一二进位来用信号通知预测类型是帧内预测还是帧间预测。在另一实例中,当切片类型是P或B且cLog2CUSize>3时,使用第二二进位来用信号通知分区模式是2N×2N还是某一其他分区模式,使用第三二进位(在适用时)来用信号通知PU分区是水平带(宽度大于高度的矩形)还是垂直带(宽度小于高度的矩形),使用第四二进位来用信号通知两个被分割的PU是具有相同大小还是不同大小,且在CU被分割为不同大小的两个PU的情况下使用第五位来用信号通知更小的PU的位置。在以上列举的所有情况下,可选择等于0的二进位值来用信号通知两个事件中的任一者,且可选择等于1的二进位值来用信号通知另一事件。另外,还可以改变二进位的位置。例如,可将第三二进位放置到第四位置中,且可将第四二进位放置到第三位置中在表4中提供了用于此设计中的二进位值的实例。
由于在传输这些二进位串的过程中可能会涉及到一些额外开销,因此相比于较长的二进位串更频繁地传输较短的二进位串可能是有益的。因此,在一个实施例中,针对预期更频繁地使用的分区和预测模式使用具有 相对较短的长度的二进位串。
表4

如上文所提到的,可以自由指定对于一些情况是整组可用还是该组的一部分可用。例如,在表4中,在切片类型等于P或B的情况下,PredMode是帧内,且cLog2CUSize>3,仅三个分区模式PART_2N×2N、PART_2N×N和PART_N×2N可用。在表5中提供另一实例,其中除了PART_N×N之外,整组分区模式都可用。
表5


在表5中,在切片类型等于P或B时,PredMode是帧内,且cLog2CUSize=3,仅四个分区模式PART_2N×2N、PART_2N×N、PART_N×2N和PART_N×N可用。在另一实施例中,整组分区模式均可用。
选择表2中所列出的分区模式,在表6中展示预测类型和分区模式的信令方法的另一实例。
表6


选择表3中所列出的分区模式,在表7中展示预测类型和分区模式的信令方法的另一实例。
表7

在表7中,在切片类型等于P或B的情况下,PredMode是帧内,且cLog2CUSize=3,整组分区模式均可用。在另一实施例中,仅四个分区模式PART_2N×2N、PART_2N×N、PART_N×2N和PART_N×N可用。在此条件下,表6中的同一组二进位串可用于四个可用的分区模式。
现在将考虑隐式TU分区模式。对于经帧内译码的CU和经帧间译码的CU,在TU深度等于1时,可使用相同机制来得到TU分区模式。TU深度等于1意味着当前CU被分裂为四个TU分区。可使用下文所描述的方法来得到所述TU分区。
选择表1中所列出的分区模式,在表8中展示用于TU深度等于1的隐式TU分区模式的实例。在分区之后所获得的TU具有相同大小。
表8

选择表2中所列出的分区模式,在表9中展示隐式TU分区模式的实例。
表9

选择表3中所列出的分区模式,在表10中展示隐式TU分区模式的实例。
表10

可注意到,当PU分区模式是PART_N×N时,CU默认被均匀地划分为四个更小的方块,即,四个N×N TU分区。因此在上面三个表中未列出当PU分区模式是PART_N×N时对TU分区模式的导出。
可以看到,通过CU分区的大小来隐式地指示TU分区的大小,如由分区模式所指示。因此,不需要进一步的信令来告知解码器TU将被如何分割。
图3说明用于视频译码的方法300。编码器310将位流320传输到解码器330。应理解,编码器310和解码器330可以是例如上文所描述的视频编码和解码系统等视频编码和解码系统内的组件,且可以耦合到适当的处理、发射和接收组件。位流320包含对视频数据的译码单元的预测模式和分区模式进行编码的二进制串。针对视频数据的帧间译码和视频数据的帧内译码两者使用同一组译码单元分区模式。
本文中所揭示的实施例可以通过针对帧内译码和帧间译码使用同一组预测分区、通过以一致的方式用信号通知预测模式和预测分区信息并且通过使用一致的一组规则从预测分区信息推断出变换分区信息来降低与视频编码和解码相关联的实施成本和/或复杂度。
上文所描述的方案可实施于网络组件上,例如具有足以处置置于上面的必需工作负荷的处理能力、存储器资源和网络处理量能力的计算机或网络组件。图4说明适合于实施本文中所揭示的方法的一个或多个实施例,例如编码方案100、解码方案200和编码方法300,的网络组件或计算机系统1300的实施例。网络组件或计算机系统1300包含处理器1302,所述处理器与存储装置通信,所述存储装置包含辅助存储装置1304、只读存储器(ROM)1306、随机存取存储器(RAM)1308、输入/输出(I/O)装置1310和发射机/接收机1312。虽然被说明为单个处理器,但处理器1302不受如此限制且可以包括多个处理器。处理器1302可以实施为一个或多个通用中央处理器单元(CPU)芯片、核(例如,多核处理器)、现场可 编程门阵列(FPGA)、专用集成电路(ASIC)和/或数字信号处理器(DSP),和/或可以是一个或多个ASIC的一部分。处理器1302可以用于实施本文中所描述的方案中的任一者,包含编码方案100、解码方案200和编码方法300。可以使用硬件或者硬件与软件的组合来实施处理器1302。
辅助存储装置1304通常包括一个或多个磁盘驱动器或磁带驱动器,且用于对数据进行非易失性存储,且在RAM1308没有大到足以保存所有工作数据的情况下用作溢流数据存储装置。在选择程序用于执行时,辅助存储装置1304可用于存储被加载到RAM1308中的此类程序。ROM1306用于存储在程序执行期间读取的指令以及可能的数据。ROM1306是非易失性存储装置,其通常具有相对于辅助存储装置1304的较大存储容量来说较小的存储容量。RAM1308用于存储易失性数据,并且还可能用于存储指令。访问ROM1306和RAM1308通常比访问辅助存储装置1304要快。
发射机/接收机1312可以用作计算机系统1300的输出和/或输入装置。例如,如果发射机/接收机1312充当发射机,那么它可以将数据从计算机系统1300发出。如果发射机/接收机1312充当接收机,那么它可以将数据接收到计算机系统1300中。发射机/接收机1312可以采取以下形式:调制解调器、调制解调器组、以太网卡、通用串行总线(USB)接口卡、串行接口、令牌环卡、光纤分布式数据接口(FDDI)卡、无线局域网(WLAN)卡、例如码分多址(CDMA)等无线电收发器卡、全球移动通信系统(GSM)、长期演进(LTE)、全球微波接入互操作性(WiMAX)、和/或其他空中接口协议无线电收发器卡,以及其他众所周知的网络装置。发射机/接收机1312可以使处理器1302能够与因特网或者一个或多个内联网进行通信。I/O装置1310可以包含视频监视器、液晶显示器(LCD)、触摸屏显示器或者用于显示视频的其他类型的视频显示器,并且还可以包含用于俘获视频的录像装置。I/O装置1310还可以包含一个或多个键盘、鼠标、或轨迹 球、或者其他众所周知的输入装置。
应理解,通过对计算机系统1300进行编程和/或将可执行指令加载到计算机系统1300上,处理器1302、辅助存储装置1304、RAM1308以及ROM1306中的至少一者会发生改变,从而将计算机系统1300部分地变换为特定的机器或设备(例如,具有本发明所教示的新颖功能性的视频编解码器)。可执行指令可以存储在辅助存储装置1304、ROM1306和/或RAM1308上,并且被加载到处理器1302中以用于执行。在电气工程和软件工程领域中的基本原理是可以通过将可执行软件加载到计算机中来实施的功能性可以通过众所周知的设计规则转换为硬件实施方案。关于在软件还是硬件中实施一个概念的决定通常取决于对设计的稳定性以及待生产的单元数目的考虑,而不是取决于在从软件领域转变到硬件领域的过程中所涉及的任何问题的考虑。通常,仍容易经常发生改变的设计可以优选地在软件中实施,这是因为硬件实施方案的重新开发比软件设计的重新开发更加昂贵。通常,将以较大体积生产的稳定的设计可以优选地在硬件中实施,例如在ASIC中实施,这是因为对于较大的生产运行,硬件实施方案可能比软件实施方案更加便宜。设计常常可能会以软件形式进行开发和测试,并且稍后通过众所周知的设计规则在专用集成电路中变换为等效的硬件实施方案,所述专用集成电路对软件的指令进行硬接线。采用与由新的ASIC控制的机器相同的方式的是特定的机器或设备,同样地,已进行编程的计算机和/或已加载有可执行指令的计算机可以被视作特定的机器或设备。
揭示至少一个实施例,且所属领域的技术人员对所述实施例和/或所述实施例的特征作出的变化、组合和/或修改在本发明的范围内。因组合、整合和/或省略所述实施例的特征而产生的替代实施例也在本发明的范围内。在明确陈述数值范围或限制的情况下,应将此些明确的范围或限制理解为包含属于明确陈述的范围或限制内的类似量值的重复范围或限制(例 如,从约1到约10包含2、3、4等;大于0.10包含0.11、0.12、0.13等)。例如,每当揭示具有下限Rl和上限Ru的数值范围时,具体揭示属于所述范围的任何数字。确切地说,具体揭示所述范围内的以下数字:R=Rl+k*(Ru-Rl),其中k为从1%到100%范围内以1%递增的变量,即,k为1%、2%、3%、4%、5%、……、70%、71%、72%、……、95%、96%、97%、98%、99%或100%。此外,还具体揭示由如上文所定义的两个R数字所界定的任何数值范围。除非另有规定,否则使用术语约是指后面数字的±10%。对于权利要求的任一元素使用术语“任选地”意味着所述元素是必要的,或者所述元素不是必要的,两种替代方案均在所述权利要求的范围内。使用例如包括、包含和具有等较广术语应被理解为提供对例如由……组成、基本上由……组成以及大体上由……组成等较窄术语的支持。因此,保护范围不受上文所陈述的描述限制,而是由所附权利要求书界定,所述范围包含权利要求书的标的物的所有均等物。每一和每个权利要求作为进一步揭示内容并入说明书中,且权利要求书是本发明的实施例。本发明中的参考文献的论述并不是承认其为现有技术,尤其是公开日期在本申请案的优先权日期之后的任何参考文献。本发明中所引用的所有专利、专利申请案和公开案的揭示内容特此以引用的方式并入本文中,其提供补充本发明的示范性、程序性或其他细节。
虽然本发明中已提供若干实施例,但可理解,在不脱离本发明的精神或范围的情况下,所揭示的系统和方法可以体现为许多其他特定形式。本发明的实例应被视为说明性的而非限制性的,且本发明不限于本文所给出的细节。例如,各种元件或组件可在另一系统中组合或集成,或某些特征可省略或不实施。
另外,在不脱离本发明的范围的情况下,各种实施例中描述和说明为离散或单独的技术、系统、子系统和方法可与其他系统、模块、技术或方法组合或整合。展示或论述为彼此耦合或直接耦合或通信的其他项目也 可以用电方式、机械方式或其他方式通过某一接口、装置或中间组件间接地耦合或通信。变化、替代和改变的其他实例可以由所属领域的一般技术人员来断定,且可以在不脱离本文中所揭示的精神和范围的情况下作出。

用于高效率视频译码的统一分割结构和信令方法.pdf_第1页
第1页 / 共20页
用于高效率视频译码的统一分割结构和信令方法.pdf_第2页
第2页 / 共20页
用于高效率视频译码的统一分割结构和信令方法.pdf_第3页
第3页 / 共20页
点击查看更多>>
资源描述

《用于高效率视频译码的统一分割结构和信令方法.pdf》由会员分享,可在线阅读,更多相关《用于高效率视频译码的统一分割结构和信令方法.pdf(20页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104126303A43申请公布日20141029CN104126303A21申请号201280058881122申请日2012112961/564,68520111129USH04N19/119201401H04N19/13201401H04N19/463201401H04N19/70201401H04N19/176201401H04N19/159201401H04N19/61201401H04N19/6020140171申请人华为技术有限公司地址518129广东省深圳市龙岗区坂田华为总部办公楼72发明人杨海涛高文于浩平54发明名称用于高效率视频译码的统一分割结构和信令方法。

2、57摘要一种用于视频译码的方法包括经由一串位用信号通知译码单元的预测模式和分区模式,其中所述串中的一个位指示所述译码单元的分区大小是否等效于所述整个译码单元,且所述串中的另一位指示所述译码单元分区是水平带还是垂直带,且其中,当所述译码单元的切片类型是预测或双向预测时,所述串中的一个位指示所述预测类型是帧内还是帧间。30优先权数据85PCT国际申请进入国家阶段日2014052986PCT国际申请的申请数据PCT/US2012/0670752012112987PCT国际申请的公布数据WO2013/082291EN2013060651INTCL权利要求书4页说明书12页附图3页19中华人民共和国国家。

3、知识产权局12发明专利申请权利要求书4页说明书12页附图3页10申请公布号CN104126303ACN104126303A1/4页21一种视频编解码器,其包括处理器,其用于针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分区模式,其中该组分区模式包含至少一个非正方形分区。2根据权利要求1所述的视频编解码器,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;第四分区模式,其由各自具有NN的大小的四个分区组成;第五分区模。

4、式,其由两个分区组成,第一分区具有2NN/2的大小且第二分区具有2N3N/2的大小;第六分区模式,其由两个分区组成,第一分区具有2N3N/2的大小且第二分区具有2NN/2的大小;第七分区模式,其由两个分区组成,第一分区具有N/22N的大小且第二分区具有3N/22N的大小;以及第八分区模式,其由两个分区组成,第一分区具有3N/22N的大小且第二分区具有N/22N的大小,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。3根据权利要求1所述的视频编解码器,其特征在于该组分区模式包含第一分区模式,其由具有2N2N。

5、的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;以及第四分区模式,其由各自具有NN的大小的四个分区组成,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。4根据权利要求1所述的视频编解码器,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;第四分区模式,其由各自具有NN的大小的四个分区组成;第。

6、五分区模式,其由各自具有2NN/2的大小的四个分区组成;以及第六分区模式,其由各自具有N/22N的大小的四个分区组成,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。5根据权利要求1所述的视频编解码器,其特征在于经由一串位用信号通知译码单元的预测模式和分区模式,且其中所述串中的一个位指示所述译码单元的分区大小是否等效于所述整个译码单元,且所述串中的另一位指示所述译码单元分区是水平带还是垂直带,且其中,当所述译码单元的切片类型是预测或双向预测时,所述串中的一个位指示所述预测类型是帧内还是帧间。6根据权利要求。

7、5所述的视频编解码器,其特征在于在所述译码单元被分割为两个分区时,所述串中的另一位指示所述两个分区是否具有相同大小,在所述译码单元被分割为不同大小的两个分区的情况下,所述串中的另一位指示较小的分区的位置,且在所述译码单元分区是水平带或垂直带时,所述串中的另一位指示所述相同大小的所述分区的数目是2还是4。7根据权利要求1所述的视频编解码器,其中变换单元分区的大小是由译码单元分区权利要求书CN104126303A2/4页3的大小隐式地指示。8一种用于视频译码的方法,其包括经由一串位用信号通知译码单元的预测模式和分区模式,其中所述串中的一个位指示所述译码单元的分区大小是否等效于所述整个译码单元,且所。

8、述串中的另一位指示所述译码单元分区是水平带还是垂直带,且其中,当所述译码单元的切片类型是预测或双向预测时,所述串中的一个位指示所述预测类型是帧内还是帧间。9根据权利要求8所述的方法,其特征在于在所述译码单元被分割为两个分区时,所述串中的另一位指示所述两个分区是否具有相同大小,在所述译码单元被分割为不同大小的两个分区的情况下,所述串中的另一位指示较小的分区的位置,且在所述译码单元分区是水平带或垂直带时,所述串中的另一位指示所述相同大小的所述分区的数目是2还是4。10根据权利要求8所述的方法,其进一步包括针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分。

9、区模式,其中该组分区模式包含至少一个非正方形分区。11根据权利要求10所述的方法,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;第四分区模式,其由各自具有NN的大小的四个分区组成;第五分区模式,其由两个分区组成,第一分区具有2NN/2的大小且第二分区具有2N3N/2的大小;第六分区模式,其由两个分区组成,第一分区具有2N3N/2的大小且第二分区具有2NN/2的大小;第七分区模式,其由两个分区组成,第一分区具有N/22N的大小且第二分区具有3N/22N的大小。

10、;以及第八分区模式,其由两个分区组成,第一分区具有3N/22N的大小且第二分区具有N/22N的大小,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。12根据权利要求11所述的方法,其特征在于所述第一分区模式指示各自具有NN的大小的四个变换单元分区,所述第二分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第三分区模式指示各自具有N/22N的大小的四个变换单元分区,所述第四分区模式指示各自具有NN的大小的四个变换单元分区,所述第五分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第六分区。

11、模式指示各自具有2NN/2的大小的四个变换单元分区,所述第七分区模式指示各自具有N/22N的大小的四个变换单元分区,且所述第八分区模式指示各自具有N/22N的大小的四个变换单元分区。13根据权利要求10所述的方法,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;以及第四分区模式,其由各自具有NN的大小的四个分区组成,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。14根。

12、据权利要求13所述的方法,其特征在于所述第一分区模式指示各自具有NN的大小的四个变换单元分区,所述第二分区模式指示各自具有2NN/2的大小的四个变换权利要求书CN104126303A3/4页4单元分区,所述第三分区模式指示各自具有N/22N的大小的四个变换单元分区,且所述第四分区模式指示各自具有NN的大小的四个变换单元分区。15根据权利要求10所述的方法,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;第四分区模式,其由各自具有NN的大小的四个分区组成;第五。

13、分区模式,其由各自具有2NN/2的大小的四个分区组成;以及第六分区模式,其由各自具有N/22N的大小的四个分区组成,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。16根据权利要求15所述的方法,其特征在于所述第一分区模式指示各自具有NN的大小的四个变换单元分区,所述第二分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第三分区模式指示各自具有N/22N的大小的四个变换单元分区,所述第四分区模式指示各自具有NN的大小的四个变换单元分区,所述第五分区模式指示各自具有2NN/2的大小的四个变换单元分。

14、区,且所述第六分区模式指示各自具有N/22N的大小的四个变换单元分区。17一种设备,其包括处理器,其用于针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分区模式对视频进行编码,其中变换单元分区的大小是由译码单元分区的大小来隐式地指示;以及发射机,其耦合到所述处理器,其中所述发射机用于将经编码的视频发射到另一设备。18根据权利要求17所述的设备,其特征在于该组分区模式包含至少一个非正方形分区。19根据权利要求18所述的设备,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成。

15、;第三分区模式,其由各自具有N2N的大小的两个分区组成;第四分区模式,其由各自具有NN的大小的四个分区组成;第五分区模式,其由两个分区组成,第一分区具有2NN/2的大小且第二分区具有2N3N/2的大小;第六分区模式,其由两个分区组成,第一分区具有2N3N/2的大小且第二分区具有2NN/2的大小;第七分区模式,其由两个分区组成,第一分区具有N/22N的大小且第二分区具有3N/22N的大小;以及第八分区模式,其由两个分区组成,第一分区具有3N/22N的大小且第二分区具有N/22N的大小,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号。

16、之后的部分指示分区的高度。20根据权利要求19所述的设备,其特征在于所述第一分区模式指示各自具有NN的大小的四个变换单元分区,所述第二分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第三分区模式指示各自具有N/22N的大小的四个变换单元分区,所述第四分区模式指示各自具有NN的大小的四个变换单元分区,所述第五分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第六分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第七分区模式指示各自具有N/22N的大小的四个变换单元分区,且所述第八分区模式指示各自具有N/22N的大小的四个变换权利要求书CN104126303A4/4。

17、页5单元分区。21根据权利要求18所述的设备,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;以及第四分区模式,其由各自具有NN的大小的四个分区组成,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。22根据权利要求21所述的设备,其特征在于所述第一分区模式指示各自具有NN的大小的四个变换单元分区,所述第二分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第三分。

18、区模式指示各自具有N/22N的大小的四个变换单元分区,且所述第四分区模式指示各自具有NN的大小的四个变换单元分区。23根据权利要求18所述的设备,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;第四分区模式,其由各自具有NN的大小的四个分区组成;第五分区模式,其由各自具有2NN/2的大小的四个分区组成;以及第六分区模式,其由各自具有N/22N的大小的四个分区组成,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述。

19、大小的在“”符号之后的部分指示分区的高度。24根据权利要求23所述的设备,其特征在于所述第一分区模式指示各自具有NN的大小的四个变换单元分区,所述第二分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第三分区模式指示各自具有N/22N的大小的四个变换单元分区,所述第四分区模式指示各自具有NN的大小的四个变换单元分区,所述第五分区模式指示各自具有2NN/2的大小的四个变换单元分区,且所述第六分区模式指示各自具有N/22N的大小的四个变换单元分区。25根据权利要求18所述的设备,其特征在于经由一串位用信号通知译码单元的预测模式和分区模式,其中所述串中的一个位指示所述译码单元的分区大小是否。

20、等效于所述整个译码单元,所述串中的另一位指示所述译码单元分区是水平带还是垂直带,在所述译码单元被分割为两个分区时,所述串中的另一位指示所述两个分区是否具有相同大小,在所述译码单元被分割为不同大小的两个分区的情况下,所述串中的另一位指示较小的分区的位置,且在所述译码单元分区是水平带或垂直带时,所述串中的另一位指示所述相同大小的所述分区的数目是2还是4,且其中,当所述译码单元的切片类型是预测或双向预测时,所述串中的一个位指示所述预测类型是帧内还是帧间。权利要求书CN104126303A1/12页6用于高效率视频译码的统一分割结构和信令方法相关申请案的交叉参考0001本申请案要求杨海涛HAITAOY。

21、ANG等人于2011年11月29日申请的发明名称为“用于高效率视频译码的统一分割结构和信令方法UNIEDPARTITIONINGSTRUCTURESANDSIGNALINGMETHODSFORHIGHEFCIENCYVIDEOCODING”的第61/564,685号美国临时专利申请案的优先权,所述申请案以全文引用的方式并入本文中。关于联邦赞助的研究或开发的声明0002不适用对缩微胶片附录的参考0003不适用技术领域无背景技术0004即使是叙述相对短的影片所需的视频数据的量也可能相当大,这可能导致难以经由带宽容量有限的通信网络流式传输或以其他方式传送数据。因此,视频数据一般要经过压缩,随后才经由。

22、如今的电信网络进行传送。视频压缩装置常常在源处使用软件和/或硬件对视频数据进行译码,然后进行传输,从而减少表示数字视频图像所需的数据量。随后通过视频解压缩装置在目的地处接收经压缩的数据,视频解压缩装置对所述视频数据进行解码。在网络资源有限且对更高视频质量的需求日益增长的情况下,能提高压缩比但又很少甚至没有牺牲图像质量的压缩和解压缩技术是所希望的。发明内容0005在一个实施例中,本发明包含一种视频编解码器,所述视频编解码器包括处理器,所述处理器用于针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分区模式,其中该组分区模式包含至少一个非正方形分区。000。

23、6在另一实施例中,本发明包含一种用于视频译码的方法,所述方法包括经由一串位用信号通知译码单元的预测模式和分区模式,其中所述串中的一个位指示译码单元的分区大小是否等效于整个译码单元,且所述串中的另一位指示译码单元分区是水平带还是垂直带,且其中,当译码单元的切片类型是预测或双向预测时,所述串中的一个位指示预测类型是帧内还是帧间。0007在又一实施例中,本发明包含一种包括处理器和发射器的设备。所述处理器用于针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分区模式来对视频进行编码,其中变换单元分区的大小是由译码单元分区的大小隐式地指示。所述发射器耦合到所述处。

24、理器且用于将经编码的视频发射到另一设说明书CN104126303A2/12页7备。0008从结合附图和权利要求书进行的以下详细描述将更清楚地理解这些和其他特征。附图说明0009为了更完整地理解本发明,现在参考以下结合附图和详细描述进行的简要描述,其中相同参考标号表示相同部分。0010图1是编码方案的实施例的示意图。0011图2是解码方案的实施例的示意图。0012图3是视频译码的方法的示意图。0013图4是计算机系统的示意图。具体实施方式0014一开头应理解,尽管下文提供一个或多个实施例的说明性实施方案,但可使用任何数目的技术,不管是当前已知还是现有的,来实施所揭示的系统和/或方法。本发明决不应。

25、限于下文所说明的说明性实施方案、图式和技术,包含本文所说明并描述的示范性设计和实施方案,而是可在所附权利要求书的范围以及其均等物的完整范围内进行修改。0015视频媒体可涉及相对快地连续显示静态图像或帧的序列,进而让观看者感觉到运动。每一帧可包括多个图片样本或像素,其中的每一图片样本或像素可表示帧中的单个参考点。在数字处理期间,可向每一像素指派一个整数值例如,0、1,或255,所述整数值表示对应的参考点处的图像质量或特性,例如亮度亮度或Y或色度色度包含U和V。在使用中,图像或视频帧可包括大量像素例如,19201080帧中的2,073,600个像素,因此独立地编码和解码下文简称为译码每一像素可为繁。

26、琐和低效的。为了提高译码效率,通常将视频帧分解为多个矩形块或宏块,所述矩形块或宏块可用作例如预测、变换和量化等处理的基本单元。例如,典型的NN块可包括N2个像素,其中N是整数且常常是4的倍数。0016在由国际电信联盟ITU电信标准化部门ITUT和国际标准化组织ISO/国际电工技术委员会IEC颁布并且将成为未来的视频标准的高效率视频译码HEVC的工作草案中,已经引入新的块概念。例如,译码单元CU可指代将视频帧再分割为相等或可变大小的方块。在HEVC中,CU可取代先前标准中的宏块结构。取决于帧间预测INTERFRAMEPREDICTION简称为帧间预测INTERPREDICTION或帧内预测INT。

27、RAFRAMEPREDICTION简称为帧内预测INTRAPREDICTION的模式,CU可包括一个或多个预测单元PU,每个预测单元可用作预测的基本单元。例如,对于帧内预测,6464CU可被对称地分裂为四个3232PU。作为另一实例,对于帧间预测,6464CU可被非对称地分裂为1664预测单元PU和4864PU。类似地,PU可包括一个或多个变换单元TU,每个变换单元可用作变换和/或量化的基本单元。例如,3232PU可被对称地分裂为四个1616TU。一个PU的多个TU可共享同一预测模式,但可单独地进行变换。本文中,术语块可一般指代宏块、CU、PU或TU中的任一者。0017可使连续的视频帧或切片大。

28、体上相关,使得帧中的块与先前经译码帧中的对应块大体上没有变化。帧间预测可利用帧序列中的时间冗余,例如连续帧的对应块之间的类似说明书CN104126303A3/12页8性,来减少压缩数据。在帧间预测中,可实施运动补偿算法,以基于根据编码次序在当前帧前面的一个或多个参考帧中的对应块来计算当前帧中的当前块的运动向量。0018类似地,在一个视频帧内,像素可与同一帧内的其他像素相关,使得一个块内或一些块间的像素值可仅有略微变化且/或展现出重复性纹理。为了利用同一帧中的相邻块之间的空间相关性,可通过视频编码器/解码器编解码器实施帧内预测以从一个或多个先前译码的相邻块内插预测块或经预测块,进而产生当前块的估。

29、计。编码器和解码器可独立地内插预测块,进而使得能够通过传送相对少量的参考块例如,位于帧的左上角以及从左上角延伸的块来重建帧和/或图像的大部分。0019为了利用这些译码效率,视频/图像译码标准可通过在帧内预测期间利用多个预测模式来提高预测准确度,其中每个预测模式可产生唯一纹理。在帧内预测之后,编码器可计算预测块与原始块之间的差值例如,通过从原始块减去预测块,从而产生残余块。由于表示残余块所需的数据量通常可能小于表示原始块所需的数据量,因此可编码残余块而不是原始块以实现更高的压缩比。在现有的HEVC软件模型HM中,可将空间域中的残余块的预测残差转换为频域中的变换矩阵的变换系数。可通过二维变换,例如。

30、与离散余弦变换DCT很类似或相同的变换,来实现所述转换。在变换矩阵中,例如对应于具有低空间频率分量的大空间特征的低索引变换系数例如,在左上部分中可具有相对高的量值,而例如对应于具有高空间频率分量的小空间特征的高索引变换系数例如,在右下部分中可具有相对小的量值。0020可由编码器接收包括视频帧或切片序列的输入视频。本文中,帧可指代经预测帧P帧、经帧间译码帧I帧或双向预测帧B帧中的任一者。同样,切片可指代P切片、I切片或B切片中的任一者。在I切片中,所有块都被帧内译码。在P切片或B切片中,块可被帧内译码或帧间译码。使用单个参考块来对P切片进行预测。对于B切片,基于来自两个可能不同的参考帧的两个块来。

31、进行预测,且将来自两个参考块的预测进行组合。0021图1说明可在视频编码器中实施的编码方案100的实施例。编码方案100可包括RDO模块110、预测模块120、变换模块125、量化模块130、熵编码器140、解量化模块150、反变换模块155,和重建模块160。0022编码方案100可实施于视频编码器中,所述视频编码器可接收包括视频帧序列的输入视频。RDO模块110可用于控制其他模块中的一者或一者以上。基于由RDO模块110作出的逻辑决策,预测模块120可利用参考像素来产生当前块的预测像素。可从当前块中的对应原始像素减去每一预测像素,进而产生残余像素。在已经计算出所有残余像素而获得残余块之后,。

32、残余块可经历变换模块125且随后经历量化模块130。可更改残差值的标度,例如每一残差值可除以因子5。结果,一些非零残差值可被转换为零残差值例如,小于某一阈值的值可被视为零。0023图2说明可在视频解码器中实施的解码方案200的实施例。解码方案200可对应于编码方案100,且可包括熵解码器210、解量化模块220、反变换模块225、预测模块230和重建模块240,如图2所示般布置。在操作中,可由熵解码器210接收含有视频帧序列的信息的经编码位流,熵解码器210可将所述位流解码为未压缩的格式。可通过熵解码器210对非零经量化经编码残差值进行解码。0024对于正被解码的当前块,可在执行熵解码器210。

33、之后产生残余块。为了将每一非说明书CN104126303A4/12页9零经量化残余像素恰当地放置到残余块中,可使用由熵解码器210解码的全有效图。随后,可将经量化的残差值馈送到解量化模块220中,解量化模块220可恢复残差值的标度例如,使每一残差值乘以因子5。随后可将经量化的残差值馈送到反变换模块225中。应注意,在量化和解量化之后,残差值可能未完全恢复到其原始值,因此在译码过程中可能会发生一些信息损失。0025另外,还可通过熵解码器210对含有预测模式的信息进行解码。基于预测模式,预测模块230可产生预测块。如果经解码的预测模式是帧间模式,那么可使用一个或多个先前经解码的参考帧来产生预测块。。

34、如果经解码的预测模式是帧内模式,那么可使用多个先前经解码的参考像素来产生预测块。随后,重建模块240可将残余块与预测块进行组合,从而产生经重建的块。另外,为了促进对视频帧的连续解码,可在参考帧中使用经重建的块来对未来帧进行帧间预测。经重建的块的一些像素还可用作对同一帧中的未来块的帧内预测的参考像素。0026如上文所提及,HEVC模型HM中的基本译码单元是CU,其类似于H264/AVC高级视频译码标准中的宏块。然而,与宏块不同的是,CU的大小是可变的,并且CU可以具有不同的预测类型帧内类型或帧间类型。PU是用于向解码器用信号通知预测模式的基本单元。一个CU可具有一个PU或多个PU。TU是变换的基。

35、本单元。一个CU可具有一个或多个TU。当前在HEVC工作草案WD中,经帧内译码的CU中所支持的PU分区是PART_2N2N和PART_NN。经帧间译码的CU中所支持的PU分区是PART_2N2N、PART_2NN、PART_N2N、PART_NN、PART_2NNU、PART_2NND、PART_NL2N、PART_NR2N。0027可观察到,可用分区模式对于帧内和帧间是不同的。具体来说,帧内译码仅使用正方形分区,而帧间译码可使用正方形或非正方形分区。归因于用于帧内译码或帧间译码的分区模式的差异,当前可将不同的信令方法用于经帧内译码的CU和经帧间译码的CU。0028在本文中所揭示的实施例中,提。

36、供一种统一分割结构。也就是说,将同一组分区模式用于帧内译码和帧间译码,这导致统一分割结构。具体来说,实施例为经帧内译码的CU提供非正方形分区。相应地修改用于分区模式的熵译码并在本文中进行描述。另外,实施例为经帧内译码的CU和经帧间译码的CU提供用信号通知预测和分区信息的一致方法。在所揭示的方案中,从预测类型和PU分区模式得到TU分区模式,因此编码器不需要向解码器明确地用信号通知TU分区模式。可使用HM中的现有方法来进行用于每一PU的预测操作和用于每一TU的变换和熵译码操作。0029现在将依次描述与统一分割结构相关的三个方面用于帧内和帧间译码的统一一组分区模式、用信号通知预测类型和分区模式的方法。

37、,以及隐式TU分区模式。0030分区模式下文表示为PARTMODE指定CU内的PU分区。在本文中所揭示的分割结构中,在帧内译码和帧间译码两者中使用同一组PARTMODE。在一个实施例中,一组PARTMODE可以是PART_2N;PART_2NN、PART_N2N、PART_NN、PART_2NNU、PART_2NND、PART_NL2N、PART_NR2N。对于这组PARTMODE,在表1中指定大小宽度高度,这表示矩形块的大小。CU的大小是2N2N。在当前HEVC设计中,N的确切值可以是4、8、16或32,且可以进一步扩展到64或更大。此大小表示法用于描述CU内的一个或多个PU分区的相对大小和。

38、形状。表1说明书CN104126303A5/12页100031在另一实施例中,该组PARTMODE可以是PART_2N2N、PART_2NN、PART_N2N、PART_NN。对于这组PARTMODE,在表2中指定大小宽度高度。表20032在另一实施例中,该组PARTMODE可以是PART_2N2N、PART_2NN、PART_N2N、PART_2NHN、PART_HN2N、PART_NN。对于这组PARTMODE,在表3中指定大小宽度高度。表30033可以注意到,PART_NN仅用于具有最小大小的CU。0034现在将考虑用信号通知预测模式和分区模式的方法。预测模式下文表示为PREDMODE指。

39、定CU是被帧内译码还是被帧间译码。可对预测模式和分区模式进行联合译码。通过使用CABAC,将二进制码字或二进位串指派给预测模式和分区模式的每一组合。编码器对预测模式和分区模式的选定组合的二进位串进行编码,且将经编码的二进位串写入到位流中。随后将具有用于每一CU的经编码的预测模式和分区模式信息的位流发送到解码器。解码器可因此从经解码的二进位串得到预测模式和分区模式。0035对于表1中所列出的分区模式,在表4中展示预测模式和分区模式的信令方法的实例。在表4中,CLOG2CUSIZE是指定当前CU的大小的变量。例如,如果CU的大小是88,那么CLOG2CUSIZELOG283。虽然表1中所指定的所有。

40、帧内分区模式用于表4中所说明书CN104126303A106/12页11示的帧内和帧间预测类型两者,但有可能在一些情况下仅可使用该组的一部分。在这里,一种情况表示切片类型、预测类型和CLOG2CUSIZE值的特定组合。如上文所提到的,切片类型可以是帧内I、预测P或双向预测B,且预测模式可以是帧内或帧间。CLOG2CUSIZE是指示当前CU的大小的变量。例如,当CLOG2CUSIZE3时,PART_NN不可用,如表4中所示。作为另一实例,当CLOG2CUSIZE3时,仅PART_2N2N、PART_2NN、PART_N2N、PART_NN可用,如表4中所示。对于另一实例,当CLOG2CUSIZE。

41、3且切片类型是P或B时,仅PART_2N2N、PART_2NN、PART_N2N可用,如表4中所示。0036I、P和B表示不同的切片类型。I切片中的所有CU都被帧内译码。P或B切片中的CU可以被帧内译码或帧间译码。或者等效地,I切片中的CU的预测类型可以仅是帧内,而P或B切片中的CU的预测类型可以是帧内或帧间。在P或B切片的情况下,二进位串的第一二进位用于指示预测类型是帧内还是帧间。在I切片的情况下,由于所有块仅可以被帧内译码,因此可以不需要使用二进位来用信号通知预测类型。0037在一些情况下例如,对于切片类型和CLOG2CUSIZE的特定组合,表示同一分区模式的二进位串的至少一部分可为相同的。

42、。例如,在两种情况下,用于PART_N2N的二进位串的一部分是001。在切片类型是I的情况下,PREDMODE是帧内,且CLOG2CUSIZE3,二进位串是001。在切片类型是P或B的情况下,PREDMODE是帧间,且CLOG2CUSIZE3,二进位串是0001。这两种情况之间的差异在于,第二种情况中开头的“0”指示PREDMODE是帧间。这开头的“0”在第一种情况下是不需要的,因为已经知道PREDMODE是帧内。0038应注意,还有其他二值化方法可以获得用于表示表4中的所有情况的不同二进位串设计,例如EXPGOLOMB码二值化、截短的一元码二值化、固定长度码二值化等。还可通过连接一个以上码字。

43、来获得二进位串。例如,可以连接两个固定长度码来得到二进位串,与二值化方法一样。0039还应注意,二进位串中的二进位通常用于用信号通知两个事件。例如,当切片类型是P或B时,使用第一二进位来用信号通知预测类型是帧内预测还是帧间预测。在另一实例中,当切片类型是P或B且CLOG2CUSIZE3时,使用第二二进位来用信号通知分区模式是2N2N还是某一其他分区模式,使用第三二进位在适用时来用信号通知PU分区是水平带宽度大于高度的矩形还是垂直带宽度小于高度的矩形,使用第四二进位来用信号通知两个被分割的PU是具有相同大小还是不同大小,且在CU被分割为不同大小的两个PU的情况下使用第五位来用信号通知更小的PU的。

44、位置。在以上列举的所有情况下,可选择等于0的二进位值来用信号通知两个事件中的任一者,且可选择等于1的二进位值来用信号通知另一事件。另外,还可以改变二进位的位置。例如,可将第三二进位放置到第四位置中,且可将第四二进位放置到第三位置中在表4中提供了用于此设计中的二进位值的实例。0040由于在传输这些二进位串的过程中可能会涉及到一些额外开销,因此相比于较长的二进位串更频繁地传输较短的二进位串可能是有益的。因此,在一个实施例中,针对预期更频繁地使用的分区和预测模式使用具有相对较短的长度的二进位串。表4说明书CN104126303A117/12页120041如上文所提到的,可以自由指定对于一些情况是整组。

45、可用还是该组的一部分可用。例如,在表4中,在切片类型等于P或B的情况下,PREDMODE是帧内,且CLOG2CUSIZE3,仅三个分区模式PART_2N2N、PART_2NN和PART_N2N可用。在表5中提供另一实例,其中除了PART_NN之外,整组分区模式都可用。表5说明书CN104126303A128/12页130042在表5中,在切片类型等于P或B时,PREDMODE是帧内,且CLOG2CUSIZE3,仅四个分区模式PART_2N2N、PART_2NN、PART_N2N和PART_NN可用。在另一实施例中,整组分区模式均可用。0043选择表2中所列出的分区模式,在表6中展示预测类型和分。

46、区模式的信令方法的另一实例。表60044选择表3中所列出的分区模式,在表7中展示预测类型和分区模式的信令方法的另一实例。表7说明书CN104126303A139/12页140045在表7中,在切片类型等于P或B的情况下,PREDMODE是帧内,且CLOG2CUSIZE3,整组分区模式均可用。在另一实施例中,仅四个分区模式PART_2N2N、PART_2NN、PART_N2N和PART_NN可用。在此条件下,表6中的同一组二进位串可用于四个可用的分区模式。0046现在将考虑隐式TU分区模式。对于经帧内译码的CU和经帧间译码的CU,在TU深度等于1时,可使用相同机制来得到TU分区模式。TU深度等于。

47、1意味着当前CU被分裂为四个TU分区。可使用下文所描述的方法来得到所述TU分区。0047选择表1中所列出的分区模式,在表8中展示用于TU深度等于1的隐式TU分区模式的实例。在分区之后所获得的TU具有相同大小。表80048选择表2中所列出的分区模式,在表9中展示隐式TU分区模式的实例。表9说明书CN104126303A1410/12页150049选择表3中所列出的分区模式,在表10中展示隐式TU分区模式的实例。表100050可注意到,当PU分区模式是PART_NN时,CU默认被均匀地划分为四个更小的方块,即,四个NNTU分区。因此在上面三个表中未列出当PU分区模式是PART_NN时对TU分区模式。

48、的导出。0051可以看到,通过CU分区的大小来隐式地指示TU分区的大小,如由分区模式所指示。因此,不需要进一步的信令来告知解码器TU将被如何分割。0052图3说明用于视频译码的方法300。编码器310将位流320传输到解码器330。应理解,编码器310和解码器330可以是例如上文所描述的视频编码和解码系统等视频编码和解码系统内的组件,且可以耦合到适当的处理、发射和接收组件。位流320包含对视频数据的译码单元的预测模式和分区模式进行编码的二进制串。针对视频数据的帧间译码和视频数据的帧内译码两者使用同一组译码单元分区模式。0053本文中所揭示的实施例可以通过针对帧内译码和帧间译码使用同一组预测分区。

49、、通过以一致的方式用信号通知预测模式和预测分区信息并且通过使用一致的一组规则从预测分区信息推断出变换分区信息来降低与视频编码和解码相关联的实施成本和/或复杂度。0054上文所描述的方案可实施于网络组件上,例如具有足以处置置于上面的必需工作负荷的处理能力、存储器资源和网络处理量能力的计算机或网络组件。图4说明适合于实施本文中所揭示的方法的一个或多个实施例,例如编码方案100、解码方案200和编码方法300,的网络组件或计算机系统1300的实施例。网络组件或计算机系统1300包含处理器1302,所述处理器与存储装置通信,所述存储装置包含辅助存储装置1304、只读存储器ROM1306、随机存取存储器RAM1308、输入/输出I/O装置1310和发射机/接收机1312。虽然被说明为单个处理器,但处理器1302不受如此限制且可以包括多个处理器。处理器1302可以实施为一个或多个通用中央处理器单元CPU芯片、核例如,多核处理器、现场可编程门阵列FPGA、专用集成电路ASIC和/或数字信号处理器DSP,和/或可以是一个或多个ASIC的一部分。处理器1302可以用于实施本文中所描述的方案中的任一者,包含编码方案100、解码方案200和编码方法300。可以使用硬件或者硬件与软件的组合来实施处理器1302。说明书CN104126303A1511/12页160055辅助存储装。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 >


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1