《用于高效率视频译码的统一分割结构和信令方法.pdf》由会员分享,可在线阅读,更多相关《用于高效率视频译码的统一分割结构和信令方法.pdf(20页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104126303A43申请公布日20141029CN104126303A21申请号201280058881122申请日2012112961/564,68520111129USH04N19/119201401H04N19/13201401H04N19/463201401H04N19/70201401H04N19/176201401H04N19/159201401H04N19/61201401H04N19/6020140171申请人华为技术有限公司地址518129广东省深圳市龙岗区坂田华为总部办公楼72发明人杨海涛高文于浩平54发明名称用于高效率视频译码的统一分割结构和信令方法。
2、57摘要一种用于视频译码的方法包括经由一串位用信号通知译码单元的预测模式和分区模式,其中所述串中的一个位指示所述译码单元的分区大小是否等效于所述整个译码单元,且所述串中的另一位指示所述译码单元分区是水平带还是垂直带,且其中,当所述译码单元的切片类型是预测或双向预测时,所述串中的一个位指示所述预测类型是帧内还是帧间。30优先权数据85PCT国际申请进入国家阶段日2014052986PCT国际申请的申请数据PCT/US2012/0670752012112987PCT国际申请的公布数据WO2013/082291EN2013060651INTCL权利要求书4页说明书12页附图3页19中华人民共和国国家。
3、知识产权局12发明专利申请权利要求书4页说明书12页附图3页10申请公布号CN104126303ACN104126303A1/4页21一种视频编解码器,其包括处理器,其用于针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分区模式,其中该组分区模式包含至少一个非正方形分区。2根据权利要求1所述的视频编解码器,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;第四分区模式,其由各自具有NN的大小的四个分区组成;第五分区模。
4、式,其由两个分区组成,第一分区具有2NN/2的大小且第二分区具有2N3N/2的大小;第六分区模式,其由两个分区组成,第一分区具有2N3N/2的大小且第二分区具有2NN/2的大小;第七分区模式,其由两个分区组成,第一分区具有N/22N的大小且第二分区具有3N/22N的大小;以及第八分区模式,其由两个分区组成,第一分区具有3N/22N的大小且第二分区具有N/22N的大小,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。3根据权利要求1所述的视频编解码器,其特征在于该组分区模式包含第一分区模式,其由具有2N2N。
5、的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;以及第四分区模式,其由各自具有NN的大小的四个分区组成,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。4根据权利要求1所述的视频编解码器,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;第四分区模式,其由各自具有NN的大小的四个分区组成;第。
6、五分区模式,其由各自具有2NN/2的大小的四个分区组成;以及第六分区模式,其由各自具有N/22N的大小的四个分区组成,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。5根据权利要求1所述的视频编解码器,其特征在于经由一串位用信号通知译码单元的预测模式和分区模式,且其中所述串中的一个位指示所述译码单元的分区大小是否等效于所述整个译码单元,且所述串中的另一位指示所述译码单元分区是水平带还是垂直带,且其中,当所述译码单元的切片类型是预测或双向预测时,所述串中的一个位指示所述预测类型是帧内还是帧间。6根据权利要求。
7、5所述的视频编解码器,其特征在于在所述译码单元被分割为两个分区时,所述串中的另一位指示所述两个分区是否具有相同大小,在所述译码单元被分割为不同大小的两个分区的情况下,所述串中的另一位指示较小的分区的位置,且在所述译码单元分区是水平带或垂直带时,所述串中的另一位指示所述相同大小的所述分区的数目是2还是4。7根据权利要求1所述的视频编解码器,其中变换单元分区的大小是由译码单元分区权利要求书CN104126303A2/4页3的大小隐式地指示。8一种用于视频译码的方法,其包括经由一串位用信号通知译码单元的预测模式和分区模式,其中所述串中的一个位指示所述译码单元的分区大小是否等效于所述整个译码单元,且所。
8、述串中的另一位指示所述译码单元分区是水平带还是垂直带,且其中,当所述译码单元的切片类型是预测或双向预测时,所述串中的一个位指示所述预测类型是帧内还是帧间。9根据权利要求8所述的方法,其特征在于在所述译码单元被分割为两个分区时,所述串中的另一位指示所述两个分区是否具有相同大小,在所述译码单元被分割为不同大小的两个分区的情况下,所述串中的另一位指示较小的分区的位置,且在所述译码单元分区是水平带或垂直带时,所述串中的另一位指示所述相同大小的所述分区的数目是2还是4。10根据权利要求8所述的方法,其进一步包括针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分。
9、区模式,其中该组分区模式包含至少一个非正方形分区。11根据权利要求10所述的方法,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;第四分区模式,其由各自具有NN的大小的四个分区组成;第五分区模式,其由两个分区组成,第一分区具有2NN/2的大小且第二分区具有2N3N/2的大小;第六分区模式,其由两个分区组成,第一分区具有2N3N/2的大小且第二分区具有2NN/2的大小;第七分区模式,其由两个分区组成,第一分区具有N/22N的大小且第二分区具有3N/22N的大小。
10、;以及第八分区模式,其由两个分区组成,第一分区具有3N/22N的大小且第二分区具有N/22N的大小,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。12根据权利要求11所述的方法,其特征在于所述第一分区模式指示各自具有NN的大小的四个变换单元分区,所述第二分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第三分区模式指示各自具有N/22N的大小的四个变换单元分区,所述第四分区模式指示各自具有NN的大小的四个变换单元分区,所述第五分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第六分区。
11、模式指示各自具有2NN/2的大小的四个变换单元分区,所述第七分区模式指示各自具有N/22N的大小的四个变换单元分区,且所述第八分区模式指示各自具有N/22N的大小的四个变换单元分区。13根据权利要求10所述的方法,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;以及第四分区模式,其由各自具有NN的大小的四个分区组成,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。14根。
12、据权利要求13所述的方法,其特征在于所述第一分区模式指示各自具有NN的大小的四个变换单元分区,所述第二分区模式指示各自具有2NN/2的大小的四个变换权利要求书CN104126303A3/4页4单元分区,所述第三分区模式指示各自具有N/22N的大小的四个变换单元分区,且所述第四分区模式指示各自具有NN的大小的四个变换单元分区。15根据权利要求10所述的方法,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;第四分区模式,其由各自具有NN的大小的四个分区组成;第五。
13、分区模式,其由各自具有2NN/2的大小的四个分区组成;以及第六分区模式,其由各自具有N/22N的大小的四个分区组成,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。16根据权利要求15所述的方法,其特征在于所述第一分区模式指示各自具有NN的大小的四个变换单元分区,所述第二分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第三分区模式指示各自具有N/22N的大小的四个变换单元分区,所述第四分区模式指示各自具有NN的大小的四个变换单元分区,所述第五分区模式指示各自具有2NN/2的大小的四个变换单元分。
14、区,且所述第六分区模式指示各自具有N/22N的大小的四个变换单元分区。17一种设备,其包括处理器,其用于针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分区模式对视频进行编码,其中变换单元分区的大小是由译码单元分区的大小来隐式地指示;以及发射机,其耦合到所述处理器,其中所述发射机用于将经编码的视频发射到另一设备。18根据权利要求17所述的设备,其特征在于该组分区模式包含至少一个非正方形分区。19根据权利要求18所述的设备,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成。
15、;第三分区模式,其由各自具有N2N的大小的两个分区组成;第四分区模式,其由各自具有NN的大小的四个分区组成;第五分区模式,其由两个分区组成,第一分区具有2NN/2的大小且第二分区具有2N3N/2的大小;第六分区模式,其由两个分区组成,第一分区具有2N3N/2的大小且第二分区具有2NN/2的大小;第七分区模式,其由两个分区组成,第一分区具有N/22N的大小且第二分区具有3N/22N的大小;以及第八分区模式,其由两个分区组成,第一分区具有3N/22N的大小且第二分区具有N/22N的大小,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号。
16、之后的部分指示分区的高度。20根据权利要求19所述的设备,其特征在于所述第一分区模式指示各自具有NN的大小的四个变换单元分区,所述第二分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第三分区模式指示各自具有N/22N的大小的四个变换单元分区,所述第四分区模式指示各自具有NN的大小的四个变换单元分区,所述第五分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第六分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第七分区模式指示各自具有N/22N的大小的四个变换单元分区,且所述第八分区模式指示各自具有N/22N的大小的四个变换权利要求书CN104126303A4/4。
17、页5单元分区。21根据权利要求18所述的设备,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;以及第四分区模式,其由各自具有NN的大小的四个分区组成,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述大小的在“”符号之后的部分指示分区的高度。22根据权利要求21所述的设备,其特征在于所述第一分区模式指示各自具有NN的大小的四个变换单元分区,所述第二分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第三分。
18、区模式指示各自具有N/22N的大小的四个变换单元分区,且所述第四分区模式指示各自具有NN的大小的四个变换单元分区。23根据权利要求18所述的设备,其特征在于该组分区模式包含第一分区模式,其由具有2N2N的大小的一个分区组成;第二分区模式,其由各自具有2NN的大小的两个分区组成;第三分区模式,其由各自具有N2N的大小的两个分区组成;第四分区模式,其由各自具有NN的大小的四个分区组成;第五分区模式,其由各自具有2NN/2的大小的四个分区组成;以及第六分区模式,其由各自具有N/22N的大小的四个分区组成,且其中2N2N的大小等效于整个译码单元,其中所述大小的在“”符号之前的部分指示分区的宽度,且所述。
19、大小的在“”符号之后的部分指示分区的高度。24根据权利要求23所述的设备,其特征在于所述第一分区模式指示各自具有NN的大小的四个变换单元分区,所述第二分区模式指示各自具有2NN/2的大小的四个变换单元分区,所述第三分区模式指示各自具有N/22N的大小的四个变换单元分区,所述第四分区模式指示各自具有NN的大小的四个变换单元分区,所述第五分区模式指示各自具有2NN/2的大小的四个变换单元分区,且所述第六分区模式指示各自具有N/22N的大小的四个变换单元分区。25根据权利要求18所述的设备,其特征在于经由一串位用信号通知译码单元的预测模式和分区模式,其中所述串中的一个位指示所述译码单元的分区大小是否。
20、等效于所述整个译码单元,所述串中的另一位指示所述译码单元分区是水平带还是垂直带,在所述译码单元被分割为两个分区时,所述串中的另一位指示所述两个分区是否具有相同大小,在所述译码单元被分割为不同大小的两个分区的情况下,所述串中的另一位指示较小的分区的位置,且在所述译码单元分区是水平带或垂直带时,所述串中的另一位指示所述相同大小的所述分区的数目是2还是4,且其中,当所述译码单元的切片类型是预测或双向预测时,所述串中的一个位指示所述预测类型是帧内还是帧间。权利要求书CN104126303A1/12页6用于高效率视频译码的统一分割结构和信令方法相关申请案的交叉参考0001本申请案要求杨海涛HAITAOY。
21、ANG等人于2011年11月29日申请的发明名称为“用于高效率视频译码的统一分割结构和信令方法UNIEDPARTITIONINGSTRUCTURESANDSIGNALINGMETHODSFORHIGHEFCIENCYVIDEOCODING”的第61/564,685号美国临时专利申请案的优先权,所述申请案以全文引用的方式并入本文中。关于联邦赞助的研究或开发的声明0002不适用对缩微胶片附录的参考0003不适用技术领域无背景技术0004即使是叙述相对短的影片所需的视频数据的量也可能相当大,这可能导致难以经由带宽容量有限的通信网络流式传输或以其他方式传送数据。因此,视频数据一般要经过压缩,随后才经由。
22、如今的电信网络进行传送。视频压缩装置常常在源处使用软件和/或硬件对视频数据进行译码,然后进行传输,从而减少表示数字视频图像所需的数据量。随后通过视频解压缩装置在目的地处接收经压缩的数据,视频解压缩装置对所述视频数据进行解码。在网络资源有限且对更高视频质量的需求日益增长的情况下,能提高压缩比但又很少甚至没有牺牲图像质量的压缩和解压缩技术是所希望的。发明内容0005在一个实施例中,本发明包含一种视频编解码器,所述视频编解码器包括处理器,所述处理器用于针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分区模式,其中该组分区模式包含至少一个非正方形分区。000。
23、6在另一实施例中,本发明包含一种用于视频译码的方法,所述方法包括经由一串位用信号通知译码单元的预测模式和分区模式,其中所述串中的一个位指示译码单元的分区大小是否等效于整个译码单元,且所述串中的另一位指示译码单元分区是水平带还是垂直带,且其中,当译码单元的切片类型是预测或双向预测时,所述串中的一个位指示预测类型是帧内还是帧间。0007在又一实施例中,本发明包含一种包括处理器和发射器的设备。所述处理器用于针对来自不同视频图片的块之间的帧间译码以及一个视频图片内的块之间的帧内译码使用同一组译码单元分区模式来对视频进行编码,其中变换单元分区的大小是由译码单元分区的大小隐式地指示。所述发射器耦合到所述处。
24、理器且用于将经编码的视频发射到另一设说明书CN104126303A2/12页7备。0008从结合附图和权利要求书进行的以下详细描述将更清楚地理解这些和其他特征。附图说明0009为了更完整地理解本发明,现在参考以下结合附图和详细描述进行的简要描述,其中相同参考标号表示相同部分。0010图1是编码方案的实施例的示意图。0011图2是解码方案的实施例的示意图。0012图3是视频译码的方法的示意图。0013图4是计算机系统的示意图。具体实施方式0014一开头应理解,尽管下文提供一个或多个实施例的说明性实施方案,但可使用任何数目的技术,不管是当前已知还是现有的,来实施所揭示的系统和/或方法。本发明决不应。
25、限于下文所说明的说明性实施方案、图式和技术,包含本文所说明并描述的示范性设计和实施方案,而是可在所附权利要求书的范围以及其均等物的完整范围内进行修改。0015视频媒体可涉及相对快地连续显示静态图像或帧的序列,进而让观看者感觉到运动。每一帧可包括多个图片样本或像素,其中的每一图片样本或像素可表示帧中的单个参考点。在数字处理期间,可向每一像素指派一个整数值例如,0、1,或255,所述整数值表示对应的参考点处的图像质量或特性,例如亮度亮度或Y或色度色度包含U和V。在使用中,图像或视频帧可包括大量像素例如,19201080帧中的2,073,600个像素,因此独立地编码和解码下文简称为译码每一像素可为繁。
26、琐和低效的。为了提高译码效率,通常将视频帧分解为多个矩形块或宏块,所述矩形块或宏块可用作例如预测、变换和量化等处理的基本单元。例如,典型的NN块可包括N2个像素,其中N是整数且常常是4的倍数。0016在由国际电信联盟ITU电信标准化部门ITUT和国际标准化组织ISO/国际电工技术委员会IEC颁布并且将成为未来的视频标准的高效率视频译码HEVC的工作草案中,已经引入新的块概念。例如,译码单元CU可指代将视频帧再分割为相等或可变大小的方块。在HEVC中,CU可取代先前标准中的宏块结构。取决于帧间预测INTERFRAMEPREDICTION简称为帧间预测INTERPREDICTION或帧内预测INT。
27、RAFRAMEPREDICTION简称为帧内预测INTRAPREDICTION的模式,CU可包括一个或多个预测单元PU,每个预测单元可用作预测的基本单元。例如,对于帧内预测,6464CU可被对称地分裂为四个3232PU。作为另一实例,对于帧间预测,6464CU可被非对称地分裂为1664预测单元PU和4864PU。类似地,PU可包括一个或多个变换单元TU,每个变换单元可用作变换和/或量化的基本单元。例如,3232PU可被对称地分裂为四个1616TU。一个PU的多个TU可共享同一预测模式,但可单独地进行变换。本文中,术语块可一般指代宏块、CU、PU或TU中的任一者。0017可使连续的视频帧或切片大。
28、体上相关,使得帧中的块与先前经译码帧中的对应块大体上没有变化。帧间预测可利用帧序列中的时间冗余,例如连续帧的对应块之间的类似说明书CN104126303A3/12页8性,来减少压缩数据。在帧间预测中,可实施运动补偿算法,以基于根据编码次序在当前帧前面的一个或多个参考帧中的对应块来计算当前帧中的当前块的运动向量。0018类似地,在一个视频帧内,像素可与同一帧内的其他像素相关,使得一个块内或一些块间的像素值可仅有略微变化且/或展现出重复性纹理。为了利用同一帧中的相邻块之间的空间相关性,可通过视频编码器/解码器编解码器实施帧内预测以从一个或多个先前译码的相邻块内插预测块或经预测块,进而产生当前块的估。
29、计。编码器和解码器可独立地内插预测块,进而使得能够通过传送相对少量的参考块例如,位于帧的左上角以及从左上角延伸的块来重建帧和/或图像的大部分。0019为了利用这些译码效率,视频/图像译码标准可通过在帧内预测期间利用多个预测模式来提高预测准确度,其中每个预测模式可产生唯一纹理。在帧内预测之后,编码器可计算预测块与原始块之间的差值例如,通过从原始块减去预测块,从而产生残余块。由于表示残余块所需的数据量通常可能小于表示原始块所需的数据量,因此可编码残余块而不是原始块以实现更高的压缩比。在现有的HEVC软件模型HM中,可将空间域中的残余块的预测残差转换为频域中的变换矩阵的变换系数。可通过二维变换,例如。
30、与离散余弦变换DCT很类似或相同的变换,来实现所述转换。在变换矩阵中,例如对应于具有低空间频率分量的大空间特征的低索引变换系数例如,在左上部分中可具有相对高的量值,而例如对应于具有高空间频率分量的小空间特征的高索引变换系数例如,在右下部分中可具有相对小的量值。0020可由编码器接收包括视频帧或切片序列的输入视频。本文中,帧可指代经预测帧P帧、经帧间译码帧I帧或双向预测帧B帧中的任一者。同样,切片可指代P切片、I切片或B切片中的任一者。在I切片中,所有块都被帧内译码。在P切片或B切片中,块可被帧内译码或帧间译码。使用单个参考块来对P切片进行预测。对于B切片,基于来自两个可能不同的参考帧的两个块来。
31、进行预测,且将来自两个参考块的预测进行组合。0021图1说明可在视频编码器中实施的编码方案100的实施例。编码方案100可包括RDO模块110、预测模块120、变换模块125、量化模块130、熵编码器140、解量化模块150、反变换模块155,和重建模块160。0022编码方案100可实施于视频编码器中,所述视频编码器可接收包括视频帧序列的输入视频。RDO模块110可用于控制其他模块中的一者或一者以上。基于由RDO模块110作出的逻辑决策,预测模块120可利用参考像素来产生当前块的预测像素。可从当前块中的对应原始像素减去每一预测像素,进而产生残余像素。在已经计算出所有残余像素而获得残余块之后,。
32、残余块可经历变换模块125且随后经历量化模块130。可更改残差值的标度,例如每一残差值可除以因子5。结果,一些非零残差值可被转换为零残差值例如,小于某一阈值的值可被视为零。0023图2说明可在视频解码器中实施的解码方案200的实施例。解码方案200可对应于编码方案100,且可包括熵解码器210、解量化模块220、反变换模块225、预测模块230和重建模块240,如图2所示般布置。在操作中,可由熵解码器210接收含有视频帧序列的信息的经编码位流,熵解码器210可将所述位流解码为未压缩的格式。可通过熵解码器210对非零经量化经编码残差值进行解码。0024对于正被解码的当前块,可在执行熵解码器210。
33、之后产生残余块。为了将每一非说明书CN104126303A4/12页9零经量化残余像素恰当地放置到残余块中,可使用由熵解码器210解码的全有效图。随后,可将经量化的残差值馈送到解量化模块220中,解量化模块220可恢复残差值的标度例如,使每一残差值乘以因子5。随后可将经量化的残差值馈送到反变换模块225中。应注意,在量化和解量化之后,残差值可能未完全恢复到其原始值,因此在译码过程中可能会发生一些信息损失。0025另外,还可通过熵解码器210对含有预测模式的信息进行解码。基于预测模式,预测模块230可产生预测块。如果经解码的预测模式是帧间模式,那么可使用一个或多个先前经解码的参考帧来产生预测块。。
34、如果经解码的预测模式是帧内模式,那么可使用多个先前经解码的参考像素来产生预测块。随后,重建模块240可将残余块与预测块进行组合,从而产生经重建的块。另外,为了促进对视频帧的连续解码,可在参考帧中使用经重建的块来对未来帧进行帧间预测。经重建的块的一些像素还可用作对同一帧中的未来块的帧内预测的参考像素。0026如上文所提及,HEVC模型HM中的基本译码单元是CU,其类似于H264/AVC高级视频译码标准中的宏块。然而,与宏块不同的是,CU的大小是可变的,并且CU可以具有不同的预测类型帧内类型或帧间类型。PU是用于向解码器用信号通知预测模式的基本单元。一个CU可具有一个PU或多个PU。TU是变换的基。
35、本单元。一个CU可具有一个或多个TU。当前在HEVC工作草案WD中,经帧内译码的CU中所支持的PU分区是PART_2N2N和PART_NN。经帧间译码的CU中所支持的PU分区是PART_2N2N、PART_2NN、PART_N2N、PART_NN、PART_2NNU、PART_2NND、PART_NL2N、PART_NR2N。0027可观察到,可用分区模式对于帧内和帧间是不同的。具体来说,帧内译码仅使用正方形分区,而帧间译码可使用正方形或非正方形分区。归因于用于帧内译码或帧间译码的分区模式的差异,当前可将不同的信令方法用于经帧内译码的CU和经帧间译码的CU。0028在本文中所揭示的实施例中,提。
36、供一种统一分割结构。也就是说,将同一组分区模式用于帧内译码和帧间译码,这导致统一分割结构。具体来说,实施例为经帧内译码的CU提供非正方形分区。相应地修改用于分区模式的熵译码并在本文中进行描述。另外,实施例为经帧内译码的CU和经帧间译码的CU提供用信号通知预测和分区信息的一致方法。在所揭示的方案中,从预测类型和PU分区模式得到TU分区模式,因此编码器不需要向解码器明确地用信号通知TU分区模式。可使用HM中的现有方法来进行用于每一PU的预测操作和用于每一TU的变换和熵译码操作。0029现在将依次描述与统一分割结构相关的三个方面用于帧内和帧间译码的统一一组分区模式、用信号通知预测类型和分区模式的方法。
37、,以及隐式TU分区模式。0030分区模式下文表示为PARTMODE指定CU内的PU分区。在本文中所揭示的分割结构中,在帧内译码和帧间译码两者中使用同一组PARTMODE。在一个实施例中,一组PARTMODE可以是PART_2N;PART_2NN、PART_N2N、PART_NN、PART_2NNU、PART_2NND、PART_NL2N、PART_NR2N。对于这组PARTMODE,在表1中指定大小宽度高度,这表示矩形块的大小。CU的大小是2N2N。在当前HEVC设计中,N的确切值可以是4、8、16或32,且可以进一步扩展到64或更大。此大小表示法用于描述CU内的一个或多个PU分区的相对大小和。
38、形状。表1说明书CN104126303A5/12页100031在另一实施例中,该组PARTMODE可以是PART_2N2N、PART_2NN、PART_N2N、PART_NN。对于这组PARTMODE,在表2中指定大小宽度高度。表20032在另一实施例中,该组PARTMODE可以是PART_2N2N、PART_2NN、PART_N2N、PART_2NHN、PART_HN2N、PART_NN。对于这组PARTMODE,在表3中指定大小宽度高度。表30033可以注意到,PART_NN仅用于具有最小大小的CU。0034现在将考虑用信号通知预测模式和分区模式的方法。预测模式下文表示为PREDMODE指。
39、定CU是被帧内译码还是被帧间译码。可对预测模式和分区模式进行联合译码。通过使用CABAC,将二进制码字或二进位串指派给预测模式和分区模式的每一组合。编码器对预测模式和分区模式的选定组合的二进位串进行编码,且将经编码的二进位串写入到位流中。随后将具有用于每一CU的经编码的预测模式和分区模式信息的位流发送到解码器。解码器可因此从经解码的二进位串得到预测模式和分区模式。0035对于表1中所列出的分区模式,在表4中展示预测模式和分区模式的信令方法的实例。在表4中,CLOG2CUSIZE是指定当前CU的大小的变量。例如,如果CU的大小是88,那么CLOG2CUSIZELOG283。虽然表1中所指定的所有。
40、帧内分区模式用于表4中所说明书CN104126303A106/12页11示的帧内和帧间预测类型两者,但有可能在一些情况下仅可使用该组的一部分。在这里,一种情况表示切片类型、预测类型和CLOG2CUSIZE值的特定组合。如上文所提到的,切片类型可以是帧内I、预测P或双向预测B,且预测模式可以是帧内或帧间。CLOG2CUSIZE是指示当前CU的大小的变量。例如,当CLOG2CUSIZE3时,PART_NN不可用,如表4中所示。作为另一实例,当CLOG2CUSIZE3时,仅PART_2N2N、PART_2NN、PART_N2N、PART_NN可用,如表4中所示。对于另一实例,当CLOG2CUSIZE。
41、3且切片类型是P或B时,仅PART_2N2N、PART_2NN、PART_N2N可用,如表4中所示。0036I、P和B表示不同的切片类型。I切片中的所有CU都被帧内译码。P或B切片中的CU可以被帧内译码或帧间译码。或者等效地,I切片中的CU的预测类型可以仅是帧内,而P或B切片中的CU的预测类型可以是帧内或帧间。在P或B切片的情况下,二进位串的第一二进位用于指示预测类型是帧内还是帧间。在I切片的情况下,由于所有块仅可以被帧内译码,因此可以不需要使用二进位来用信号通知预测类型。0037在一些情况下例如,对于切片类型和CLOG2CUSIZE的特定组合,表示同一分区模式的二进位串的至少一部分可为相同的。
42、。例如,在两种情况下,用于PART_N2N的二进位串的一部分是001。在切片类型是I的情况下,PREDMODE是帧内,且CLOG2CUSIZE3,二进位串是001。在切片类型是P或B的情况下,PREDMODE是帧间,且CLOG2CUSIZE3,二进位串是0001。这两种情况之间的差异在于,第二种情况中开头的“0”指示PREDMODE是帧间。这开头的“0”在第一种情况下是不需要的,因为已经知道PREDMODE是帧内。0038应注意,还有其他二值化方法可以获得用于表示表4中的所有情况的不同二进位串设计,例如EXPGOLOMB码二值化、截短的一元码二值化、固定长度码二值化等。还可通过连接一个以上码字。
43、来获得二进位串。例如,可以连接两个固定长度码来得到二进位串,与二值化方法一样。0039还应注意,二进位串中的二进位通常用于用信号通知两个事件。例如,当切片类型是P或B时,使用第一二进位来用信号通知预测类型是帧内预测还是帧间预测。在另一实例中,当切片类型是P或B且CLOG2CUSIZE3时,使用第二二进位来用信号通知分区模式是2N2N还是某一其他分区模式,使用第三二进位在适用时来用信号通知PU分区是水平带宽度大于高度的矩形还是垂直带宽度小于高度的矩形,使用第四二进位来用信号通知两个被分割的PU是具有相同大小还是不同大小,且在CU被分割为不同大小的两个PU的情况下使用第五位来用信号通知更小的PU的。
44、位置。在以上列举的所有情况下,可选择等于0的二进位值来用信号通知两个事件中的任一者,且可选择等于1的二进位值来用信号通知另一事件。另外,还可以改变二进位的位置。例如,可将第三二进位放置到第四位置中,且可将第四二进位放置到第三位置中在表4中提供了用于此设计中的二进位值的实例。0040由于在传输这些二进位串的过程中可能会涉及到一些额外开销,因此相比于较长的二进位串更频繁地传输较短的二进位串可能是有益的。因此,在一个实施例中,针对预期更频繁地使用的分区和预测模式使用具有相对较短的长度的二进位串。表4说明书CN104126303A117/12页120041如上文所提到的,可以自由指定对于一些情况是整组。
45、可用还是该组的一部分可用。例如,在表4中,在切片类型等于P或B的情况下,PREDMODE是帧内,且CLOG2CUSIZE3,仅三个分区模式PART_2N2N、PART_2NN和PART_N2N可用。在表5中提供另一实例,其中除了PART_NN之外,整组分区模式都可用。表5说明书CN104126303A128/12页130042在表5中,在切片类型等于P或B时,PREDMODE是帧内,且CLOG2CUSIZE3,仅四个分区模式PART_2N2N、PART_2NN、PART_N2N和PART_NN可用。在另一实施例中,整组分区模式均可用。0043选择表2中所列出的分区模式,在表6中展示预测类型和分。
46、区模式的信令方法的另一实例。表60044选择表3中所列出的分区模式,在表7中展示预测类型和分区模式的信令方法的另一实例。表7说明书CN104126303A139/12页140045在表7中,在切片类型等于P或B的情况下,PREDMODE是帧内,且CLOG2CUSIZE3,整组分区模式均可用。在另一实施例中,仅四个分区模式PART_2N2N、PART_2NN、PART_N2N和PART_NN可用。在此条件下,表6中的同一组二进位串可用于四个可用的分区模式。0046现在将考虑隐式TU分区模式。对于经帧内译码的CU和经帧间译码的CU,在TU深度等于1时,可使用相同机制来得到TU分区模式。TU深度等于。
47、1意味着当前CU被分裂为四个TU分区。可使用下文所描述的方法来得到所述TU分区。0047选择表1中所列出的分区模式,在表8中展示用于TU深度等于1的隐式TU分区模式的实例。在分区之后所获得的TU具有相同大小。表80048选择表2中所列出的分区模式,在表9中展示隐式TU分区模式的实例。表9说明书CN104126303A1410/12页150049选择表3中所列出的分区模式,在表10中展示隐式TU分区模式的实例。表100050可注意到,当PU分区模式是PART_NN时,CU默认被均匀地划分为四个更小的方块,即,四个NNTU分区。因此在上面三个表中未列出当PU分区模式是PART_NN时对TU分区模式。
48、的导出。0051可以看到,通过CU分区的大小来隐式地指示TU分区的大小,如由分区模式所指示。因此,不需要进一步的信令来告知解码器TU将被如何分割。0052图3说明用于视频译码的方法300。编码器310将位流320传输到解码器330。应理解,编码器310和解码器330可以是例如上文所描述的视频编码和解码系统等视频编码和解码系统内的组件,且可以耦合到适当的处理、发射和接收组件。位流320包含对视频数据的译码单元的预测模式和分区模式进行编码的二进制串。针对视频数据的帧间译码和视频数据的帧内译码两者使用同一组译码单元分区模式。0053本文中所揭示的实施例可以通过针对帧内译码和帧间译码使用同一组预测分区。
49、、通过以一致的方式用信号通知预测模式和预测分区信息并且通过使用一致的一组规则从预测分区信息推断出变换分区信息来降低与视频编码和解码相关联的实施成本和/或复杂度。0054上文所描述的方案可实施于网络组件上,例如具有足以处置置于上面的必需工作负荷的处理能力、存储器资源和网络处理量能力的计算机或网络组件。图4说明适合于实施本文中所揭示的方法的一个或多个实施例,例如编码方案100、解码方案200和编码方法300,的网络组件或计算机系统1300的实施例。网络组件或计算机系统1300包含处理器1302,所述处理器与存储装置通信,所述存储装置包含辅助存储装置1304、只读存储器ROM1306、随机存取存储器RAM1308、输入/输出I/O装置1310和发射机/接收机1312。虽然被说明为单个处理器,但处理器1302不受如此限制且可以包括多个处理器。处理器1302可以实施为一个或多个通用中央处理器单元CPU芯片、核例如,多核处理器、现场可编程门阵列FPGA、专用集成电路ASIC和/或数字信号处理器DSP,和/或可以是一个或多个ASIC的一部分。处理器1302可以用于实施本文中所描述的方案中的任一者,包含编码方案100、解码方案200和编码方法300。可以使用硬件或者硬件与软件的组合来实施处理器1302。说明书CN104126303A1511/12页160055辅助存储装。