《基于分段对图像编码和解码的方法和设备.pdf》由会员分享,可在线阅读,更多相关《基于分段对图像编码和解码的方法和设备.pdf(33页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102934445 A (43)申请公布日 2013.02.13 C N 1 0 2 9 3 4 4 4 5 A *CN102934445A* (21)申请号 201180027601.6 (22)申请日 2011.04.05 10-2010-0031144 2010.04.05 KR H04N 7/34(2006.01) H04N 7/32(2006.01) (71)申请人三星电子株式会社 地址韩国京畿道水原市 (72)发明人范迪姆谢廖金 陈建乐 韩宇镇 (74)专利代理机构北京铭硕知识产权代理有限 公司 11286 代理人韩明星 (54) 发明名称 基于分段对图像。
2、编码和解码的方法和设备 (57) 摘要 可通过基于第一颜色分量块的像素值设置第 二颜色分量块的多个分段来对图像执行编码和解 码。可通过使用不同的相关像素来预测多个分段, 并可基于预测的多个分段对第二颜色分量块进行 编码和解码。 (30)优先权数据 (85)PCT申请进入国家阶段日 2012.12.04 (86)PCT申请的申请数据 PCT/KR2011/002374 2011.04.05 (87)PCT申请的公布数据 WO2011/126274 EN 2011.10.13 (51)Int.Cl. 权利要求书2页 说明书15页 附图15页 (19)中华人民共和国国家知识产权局 (12)发明专利申。
3、请 权利要求书 2 页 说明书 15 页 附图 15 页 1/2页 2 1.一种对图像编码的方法,所述方法包括: 基于当前块的第一颜色分量块的像素值将当前块的第二颜色分量块分为多个分段; 基于靠近所述多个分段中的第一分段且包括在先于当前块被编码的区域中的第二颜 色分量像素的第一像素值预测第一分段,并基于靠近所述多个分段中的第二分段且包括在 先于当前块被编码的区域中的第二颜色分量像素的第二像素值预测第二分段; 基于预测的第一分段和预测的第二分段对第二颜色分量块进行编码。 2.如权利要求1所述的方法,其中,分段的步骤包括: 基于第一颜色分量块的像素值设置预定的参考值; 基于第一部分和第二部分设置第。
4、二颜色分量块的多个分段, 其中,第一颜色分量块的多个像素中,像素值等于或小于所述预定的参考值的像素被 设置为第一部分,像素值大于所述预定的参考值的像素被设置为第二部分。 3.如权利要求2所述的方法,其中,设置预定参考值的步骤包括: 确定关于第一颜色分量的4N4M尺寸的块,所述4N4M尺寸的块包括尺寸为2N2M 的第一颜色分量块; 对所述4N4M尺寸的块进行下采样,基于下采样的4N4M尺寸的块产生下采样的 2N2M尺寸的块; 将下采样的2N2M尺寸的块的像素值的平均值设置为参考值。 4.如权利要求3所述的方法,其中,确定关于第一颜色分量块的4N4M尺寸的块的步 骤包括:基于靠近第一颜色分量块的边。
5、界的像素的像素值填充所述4N4M尺寸的块的至 少一部分。 5.如权利要求3所述的方法,其中,基于第一部分和第二部分设置第二颜色分量块的 多个分段的步骤包括: 将在下采样的2N2M尺寸的块中包括的像素中的像素值等于或小于参考值的像素设 置为第一部分,将在下采样的2N2M尺寸的块中包括的像素中像素值大于参考值的像素 设置为第二部分; 基于下采样的2N2M尺寸的块的第一部分和第二部分设置第二颜色分量块的所述多 个分段。 6.如权利要求5所述的方法,其中,基于下采样的块的第一部分和第二部分设置第二 颜色分量块的多个分段的步骤包括: 将第二颜色分量块的所述多个分段设置为与位于下采样的具有2N2M尺寸的块。
6、的中 央部分的NM尺寸的块的第一部分和第二部分相同。 7.一种对图像解码的方法,所述方法包括: 基于当前块的第一颜色分量块的像素值将当前块的第二颜色分量块分为多个分段; 基于靠近所述多个分段中的第一分段且包括在先于当前块被解码的区域中的第二颜 色分量像素的第一像素值预测第一分段,并基于靠近所述多个分段中的第二分段且包括在 先于当前块被解码的区域中的第二颜色分量像素的第二像素值预测第二分段; 基于预测的第一分段和预测的第二分段对第二颜色分量块进行解码。 8.如权利要求7所述的方法,其中,分段的步骤包括: 基于第一颜色分量块的像素值设置预定的参考值; 权 利 要 求 书CN 102934445 A。
7、 2/2页 3 基于第一部分和第二部分设置第二颜色分量块的多个分段, 其中,第一颜色分量块的多个像素中,像素值等于或小于所述预定的参考值的像素被 设置为第一部分,像素值大于所述预定的参考值的像素被设置为第二部分。 9.如权利要求8所述的方法,其中,设置预定的参考值的步骤包括: 确定关于第一颜色分量的4N4M尺寸的块,所述4N4M尺寸的块包括尺寸为2N2M 的第一颜色分量块; 对所述4N4M尺寸的块进行下采样,基于下采样的4N4M尺寸的块产生下采样的 2N2M尺寸的块; 将下采样的2N2M尺寸的块的像素值的平均值设置为参考值。 10.如权利要求9所述的方法,其中,确定关于第一颜色分量块的4N4M。
8、尺寸的块的步 骤包括:基于靠近第一颜色分量块的边界的像素的像素值填充所述4N4M尺寸的块的至 少一部分。 11.如权利要求9所述的方法,其中,基于第一部分和第二部分设置第二颜色分量块的 多个分段的步骤包括: 将在下采样的2N2M尺寸的块中包括的像素中像素值等于或小于参考值的像素设置 为第一部分,将在下采样的2N2M尺寸的块中包括的像素中像素值大于参考值的像素设 置为第二部分; 基于下采样的2N2M尺寸的块的第一部分和第二部分设置第二颜色分量块的所述多 个分段。 12.如权利要求11所述的方法,其中,基于下采样的块的第一部分和第二部分设置第 二颜色分量块的多个分段的步骤包括: 将第二颜色分量块的。
9、所述多个分段设置为与位于下采样的具有2N2M尺寸的块的中 央部分的NM尺寸的块的第一部分和第二部分相同。 13.一种对图像编码的设备,所述设备包括: 预测单元,基于当前块的第一颜色分量块的像素值将当前块的第二颜色分量块分为多 个分段,基于靠近所述多个分段中的第一分段且包括在先于当前块被编码的区域中的第二 颜色分量像素的第一像素值预测第一分段,并基于靠近所述多个分段中的第二分段且包括 在先于当前块被编码的区域中的第二颜色分量像素的第二像素值预测第二分段; 编码器,基于预测的第一分段和预测的第二分段对第二颜色分量块进行编码。 14.一种对图像解码的设备,所述设备包括: 预测单元,基于当前块的第一颜。
10、色分量块的像素值将当前块的第二颜色分量块分为多 个分段,基于靠近所述多个分段中的第一分段且包括在先于当前块被解码的区域中的第二 颜色分量像素的第一像素值预测第一分段,并基于靠近所述多个分段中的第二分段且包括 在先于当前块被解码的区域中的第二颜色分量像素的第二像素值预测第二分段; 解码器,基于预测的第一分段和预测的第二分段对第二颜色分量块进行解码。 15.一种存储用于执行权利要求1到12中的任意一个的方法的计算机可读程序的计算 机可读记录介质。 权 利 要 求 书CN 102934445 A 1/15页 4 基于分段对图像编码和解码的方法和设备 技术领域 0001 示例性实施例的一个或多个方面涉。
11、及对图像进行预测编码和解码的方法和设备, 更具体地,涉及对作为多个颜色分量的图像进行预测编码和解码方法和设备。 背景技术 0002 在图像压缩方法(诸如,运动图像专家组(MPEG)-1、MPEG-2、MPEG-4或H.264/ MPEG-4先进视频编码(AVC)中,图像被划分为用于对图像编码的具有预定尺寸的块,然后 通过使用帧间预测或帧内预测对每个块进行预测编码。 0003 通过减去作为帧间预测或帧内预测结果而产生的预测块来产生残差块,通过对产 生的残差块执行离散余弦变换(DCT)并对产生的残差块执行量化和熵编码来产生比特流。 0004 另外,在现有图像编码方法中,通过使用多个颜色分量来对图像。
12、编码。单个像素被 实现为亮度分量和色度分量,亮度分量和色度分量被编码。色度分量可包括蓝色色度分量 (Cb)和红色色度分量(Cr)。 发明内容 0005 技术方案 0006 示例性实施例的一个或多个方面提供用于对作为多个颜色分量的图像进行预测 编码和解码的方法和设备,以及存储执行所述方法的计算机可读程序的计算机可读记录介 质。 0007 有益效果 0008 根据一个或多个示例性实施例,可通过基于颜色分量之间的相似度预测当前块来 执行精确的预测,从而增加在对图像编码时的压缩率。 附图说明 0009 通过参照附图详细描述示例性实施例,以上和其它特征和优点将变得更清楚,其 中: 0010 图1是根据示。
13、例性实施例的用于对图像编码的设备的框图; 0011 图2是根据示例性实施例的用于对图像解码的设备的框图; 0012 图3示出描述根据示例性实施例的分层编码单元; 0013 图4是根据本发明示例性实施例的图像编码器的框图; 0014 图5是根据示例性实施例的图像解码器的框图; 0015 图6示出根据示例性实施例的分层编码单元结构; 0016 图7示出根据示例性实施例的编码单元和变换单元; 0017 图8A到图8D示出根据示例性实施例的编码单元、预测单元和变换单元; 0018 图9是根据示例性实施例的对图像编码的设备的框图; 0019 图10A和图10B分别是根据示例性实施例的第一颜色分量块的像素。
14、值和基于第一 说 明 书CN 102934445 A 2/15页 5 颜色分量块的像素值的第二颜色分量块的分段的示图; 0020 图11是根据示例性实施例的通过使用具有比当前块更大的尺寸的块进行分段的 示图; 0021 图12是用于解释根据示例性实施例的产生具有比当前块更大的尺寸的第一颜色 分量块的方法的示图; 0022 图13是根据示例性实施例的具有比第一颜色分量块更小的尺寸的第二颜色分量 块的分段的示图; 0023 图14A和图14B是用于解释根据示例性实施例的预测第二颜色分量块的方法的示 图; 0024 图15是根据示例性实施例的对图像解码的设备的框图; 0025 图16是根据示例性实施。
15、例的对图像编码的方法的流程图; 0026 图17是根据示例性实施例的对图像解码的方法的流程图。 0027 最佳模式 0028 根据示例性实施例,一种对图像编码的方法可包括:基于当前块的第一颜色分量 块的像素值将当前块的第二颜色分量块分为多个分段;基于靠近所述多个分段中的第一分 段且包括在先于当前块被编码的区域中的第二颜色分量像素的第一像素值预测第一分段, 并基于靠近所述多个分段中的第二分段且包括在先于当前块被编码的区域中的第二颜色 分量像素的第二像素值预测第二分段;基于预测的第一分段和预测的第二分段对第二颜色 分量块进行编码。 0029 分段的步骤可包括:基于第一颜色分量块的像素值设置预定的参。
16、考值;基于第一 部分和第二部分设置第二颜色分量块的多个分段,其中,第一颜色分量块的多个像素中,像 素值等于或小于所述预定的参考值的像素被设置为第一部分,像素值大于所述预定的参考 值的像素被设置为第二部分。 0030 设置预定的参考值的步骤可包括:确定关于第一颜色分量的4N4M尺寸的块,所 述4N4M尺寸的块包括尺寸为2N2M的第一颜色分量块;对所述4N4M尺寸的块进行下 采样,基于下采样的4N4M尺寸的块产生下采样的2N2M尺寸的块;将下采样的2N2M 尺寸的块的像素值的平均值设置为参考值。 0031 确定关于第一颜色分量块的4N4M尺寸的块的步骤可包括:基于靠近第一颜色 分量块的边界的像素的。
17、像素值填充所述4N4M尺寸的块的至少一部分。 0032 基于第一部分和第二部分设置第二颜色分量块的多个分段的步骤可包括:将在 下采样的2N2M尺寸的块中包括的像素中像素值等于或小于参考值的像素设置为第一部 分,将在下采样的2N2M尺寸的块中包括的像素中像素值大于参考值的像素设置为第二 部分;基于下采样的2N2M尺寸的块的第一部分和第二部分设置第二颜色分量块的所述 多个分段。 0033 基于下采样的块的第一部分和第二部分设置第二颜色分量块的多个分段的步骤 可包括:将第二颜色分量块的所述多个分段设置为与位于下采样的具有2N2M尺寸的块 的中央部分的NM尺寸的块的第一部分和第二部分相同。 0034 。
18、预测步骤可包括:基于包括在先于当前块被编码且靠近当前块的第二颜色分量块 的第一分段和第二分段的区域中的第二颜色分量的多个像素值的平均值来预测第一分段 说 明 书CN 102934445 A 3/15页 6 和第二分段。 0035 根据示例性实施例,一种对图像解码的方法可包括:基于当前块的第一颜色分量 块的像素值将当前块的第二颜色分量块分为多个分段;基于靠近所述多个分段中的第一分 段且包括在先于当前块被解码的区域中的第二颜色分量像素的第一像素值预测第一分段, 并基于靠近所述多个分段中的第二分段且包括在先于当前块被解码的区域中的第二颜色 分量像素的第二像素值预测第二分段;基于预测的第一分段和预测的。
19、第二分段对第二颜色 分量块进行解码。 0036 根据示例性实施例,一种对图像编码的设备可包括:预测单元,基于当前块的第一 颜色分量块的像素值将当前块的第二颜色分量块分为多个分段,基于靠近所述多个分段中 的第一分段且包括在先于当前块被编码的区域中的第二颜色分量像素的第一像素值预测 第一分段,并基于靠近所述多个分段中的第二分段且包括在先于当前块被编码的区域中的 第二颜色分量像素的第二像素值预测第二分段;编码器,基于预测的第一分段和预测的第 二分段对第二颜色分量块进行编码。 0037 根据示例性实施例,一种对图像解码的设备可包括:预测单元,基于当前块的第一 颜色分量块的像素值将当前块的第二颜色分量块。
20、分为多个分段,基于靠近所述多个分段中 的第一分段且包括在先于当前块被解码的区域中的第二颜色分量像素的第一像素值预测 第一分段,并基于靠近所述多个分段中的第二分段且包括在先于当前块被解码的区域中的 第二颜色分量像素的第二像素值预测第二分段;解码器,基于预测的第一分段和预测的第 二分段对第二颜色分量块进行解码。 0038 根据示例性实施例,一种计算机可读记录介质可存储用于执行对图像编码的方法 的计算机可读程序,一种计算机可读记录介质可存储用于执行对图像解码的方法的计算机 可读程序。 具体实施方式 0039 以下将参照附图更详细地描述特定示例性实施例。当诸如“.中的至少一个”的 表达出现在列出的元件。
21、之后时,其修饰列出的全部元件而不是修饰列出的单个元件。在本 说明书中,“图像”可表示视频的静止图像或运动图像,即,视频本身。 0040 在以下描述中,相同的附图标号即使在不同的附图中也用于相同的元件。在说明 书中限定的内容(诸如,详细结构和元件)被提供用于帮助对示例性实施例的全面理解。 然而,可不使用这些特别限定的内容来实践示例性实施例。图1是根据示例性实施例的用 于对图像编码的图像编码设备100的框图。图像编码设备100可实现为硬件设备,例如,计 算机或计算机系统的处理器。图像编码设备100还可实现为驻留在计算机系统上的软件模 块。 0041 参照图1,图像编码设备100包括最大编码单元划分。
22、器110、编码深度确定器120、 图像数据编码器130和编码信息编码器140。最大编码单元划分器110、编码深度确定器 120、图像数据编码器130和编码信息编码器140可被实现为例如集成在图像编码设备100 内的硬件或软件模块,或者实现为与图像编码设备100分离的硬件或软件模块。 0042 最大编码单元划分器110可基于作为最大尺寸的编码单元的最大编码单元划分 当前帧或条带。也就是说,最大编码单元划分器110可将当前帧或条带划分为至少一个最 说 明 书CN 102934445 A 4/15页 7 大编码单元。 0043 根据示例性实施例,可使用最大编码单元和深度来表示编码单元。如上所述,最 。
23、大编码单元指示当前帧的编码单元中的具有最大尺寸的编码单元,深度指示分层地减小编 码单元的程度。随着深度增加,编码单元可从最大编码单元减小到最小编码单元,其中,最 大编码单元的深度被定义为最小深度,最小编码单元的深度被定义为最大深度。由于编码 单元的尺寸随着深度增加从最大编码单元减小,因此第k深度的子编码单元可包括多个第 (k+n)深度的子编码单元(k和n是等于或大于1的整数)。 0044 根据将被编码的帧的尺寸的增加,以较大编码单元对图像编码会导致较高的图像 压缩率。然而,如果固定了较大的编码单元,则不能通过反映连续改变的图像特征来对图像 进行有效的编码。 0045 例如,当对诸如海或天空的平。
24、滑区域进行编码时,编码单元越大则压缩率越会增 加。然而,当对诸如人或建筑的复杂区域编码时,编码单元越小则压缩率越会增加。 0046 因此,在示例性实施例中,针对每个帧或条带设置最大图像编码单元和最大深度。 由于最大深度表示编码单元可减小的最大次数,因此包括在最大编码单元中的每个最小编 码单元的尺寸可根据最大深度被变化地设置。可针对每个最大编码单元或针对每个帧或条 带不同地确定最大深度。 0047 编码深度确定器120确定最大编码单元的划分形状。可基于率失真(RD)代价的 计算来确定划分形状。确定的最大编码单元的划分形状被提供给编码信息编码器140,根据 最大编码单元的图像数据被提供给图像数据编。
25、码器130。 0048 可将最大编码单元划分为具有根据不同的深度的不同尺寸的子编码单元。可基于 具有不同尺寸的处理单元对包括在最大编码单元中的具有不同尺寸的子编码单元进行预 测或频率变换。换句话说,图像编码设备100可基于具有多种尺寸和多种形状的处理单元 执行多个用于图像编码的处理操作。为了对图像数据编码,执行诸如预测、变换和熵编码的 处理操作,其中,具有相同尺寸或不同尺寸的处理单元可用于每个操作。 0049 例如,图像编码设备100可选择与编码单元不同的处理单元来预测编码单元。 0050 当编码单元的尺寸为2N2N(其中,N是正整数)时,用于预测的处理单元可以是 2N2N、2NN、N2N和N。
26、N。换句话说,可基于通过具有将编码单元的高度和宽度中的至 少一个二等分的形状的处理单元来执行运动预测。以下,作为预测的基础的处理单元被定 义为预测单元。 0051 预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个,并且可仅对具有 特定尺寸或特定形状的预测单元执行特定预测模式。例如,可仅对具有2N2N或NN的 尺寸的正方形的预测单元执行帧内模式。另外,可仅对具有2N2N的尺寸的预测单元执行 跳过模式。如果在编码单元中存在多个预测单元,则可在对每个预测单元执行预测之后选 择具有最小编码误差的预测模式。 0052 可选择地,图像编码设备100可基于与编码单元的尺寸不同尺寸的处理单元对图 像数据。
27、执行频率变换。为了在编码单元中进行频率变换,可基于具有小于或等于编码单元 的尺寸的处理单元执行频率变换。以下,作为频率变换的基础的处理单元被定义为变换单 元。频率变换可以是离散余弦变换(DCT)或Karhunen Loeve变换(KLT)。 0053 编码深度确定器120可通过使用基于拉格朗日乘子(Lagrangian multiplier)的 说 明 书CN 102934445 A 5/15页 8 RD最优化来确定包括在最大编码单元中的子编码单元。换句话说,编码深度确定器120可 确定从最大编码单元划分的多个子编码单元的形状,其中,子编码单元具有根据子编码单 元的深度的尺寸。图像数据编码器1。
28、30通过基于由编码深度确定器120确定的划分形状对 最大编码单元编码来输出比特流。 0054 编码信息编码器140对关于编码深度确定器120确定的最大编码单元的编码模式 的信息编码。换句话说,编码信息编码器140通过对关于最大编码单元的划分形状的信息、 关于最大深度的信息和关于每个深度的子编码单元的编码模式的信息进行编码来输出比 特流。关于子编码单元的编码模式的信息可包括关于子编码单元的预测单元的信息、关于 每个预测单元的预测模式的信息和关于子编码单元的变换单元的信息。 0055 关于最大编码单元的划分形状的信息可以是标志信息,其指示每个编码单元是否 被划分。例如,当最大编码单元被划分和编码时。
29、,指示最大编码单元是否被划分的信息被编 码。另外,当从最大编码单元划分的子编码单元被划分和编码时,指示子编码单元是否被划 分的信息被编码。 0056 由于针对每个最大编码单元存在具有不同尺寸的子编码单元并且针对每个子编 码单元确定关于编码模式的信息,因此可针对一个最大编码单元确定关于至少一个编码模 式的信息。 0057 图像编码设备100可通过根据深度的增加将最大编码单元的高度和宽度二等分 来产生子编码单元。也就是说,当第k深度的编码单元的尺寸为2N2N时,第(k+1)深度 的编码单元的尺寸是NN。 0058 因此,图像编码设备100可基于最大编码单元的尺寸和考虑图像特性的最大深 度,针对每个。
30、最大编码单元确定最佳划分形状。通过考虑图像特性可变地调整最大编码单 元的尺寸并对通过将最大编码单元划分为不同尺寸的子编码单元来对图像编码,可更有效 地对具有多种分辨率的图像编码。 0059 图2是根据示例性实施例的用于对图像解码的图像解码设备200的框图。图像解 码设备200可被实现为诸如计算机或计算机系统的处理器的硬件设备。图像解码设备200 还可被实现为驻留在计算机系统上的软件模块。 0060 参照图2,视频解码设备200包括图像数据获取单元210、编码信息提取器220以 及图像数据解码器230。图像数据获取单元210、编码信息提取器220以及图像数据解码器 230可被实现为例如集成在图像。
31、解码设备200内或与图像解码设备200分离的硬件模块或 软件模块。 0061 图像数据获取单元210通过分析由图像解码设备200接收的比特流来获取根据最 大编码单元的图像数据,并将图像数据输出到图像数据解码器230。图像数据获取单元210 可从当前帧或条带的头提取关于当前帧或条带的最大编码单元的信息。换句话说,图像数 据获取单元210以最大编码单元划分比特流,从而使图像数据解码器230可根据最大编码 单元对图像数据解码。 0062 编码信息提取器220通过解析图像解码设备200接收的比特流,从当前帧的头提 取关于最大编码单元、最大深度、最大编码单元的划分形状、子编码单元的编码模式的信 息。关于。
32、划分形状的信息和关于编码模式的信息被提供给图像数据解码器230。 0063 关于最大编码单元的划分形状的信息可包括关于根据深度具有不同尺寸且包括 说 明 书CN 102934445 A 6/15页 9 在最大编码单元中的子编码单元的信息,并且可以是指示每个编码单元是否被划分的标志 信息。 0064 关于编码模式的信息可包括关于根据子编码单元的预测单元的信息、关于预测模 式的信息和关于变换单元的信息。 0065 图像数据解码器230通过基于编码信息提取器220提取的信息对每个最大编码单 元的图像数据解码来恢复当前帧。 0066 图像数据解码器230可基于关于最大编码单元的划分形状的信息对包括在最。
33、大 编码单元中的子编码单元解码。解码处理可包括预测处理和反变换处理,预测处理包括帧 内预测和运动补偿。 0067 图像数据解码器230可基于关于预测单元的信息和关于预测模式的信息执行帧 内预测或帧间预测,从而对预测单元进行预测。图像数据解码器230还可基于关于子编码 单元的变换单元的信息对每个子编码单元执行反变换。 0068 图3示出根据示例性实施例的分层编码单元。 0069 参照图3,分层编码单元可包括宽度和高度为6464、3232、1616、88和 44的编码单元。除了具有完美正方形形状的这些编码单元,也可存在宽度和高度为 6432、3264、3216、1632、168、816、84、48。
34、的编码单元。 0070 参照图3,对于分辨率是19201080的图像数据组310,最大编码单元的尺寸被设 置为6464,最大深度被设置为2。 0071 对于分辨率是19201080的图像数据组320,最大编码单元的尺寸被设置为 6464,最大深度被设置为3。对于分辨率是352288的图像数据组330,最大编码单元的 尺寸被设置为1616,最大深度被设置为1。 0072 当分辨率高或者数据量大时,编码单元的最大尺寸可被设置为相对较大以增加压 缩率并更准确地反映图像特性。因此,对于具有比图像数据组330更高的分辨率的图像数 据组310和图像数据组320,6464可被选择为最大编码单元的尺寸。 00。
35、73 最大深度表示分层编码单元中的总层数。由于图像数据组310的最大深度是2,所 以图像数据组310的编码单元315可包括具有64的长轴(long axis)尺寸的最大编码单 元,还包括根据深度的增加而具有32和16的长轴尺寸的子编码单元。 0074 另一方面,因为图像数据组330的最大深度是1,所以图像数据组330的编码单元 335可包括具有16的长轴尺寸的最大编码单元和根据深度的增加而具有8的长轴尺寸的编 码单元。 0075 然而,因为图像数据320的最大深度是3,所以图像数据组320的编码单元325可 包括具有64的长轴尺寸的最大编码单元,并且还包括根据深度的增加而具有32、16、8和4。
36、 的长轴尺寸的子编码单元。由于随着深度的增加基于较小的子编码单元对图像编码,因此 示例性实施例适合于对包括多个更细小场景的图像编码。 0076 图4是根据示例性实施例的图像编码器400的框图。图像编码器400可被实现为 例如计算机的处理器的硬件装置,或实现为驻留在计算机系统上的软件模块。图像编码器 400可包括帧内预测单元410、运动估计器420、运动补偿器425、变换器430、量化器440、熵 编码器450、反量化器460、反变换器470、去块单元480和环路滤波单元490。 0077 帧内预测单元410对当前帧405中的帧内模式的预测单元执行帧内预测,运动估 说 明 书CN 1029344。
37、45 A 7/15页 10 计器420和运动补偿器425通过使用当前帧405和参考帧495,对帧间模式的编码单元执行 帧间估计和运动补偿。帧内预测单元410、运动估计器420、运动补偿器425和参考帧495可 被实现为例如集成在图像编码器400内的硬件或软件模块,或被实现为与图像编码器400 分离的硬件或软件模块。 0078 基于从帧内预测单元410、运动估计器420和运动补偿器425输出的预测单元产生 残差值。产生的残差值经过变换器430和量化器440被输出为量化的变换系数。 0079 量化的变换系数经过反量化器460和反变换器470被恢复为残差值。恢复的残差 值经过去块单元480和环路滤波。
38、单元490被后处理并输出为参考帧495。量化的变换系数 可经过熵编码器450输出为比特流455。 0080 为了基于根据示例性实施例的编码方法执行编码,图像编码器400的帧内预测单 元410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器 460、反变换器470、去块单元480和环路滤波单元490基于最大编码单元、根据深度的子编 码单元、预测单元和变换单元执行图像编码处理。 0081 图5是根据示例性实施例的图像解码器500的框图。图像解码器500可被实现为 例如计算机的处理的硬件装置,或实现为驻留在计算机系统上的软件模块。图像解码器500 可包括解析。
39、器510、熵解码器520、反量化器530、反变换器540、帧内预测单元550、运动补偿 器560、去块单元570和环路滤波单元580。 0082 比特流505经过解析器510,解析器510对将被解码的编码图像数据和解码所需 的编码信息进行解析。编码图像数据经过熵解码器520和反量化器530被输出为反量化的 数据,并且经过反变换器540被恢复为残差值。通过将残差值与帧内预测单元550的帧内 预测结果或运动补偿器560的运动补偿结果相加来根据编码单元恢复残差值。恢复的编码 单元通过经过去块单元570和环路滤波单元580用于预测后续的编码单元或下一帧。解析 器510、熵解码器520、反量化器530、。
40、反变换器540、帧内预测单元550、补偿器560、去块单 元570和环路滤波单元580可被实现为例如集成在图像解码器500内的硬件或软件模块, 或被实现为与图像解码器500分离的硬件或软件模块。 0083 为了基于根据示例性实施例的解码方法执行解码,图像解码器500的解析器510、 熵解码器520、反量化器530、反变换器540、帧内预测单元550、运动补偿器560、去块单元 570和环路滤波单元580基于最大编码单元、根据深度的子编码单元、预测单元和变换单元 执行图像解码处理。 0084 具体地,帧内预测单元550和运动补偿器560通过考虑最大编码单元和深度确定 子编码单元中的预测单元和预测。
41、模式,反变换器540通过考虑变换单元的尺寸执行反变 换。 0085 图6示出根据示例性实施例的分层编码单元结构。 0086 图1中示出的图像编码设备100和图2中示出的图像解码设备200使用分层的编 码单元以考虑图像的特性执行编码和解码。根据图像的特性可自适应地设置最大编码单元 和最大深度,或可根据用户的需求不同地设置最大编码单元和最大深度。 0087 在图6中,分层编码单元结构600具有最大编码单元610,最大编码单元610是高 度和宽度为64,最大深度为4的最大编码单元。深度随分层编码单元结构600的垂直轴加 深,并且随着深度加深,子编码单元620到650的高度和宽度减小。最大编码单元61。
42、0和子 说 明 书CN 102934445 A 10 8/15页 11 编码单元620到650的预测单元沿着分层编码单元结构600的水平轴被显示。 0088 最大编码单元610具有深度0以及6464的编码单元的尺寸(或高度宽度)。 深度沿着垂直轴增加,并存在尺寸为3232和深度为1的第一子编码单元620、尺寸为 1616和深度为2的第二子编码单元630、尺寸为88和深度为3的第三子编码单元640 以及尺寸为44和深度为4的最小编码单元650。尺寸为44和深度为4的最小编码单 元650是最小编码单元,并且最小编码单元可划分为多个预测单元,每个预测单元小于最 小编码单元。 0089 参照图6,根据。
43、每个深度沿水平轴显示了预测单元的示例。也就是说,深度为0的 最大编码单元610的预测单元可以是尺寸等于最大编码单元的尺寸6464的预测单元, 或者是尺寸小于尺寸为6464的最大编码单元的、尺寸为6432的预测单元612、尺寸为 3264的预测单元614和尺寸为3232的预测单元616。 0090 深度为1且尺寸为3232的第一子编码单元620的预测单元可以是尺寸等于第 一子编码单元的尺寸3232的预测单元,或者是尺寸小于尺寸为3232的第一子编码单 元620的、尺寸为3216的预测单元622、尺寸为1632的预测单元624或尺寸为1616 的预测单元626。 0091 深度为2且尺寸为1616。
44、的第二子编码单元630的预测单元可以是尺寸等于第 二子编码单元630的尺寸为1616的预测单元,或者是尺寸小于尺寸为1616的第二子 编码单元630的、尺寸为168的预测单元632、尺寸为816的预测单元634或尺寸为 88的预测单元636。 0092 深度为3且尺寸为88的第三子编码单元640的预测单元可以是尺寸等于第三 子编码单元640的尺寸为88的预测单元,或者是尺寸小于尺寸为88的第三子编码单 元640的、尺寸为84的预测单元642、尺寸为48的预测单元644或尺寸为44的预测 单元646。 0093 深度为4且尺寸为44的最小编码单元650是最小编码单元和最大深度的编码 单元。最小编。
45、码单元650的预测单元可以是尺寸为44的预测单元650、尺寸为42的预 测单元652、尺寸为24的预测单元654或者尺寸为22的预测单元656。 0094 图7示出根据示例性实施例的编码单元和变换单元。 0095 图1中示出的图像编码设备100和图2中示出的图像解码设备200用最大编码单 元或从最大编码单元划分的具有等于或小于最大编码单元的尺寸的子编码单元执行编码 和解码。在编码和解码处理中,频率变换的变换单元的尺寸被选择为不大于相应的编码单 元的尺寸。例如,如果当前编码单元710的尺寸为6464,则可使用尺寸为3232的变换 单元720执行频率变换。 0096 图8A、图8B、图8C和图8D。
46、示出根据示例性实施例的编码单元、预测单元和变换单 元的划分形状。 0097 图8A和图8B示出根据示例性实施例的编码单元和预测单元。 0098 图8A示出图1中示出的图像编码设备100选择的划分形状以对最大编码单元810 进行编码。图像编码设备100将最大编码单元810划分为多种形状,执行编码,并通过基于 RD代价对各种划分形状的编码结果彼此进行比较来选择最优的划分形状。当最优的是对最 大编码单元810进行编码时,可不划分如图8A到图8D所示的最大编码单元810来对最大 说 明 书CN 102934445 A 11 9/15页 12 编码单元810进行编码。 0099 参照图8A,通过将最大编。
47、码单元810划分为深度等于或大于1的多个子编码单元 来对深度为0的最大编码单元810进行编码。也就是说,最大编码单元810被划分为4个 深度为1的子编码单元,所有或者部分的这些深度为1的子编码单元被划分为深度为2的 子编码单元814、816、818、828、850和852。 0100 深度为1的子编码单元中的位于右上侧的子编码单元和位于左下侧的子编码单 元被进一步分为深度等于或大于2的子编码单元。深度等于或大于2的子编码单元中的 一些子编码单元可被划分为深度等于或大于3的子编码单元820、822、824、826、830、832、 840、842、844、846和848。 0101 图8B示出最。
48、大编码单元的预测单元的划分形状。 0102 参照图8B,最大编码单元810的预测单元860可被划分为与最大编码单元810不 同。换句话说,每个子编码单元的预测单元可小于相应的子编码单元。 0103 例如,深度为1的子编码单元812、854中的位于右下侧的子编码单元854的预测 单元可小于子编码单元854。另外,深度为2的子编码单元814、816、818、828、850和852中 的子编码单元814、816、850和852的预测单元可分别小于子编码单元814、816、850和852。 0104 另外,深度为3的子编码单元822、832和848的预测单元可分别小于子编码单元 822、832和848。预测单元可具有各个子编码单元在高度或宽度的方向被二等分的形状,或 者具有各个子编码单元在高度和宽度的方向被四等分的形状。 0105 图8C和图8D示出根据示例性实施例的预测单元和变换单元。 0106 图8C示出图8B中显示的最大编码单元810的预测单元的划分形状,图8D示出最 大编码单元810的变换单元的划分形状。 0107 参照图8D,变换单元870的划分形状可被设置为与预测单元860不同。 0108 例如,尽管深度为1的子编码单元854的预测单元被选择为具有子编码单元854 的高度被二等分的形状,变换单元可被选择为具有子编码单元854。