使用自适应几何划分进行视频编码和解码的方法及装置.pdf

摘要
申请专利号：	CN201080037885.2	申请日：	2010.06.25
公开号：	CN102484706A	公开日：	2012.05.30
当前法律状态：	授权	有效性：	有权
法律详情：	授权\|\|\|实质审查的生效IPC(主分类):H04N 7/26申请日:20100625\|\|\|公开
IPC分类号：	H04N7/26	主分类号：	H04N7/26
申请人：	汤姆森特许公司
发明人：	郭力伟; 尹鹏; J.索尔; 郑云飞; 吕小安; 许茜
地址：	法国伊西莱穆利诺
优先权：	2009.06.26 US 61/220,918
专利代理机构：	北京市柳沈律师事务所 11105	代理人：	吕晓章
PDF下载：	PDF下载

内容摘要

提供了使用自适应几何划分进行视频编码和解码的方法和装置。装置包括：编码器(100)，使用自适应几何划分对画面中区域的画面数据进行编码，其中，响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分子集，所述距离是从该区域内的所定义的点到划分边界测量的。所述角度是相对于从该区域内的所定义的点到所述划分边界延伸的至少一条线而测量的。

权利要求书

1：一种装置，包括：编码器 (100)，用于使用自适应几何划分对画面中区域的画面数据进行编码，其中，响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分的子集，所述距离是从该区域内的点到划分边界测量的，所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。2：一种视频编码器中的方法，包括：使用自适应几何划分对画面中区域的画面数据进行编码 (430， 615， 620， 625)，其中，响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分的子集，所述距离是从该区域内的点到划分边界测量的，所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。3：如权利要求 2 所述的方法，其中，所述区域内的所述点是所述区域的中心，以及响应于从所述区域的中心到划分边界的距离来确定所述几何划分的子集 (810)。4：如权利要求 3 所述的方法，其中，使用距离步长和角度步长来对自适应几何划分的距离空间和角度空间进行采样以便构造几何划分字典，所述距离步长和角度步长是从所述点到所述划分边界的距离的函数，所述几何划分的子集具有比所述几何划分字典少的几何划分 (810)。5：如权利要求 3 所述的方法，其中，所述几何划分的子集包括：从所述点到所述划分边界的距离等于或小于阈值距离的几何划分。6：如权利要求 2 所述的方法，其中，所述几何划分的子集基于所述区域和所述画面中先前编码的其它区域中的至少一个的先前编码信息 (910)。7：如权利要求 6 所述的方法，其中，所述几何划分的子集基于为所述先前编码的其它区域选择的划分 (910)。8：如权利要求 7 所述的方法，其中，为所述区域选择的划分被外插以便预测用于随后区域的划分，并且用于编码所述随后区域的几何划分的子集基于所预测的用于所述随后区域的划分 (910)。9：如权利要求 6 所述的方法，其中，所述几何划分的子集是基于为所述先前编码的其它区域选择的划分的统计而导出的 (910)。10：如权利要求 9 所述的方法，其中，所述画面被包含在视频序列中，使用与强力划分计算方案相对应的默认的几何划分字典来编码所述视频序列中每一个不具有所述区域的一组画面，为该组画面选择的划分的统计被用来构造用于所述区域的几何划分的子集，所述子集具有比默认字典少的几何划分。11：如权利要求 2 所述的方法，其中，对于所述自适应几何划分可用的所述几何划分的子集是用户定义的并且在作为结果的比特流中被显式地发信号通知 (1010， 1115)。12：如权利要求 2 所述的方法，其中，所述子集是多个子集之一，其中，所述子集以及所述多个子集一起表示小于所有可能划分，所述多个子集是预先存储的，并且其中所述方法还包括：使用一个或多个高级语法元素向解码器发送索引，所述索引指示要用于解码的多个子集中的特定一个或多个子集 (1010， 1115)。13：如权利要求 2 所述的方法，还包括，在至解码器的比特流中传送要供解码器在解码至少所述区域的画面数据时使用的所述几何划分的子集 (1010， 1110， 1115)。 214：如权利要求 2 所述的方法，其中，所述编码步骤包括：基于率失真准则，从默认几何划分字典中选择用于所述区域的划分；以及执行几何运动补偿以便获得所述区域的残差，以及重构所述残差，使得在解码器处仅仅能够从所述残差的随后重构中推断出从默认几何划分字典中的多个可用划分中选择的划分 (1215)。15：一种装置，包括：解码器 (200)，用于使用自适应几何划分对画面中区域的画面数据进行解码，其中，响应于距离和角度中的至少一个来确定被用来解码该区域的画面数据的几何划分的子集，所述距离是从该区域内的点到划分边界测量的，所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。16：一种视频解码器中的方法，包括：使用自适应几何划分对画面中区域的画面数据进行解码 (720)，其中，响应于距离和角度中的至少一个来确定被用来解码该区域的画面数据的几何划分的子集，所述距离是从该区域内的点到划分边界测量的，所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。17：如权利要求 16 所述的方法，其中，所述区域内的所述点是所述区域的中心，以及响应于从所述区域的中心到所述划分边界的距离来确定所述几何划分的子集 (1310)。18：如权利要求 17 所述的方法，其中，使用距离步长和角度步长来对自适应几何划分的距离空间和角度空间进行采样以便构造几何划分字典，所述距离步长和角度步长是从所述点到所述划分边界的距离的函数，所述几何划分的子集具有比所述几何划分字典少的几何划分 (1310)。19：如权利要求 17 所述的方法，其中，所述几何划分的子集包括：从所述点到所述划分边界的距离等于或小于阈值距离的几何划分。20：如权利要求 16 所述的方法，其中，所述几何划分的子集基于所述区域和所述画面中先前解码的其它区域中的至少一个的先前解码信息 (1410)。21：如权利要求 16 所述的方法，其中，所述子集是多个子集之一，其中，所述子集以及所述多个子集一起表示小于所有可能划分，所述多个子集是预先存储的，并且其中所述方法还包括：在一个或多个高级语法元素中接收索引，所述索引指示要用于解码的多个子集中的特定一个或多个子集 (1610)。22：如权利要求 16 所述的方法，在来自编码器的比特流中接收所述几何划分的子集以用于解码至少所述区域的画面数据 (1510)。23：如权利要求 16 所述的方法，其中，所述解码步骤包括：在比特流中接收残差，所述残差是通过以下操作先前形成的：基于率失真准则从默认几何划分字典中选择用于所述区域的划分，执行几何运动补偿以便获得所述区域的残差，以及重构所述残差，使得在解码器处从所述残差的随后重构中仅仅能够推断出从默认几何划分字典中的多个可用划分中选择的划分 (1715)。24：一种在其上编码有视频信号数据的非暂时存储介质，包括：使用自适应几何划分编码的画面中区域的画面数据，其中，响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分的子集，所述距离是从该区域内的 3 点到划分边界测量的，所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。

说明书

使用自适应几何划分进行视频编码和解码的方法及装置
    相关申请的交叉引用
     本申请要求 2009 年 6 月 26 日提交的美国临时申请序列号 No.61/220,918( 代理人案号 No.PU090067) 的权益，通过引用将其内容全部并入于此。
     技术领域
     本原理一般地涉及视频编码和解码，并且更具体地涉及使用自适应几何划分 (geometric partition) 进行视频编码和解码的方法及装置。背景技术帧划分是有效的视频编码中至关重要的处理。大多数当前的视频压缩技术使用基于树的帧划分。一种示例的当前视频压缩技术涉及国际标准化组织 / 国际电工委员会 (ISO/IEC) 运动画面专家组 -4(MPEG-4) 第 10 部分高级视频编码 (AVC) 标准 / 国际电信联盟电信分部 (ITU-T)H.264 推荐 ( 下文中 “MPEG-4AVC 标准” )。MPEG-4AVC 标准中的帧划分比简单的均匀 (uniform) 块划分更有效，所述均匀块划分典型地被用于诸如 MPEG-2 的更老
     的视频编码标准中。然而，基于树的帧划分仍没有足够有效地编码视频信息，这是因为其不能捕捉二维 (2D) 数据的几何结构。
     尽管已经提出几何自适应的块划分来改进编码效率，但是其以复杂度为代价来改进编码效率。为了获得改进的性能，第一种现有技术方案支持基于每个距离和角度的所有划分模式。在该第一种现有技术方案中，使用用于对块进行划分的简单的自适应模型。更具体地，使用直线模型来适应角度和位置，以便捕捉可预测区域的局部几何统计依赖性。通过发送两个索引来执行线编码。这两个索引中的每一个对应于到该块的中心的角度和距离的值。距离 Δρ 和角度 Δθ 的量化步骤可以被固定在高级语法上，以便在被耗费用于编码该划分的比特方面具有最佳的率失真 (R-D) 折衷 ( 同样，如果需要，对最大允许的计算复杂度的控制 )。
     第二种现有技术方案试图通过将角度 Δθ 限制为垂直、水平或斜线 (diagonal) (+45 度或 -45 度 ) 定向来降低划分模式复杂度。然而，与第一种现有技术方案相比，这降级了性能。
     为了解决这样的局限性，第一种现有技术方案提出了一种通过考虑 2D 视频数据的 2D 几何来更好地表现并编码该 2D 视频数据的方法。也就是说，第一种现有技术方案对于帧间预测 (INTER 16×16GEO， INTER 8×8GEO) 和帧内预测 (INTRA 16×16GEO， INTRA 8×8GEO) 两者的一组新模式使用楔形划分 ( 即，由任意线或曲线分离的两个区域中的块的划分 )。
     通过线的隐式来建模块内的几何划分。这里，划分被如下地定义：
     f(x， y) ＝ x cosθ+ysinθ-ρ
     其中， ρ 和 θ 分别表示：沿着到 f(x， y) 的正交方向从原点到边界线 f(x， y) 的距离；以及到 f(x， y) 的正交方向与水平坐标轴 x 的角度。将每个块像素 (x， y) 分类，使得：为了编码的目的，可能的几何划分 ( 或几何模式 ) 的字典 ( 所定义的汇编或列表 ) 是先验定义的。这可以通过如下地为 f(x， y) 的每个参数确定值范围和采样精度来正式地定义：
     和以及和其中， Δρ 和 Δθ 是所选择的量化 ( 参数分辨率 ) 步长， MBsize 是宏块的大小。θ 和 ρ 的量化索引为传送的用于编码划分边界线的信息。然而，如果在编码例程中使用模式 16×8 和 8×16，则对于 ρ ＝ 0 的情况可以从一组可能边缘中移除角度 0 和 90。
     在第一种现有技术方案中提出的实施例内，对于几何自适应的运动补偿模式，执行对于每个划分的 θ、 ρ 和运动矢量的搜索，以便找到最佳配置。以两个阶段执行完全搜索策略，使得对于每个 θ、 ρ 对，搜索最佳的运动矢量。在几何自适应的帧内预测模式内，执行对于每个划分的 θ、 ρ 和最佳预测者 ( 直接预测、或统计等 ) 的搜索，以便找到最佳配置。
     在编码器侧，如果使用完全搜索，几何模式的计算复杂度可能非常高。在解码器侧，解码器需要支持所有的划分模式。如果使用查找表格来降低模式形状的实时计算，则表格将非常大。
     在第二种现有技术方案中描述的其它几何划分工作通过仅仅允许垂直、水平或斜线 (+45 度或 -45 度 ) 定向而试图减少几何模式的数量。这确实降低了确定的复杂度，但确实是以降级的编码性能为代价的。发明内容通过本原理解决现有技术的这些和其它缺陷和缺点，本原理针对使用自适应几何划分进行视频编码和解码的方法和装置。
     根据本原理的一个方面，提供了一种装置。该装置包括使用自适应几何划分对画面中区域的画面数据进行编码的编码器，其中，响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分子集。所述距离是从该区域内的所定义的点到划分边界测量的。所述角度是相对于至少一条从该区域内的所定义的点到划分边界延伸的线而测量的。
     根据本原理的另一方面，提供了一种视频编码器中的方法。该方法包括使用自适应几何划分对画面中区域的画面数据进行编码，其中，响应于距离和角度中的至少一个来
     确定被用来编码该区域的画面数据的几何划分子集。所述距离是从该区域内的所定义的点到划分边界测量的。所述角度是相对于至少一条从该区域内的所定义的点到划分边界延伸的线而测量的。
     根据本原理的又一方面，提供了一种装置。该装置包括使用自适应几何划分对画面中区域的画面数据进行解码的解码器，其中，响应于距离和角度中的至少一个来确定被用来解码该区域的画面数据的几何划分子集。所述距离是从该区域内的所定义的点到划分边界测量的。所述角度是相对于至少一条从该区域内的所定义的点到划分边界延伸的线而测量的。
     根据本原理的再一方面，提供了一种视频解码器中的方法。该方法包括使用自适应几何划分对画面中区域的画面数据进行解码，其中，响应于距离和角度中的至少一个来确定被用来解码该区域的画面数据的几何划分子集。所述距离是从该区域内的所定义的点到划分边界测量的。所述角度是相对于至少一条从该区域内的所定义的点到划分边界延伸的线而测量的。
     本原理的这些和其它方面、特征和优点将从示例实施例的以下具体描述中变得明显，将结合附图阅读以下具体描述。附图说明依据以下示例性图将更好地理解本原理，其中：
     图 1 是依据本原理实施例的可以应用本原理的示例性编码器的框图；
     图 2 是依据本原理实施例的可以应用本原理的示例性解码器的框图；
     图 3 是依据本原理实施例的可以应用本原理的图像块的示例性几何划分的框图；
     图 4 是依据本原理实施例的使用自适应几何划分来编码画面数据的示例性方法的流程图；
     图 5 是依据本原理实施例的使用自适应几何划分字典在编码器侧搜索最佳预测的示例性方法的流程图；
     图 6 是依据本原理实施例的利用自适应几何划分字典用于几何划分模式的熵编码的示例性方法的流程图；
     图 7 是依据本原理实施例的使用自适应几何划分字典来解码画面数据的示例性方法的流程图；
     图 8 是依据本原理实施例的使用自适应几何划分字典来编码画面数据的另一示例性方法的流程图；
     图 9 是依据本原理实施例的使用自适应几何划分字典来编码画面数据的另一示例性方法的流程图；
     图 10 是依据本原理实施例的使用自适应几何划分字典来编码画面数据的另一示例性方法的流程图；
     图 11 是依据本原理实施例的使用自适应几何划分字典来编码画面数据的另一示例性方法的流程图；
     图 12 是依据本原理实施例的使用自适应几何划分字典来编码画面数据的另一示例性方法的流程图；
     图 13 是依据本原理实施例的使用自适应几何划分字典来解码画面数据的另一示例性方法的流程图；
     图 14 是依据本原理实施例的使用自适应几何划分字典来解码画面数据的另一示例性方法的流程图；
     图 15 是依据本原理实施例的使用自适应几何划分字典来解码画面数据的另一示例性方法的流程图；
     图 16 是依据本原理实施例的使用自适应几何划分字典来解码画面数据的另一示例性方法的流程图；以及
     图 17 是依据本原理实施例的使用自适应几何划分字典来解码画面数据的另一示例性方法的流程图。具体实施方式
     本原理针对使用自适应几何划分进行视频编码和解码的方法和装置。
     本描述例示了本原理。因此，将理解，本领域技术人员将能够开发尽管未在这里明确描述或示出但是体现本原理并且被包括在本原理的精神和范围之内的各种布置。在此叙述的所有示例和条件性语言意欲用于教导的目的以便帮助读者理解本原理以及由发明人贡献以推动现有技术发展的构思，并且应该被解释为不局限于这样具体叙述的示例和条件。
     另外，在这里叙述本原理的原理、方面和实施例及其具体示例的所有陈述意欲包括其结构和功能上的等效物。另外，意图是：这样的等效物包括当前已知的等效物以及将来开发的等效物二者，即所开发的执行相同功能的任何元件，而不论其结构如何。
     因此，例如，本领域技术人员将认识到：在此呈现的框图表示体现本原理的例示性电路的概念性视图。类似地，将认识到：任何流程图示 (flow chart)、流程图 (flow diagram)、状态转换图、伪代码等表示实质上可以表示在计算机可读介质中并因此由计算机或处理器执行的各种处理，而不管是否明确地示出这样的计算机或处理器。
     可以通过使用专用硬件以及与适当的软件相关联的能够执行软件的硬件来提供图中示出的各种元件的功能。当利用处理器来提供所述功能时，可以利用单个专用处理器、利用单个共享处理器、或者利用其中一些可被共享的多个独立处理器来提供所述功能。另外，术语 “处理器” 或 “控制器” 的明确使用不应该被解释为排他性地指代能够执行软件的硬件，而是可以隐含地没有限制地包括数字信号处理器 (“DSP” ) 硬件、用于存储软件的只读存储器 (“ROM” )、随机存取存储器 (“RAM” )、和非易失性存储装置。
     还可以包括其它传统的和 / 或定制的硬件。类似地，图中示出的任何开关只是概念性的。它们的功能可以通过程序逻辑的运行、通过专用逻辑、通过程序控制和专用逻辑的交互、或者甚至手动地来执行，如从上下文更具体地理解的，实施者可选择具体技术。
     在其权利要求中，被表示为用于执行指定功能的部件的任何元件意欲包含执行那个功能的任何方式，例如包括： a) 执行那个功能的电路元件的组合或者 b) 与适当电路相组合的任何形式的软件，所述软件因此包括固件或微代码等，所述适当电路用于执行该软件以执行所述功能。由这种权利要求限定的本发明在于如下事实，即，以权利要求所要求的方式将由各种所叙述的部件提供的功能组合和集合到一起。因此认为可以提供那些功能的任
     何部件与在此示出的那些部件等效。
     在本说明书中提到的本原理的 “一个实施例” 或 “实施例” 及其其它变型意味着：结合所述实施例描述的具体特征、结构、特性等被包括在本原理的至少一个实施例中。因此，在说明书各处出现的短语 “在一个实施例中” 和 “在实施例中” 、以及任何其它变型不一定都指代相同的实施例。
     应当认识到，例如在 “A/B” 、 “A 和 / 或 B” 和 “A 和 B 中的至少一个” 的情况中， “/” 、 “和 / 或” 以及 “至少一个” 任何一个的使用意欲包括对于仅仅第一个列出的选项 (A) 的选择、或对于仅仅第二个列出的选项 (B) 的选择、或者对于两个选项 (A 和 B) 的选择。作为另一示例，在 “A、 B 和 / 或 C” 以及 “A、 B 和 C 中的至少一个” 的情况中，这种措辞意欲包括对于仅仅第一个列出的选项 (A) 的选择、或对于仅仅第二个列出的选项 (B) 的选择、或对于仅仅第三个列出的选项 (C) 的选择、或对于仅仅第一个和第二个列出的选项 (A 和 B) 的选择、或对于仅仅第一个和第三个列出的选项 (A 和 C) 的选择、或对于仅仅第二个和第三个列出的选项 (B 和 C) 的选择、或者对于全部三个选项 (A 和 B 和 C) 的选择。如本领域和相关领域普通技术人员容易认识到的，这可以被扩展用于很多列出的条目。
     此外，应理解，尽管这里关于 MPEG-4AVC 标准来描述本原理的一个或多个实施例，但本原理不仅仅限于该标准，并且因此可以关于其它视频编码标准、推荐、及其扩展 ( 包括 MPEG-4AVC 标准的扩展 ) 而被利用，同时保持本原理的精神。而且，如这里所使用的，词语 “画面” 和 “图像” 被可互换地使用，并且指代静止图像或来自视频序列的画面。如已知的，画面可以是帧或场。
     如这里所使用的， “高级语法” 指代在层级上驻留在宏块层之上的比特流中表现的语法。例如，如这里所使用的，高级语法可以指代但不限于：码片首标级、补充增强信息 (SEI) 级、画面参数集 (PPS) 级、序列参数集 (SPS) 级、和网络抽象层 (NAL) 单元首标级处的语法。
     此外，如这里所使用的，词语 “发信号通知”指代向对应解码器指示某些内容 (something)。例如，编码器可以发信号通知来自多个几何划分子集中的具体一个几何划分子集，以便使得解码器得知在编码器侧使用哪个具体子集。以此方式，在编码器侧和解码器侧两处可以使用相同的子集。因此，例如，编码器可以将子集传送到解码器，使得解码器可以使用相同的具体子集，或者如果解码器已经具有该具体子集以及其它子集，则可以使用信令 ( 而非传送 ) 来简单地允许解码器知道并选择该具体子集。通过避免传送任何实际子集，可以实现比特节省。应理解，可以以多种方式来完成发信号通知。例如，可以使用一个或多个语法元素、标志等来向对应解码器发信号通知信息。
     另外，如这里所使用的，短语 “画面区域” ( 或简单地简称为 “区域” ) 指代包含例如一个或多个块或任何大小的任意形状、以及 / 或者另外由一个或多个块或任何大小的任意形状表示的画面的一部分。所述一个或多个块可能涉及例如超宏块、宏块、宏块划分、子宏块划分等等。在一个示例中，区域可以是块，在该情况下，划分边界可以是该块的边缘。给出这里提供的本原理的教导，本领域和相关领域中的普通技术人员容易确定可以被认为是 ( 画面内的 ) 区域以及可以被认为是区域的划分边界的这些和其它变型，同时保持本原理的精神。
     此外，如这里所使用的，短语 “随后区域” 指代画面或视频序列中尚未被编码或解
     码的区域。该短语被用来区分正在被编码或解码的 ( 当前 ) 区域。
     此外，如这里所使用的，短语 “几何划分子集” 指代比可能在强力 (brute force) 计算或列表中可用的所有几何划分小的几何划分编组。以此方式，减少了对应编码器或解码器需要考虑的几何划分的总数。
     而且，如这里所使用的，短语 “距离空间” 指代几何模式的距离参数的所有允许值的集合。例如，对于 16×16 块，距离的最大值为 11.312( 主对角线的长度， 16×1.414/2)，而最小值为 0( 因为其不可能为负 )。由于存在过多的距离参数的选择，在构造几何划分字典时，仅从整个空间中选择有限数量的值 ( 该 “选择” 被称作 “采样” )。
     另外，如这里所使用的，短语 “角度空间” 指代角度参数的所有允许值的集合。当距离参数为 0 时，角度空间为 [0， 180)( 即，其可以是等于或大于 0 但小于 180 的任何值 )。当距离参数大于 0 时，角度空间为 [0， 360)( 即，其可以是等于或大于 0 但小于 360 的任何值 )。
     如上面注意到的，本原理针对使用自适应几何划分进行视频编码和解码的方法和装置。
     转到图 1，由参考标号 100 总地指示能够依据 MPEG-4AVC 标准执行视频编码的视频编码器。视频编码器 100 包括帧排序缓冲器 110，该帧排序缓冲器 110 具有与组合器 185 的非反相输入端进行信号通信的输出端。组合器 185 的输出端以信号通信方式与具有几何扩展的变换器和量化器 125 的第一输入端连接。具有几何扩展的变换器和量化器 125 的输出端以信号通信方式与具有几何扩展的熵编码器 145 的第一输入端以及具有几何扩展的逆变换器和逆量化器 150 的第一输入端连接。具有几何扩展的熵编码器 145 的输出端以信号通信方式与组合器 190 的第一非反相输入端连接。组合器 190 的输出端以信号通信方式与输出缓冲器 135 的第一输入端连接。
     具有几何扩展的编码器控制器 105 的第一输出端以信号通信方式与帧排序缓冲器 110 的第二输入端、具有几何扩展的逆变换器和逆量化器 150 的第二输入端、画面类型判定模块 115 的输入端、具有几何扩展的宏块类型 (MB 类型 ) 判定模块 120 的第一输入端、具有几何扩展的帧内预测模块 160 的第二输入端、具有几何扩展的去块滤波器 165 的第二输入端、具有几何扩展的运动补偿器 170 的第一输入端、具有几何扩展的运动估计器 175 的第一输入端、和参考画面缓冲器 180 的第二输入端连接。
     具有几何扩展的编码器控制器 105 的第二输出端以信号通信方式与补充增强信息 (SEI) 插入器 130 的第一输入端、具有几何扩展的变换器和量化器 125 的第二输入端、具有几何扩展的熵编码器 145 的第二输入端、输出缓冲器 135 的第二输入端、以及序列参数集 (SPS) 和画面参数集 (PPS) 插入器 140 的输入端连接。
     SEI 插入器 130 的输出端以信号通信方式与组合器 190 的第二非反相输入端连接。
     画面类型判定模块 115 的第一输出端以信号通信方式与帧排序缓冲器 110 的第三输入端连接。画面类型判定模块 115 的第二输出端以信号通信方式与具有几何扩展的宏块类型判定模块 120 的第二输入端连接。
     序列参数集 (SPS) 和画面参数集 (PPS) 插入器 140 的输出端以信号通信方式与组合器 190 的第三非反相输入端连接。
     具有几何扩展的逆量化器和逆变换器 150 的输出端以信号通信方式与组合器 119的第一非反相输入端连接。组合器 119 的输出端以信号通信方式与具有几何扩展的帧内预测模块 160 的第一输入端和具有几何扩展的去块滤波器 165 的第一输入端连接。具有几何扩展的去块滤波器 165 的输出端以信号通信方式与参考画面缓冲器 180 的第一输入端连接。参考画面缓冲器 180 的输出端以信号通信方式与具有几何扩展的运动估计器 175 的第二输入端、以及具有几何扩展的运动补偿器 170 的第三输入端连接。具有几何扩展的运动估计器 175 的第一输出端以信号通信方式与具有几何扩展的运动补偿器 170 的第二输入端连接。具有几何扩展的运动估计器 175 的第二输出端以信号通信方式与具有几何扩展的熵编码器 145 的第三输入端连接。
     具有几何扩展的运动补偿器 170 的输出端以信号通信方式与开关 197 的第一输入端连接。具有几何扩展的帧内预测模块 160 的输出端以信号通信方式与开关 197 的第二输入端连接。具有几何扩展的宏块类型判定模块 120 的输出端以信号通信方式与开关 197 的第三输入端连接。开关 197 的第三输入端确定开关的 “数据” 输入 ( 与控制输入 ( 即，第三输入端 ) 相比 ) 是由具有几何扩展的运动补偿器 170 提供还是由具有几何扩展的帧内预测模块 160 提供。开关 197 的输出端以信号通信方式与组合器 119 的第二非反相输入端和组合器 185 的反向输入端连接。帧排序缓冲器 110 的第一输入端和具有几何扩展的编码器控制器 105 的输入端可用作编码器 100 的用于接收输入画面 101 的输入端。此外，补充增强信息 (SEI) 插入器 130 的第二输入端可用作编码器 100 的用于接收元数据的输入端。输出缓冲器 135 的输出端可用作编码器 100 的用于输出比特流的输出端。
     转到图 2，通过参考标号 200 总地指示能够依据 MPEG-4AVC 标准执行视频解码的视频解码器。视频解码器 200 包括输入缓冲器 210，该输入缓冲器 210 具有以信号通信方式与具有几何扩展的熵解码器 245 的第一输入端连接的输出端。具有几何扩展的熵解码器 245 的第一输出端以信号通信方式与逆变换器和逆量化器 250 的第一输入端连接。具有几何扩展的逆变换器和逆量化器 250 的输出端以信号通信方式与组合器 225 的第二非反相输入端连接。组合器 225 的输出端以信号通信方式与具有几何扩展的去块滤波器 265 的第二输入端和具有几何扩展的帧内预测模块 260 的第一输入端连接。具有几何扩展的去块滤波器 265 的第二输出端以信号通信方式与参考画面缓冲器 280 的第一输入端连接。参考画面缓冲器 280 的输出端以信号通信方式与具有几何扩展的运动补偿器 270 的第二输入端连接。
     具有几何扩展的熵解码器 245 的第二输出端以信号通信方式与具有几何扩展的运动补偿器 270 的第三输入端和具有几何扩展的去块滤波器 265 的第一输入端连接。具有几何扩展的熵解码器 245 的第三输出端以信号通信方式与具有几何扩展的解码器控制器 205 的输入端连接。具有几何扩展的解码器控制器 205 的第一输出端以信号通信方式与具有几何扩展的熵解码器 245 的第二输入端连接。具有几何扩展的解码器控制器 205 的第二输出端以信号通信方式与具有几何扩展的逆变换器和逆量化器 250 的第二输入端连接。具有几何扩展的解码器控制器 205 的第三输出端以信号通信方式与具有几何扩展的去块滤波器 265 的第三输入端连接。具有几何扩展的解码器控制器 205 的第四输出端以信号通信方式与具有几何扩展的帧内预测模块 260 的第二输入端、具有几何扩展的运动补偿器 270 的第一输入端、以及参考画面缓冲器 280 的第二输入端连接。
     具有几何扩展的运动补偿器 270 的输出端以信号通信方式与开关 297 的第一输入
     端连接。具有几何扩展的帧内预测模块 260 的输出端以信号通信方式与开关 297 的第二输入端连接。开关 297 的输出端以信号通信方式与组合器 225 的第一非反相输入端连接。
     输入缓冲器 210 的输入端可用作解码器 200 的用于接收输入比特流的输入端。具有几何扩展的去块滤波器 265 的第一输出端可用作解码器 200 的用于对输出画面进行输出的输出端。
     如上面所注意的，已经将使用几何区域划分的帧间预测和帧内预测标识为改进视频编码效率的有前途的研究方向，但是增加的计算复杂度的问题是艰巨的并且仍然是有待解决的问题。因此，在本原理的实施例中，提供了使用自适应几何区域划分字典 ( 例如，作为由强力方案所规定的汇编或列表的子集的所定义的汇编或列表 ) 的机制。在保持编码效率的同时减少在编码器和解码器中考虑的几何划分的数量在编码器和解码器两处都提供了益处。
     因此，在实施例中，提供了自适应几何划分字典 ( 例如，所定义的汇编或列表 ) 以便在仍保持良好编码效率的同时减少所考虑的几何模式的数量。其背后的基本构思在于：没有均匀地支持可用于强力计算和列表的所有距离和角度组合的划分。相反，距离步长和角度步长是从块 ( 或区域 ) 的所定义的点 ( 例如，从中心或原点 ) 到边界线的距离的函数。可以使用以下标记方法 (nomenclature)，即， Δρ ＝ h(ρ)， Δθ ＝ g(ρ)，其中和 h() 和 g() 可以是线性和 / 或非线性函数。此外，如上面注意到的， ρ 和 θ 分别表示：沿着到边界线 f(x， y) 的正交方向从原点到 f(x， y) 的距离；以及到 f(x， y) 的正交方向关于水平坐标轴 x 的角度 ( 参见，例如图 8 和图 13)。转到图 3，通过参考标号 300 总地指示图像块的示例性几何划分。通过参考标号 320 总地指示整个图像块，分别通过参考标号 330 和 340 总地指示图像块 320 的位于斜线 350 相对侧的两个划分。
     在实施例中，当 ρ 接近该块的中心 ( 原点 ) 时，支持密集的距离 (Δρ 小 )，而当 ρ 远离该块的中心 ( 原点 ) 时，支持稀疏的距离 (Δρ 大 )( 参见例如图 8 和图 13)。
     在实施例中，当 ρ 接近该块的中心 ( 原点 ) 时，支持密集的角度，而当 ρ 远离该块的中心 ( 原点 ) 时，支持稀疏的角度 (Δρ 大 )( 参见例如图 8 和图 13)。
     在实施例中，以默认字典 ( 例如，所定义的汇编或列表 ) 开始。该实施例可以被认为包含训练阶段和编码阶段。在编码了 Mtraining 个帧、码片或块 ( 其可以被认为对应于训练阶段 ) 之后，分析由已经编码的块选择的划分的统计，并且重新建立用于接下来的 Ncoding 个帧、码片或块的编码 ( 其可以被认为对应于编码阶段 ) 的字典。然后开始另一循环 ( 训练阶段之后是编码阶段 )。可以在一个或多个高级语法元素 ( 例如，码片首标、 SEI 消息、 PPS、 SPS、 NAL 单元首标等等 ) 中指定 Mtraining 和 Ncoding 的数量。它们还可以是预先定义的对于编码器和解码器两者都已知的常数。在解码器处应用相同的例程 ( 参见例如图 9 和图 14)。
     在实施例中，从默认字典开始。在完成了编码当前块之后，根据为当前块选择的划分来调整用于编码下一块的字典。所述调整可以是移除远离由当前块选择的划分的一些划分。所述调整还可以如下：外推当前块的所选择的划分以便预测下一块的划分；以及用于下一块的字典基于该预测的划分。在解码器处应用相同的例程 ( 参见例如图 9 和图 14)。
     在实施例中，从默认字典开始。对于一个块，基于某个率失真准则从默认集合中选择最佳划分，执行几何运动补偿以获得残差，并且编码所述残差。在编码器处重构预测残
     差，并且分析所述预测残差以便推断出新的划分字典，其包括所选择的划分和一些其它划分，并且将划分的索引发送给解码器。假设所述新的字典包括比所述默认集合更少的划分，使得需要更少的比特来将所选择的划分传递到解码器。在解码器侧，重构并且分析残差以便推断出与编码器所使用的字典相同的字典。利用所接收的索引，从该字典中选择划分用于重构该块。
     时间上或空间上相邻的块可以具有相似的内容，并且因此趋于从所述默认字典中的有限数量的划分中选择。与使用具有许多划分的默认字典相比，使用具有更少划分的小字典可以节省编码时间以及用于发信号通知几何划分模式的比特。在实施例中，预先定义被预存储在编码器和解码器两者处的多个几何划分字典。这些字典中的每个字典是默认字典子集。使用索引来指示在编码器处当前使用哪个字典并且在一个或多个高级语法元素 ( 例如，码片首标、 SEI 消息、 PPS、 SPS、 NAL 单元首标等等 ) 中指定该索引，使得解码器可以与编码器同步。仅仅选择字典中的几何划分，以便减少在发送几何划分模式时的开销 ( 参见例如图 11 和图 16)。
     在实施例中，对于编码器应用用户定义的字典，并且例如使用要被传送到解码器的一个或多个高级语法元素 ( 例如，码片首标、 SEI 消息、 PPS、 SPS、 NAL 单元首标等等 ) 在比特流中指定所述用户定义的字典 ( 参见例如图 10 和图 15)。所有上面的实施例需要显式发信号通知所选择的几何划分。如果可以将划分索引嵌入在其它编码信息中，则可以节省编码比特并且可以改进编码效率。在实施例中，从默认字典开始。对于一个块，基于某个率失真准则从默认集合中选择最佳划分，执行几何运动补偿以获得残差，并且编码所述残差。在编码器侧，将几何划分信息嵌入到变换系数或量化系数中。解码器遵循相同的规则以便从所解码的比特流中推断出几何划分。将几何划分索引嵌入到变换系数或量化系数中的一个示例可以是如下。将划分索引信息嵌入到系数总和 M 中。如果划分索引为 n，修改一些系数，使得 M％ k ＝ n，其中， k 为对于编码器和解码器两者都已知的常数，％为模运算。处理后的系数被传送到解码器，并且解码器可以精确地重构相同的残差。然后，其可以推断出该几何划分。因此，节省了用于几何划分的比特 ( 参见例如图 12 和图 17)。
     以下是详细说明如何在压缩系统中构造并使用自适应几何划分字典的具体示例。尽管以下示例基于 MPEG-4AVC 标准，如上所述，本原理可以应用于其它视频编码标准、推荐及其扩展。
     构造自适应字典：
     假设编码块单元的大小为 16×16。对于默认几何划分字典，假设将均匀的采样应用于角度参数和距离参数两者，其中， Δθ ＝ 11.25 以及 Δρ ＝ 1。该字典中可能划分的总数量为 274。
     在构造该示例的自适应字典时，首先执行距离 ρ 的非均匀采样。此外，对于 ρ 的不同值 ( 距离 )，设 Δθ 的角度采样密度不同并且因此 Δθ 是 ρ 的函数， Δθ ＝ g(ρ)。
     具体地，在 16×16 编码块单元的假设下，可以从图 3 计算的 ρ 的最大距离为 11( 小于主对角线的长度的一半 16×1.414/2 ＝ 11.312 的最大整数 )。为了减小字典的大小，减小距离采样间隔并且仅仅考虑 ρ ≤ 7 时的几何划分。类似地，我们减小角度采样间隔。
     对于 ρ 的不同值，使用不同的采样密度来最大化地开发几何划分的效率且同时最小化开销。如下，表 1 对应于依据本原理的实施例的一种示例性采样方法：
     表1
     ρ Δθ 0 22.5 6 可能划分 1 90 4 2 22.5 16 3 90 4 4 90 4 5 90 4 6 90 4 7 90 4表 1 中示出的采样方法对应于 ρ ≤ 7 以及 θ 的非均匀的 ρ 依赖采样，产生总共仅仅 46 个可能划分。假设规则是先验的，编码器和解码器两者可以构造该字典，该字典的元素可以比默认字典的元素少得多。
     使用自适应字典的编码和解码：
     在编码器侧，首先执行搜索以找到最佳划分 ( 其由 (ρ， θ) 表示 ) 以及相关联的运动矢量。然后，使用某种熵编码方法编码 ρ。一种可能的熵编码方法可以包括指数哥伦布码 (Expo-Golomb code)，然而应理解：本原理不限于仅仅前述的码，而是还可以使用其它码。此后，利用 ρ 和预先定义的规则 Δθ ＝ g(ρ)，可以计算 θ 的可能的总数量和 θ 的索引。相应地，可以设计熵编码方法。一种可能的熵编码方法可以是 N 比特固定长度编码，其中可以从 ρ 和 Δθ 来计算 N。
     在解码器侧，首先解码 ρ。利用 ρ 和预先定义的规则 Δθ ＝ g(ρ)，可以计算 θ 的可能的总数量以便帮助解析 θ 的语法并重构其值。
     语法
     表 2 示出了依据本原理实施例的示例性码片级语法。
     slice_header(){ .... adaptive_dictionary_flag if(adaptive_dictionary_flag ＝＝ 1) Geo_partition_derivation_adaptive() else Geo_partition_derivation_default() .... } u(1) 描述符
     在该示例中，假设：除了默认字典之外，在编码器和解码器两者处存储预先定义的自适应字典。
     adaptive_dictionary_flag ：
     adaptive_dictionary_flag 等于 1 指定在解码该码片中的所有几何划分块时利用自适应字典。在函数 Geo_partition_derivation_adaptive() 中定义解码操作，其中，从比特流中解析划分索引，并且从所述预先定义的自适应字典中选择划分。
     adaptive_dictionary_flag 等于 0 指定在解码该码片中的所有几何划分块时利用默认字典。在函数 Geo_partition_derivation_default() 中定义解码操作，其中，从比特流中解析划分索引，并且从所述预先定义的默认字典中选择划分。
     转到图 4，通过参考标号 400 来总地指示使用自适应几何划分编码画面数据的示例性方法。方法 400 包括开始块 405，其将控制传递到功能块 410。功能块 410 构造自适应几何划分字典，并将控制传递到功能块 415。功能块 415 利用自适应几何划分字典搜索最佳几何划分，并将控制传递到功能块 420。功能块 420 使用常规编码模式搜索最佳预测，将利用常规编码模式获得的预测与几何预测进行比较以便选择最佳预测，并将控制传递到判定块 425。判定块 425 确定最佳预测模式是否是几何预测模式。如果是，则将控制传递到功能块 430。否则，将控制传递到功能块 435。
     功能块 430 利用自适应几何划分字典执行用于 ( 多个 ) 几何划分模式的熵编码，并将控制传递到结束块 499。
     功能块 435 执行常规 ( 传统 ) 熵编码，并将控制传递到结束块 499。
     转到图 5，通过参考标号 500 总地指示使用自适应几何划分字典的在编码器侧搜索最佳预测的示例性方法。方法 500 包括开始块 505，其将控制传递到循环限制块 510。循环限制块 510 对于字典中的可能距离 ρ 开始循环 1，并将控制传递到循环限制块 515。循环限制块 515 对于字典中的用于距离 ρ 的可能角度 θ 开始循环 2，并将控制传递到功能块 520。功能块 520 利用参数集合 (ρ， θ) 生成划分，并将控制传递到功能块 525。功能块 525 在给定划分集合的情况下搜索最佳预测者，并将控制传递到循环限制块 530。循环限制块 530 结束循环 1，并将控制传递到循环限制块 535。循环限制块 535 结束循环 2，并将控制传递到结束块 599。
     转到图 6，通过参考标号 600 总地指示使用自适应几何划分字典的用于几何划分模式的熵编码的示例性方法。方法 600 包括开始块 605，其将控制传递到功能块 610。功能块 610 对于所选择的距离 ρ，在字典中查找以找到对应索引，编码该索引，并将控制传递到功能块 615。功能块 615 对于所选择的角度，在字典中查找以便找到对应的索引，编码该索引，并将控制传递到功能块 620。功能块 620 编码该块的剩余模式信息，并将控制传递到功能块 625。功能块 625 编码该块的预测误差 ( 残差 )，并将控制传递到结束块 699。
     转到图 7，通过参考标号 700 总地指示使用自适应几何划分字典解码画面数据的示例性方法。方法 700 包括开始块 705，其将控制传递到功能块 710。功能块 710 构造自适应几何划分字典，并将控制传递到判定块 715。判定块 715 确定当前模式是否是几何划分模式。如果是，则将控制传递到功能块 720。否则，将控制传递到功能块 730。
     功能块 720 利用自适应几何划分字典执行用于几何划分模式块的熵解码，并将控制传递到功能块 725。功能块 725 利用自适应划分字典执行用于几何划分模式块的预测和重构，并将控制传递到结束块 799。功能块 730 执行常规 ( 传统 ) 熵解码，并将控制传递到功能块 735。功能块 735 执行常规 ( 传统 ) 预测和重构，并将控制传递到结束块 799。
     转到图 8，通过参考标号 800 总地指示使用自适应几何划分编码画面数据的示例性方法。在方法 800 中，自适应几何划分字典基于划分边界的角度以及 / 或者其到该块中所定义的点的距离。方法 800 包括开始块 805，其将控制传递到功能块 810。功能块 810 选择多个划分，以便基于划分边界的角度以及 / 或者其到该块中所定义的点的距离来构造自适应几何划分字典，并将控制传递到功能块 815。功能块 815 利用自适应几何划分字典搜索最佳几何预测，并将控制传递到功能块 820。功能块 820 搜索用于常规 ( 即，非几何 ) 编码模式的最佳预测，将用于常规编码模式的预测与几何预测进行比较以便 ( 例如基于率失真 (RD) 成本 ) 选择最佳的预测，并将控制传递到判定块 825。判定块 825 确定最佳预测是否是利用几何预测模式获得的。如果是，则将控制传递到功能块 830。否则，将控制传递到功能块 835。功能块 830 利用自适应几何划分字典熵编码用于几何划分模式的语法元素，并将控制传递到结束块 899。功能块 835 执行常规 ( 传统 ) 熵编码，并将控制传递到结束块 899。
     转到图 9，通过参考标号 900 来总地指示使用自适应几何划分编码画面数据的另一示例性方法。在方法 900 中，自适应几何划分字典基于先前编码区域的信息。方法 900 包括开始块 905，其将控制传递到功能块 910。功能块 910 基于先前编码的 ( 多个 ) 区域的信息，例如基于为先前编码的 ( 多个 ) 其它区域选择的划分和 / 或选择的划分的统计等等，来构造用于 ( 要被编码的 ) 当前块的自适应几何划分字典，并将控制传递到功能块 915。功能块 915 利用自适应几何划分字典搜索最佳几何预测，并将控制传递到功能块 920。功能块 920 搜索用于常规 ( 即，非几何 ) 编码模式的最佳预测，将用于常规编码模式的预测与几何预测进行比较以便 ( 例如基于率失真 (RD) 成本 ) 选择最佳的预测，并将控制传递到判定块 925。判定块 925 确定最佳预测是否是利用几何预测模式获得的。如果是，则将控制传递到功能块 930。否则，将控制传递到功能块 935。功能块 930 利用自适应几何划分字典熵编码用于几何划分模式的语法元素，并将控制传递到结束块 999。功能块 935 执行常规 ( 传统 ) 熵编码，并将控制传递到结束块 999。
     转到图 10，通过参考标号 1000 来总地指示使用自适应几何划分编码画面数据的另一示例性方法。在方法 1000 中，自适应几何划分字典是用户定义的并被传送到解码器。方法 1000 包括开始块 1005，其将控制传递到功能块 1010。功能块 1010 基于用户输入来构造用于 ( 要被编码的 ) 当前块的自适应几何划分字典，并将控制传递到功能块 1015。功能块 1015 将用户定义的字典发送到解码器，并将控制传递到循环限制块 1020。循环限制块 1020 使用具有 1 到 ( 例如当前画面中的 ) 块数量 (#) 的范围的变量 I 在 ( 例如当前画面中的 ) 块上开始循环，并将控制传递到功能块 1025。功能块 1025 利用自适应几何划分字典搜索最佳几何预测，并将控制传递到功能块 1030。功能块 1030 搜索用于常规 ( 即，非几何 ) 编码模式的最佳预测，将用于常规编码模式的预测与几何预测进行比较以便 ( 例如基于率失真 (RD) 成本 ) 选择最佳的预测，并将控制传递到判定块 1035。判定块 1035 确定最佳预测是否是利用几何预测模式获得的。如果是，则将控制传递到功能块 1040。否则，将控制传递到功能块 1045。功能块 1040 利用自适应几何划分字典熵编码用于几何划分模式的语法元素，并将控制传递到循环限制块 1050。功能块 1045 执行常规 ( 传统 ) 熵编码，并将控制传递到循环限制块 1050。循环限制块 1050 结束循环，将控制传递到结束块 1099。
     转到图 11，通过参考标号 1100 来总地指示使用自适应几何划分编码画面数据的另一示例性方法。在方法 1100 中，自适应几何划分字典 ( 即，几何划分子集 ) 是从多个子集 ( 每个子集是例如从默认字典获得的，而所述默认字典是使用例如强力方案获得的 ) 中选择的，并且将该子集或者该子集的索引指示给解码器。方法 1100 包括开始块 1105，其将控制传递到功能块 1110。功能块 1110 从多个子集构造自适应几何划分字典 ( 即，子集 )，并将控制传递到功能块 1115。功能块 1115 指示所选择的几何划分子集或者指示所选择的子集的索引，并将控制传递到循环限制块 1120。循环限制块 1120 使用具有 1 到例如当前画面中的块数量 (#) 的范围的变量 I 在 ( 例如当前画面中的 ) 块上开始循环，并将控制传递到功能块 1125。功能块 1125 利用自适应几何划分字典搜索最佳几何预测，并将控制传递到功能块 1130。功能块 1130 搜索用于常规 ( 即，非几何 ) 编码模式的最佳预测，将用于常规编码模式的预测与几何预测进行比较以便 ( 例如基于率失真 (RD) 成本 ) 选择最佳预测，并将控制传递到判定块 1135。判定块 1135 确定最佳预测是否是利用几何预测模式获得的。如果是，则将控制传递到功能块 1140。否则，将控制传递到功能块 1145。功能块 1140 利用自适应几何划分字典熵编码用于几何划分模式的语法元素，并将控制传递到循环限制块 1150。功能块 1145 执行常规 ( 传统 ) 熵编码，并将控制传递到循环限制块 1150。循环限制块 1150 结束循环，将控制传递到结束块 1199。转到图 12，通过参考标号 1200 来总地指示使用自适应几何划分编码画面数据的另一示例性方法。在方法 1200 中，几何划分模式是由解码器从所解码的残差中推断出的。方法 1200 包括开始块 1205，其将控制传递到功能块 1210。功能块 1210 利用默认几何划分字典搜索最佳几何预测，并将控制传递到功能块 1215。功能块 1215 使用该最佳几何划分编码当前块，处理残差使得在解码器处从所解码的残差中仅能推断出所选择的划分，并且将控制传递到功能块 1220。功能块 1220 搜索用于常规 ( 即，非几何 ) 编码模式的最佳预测，将用于常规编码模式的预测与几何预测进行比较以便 ( 例如基于率失真 (RD) 成本 ) 选择最佳的预测，并将控制传递到判定块 1225。判定块 1225 确定最佳预测是否是利用几何预测模式获得的。如果是，则将控制传递到功能块 1230。否则，将控制传递到功能块 1240。功能块 1230 熵编码用于选择的几何划分模式的残留系数，并将控制传递到功能块 135。功能块 1235 熵编码用于几何划分模式的、除了划分索引之外的其它语法元素，并将控制传递到结束块 1299。功能块 1240 执行常规 ( 传统 ) 熵编码，并将控制传递到结束块 1299。
     这里，给出了如何处理残差使得在解码器处从所解码的残差中仅能推断出所选择的划分的一个示例：将划分信息嵌入到系数总和 M 中。如果划分索引为 n，我们修改一些系数，使得 M％ k ＝ n，其中， k 为对于编码器和解码器两者都已知的常数，％为模运算。处理后的系数被传送到解码器，并且解码器可以精确地重构相同的残差。然后，其可以推断出该几何划分。
     转到图 13，通过参考标号 1300 总地指示使用自适应几何划分字典解码画面数据的示例性方法。在方法 1300 中，自适应几何划分字典基于划分边界的角度以及 / 或者其到该块中所定义的点的距离。方法 1300 包括开始块 1305，其将控制传递到功能块 1310。功能块 1310 通过基于划分边界的角度以及 / 或者其到该块中预先定义的点的距离选择多个划分来构造自适应几何划分字典，并将控制传递到判定块 1315。判定块 1315 确定当前预测
     模式是否是几何预测模式。如果是，则将控制传递到功能块 1320。否则，将控制传递到功能块 1325。功能块 1320 利用自适应几何划分字典执行熵解码以便解码用于几何划分模式的语法元素，并将控制传递到功能块 1325。功能块 1325 利用自适应几何划分字典执行用于几何划分模式的预测和重构，并将控制传递到结束块 1399。功能块 1330 执行常规 ( 传统 ) 熵编码，并将控制传递到功能块 1335。功能块 1335 执行常规 ( 传统 ) 预测和重构，并将控制传递到结束块 1399。
     转到图 14，通过参考标号 1400 总地指示使用自适应几何划分字典解码画面数据的另一示例性方法。在方法 1400 中，自适应几何划分字典基于先前解码区域的信息。方法 1400 包括开始块 1405，其将控制传递到功能块 1410。功能块 1410 基于先前解码的 ( 多个 ) 区域的信息，例如基于为先前编码的 ( 多个 ) 其它区域选择的划分和 / 或选择的划分的统计等等，来构造用于 ( 要被解码的 ) 当前块的自适应几何划分字典，并将控制传递到判定块 1415。判定块 1415 确定当前预测模式是否是几何预测模式。如果是，则将控制传递到功能块 1420。否则，将控制传递到功能块 1430。功能块 1420 利用自适应几何划分字典执行熵解码以便解码用于几何划分模式的语法元素，并将控制传递到功能块 1425。功能块 1425 利用自适应几何划分字典执行用于所述几何划分模式的预测和重构，并将控制传递到结束块 1499。功能块 1430 执行常规 ( 传统 ) 熵编码，并将控制传递到功能块 1435。功能块 1435 执行常规 ( 传统 ) 预测和重构，并将控制传递到结束块 1499。
     转到图 15，通过参考标号 1500 总地指示使用自适应几何划分字典解码画面数据的另一示例性方法。在方法 1500 中，自适应几何划分字典在比特流中传送并且被解码器解析。方法 1500 包括开始块 1505，其将控制传递到功能块 1510。功能块 1510 从比特流中解析用户定义的自适应几何划分字典，并将控制传递到循环限制块 1515。循环限制块 1515 使用具有 1 到例如当前画面中的块数量 (#) 的范围的变量 I 在 ( 例如当前画面中的 ) 块上开始循环，并将控制传递到判定块 1520。判定块 1520 确定当前预测模式是否是几何预测模式。如果是，则将控制传递到功能块 1525。否则，将控制传递到功能块 1535。功能块 1525 利用自适应几何划分字典执行熵解码以便解码用于几何划分模式的语法元素，并将控制传递到功能块 1530。功能块 1530 利用自适应几何划分字典执行用于所述几何划分模式的预测和重构，并将控制传递到循环限制块 1545。功能块 1535 执行常规 ( 传统 ) 熵编码，并将控制传递到功能块 1540。功能块 1540 执行常规 ( 传统 ) 预测和重构，并将控制传递到循环限制块 1545。循环限制块 1545 结束循环，并将控制传递到结束块 1599。
     转到图 16，通过参考标号 1600 总地指示使用自适应几何划分字典解码画面数据的另一示例性方法。在方法 1600 中，自适应几何划分字典的索引在比特流中传送并且被解码器解析。方法 1600 包括开始块 1605，其将控制传递到功能块 1610。功能块 1610 解析子集的索引以便选择正确的子集并构造自适应几何划分字典，并将控制传递到循环限制块 1615。循环限制块 1615 使用具有 1 到例如当前画面中的块数量 (#) 的范围的变量 I 在 ( 例如当前画面中的 ) 块上开始循环，并将控制传递到判定块 1620。判定块 1620 确定当前预测模式是否是几何预测模式。如果是，则将控制传递到功能块 1625。否则，将控制传递到功能块 1635。功能块 1625 利用自适应几何划分字典执行熵解码以便解码用于几何划分模式的语法元素，并将控制传递到功能块 1630。功能块 1630 利用自适应几何划分字典执行用于所述几何划分模式的预测和重构，并将控制传递到循环限制块 1645。功能块 1635 执行常规 ( 传统 ) 熵编码，并将控制传递到功能块 1640。功能块 1640 执行常规 ( 传统 ) 预测和重构，并将控制传递到循环限制块 1645。循环限制块 1645 结束循环，并将控制传递到结束块 1699。
     转到图 17，通过参考标号 1700 总地指示使用自适应几何划分字典解码画面数据的另一示例性方法。在方法 1700 中，解码器从所解码的残差中推断出几何划分模式。方法 1700 包括开始块 1705，其将控制传递到判定块 1710。判定块 1710 确定当前预测模式是否是几何预测模式。如果是，则将控制传递到功能块 1715。否则，将控制传递到功能块 1730。功能块 1715 执行熵解码以便解码残差系数，从重构的残差中推断出划分索引，并将控制传递到功能块 1720。功能块 1720 执行熵解码以便解码用于几何划分模式的其它语法元素，并将控制传递到功能块 1725。功能块 1725 利用自适应几何划分字典执行用于所述几何划分模式的预测和重构，并将控制传递到结束块。功能块 1730 执行常规 ( 传统 ) 熵编码，并将控制传递到功能块 1735。功能块 1735 执行常规 ( 传统 ) 预测和重构，并将控制传递到结束块 1799。
     现在将描述本发明的许多伴随优点 / 特征中的一些，其中的一些已经在上面提及。例如，一个优点 / 特征是一种具有使用自适应几何划分对画面中区域的画面数据进行编码的编码器的装置，其中，响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分子集。所述距离是从该区域内定义的点到划分边界测量的。所述角度是相对于从该区域内的所定义的点到所述划分边界延伸的至少一条线而测量的。
     另一优点 / 特征是具有上述编码器的装置，其中，所述区域内的所定义的点是所述区域的中心，以及响应于从所述区域的中心到划分边界的距离来确定所述几何划分子集。
     另一优点 / 特征是具有所述编码器的装置，如上所述其中所述区域内的所定义的点是所述区域的中心以及响应于从所述区域的中心到划分边界的距离来确定所述几何划分子集，其中，使用距离步长和角度步长来对自适应几何划分的距离空间和角度空间进行采样以便构造几何划分字典，所述距离步长和角度步长是从所定义的点到所述划分边界的距离的函数，所述几何划分子集具有比所述几何划分字典少的几何划分。
     另一优点 / 特征是具有所述编码器的装置，如上所述，其中所述区域内的所定义的点是所述区域的中心以及响应于从所述区域的中心到划分边界的距离来确定所述几何划分子集，其中，所述几何划分子集包括具有从所定义的点到所述划分边界的等于或小于阈值距离的距离的几何划分。
     另一优点 / 特征是具有如上所述的编码器的装置，其中，所述几何划分子集基于所述区域和所述画面中先前编码的其它区域中的至少一个的先前编码信息。
     另一优点 / 特征是具有所述编码器的装置，如上所述，其中所述几何划分子集基于所述区域和所述画面中先前编码的其它区域中的至少一个的先前编码信息，其中，所述几何划分子集基于为所述先前编码的其它区域选择的划分。
     此外，另一优点 / 特征是具有所述编码器的装置，如上所述，其中所述几何划分子集基于为所述先前编码的其它区域选择的划分，其中，为所述区域选择的划分被外推以便预测用于随后区域的划分，并且用于编码随后区域的几何划分子集基于所预测的用于所述随后区域的划分。此外，另一优点 / 特征是具有所述编码器的装置，如上所述，其中所述几何划分子集基于所述区域和所述画面中先前编码的其它区域中的至少一个的先前编码信息，其中，所述几何划分子集是基于为所述先前编码的其它区域选择的划分的统计而导出的。
     而且，另一优点 / 特征是具有所述编码器的装置，如上所述，其中所述几何划分子集是基于为所述先前编码的其它区域选择的划分的统计而导出的，其中，所述画面被包含在视频序列中，使用与强力划分计算方案相对应的默认几何划分字典来编码所述视频序列中的一组画面，每个画面不具有所述区域，为该组画面选择的划分的统计被用来构造用于所述区域的所述几何划分子集，所述子集具有比所述默认字典少的几何划分。
     另外，另一优点 / 特征是具有如上所述的编码器的装置，其中，对于所述自适应几何划分可用的所述几何划分子集是用户定义的并且在作为结果的比特流中显式地发信号通知。
     此外，另一优点 / 特征是具有如上所述的编码器的装置，其中，所述子集是多个子集之一，其中，所述子集以及所述多个子集一起表示小于所有可能划分，所述多个子集是预先存储的，并且其中所述编码器使用一个或多个高级语法元素向解码器发送索引，所述索引指示要用于解码的多个子集中的具体一个或多个子集。
     此外，另一优点 / 特征是具有如上所述的编码器的装置，其中，在比特流中向解码器传送供解码器在解码至少所述区域的画面数据时使用所述几何划分子集。
     而且，另一优点 / 特征是具有如上所述的编码器的装置，其中，所述编码器基于率失真准则从默认几何划分字典中选择用于所述区域的划分，执行几何运动补偿以便获得所述区域的残差，以及重构所述残差，使得仅仅能够在解码器处从所述残差的随后重构中推断出从所述默认几何划分字典中的多个可用划分中选择的划分。
     基于这里的教导，本领域普通技术人员可以容易确定本原理的这些和其它特征和优点。应理解本原理的教导可以以硬件、软件、固件、专用处理器、或其组合的各种形式来实现。
     更优选地，本原理的教导被实现为硬件与软件的组合。此外，软件可以实现为有形地体现在程序存储单元上的应用程序。应用程序可以被上载到包括任何适当架构的机器并由该机器执行。优选地，在具有诸如一个或多个中央处理单元 (“CPU” )、随机存取存储器 (“RAM” )、以及输入 / 输出 (“I/O” ) 接口等的硬件的计算机平台上实现该机器。计算机平台还可以包括操作系统和微指令代码。这里描述的各种处理与功能可以是可能由 CPU 执行的微指令代码的一部分或是应用程序的一部分、或者是其任何组合。另外，各种其它外设单元可以连接到计算机平台，如附加数据存储单元以及打印单元。
     还应理解，由于在附图中描绘的一些组成系统组件和方法优选地以软件实现，因此这些系统组件或处理功能块之间的实际连接可能取决于本原理被编程的方式而有所不同。给出这里的教导，本领域普通技术人员将能够预期本原理的这些和类似的实现方式或配置。
     尽管这里已经参考附图描述了示例实施例，应理解本原理不限于那些确切的实施例，并且本领域普通技术人员可以在其中进行各种改变和修改，而不偏离本原理的范围和精神。所有这些改变和修改意在被包括在所附权利要求阐述的本原理的范围之内。

资源描述

《使用自适应几何划分进行视频编码和解码的方法及装置.pdf》由会员分享，可在线阅读，更多相关《使用自适应几何划分进行视频编码和解码的方法及装置.pdf（37页珍藏版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 102484706 A (43)申请公布日 2012.05.30 C N 1 0 2 4 8 4 7 0 6 A *CN102484706A* (21)申请号 201080037885.2 (22)申请日 2010.06.25 61/220,918 2009.06.26 US H04N 7/26(2006.01) (71)申请人汤姆森特许公司地址法国伊西莱穆利诺 (72)发明人郭力伟尹鹏 J.索尔郑云飞吕小安许茜 (74)专利代理机构北京市柳沈律师事务所 11105 代理人吕晓章 (54) 发明名称使用自适应几何划分进行视频编码和解码的方法及装置 (57。

2、) 摘要提供了使用自适应几何划分进行视频编码和解码的方法和装置。装置包括：编码器(100)，使用自适应几何划分对画面中区域的画面数据进行编码，其中，响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分子集，所述距离是从该区域内的所定义的点到划分边界测量的。所述角度是相对于从该区域内的所定义的点到所述划分边界延伸的至少一条线而测量的。 (30)优先权数据 (85)PCT申请进入国家阶段日 2012.02.27 (86)PCT申请的申请数据 PCT/US2010/001829 2010.06.25 (87)PCT申请的公布数据 WO2010/151334 EN 。

3、2010.12.29 (51)Int.Cl. 权利要求书3页说明书16页附图17页 (19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书 3 页说明书 16 页附图 17 页 1/3页 2 1.一种装置，包括：编码器(100)，用于使用自适应几何划分对画面中区域的画面数据进行编码，其中，响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分的子集，所述距离是从该区域内的点到划分边界测量的，所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。 2.一种视频编码器中的方法，包括：使用自适应几何划分对画面中区域的画面数据进行编码(43。

4、0，615，620，625)，其中，响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分的子集，所述距离是从该区域内的点到划分边界测量的，所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。 3.如权利要求2所述的方法，其中，所述区域内的所述点是所述区域的中心，以及响应于从所述区域的中心到划分边界的距离来确定所述几何划分的子集(810)。 4.如权利要求3所述的方法，其中，使用距离步长和角度步长来对自适应几何划分的距离空间和角度空间进行采样以便构造几何划分字典，所述距离步长和角度步长是从所述点到所述划分边界的距离的函数，所述几何划分的子集具有比所述几。

5、何划分字典少的几何划分(810)。 5.如权利要求3所述的方法，其中，所述几何划分的子集包括：从所述点到所述划分边界的距离等于或小于阈值距离的几何划分。 6.如权利要求2所述的方法，其中，所述几何划分的子集基于所述区域和所述画面中先前编码的其它区域中的至少一个的先前编码信息(910)。 7.如权利要求6所述的方法，其中，所述几何划分的子集基于为所述先前编码的其它区域选择的划分(910)。 8.如权利要求7所述的方法，其中，为所述区域选择的划分被外插以便预测用于随后区域的划分，并且用于编码所述随后区域的几何划分的子集基于所预测的用于所述随后区域的划分(910)。 9.如权利要求6所述。

6、的方法，其中，所述几何划分的子集是基于为所述先前编码的其它区域选择的划分的统计而导出的(910)。 10.如权利要求9所述的方法，其中，所述画面被包含在视频序列中，使用与强力划分计算方案相对应的默认的几何划分字典来编码所述视频序列中每一个不具有所述区域的一组画面，为该组画面选择的划分的统计被用来构造用于所述区域的几何划分的子集，所述子集具有比默认字典少的几何划分。 11.如权利要求2所述的方法，其中，对于所述自适应几何划分可用的所述几何划分的子集是用户定义的并且在作为结果的比特流中被显式地发信号通知(1010，1115)。 12.如权利要求2所述的方法，其中，所述子集是多个子集之一，。

7、其中，所述子集以及所述多个子集一起表示小于所有可能划分，所述多个子集是预先存储的，并且其中所述方法还包括：使用一个或多个高级语法元素向解码器发送索引，所述索引指示要用于解码的多个子集中的特定一个或多个子集(1010，1115)。 13.如权利要求2所述的方法，还包括，在至解码器的比特流中传送要供解码器在解码至少所述区域的画面数据时使用的所述几何划分的子集(1010，1110，1115)。权利要求书CN 102484706 A 2/3页 3 14.如权利要求2所述的方法，其中，所述编码步骤包括：基于率失真准则，从默认几何划分字典中选择用于所述区域的划分；以及执行几何运动补偿。

8、以便获得所述区域的残差，以及重构所述残差，使得在解码器处仅仅能够从所述残差的随后重构中推断出从默认几何划分字典中的多个可用划分中选择的划分(1215)。 15.一种装置，包括：解码器(200)，用于使用自适应几何划分对画面中区域的画面数据进行解码，其中，响应于距离和角度中的至少一个来确定被用来解码该区域的画面数据的几何划分的子集，所述距离是从该区域内的点到划分边界测量的，所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。 16.一种视频解码器中的方法，包括：使用自适应几何划分对画面中区域的画面数据进行解码(720)，其中，响应于距离和角度中的至少一个来确定被用来。

9、解码该区域的画面数据的几何划分的子集，所述距离是从该区域内的点到划分边界测量的，所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。 17.如权利要求16所述的方法，其中，所述区域内的所述点是所述区域的中心，以及响应于从所述区域的中心到所述划分边界的距离来确定所述几何划分的子集(1310)。 18.如权利要求17所述的方法，其中，使用距离步长和角度步长来对自适应几何划分的距离空间和角度空间进行采样以便构造几何划分字典，所述距离步长和角度步长是从所述点到所述划分边界的距离的函数，所述几何划分的子集具有比所述几何划分字典少的几何划分(1310)。 19.如权利要求17所述。

10、的方法，其中，所述几何划分的子集包括：从所述点到所述划分边界的距离等于或小于阈值距离的几何划分。 20.如权利要求16所述的方法，其中，所述几何划分的子集基于所述区域和所述画面中先前解码的其它区域中的至少一个的先前解码信息(1410)。 21.如权利要求16所述的方法，其中，所述子集是多个子集之一，其中，所述子集以及所述多个子集一起表示小于所有可能划分，所述多个子集是预先存储的，并且其中所述方法还包括：在一个或多个高级语法元素中接收索引，所述索引指示要用于解码的多个子集中的特定一个或多个子集(1610)。 22.如权利要求16所述的方法，在来自编码器的比特流中接收所述几何划分的子集以。

11、用于解码至少所述区域的画面数据(1510)。 23.如权利要求16所述的方法，其中，所述解码步骤包括：在比特流中接收残差，所述残差是通过以下操作先前形成的：基于率失真准则从默认几何划分字典中选择用于所述区域的划分，执行几何运动补偿以便获得所述区域的残差，以及重构所述残差，使得在解码器处从所述残差的随后重构中仅仅能够推断出从默认几何划分字典中的多个可用划分中选择的划分(1715)。 24.一种在其上编码有视频信号数据的非暂时存储介质，包括：使用自适应几何划分编码的画面中区域的画面数据，其中，响应于距离和角度中的至少一个来确定被用来编码该区域的画面数据的几何划分的子集，所述距离是从该。

12、区域内的权利要求书CN 102484706 A 3/3页 4 点到划分边界测量的，所述角度是相对于从该区域内的所述点到所述划分边界延伸的线而测量的。权利要求书CN 102484706 A 1/16页 5 使用自适应几何划分进行视频编码和解码的方法及装置 0001 相关申请的交叉引用 0002 本申请要求2009年6月26日提交的美国临时申请序列号No.61/220,918(代理人案号No.PU090067)的权益，通过引用将其内容全部并入于此。技术领域 0003 本原理一般地涉及视频编码和解码，并且更具体地涉及使用自适应几何划分 (geometric partitio。

13、n)进行视频编码和解码的方法及装置。背景技术 0004 帧划分是有效的视频编码中至关重要的处理。大多数当前的视频压缩技术使用基于树的帧划分。一种示例的当前视频压缩技术涉及国际标准化组织/国际电工委员会 (ISO/IEC)运动画面专家组-4(MPEG-4)第10部分高级视频编码(AVC)标准/国际电信联盟电信分部(ITU-T)H.264推荐(下文中“MPEG-4AVC标准”)。MPEG-4AVC标准中的帧划分比简单的均匀(uniform)块划分更有效，所述均匀块划分典型地被用于诸如MPEG-2的更老的视频编码标准中。然而，基于树的帧划分仍没有足够有效地编码视频信息，这是因为其不能捕捉。

14、二维(2D)数据的几何结构。 0005 尽管已经提出几何自适应的块划分来改进编码效率，但是其以复杂度为代价来改进编码效率。为了获得改进的性能，第一种现有技术方案支持基于每个距离和角度的所有划分模式。在该第一种现有技术方案中，使用用于对块进行划分的简单的自适应模型。更具体地，使用直线模型来适应角度和位置，以便捕捉可预测区域的局部几何统计依赖性。通过发送两个索引来执行线编码。这两个索引中的每一个对应于到该块的中心的角度和距离的值。距离和角度的量化步骤可以被固定在高级语法上，以便在被耗费用于编码该划分的比特方面具有最佳的率失真(R-D)折衷(同样，如果需要，对最大允许的计算复杂度的控制。

15、)。 0006 第二种现有技术方案试图通过将角度限制为垂直、水平或斜线(diagonal) (+45度或-45度)定向来降低划分模式复杂度。然而，与第一种现有技术方案相比，这降级了性能。 0007 为了解决这样的局限性，第一种现有技术方案提出了一种通过考虑2D视频数据的2D几何来更好地表现并编码该2D视频数据的方法。也就是说，第一种现有技术方案对于帧间预测(INTER 1616GEO，INTER 88GEO)和帧内预测(INTRA 1616GEO，INTRA 88GEO)两者的一组新模式使用楔形划分(即，由任意线或曲线分离的两个区域中的块的划分)。 0008 通过线的隐式来建模块内的几。

16、何划分。这里，划分被如下地定义： 0009 f(x，y)x cos+ysin- 0010 其中，和分别表示：沿着到f(x，y)的正交方向从原点到边界线f(x，y)的距离；以及到f(x，y)的正交方向与水平坐标轴x的角度。说明书CN 102484706 A 2/16页 6 0011 将每个块像素(x，y)分类，使得： 0012 0013 为了编码的目的，可能的几何划分(或几何模式)的字典(所定义的汇编或列表) 是先验定义的。这可以通过如下地为f(x，y)的每个参数确定值范围和采样精度来正式地定义： 0014 和 0015 以及 0016 和 0017 其中，和是所选择的量化(参数分辨率。

17、)步长，MB size 是宏块的大小。和的量化索引为传送的用于编码划分边界线的信息。然而，如果在编码例程中使用模式 168和816，则对于0的情况可以从一组可能边缘中移除角度0和90。 0018 在第一种现有技术方案中提出的实施例内，对于几何自适应的运动补偿模式，执行对于每个划分的、和运动矢量的搜索，以便找到最佳配置。以两个阶段执行完全搜索策略，使得对于每个、对，搜索最佳的运动矢量。在几何自适应的帧内预测模式内，执行对于每个划分的、和最佳预测者(直接预测、或统计等)的搜索，以便找到最佳配置。 0019 在编码器侧，如果使用完全搜索，几何模式的计算复杂度可能非常高。在解码器侧，解码器。

18、需要支持所有的划分模式。如果使用查找表格来降低模式形状的实时计算，则表格将非常大。 0020 在第二种现有技术方案中描述的其它几何划分工作通过仅仅允许垂直、水平或斜线(+45度或-45度)定向而试图减少几何模式的数量。这确实降低了确定的复杂度，但确实是以降级的编码性能为代价的。发明内容 0021 通过本原理解决现有技术的这些和其它缺陷和缺点，本原理针对使用自适应几何划分进行视频编码和解码的方法和装置。 0022 根据本原理的一个方面，提供了一种装置。该装置包括使用自适应几何划分对画面中区域的画面数据进行编码的编码器，其中，响应于距离和角度中的至少一个来确定被用来编码该区域的画面数。

19、据的几何划分子集。所述距离是从该区域内的所定义的点到划分边界测量的。所述角度是相对于至少一条从该区域内的所定义的点到划分边界延伸的线而测量的。 0023 根据本原理的另一方面，提供了一种视频编码器中的方法。该方法包括使用自适应几何划分对画面中区域的画面数据进行编码，其中，响应于距离和角度中的至少一个来说明书CN 102484706 A 3/16页 7 确定被用来编码该区域的画面数据的几何划分子集。所述距离是从该区域内的所定义的点到划分边界测量的。所述角度是相对于至少一条从该区域内的所定义的点到划分边界延伸的线而测量的。 0024 根据本原理的又一方面，提供了一种装置。该装置包括。

20、使用自适应几何划分对画面中区域的画面数据进行解码的解码器，其中，响应于距离和角度中的至少一个来确定被用来解码该区域的画面数据的几何划分子集。所述距离是从该区域内的所定义的点到划分边界测量的。所述角度是相对于至少一条从该区域内的所定义的点到划分边界延伸的线而测量的。 0025 根据本原理的再一方面，提供了一种视频解码器中的方法。该方法包括使用自适应几何划分对画面中区域的画面数据进行解码，其中，响应于距离和角度中的至少一个来确定被用来解码该区域的画面数据的几何划分子集。所述距离是从该区域内的所定义的点到划分边界测量的。所述角度是相对于至少一条从该区域内的所定义的点到划分边界延伸的线。

21、而测量的。 0026 本原理的这些和其它方面、特征和优点将从示例实施例的以下具体描述中变得明显，将结合附图阅读以下具体描述。附图说明 0027 依据以下示例性图将更好地理解本原理，其中： 0028 图1是依据本原理实施例的可以应用本原理的示例性编码器的框图； 0029 图2是依据本原理实施例的可以应用本原理的示例性解码器的框图； 0030 图3是依据本原理实施例的可以应用本原理的图像块的示例性几何划分的框图； 0031 图4是依据本原理实施例的使用自适应几何划分来编码画面数据的示例性方法的流程图； 0032 图5是依据本原理实施例的使用自适应几何划分字典在编码器侧搜索最佳预测的示例性方。

22、法的流程图； 0033 图6是依据本原理实施例的利用自适应几何划分字典用于几何划分模式的熵编码的示例性方法的流程图； 0034 图7是依据本原理实施例的使用自适应几何划分字典来解码画面数据的示例性方法的流程图； 0035 图8是依据本原理实施例的使用自适应几何划分字典来编码画面数据的另一示例性方法的流程图； 0036 图9是依据本原理实施例的使用自适应几何划分字典来编码画面数据的另一示例性方法的流程图； 0037 图10是依据本原理实施例的使用自适应几何划分字典来编码画面数据的另一示例性方法的流程图； 0038 图11是依据本原理实施例的使用自适应几何划分字典来编码画面数据的另一示。

23、例性方法的流程图； 0039 图12是依据本原理实施例的使用自适应几何划分字典来编码画面数据的另一示例性方法的流程图；说明书CN 102484706 A 4/16页 8 0040 图13是依据本原理实施例的使用自适应几何划分字典来解码画面数据的另一示例性方法的流程图； 0041 图14是依据本原理实施例的使用自适应几何划分字典来解码画面数据的另一示例性方法的流程图； 0042 图15是依据本原理实施例的使用自适应几何划分字典来解码画面数据的另一示例性方法的流程图； 0043 图16是依据本原理实施例的使用自适应几何划分字典来解码画面数据的另一示例性方法的流程图；以及 0044 。

24、图17是依据本原理实施例的使用自适应几何划分字典来解码画面数据的另一示例性方法的流程图。具体实施方式 0045 本原理针对使用自适应几何划分进行视频编码和解码的方法和装置。 0046 本描述例示了本原理。因此，将理解，本领域技术人员将能够开发尽管未在这里明确描述或示出但是体现本原理并且被包括在本原理的精神和范围之内的各种布置。 0047 在此叙述的所有示例和条件性语言意欲用于教导的目的以便帮助读者理解本原理以及由发明人贡献以推动现有技术发展的构思，并且应该被解释为不局限于这样具体叙述的示例和条件。 0048 另外，在这里叙述本原理的原理、方面和实施例及其具体示例的所有陈述意欲包括其。

25、结构和功能上的等效物。另外，意图是：这样的等效物包括当前已知的等效物以及将来开发的等效物二者，即所开发的执行相同功能的任何元件，而不论其结构如何。 0049 因此，例如，本领域技术人员将认识到：在此呈现的框图表示体现本原理的例示性电路的概念性视图。类似地，将认识到：任何流程图示(flow chart)、流程图(flow diagram)、状态转换图、伪代码等表示实质上可以表示在计算机可读介质中并因此由计算机或处理器执行的各种处理，而不管是否明确地示出这样的计算机或处理器。 0050 可以通过使用专用硬件以及与适当的软件相关联的能够执行软件的硬件来提供图中示出的各种元件的功能。当利用处理。

26、器来提供所述功能时，可以利用单个专用处理器、利用单个共享处理器、或者利用其中一些可被共享的多个独立处理器来提供所述功能。另外，术语“处理器”或“控制器”的明确使用不应该被解释为排他性地指代能够执行软件的硬件，而是可以隐含地没有限制地包括数字信号处理器(“DSP”)硬件、用于存储软件的只读存储器(“ROM”)、随机存取存储器(“RAM”)、和非易失性存储装置。 0051 还可以包括其它传统的和/或定制的硬件。类似地，图中示出的任何开关只是概念性的。它们的功能可以通过程序逻辑的运行、通过专用逻辑、通过程序控制和专用逻辑的交互、或者甚至手动地来执行，如从上下文更具体地理解的，实施者可选择。

27、具体技术。 0052 在其权利要求中，被表示为用于执行指定功能的部件的任何元件意欲包含执行那个功能的任何方式，例如包括：a)执行那个功能的电路元件的组合或者b)与适当电路相组合的任何形式的软件，所述软件因此包括固件或微代码等，所述适当电路用于执行该软件以执行所述功能。由这种权利要求限定的本发明在于如下事实，即，以权利要求所要求的方式将由各种所叙述的部件提供的功能组合和集合到一起。因此认为可以提供那些功能的任说明书CN 102484706 A 5/16页 9 何部件与在此示出的那些部件等效。 0053 在本说明书中提到的本原理的“一个实施例”或“实施例”及其其它变型意味着：结合所。

28、述实施例描述的具体特征、结构、特性等被包括在本原理的至少一个实施例中。因此，在说明书各处出现的短语“在一个实施例中”和“在实施例中”、以及任何其它变型不一定都指代相同的实施例。 0054 应当认识到，例如在“A/B”、“A和/或B”和“A和B中的至少一个”的情况中，“/”、 “和/或”以及“至少一个”任何一个的使用意欲包括对于仅仅第一个列出的选项(A)的选择、或对于仅仅第二个列出的选项(B)的选择、或者对于两个选项(A和B)的选择。作为另一示例，在“A、B和/或C”以及“A、B和C中的至少一个”的情况中，这种措辞意欲包括对于仅仅第一个列出的选项(A)的选择、或对于仅仅第二个列出的选项。

29、(B)的选择、或对于仅仅第三个列出的选项(C)的选择、或对于仅仅第一个和第二个列出的选项(A和B)的选择、或对于仅仅第一个和第三个列出的选项(A和C)的选择、或对于仅仅第二个和第三个列出的选项(B和C)的选择、或者对于全部三个选项(A和B和C)的选择。如本领域和相关领域普通技术人员容易认识到的，这可以被扩展用于很多列出的条目。 0055 此外，应理解，尽管这里关于MPEG-4AVC标准来描述本原理的一个或多个实施例，但本原理不仅仅限于该标准，并且因此可以关于其它视频编码标准、推荐、及其扩展(包括 MPEG-4AVC标准的扩展)而被利用，同时保持本原理的精神。 0056 而且，如这里所。

30、使用的，词语“画面”和“图像”被可互换地使用，并且指代静止图像或来自视频序列的画面。如已知的，画面可以是帧或场。 0057 如这里所使用的，“高级语法”指代在层级上驻留在宏块层之上的比特流中表现的语法。例如，如这里所使用的，高级语法可以指代但不限于：码片首标级、补充增强信息 (SEI)级、画面参数集(PPS)级、序列参数集(SPS)级、和网络抽象层(NAL)单元首标级处的语法。 0058 此外，如这里所使用的，词语“发信号通知”指代向对应解码器指示某些内容 (something)。例如，编码器可以发信号通知来自多个几何划分子集中的具体一个几何划分子集，以便使得解码器得知在编码器侧使用哪。

31、个具体子集。以此方式，在编码器侧和解码器侧两处可以使用相同的子集。因此，例如，编码器可以将子集传送到解码器，使得解码器可以使用相同的具体子集，或者如果解码器已经具有该具体子集以及其它子集，则可以使用信令(而非传送)来简单地允许解码器知道并选择该具体子集。通过避免传送任何实际子集，可以实现比特节省。应理解，可以以多种方式来完成发信号通知。例如，可以使用一个或多个语法元素、标志等来向对应解码器发信号通知信息。 0059 另外，如这里所使用的，短语“画面区域”(或简单地简称为“区域”)指代包含例如一个或多个块或任何大小的任意形状、以及/或者另外由一个或多个块或任何大小的任意形状表示的画。

32、面的一部分。所述一个或多个块可能涉及例如超宏块、宏块、宏块划分、子宏块划分等等。在一个示例中，区域可以是块，在该情况下，划分边界可以是该块的边缘。给出这里提供的本原理的教导，本领域和相关领域中的普通技术人员容易确定可以被认为是 (画面内的)区域以及可以被认为是区域的划分边界的这些和其它变型，同时保持本原理的精神。 0060 此外，如这里所使用的，短语“随后区域”指代画面或视频序列中尚未被编码或解说明书CN 102484706 A 6/16页 10 码的区域。该短语被用来区分正在被编码或解码的(当前)区域。 0061 此外，如这里所使用的，短语“几何划分子集”指代比可能在强力(bru。

33、te force)计算或列表中可用的所有几何划分小的几何划分编组。以此方式，减少了对应编码器或解码器需要考虑的几何划分的总数。 0062 而且，如这里所使用的，短语“距离空间”指代几何模式的距离参数的所有允许值的集合。例如，对于1616块，距离的最大值为11.312(主对角线的长度，161.414/2)，而最小值为0(因为其不可能为负)。由于存在过多的距离参数的选择，在构造几何划分字典时，仅从整个空间中选择有限数量的值(该“选择”被称作“采样”)。 0063 另外，如这里所使用的，短语“角度空间”指代角度参数的所有允许值的集合。当距离参数为0时，角度空间为0，180)(即，其可以是。

34、等于或大于0但小于180的任何值)。当距离参数大于0时，角度空间为0，360)(即，其可以是等于或大于0但小于360的任何值)。 0064 如上面注意到的，本原理针对使用自适应几何划分进行视频编码和解码的方法和装置。 0065 转到图1，由参考标号100总地指示能够依据MPEG-4AVC标准执行视频编码的视频编码器。视频编码器100包括帧排序缓冲器110，该帧排序缓冲器110具有与组合器185 的非反相输入端进行信号通信的输出端。组合器185的输出端以信号通信方式与具有几何扩展的变换器和量化器125的第一输入端连接。具有几何扩展的变换器和量化器125的输出端以信号通信方式与具有几何。

35、扩展的熵编码器145的第一输入端以及具有几何扩展的逆变换器和逆量化器150的第一输入端连接。具有几何扩展的熵编码器145的输出端以信号通信方式与组合器190的第一非反相输入端连接。组合器190的输出端以信号通信方式与输出缓冲器135的第一输入端连接。 0066 具有几何扩展的编码器控制器105的第一输出端以信号通信方式与帧排序缓冲器110的第二输入端、具有几何扩展的逆变换器和逆量化器150的第二输入端、画面类型判定模块115的输入端、具有几何扩展的宏块类型(MB类型)判定模块120的第一输入端、具有几何扩展的帧内预测模块160的第二输入端、具有几何扩展的去块滤波器165的第二输入。

36、端、具有几何扩展的运动补偿器170的第一输入端、具有几何扩展的运动估计器175的第一输入端、和参考画面缓冲器180的第二输入端连接。 0067 具有几何扩展的编码器控制器105的第二输出端以信号通信方式与补充增强信息(SEI)插入器130的第一输入端、具有几何扩展的变换器和量化器125的第二输入端、具有几何扩展的熵编码器145的第二输入端、输出缓冲器135的第二输入端、以及序列参数集 (SPS)和画面参数集(PPS)插入器140的输入端连接。 0068 SEI插入器130的输出端以信号通信方式与组合器190的第二非反相输入端连接。 0069 画面类型判定模块115的第一输出端以信号通信方。

37、式与帧排序缓冲器110的第三输入端连接。画面类型判定模块115的第二输出端以信号通信方式与具有几何扩展的宏块类型判定模块120的第二输入端连接。 0070 序列参数集(SPS)和画面参数集(PPS)插入器140的输出端以信号通信方式与组合器190的第三非反相输入端连接。 0071 具有几何扩展的逆量化器和逆变换器150的输出端以信号通信方式与组合器119 说明书CN 102484706 A 10 7/16页 11 的第一非反相输入端连接。组合器119的输出端以信号通信方式与具有几何扩展的帧内预测模块160的第一输入端和具有几何扩展的去块滤波器165的第一输入端连接。具有几何扩展的。

38、去块滤波器165的输出端以信号通信方式与参考画面缓冲器180的第一输入端连接。参考画面缓冲器180的输出端以信号通信方式与具有几何扩展的运动估计器175的第二输入端、以及具有几何扩展的运动补偿器170的第三输入端连接。具有几何扩展的运动估计器175的第一输出端以信号通信方式与具有几何扩展的运动补偿器170的第二输入端连接。具有几何扩展的运动估计器175的第二输出端以信号通信方式与具有几何扩展的熵编码器145的第三输入端连接。 0072 具有几何扩展的运动补偿器170的输出端以信号通信方式与开关197的第一输入端连接。具有几何扩展的帧内预测模块160的输出端以信号通信方式与开关197。

39、的第二输入端连接。具有几何扩展的宏块类型判定模块120的输出端以信号通信方式与开关197的第三输入端连接。开关197的第三输入端确定开关的“数据”输入(与控制输入(即，第三输入端)相比)是由具有几何扩展的运动补偿器170提供还是由具有几何扩展的帧内预测模块160提供。开关197的输出端以信号通信方式与组合器119的第二非反相输入端和组合器185的反向输入端连接。 0073 帧排序缓冲器110的第一输入端和具有几何扩展的编码器控制器105的输入端可用作编码器100的用于接收输入画面101的输入端。此外，补充增强信息(SEI)插入器130 的第二输入端可用作编码器100的用于接收元数据。

40、的输入端。输出缓冲器135的输出端可用作编码器100的用于输出比特流的输出端。 0074 转到图2，通过参考标号200总地指示能够依据MPEG-4AVC标准执行视频解码的视频解码器。视频解码器200包括输入缓冲器210，该输入缓冲器210具有以信号通信方式与具有几何扩展的熵解码器245的第一输入端连接的输出端。具有几何扩展的熵解码器245 的第一输出端以信号通信方式与逆变换器和逆量化器250的第一输入端连接。具有几何扩展的逆变换器和逆量化器250的输出端以信号通信方式与组合器225的第二非反相输入端连接。组合器225的输出端以信号通信方式与具有几何扩展的去块滤波器265的第二输入端。

41、和具有几何扩展的帧内预测模块260的第一输入端连接。具有几何扩展的去块滤波器 265的第二输出端以信号通信方式与参考画面缓冲器280的第一输入端连接。参考画面缓冲器280的输出端以信号通信方式与具有几何扩展的运动补偿器270的第二输入端连接。 0075 具有几何扩展的熵解码器245的第二输出端以信号通信方式与具有几何扩展的运动补偿器270的第三输入端和具有几何扩展的去块滤波器265的第一输入端连接。具有几何扩展的熵解码器245的第三输出端以信号通信方式与具有几何扩展的解码器控制器 205的输入端连接。具有几何扩展的解码器控制器205的第一输出端以信号通信方式与具有几何扩展的熵解码器24。

42、5的第二输入端连接。具有几何扩展的解码器控制器205的第二输出端以信号通信方式与具有几何扩展的逆变换器和逆量化器250的第二输入端连接。具有几何扩展的解码器控制器205的第三输出端以信号通信方式与具有几何扩展的去块滤波器265的第三输入端连接。具有几何扩展的解码器控制器205的第四输出端以信号通信方式与具有几何扩展的帧内预测模块260的第二输入端、具有几何扩展的运动补偿器270 的第一输入端、以及参考画面缓冲器280的第二输入端连接。 0076 具有几何扩展的运动补偿器270的输出端以信号通信方式与开关297的第一输入说明书CN 102484706 A 11 8/16页 12 端。

43、连接。具有几何扩展的帧内预测模块260的输出端以信号通信方式与开关297的第二输入端连接。开关297的输出端以信号通信方式与组合器225的第一非反相输入端连接。 0077 输入缓冲器210的输入端可用作解码器200的用于接收输入比特流的输入端。具有几何扩展的去块滤波器265的第一输出端可用作解码器200的用于对输出画面进行输出的输出端。 0078 如上面所注意的，已经将使用几何区域划分的帧间预测和帧内预测标识为改进视频编码效率的有前途的研究方向，但是增加的计算复杂度的问题是艰巨的并且仍然是有待解决的问题。因此，在本原理的实施例中，提供了使用自适应几何区域划分字典(例如，作为由强力方。

44、案所规定的汇编或列表的子集的所定义的汇编或列表)的机制。在保持编码效率的同时减少在编码器和解码器中考虑的几何划分的数量在编码器和解码器两处都提供了益处。 0079 因此，在实施例中，提供了自适应几何划分字典(例如，所定义的汇编或列表)以便在仍保持良好编码效率的同时减少所考虑的几何模式的数量。其背后的基本构思在于：没有均匀地支持可用于强力计算和列表的所有距离和角度组合的划分。相反，距离步长和角度步长是从块(或区域)的所定义的点(例如，从中心或原点)到边界线的距离的函数。可以使用以下标记方法(nomenclature)，即，h()，g()，其中和h()和 g()可以是线性和/或非线性函。

45、数。此外，如上面注意到的，和分别表示：沿着到边界线f(x，y)的正交方向从原点到f(x，y)的距离；以及到f(x，y)的正交方向关于水平坐标轴x的角度(参见，例如图8和图13)。 0080 转到图3，通过参考标号300总地指示图像块的示例性几何划分。通过参考标号 320总地指示整个图像块，分别通过参考标号330和340总地指示图像块320的位于斜线 350相对侧的两个划分。 0081 在实施例中，当接近该块的中心(原点)时，支持密集的距离(小)，而当远离该块的中心(原点)时，支持稀疏的距离(大)(参见例如图8和图13)。 0082 在实施例中，当接近该块的中心(原点)时，支持密集的角度，。

46、而当远离该块的中心(原点)时，支持稀疏的角度(大)(参见例如图8和图13)。 0083 在实施例中，以默认字典(例如，所定义的汇编或列表)开始。该实施例可以被认为包含训练阶段和编码阶段。在编码了M training 个帧、码片或块(其可以被认为对应于训练阶段)之后，分析由已经编码的块选择的划分的统计，并且重新建立用于接下来的N coding 个帧、码片或块的编码(其可以被认为对应于编码阶段)的字典。然后开始另一循环(训练阶段之后是编码阶段)。可以在一个或多个高级语法元素(例如，码片首标、SEI消息、PPS、 SPS、NAL单元首标等等)中指定M training 和N coding 。

47、的数量。它们还可以是预先定义的对于编码器和解码器两者都已知的常数。在解码器处应用相同的例程(参见例如图9和图14)。 0084 在实施例中，从默认字典开始。在完成了编码当前块之后，根据为当前块选择的划分来调整用于编码下一块的字典。所述调整可以是移除远离由当前块选择的划分的一些划分。所述调整还可以如下：外推当前块的所选择的划分以便预测下一块的划分；以及用于下一块的字典基于该预测的划分。在解码器处应用相同的例程(参见例如图9和图14)。 0085 在实施例中，从默认字典开始。对于一个块，基于某个率失真准则从默认集合中选择最佳划分，执行几何运动补偿以获得残差，并且编码所述残差。在编码器处重。

48、构预测残说明书CN 102484706 A 12 9/16页 13 差，并且分析所述预测残差以便推断出新的划分字典，其包括所选择的划分和一些其它划分，并且将划分的索引发送给解码器。假设所述新的字典包括比所述默认集合更少的划分，使得需要更少的比特来将所选择的划分传递到解码器。在解码器侧，重构并且分析残差以便推断出与编码器所使用的字典相同的字典。利用所接收的索引，从该字典中选择划分用于重构该块。 0086 时间上或空间上相邻的块可以具有相似的内容，并且因此趋于从所述默认字典中的有限数量的划分中选择。与使用具有许多划分的默认字典相比，使用具有更少划分的小字典可以节省编码时间以及用于。

49、发信号通知几何划分模式的比特。在实施例中，预先定义被预存储在编码器和解码器两者处的多个几何划分字典。这些字典中的每个字典是默认字典子集。使用索引来指示在编码器处当前使用哪个字典并且在一个或多个高级语法元素 (例如，码片首标、SEI消息、PPS、SPS、NAL单元首标等等)中指定该索引，使得解码器可以与编码器同步。仅仅选择字典中的几何划分，以便减少在发送几何划分模式时的开销(参见例如图11和图16)。 0087 在实施例中，对于编码器应用用户定义的字典，并且例如使用要被传送到解码器的一个或多个高级语法元素(例如，码片首标、SEI消息、PPS、SPS、NAL单元首标等等)在比特流中指定所述用户定义的字典(参见例如图10和图15)。 0088 所有上面的实施例需要显式发信号通知所选择的几何划分。如果可以将划分索引嵌入在。

展开阅读全文