1、(10)申请公布号 CN 103947205 A (43)申请公布日 2014.07.23 CN 103947205 A (21)申请号 201280056960.9 (22)申请日 2012.11.16 61/561,819 2011.11.18 US 61/561,803 2011.11.18 US 13/678,334 2012.11.15 US H04N 19/159(2014.01) (71)申请人 高通股份有限公司 地址 美国加利福尼亚州 (72)发明人 钱威俊 穆罕默德蔡德科班 马尔塔卡切维奇 (74)专利代理机构 北京律盟知识产权代理有限 责任公司 11287 代理人 宋献涛
2、(54) 发明名称 帧内模式译码中的参考模式选择 (57) 摘要 视频译码器可对于当前视频块确定第一最可 能帧内预测模式及第二最可能帧内预测模式, 且 基于所述第一及第二最可能帧内预测模式, 确定 用以译码所述当前视频块的实际帧内预测模式的 估计。可通过响应于所述第一最可能模式及所述 第二最可能模式两者为不同的角度预测模式而选 择所述第一最可能模式及所述第二最可能模式中 的一者作为所述实际帧内预测的所述估计来确定 所述实际帧内预测模式的所述估计。可使用所述 实际帧内预测模式的所述估计加上差信息来识别 用以译码所述当前视频块的所述实际帧内预测模 式。 (30)优先权数据 (85)PCT国际申请进
3、入国家阶段日 2014.05.19 (86)PCT国际申请的申请数据 PCT/US2012/065532 2012.11.16 (87)PCT国际申请的公布数据 WO2013/074935 EN 2013.05.23 (51)Int.Cl. 权利要求书 4 页 说明书 19 页 附图 7 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书4页 说明书19页 附图7页 (10)申请公布号 CN 103947205 A CN 103947205 A 1/4 页 2 1. 一种用于译码视频数据的方法, 所述方法包括 : 对于当前视频块, 确定第一最可能帧内预测模式及第二最可能
4、帧内预测模式 ; 基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式, 确定用以译码所 述当前视频块的实际帧内预测模式的估计, 其中确定所述实际帧内预测模式的所述估计包 括 : 响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧 内预测模式, 选择所述第一最可能模式作为所述实际帧内预测模式的所述估计 ; 响应于所述第一最可能模式与所述第二最可能模式两者为不同的角度预测模式, 选择 所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所述估计。 2. 根据权利要求 1 所述的方法, 其中选择所述第一最可能模式及所述第二最可能模式 中的所述一者作为所述
5、实际帧内预测模式的所述估计包括 : 确定所述第一最可能模式及所述第二最可能中的哪一者为角度较接近于垂直角度的 最可能模式 ; 以及, 选择所述角度较接近于所述垂直角度的所述最可能模式作为所述实际帧内预测模式 的所述估计。 3. 根据权利要求 1 所述的方法, 其中选择所述第一最可能模式及所述第二最可能模式 中的所述一者作为所述实际帧内预测模式的所述估计包括选择所述第一最可能模式及所 述第二最可能模式中的不在垂直角度与水平角度之间的那一者。 4. 根据权利要求 1 所述的方法, 其中选择所述第一最可能模式及所述第二最可能模式 中的所述一者作为所述实际帧内预测模式的所述估计包括用信号通知所述第一最
6、可能模 式及所述第二最可能模式中的一者为所述实际帧内预测模式的所述估计。 5. 根据权利要求 1 所述的方法, 其中选择所述第一最可能模式及所述第二最可能模式 中的所述一者作为所述实际帧内预测模式的所述估计包括选择所述第一最可能模式及所 述第二最可能模式中的具有较小帧内模式数目的那一者作为所述实际帧内预测模式的所 述估计。 6. 根据权利要求 1 所述的方法, 其中选择所述第一最可能模式及所述第二最可能模式 中的所述一者作为所述实际帧内预测模式的所述估计是至少部分基于一或多个相邻的信 息块。 7. 根据权利要求 1 所述的方法, 其中选择所述第一最可能模式及所述第二最可能模式 中的所述一者作为
7、所述实际帧内预测模式的所述估计包括选择所述第一最可能模式及所 述第二最可能模式中的与在大小上较接近于所述当前视频块的视频数据块相关联的那一 者。 8. 根据权利要求 1 所述的方法, 其中所述方法由视频解码器执行, 且所述方法进一步 包括 : 接收差信息 ; 以及 基于所述差信息及所述实际帧内预测模式的所述估计确定用于所述当前视频块的实 际帧内预测模式。 9. 根据权利要求 8 所述的方法, 其进一步包括 : 使用所述实际帧内预测模式产生经重建视频块。 权 利 要 求 书 CN 103947205 A 2 2/4 页 3 10. 根据权利要求 1 所述的方法, 其中所述方法由视频编码器执行,
8、且所述方法进一步 包括 : 在经编码位流中用信号通知差信息, 其中所述差信息识别用于所述当前块的实际帧内 预测模式与所述实际帧内预测模式的所述估计之间的差。 11. 一种用于译码视频数据的装置, 所述装置包括 : 视频译码器, 其经配置以 : 对于当前视频块, 确定第一最可能帧内预测模式及第二最可能帧内预测模式 ; 基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式, 确定用以译码所 述当前视频块的实际帧内预测模式的估计, 其中确定所述实际帧内预测模式的所述估计包 括 : 响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧 内预测模式, 选择所述第一最可能模式作为
9、所述实际帧内预测模式的所述估计 ; 响应于所述第一最可能模式与所述第二最可能模式两者为不同的角度预测模式, 选择 所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所述估计。 12. 根据权利要求 11 所述的装置, 其中所述视频译码器经配置以通过确定所述第一最 可能模式及所述第二最可能中的哪一者为角度较接近于垂直角度的最可能模式及选择所 述角度较接近于所述垂直角度的所述最可能模式作为所述实际帧内预测模式的所述估计 而选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测 模式的所述估计。 13. 根据权利要求 11 所述的装置, 其中所述视频译码器经配置
10、以通过选择所述第一最 可能模式及所述第二最可能模式中的哪一者不在垂直角度与水平角度之间而选择所述第 一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模式的所述估 计。 14. 根据权利要求 11 所述的装置, 其中所述视频译码器经配置以通过用信号通知所述 第一最可能模式及所述第二最可能模式中的一者为所述实际帧内预测模式的所述估计而 选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述实际帧内预测模 式的所述估计。 15. 根据权利要求 11 所述的装置, 其中所述视频译码器经配置以通过选择所述第一最 可能模式及所述第二最可能模式中的具有较小帧内模式数目的那一者作为所述
11、实际帧内 预测模式的所述估计而选择所述第一最可能模式及所述第二最可能模式中的所述一者作 为所述实际帧内预测模式的所述估计。 16. 根据权利要求 11 所述的装置, 其中所述视频译码器经配置以至少部分基于一或多 个相邻的信息块选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所述 实际帧内预测模式的所述估计。 17. 根据权利要求 11 所述的装置, 其中所述视频译码器经配置以通过选择所述第一最 可能模式及所述第二最可能模式中的与在大小上较接近于所述当前视频块的视频数据块 相关联的那一者而选择所述第一最可能模式及所述第二最可能模式中的所述一者作为所 述实际帧内预测模式的所述估计。 18
12、. 根据权利要求 11 所述的装置, 其中所述视频译码器为视频解码器, 且其中所述视 权 利 要 求 书 CN 103947205 A 3 3/4 页 4 频译码器进一步经配置以 : 接收差信息 ; 以及 基于所述差信息及所述实际帧内预测模式的所述估计确定用于所述当前视频块的实 际帧内预测模式。 19. 根据权利要求 18 所述的装置, 其中所述视频译码器进一步经配置以 : 使用所述实际帧内预测模式产生经重建视频块。 20. 根据权利要求 18 所述的装置, 其中所述视频译码器包括视频编码器, 且其中所述 视频译码器进一步经配置以 : 在经编码位流中用信号通知差信息, 其中所述差信息识别用于所
13、述当前块的实际帧内 预测模式与所述实际帧内预测模式的所述估计之间的差。 21. 根据权利要求 11 所述的装置, 其中所述装置包括以下各者中的至少一者 : 集成电路 ; 微处理器 ; 以及, 无线通信装置, 其包含所述视频译码器。 22. 一种用于译码视频数据的设备, 所述设备包括 : 用于对于当前视频块确定第一最可能帧内预测模式及第二最可能帧内预测模式的装 置 ; 用于基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式确定用以译 码所述当前视频块的实际帧内预测模式的估计的装置, 其中所述用于确定所述实际帧内预 测模式的所述估计的装置包括 : 用于响应于所述第一最可能模式为角度帧内预测
14、模式且所述第二最可能模式为非角 度帧内预测模式而选择所述第一最可能模式作为所述实际帧内预测模式的所述估计的装 置 ; 用于响应于所述第一最可能模式与所述第二最可能模式两者为不同的角度预测模式 而选择所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所 述估计的装置。 23. 根据权利要求 22 所述的设备, 其中所述用于选择所述第一最可能模式及所述第二 最可能模式中的所述一者作为所述实际帧内预测模式的所述估计的装置包括 : 用于确定所述第一最可能模式及所述第二最可能中的哪一者为角度较接近于垂直角 度的最可能模式的装置 ; 以及, 用于选择所述角度较接近于所述垂直角度的所述最可
15、能模式作为所述实际帧内预测 模式的所述估计的装置。 24. 根据权利要求 22 所述的设备, 其中所述用于选择所述第一最可能模式及所述第二 最可能模式中的所述一者作为所述实际帧内预测模式的所述估计的装置包括用于选择所 述第一最可能模式及所述第二最可能模式中的不在垂直角度与水平角度之间的那一者的 装置。 25. 根据权利要求 22 所述的设备, 其中所述用于选择所述第一最可能模式及所述第二 最可能模式中的所述一者作为所述实际帧内预测模式的所述估计的装置包括用于用信号 通知所述第一最可能模式及所述第二最可能模式中的一者为所述实际帧内预测模式的所 权 利 要 求 书 CN 103947205 A 4
16、 4/4 页 5 述估计的装置。 26. 根据权利要求 22 所述的设备, 其中所述用于选择所述第一最可能模式及所述第二 最可能模式中的所述一者作为所述实际帧内预测模式的所述估计的装置包括用于选择所 述第一最可能模式及所述第二最可能模式中的具有较小帧内模式数目的那一者作为所述 实际帧内预测模式的所述估计的装置。 27. 根据权利要求 22 所述的设备, 其中所述用于选择所述第一最可能模式及所述第二 最可能模式中的所述一者作为所述实际帧内预测模式的所述估计的装置至少部分基于一 或多个相邻的信息块选择所述第一最可能模式及所述第二最可能模式中的所述一者作为 所述实际帧内预测模式的所述估计。 28.
17、根据权利要求 22 所述的设备, 其中所述用于选择所述第一最可能模式及所述第二 最可能模式中的所述一者作为所述实际帧内预测模式的所述估计的装置包括用于选择所 述第一最可能模式及所述第二最可能模式中的与在大小上较接近于所述当前视频块的视 频数据块相关联的那一者的装置。 29. 根据权利要求 22 所述的设备, 其中所述设备包括视频解码器, 且其中所述设备进 一步包括 : 用于接收差信息的装置 ; 以及 用于基于所述差信息及所述实际帧内预测模式的所述估计确定用于所述当前视频块 的实际帧内预测模式的装置。 30. 根据权利要求 29 所述的设备, 其进一步包括 : 用于使用所述实际帧内预测模式产生经
18、重建视频块的装置。 31. 根据权利要求 22 所述的设备, 其中所述设备包括视频编码器, 且其中所述设备进 一步包括 : 用于在经编码位流中用信号通知差信息的装置, 其中所述差信息识别用于所述当前块 的实际帧内预测模式与所述实际帧内预测模式的所述估计之间的差。 32. 一种存储指令的计算机可读存储媒体, 所述指令可操作以致使一或多个处理器 : 对于当前视频块, 确定第一最可能帧内预测模式及第二最可能帧内预测模式 ; 基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式, 确定用以译码所 述当前视频块的实际帧内预测模式的估计, 其中所述指令致使所述一或多个处理器通过以 下操作确定所述实际
19、帧内预测模式的所述估计 : 响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧 内预测模式, 选择所述第一最可能模式作为所述实际帧内预测模式的所述估计 ; 响应于所述第一最可能模式与所述第二最可能模式两者为不同的角度预测模式, 选择 所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所述估计。 权 利 要 求 书 CN 103947205 A 5 1/19 页 6 帧内模式译码中的参考模式选择 0001 本申请案主张 2011 年 11 月 18 日申请的美国临时申请案 61/561,803 及 2011 年 11 月 18 日申请的美国临时申请案 61
20、/561,819 的权益, 所述两个美国临时申请案中的每一 者的全部内容以引用的方式并入本文。 技术领域 0002 本发明涉及视频译码, 且更明确地说, 涉及用信号通知用于经译码视频数据的帧 内预测模式。 背景技术 0003 数字视频能力可并入到广泛范围的装置中, 包括数字电视、 数字直播系统、 无线广 播系统、 个人数字助理 (PDA)、 膝上型或桌上型计算机、 数码相机、 数字记录装置、 数字媒体 播放器、 视频游戏装置、 视频游戏控制台、 蜂窝式或卫星无线电电话、 视频电话会议装置及 其类似者。数字视频装置实施视频压缩技术 ( 例如, 由 MPEG-2、 MPEG-4、 ITU-T H.
21、263 或 ITU-T H.264/MPEG-4 第 10 部分高级视频译码 (AVC) 所定义的标准及这些标准的扩展中所 描述的视频压缩技术 ), 以较有效地发射及接收数字视频信息。 0004 视频压缩技术执行空间预测及 / 或时间预测, 以减少或移除视频序列中所固有的 冗余。对于基于块的视频译码, 一视频帧或切片可分割成多个视频块。每个视频块可被进 一步分割。使用相对于相邻视频块的空间预测来对经帧内译码 (I) 帧或切片中的视频块进 行编码。经帧间译码 (P 或 B) 帧或切片中的视频块可使用相对于相同帧或切片中的相邻宏 块或译码单元的空间预测或相对于其它参考帧的时间预测。 发明内容 00
22、05 大体来说, 本发明描述用于用信号通知经译码视频数据的译码特性且处理经译码 视频数据的译码特性的信令的技术, 且更明确地说, 本发明描述用于在视频数据的经编码 位流中用信号通知帧内预测模式且处理帧内预测模式的信令的技术。在视频译码中, 可从 先前经译码图片的视频块预测 ( 即, 帧间预测 ) 或可从同一图片的已经译码视频块预测 ( 即, 帧内预测 ) 当前正译码 ( 编码或解码 ) 的视频数据块。当视频块是经帧内预测时, 与 明确地用信号通知实际帧内预测模式相对, 有时将帧内预测模式用信号通知为估计的实际 帧内预测模式与实际帧内预测模式之间的差。 假设所述实际帧内预测模式通常接近于所述 估
23、计帧内预测模式, 则使用可变长度译码 (VLC) 技术, 可使用相对较少的位用信号通知所 述实际帧内预测模式。在一些情况下, 本发明的技术可通过在一些译码情形中确定较接近 于实际帧内预测模式的估计帧内预测模式而改善用信号通知用以帧内译码视频数据块的 帧内预测模式的效率。 0006 在一个实例中, 一种用于译码视频数据的方法包含 : 对于当前视频块, 确定第一最 可能帧内预测模式及第二最可能帧内预测模式 ; 以及基于所述第一最可能帧内预测模式 及所述第二最可能帧内预测模式, 确定用以译码所述当前视频块的实际帧内预测模式的估 说 明 书 CN 103947205 A 6 2/19 页 7 计。 确
24、定所述实际帧内预测模式的所述估计包含响应于所述第一最可能模式为角度帧内预 测模式且所述第二最可能模式为非角度帧内预测模式, 选择所述第一最可能模式作为所述 实际帧内预测模式的所述估计 ; 以及响应于所述第一最可能模式与所述第二最可能模式两 者为不同的角度预测模式, 选择所述第一最可能模式及所述第二最可能模式中的一者作为 所述实际帧内预测的所述估计。 0007 在另一实例中, 一种用于译码视频数据的装置包含视频译码器, 所述视频译码器 经配置以 : 对于当前视频块, 确定第一最可能帧内预测模式及第二最可能帧内预测模式 ; 以及基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式, 确定用以
25、译码所 述当前视频块的实际帧内预测模式的估计。 所述视频译码器经配置以通过以下操作确定所 述实际帧内预测模式的所述估计 : 响应于所述第一最可能模式为角度帧内预测模式且所述 第二最可能模式为非角度帧内预测模式, 选择所述第一最可能模式作为所述实际帧内预测 模式的所述估计 ; 以及响应于所述第一最可能模式及所述第二最可能模式两者为不同的角 度预测模式, 选择所述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内 预测的所述估计。 0008 在另一实例中, 一种用于译码视频数据的设备包含 : 用于对于当前视频块确定第 一最可能帧内预测模式及第二最可能帧内预测模式的装置 ; 以及用于基于所述
26、第一最可能 帧内预测模式及所述第二最可能帧内预测模式确定用以译码所述当前视频块的实际帧内 预测模式的估计的装置。 所述用于确定所述实际帧内预测模式的所述估计的装置包含用于 响应于所述第一最可能模式为角度帧内预测模式且所述第二最可能模式为非角度帧内预 测模式而选择所述第一最可能模式作为所述实际帧内预测模式的所述估计的装置, 及用于 响应于所述第一最可能模式及所述第二最可能模式两者为不同的角度预测模式而选择所 述第一最可能模式及所述第二最可能模式中的一者作为所述实际帧内预测的所述估计的 装置。 0009 在另一实例中, 一种计算机可读存储媒体存储指令, 所述指令可操作以致使一或 多个处理器 : 对
27、于当前视频块, 确定第一最可能帧内预测模式及第二最可能帧内预测模式 ; 以及基于所述第一最可能帧内预测模式及所述第二最可能帧内预测模式, 确定用以译码所 述当前视频块的实际帧内预测模式的估计。 所述指令致使所述一或多个处理器通过以下操 作确定所述实际帧内预测模式的所述估计 : 响应于所述第一最可能模式为角度帧内预测模 式且所述第二最可能模式为非角度帧内预测模式, 选择所述第一最可能模式作为所述实际 帧内预测模式的所述估计 ; 以及响应于所述第一最可能模式及所述第二最可能模式两者为 不同的角度预测模式, 选择所述第一最可能模式及所述第二最可能模式中的一者作为所述 实际帧内预测的所述估计。 001
28、0 随附图式及以下描述中陈述一或多个实例的细节。其它特征、 目标及优点将从所 述描述及图式以及权利要求书而显而易见。 附图说明 0011 图 1 是说明可利用本发明的技术的实例视频编码及解码系统的框图。 0012 图 2 是说明可实施用于译码指示帧内预测模式的信息的技术的视频编码器的实 例的框图。 说 明 书 CN 103947205 A 7 3/19 页 8 0013 图 3A 展示帧内预测模式的实例。 0014 图 3B 及 3C 展示最可能帧内预测模式及估计的实际帧内预测模式的实例。 0015 图 4 展示可用以确定用于当前块的最可能模式的当前块及相邻块的实例。 0016 图 5 是说明
29、可实施用于解码指示帧内预测模式的信息的技术的视频解码器的实 例的框图。 0017 图 6 是描绘根据本发明的技术的用信号通知帧内预测模式的实例方法的流程图。 具体实施方式 0018 大体来说, 本发明描述用于用信号通知经译码视频数据的译码特性且处理经译码 视频数据的译码特性的信令的技术, 且更明确地说, 本发明描述用于在视频数据的经编码 位流中用信号通知帧内预测模式且处理帧内预测模式的信令的技术。在视频译码中, 可从 先前经译码图片的视频块预测 ( 即, 帧间预测 ) 或可从同一图片的已经译码视频块预测 ( 即, 帧内预测 ) 当前正译码 ( 例如, 编码或解码 ) 的视频数据块。当视频块是经
30、帧内预测 时, 与明确地用信号通知实际帧内预测模式相对, 有时将帧内预测模式用信号通知为参考 模式 ( 本发明中还称为实际帧内预测模式的估计 ) 与实际帧内预测模式之间的差。如下文 将更详细地解释, 不同帧内预测模式大体对应于不同预测角度, 但某些模式被视为非角度 的。 0019 假设所述实际帧内预测模式通常接近于所述估计帧内预测模式, 则使用可变长度 译码 (VLC) 技术, 可使用相对较少的位用信号通知所述实际帧内预测模式。在一些情况下, 本发明的技术可通过在一些译码情形中确定较接近于实际帧内预测模式的估计帧内预测 模式而改善用信号通知用以帧内译码视频数据块的帧内预测模式的效率。 0020
31、 可基于用于当前块的最可能帧内预测模式确定所述块的估计帧内预测模式。 这些 最可能帧内预测模式有时可在本发明中简称为最可能模式。如下文将更详细地解释, 可至 少部分地基于已经译码的相邻块的帧内预测模式选择用于当前视频块的最可能模式。 举例 来说, 当前块可具有对应于用以译码当前块上方的块的帧内预测模式及用以译码当前块左 方的块的帧内预测模式的两个最可能模式。假设视频块是以光栅扫描次序 ( 例如, 从左到 右及从上到下 ) 经译码, 则在当前块上方及在当前块左方的视频块将在当前块之前译码, 且因此, 那些块的帧内预测模式在译码当前块之前已为视频译码器所知。当前块还可具有 也是基于相邻块确定或以某
32、一其它方式确定的额外最可能模式 ( 例如, 第三最可能模式、 第四最可能模式, 等 )。 0021 假设两个最可能模式, 当所述最可能帧内预测模式中的一者是用于当前块的实际 帧内预测模式时, 则可使用两位码字用信号通知所述实际帧内预测模式以指示所述块是使 用最可能模式中的一者译码。举例来说, 码字 “00” 可用以用信号通知用于所述块的实际帧 内预测模式是第一最可能模式, 且码字 “01” 可用以用信号通知用于所述块的实际帧内预测 模式是第二最可能模式。 如果使用两个以上最可能模式, 则在一些情况下, 可使用额外位用 于用信号通知哪一最可能模式为实际模式。 0022 在其中选择使用的模式(还称
33、为实际模式或所选模式)不同于最可能模式中的一 者的情况下, 则可直接用信号通知或可使用实际模式与实际模式的估计之间的差分信息用 信号通知所述实际模式。 在这些情况下, 可使用如下码字用信号通知实际帧内预测模式, 所 说 明 书 CN 103947205 A 8 4/19 页 9 述码字以 “1” 开始以区分所述码字与用于最可能模式的码字。以上实例为其中可使用最可 能模式来用信号通知视频块的帧内预测模式的许多译码结构中的一者。 本发明的技术不限 于用于利用最可能模式的任何一个特定结构。 0023 当将帧内预测模式用信号通知为估计模式与实际模式之间的差时, 可在经编码位 流中作为码字将所述差信息从
34、视频编码器用信号通知到视频解码器。举例来说, 所述码字 可为对应于实际模式的估计与实际模式之间的顺序模式次序差的可变长度码字。 如果使用 可变长度码字, 则可例如将较短码字指派给较频繁出现的差, 而将较长码字指派给较不频 繁出现的差。较频繁出现的差可例如为较短差, 而较不频繁出现的差为较长距离。因此, 当 实际帧内预测模式的估计接近于实际预测时较之于当实际帧内预测模式的估计远离实际 帧内预测模式时通常使用较少位来用信号通知差信息。如下文的实例中将更详细地解释, 两个帧内预测模式之间的距离可大体视为其顺序模式次序的差的绝对值。因此, 具有顺序 模式次序 3 及 15 的模式可视为比具有顺序模式次
35、序 8 及 6 的模式相隔远。 0024 根据当前技术, 当最可能模式集合中的两个模式为角度模式时 ( 即, 与非角度相 对 ), 估计模式确定为两个最可能模式的角度的均值或中值。然而, 在一些情况下, 此估计 模式可能并不那么接近 ( 例如根据顺序模式次序 ) 于用于当前视频块的实际模式。因此, 使用最可能模式中的一者作为实际模式的估计而非使用两个最可能模式的均值或中值可 能更准确。举例来说, 如果边缘存在于相邻块中, 则最可能模式可能极其精确地传达信息。 边缘可能从最可能模式中的一者移位一个或两个角度, 但所述边缘不太可能移位到两个最 可能模式的中间角度, 当两个最可能模式的角度量相差大时
36、尤其如此。换句话说, 如果两 个最可能模式具有相对较大的角度差, 则基于那些两个最可能模式的均值或中值的估计可 能以高于所需频率的频率将较短码字指派给不太可能为实际模式的模式, 这可降低译码效 率。 本发明大体描述用于通过将两个最可能模式中的一者选择为实际帧内预测模式的估计 而确定实际帧内预测模式的估计的技术。 0025 可例如结合差信息使用实际帧内预测模式的估计来识别用以译码视频数据块的 实际帧内预测模式。因此, 如果视频编码器及视频解码器两者经配置以确定用于实际帧内 预测模式的相同估计, 则仅需要在经编码位流中传达实际帧内预测模式的估计与实际帧内 预测模式之间的差以使视频解码器确定用以译码
37、视频数据块的帧内预测模式。 0026 图 1 是说明可利用根据本发明的技术的用于译码表示用于视频数据块的帧内预 测模式的语法数据的技术的实例视频编码及解码系统 10 的框图。如图 1 中所示, 系统 10 包含经由通信信道 16 将经编码视频传输到目的地装置 14 的源装置 12。源装置 12 及目的 地装置 14 可包括广泛范围的装置中的任一者。在一些情况下, 源装置 12 及目的地装置 14 可包括无线通信装置, 例如无线手持机、 所谓的蜂窝式或卫星无线电电话, 或可经由通信信 道 16 传达视频信息的任何无线装置, 在所述情况下, 通信信道 16 为无线的。 0027 然而, 关注表示用
38、于视频数据块的帧内预测模式的语法数据的译码的本发明的技 术未必限于无线应用或设定。举例来说, 这些技术可应用于空中电视广播、 有线电视传输、 卫星电视传输、 因特网视频传输、 编码到存储媒体上的经编码数字视频, 或其它情形。 因此, 通信信道 16 可包括适合于传输经编码视频数据的无线或有线媒体的任何组合。此外, 通信 频道 16 既定表示视频编码装置可发送数据到视频解码装置的许多方式中的仅一者。举例 来说, 在系统 10 的其它配置中, 源装置 12 可产生经编码视频以供目的地装置 14 解码且将 说 明 书 CN 103947205 A 9 5/19 页 10 所述经编码视频存储在存储媒体
39、或文件服务器上, 使得所述经编码视频可由目的地装置 14 在需要时存取。 0028 在图 1 的实例中, 源装置 12 包含视频源 18、 视频编码器 20、 调制器 / 解调器 ( 调 制解调器 )22 及发射器 24。目的地装置 14 包含接收器 26、 调制解调器 28、 视频解码器 30 及显示装置32。 在其它实例中, 源装置及目的地装置可包含其它组件或布置。 举例来说, 源 装置 12 可从外部视频源 18( 例如外部相机 ) 接收视频数据。同样, 目的地装置 14 可与外 部显示装置介接, 而非包含集成显示装置。视频编码器 20 及视频解码器 30 可经类似地配 置以执行本发明的
40、技术。举例来说, 视频编码器 20 及视频解码器 30 可经配置以使用相同 技术确定最可能模式及估计模式, 使得不需要在经编码视频位流中明确地用信号通知最可 能模式及估计模式。 0029 图 1 的所说明系统 10 只是一个实例。可通过任何数字视频编码及 / 或解码装置 来执行用于译码表示用于视频数据块的帧内预测模式的语法数据的技术。 尽管本发明的技 术大体上由视频编码装置来执行, 但所述技术还可通过视频编码器 / 解码器 ( 通常被称作 “编解码器” ) 执行。此外, 本发明的技术还可由视频预处理器执行。源装置 12 及目的地装 置 14 仅为源装置 12 在其中产生经译码视频数据以供发射到
41、目的地装置 14 的此些译码装 置的实例。在一些实例中, 装置 12、 14 可以实质上对称的方式操作, 使得装置 12、 14 中的每 一者包含视频编码及解码组件。因此, 系统 10 可支持视频装置 12、 14 之间的单向或双向视 频传播以例如用于视频流式传输、 视频回放、 视频广播或视频电话。 0030 源装置12的视频源18可包括视频俘获装置, 例如摄像机、 含有先前所俘获视频的 视频档案及 / 或来自视频内容提供者的视频馈送。作为另一替代方案, 视频源 18 可产生基 于计算机图形的数据作为源视频, 或实况视频、 存档视频与计算机产生的视频的组合。 在一 些情况下, 如果视频源 18
42、 是摄像机, 则源装置 12 及目的地装置 14 可形成所谓的相机电话 或视频电话。然而, 如上文所提及, 本发明中所描述的技术可大体上适用于视频译码, 且可 应用于无线及 / 或有线应用。在每一情况下, 可由视频编码器 20 编码所捕获、 预先捕获或 计算机产生的视频。经编码视频信息可接着由调制解调器 22 根据通信标准进行调制, 且经 由发射器24发射到目的地装置14。 调制解调器22可包含各种混合器、 滤波器、 放大器或经 设计以用于信号调制的其它组件。发射器 24 可包含经设计用于发射数据的电路, 包含放大 器、 滤波器及一或多个天线。 0031 目的地装置 14 的接收器 26 经由
43、信道 16 接受信息, 且调制解调器 28 对所述信息 进行解调。再次, 视频编码过程可实施本文所述的技术中的一或多者以译码表示用于视频 数据块的帧内预测模式的语法数据。经由信道 16 传达的信息可包含由视频编码器 20 定义 的语法信息, 所述语法信息还由视频解码器 30 使用, 包含描述宏块及其它经译码单元 ( 例 如 GOP) 的特性及 / 或处理的语法元素。显示装置 32 将经解码视频数据显示给用户, 且可 包括多种显示装置中的任一者, 例如阴极射线管 (CRT)、 液晶显示器 (LCD)、 等离子显示器、 有机发光二极管 (OLED) 显示器或另一类型的显示装置。 0032 在图 1
44、 的实例中, 通信信道 16 可包括任何无线或有线通信媒体, 例如射频 (RF) 频 谱或一或多个物理传输线, 或无线与有线媒体的任何组合。通信频道 16 可形成分组网络 (例如局域网、 广域网或全球网络, 例如因特网)的部分。 通信信道16大体上表示用于将视 频数据从源装置 12 发射到目的地装置 14 的任何合适的通信媒体或不同通信媒体的集合, 说 明 书 CN 103947205 A 10 6/19 页 11 包含有线或无线媒体的任何合适的组合。通信信道 16 可包含路由器、 交换器、 基站或可以 用于促进从源装置 12 到目的地装置 14 的通信的任何其它装备。 0033 视频编码器
45、20 及视频解码器 30 可根据视频压缩标准 ( 例如 ITU-T H.264 标准, 替代地称作 MPEG-4, 第 10 部分, 高级视频译码 (AVC) 操作。然而, 本发明的技术不限于任 何特定译码标准。其它实例包含 MPEG-2 及 ITU-T H.263。尽管图 1 中未展示, 但在一些方 面中, 视频编码器20及视频解码器30可各自与音频编码器及解码器集成, 且可包含适当多 路复用器 - 多路分用器单元或其它硬件及软件以处置对共同数据流或单独数据流中的音 频或视频两者的编码。如果适用, 则多路复用器 - 多路分用器单元可符合 ITU H.223 多路 复用器协议, 或例如用户数据
46、报协议 (UDP) 等其它协议。 0034 ITU-T H.264/MPEG-4(AVC) 标准是作为被称为联合视频组 (JVT) 的集体伙伴的产 品由 ITU-T 视频译码专家组 (VCEG) 连同 ISO/IEC 移动图片专家组 (MPEG) 一起制定的。在 一些方面中, 本发明中描述的技术可应用到大体符合H.264标准的装置。 H.264标准描述于 ITU-T 研究组的日期为 2005 年 3 月的 “ITU-T 推荐书 H.264, 用于通用视听服务的高级视频 译码” (ITU-T Recommendation H.264, Advanced Video Coding for gene
47、ric audiovisual services) 中, 其在本文中可称为 H.264 标准或 H.264 规范或 H.264/AVC 标准或规范。联合 视频组 (JVT) 持续致力于扩展 H.264/MPEG-4AVC。 0035 视频编码器 20 及视频解码器 30 各自可实施为多种合适的编码器电路中的任一 者, 例如一或多个微处理器、 数字信号处理器 (DSP)、 专用集成电路 (ASIC)、 现场可编程门 阵列(FPGA)、 离散逻辑、 软件、 硬件、 固件或其任何组合。 视频编码器20及视频解码器30中 的每一者可包含于一或多个编码器或解码器中, 其中的任一者可集成为相应相机、 计算
48、机、 移动装置、 订户装置、 广播装置、 机顶盒、 服务器或其类似者中的组合式编码器/解码器(编 解码器 ) 的部分。 0036 视频序列通常包括一系列视频帧。图片群组 (GOP) 一股来说包括一系列一或多个 视频帧。GOP 可在 GOP 的标头、 GOP 的一或多个帧的标头或其它地方中包含语法数据, 其描 述 GOP 中包含的帧的数目。每一帧可包含描述相应帧的编码模式的帧语法数据。视频编码 器 20 通常对个别视频帧内的视频块进行操作以便编码视频数据。视频块可对应于宏块或 宏块的分区。视频块可具有固定或变化的大小, 且可根据指定的译码标准而大小不同。每 一视频帧可包含多个切片。每一切片可包含
49、多个宏块, 所述宏块可布置成分区 ( 还称为子 块 )。 0037 作为一实例, ITU-T H.264 标准支持各种块大小的帧内预测 ( 例如用于明度分量 的 16 乘 16、 8 乘 8 或 4 乘 4 及用于色度分量的 8x8), 以及各种块大小的帧间预测, 例如用于 明度分量的 16x16、 16x8、 8x16、 8x8、 8x4、 4x8 及 4x4 及用于色度分量的对应缩放大小。在本 发明中,“NxN” 及 “N 乘 N” 可互换使用来指在垂直及水平尺寸方面的块的像素尺寸, 例如, 16x16 像素或 16 乘 16 像素。一股来说, 16x16 块将在垂直方向上具有 16 个像素 (y 16), 且在水平方向上具有 16 个像素 (x 16)。同样, NxN 块大体上在垂直方向上具有 N 个像 素, 且在水平方向上具有 N 个像素, 其中 N 表示非负整数值。块中的像素可布置成行及列。 此外, 块未必需要在水平方向与垂直方向上具有相同数目的像素。举例来说, 块可包括 NxM 像素, 其中 M 未必等于 N。小于 16x16 的块大小在 ITU-TH.264 中可被称为 16x16 宏块的分 区。 说 明
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1