《用于多层视频系统的复杂度自适应可伸缩解码及流处理.pdf》由会员分享,可在线阅读,更多相关《用于多层视频系统的复杂度自适应可伸缩解码及流处理.pdf(25页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102860008 A (43)申请公布日 2013.01.02 C N 1 0 2 8 6 0 0 0 8 A *CN102860008A* (21)申请号 201180005589.9 (22)申请日 2011.01.03 61/292,741 2010.01.06 US H04N 7/26(2006.01) (71)申请人杜比实验室特许公司 地址美国加利福尼亚州 (72)发明人贺玉文 亚历山德罗斯图拉皮斯 佩沙拉V帕哈拉瓦达 阿萨纳西奥斯莱昂塔里斯 (74)专利代理机构北京集佳知识产权代理有限 公司 11227 代理人陈炜 李德山 (54) 发明名称 用于多层视。
2、频系统的复杂度自适应可伸缩解 码及流处理 (57) 摘要 描述了自适应解码、流处理多层视频系统及 方法。该解码系统包括基本层解码器和一个或更 多个增强层解码器。该流处理系统包括基本层打 包器和一个或更多个增强层打包器。解码适配器 控制基本层解码器和/或增强层解码器的操作。 打包适配器控制基本层打包器和/或增强层打包 器的操作。 (30)优先权数据 (85)PCT申请进入国家阶段日 2012.07.06 (86)PCT申请的申请数据 PCT/US2011/020027 2011.01.03 (87)PCT申请的公布数据 WO2011/084913 EN 2011.07.14 (51)Int.Cl。
3、. 权利要求书3页 说明书9页 附图12页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 3 页 说明书 9 页 附图 12 页 1/3页 2 1.一种自适应解码多层视频系统,包括: 基本层解码器; 一个或更多个增强层解码器;以及 解码适配器,所述解码适配器与所述基本层解码器和所述一个或更多个增强层解码器 连接,所述解码适配器控制所述基本层解码器和所述一个或更多个增强层解码器的操作。 2.根据权利要求1所述的系统,还包括: 一个或更多个处理模块,所述一个或更多个处理模块用于向所述一个或更多个增强层 解码器提供来自所述基本层解码器的滤波预测,其中,所述解码适配器还控制所。
4、述一个或 更多个处理模块的操作。 3.根据权利要求1或2所述的系统,其中,所述解码适配器基于从从一个或更多个所述 基本层解码器和所述一个或更多个增强层解码器收集的信息,来控制所述基本层解码器和 所述一个或更多个增强层解码器的操作。 4.根据上述权利要求中任一项所述的系统,还包括后处理模块,其中,所述解码适配器 基于从所述后处理模块收集的信息,来控制所述基本层解码器和所述一个或更多个增强层 解码器的操作。 5.根据权利要求4所述的系统,其中,所述后处理信息包括与所述基本层解码器和所 述一个或更多个增强层解码器有关的编码时间信息。 6.根据上述权利要求中任一项所述的自适应解码多层视频系统,其中,所。
5、述解码适配 器通过简化所述基本层解码器和/或所述一个或更多个增强层解码器的操作,来控制所述 基本层解码器和/或所述一个或更多个增强层解码器的操作。 7.根据权利要求6所述的自适应解码多层视频系统,其中,所述基本层解码器和所述 一个或更多个增强层解码器各自包括残余解码模块和环路滤波模块,并且其中,通过简化 或去除所述基本层解码器和/或所述一个或更多个增强层解码器的所述残余解码模块和 所述环路滤波模块中的一个或更多个,来进行所述基本层解码器和/或所述一个或更多个 增强层解码器的简化。 8.根据上述权利要求中任一项所述的自适应解码多层视频系统,其中,参考图像、图像 的部分、切片、图像序列和图片组(G。
6、OP)中的一个或更多个,控制所述基本层解码器和所述 一个或更多个增强层解码器的操作。 9.根据权利要求8所述的自适应解码多层视频系统,其中,所述解码适配器控制非参 考图像和/或参考图像的操作。 10.根据上述权利要求中任一项所述的自适应解码多层视频系统,其中,所述解码适配 器基于复杂度估计来控制所述基本层解码器和所述一个或更多个增强层解码器的操作。 11.根据上述权利要求中任一项所述的自适应解码多层视频系统,其中,所述解码适配 器基于平均解码时间来控制所述基本层解码器和所述一个或更多个增强层解码器的操作。 12.根据上述权利要求中任一项所述的自适应解码多层视频系统,其中,所述解码适配 器基于解。
7、码质量估计来控制所述基本层解码器和所述一个或更多个增强层解码器的操作。 13.根据权利要求10、11或12所述的自适应解码多层视频系统,其中,所述解码适配器 还基于元数据信息来控制所述基本层解码器和所述一个或更多个增强层解码器的操作。 14.一种用于多层视频系统的自适应解码的方法,包括如下步骤: 权 利 要 求 书CN 102860008 A 2/3页 3 读取视频信息; 基于先前解码的视频信息的解码时间,针对所述视频信息从多个解码模式中选择解码 模式; 根据所选择的解码模式对所述多层系统的一个或更多个层的所述视频信息进行解 码; 在每次解码后,更新所述先前解码的视频信息的解码时间;以及 如果。
8、可获得更多的视频信息,则重复所述读取步骤、所述选择步骤以及所述解码步骤。 15.根据权利要求14所述的方法,其中,所述先前解码的视频信息的解码时间是平均 解码时间。 16.根据权利要求14或15所述的方法,其中,所述多个解码模式包括最快解码模式,所 述方法还包括:当选择所述最快解码模式时,对所述最快解码模式的解码复杂度进行估计。 17.根据权利要求16所述的方法,其中,关于以所述最快解码模式对所述多层系统的 哪个层进行解码的决定基于所估计的所述最快解码模式的解码复杂度。 18.根据权利要求17所述的方法,其中,关于是否针对所述多层系统的一个或更多个 层使用简化的解码的决定也基于所估计的所述最快。
9、解码模式的解码复杂度。 19.根据权利要求18所述的方法,其中,所述决定还基于图像质量考虑。 20.根据权利要求14或15所述的方法,其中,所述视频信息包括非参考图片信息和参 考图片信息,所述方法还包括:当选择包括参考图片信息的视频信息的解码模式时,对所述 解码模式的解码复杂度进行估计。 21.根据权利要求20所述的方法,其中,关于以所述解码模式对所述多层系统的哪个 层进行解码的决定基于所估计的所述解码模式的解码复杂度。 22.根据权利要求21所述的方法,其中,关于是否针对所述多层系统的一个或更多个 层使用简化的解码的决定也基于所估计的所述解码模式的解码复杂度。 23.根据权利要求22所述的方。
10、法,其中,所述决定还基于图像质量考虑。 24.根据权利要求14至23中任一项所述的方法,其中,所述视频信息包括:图片、图片 的部分或图片系列。 25.根据权利要求24所述的方法,其中,所述图片的部分是切片,且所述图片系列是图 片组(GOP)。 26.根据权利要求14至25中任一项所述的方法,其中,所述多层系统包括基本层和一 个或更多个增强层。 27.根据权利要求26所述的方法,其中,所述多层系统包括适于将来自所述基本层的 解码信息传输至所述增强层中的一个或更多个的参考处理器。 28.根据权利要求14所述的方法,其中: 所述多个解码模式基于要对所述多层系统的一个或更多个层执行的解码操作的简化 量。
11、而彼此不同,以及 所述解码模式的选择是通过将先前实现的解码操作的平均解码时间与目标阈值进行 比较而进行的。 29.根据权利要求28所述的方法,其中,所述解码模式的选择是在以下之间选择的:保 持先前选择的解码模式;选择较快解码模式;以及选择较慢解码模式。 权 利 要 求 书CN 102860008 A 3/3页 4 30.根据权利要求28或29所述的方法,其中,所述解码模式的选择还取决于图像质量 考虑。 31.一种适于将视频包通过网络发送到客户端的自适应多层视频服务器,包括: 基本层视频打包器; 一个或更多个增强层视频打包器;以及 打包适配器,所述打包适配器与所述基本层视频打包器和所述一个或更多。
12、个增强层视 频打包器连接,所述打包适配器控制所述基本层视频打包器和所述一个或更多个增强层视 频打包器的操作。 32.根据权利要求31所述的视频服务器,其中,通过关于通过所述基本层视频打包器 和所述一个或更多个增强层视频打包器经由网络发送或不发送哪些包的决定,控制所述基 本层视频打包器和所述一个或更多个增强层视频打包器的操作。 33.根据权利要求31或32所述的视频服务器,其中,所述打包适配器的控制是基于服 务器生成的信息的。 34.根据权利要求31或32所述的视频服务器,其中,所述打包适配器的控制是基于客 户端生成的信息的。 35.一种视频处理架构,包括:根据权利要求31所述的视频服务器和根据。
13、权利要求1 所述的解码系统。 权 利 要 求 书CN 102860008 A 1/9页 5 用于多层视频系统的复杂度自适应可伸缩解码及流处理 0001 相关申请的交叉引用 0002 本申请要求于2010年1月6日提交的美国专利临时申请No.61/292,741的优先 权,其全部内容通过引用合并到本申请中。 技术领域 0003 本公开内容涉及多层视频系统。更具体地,本公开内容涉及用于多层视频系统的 复杂度自适应可伸缩解码及流处理。 背景技术 0004 近年来,出现了考虑用于视频媒介的传输的多层方法的若干应用及系统。这些应 用及系统可以包括SNR或分辨率、或时间可伸缩系统,并且还可以包括多视点或3。
14、D/立体视 频、位深与高动态范围(HDR)应用等。这些应用或系统可能需要大量的计算资源来解码,或 可能在传输期间受到网络中的带宽变化的影响。 0005 立体视频的传输是内容提供商的一贯目标。显示技术的最新创新如具有3D功能 的DLP(见参考文献1,其全部内容通过引用合并到本申请中),和诸如三菱及三星的等离子 显示器的等离子显示器,增加了开发用于传输立体视频的有效技术的紧迫性。 附图说明 0006 图1A和图1B示出了3D视频解码框架的系统概况。 0007 图2A和图2B示出了根据本公开内容的示教的可伸缩解码架构的框图。 0008 图3示出了根据本公开内容的实施方式的完全解码模式(FDM-0)。。
15、 0009 图4示出了图片的解码依赖性。 0010 图5示出了根据本公开内容的另外的解码模式(FDM-1)。 0011 图6示出了根据本公开内容的另一解码模式(FDM-2)。 0012 图7示出了根据本公开内容的再一解码模式(FDM-3)。 0013 图8示出了图7的解码模式的省略简化。 0014 图9示出了根据本公开内容的又一解码模式4(FDM-4)。 0015 图10示出了图9的解码模式的省略简化。 0016 图11示出了根据本公开内容的示教的可伸缩解码算法。 0017 图12示出了用于说明本公开内容的示教的操作模式的高级语言程序。 0018 图13示出了根据本公开内容的另外的实施方式的可。
16、伸缩的打包架构的框图。 具体实施方式 0019 根据第一实施方式,提供了一种自适应解码多层视频系统,包括:基本层解码器; 一个或更多个增强层解码器;以及与所述基本层解码器和所述一个或更多个增强层解码器 连接的解码适配器,所述解码适配器控制所述基本层解码器和所述一个或更多个增强层解 说 明 书CN 102860008 A 2/9页 6 码器的操作。 0020 根据第二实施方式,提供了一种用于多层视频系统的自适应解码的方法,包括:读 取视频信息;基于先前解码的视频信息的解码时间来针对所述视频信息从多个解码模式中 选择解码模式;根据所选择的解码模式对所述多层系统的一个或更多个层的视频信息进行 解码;。
17、在每次解码后,更新所述先前解码的视频信息的解码时间;以及如果可获得更多的 视频信息,则重复上述读取、选择和解码步骤。 0021 根据第三实施方式,提供了一种适于通过网络将视频打包发送到客户端的自适应 多层视频服务器,包括:基本层视频打包器;一个或更多个增强层视频打包器;以及与所述 基本层视频打包器和所述一个或更多个增强层视频打包器连接的打包适配器,所述打包适 配器控制所述基本层视频打包器和所述一个或更多个增强层视频打包器的操作。 0022 在本申请的说明书、附图和权利要求中提供了本公开内容的其它实施方式。 0023 图1A和图1B示出了解码系统的概况,其示出了基本层解码器和增强层解码器。 采用。
18、图1A的解码系统的示例性架构是MPEG-4 AVC/H.264标准的SHP规范(Stereo High Profile)。该规范是在标准规格中添加了立体视频支持的、MPEG-4AVC的多视点视频编码 (MVC)扩展的特殊情况。参见,例如参考文献2,其全部内容通过引用合并到本申请中。采 用图1B的解码系统的示例性架构是杜比的帧兼容全分辨率(FCFR)系统。参见,例如,于 2009年4月20日提交的题为“Directed Interpolation and Data Postprocessing”的 美国临时专利申请No.61/170,995,以及于2009年7月4日提交的题为“Encoding 。
19、and Decoding Architectures for Format Compatible 3D Video Delivery”的美国临时专利 申请No.61/223,027,两者的全部内容通过引用合并到本申请中。在MPEG-4AVC SHP中,每 个视点被存储在单独的层中。杜比FCFR的基本层存储来自每个视点的一半数量的样本,并 且可以通过不同的交叉存取方法来构造,如棋盘和并排交叉存储等。增强层提供两个视点 的残余信息(针对每个视点的另一半样本)。该解码系统将组合来自两个层的图片输出以生 成全分辨率的两个视点。 0024 在图1B的系统中,示出了参考处理单元(RPU)。RPU处理来自基。
20、本层的输出图片 以生成高质量的参考,该参考随后可以用于增强层的运动补偿预测。还可以包括也在图1B 中示出的后处理单元。在3D应用示例中,后处理单元可以通过组合两个解码器的输出来产 生每个视点的全分辨率图片。 0025 本公开内容的实施方式涉及随后参考图13讨论的复杂度自适应解码与流处理技 术。如上面已经提到的,这些技术可以用于,例如,从高端到低端的处理系统范围内的各种 平台上的3D视频流编码系统的实时回放和流处理。本公开内容的示教可以应用到其它类 似的可伸缩方案(诸如由如Sensio和Real-D等公司提出的3D方案)或使用类似的可伸缩 概念的其它方案。本领域的普通技术人员还应当理解,本公开内。
21、容的示教不限于3D应用, 而且可以包括质量可伸缩系统、位深可伸缩性,除此之外还包括高动态范围的可伸缩方案 等。 0026 本公开内容的另外的应用涉及穿过异质和变化的网络的无缝视频流,如在参考文 献3到参考文献5中所描述的那些,其全部内容通过引用合并到本申请中。 0027 根据本公开内容的若干实施方式,提供了复杂度度量与自适应机制。图2A和图2B 示出了控制基本层解码器、RPU和增强层解码器的操作的解码自适应模块。在图2A的实施 说 明 书CN 102860008 A 3/9页 7 方式中,示出了基本层解码器和一个或更多个增强层解码器。在图2B的实施方式中,还考 虑了RPU的存在。 0028 具。
22、体地,针对每个基本层解码器和增强层解码器,解码自适应模块能够使能完全 解码模式、简化的解码模式,或甚至使能跳过所有模式。类似地,对于RPU,解码自适应模块 能够使能完全滤波、部分滤波或完全跳过RPU步骤。 0029 图2A和图2B的解码自适应模块适于从所有其它块(如基本解码器、增强解码器和 RPU)接收反馈。传递到解码自适应模块的信息可以包括关于解码复杂度、块或编码单元之 间的依赖性(通过比特流分析或甚至可能存在于比特流中的元数据)的信息,以及关于电源 使用和视频质量的信息。质量因素可以包括目前为止引入的失真以及如果稍后做出某些决 定可能引起的失真。所有这些信息都在模块中进行处理以进行解码自适。
23、应,从而决定哪个 模块应该受到了影响以及受到多大的影响。参考流处理实施方式可以做出类似的考虑(包 括网络特性),如稍后参考图13所讨论的。 0030 在以下段落所示的示例中,考虑了具有不同复杂度的六种不同解码模式。但是,本 领域普通技术人员应当理解,可以考虑任何数量的不同解码模式。尽管以下附图的示例示 出了一个增强层和一个RPU,但是本领域普通技术人员应当理解,RPU是可选的,并且如果 期望,可以设置有不止一个增强层。 0031 图3示出了解码模式的第一示例,其中,将计算最复杂的模式(也称为完全解码模 式)应用于基本层和增强层两者。在本公开内容全文中,这种模式将被称为FDM-0。当使用 快速解。
24、码模式时,图片质量会降低,但是在这种情况下,质量的损失是受控的。 0032 图4示出了解码过程中的图片依赖性。作为示例,可自由使用的双向预测图片(B) 依赖于预测图片(P),但是不用作参考,因此,在对这些图片进行解码时所发生的错误不会 影响其它图片的解码过程。P图片可以用作参考图片以接替P图片和B图片。P图片中的错 误将传播到依赖于其的后面的P图片和B图片,甚至更糟,这种错误将在整个图片组(GOP) 内传播。此处注意,B编码图片可以是可自由使用的但也可以用作针对运动补偿预测的参 考(在本示意图中标记为RB图片)。这对于帧内编码图片(I)或单向预测编码图片(P)也是 正确的。尽管在过去的编码标准。
25、中,I与P总是用作参考并且B图片被视为可自由使用的, 但是在MPEG-4AVC/H.264中,不再是这种情况。任何类型的图片均可以被标识为可自由使 用的。 0033 通常可以独立地解码的两个帧内(I)编码的图片之间的图像一般被认为属于单个 GOP。在MPEG-4AVC中,帧内编码的图片可能必须是即时解码器刷新(IDR)图片,或被标识 为随机存取单元。结果,对于所示的示例编码结构,P图片比B编码的图片更重要。如果使 用具有固定或自适应GOP的层级编码结构,则可以存在类似的依赖性。 0034 因此,根据本公开内容的一些实施方式,将初始尝试减小可自由使用的图片的解 码复杂度。如果解码速度依然比目标解。
26、码速度慢并且当前参考图片的解码复杂度大于给定 的阈值,则还依据参考图片对GOP中的将来图片的影响减小参考图片的解码复杂度。代替 仅基于图片等级,还可以基于较高的等级(如GOP等级)确定解码模式。换言之,代替每次 针对一张图片做出决定,系统可以每次在GOP等级或针对每N张图片做出决定。即,解码器 (或稍后在图13中说明的流处理情况中的服务器)可以对复杂度性能(或流处理实施方式中 的网络带宽)进行评估并且立即做出影响当前GOP中的所有这些图片的决定。即,可以这 说 明 书CN 102860008 A 4/9页 8 么说:可以针对所有的增强层图片跳过解块,或将不对GOP中的所有图片进行增强层的解 码。
27、(或针对图13的流处理情况不传输任何增强层信息),或甚至分析GOP中的依赖性并且基 于该依赖性来确定哪些图片应当完全解码、哪些图片地部分解码(以及在何等级)或哪些图 片完全不解码。在这些情况下,在全局等级做出决定。但是,这不能排除也可以在局部等级 (图片或切片)处做出的额外的改良。因此,该过程可以是局部的、全局的或局部与全局的组 合。 0035 图5示出了比FDM-0模式简单的第二解码模式,该模式在本文中被称为FDM-1模 式。根据这种模式,简化了增强层处的解码。通过该示例,可以简化或甚至消除非参考图片 (通常是B图片)的解块过程。例如,可以通过使用比由系统指定的解块滤波机制更简单的 解块滤波。
28、机制仅简化或禁用某些颜色组分的解块过程或甚至简化或禁用仅针对某些切片 的解块过程,来简化该解块过程。 0036 关于何时与如何修改解块过程的决定可以不仅取决于复杂度而且还取决于针对 图片如何影响质量。该决定可基于在解码期间收集的关于图片和图片组的信息。通过示例, 该决定可基于图片或切片的运动或基于标志信息(诸如向比特流中的该过程提供线索的元 数据)。 0037 通过使用图5所示的FDM-1模式,以通常很小的图片质量损失为代价,解码过程相 较于FDM-0而加速。由于该模式仅影响可自由使用的非参考图片,由该简化的解码过程导 致的错误不会传播给后续解码的图片。 0038 图6示出了与FDM-1相比更。
29、简单的解码模式,该模式被称为FDM-2。根据这种模式, 简化了基本层和增强层两者处的解码。通过示例的方式,简化或甚至跳过了基本层和增强 层两者处的非参考图片的解块过程。尽管由于RPU提供的参考的变更可能导致增强层中的 一些其它失真以及基本层中的一些失真,然而,由于这些帧没有用作任何其它图片的参考, 因此在解码期间不会产生漂移。应当理解,基础层和增强层的简化方法可以不同,并且可以 是上面参考FDM-1所讨论的简化方法中的任何一种。 0039 如果解码速度略微低于目标速度,则可以使用图5和图6中示出的解码方法FDM-1 和FDM-2。 0040 图7到图10示出了两种另外的快速解码模式(称为FDM。
30、-3和FDM-4),其可以导致 解码过程的进一步简化。 0041 图7示出了解码模式FDM-3,其中,通过在对非参考图片或可自由使用的图片解码 时另外简化其残余解码过程来简化增强层。该残余解码过程包括如熵解码、逆变换和逆量 化等的子过程。因此,通过简化上述一种或更多种子过程,存在可以简化该过程的不同方 式。另外,可以针对不同的切片简化残余解码,其中,每个切片可以使用基于元数据或分析 的不同简化方法。 0042 在具体的实施方式中,可以跳过整个残余解码过程,如图8所示。在这种情况下, RPU过程的输出被视为增强层的输出。在3D视频编码的情况下,通过在后处理步骤中将基 本层的输出与RPU单元的输出。
31、多路复用在一起,解码器将生成全分辨率的图片。 0043 由于存储在压缩的比特流的残余部分中的一些高频信号不会与编码器侧的高频 信号匹配,因此解码模式FDM-3将引入一些另外的失真。然而,将发生无错传播。此外,在 使用元数据来促进简化方法或如果该简化方法是内容自适应的实施方式中可以很好地控 说 明 书CN 102860008 A 5/9页 9 制该错误。例如,可以基于切片等级在编码器侧测量残余解码过程简化的质量失真,并且可 以将该信息嵌入到比特流中作为元数据。在解码器处,解码器可以做出使能某些简化或不 根据失真信息的决定。代替失真信息,还可以设置不同切片或图片之间的依赖性,而如果考 虑简化的解码。
32、方法,失真信息可以是可引入到比特流中的潜在失真的估计。在图13中稍后 讨论的流处理实施方式中,可以通过不标志某些信息进行错误控制。 0044 在不同的实施方式中,可以仅选择图片中的某些切片进行解码,或者可以在经过 一定时间之后或在已对这些切片中的一定数量的宏块进行解码之后开始及停止所有切片 的并行解码。针对还没有解码的残余区域,如图8所示,相反可以使用来自RPU的信号。 0045 图9示出了另一解码模式,其在本文中被称为FDM-4模式。根据该实施方式,可以 简化RPU过程、增强层解码(如残余解码和解块)和增强层处的非参考图片的后处理。具体 地,该简化过程可涉及:使用与指定的插值滤波器不同的插值。
33、滤波器,不对使用昂贵的亚像 素定位的一些宏块解码并恢复到RTU处理的信号,以及不对使用双向预测或加权预测等的 宏块解码。可以对每个子过程或每个切片进行该简化。还可以通过使用与指定的滤波器不 同的滤波器简化RPU过程。例如,可以使用较短的滤波器来代替较长的滤波器,可以使用一 维滤波器替代二维滤波器,可以使用固定滤波器代替显式滤波器等。可以针对整个图片、区 域(针对不同的区域可以在RPU中标志不同的滤波器)或甚至在颜色分量等级处选择这些滤 波器。 0046 图10示出图9的实施方式的特殊情况,其中,跳过了RPU过程、残余解码过程和解 块过程。假设已完全跳过了增强层并且基本层属于非参考图片,则FDM。
34、-4处理还可以扩展 到基本层。 0047 在使用上面的一种或更多种实施方式依然不会产生充分的解码器复杂度或期望 的流处理处理功能的情况下,上面的图和实施方式中所示的简化过程还可以扩展到参考图 片。将上述实施方式扩展到参考图片的解码模式在本文中将被称为FDM-5。这是最快的解 码模式并且可以用在基本层、增强层或两者上。在这种情况下,如果简化不是以受控的方式 来完成,则可能发生差的伪像。例如,考虑图片处于GOP中何处、因任何解码简化将导致质 量受到多远和多大的影响以及复杂度和流处理中的含义可以显著地帮助选择应该应用于 该图片的过程,如果任何。一张图片(例如靠近GOP的末端)即使是参考图片,由于其质。
35、量不 会传播到更多的图片,因而其相较于GOP中早先的其它图片可能更容易被舍弃。此外,期望 在影响基本层中的参考图片之前作用于增强层中的参考图片(通过简化或跳过)。 0048 具体地,当当前图片是参考图片时,将估计该图片的解码复杂度(如稍后在后续段 落中所说明的),以尽可能多地减小质量损失同时将解码速度的增加最大化。 0049 一旦已知或估计了该图片的解码复杂度,如果没有指示图片的失真的边信息(通 过例如元数据来提供),可以如下来处理解码过程。如果该图片的解码过程的估计复杂度小 于第一阈值(表示复杂度对于系统的解码能力而言是足够低的),则在解码过程中不 发生变化。否则,如果估计的复杂度高于第一阈。
36、值而低于第二阈值(表示复杂度既不 是太低也不是太高),则进行解码过程的初始简化,如解块过程的简化。另一方面,如果复杂 度高于第二阈值则进行进一步的简化,如残余解码过程和解块过程的简化。 0050 在图片等级处描述了上述实施方式。但是,可以提供不同的实施方式,其中,可以 在例如为子图片等级/区域等级的切片等级处应用所有提出的解码模式。切片等级的应用 说 明 书CN 102860008 A 6/9页 10 可以针对参考图片和非参考图片两者进行。可以基于比特流的解码期间的先前观察、针对 解码一张图片预算的平均时间以及为确保将进行解码而不超出该预算当前图片需要多少 时间等,来计算用于参考图片的上述阈值。
37、。 0051 另外,代替每次考虑单张图片或切片,如果需要,系统可以决定将多个图片分在一 组并且针对这些图片联合地作出这种决定。通过跳过或减少针对多个图片的解码器复杂度 的复杂度节省可以导致用于其它图片的节省,该可能对于主观质量具有比当前的节省更重 要的影响。关于是否跳过多个图片的决定可以基于图片相似度,图片相似度可设置于比特 流元数据中或甚至可以根据诸如比特流中可获得的运动矢量的给定比特流信息推论出来。 例如,如果两个顺序的图片的运动矢量类似,则知道这些图片也会是相似的并且可以使用 类似的方法一起简化(如,跳过)。 0052 图11示出了可控地应用上述简化的可伸缩解码过程的实施方式。在读取图片。
38、后, 初始地设置解码模式。将参考稍后描述的图12示出如何设置解码模式的示例。如果所选 择的解码模式是最快解码模式FDM-5(如上所述,其还提供参考图片的简化),则还对解码复 杂度进行估计。如上面参考解码模式FDM-5的描述已指出的,对解码复杂度的估计和随后 与阈值参数的比较允许在这种解码模式内执行简化的受控选择。然后,根据所选择的解码 模式对切片、图片或GOP进行解码。然后,根据稍后将要描述的公式来更新平均解码时间。 然后,重复该过程直到解码终止。 0053 现在转到图12,将描述根据本公开内容的待使用的解码模式设置算法的示例。如 果平均解码时间(DecTime Avg )大于第一阈值T 0 。
39、,则可以通过将解码模式改变成简化版本 (DecMode=DecMode+1)来减小解码复杂度。如果平均解码时间大于第二阈值T 2 (T 2 T 0 ) (这表示当前解码非常慢),则将解码模式设置成最简单的模式,如上面讨论的FDM-5模式 (D ecMode=FDM_5)。如果平均解码时间不大于阈值T 0 并且小于阈值T 1 (这表示解码足够快), 则将增加解码复杂度以确保更好的图片质量。另一方面,如果平均解码时间不大于阈值T 0 并且不大于阈值T 1 ,则将保持先前使用的解码复杂度(保持DecMode)。 0054 在以下段落中,将讨论四个公式以更好地理解图11和图12中包含的处理。公式 (1。
40、)将描述在图11的流程图中如何更新平均解码时间。另一方面,公式(2)到公式(4)将 描述如何估计解码复杂度。 0055 具体地,公式(1)描述了如何更新平均解码时间DecTime Avg 的示例。是控制更 新速度的因子,其可以取决于图片组(GOP)的长度。通过示例,可以随着GOP长度的增加 而减小。 0056 DecTime Avg LastPicDecTime+DecTime Avg (1-) (1) 0057 现在回到图11的解码复杂度的估计步骤,该步骤可以包括两部分。 0058 在第一部分中,对RPU处理的复杂度进行估计。该复杂度取决于滤波器的类型和 分区面积,并且例如可以通过公式(2)。
41、来计算。整个图片的RPU过程的复杂度是所有分区 的复杂度之和。 0059 0060 第二部分处理残余解码复杂度的估计。该估计取决于编码比特的数量和切片类 说 明 书CN 102860008 A 10 7/9页 11 型,并且例如可以通过经由查询表估计而由公式(3)计算。该表可以针对不同切片类型的 解码时间构建,考虑到解码统计数据,上述解码时间具有相同尺寸。 0061 0062 可以在公式(4)中估计总体复杂度,其中,考虑了公式(2)和公式(3)的结果,并且 其中,是对应于RPU处理的复杂度与整个解码处理的复杂度的比率的加权因子。基于收 集到的统计数据来测量。 0063 Comlexity pi。
42、cture Comlexity RPU +Comlexity Residue (1-) (4) 0064 可以使用元数据信息(表示例如使用SEI(辅助增强信息)消息、MPEG-4或MPEG-2 传输层或程序层的用户指定消息或通过用其它机制)来提供关于切片、图片或GOP的失真影 响的边信息。这种附加的信息对确定如上所述的模式FDM-5的控制的可能简化是有用的。 例如,解码器可以接收每个切片或图片的质量的测量、和/或图片依赖性以及任何解码器 简化对质量或复杂度的影响作为元数据。给出这些信息,则解码器甚至可以针对参考图片 来确定以下:如何通过仅会产生很小失真的第一影响切片来进行解码器简化的过程,同时。
43、 对总体的解码器复杂度还具有明显的影响。决定可以是仅基于失真或复杂度的,但也可以 基于联合决定,如,使用拉格朗日最优化方法。 0065 应当注意,在图12的示例中,SetDecodingMode算法仅指定了基于定时的性能的 而没有直接对质量进行解释。更直接地控制质量的其它实施方式也是可能的。例如,如果 两种方法产生类似的解码时间节省,则可以选择产生较低失真的方法。可替代地,考虑所有 将产生至少N%的复杂度减小的模式,可以联合地对它们进行评估,并且可以选择产生最佳 性能J=D+C的模式,其中,D是引入的失真,C是复杂度以及是拉格朗日乘数。 0066 可以提供附加信息,诸如哪里是安全的或不执行任何。
44、简化、GOP和预测关系等。还 可以通过元数据来提供关于图片的复杂度的信息。但是,在某些情况下,必需通过分析比特 流来计算或完善(在存在元数据时)复杂度。 0067 尽管本公开内容的实施方式考虑了复杂度估计过程,但是在复杂度方面,该过程 仍然可以低于执行完全解码操作的过程。 0068 具体地,切片等级的复杂度的估计可以通过首先检查该切片占用的比特数来取 得。如果复杂度不足,则仅可以进行部分或完全的熵解码。通过这样做,能够确定头信息比 特对纹理比特。如果比特流包括大量的头比特(意味着存在大量的运动矢量),则在比特流 中使能的情况下表示必需对运动补偿做更多的处理以及甚至解块。另一方面,如果纹理信 息。
45、很重要,则表示在解码期间针对变换与量化过程可能必需要花费大量的时间。 0069 上述复杂度分析可以影响在本公开内容中讨论的任何层与任何模式。 0070 为了获得图片的解码复杂度的更好估计,如果需要其它信息,则可以仅对视频的 运动信息进行解码而不进行全运动补偿过程。如果对此满意,则继续进行图片的完全解码, 否则可以如早前讨论的,跳过或简化所有剩余的解码步骤。 0071 本公开内容的示教可以用于不同平台(如低端平台)上的实时解码与三维视频编 码图像流。它们可以用在如视屏解码器、回放装置上以及能够显示高分辨率立体视图的一 些显示装置内。 说 明 书CN 102860008 A 11 8/9页 12 。
46、0072 本公开内容的示教可以用在考虑网络传输带宽和客户端解码能力的视频流服务 器中。图13示出了发生在视频流服务器中的过程的一般性描述。 0073 在流处理应用中,类似于参考先前图所讨论的,服务器可以在尝试保持针对客户 端的最好质量的同时采用根据反馈的打包过程,该反馈包括包丢失率和来自客户端的延 迟。打包涉及以下过程:将待传递的数据分成小单元并且将每个单元封装成格式化的块(如 IP包),该格式化的块的格式对于网络传输是友好的。通信量信息由客户端返回给服务器侧 的自适应模块。当包丢失率非常低时,服务器会发送所有层的所有包。另一方面,如果,包 丢失率增加但是仍然很低,则服务器会首先丢弃可自由使用。
47、切片上的加强层包。如果包丢 失率依然在增加,则服务器会丢弃可自由使用切片上的基本层包,并且进一步丢弃非可自 由使用切片上的增强层包。因此,在图13的应用中,替代针对解码器复杂度调节比特流,在 考虑比特流中的相同依赖性的同时将一些包发送给客户端(因此,减小了总体比特率和网 络负载)。图13的流处理或打包适配器可以从服务器自身接收信息(独立于客户端或在对 客户端信息进行处理后)和/或从客户端。 0074 根据本公开内容的实施方式,服务器还可以选择丢弃可在解码期间产生一些小漂 移或“错误”的信息。该信息可以发送给客户端作为元数据。此外,在给出该知识的情况下, 在客户端侧客户端可以尝试(如果可能和/或。
48、期望)对这些错误进行纠正。该服务器可以知 道客户端的能力(或甚至是处于组播环境中的客户端)并且使得这些情况可以基于对这些 能力的了解来进行。通过示例的方式,可以提供拉格朗日成本,其众,参数可以包括网络带 宽、每个客户端的质量、功率消耗(如果相关)等。 0075 还提供了本公开内容的实施方式,其中,图2的解码侧的架构与图13的服务器侧 的架构相组合。 0076 本公开内容的一些实施方式集中于如下技术:采用比特流实现跨越不同平台的无 缝视频交付和最好的用户体验,以及立体视屏方案的上下文中的系统。但是,本领域的普 通技术人员应当理解,这里所提出的概念还可以应用于其它类似的系统,如类高动态范围 (HD。
49、R)的可伸缩系统,或多视点编码。 0077 本公开内容所描述的方法及系统可以以硬件、软件、固件或其组合来实施。描述为 块、模块或部件的特征可以一起实施(例如,在诸如集成的逻辑器件的逻辑器件中)或单独 地实施(例如,作为单独连接的逻辑装置)。本公开内容的方法的软件部分可以包括计算机 可读介质,其包括当被执行时至少部分地执行所描述的方法的指令。该计算机可读介质可 以包括,例如,随机存取存储器(RAM)和/或只读存储器(ROM)。该指令可以通过处理器(如, 数字信号处理器(DSP)、专用集成电路(ASIC)、或现场可编程门阵列(FPGA)来执行。 0078 本说明书中所提到的所有专利与出版物可以指示与本公开内容相关的领域的普 通技术人员的水平。本公开内容所引用的所有参考文献通过引用包含在本文中,如同每个 文献的全部内容通过单独引用包含在本文中。 0079 应当理解,本公开内容不限于特定的方法或系统,这些方法或系统当然可以变化。。