在MPEG2系统中组合多视角视频译码子位流.pdf-资源下载-专利查询网

在MPEG2系统中组合多视角视频译码子位流.pdf

1、(10)申请公布号 CN 102804773 A (43)申请公布日 2012.11.28 CN 102804773 A *CN102804773A* (21)申请号 201080029011.2 (22)申请日 2010.06.28 61/221,449 2009.06.29 US 12/709,323 2010.02.19 US H04N 7/26(2006.01) H04N 7/50(2006.01) H04N 21/2343(2011.01) H04N 21/2362(2011.01) H04N 21/434(2011.01) H04N 21/845(2011.01) (71)申请人

2、高通股份有限公司地址美国加利福尼亚州 (72)发明人陈英马尔塔卡切维奇陈培松 (74)专利代理机构北京律盟知识产权代理有限责任公司 11287 代理人宋献涛 (54) 发明名称在 MPEG-2 系统中组合多视角视频译码子位流 (57) 摘要一种多路分用器可组合子位流的视角分量。在一个实例中，一种设备包含多路分用器，所述多路分用器从包含主要子位流和嵌入子位流的所接收位流中产生符合多视角视频译码 MVC 标准的位流。为产生所述符合MVC标准的位流，所述多路分用器确定所述主要子位流的视角分量是否具有比所述嵌入子位流的视角分量的视角次序索引大的视角次序索引，

3、并将来自视角次序索引较低的子位流的视角分量添加到所述所产生的位流。所述所接收的位流可在每一视角分量之间包含定界符网络抽象层 NAL 单元以区别所述视角分量。所述设备可进一步包含视频解码器以解码由所述多路分用器产生的所述位流。 (30)优先权数据 (85)PCT申请进入国家阶段日 2011.12.27 (86)PCT申请的申请数据 PCT/US2010/040230 2010.06.28 (87)PCT申请的公布数据 WO2011/002723 EN 2011.01.06 (51)Int.Cl. 权利要求书 4 页说明书 26 页附图 8 页 (19)中华人民共和国国家知识产权局

4、 (12)发明专利申请权利要求书 4 页说明书 26 页附图 8 页 1/4 页 2 1. 一种产生视频位流的方法，其包含：通过客户端装置从包含主要子位流和所述主要子位流的嵌入子位流的所接收的位流中产生符合多视角视频译码 MVC 标准的位流，其中产生所述符合 MVC 标准的位流包含：确定所述主要子位流的视角分量是否具有大于所述嵌入子位流的视角分量的视角次序索引的视角次序索引；当所述主要子位流的所述视角分量的所述视角次序索引大于所述嵌入子位流的所述视角分量的所述视角次序索引时，将所述嵌入子位流的所述视角分量添加到所述所产生的位流；及当所述主要子位流的所述视角

5、分量的所述视角次序索引不大于所述嵌入子位流的所述视角分量的所述视角次序索引时，将所述主要子位流的所述视角分量添加到所述所产生的位流；以及将所述所产生的位流输出到视频解码器。 2. 根据权利要求 1 所述的方法，其进一步包含：确定所述主要子位流不具有剩余视角分量；以及将所述嵌入子位流的所有剩余视角分量添加到所述所产生的子位流。 3. 根据权利要求 1 所述的方法，其进一步包含：确定所述嵌入子位流不具有剩余视角分量；以及将所述主要子位流的所有剩余视角分量添加到所述所产生的子位流。 4. 根据权利要求 1 所述的方法，其中将所述嵌入子位流的所述视角分量添加到所述

6、所产生的位流包含：从所述嵌入子位流检索网络抽象层 NAL 单元直到在所述嵌入子位流中到达定界符 NAL 单元为止；以及将所述所检索的NAL单元中除所述定界符NAL单元外的每一单元添加到所述所产生的位流。 5. 根据权利要求 1 所述的方法，其中将所述主要子位流的所述视角分量添加到所述所产生的位流包含：从所述主要子位流检索网络抽象层 NAL 单元直到在所述主要子位流中到达定界符 NAL 单元为止；以及将所述所检索的NAL单元中除所述定界符NAL单元外的每一单元添加到所述所产生的位流。 6. 根据权利要求 1 所述的方法，其进一步包含：根据所述视角分量的所述视角

7、次序索引产生包含所述所接收的位流的所述视角分量的有序表示的分级结构层索引列表；且其中将所述所产生的位流输出到所述视频解码器包含将所述分级结构层索引输出到所述视频解码器。 7. 根据权利要求 1 所述的方法，其中产生所述符合 MVC 标准的位流包含在不将包括于所述主要子位流中的视角的视角识别符与包括于所述嵌入子位流中的视角的视角识别符进行比较的情况下产生所述符合 MVC 标准的位流。 8. 一种用于产生视频位流的设备，其包含：权利要求书 CN 102804773 A 2 2/4 页 3 输入接口，其接收包含主要子位流和所述主要子位流的嵌入子位流的位流；多路分用

8、器，其从所述所接收的位流中产生符合多视角视频译码 MVC 标准的位流，其中为产生所述符合 MVC 标准的位流，所述多路分用器确定所述主要子位流的视角分量是否具有大于所述嵌入子位流的视角分量的视角次序索引的视角次序索引，当所述主要子位流的所述视角分量的所述视角次序索引大于所述嵌入子位流的所述视角分量的所述视角次序索引时，将所述嵌入子位流的所述视角分量添加到所述所产生的位流，且当所述主要子位流的所述视角分量的所述视角次序索引不大于所述嵌入子位流的所述视角分量的所述视角次序索引时，将所述主要子位流的所述视角分量添加到所述所产生的位流；以及视频解码器，其解码由所述多路

9、分用器产生的所述位流。 9. 根据权利要求 8 所述的设备，其中所述多路分用器在确定所述主要子位流不具有剩余视角分量后即刻将所述嵌入子位流的所有剩余视角分量添加到所述所产生的子位流。 10. 根据权利要求 8 所述的设备，其中所述多路分用器在确定所述嵌入子位流不具有剩余视角分量后即刻将所述主要子位流的所有剩余视角分量添加到所述所产生的子位流。 11. 根据权利要求 8 所述的设备，其中为将所述嵌入子位流的所述视角分量添加到所述所产生的位流，所述多路分用器从所述嵌入子位流检索网络抽象层 NAL 单元直到在所述嵌入子位流中到达定界符 NAL 单元为止，且接着将所述所检索的 NAL

10、单元中除所述定界符 NAL 单元外的每一单元添加到所述所产生的位流。 12. 根据权利要求 8 所述的设备，其中为将所述主要子位流的所述视角分量添加到所述所产生的位流，所述多路分用器从所述主要子位流检索网络抽象层 NAL 单元直到在所述主要子位流中到达定界符 NAL 单元为止，且将所述所检索的 NAL 单元中除所述定界符 NAL 单元外的每一单元添加到所述所产生的位流。 13. 根据权利要求 8 所述的设备，其中所述多路分用器进一步根据所述视角分量的所述视角次序索引产生包含所述所接收的位流的所述视角分量的有序表示的分级结构层索引列表，且将所述分级结构层索引作为所述所产生的位

11、流的一部分输出到所述视频解码器。 14. 根据权利要求 8 所述的设备，其中所述多路分用器在不将包括于所述主要子位流中的视角的视角识别符与包括于所述嵌入子位流中的视角的视角识别符进行比较的情况下产生所述符合 MVC 标准的位流。 15. 根据权利要求 8 所述的设备，其中所述设备包含以下各物中的至少一者：集成电路；微处理器，以及包括所述视频编码器的无线通信装置。 16. 一种用于产生视频位流的设备，其包含：用于从包含主要子位流和所述主要子位流的嵌入子位流的所接收位流产生符合多视角视频译码 MVC 标准的位流的装置，其包含：用于确定所述主要子位流的视角分量是

12、否具有大于所述嵌入子位流的视角分量的视角次序索引的视角次序索引的装置，用于当所述主要子位流的所述视角分量的所述视角次序索引大于所述嵌入子位流的所述视角分量的所述视角次序索引时将所述嵌入子位流的所述视角分量添加到所述所产权利要求书 CN 102804773 A 3 3/4 页 4 生的位流的装置，以及用于当所述主要子位流的所述视角分量的所述视角次序索引不大于所述嵌入子位流的所述视角分量的所述视角次序索引时将所述主要子位流的所述视角分量添加到所述所产生的位流的装置；以及用于将所述所产生的位流输出到视频解码器的装置。 17. 根据权利要求 16 所述的设备，其进一步包

13、含：用于确定所述主要子位流不具有剩余视角分量的装置；以及用于将所述嵌入子位流的所有剩余视角分量添加到所述所产生的子位流的装置。 18. 根据权利要求 16 所述的设备，其进一步包含：用于确定所述嵌入子位流不具有剩余视角分量的装置；以及用于将所述主要子位流的所有剩余视角分量添加到所述所产生的子位流的装置。 19. 根据权利要求 16 所述的设备，其中所述用于将所述嵌入子位流的所述视角分量添加到所述所产生的位流的装置包含：用于从所述嵌入子位流检索网络抽象层 NAL 单元直到在所述嵌入子位流中到达定界符 NAL 单元为止的装置；以及用于将所述所检索的NAL单元中

14、除所述定界符NAL单元外的每一单元添加到所述所产生的位流的装置。 20. 根据权利要求 16 所述的设备，其中所述用于将所述主要子位流的所述视角分量添加到所述所产生的位流的装置包含：用于从所述主要子位流检索网络抽象层 NAL 单元直到在所述主要子位流中到达定界符 NAL 单元为止的装置；以及用于将所述所检索的NAL单元中除所述定界符NAL单元外的每一单元添加到所述所产生的位流的装置。 21. 根据权利要求 16 所述的设备，其进一步包含：用于根据所述视角分量的所述视角次序索引产生包含所述所接收的位流的所述视角分量的有序表示的分级结构层索引列表的装置；且其中所述

15、用于将所述所产生的位流输出到所述视频解码器的装置包含用于将所述分级结构层索引输出到所述视频解码器的装置。 22. 根据权利要求 16 所述的设备，其中所述用于产生所述符合 MVC 标准的位流的装置包含用于在不将包括于所述主要子位流中的视角的视角识别符与包括于所述嵌入子位流中的视角的视角识别符进行比较的情况下产生所述符合 MVC 标准位流的装置。 23. 一种编码有指令的计算机可读存储媒体，所述指令用于致使客户端装置的处理器执行以下动作：从包含主要子位流和所述主要子位流的嵌入子位流的所接收的位流中产生符合多视角视频译码 MVC 标准的位流，其中所述用以产生所述符合 MVC 标

16、准的位流的指令包含用以执行以下动作的指令：确定所述主要子位流的视角分量是否具有大于所述嵌入子位流的视角分量的视角次序索引的视角次序索引；当所述主要子位流的所述视角分量的所述视角次序索引大于所述嵌入子位流的所述权利要求书 CN 102804773 A 4 4/4 页 5 视角分量的所述视角次序索引时，将所述嵌入子位流的所述视角分量添加到所述所产生的位流；以及当所述主要子位流的所述视角分量的所述视角次序索引不大于所述嵌入子位流的所述视角分量的所述视角次序索引时，将所述主要子位流的所述视角分量添加到所述所产生的位流；以及将所述所产生的位流从所述客户端装置输

17、出到视频解码器。 24. 根据权利要求 23 所述的计算机可读存储媒体，其进一步包含用以执行以下动作的指令：确定所述主要子位流不具有剩余视角分量；以及将所述嵌入子位流的所有剩余视角分量添加到所述所产生的子位流。 25. 根据权利要求 23 所述的计算机可读存储媒体，其进一步包含用以执行以下动作的指令：确定所述嵌入子位流不具有剩余视角分量；以及将所述主要子位流的所有剩余视角分量添加到所述所产生的子位流。 26. 根据权利要求 23 所述的计算机可读存储媒体，其中所述用以将所述嵌入子位流的所述视角分量添加到所述所产生的位流的指令包含用以执行以下动作的指令：从所述

18、嵌入子位流检索网络抽象层 NAL 单元直到在所述嵌入子位流中到达定界符 NAL 单元为止；以及将所述所检索的NAL单元中除所述定界符NAL单元外的每一单元添加到所述所产生的位流。 27. 根据权利要求 23 所述的计算机可读存储媒体，其中所述用以将所述主要子位流的所述视角分量添加到在所述所产生的位流的指令包含用以执行以下动作的指令：从所述主要子位流检索网络抽象层NAL单元直到所述主要子位流中到达定界符NAL单元为止；以及将所述所检索的NAL单元中除所述定界符NAL单元外的每一单元添加到所述所产生的位流。 28. 根据权利要求 23 所述的计算机可读存储媒体，其进一步

19、包含用以执行以下动作的指令：根据所述视角分量的所述视角次序索引产生包含所述所接收的位流的所述视角分量的有序表示的分级结构层索引列表，其中所述用以将所述所产生的位流输出到所述视频解码器的指令包含用以将所述分级结构层索引输出到所述视频解码器的指令。 29. 根据权利要求 23 所述的计算机可读存储媒体，其中所述用以产生所述符合 MVC 标准的位流的指令包含用以在不将包括于所述主要子位流中的视角的视角识别符与包括于所述嵌入子位流中的视角的视角识别符进行比较的情况下产生所述符合 MVC 标准的位流的指令。权利要求书 CN 102804773 A 5 1/26 页 6 在

20、MPEG-2 系统中组合多视角视频译码子位流 0001 相关申请案 0002 本申请案主张 2009 年 6 月 29 日申请的第 61/221,449 号美国临时申请案和 2009 年 6 月 12 日申请的第 61/186,613 号美国临时申请案的权益，所述两个临时申请案的全部内容的相应全文在此以引用的方式明确地并入本文中。 0003 相关申请案的交叉参考 0004 本专利申请案与以下共同待决美国专利申请案相关：由 Ying Chen 与本案同时申请的 “MPEG-2 系统上的多视角视频译码 (MULTIVIEW VIDEO CODING OVER MPEG-2 SYSTEMS

21、)” ，所述专利申请案代理人案号为 092514，转让给本受让人，且以引用的方式明确地并入本文中。技术领域 0005 本发明涉及经编码的视频数据的传送。背景技术 0006 数字视频能力可并入到广泛装置中，包括数字电视、数字直播系统、无线广播系统、个人数字助理 (PDA)、膝上型或台式计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电传会议装置等。数字视频装置实施视频压缩技术，例如由MPEG-2、 MPEG-4、 ITU-T H.263或ITU-T H.264/MPEG-4第 10 部分先进视频译

22、码 (AVC) 所定义的标准和此类标准的扩展版中描述的技术，以更有效地发射和接收数字视频信息。 0007 视频压缩技术执行空间预测和 / 或时间预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码，可将视频帧或片段分割成宏块。每一宏块可经进一步分割。帧内译码 (I) 帧或片段中的宏块使用相对于相邻宏块的空间预测来编码。帧间译码 (P 或 B) 帧或片段中的宏块可使用相对于同一帧或片段中的相邻宏块的空间预测或相对于其它参考帧的时间预测。 0008 在已编码视频数据后，视频数据可由多路复用器来包化以供发射或存储。MPEG-2 包括 “系统” 部分，其定义用于许多视频编码标准的

23、传送层。MPEG-2 传送层系统可由 MPEG-2 视频编码器或其它符合不同视频编码标准的视频编码器使用。举例来说， MPEG-4 指定不同于 MPEG-2 的编码和解码方法的编码和解码方法，但实施 MPEG-4 标准的技术的视频编码器仍可利用 MPEG-2 传送层方法。一般来说，对 “MPEG-2 系统” 的提及指代由 MPEG-2 所指定的视频数据的传送层。由 MPEG-2 所指定的传送层在本发明中也称为 “MPEG-2 传送流” 或简称为 “传送流” 。同样， MPEG-2 系统的传送层还包括节目流。传送流和节目流通常包括用于传递类似数据的不同格式，其中传送流包含包括音频

24、数据与视频数据两者的一个或一个以上 “节目” ，而节目流包括包含音频数据与视频数据两者的一个节目。 0009 MPEG-2 系统规范描述可如何将经压缩的多媒体 ( 视频和音频 ) 数据流与其它数据一起多路复用以形成适合于数字发射或存储的单一数据流。在 2006 年 5 月的 “信说明书 CN 102804773 A 6 2/26 页 7 息技术 - 动画和相关联音频的一般译码：系统，推荐 H.222.0 ；国际标准化组织， ISO/IEC JTC1/SC29/WG11 ；动画和相关联音频的译码 (Information Technology-Generic Coding o

25、f Moving Pictures and Associated Audio ： Systems， Recommendation H.222.0 ； International Organisation for Standardisation， ISO/IEC JTC1/SC29/WG11 ； Coding of Moving Pictures and Associated Audio)” 中指定 MPEG-2 系统的最新规范。MPEG 最近针对 MPEG-2 系统设计了 MVC 的传送标准，且此规范的最新版本为 “ISO/IEC 13818-1 的研究： MVC 的 2007/FPD

26、AM4 传送 (Study of ISO/IEC 13818-1 ： 2007/FPDAM4 Transport of MVC)” ， MPEG doc.N10572， MPEG of ISO/IEC JTC1/SC29/WG11，美国夏威夷毛伊岛 (Maui， Hawaii， USA)， 2009 年 4 月。发明内容 0010 大体上，本发明描述用于改进 MPEG-2( 动画专家组 ) 系统中多视角视频译码的技术。本发明的技术大体来说相对于多视角视频译码 (MVC) 而扩展 MPEG-2 传送层 ( 例如， MPEG-2 传送流和 MPEG-2 节目流 ) 的能力。举例来说，本发

27、明的技术使得 MVC 视频流的不连续视角的发射能够在传送层处发射。本发明的技术进一步使得传送流 ( 或节目 ) 的子位流各自能够包括不连续视角。所述技术还使得接收装置在接收到包含多个子位流 ( 每一子位流具有不连续视角 ) 的传送层流后能够即刻重新布置子位流中的视角，使得传送流经适当地定序 ( 即，根据视角次序索引按递增次序 )，以使得解码器可适当地解码所述视角中的每一者的帧。 0011 在一个实例中，一种方法包括通过源装置建构数据结构，所述数据结构用于信令相应MPEG-2(动画专家组)系统标准位流包含场景的与第一视角次序索引相关联的第一视角和所述场景的与第二视角次序索

28、引相关联的第二视角，其中所述第一视角次序索引和所述第二视角次序索引为不连续的。所述方法还包括输出所述数据结构，例如，将所述数据结构发射到目的地装置或将所述数据结构存储到计算机可读媒体。 0012 在另一实例中，一种设备包括：视频编码器，其编码场景的多个视角；多路复用器，其建构数据结构，所述数据结构用于信令相应MPEG-2(动画专家组)系统标准位流包含所述场景的所述多个视角中的与第一视角次序索引相关联的第一视角和所述场景的所述多个视角中的与第二视角次序索引相关联的第二视角，其中所述第一视角次序索引和所述第二视角次序索引为不连续的；以及输出接口，其输出所

29、述数据结构。 0013 在另一实例中，一种设备包括：用于通过源装置建构数据结构的装置，所述数据结构用于信令相应MPEG-2(动画专家组)系统标准位流包含场景的与第一视角次序索引相关联的第一视角和所述场景的与第二视角次序索引相关联的第二视角，其中所述第一视角次序索引和所述第二视角次序索引为不连续的；以及用于输出所述数据结构的装置。 0014 在另一实例中，一种计算机可读存储媒体以多个指令进行编码，所述指令致使处理器建构数据结构并输出所述数据结构，所述数据结构用于信令相应 MPEG-2( 动画专家组 ) 系统标准位流包含场景的与第一视角次序索引相关联的第一视角和所述场

30、景的与第二视角次序索引相关联的第二视角，其中所述第一视角次序索引和所述第二视角次序索引为不连续的。 0015 在又一实例中，一种方法包括通过客户端装置从包含主要子位流和所述主要子位说明书 CN 102804773 A 7 3/26 页 8 流的嵌入子位流的所接收位流产生符合多视角视频译码 (MVC) 标准的位流，其中产生所述符合 MVC 标准的位流包括确定所述主要子位流的视角分量是否具有大于嵌入子位流的视角分量的视角次序索引的视角次序索引，当主要子位流的视角分量的视角次序索引大于嵌入子位流的视角分量的视角次序索引时，将嵌入子位流的视角分量添加到所产生的位流，且当主要

31、子位流的视角分量的视角次序索引不大于嵌入子位流的视角分量的视角次序索引时，将主要子位流的视角分量添加到所产生的位流。所述方法进一步包括将所产生的位流输出到视频解码器。 0016 在另一实例中，一种设备包括：输入接口，其接收包含主要子位流和所述主要子位流的嵌入子位流的位流；多路分用器，其从所接收的位流产生符合多视角视频译码 (MVC) 标准的位流，其中为了产生所述符合 MVC 标准的位流，所述多路分用器确定所述主要子位流的视角分量是否具有大于嵌入子位流的视角分量的视角次序索引的视角次序索引，当主要子位流的视角分量的视角次序索引大于嵌入子位流的视角分量的视角次序索引

32、时将嵌入子位流的视角分量添加到所产生的位流，且当主要子位流的视角分量的视角次序索引不大于嵌入子位流的视角分量的视角次序索引时将主要子位流的视角分量添加到所产生的位流；以及视频解码器，其解码由多路分用器产生的位流。 0017 在另一实例中，一种设备包括：用于从包含主要子位流和所述主要子位流的嵌入子位流的所接收位流产生符合多视角视频译码 (MVC) 标准的位流的装置；用于确定所述主要子位流的视角分量是否具有大于嵌入子位流的视角分量的视角次序索引的视角次序索引的装置；用于当主要子位流的视角分量的视角次序索引大于嵌入子位流的视角分量的视角次序索引时将嵌入子位流的视角

33、分量添加到所产生的位流的装置；以及用于当主要子位流的视角分量的视角次序索引不大于嵌入子位流的视角分量的视角次序索引时将主要子位流的视角分量添加到所产生的位流的装置；以及用于将所产生的位流输出到视频解码器的装置。 0018 在另一实例中，一种计算机可读存储媒体以指令进行编码，所述指令用于致使客户端装置的可编程处理器从包含主要子位流和所述主要子位流的嵌入子位流的所接收位流产生符合多视角视频译码 (MVC) 标准的位流并将所产生的位流输出到视频解码器，包含用以确定所述主要子位流的视角分量是否具有大于嵌入子位流的视角分量的视角次序索引的视角次序索引的指令，当主要子位流的视

34、角分量的视角次序索引大于嵌入子位流的视角分量的视角次序索引时，将嵌入子位流的视角分量添加到所产生的位流，且当主要子位流的视角分量的视角次序索引不大于嵌入子位流的视角分量的视角次序索引时，将主要子位流的视角分量添加到所产生的位流。 0019 附图和下文描述中阐述一个或一个以上实例的细节。其它特征、目标和优点将从描述内容和图式以及从权利要求书而显而易见。附图说明 0020 图 1 为说明其中音频 / 视频 (A/V) 源装置将音频和视频数据传送到 A/V 目的地装置的实例系统的框图。 0021 图 2 为说明多路复用器的组件的实例布置的框图。 0022 图 3 为说明节目特定信

35、息表的实例集合的框图。说明书 CN 102804773 A 8 4/26 页 9 0023 图 4 为说明可包括于多视角视频译码 (MVC) 扩展描述符中的实例数据集的框图。 0024 图 5 为说明可包括于分级结构描述符中的实例数据集的框图。 0025 图 6 为说明实例 MVC 预测图案的概念图。 0026 图 7 为说明用于从服务器将具有拥有不连续视角次序索引的视角的子集的 MPEG-2 系统流发送到客户端的实例方法的流程图。 0027 图 8 为说明用于组合两个或两个以上子位流的视角分量以产生位流使得所述视角分量具有递增视角次序索引的实例方法的流程图。具体实施方式 0028

36、本发明的技术大体来说针对增强 MPEG-2( 动画专家组 ) 系统 ( 即，就传送层细节来说符合 MPEG-2 的系统 ) 中的多视角视频译码 (MVC)。举例来说， MPEG-4 提供用于视频编码的标准，但通常假定遵从 MPEG-4 标准的视频编码器将利用 MPEG-2 传送层系统。因此，本发明的技术适用于符合 MPEG-2、 MPEG-4、 ITU-T H.263、 ITU-T H.264/MPEG-4 或利用 MPEG-2 传送流和 / 或节目流的任何其它视频编码标准的视频编码器。 0029 特定来说，本发明的技术可用以修改用于 MPEG-2 传送流和节目流的传送层处的语

37、法元素。举例来说，本发明的技术包括在传送流中发射以特定地识别在传送流中发送的多视角视频数据的每一视角的描述符。举例来说，服务器装置可提供各种服务，所述服务中的每一者包含多视角视频译码视频数据的特定视角的相应子集，其中可基于由客户端装置执行的应用程序、由客户端装置执行的解码器的能力、由客户端装置表达的偏好或其它选择标准来选择服务的视角子集。 0030 根据本发明的技术，服务器装置可提供具有不连续视角次序索引的视角的子集。在一个实例中，服务器装置在可包括于节目映射表 (PMT) 或节目流映射 (PSM) 中的 MVC 扩展描述符中特定地信令将包括于传送流中的所述视角中

38、的每一者。 0031 在一些实例中，服务器装置可在单一传送流或节目流中发送多个子位流。通过使得位流的视角能够为不连续的，本发明的技术还使对应于每一子位流的视角的视角次序索引能够为不连续的。虽然这些技术使得每一子位流中的视角次序索引能够为不连续的，但是仍需要视角次序索引在子位流中递增，以便符合现有位流标准 ( 例如， MPEG-2 系统标准 )。然而，因为第一子位流和第二子位流的视角可各自为不连续的，所以所述视角相对于视角次序索引来说可能无序地到达客户端装置。本发明的技术还使得客户端装置能够处理此种传送流以有效地重新定序第一子位流和第二子位流的视角，使得所述视角的视角次

39、序索引递增。具有不连续视角次序索引的视角组合可用于实现视角可调能力，其对于带宽调适、解码器效率可能有用并提供其它此类优点。举例来说，与将需要将所有视角发送到客户端装置且客户端装置解码具有连续视角次序索引的每一视角的常规技术相比，本发明的技术使得能够仅发送客户端装置特别需要的那些视角，即使在此导致具有不连续视角次序索引的视角时也如此。以此方式，客户端装置可仅接收特定服务所需的那些视角，而非具有介入视角次序索引的所有视角。 0032 虽然在各个部分中本发明可个别地提及 “传送流” 或 “节目流” ，但应理解，本发明的技术大体来说适用于 MPEG-2 传送流和节目

40、流中的任一者或两者。大体上，本发明描述用于执行本发明的技术的实例描述符。描述符用以扩展流的功能性。本发明的描述符可由传说明书 CN 102804773 A 9 5/26 页 10 送流与节目流两者使用以实施本发明的技术。 0033 本发明还使用以下术语，且提议将这些术语连同如所指示的术语的语义一起包括于当前 MPEG-2 系统标准的修订版中： 0034 AVC 视频子位流： MVC 位流的基本视角。 0035 MVC 的 AVC 视频子位流：舍弃前置 NAL 单元的 MVC 位流的基本视角。 0036 MVC 基本视角子位流： MVC 的 AVC 视频子流或 AVC 视

41、频子位流。 0037 MVC 视角分量子集：一个视角分量的 NAL 单元。 0038 MVC view_id 子集：一个视角的 NAL 单元。 0039 MVC 视频子位流：非基本视角的 NAL 单元。 0040 图 1 为说明其中音频 / 视频 (A/V) 源装置 20 将音频和视频数据传送到 A/V 目的地装置 40 的实例系统 10 的框图。图 1 的系统 10 可对应于视频电传会议系统、服务器 / 客户端系统、广播装置 / 接收器系统，或将视频数据从源装置 ( 例如， A/V 源装置 20) 发送到目的地装置 ( 例如， A/V 目的地装置 40) 的任何其它系

42、统。在一些实例中， A/V 源装置 20 和 A/V 目的地装置 40 可执行双向信息交换。即， A/V 源装置 20 和 A/V 目的地装置 40 可能能够编码与解码 ( 以及发射和接收 ) 音频和视频数据。在一些实例中，音频编码器 26 可包含语音编码器，也称为声码器。 0041 在图 1 的实例中， A/V 源装置 20 包含音频源 22 和视频源 24。音频源 22 可包含 (例如)麦克风，其产生表示待由音频编码器26编码的所俘获音频数据的电信号。或者，音频源 22 可包含存储先前记录的音频数据的存储媒体、例如计算机化合成器等音频数据产生器，或任何其它音频数据源。

43、视频源 24 可包含产生待由视频编码器 28 编码的视频数据的视频相机、编码有先前记录的视频数据的存储媒体、视频数据产生单元或任何其它视频数据源。原始音频和视频数据可包含模拟或数字数据。模拟数据可在由音频编码器 26 和 / 或视频编码器 28 编码之前经数字化。音频源 22 可在发言参与者发言的同时从所述发言参与者获得音频数据，且视频源 24 可同时获得发言参与者的视频数据。在其它实例中，音频源 22 可包含包括所存储的音频数据的计算机可读存储媒体，且视频源 24 可包含包括所存储的视频数据的计算机可读存储媒体。以此方式，本发明中所描述的技术可应用于直播串流实时音频和

44、视频数据或应用于归档的预先记录的音频和视频数据。 0042 对应于视频帧的音频帧通常为含有与由视频源 24 俘获的含于视频帧中的视频数据同时由音频源 22 俘获的音频数据的音频帧。举例来说，在发言参与者通常通过发言而产生音频数据的同时，音频源 22 俘获音频数据，且视频源 24 同时 ( 即，在音频源 22 正俘获音频数据的同时 ) 俘获发言参与者的视频数据。因此，音频帧可在时间上对应于一个或一个以上特定视频帧。因此，对应于视频帧的音频帧通常对应于其中音频数据和视频数据被同时俘获且音频帧和视频帧分别包含同时被俘获的音频数据和视频数据的情境。 0043 在一些实例中，音频

45、编码器 26 可在每一经编码音频帧中编码时间戳，所述时间戳表示记录经编码音频帧的音频数据的时间，且类似地，视频编码器 28 可在每一经编码视频帧中编码时间戳，所述时间戳表示记录经编码视频帧的视频数据的时间。在此类实例中，对应于视频帧的音频帧可包含包括时间戳的音频帧和包含相同时间戳的视频帧。A/V 源装置 20 可包括内部时钟，音频编码器 26 和 / 或视频编码器 28 可从所述内部时钟产生时间戳，或音频源22和视频源24可使用所述内部时钟来分别使音频数据和视频数据与时间戳相关说明书 CN 102804773 A 10 6/26 页 11 联。在一些实例中，音频源

46、 22 可对应于记录音频数据的时间而将数据发送到音频编码器 26，且视频源24可对应于记录视频数据的时间而将数据发送到视频编码器28。在一些实例中，音频编码器 26 可在经编码音频数据中编码序列识别符以指示经编码音频数据的相对时间定序，而无需指示记录音频数据的绝对时间，且类似地，视频编码器 28 也可使用序列识别符来指示经编码视频数据的相对时间定序。类似地，在一些实例中，序列识别符可与时间戳映射或以其它方式与所述时间戳相关。 0044 本发明的技术大体来说针对经编码多媒体(例如，音频和视频)数据的传送，以及所传送多媒体数据的接收和随后解译以及解码。本发明的技术

47、尤其适用于多视角视频译码 (MVC) 数据 ( 即，包含多个视角的视频数据 ) 的传送。如图 1 的实例中所示，视频源 24 可将场景的多个视角提供到视频编码器 28。MVC 对于产生将由三维显示器 ( 例如，立体或自动立体三维显示器 ) 使用的三维视频数据可为有用的。 0045 A/V 源装置 20 可将 “服务” 提供到 A/V 目的地装置 40。服务通常对应于 MVC 数据的可用视角的子集。举例来说， MVC 数据可用于定序为零到七的八个视角。一个服务可对应于具有两个视角的立体视频，而另一服务可对应于四个视角，且又一服务可对应于全部八个视角。大体上，一服务对应于可用

48、视角的任何组合 ( 即，任何子集 )。一服务还可对应于可用视角以及音频数据的组合。 0046 根据本发明的技术， A/V 源装置 20 能够提供对应于包括不连续视角次序索引的视角的子集的服务。通常，视角由视角识别符 ( 也称为 “view_id” ) 表示。视角识别符通常包含可用以识别视角的语法元素。当编码视角时， MVC编码器提供所述视角的view_id。 view_ id 可由 MVC 解码器使用以用于视角间预测或由其它单元使用以用于其它用途 ( 例如，用于呈现 )。 0047 视角间预测是一种用于参考在共同时间位置处的一个或一个以上帧将帧的 MVC 视频数据译码为不同视角

49、的经编码帧的技术。图 6( 下文较详细论述 ) 提供用于视角间预测的实例译码方案。通常，在空间上、在时间上和 / 或参考在共同时间位置处的其它视角的帧来预测性地编码 MVC 视频数据的经编码帧。因此，参考视角 ( 从其预测其它视角 ) 通常在参考视角充当其参考的视角之前被解码，以使得这些经解码的视角可在解码参考视角时用于参考。解码次序无需对应于 view_id 的次序。因此，使用视角次序索引描述视角的解码次序。视角次序索引为指示接入单元中的相应视角分量的解码次序的索引。 0048 每一个别数据流 ( 无论是音频还是视频 ) 被称为基本流。基本流为节目的单一经数字译码 ( 可能经压缩 ) 的分量。举例来说，节目的经译码视频或音频部分可为基本流。基本流可在经多路复用成节目流或传送流之前转换成包化基本流 (PES)。在同一节目内，流 ID 用以区分属于一个基本流的 PES 包与其它包。基本流的数据的基本单位为包化基本流 (PES) 包。因而， MVC 视频数据的每一视角对应于相应基本流。类似地，音频数据对应于相应基本流。在图 1 的实例中，多路复用器

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？