用于3D特技播放的入口点.pdf

上传人:柴****2 文档编号:4319329 上传时间:2018-09-13 格式:PDF 页数:21 大小:631.89KB
返回 下载 相关 举报
摘要
申请专利号:

CN201080021900.4

申请日:

2010.05.12

公开号:

CN102428706A

公开日:

2012.04.25

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):H04N 13/00申请日:20100512|||公开

IPC分类号:

H04N13/00

主分类号:

H04N13/00

申请人:

皇家飞利浦电子股份有限公司

发明人:

P. S. 牛顿; F. 斯卡洛里

地址:

荷兰艾恩德霍芬

优先权:

2009.05.18 EP 09160453.8

专利代理机构:

中国专利代理(香港)有限公司 72001

代理人:

刘红;刘鹏

PDF下载: PDF下载
内容摘要

描述为3D视频数据提供入口点。入口点单元(18)通过在传入3D视频数据流中定义入口点以及存储给出所定义的入口点的位置的入口点地址来生成入口点表格。视频数据流包括众多子流,这些众多子流编码3D视频数据的一个流,并包括独立编码2D版本的3D视频数据的至少一个2D子流以及依赖性编码3D视频数据的部分的至少一个辅助子流。这些入口点包括在2D子流中的主要入口点以及在辅助子流中的辅助入口点,以便通过检索和解码2D子流中的非相邻片段以及检索和依赖性解码辅助子流中的对应片段来启用3D视频数据的3D特技播放。

权利要求书

1: 一种为视频数据流提供入口点的方法, 该方法包括 : 生成入口点表格 ; 在视频数据流中定义入口点, 其中以彼此在时间上相隔一定距离的方式来定义这些入 口点 ; 通过存储给出所定义的入口点的位置的入口点地址, 在入口点表格中存储所定义的入 口点, 其中 视频数据流包括众多子流, 其中众多子流编码 3D 视频数据的一个流, 并包括独立编码 2D 版本的 3D 视频数据的至少一个 2D 子流以及依赖性编码 3D 视频数据的部分的至少一个 辅助子流 ; 定义入口点包括 : 定义在 2D 子流中的主要入口点以及在辅助子流中的辅助入口点, 以 便通过检索和解码 2D 子流中的非相邻片段以及检索和依赖性解码辅助子流中的对应片段 来启用 3D 视频数据的 3D 特技播放。2: 如权利要求 1 所述的方法, 其中视频数据流包括多视图 3D 视频数据, 其中多视图至 少包括一个左视图和一个右视图。3: 如权利要求 1 所述的方法, 其中至少一个辅助子流包括至少以下之一 : 深度信息数据流 ; 透明度信息数据流 ; 阻塞信息数据流。4: 如权利要求 2 或 3 所述的方法, 其中视频数据流包括多个辅助子流, 并且入口点包括 仅用于所述多个辅助子流的选定子集的辅助入口点, 用于在特技播放期间再现精简版本的 3D 视频数据。5: 如权利要求 1 所述的方法, 其中该方法包括以下步骤 : 生成与 2D 子流相关联的第一入口点子表格, 和 生成与辅助子流相关联的第二入口点子表格, 以及 通过包括由第一入口点子表格和第二入口点子表格形成的子表格, 形成与 3D 视频数 据相关联的入口点表格。6: 如权利要求 1 所述的方法, 其中该方法包括以下步骤 : 为每一个入口点定义多个入口点地址的集合, 其包括至主要入口点的至少第一入口点 地址以及至对应的辅助入口点地址的至少第二入口点地址。7: 如权利要求 1 所述的方法, 其中该方法包括提供记录载体, 其中在所述记录载体上 存储数据流和入口点表格。8: 一种用于为视频数据流提供入口点的设备, 该设备包括 : 用于通过以下来生成入口点表格的装置 (18) : 在视频数据流中定义入口点, 其中以彼此在时间上相隔一定距离的方式来定义这些入 口点 ; 和 通过存储给出所定义的入口点的位置的入口点地址, 在入口点表格中存储所定义的入 口点, 其中 2 视频数据流包括众多子流, 其中众多子流编码 3D 视频数据的一个流, 并包括独立编码 2D 版本的 3D 视频数据的至少一个 2D 子流以及依赖性编码 3D 视频数据的部分的至少一个 辅助子流, 以及 用于生成入口点表格的装置 (18) 被安排用于定义在 2D 子流中的主要入口点以及在辅 助子流中的辅助入口点, 以便通过检索和解码 2D 子流中的非相邻片段以及检索和依赖性 解码辅助子流中的对应片段来启用 3D 视频数据的 3D 特技播放。9: 如权利要求 8 所述的设备, 其中该设备包括写入装置, 用于在记录载体上存储视频 数据流和入口点表格。10: 一种用于再生视频数据的设备, 该设备包括 : 用于接收视频数据流以及如在权利要求 1-7 中任一权利要求中定义的入口点表格的 装置 (58, 59) , 其中 视频数据流包括众多子流, 其中众多子流编码 3D 视频数据的一个流, 并包括独立编码 2D 版本的 3D 视频数据的至少一个 2D 子流以及依赖性编码 3D 视频数据的部分的至少一个 辅助子流, 和 入口点包括 2D 子流中的主要入口点以及辅助子流中的辅助入口点 ; 以及 该设备包括用于通过根据入口点表格检索和解码 2D 子流中的非相邻片段以及检索和 依赖性解码辅助子流中的对应片段来再生 3D 视频数据的 3D 视频数据的 3D 特技播放的装 置 (48) 。11: 如权利要求 10 所述的设备, 其中该设备包括用于从记录载体中读取视频数据流和 入口点表格的读取装置 (58) 。12: 一种传递视频数据的信号 (15) , 该信号包括 : 具有以彼此在时间上相隔一定距离的方式定义的入口点的视频数据流 ; 如在权利要求 1-7 中任一权利要求中定义的入口点表格, 其通过存储给出所定义的入 口点的位置的入口点地址来包括所定义的入口点, 其中 视频数据流包括众多子流, 其中众多子流编码 3D 视频数据的一个流, 并包括独立编码 2D 版本的 3D 视频数据的至少一个 2D 子流以及依赖性编码 3D 视频数据的部分的至少一个 辅助子流 ; 以及 该入口点表格包括在 2D 子流中的主要入口点以及在辅助子流中的辅助入口点, 用于 通过检索和解码 2D 子流中的非相邻片段以及检索和依赖性解码辅助子流中的对应片段来 启用 3D 视频数据的 3D 特技播放。13: 一种存储介质 (14, 54) , 其包括根据权利要求 12 的信号。14: 根据权利要求 13 的存储介质, 其中该存储介质是光学可读类型的记录载体 (54) , 其具有包含光学可检测标记的轨道, 这些标记的光学可检测属性代表该信号。15: 一种基于根据权利要求 12 的信号来再现视频数据的方法, 该方法包括 : 接收视频数据流以及如在权利要求 1-7 中任一权利要求中定义的入口点表格, 其中 视频数据流包括众多子流, 其中众多子流编码 3D 视频数据的一个流, 并包括独立编码 2D 版本的 3D 视频数据的至少一个 2D 子流以及依赖性编码 3D 视频数据的部分的至少一个 辅助子流, 3 这些入口点包括在 2D 子流中的主要入口点以及在辅助子流中的辅助入口点 ; 以及 该方法包括 : 通过根据入口点表格检索和解码 2D 子流中的非相邻片段以及检索和依 赖性解码辅助子流中的对应分段来再生 3D 视频数据, 从而再现 3D 视频数据的 3D 特技播 放。16: 一种包括一组指令的计算机程序产品, 其中所述指令当被装入处理器中时导致该 处理器执行如在权利要求 1-7 中任一权利要求或在权利要求 15 中所述的方法。

说明书


用于 3D 特技播放的入口点

    技术领域 本发明涉及为视频数据流提供入口点的方法, 该方法包括 : 生成入口点表格 ; 定义视频数据流中的入口点, 其中以彼此在时间上相隔一定距离的方式来定义这些入 口点 ; 通过存储给出所定义的入口点的位置的入口点地址, 将所定义的入口点存储在入口点 表格中。
     本发明进一步涉及用于提供入口点的设备、 用于再生视频数据的设备、 信号、 再现 的方法以及计算机程序产品。
     本发明涉及在特技播放模式中再现 3D 视频数据的领域, 即在 3D 显示设备上在向 前或向后方向利用增加的速度来再生 3D 视频的领域。
     背景技术 用于再现 2D 视频数据的设备是已知的, 例如视频播放器, 如同 DVD 播放器或机顶 盒, 其提供数字视频信号。源设备将被耦合到如同电视机或监视器之类的显示设备。从源 设备经由适当接口、 优选地如同 HDMI 之类的高速数据接口来传送图像数据。当前正在提议 用于供应三维 (3D) 图像数据的 3D 增强设备。
     对于诸如 3D 电影或 TV(电视) 节目之类的 3D 内容而言, 用于启用特技播放的附 加控制数据可以与图像数据相结合来提供, 例如, 指向能够以增加速度再现的帧的随后位 置的指针列表。 特技播放是以与初始速度不同的速度、 诸如以各种速度快进、 快退或慢动作 来再现 3D 视频内容的任何再现模式。
     文献 US 2006/0117357 描述一种用于在特技播放模式中再现 2D 视频数据的系统。 数字视频信号以各种特技模式回放速度进行再生。 与数字视频流中的视频帧相关联的帧索 引被监视, 并且图片组 (Group-of-Picture) (GOP) 大小从帧索引中进行确定。 一个或多个特 技模式播放速度参数基于所确定的 GOP 大小来计算。视频帧的呈现基于所计算的特技模式 播放速度参数来控制。在一个实施例中, 特技模式播放速度参数包括帧跳跃 (frame-skip) 计数和帧重复计数。
     对于 3D 内容来说, 也必须发展特技播放。 3D 内容的一个示例是二维图像以及相关 联的深度图 (depth map) 。3D 内容的另一个示例是多个二维图像, 例如众所周知的具有右 眼图像和左眼图像的立体内容。 3D 内容的再一个示例是将在多视图显示器上显示的具有多 个左眼图像和多个右眼图像的立体内容。
     发明内容 3D 视频的特技播放的问题是 : 视频解码器上的负担增加, 这是因为该解码器必须 在较短的时间内解码较多的帧 (为了平滑的特技播放) 。由于立体视频, 解码器必须解码两 个或更多的流, 并且这与 2D 相比增加负担。此外, 如果使用依赖的子流多视图编码来对多
     视图视频进行编码, 那么附加流的解码变得依赖于基本视图流。
     为了提供 2D 特技播放, 蓝光光盘标准为每一个基本视频流规定入口点表格 (Entry Point table) (EP-map) (EP 映射) 。该视频被编码在如在众所周知的 MEPG 标准中 定义的各种类型的帧中。该表格列出其中解码可以开始的点在该流中的位置。通常, 这些 入口点位于 MPEG I 帧边界上。该表格仅列出用于一个流的入口点, 而没有考虑可能同时解 码若干个也彼此依赖的视频流的事实。
     本发明的目的是以更便利的方式来提供用于 3D 特技播放的系统。
     为此目的, 根据本发明的第一方面, 在首段中描述的方法中, 视频数据流包括众多 子流, 这些众多子流编码 3D 视频数据的一个流, 并包括独立编码 2D 版本的 3D 视频数据的 至少一个 2D 子流以及依赖性 (dependently) 编码 3D 视频数据的部分的至少一个辅助子 流; 定义入口点包括定义 2D 子流中的主要入口点以及辅助子流中的辅助入口点, 以便通过 检索和解码 2D 子流中的非相邻片段以及检索和依赖性解码辅助子流中的对应片段来启用 3D 视频数据的 3D 特技播放。
     为此目的, 根据本发明的第二方面, 用于为视频数据流提供入口点的设备包括用 于通过在视频数据流中定义入口点以及通过存储给出所定义的入口点的位置的入口点地 址将所定义的入口点存储在入口点表格中来生成入口点表格的装置, 其中以彼此在时间上 相隔一定距离的方式定义这些入口点, 其中视频数据流包括众多子流, 这些众多子流编码 3D 视频数据的一个流, 并包括独立编码 2D 版本的 3D 视频数据的至少一个 2D 子流以及依赖 性编码 3D 视频数据的部分的至少一个辅助子流, 以及用于生成入口点表格的装置被安排 用于定义 2D 子流中的主要入口点以及辅助子流中的辅助入口点, 以便通过检索和解码 2D 子流的非相邻片段以及检索和依赖性解码辅助子流中的对应片段来启用 3D 视频数据的 3D 特技播放。
     为此目的, 根据本发明的进一步方面, 用于再生视频数据的设备包括用于接收视 频数据流以及如上所定义的入口点表格的装置, 其中视频数据流包括众多子流, 这些众多 子流编码 3D 视频数据的一个流, 并包括独立编码 2D 版本的 3D 视频数据的至少一个 2D 子 流以及依赖性编码 3D 视频数据的部分的至少一个辅助子流, 并且这些入口点包括 2D 子流 中的主要入口点以及辅助子流中的辅助入口点 ; 并且该设备包括用于通过根据入口点表格 检索和解码 2D 子流中的非相邻片段以及检索和依赖性解码辅助子流中的对应片段来再生 3D 视频数据而进行 3D 视频数据的 3D 特技播放的装置。
     为此目的, 根据本发明的进一步方面, 传递视频数据的信号包括具有以彼此在时 间上相隔一定距离的方式来定义的入口点的视频数据流以及如上所定义的入口点表格, 其 中该入口点表格通过存储给出所定义的入口点的位置的入口点地址来包括所定义的入口 点, 其中视频数据流包括众多子流, 这些众多子流编码 3D 视频数据的一个流, 并包括独立 编码 2D 版本的 3D 视频数据的至少一个 2D 子流以及依赖性编码 3D 视频数据的部分的至少 一个辅助子流 ; 以及入口点表格包括 2D 子流中的主要入口点以及辅助子流中的辅助入口 点, 以便通过检索和解码 2D 子流中的非相邻片段以及检索和依赖性解码辅助子流中的对 应片段来启用 3D 视频数据的 3D 特技播放。
     为此目的, 根据本发明的进一步方面, 基于如上所定义的信号来再现视频数据的 方法包括 : 接收视频数据流以及如上所定义的入口点表格, 其中视频数据流包括众多子流,这些众多子流对 3D 视频数据的一个流进行编码, 并包括独立编码 2D 版本的 3D 视频数据的 至少一个 2D 子流以及依赖性编码 3D 视频数据的部分的至少一个辅助子流, 这些入口点包 括 2D 子流中的主要入口点以及辅助子流中的辅助入口点 ; 并且该方法包括 : 通过根据入口 点表格、 检索和解码 2D 子流中的非相邻片段以及检索和依赖性解码辅助子流中的对应分 段来再生 3D 视频数据, 从而再现 3D 视频数据的 3D 特技播放。
     这些措施具有的效果在于 : 现在利用扩展的入口点表格来提供例如用于蓝光光盘 的多视图编码视频之类的多子流编码 3D 视频数据的特技播放。传统的入口点表格为视频 流中的特定时刻提供单个入口点。 根据本发明的入口点表格为特定时刻提供至少一个进一 步入口点, 其具有用于也直接访问对应的辅助视频流的主要入口点。 例如, 这通过改变入口 点表格的定义来实现, 以致与基本视图视频流有关的 EP 映射也包含用于相关联的辅助流 的入口点, 而这些相关联的辅助流不能单独被解码。在解码将在特技播放模式中再生的 3D 视频的特定片段时, 主要流和辅助流的必要数据能够被直接访问。 有利地, 当由于缺少参考 而不是所有的子流被正确解码或可用时, 观看者将不会在深度感知方面经历干扰影响。
     本发明也基于以下认识。现有技术 2D 特技播放系统未意识到 3D 特技播放的问 题。特别地, 对于单个视频流来说, 提供单个集合的入口点。但是, 除了独立可解码的主要 子流之外, 一个或多个辅助子流还存在于 3D 视频信号中。发明人已看到 : 这样的处于正常 再生速度上的子流仅依赖于主要流而是可解码的。 因此, 传统上, 这样的辅助流将不具有入 口点, 这是因为在任何不可解码流中的入口点似乎没有任何价值。 然而, 发明人已给不可解 码的辅助流添加了入口点。仅通过提供主要与辅助入口点地址, 就能够为了特技播放而在 不相邻分段中便利地解码这两个流, 这是因为对于这样的分段, 能够根据增强的入口点表 格立即检索辅助流中的对应分段。
     在该系统的实施例中, 视频数据流包括多视图 3D 视频数据, 其中多视图至少包括 一个左视图以及一个右视图。多视图 3D 视频为左眼和右眼提供多个单独的视图。如例如 在参考文献 [1] 或 [2] 中所解释的, 3D 场景的多个视图具有大重叠 (overlap) , 并且通常被 依赖性编码。增强的入口点表格便利地为这样的多视图 3D 视频流提供特技播放。
     在该系统的实施例中, 视频数据流包括多个辅助子流, 并且入口点包括仅用于所 述多个辅助子流的选定子集的辅助入口点, 以便在特技播放期间再现精简版本的 3D 视频 数据。有利地, 入口点表格的大小保持有限。该实施例也基于以下认识 : 在特技播放期间, 所再现的 3D 视频的一些退化是可接受的。 例如, 通过不解码每一个子流可以减少多视图 3D 视频的视图的数量, 或者在结构化的 3D 视频格式中可以忽略透明度数据。
     在所附的权利要求书中给出根据本发明的方法、 3D 设备和信号的进一步优选的实 施例, 其公开内容在这里被并入作为参考。 附图说明 本发明的这些和其他方面从以下的描述中利用示例并参考附图描述的实施例中 将是显而易见的, 并将参考这些实施例来进一步阐述, 其中 : 图 1 显示 3D 视频生成系统, 图 2 显示多视图显示器, 图 3 显示经由双凸透镜的左与右眼视图,
     图 4 显示播放列表的基本结构, 图 5 显示用于显示三维 (3D) 视频数据的系统, 图 6 显示入口点表格指示符表格, 图 7 显示增强的入口点表格指示符表格, 图 8 显示增强的流类型表格, 图 9 显示具有两个子流的 3D 视频流, 图 10 显示入口点图的定义, 和 图 11 显示用于组合的主要流和子流的入口点表格。
     在附图中, 与已经描述的元素相对应的元素具有相同的参考数字。 具体实施方式
     图 1 显示 3D 视频生成系统。该 3D 视频生成系统包括一对相机即右侧相机 11 和 左侧相机 12、 生成将存储在存储介质 14 上的视频信号 15 的 3D 视频处理器 13。右侧相机 和左侧相机均可以是传统相机。深度扫描器可以与左侧相机相关联, 其包括例如能够在不 同方向进行操纵的激光束以及检测激光束的反射的传感器。 也可以从相机信息中通过计算 来生成深度信息。该对相机被指向场景 10, 以捕获该场景的 3D 视频。场景 10 包括各种对 象, 例如, 诸如人、 树、 房屋以及天空中的太阳。每一个对象相对于该对相机具有给定距离, 其中这些相机可以被认为是观看该场景的虚拟观察者。
     3D 视频处理器可以包括例如指令执行设备以及其中已装载一组定义 3D 视频处理 器的操作的指令的程序存储器, 这将在下文进行描述。例如, 存储介质 14 可以采用硬盘、 可 写光盘、 用于制造只读类型光盘的母盘刻录 (mastering) 系统或固态存储器的形式。
     3D 视频生成系统基本上如下操作。 该对相机提供该场景的基本 3D 视频, 其利用一 系列图片对来形成。图片对包括右侧图片和左侧图片。利用右侧相机捕获的右侧图片用于 人类观察者的右眼。利用左侧相机捕获的左侧图片用于人类观察者的左眼。
     右侧相机和左侧相机具有相对于彼此的特定位置关系。 这种位置关系可以利用典 型的再现上下文依照例如场景大小和观看距离来定义。例如, 包括相互关联的一系列右侧 图片和一系列左侧图片的基本 3D 视频可以预定用于在具有典型的 12 米屏幕大小以及典型 的 18 米观看距离的影院中显示。 多视图 3D 视频数据流可以从相机和 / 或深度信息中生成。 多视图 3D 视频为左眼和右眼提供多个单独的视图。 3D 场景的多个视图具有大重叠, 并且通 常被依赖性编码, 如例如在参考文献 [1] 或 [2] 中所解释的。
     不同的 3D 格式基于使用 2D 图像以及附加深度图像的两个视图, 其中附加深度图 像即为所谓的深度图, 其传递有关对象在 2D 图像中的深度的信息。称为图像 + 深度的格式 的不同之处在于 : 它是 2D 图像与所谓的 “深度” 或差距图 (disparity map) 的组合。这是 灰度图像, 由此像素的灰度值指示对于相关联的 2D 图像中对应像素的差距 (或在深度图的 情况中的深度) 量。显示设备将差距、 深度或视差图用于通过将 2D 图像作为输入来计算附 加视图。 这可以采用各种方式来完成, 在最简单的形式中, 这是依赖于与像素相关联的差距 值而将那些像素移到左或右的事情。参考文献 [3] 给出该技术的极好概述。
     在图 1 所示的系统中, 3D 视频处理器 13 具有入口点单元 18, 用于处理传入 3D 视 频数据和生成用于 3D 特技播放模式的入口点表格。入口点单元被安排用于定义视频数据流中的入口点。这些入口点被存储在入口点表格中。以彼此在时间上相隔一定距离的方式 在视频数据流中定义这些入口点。随后, 所定义的入口点例如通过存储给出所定义的入口 点的位置的入口点地址而被存储在入口点表格中。在 3D 视频数据流格式中, 视频数据流通 常包括众多子流, 这些众多子流编码 3D 视频数据的一个流, 并包括独立编码 2D 版本的 3D 视频数据的至少一个 2D 子流以及依赖性编码 3D 视频数据的部分的至少一个辅助子流。例 如, 该部分可以是右视图 (取决于独立编码的左视图流) 或深度图。对于这样的 3D 视频流, 这些入口点被生成为包括 2D 子流中的主要入口点以及辅助子流中的辅助入口点, 以启用 3D 视频数据的 3D 特技播放。
     在再现期间, 主要 (2D) 子流的选定分段基于主要入口点进行检索, 并被解码为 2D 子流中的非相邻分段。随后, 与 2D 子流的选定部分相对应的辅助从属子流的部分基于辅助 入口点进行检索, 并被依赖性解码为辅助子流的分段。
     图 2 显示多视图显示器 21, 其在 LCD 屏幕前方使用双凸透镜 22 来为左与右眼生成 不同的视图。交错从两个略微不同的角度拍摄的两个图像创建 3D 感知。这种效果基于双 眼视差, 即左眼和右眼通常从略微不同的角度来观看对象。这些通过调视和会聚而被融合 在一起, 并且这对于大脑充当强有力的深度提示。
     图 3 显示经由双凸透镜 30 的左与右眼视图。右眼 32 仅看到像素 33 的左部分, 而 左眼 31 看到右部分。这些像素部分被称为子像素 34。通过调视和会聚在人类观察者中融 合图像的右部分和左部分通过呈现单个立体图像来创建深度提示。 通过细分多个子像素中 的每一个像素能够创建多个左和右视图。
     例如, 与其中仅显示两个交错图像的图 3 形成对照, 实际的显示器可以使用例如 9 个交错图像, 这对于该图像给出更广泛的视野和轮廓, 如图 2 中示意性所示的。驱动这种类 型的显示器需要被处理以生成多个视图的基于图像加深度的视频或多视图编码的视频。 为 此目的, 蓝光光盘标准可以被扩展以包括对于这样的 3D 视频流的支持。播放器随后可以不 仅驱动自动立体显示器, 而且也可以驱动其他类型的立体 3D 显示器, 诸如交替视图并使用 快门眼镜来为双眼单独分隔开视图的显示器, 或者在未来甚至可以包括全息显示器。
     对于透镜屏幕的替换方案是屏障 (Barrier) 显示器, 其使用位于 LCD 之后和背光 之前的视差屏障来分隔开 LCD 中来自像素的光。 该屏障使得 : 从屏幕前方的设置位置中, 左 眼看到与右眼不同的像素。屏障也可以位于 LCD 与人类观看者之间, 以致在显示器的行中 的像素交替地由左眼和右眼可看到。
     从利用 3D 视频的特技播放进行的实验中, 已发现 : “3D 深度” 印象的质量在特技播 放期间恶化。一种可能的解释是 : 立体视频对于人类光学系统 (调视和会聚) 而言需要比正 常 2D 视频更大和更长的努力, 以便大脑将利用眼睛接收到的两个图像融合为 “3D” 心智图 像 (mental image) 。当每秒显示的帧的数量在特技播放期间显著增加时, 人类光学系统似 乎不能完全跟上更高的帧速率。
     利用立体 3D 视频的特技播放的另一个问题在于 : 由于解码器必须在更短时间内 解码更多的帧 (为了平滑的特技播放) , 所以视频解码器上的负担增加。由于立体视频, 解码 器必须解码两个或更多的流, 并且这与 2D 相比增加了问题。此外, 如果使用如利用 MPEG 中 定义的可扩缩多视图编码来编码多视图视频, 那么附加流的解码变得依赖于基本视图流, 因此在播放器中能够完成特技播放的方式必须改变。 这样的不能独立被解码的流在这个文献中被称为辅助子流。这样的流将基于相应的主要流而被依赖性解码。
     在以下的解释中, 入口点表格的示例参考蓝光光盘系统来讨论。 注意 : 入口点表格 能够应用于任何的以主要和辅助视频流为基础的 3D 视频系统, 并且对于实现本发明而言 并不需要蓝光光盘系统的细节。蓝光光盘标准为每一个基本视频流规定入口点表格 (包括 入口点图 : EP 映射 (EP-map) ) 。该入口点表格定义列出解码可以开始的点在流中的位置的 表格。通常, 这些位于 MPEG I 帧边界上。这个表格仅列出用于一个流的入口点, 而没有考 虑可能同时解码也彼此依赖的若干视频流的事实。
     已发现 : 当跳帧以创建某种类型的幻灯片效果时, 特技播放期间的深度感知得到 改善。因此, 原始 3D 视频中的单独的不相邻分段被显示在一个序列中。令人惊奇地, 跳过 的帧越多, 则感知的深度变得越好。这在某种程度上与正常 2D 视频形成对比, 其中在 2D 视 频中解码器籍此更快地解码所有的帧的平滑特技播放被感知为更佳。 这能够通过考虑以下 事实来加以解释 : 光学系统耗费时间来将来自眼睛的两个图像融合成一个立体图像 (通过 调视和会聚) , 并生成 “3D” 心智图像。在正常生活中, 这不是问题, 因为深度感知取决于许 多因素, 并且双眼视差 (实体视觉) 仅对于靠近观看者的对象是有效的。对于快速移动对象 来说, 运动视差发挥比闭塞更大的作用。在 3D 显示器中, 这却是一个问题, 因为 3D 效果主 要取决于双眼视差, 因此对于快速移动对象而言, 深度感知被减弱。 为了解决对于特技播放的上述问题, 必须为将在相应的特技播放模式中再生的选 定分段的序列定义入口点, 如上所述。
     在一个实施例中, 蓝光光盘的入口点表格被扩展为容纳附加定义的入口点。这个 表格现在列出用于视频的入口点, 并在视频中的时间位置与盘上的文件中的位置之间提供 链接。该扩展使得 : 除了用于 2D 视频流的入口点之外, 该表格现在也列出用于第二辅助视 频流的入口点, 其中第二辅助视频流使用可扩缩视频编码来编码, 并依赖于基本视频流来 解码。这个第二入口建立从第一流中的每一个入口到第二流中的对应入口点的关联性。这 个后者可以包含 I 或 P 帧, 其中 P 帧可以转而参考来自基本流的 I 帧。在使用直接的显示 时间标记 (Presentation Time Stamp) (PTS) 值时采用这种方案。注意 : 由于辅助流仅可 依赖性解码, 例如可能在相同的 PTS 时间仅包含 P 或 B 帧, 所以用于第二流的单独 EP 映射 可能无法靠自己工作。因此, 辅助流在靠自己进行解码时不是有效的流。例如, 对于蓝光光 盘中的多视图编码的视频, 入口点表格可以被扩展, 并且蓝光播放器使用 EP 映射的方式被 适配以检索主要入口点和辅助入口点二者。该规范被增强, 以致与基本视图视频流相关联 的 EP 映射也包含用于其自己无法解码的相关联的辅助流的入口点。
     参考文献 [1] 和 [2] 描述在联合编码的视频流以及相关联的传输格式背后的原 理。例如, 在编码之前, 3D 视图被交错, 并随后使用分层 B 帧进行编码。在传送之前, 比特流 被分成基本流和辅助流。这为了向后兼容性而完成, 以致 2D 解码器能够解码和使用基本流 并忽略辅助流。在修改的解码器中, 基本流和辅助流被再次交错和解码。这对于蓝光光盘 上的特技播放产生问题, 籍此基本流和辅助流在光盘上分开进行存储。 为了解决此, 需要对 EP 映射表格进行扩展, 以致播放器知道必须交错和解码基本流和辅助流中的哪些剪辑, 即, 流的部分, 以便显示播放器已跳至的视频的区段。 利用所提议的增强的入口点表格, 解决这 个问题。
     图 4 显示播放列表的基本结构。该示例以 BD 以及 EP 映射 41 (控制信息 CPI 中的
     入口点表格) 在这个结构中所起的作用为基础。对于某个 PTS 值, EP 映射提供逻辑地址, 例 如, 为 MPEG 编码基本流的剪辑 AV 流文件中的对应源分组编号。参考图 6-11 进一步描述该 结构。
     图 5 显示用于显示三维 (3D) 视频数据的系统。例如光盘播放器之类的 3D 源设备 50 耦合到 3D 显示设备 53, 以便传送 3D 显示信号 56。 3D 源设备具有用于接收图像信息的输 入单元 51。例如, 输入单元设备可以包括光盘单元 58, 用于从如同 DVD 或蓝光光盘之类的 光学记录载体 54 中检索各种类型的图像信息。替代地, 输入单元可以包括用于耦合到例如 因特网或广播网之类的网络 55 的网络接口单元 59, 其中这样的设备通常被称为机顶盒。 图 像数据可以从远程媒体服务器 57 进行检索。源设备也可以是卫星接收机或直接提供显示 信号的媒体服务器, 即, 输出 3D 显示信号以便直接地被耦合到显示单元的任何适当设备。
     3D 显示设备 53 用于显示 3D 图像数据。该设备具有用于接收包括从源设备 10 传 送的 3D 图像数据的 3D 显示信号 56 的输入接口单元。该设备具有用于显示处理的图像数 据的 3D 显示器, 例如, 双或透镜 LCD。显示设备 53 可以是任何类型的也被称为 3D 显示器的 立体显示器, 并且具有利用箭头 44 指示的显示深度范围。
     3D 源设备 50 具有与输入单元 51 相耦合的图像处理单元 52, 用于处理图像信息, 以生成将经由输出接口单元 12 被传送至显示设备的 3D 显示信号 56。处理单元 52 被安排 用于生成包括在 3D 显示信号 56 中的图像数据, 以便显示在显示设备 13 上。源设备配备有 用户控制元件, 用于控制诸如对比度或颜色参数之类的图像数据的显示参数。这样的用户 控制元件是众所周知的, 并且可以包括具有各种按钮和 / 或光标控制功能的遥控单元, 以 控制 3D 源设备的各种功能, 诸如正常回放和记录功能, 以及用于例如借助于直接按钮或借 助于图形用户界面和 / 或菜单来选择特技播放模式。 源设备 50 具有用于在特技播放模式中处理 3D 视频数据的特技播放处理单元 48。 3D 视频数据在特技播放期间通过根据入口点表格检索和解码 2D 子流中的非相邻分段以及 检索和依赖性解码辅助子流中的对应分段而被再生。对于相应的分段, 独立解码 2D 子流, 并且 3D 信息以基于辅助入口点从视频数据流中检索的辅助流的对应分段为基础来添加。
     图 5 进一步显示记录载体 54 作为 3D 图像数据的载体。该记录载体是盘状的, 并 具有轨道和中心孔。 利用一系列物理可检测的标记构成的轨道根据在信息层上构成大致平 行轨道的螺旋或同心图案的圈来排列。 该记录载体可以是光学可读的, 其被称为光盘, 例如 CD、 DVD 或 BD(蓝光光盘) 。在信息层上利用沿着轨道的例如坑和脊的光学可检测标记来表 示信息。该轨道结构也包括用于指示通常被称为信息块的信息单元的位置的位置信息, 例 如标题和地址。记录载体 54 在如同 DVD 或 BD 格式之类的预定义记录格式中运送代表数字 编码的 3D 视频数据的信息, 其中 3D 视频数据例如根据 MPEG2 或 MPEG4 编码系统来编码。
     下文描述的是基于蓝光光盘规范的 EP 映射表格的语法的相关部分。我们提议对 这个表格进行扩展, 以致它可能也包含对于在 EP 映射表的顶部列出的主要流上的解码而 言是依赖性的相关联流的入口。
     在实践中, 这将意味着 : 对于与另一个流联合编码的每一个辅助流, 在与其依赖来 解码的流相同的表格中具有 EP 映射 (EP_map) 。相反的即用于辅助流的附加表格也是有可 能的, 并且在与 2D 解码向后兼容性的情况中是更有效的。在这种情况中, 对于包含辅助流 的剪辑, 具有 EP 映射。在这个 EP 映射中也具有用于辅助流中的入口点所依赖来解码的基
     本视图流的部分的入口点位置。在多视图编码视频的回放情况中, 播放器则仅需要加载辅 助流的 EP 映射, 并且随后具有用于基本视图流的接入点, 其中基本视图流必须被解码, 以 便能在辅助流的接入点上解码该帧。
     详细地, 提议新的 EP 映射, 其包含入口点至用于多流编码 3D 视频流的文件地址的 映射。蓝光光盘规范当前定义唯一一种类型的 EP 映射, 这指示在如下所示的规范的表格 示。
     图 6 显示输入点表格指示符表格。该表格显示现有的 EP 映射类型。用于指示 EP 映射类型的指示符值可以在描述例如蓝光光盘之类的记录格式的标准中进行定义。 提议在 称为 “EP_map_MVC” 或如同用于立体 3D 视频的 EP_map_ST 之类的某种类似命名的这个表格 中添加用于多视图编码 (MVC) 3D 视频的新类型。这个 EP_MVC_map_type 可以利用值 2 来指 示。
     图 7 显示增强的入口点表格指示符表格。 该表格显示现有 EP 映射类型以及为 MVC 3D 视频提议的在这个表格中称为 EP_map_MVC 的新类型。在一个实施例中, 相应的 EP 映射 类型在生成 3D 视频数据流时被包括在 EP 映射数据结构中, 并被传送到回放设备。该回放 设备现在能够容易检测新的 EP 映射表格类型, 并使得特技播放操作适应于相应的 EP 映射。 图 8 显示增强的流类型表格。作为图 6、 7 的替代, 新的 EP 映射现在使用该表格中 显示的 EP_stream_type 值来指示, 其中该表格对于 EP_map(EP 映射) 中引用的流的类型具 有新的值 (该表格中的 8) 。 在一个实施例中, 相应的 EP 流类型在生成 3D 视频数据流时被包 括在 3D 视频流数据结构中, 并被传送到回放设备。回放设备现在能够容易检测新的 EP 流 类型, 并从该流中检索增强的入口点表格, 且使得特技播放操作适合于增强的入口点表格。
     图 9 显示具有两个子流的 3D 视频流。该图显示使用分层 B 图片来 MVC 编码两个 流的区段的示例。标记为 L 的上序列是独立可解码的 2D 子流, 而标记为 R 的较低序列是依 赖性可解码的, 这是因为它需要来自第一流的数据。 箭头指示 : 来自第一 I 帧的数据用于编 码较低子流中的第一 P 图片。
     在图 9 所示的示例中, 在 L 和 R 流二者中具有三个入口点。 在 L 流中, 具有 I、 B(T2) 和 B(T4) 图片, 而在 R 流中具有 P、 B(T2) 和 B(T4) 图片。在中间的 B 图片是非参考帧, 并且 不能用作入口点。注意 : 在实践中, 入口点之间的距离将是相当大的。
     我们现在将通过调查在用户想跳到位置 T2 时发生什么来继续。如果解码开始于 T2, 那么解码器也必须为 L 流在 T0 访问 I 图片, 而对于 R 流, 它必须访问来自 L 流的 I 图片 和来自 R 流的 P 图片。因此, 它需要 I 图片在 L 流中的位置以及 P 图片在 R 流中的位置。于 是, 它需要针对 P 图片的位置的时间矢量以及针对 L 帧中的 I 图片的空间矢量。
     在盘上, L 和 R 流均可以在盘上的不同区段中进行交错, 或者可以被包含在一个流 中。因此, 对于一个入口点, 可能需要文件中的位置和盘上的位置二者, 这是因为对于一个 入口点来说, 需要来自 L 和 R 流二者的信息, 如上所述。因此, 在子流 L 中的主要入口点以 及依赖性可解码的子流 R 中的辅助入口点将被提供。
     因此, 详细地, 我们提议对于 MVC 编码的视频扩展 EP 映射, 以致每一个入口点包含 两个地址, 其也被称为矢量。一个时间矢量指向 PTS, 而一个空间矢量指向对于入口点而言 充当参考帧的帧的分组编号。
     图 10 显示也被称为 EP_map_syntax 的入口点图的定义。该表格显示被扩展用于
     与 MVC 编码视频一起使用的当前 EP 映射的一个示例。该映射包括用于相应子流的子表格。 注意 : 该表格定义例如在诸如蓝光光盘格式中的控制信息 CPI 41 之类的记录载体上的控 制信息中利用 3D 视频数据流而包括的入口点表格的数据结构。
     图 11 显示用于组合的主要流和子流的入口点表格, 其也被称为用于一个流 PID 的 EP_map。在这个实施例中, 没有特定的 MVC 区段如图 10 所示被添加, 而利用附加条目来扩 展该表格, 以致每一个入口点也指示从属数据流中的分组编号和 PTS 值的列表。
     在用于多视图编码 3D 视频的回放系统的一个实施例中, 特技播放如下进行安排。 3D 视频流具有多个辅助子流, 并且入口点包括仅用于所述多个辅助子流的选定子集的辅助 入口点。 在特技播放期间, 通过只解码具有入口点的子流, 再现精简版本的 3D 视频数据。 有 利地, 入口点表格的大小保持有限。
     替代地, 解码器在执行特技播放时自动地减少视图的数量, 以减轻播放器上的负 担。在用于增加速度的步骤例如 9-7-5-3-2 中, 能够动态地减少视图的数量。可以从入口 点表格中检索用于减少数量的视图的相应入口点。替代地, 减少数量的视图可以在特技播 放期间在处理单元中生成, 其中处理单元在标准速度回放期间产生所述全部众多的视图。
     将注意 : 本发明可以使用可编程组件在硬件和 / 或软件中进行实现。用于实现本 发明的方法具有与参考图 1 所阐述的 3D 视频数据的处理相对应的处理步骤。虽然本发明 主要利用使用光学记录载体或因特网的实施例进行解释了, 但是本发明也适于任何的图像 接口环境, 如同 3D 个人计算机 (PC) 显示接口或耦合到无线 3D 显示设备的 3D 媒体中心 PC。
     注意 : 在这个文献中, 词 “包括” 并不排除除了所列出之外的其他元素或步骤的存 在, 并且在元素之前的词 “一” 或 “一个” 并不排除多个这样的元素的存在, 任何参考符号并 不限制权利要求书的范畴, 本发明可以利用硬件和软件二者来实现, 并且若干个 “装置” 或 “单元” 可以利用同一项硬件或软件来表示, 而且处理器可以有可能与硬件元素协作来实现 一个或更多单元的功能。 进一步, 本发明并不限于这些实施例, 并在于如上所述的每一个新 颖特征或特征的组合之中。
     参考文献 [1] : “A novel Milti-View Video Coding Scheme Based on H.264; by GuopingLi, Yun He; ICICS-PCM 2003, 15-18 december 2003, Singapore, IEEE 0-7893-8185-8/03/$17.00” 参考文献 [2] “ :Efficient Prediction Structures for Multi-View Video Coding; by Philipp Merkle et al; IEEE 2007” 参考文献 [3] : “Depth image based rendering, compression and transmission for a new approach on 3D TV”by Christoph Fehn (see http://iphome.hhi.de/fehn/ Publications/fehn_EI2004.pdf) .

用于3D特技播放的入口点.pdf_第1页
第1页 / 共21页
用于3D特技播放的入口点.pdf_第2页
第2页 / 共21页
用于3D特技播放的入口点.pdf_第3页
第3页 / 共21页
点击查看更多>>
资源描述

《用于3D特技播放的入口点.pdf》由会员分享,可在线阅读,更多相关《用于3D特技播放的入口点.pdf(21页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102428706 A (43)申请公布日 2012.04.25 C N 1 0 2 4 2 8 7 0 6 A *CN102428706A* (21)申请号 201080021900.4 (22)申请日 2010.05.12 09160453.8 2009.05.18 EP H04N 13/00(2006.01) (71)申请人皇家飞利浦电子股份有限公司 地址荷兰艾恩德霍芬 (72)发明人 P. S. 牛顿 F. 斯卡洛里 (74)专利代理机构中国专利代理(香港)有限公 司 72001 代理人刘红 刘鹏 (54) 发明名称 用于3D特技播放的入口点 (57) 摘要 。

2、描述为3D视频数据提供入口点。入口点单元 (18)通过在传入3D视频数据流中定义入口点以 及存储给出所定义的入口点的位置的入口点地址 来生成入口点表格。视频数据流包括众多子流,这 些众多子流编码3D视频数据的一个流,并包括独 立编码2D版本的3D视频数据的至少一个2D子流 以及依赖性编码3D视频数据的部分的至少一个 辅助子流。这些入口点包括在2D子流中的主要入 口点以及在辅助子流中的辅助入口点,以便通过 检索和解码2D子流中的非相邻片段以及检索和 依赖性解码辅助子流中的对应片段来启用3D视 频数据的3D特技播放。 (30)优先权数据 (85)PCT申请进入国家阶段日 2011.11.18 (8。

3、6)PCT申请的申请数据 PCT/IB2010/052101 2010.05.12 (87)PCT申请的公布数据 WO2010/134003 EN 2010.11.25 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 3 页 说明书 9 页 附图 8 页 CN 102428713 A 1/3页 2 1.一种为视频数据流提供入口点的方法,该方法包括: 生成入口点表格; 在视频数据流中定义入口点,其中以彼此在时间上相隔一定距离的方式来定义这些入 口点; 通过存储给出所定义的入口点的位置的入口点地址,在入口点表格中存储所定义的入 口点, 其中 视频数据。

4、流包括众多子流,其中众多子流编码3D视频数据的一个流,并包括独立编码 2D版本的3D视频数据的至少一个2D子流以及依赖性编码3D视频数据的部分的至少一个 辅助子流; 定义入口点包括:定义在2D子流中的主要入口点以及在辅助子流中的辅助入口点,以 便通过检索和解码2D子流中的非相邻片段以及检索和依赖性解码辅助子流中的对应片段 来启用3D视频数据的3D特技播放。 2.如权利要求1所述的方法,其中视频数据流包括多视图3D视频数据,其中多视图至 少包括一个左视图和一个右视图。 3.如权利要求1所述的方法,其中至少一个辅助子流包括至少以下之一: 深度信息数据流; 透明度信息数据流; 阻塞信息数据流。 4.。

5、如权利要求2或3所述的方法,其中视频数据流包括多个辅助子流,并且入口点包括 仅用于所述多个辅助子流的选定子集的辅助入口点,用于在特技播放期间再现精简版本的 3D视频数据。 5.如权利要求1所述的方法,其中该方法包括以下步骤: 生成与2D子流相关联的第一入口点子表格,和 生成与辅助子流相关联的第二入口点子表格,以及 通过包括由第一入口点子表格和第二入口点子表格形成的子表格,形成与3D视频数 据相关联的入口点表格。 6.如权利要求1所述的方法,其中该方法包括以下步骤: 为每一个入口点定义多个入口点地址的集合,其包括至主要入口点的至少第一入口点 地址以及至对应的辅助入口点地址的至少第二入口点地址。 。

6、7.如权利要求1所述的方法,其中该方法包括提供记录载体,其中在所述记录载体上 存储数据流和入口点表格。 8.一种用于为视频数据流提供入口点的设备,该设备包括: 用于通过以下来生成入口点表格的装置(18): 在视频数据流中定义入口点,其中以彼此在时间上相隔一定距离的方式来定义这些入 口点;和 通过存储给出所定义的入口点的位置的入口点地址,在入口点表格中存储所定义的入 口点, 其中 权 利 要 求 书CN 102428706 A CN 102428713 A 2/3页 3 视频数据流包括众多子流,其中众多子流编码3D视频数据的一个流,并包括独立编码 2D版本的3D视频数据的至少一个2D子流以及依赖。

7、性编码3D视频数据的部分的至少一个 辅助子流,以及 用于生成入口点表格的装置(18)被安排用于定义在2D子流中的主要入口点以及在辅 助子流中的辅助入口点,以便通过检索和解码2D子流中的非相邻片段以及检索和依赖性 解码辅助子流中的对应片段来启用3D视频数据的3D特技播放。 9.如权利要求8所述的设备,其中该设备包括写入装置,用于在记录载体上存储视频 数据流和入口点表格。 10.一种用于再生视频数据的设备,该设备包括: 用于接收视频数据流以及如在权利要求1-7中任一权利要求中定义的入口点表格的 装置(58,59),其中 视频数据流包括众多子流,其中众多子流编码3D视频数据的一个流,并包括独立编码 。

8、2D版本的3D视频数据的至少一个2D子流以及依赖性编码3D视频数据的部分的至少一个 辅助子流,和 入口点包括2D子流中的主要入口点以及辅助子流中的辅助入口点;以及 该设备包括用于通过根据入口点表格检索和解码2D子流中的非相邻片段以及检索和 依赖性解码辅助子流中的对应片段来再生3D视频数据的3D视频数据的3D特技播放的装 置(48)。 11.如权利要求10所述的设备,其中该设备包括用于从记录载体中读取视频数据流和 入口点表格的读取装置(58)。 12.一种传递视频数据的信号(15),该信号包括: 具有以彼此在时间上相隔一定距离的方式定义的入口点的视频数据流; 如在权利要求1-7中任一权利要求中定。

9、义的入口点表格,其通过存储给出所定义的入 口点的位置的入口点地址来包括所定义的入口点, 其中 视频数据流包括众多子流,其中众多子流编码3D视频数据的一个流,并包括独立编码 2D版本的3D视频数据的至少一个2D子流以及依赖性编码3D视频数据的部分的至少一个 辅助子流;以及 该入口点表格包括在2D子流中的主要入口点以及在辅助子流中的辅助入口点,用于 通过检索和解码2D子流中的非相邻片段以及检索和依赖性解码辅助子流中的对应片段来 启用3D视频数据的3D特技播放。 13.一种存储介质(14,54),其包括根据权利要求12的信号。 14.根据权利要求13的存储介质,其中该存储介质是光学可读类型的记录载体。

10、(54), 其具有包含光学可检测标记的轨道,这些标记的光学可检测属性代表该信号。 15.一种基于根据权利要求12的信号来再现视频数据的方法,该方法包括: 接收视频数据流以及如在权利要求1-7中任一权利要求中定义的入口点表格,其中 视频数据流包括众多子流,其中众多子流编码3D视频数据的一个流,并包括独立编码 2D版本的3D视频数据的至少一个2D子流以及依赖性编码3D视频数据的部分的至少一个 辅助子流, 权 利 要 求 书CN 102428706 A CN 102428713 A 3/3页 4 这些入口点包括在2D子流中的主要入口点以及在辅助子流中的辅助入口点;以及 该方法包括:通过根据入口点表格。

11、检索和解码2D子流中的非相邻片段以及检索和依 赖性解码辅助子流中的对应分段来再生3D视频数据,从而再现3D视频数据的3D特技播 放。 16.一种包括一组指令的计算机程序产品,其中所述指令当被装入处理器中时导致该 处理器执行如在权利要求1-7中任一权利要求或在权利要求15中所述的方法。 权 利 要 求 书CN 102428706 A CN 102428713 A 1/9页 5 用于 3D 特技播放的入口点 技术领域 0001 本发明涉及为视频数据流提供入口点的方法,该方法包括: 生成入口点表格; 定义视频数据流中的入口点,其中以彼此在时间上相隔一定距离的方式来定义这些入 口点; 通过存储给出所定。

12、义的入口点的位置的入口点地址,将所定义的入口点存储在入口点 表格中。 0002 本发明进一步涉及用于提供入口点的设备、用于再生视频数据的设备、信号、再现 的方法以及计算机程序产品。 0003 本发明涉及在特技播放模式中再现3D视频数据的领域,即在3D显示设备上在向 前或向后方向利用增加的速度来再生3D视频的领域。 背景技术 0004 用于再现2D视频数据的设备是已知的,例如视频播放器,如同DVD播放器或机顶 盒,其提供数字视频信号。源设备将被耦合到如同电视机或监视器之类的显示设备。从源 设备经由适当接口、优选地如同HDMI之类的高速数据接口来传送图像数据。当前正在提议 用于供应三维(3D)图像。

13、数据的3D增强设备。 0005 对于诸如3D电影或TV(电视)节目之类的3D内容而言,用于启用特技播放的附 加控制数据可以与图像数据相结合来提供,例如,指向能够以增加速度再现的帧的随后位 置的指针列表。特技播放是以与初始速度不同的速度、诸如以各种速度快进、快退或慢动作 来再现3D视频内容的任何再现模式。 0006 文献US 2006/0117357描述一种用于在特技播放模式中再现2D视频数据的系统。 数字视频信号以各种特技模式回放速度进行再生。与数字视频流中的视频帧相关联的帧索 引被监视,并且图片组(Group-of-Picture)(GOP)大小从帧索引中进行确定。一个或多个特 技模式播放速。

14、度参数基于所确定的GOP大小来计算。视频帧的呈现基于所计算的特技模式 播放速度参数来控制。在一个实施例中,特技模式播放速度参数包括帧跳跃(frame-skip) 计数和帧重复计数。 0007 对于3D内容来说,也必须发展特技播放。3D内容的一个示例是二维图像以及相关 联的深度图(depth map)。3D内容的另一个示例是多个二维图像,例如众所周知的具有右 眼图像和左眼图像的立体内容。3D内容的再一个示例是将在多视图显示器上显示的具有多 个左眼图像和多个右眼图像的立体内容。 发明内容 0008 3D视频的特技播放的问题是:视频解码器上的负担增加,这是因为该解码器必须 在较短的时间内解码较多的帧。

15、(为了平滑的特技播放)。由于立体视频,解码器必须解码两 个或更多的流,并且这与2D相比增加负担。此外,如果使用依赖的子流多视图编码来对多 说 明 书CN 102428706 A CN 102428713 A 2/9页 6 视图视频进行编码,那么附加流的解码变得依赖于基本视图流。 0009 为了提供2D特技播放,蓝光光盘标准为每一个基本视频流规定入口点表格 (Entry Point table)(EP-map)(EP映射)。该视频被编码在如在众所周知的MEPG标准中 定义的各种类型的帧中。该表格列出其中解码可以开始的点在该流中的位置。通常,这些 入口点位于MPEG I帧边界上。该表格仅列出用于一。

16、个流的入口点,而没有考虑可能同时解 码若干个也彼此依赖的视频流的事实。 0010 本发明的目的是以更便利的方式来提供用于3D特技播放的系统。 0011 为此目的,根据本发明的第一方面,在首段中描述的方法中,视频数据流包括众多 子流,这些众多子流编码3D视频数据的一个流,并包括独立编码2D版本的3D视频数据的 至少一个2D子流以及依赖性(dependently)编码3D视频数据的部分的至少一个辅助子 流;定义入口点包括定义2D子流中的主要入口点以及辅助子流中的辅助入口点,以便通过 检索和解码2D子流中的非相邻片段以及检索和依赖性解码辅助子流中的对应片段来启用 3D视频数据的3D特技播放。 001。

17、2 为此目的,根据本发明的第二方面,用于为视频数据流提供入口点的设备包括用 于通过在视频数据流中定义入口点以及通过存储给出所定义的入口点的位置的入口点地 址将所定义的入口点存储在入口点表格中来生成入口点表格的装置,其中以彼此在时间上 相隔一定距离的方式定义这些入口点,其中视频数据流包括众多子流,这些众多子流编码 3D视频数据的一个流,并包括独立编码2D版本的3D视频数据的至少一个2D子流以及依赖 性编码3D视频数据的部分的至少一个辅助子流,以及用于生成入口点表格的装置被安排 用于定义2D子流中的主要入口点以及辅助子流中的辅助入口点,以便通过检索和解码2D 子流的非相邻片段以及检索和依赖性解码辅。

18、助子流中的对应片段来启用3D视频数据的3D 特技播放。 0013 为此目的,根据本发明的进一步方面,用于再生视频数据的设备包括用于接收视 频数据流以及如上所定义的入口点表格的装置,其中视频数据流包括众多子流,这些众多 子流编码3D视频数据的一个流,并包括独立编码2D版本的3D视频数据的至少一个2D子 流以及依赖性编码3D视频数据的部分的至少一个辅助子流,并且这些入口点包括2D子流 中的主要入口点以及辅助子流中的辅助入口点;并且该设备包括用于通过根据入口点表格 检索和解码2D子流中的非相邻片段以及检索和依赖性解码辅助子流中的对应片段来再生 3D视频数据而进行3D视频数据的3D特技播放的装置。 0。

19、014 为此目的,根据本发明的进一步方面,传递视频数据的信号包括具有以彼此在时 间上相隔一定距离的方式来定义的入口点的视频数据流以及如上所定义的入口点表格,其 中该入口点表格通过存储给出所定义的入口点的位置的入口点地址来包括所定义的入口 点,其中视频数据流包括众多子流,这些众多子流编码3D视频数据的一个流,并包括独立 编码2D版本的3D视频数据的至少一个2D子流以及依赖性编码3D视频数据的部分的至少 一个辅助子流;以及入口点表格包括2D子流中的主要入口点以及辅助子流中的辅助入口 点,以便通过检索和解码2D子流中的非相邻片段以及检索和依赖性解码辅助子流中的对 应片段来启用3D视频数据的3D特技播。

20、放。 0015 为此目的,根据本发明的进一步方面,基于如上所定义的信号来再现视频数据的 方法包括:接收视频数据流以及如上所定义的入口点表格,其中视频数据流包括众多子流, 说 明 书CN 102428706 A CN 102428713 A 3/9页 7 这些众多子流对3D视频数据的一个流进行编码,并包括独立编码2D版本的3D视频数据的 至少一个2D子流以及依赖性编码3D视频数据的部分的至少一个辅助子流,这些入口点包 括2D子流中的主要入口点以及辅助子流中的辅助入口点;并且该方法包括:通过根据入口 点表格、检索和解码2D子流中的非相邻片段以及检索和依赖性解码辅助子流中的对应分 段来再生3D视频数。

21、据,从而再现3D视频数据的3D特技播放。 0016 这些措施具有的效果在于:现在利用扩展的入口点表格来提供例如用于蓝光光盘 的多视图编码视频之类的多子流编码3D视频数据的特技播放。传统的入口点表格为视频 流中的特定时刻提供单个入口点。根据本发明的入口点表格为特定时刻提供至少一个进一 步入口点,其具有用于也直接访问对应的辅助视频流的主要入口点。例如,这通过改变入口 点表格的定义来实现,以致与基本视图视频流有关的EP映射也包含用于相关联的辅助流 的入口点,而这些相关联的辅助流不能单独被解码。在解码将在特技播放模式中再生的3D 视频的特定片段时,主要流和辅助流的必要数据能够被直接访问。有利地,当由于。

22、缺少参考 而不是所有的子流被正确解码或可用时,观看者将不会在深度感知方面经历干扰影响。 0017 本发明也基于以下认识。现有技术2D特技播放系统未意识到3D特技播放的问 题。特别地,对于单个视频流来说,提供单个集合的入口点。但是,除了独立可解码的主要 子流之外,一个或多个辅助子流还存在于3D视频信号中。发明人已看到:这样的处于正常 再生速度上的子流仅依赖于主要流而是可解码的。因此,传统上,这样的辅助流将不具有入 口点,这是因为在任何不可解码流中的入口点似乎没有任何价值。然而,发明人已给不可解 码的辅助流添加了入口点。仅通过提供主要与辅助入口点地址,就能够为了特技播放而在 不相邻分段中便利地解码。

23、这两个流,这是因为对于这样的分段,能够根据增强的入口点表 格立即检索辅助流中的对应分段。 0018 在该系统的实施例中,视频数据流包括多视图3D视频数据,其中多视图至少包括 一个左视图以及一个右视图。多视图3D视频为左眼和右眼提供多个单独的视图。如例如 在参考文献1或2中所解释的,3D场景的多个视图具有大重叠(overlap),并且通常被 依赖性编码。增强的入口点表格便利地为这样的多视图3D视频流提供特技播放。 0019 在该系统的实施例中,视频数据流包括多个辅助子流,并且入口点包括仅用于所 述多个辅助子流的选定子集的辅助入口点,以便在特技播放期间再现精简版本的3D视频 数据。有利地,入口点表。

24、格的大小保持有限。该实施例也基于以下认识:在特技播放期间, 所再现的3D视频的一些退化是可接受的。例如,通过不解码每一个子流可以减少多视图3D 视频的视图的数量,或者在结构化的3D视频格式中可以忽略透明度数据。 0020 在所附的权利要求书中给出根据本发明的方法、3D设备和信号的进一步优选的实 施例,其公开内容在这里被并入作为参考。 附图说明 0021 本发明的这些和其他方面从以下的描述中利用示例并参考附图描述的实施例中 将是显而易见的,并将参考这些实施例来进一步阐述,其中: 图1显示3D视频生成系统, 图2显示多视图显示器, 图3显示经由双凸透镜的左与右眼视图, 说 明 书CN 102428。

25、706 A CN 102428713 A 4/9页 8 图4显示播放列表的基本结构, 图5显示用于显示三维(3D)视频数据的系统, 图6显示入口点表格指示符表格, 图7显示增强的入口点表格指示符表格, 图8显示增强的流类型表格, 图9显示具有两个子流的3D视频流, 图10显示入口点图的定义,和 图11显示用于组合的主要流和子流的入口点表格。 0022 在附图中,与已经描述的元素相对应的元素具有相同的参考数字。 具体实施方式 0023 图1显示3D视频生成系统。该3D视频生成系统包括一对相机即右侧相机11和 左侧相机12、生成将存储在存储介质14上的视频信号15的3D视频处理器13。右侧相机 和。

26、左侧相机均可以是传统相机。深度扫描器可以与左侧相机相关联,其包括例如能够在不 同方向进行操纵的激光束以及检测激光束的反射的传感器。也可以从相机信息中通过计算 来生成深度信息。该对相机被指向场景10,以捕获该场景的3D视频。场景10包括各种对 象,例如,诸如人、树、房屋以及天空中的太阳。每一个对象相对于该对相机具有给定距离, 其中这些相机可以被认为是观看该场景的虚拟观察者。 0024 3D视频处理器可以包括例如指令执行设备以及其中已装载一组定义3D视频处理 器的操作的指令的程序存储器,这将在下文进行描述。例如,存储介质14可以采用硬盘、可 写光盘、用于制造只读类型光盘的母盘刻录(masterin。

27、g)系统或固态存储器的形式。 0025 3D视频生成系统基本上如下操作。该对相机提供该场景的基本3D视频,其利用一 系列图片对来形成。图片对包括右侧图片和左侧图片。利用右侧相机捕获的右侧图片用于 人类观察者的右眼。利用左侧相机捕获的左侧图片用于人类观察者的左眼。 0026 右侧相机和左侧相机具有相对于彼此的特定位置关系。这种位置关系可以利用典 型的再现上下文依照例如场景大小和观看距离来定义。例如,包括相互关联的一系列右侧 图片和一系列左侧图片的基本3D视频可以预定用于在具有典型的12米屏幕大小以及典型 的18米观看距离的影院中显示。多视图3D视频数据流可以从相机和/或深度信息中生成。 多视图3。

28、D视频为左眼和右眼提供多个单独的视图。3D场景的多个视图具有大重叠,并且通 常被依赖性编码,如例如在参考文献1或2中所解释的。 0027 不同的3D格式基于使用2D图像以及附加深度图像的两个视图,其中附加深度图 像即为所谓的深度图,其传递有关对象在2D图像中的深度的信息。称为图像+深度的格式 的不同之处在于:它是2D图像与所谓的“深度”或差距图(disparity map)的组合。这是 灰度图像,由此像素的灰度值指示对于相关联的2D图像中对应像素的差距(或在深度图的 情况中的深度)量。显示设备将差距、深度或视差图用于通过将2D图像作为输入来计算附 加视图。这可以采用各种方式来完成,在最简单的形。

29、式中,这是依赖于与像素相关联的差距 值而将那些像素移到左或右的事情。参考文献3给出该技术的极好概述。 0028 在图1所示的系统中,3D视频处理器13具有入口点单元18,用于处理传入3D视 频数据和生成用于3D特技播放模式的入口点表格。入口点单元被安排用于定义视频数据 说 明 书CN 102428706 A CN 102428713 A 5/9页 9 流中的入口点。这些入口点被存储在入口点表格中。以彼此在时间上相隔一定距离的方式 在视频数据流中定义这些入口点。随后,所定义的入口点例如通过存储给出所定义的入口 点的位置的入口点地址而被存储在入口点表格中。在3D视频数据流格式中,视频数据流通 常包。

30、括众多子流,这些众多子流编码3D视频数据的一个流,并包括独立编码2D版本的3D 视频数据的至少一个2D子流以及依赖性编码3D视频数据的部分的至少一个辅助子流。例 如,该部分可以是右视图(取决于独立编码的左视图流)或深度图。对于这样的3D视频流, 这些入口点被生成为包括2D子流中的主要入口点以及辅助子流中的辅助入口点,以启用 3D视频数据的3D特技播放。 0029 在再现期间,主要(2D)子流的选定分段基于主要入口点进行检索,并被解码为2D 子流中的非相邻分段。随后,与2D子流的选定部分相对应的辅助从属子流的部分基于辅助 入口点进行检索,并被依赖性解码为辅助子流的分段。 0030 图2显示多视图。

31、显示器21,其在LCD屏幕前方使用双凸透镜22来为左与右眼生成 不同的视图。交错从两个略微不同的角度拍摄的两个图像创建3D感知。这种效果基于双 眼视差,即左眼和右眼通常从略微不同的角度来观看对象。这些通过调视和会聚而被融合 在一起,并且这对于大脑充当强有力的深度提示。 0031 图3显示经由双凸透镜30的左与右眼视图。右眼32仅看到像素33的左部分,而 左眼31看到右部分。这些像素部分被称为子像素34。通过调视和会聚在人类观察者中融 合图像的右部分和左部分通过呈现单个立体图像来创建深度提示。通过细分多个子像素中 的每一个像素能够创建多个左和右视图。 0032 例如,与其中仅显示两个交错图像的图。

32、3形成对照,实际的显示器可以使用例如9 个交错图像,这对于该图像给出更广泛的视野和轮廓,如图2中示意性所示的。驱动这种类 型的显示器需要被处理以生成多个视图的基于图像加深度的视频或多视图编码的视频。为 此目的,蓝光光盘标准可以被扩展以包括对于这样的3D视频流的支持。播放器随后可以不 仅驱动自动立体显示器,而且也可以驱动其他类型的立体3D显示器,诸如交替视图并使用 快门眼镜来为双眼单独分隔开视图的显示器,或者在未来甚至可以包括全息显示器。 0033 对于透镜屏幕的替换方案是屏障(Barrier)显示器,其使用位于LCD之后和背光 之前的视差屏障来分隔开LCD中来自像素的光。该屏障使得:从屏幕前方。

33、的设置位置中,左 眼看到与右眼不同的像素。屏障也可以位于LCD与人类观看者之间,以致在显示器的行中 的像素交替地由左眼和右眼可看到。 0034 从利用3D视频的特技播放进行的实验中,已发现:“3D深度”印象的质量在特技播 放期间恶化。一种可能的解释是:立体视频对于人类光学系统(调视和会聚)而言需要比正 常2D视频更大和更长的努力,以便大脑将利用眼睛接收到的两个图像融合为“3D”心智图 像(mental image)。当每秒显示的帧的数量在特技播放期间显著增加时,人类光学系统似 乎不能完全跟上更高的帧速率。 0035 利用立体3D视频的特技播放的另一个问题在于:由于解码器必须在更短时间内 解码更。

34、多的帧(为了平滑的特技播放),所以视频解码器上的负担增加。由于立体视频,解码 器必须解码两个或更多的流,并且这与2D相比增加了问题。此外,如果使用如利用MPEG中 定义的可扩缩多视图编码来编码多视图视频,那么附加流的解码变得依赖于基本视图流, 因此在播放器中能够完成特技播放的方式必须改变。这样的不能独立被解码的流在这个文 说 明 书CN 102428706 A CN 102428713 A 6/9页 10 献中被称为辅助子流。这样的流将基于相应的主要流而被依赖性解码。 0036 在以下的解释中,入口点表格的示例参考蓝光光盘系统来讨论。注意:入口点表格 能够应用于任何的以主要和辅助视频流为基础的。

35、3D视频系统,并且对于实现本发明而言 并不需要蓝光光盘系统的细节。蓝光光盘标准为每一个基本视频流规定入口点表格(包括 入口点图:EP映射(EP-map)。该入口点表格定义列出解码可以开始的点在流中的位置的 表格。通常,这些位于MPEG I帧边界上。这个表格仅列出用于一个流的入口点,而没有考 虑可能同时解码也彼此依赖的若干视频流的事实。 0037 已发现:当跳帧以创建某种类型的幻灯片效果时,特技播放期间的深度感知得到 改善。因此,原始3D视频中的单独的不相邻分段被显示在一个序列中。令人惊奇地,跳过 的帧越多,则感知的深度变得越好。这在某种程度上与正常2D视频形成对比,其中在2D视 频中解码器籍此。

36、更快地解码所有的帧的平滑特技播放被感知为更佳。这能够通过考虑以下 事实来加以解释:光学系统耗费时间来将来自眼睛的两个图像融合成一个立体图像(通过 调视和会聚),并生成“3D”心智图像。在正常生活中,这不是问题,因为深度感知取决于许 多因素,并且双眼视差(实体视觉)仅对于靠近观看者的对象是有效的。对于快速移动对象 来说,运动视差发挥比闭塞更大的作用。在3D显示器中,这却是一个问题,因为3D效果主 要取决于双眼视差,因此对于快速移动对象而言,深度感知被减弱。 0038 为了解决对于特技播放的上述问题,必须为将在相应的特技播放模式中再生的选 定分段的序列定义入口点,如上所述。 0039 在一个实施例。

37、中,蓝光光盘的入口点表格被扩展为容纳附加定义的入口点。这个 表格现在列出用于视频的入口点,并在视频中的时间位置与盘上的文件中的位置之间提供 链接。该扩展使得:除了用于2D视频流的入口点之外,该表格现在也列出用于第二辅助视 频流的入口点,其中第二辅助视频流使用可扩缩视频编码来编码,并依赖于基本视频流来 解码。这个第二入口建立从第一流中的每一个入口到第二流中的对应入口点的关联性。这 个后者可以包含I或P帧,其中P帧可以转而参考来自基本流的I帧。在使用直接的显示 时间标记(Presentation Time Stamp)(PTS)值时采用这种方案。注意:由于辅助流仅可 依赖性解码,例如可能在相同的P。

38、TS时间仅包含P或B帧,所以用于第二流的单独EP映射 可能无法靠自己工作。因此,辅助流在靠自己进行解码时不是有效的流。例如,对于蓝光光 盘中的多视图编码的视频,入口点表格可以被扩展,并且蓝光播放器使用EP映射的方式被 适配以检索主要入口点和辅助入口点二者。该规范被增强,以致与基本视图视频流相关联 的EP映射也包含用于其自己无法解码的相关联的辅助流的入口点。 0040 参考文献1和2描述在联合编码的视频流以及相关联的传输格式背后的原 理。例如,在编码之前,3D视图被交错,并随后使用分层B帧进行编码。在传送之前,比特流 被分成基本流和辅助流。这为了向后兼容性而完成,以致2D解码器能够解码和使用基本。

39、流 并忽略辅助流。在修改的解码器中,基本流和辅助流被再次交错和解码。这对于蓝光光盘 上的特技播放产生问题,籍此基本流和辅助流在光盘上分开进行存储。为了解决此,需要对 EP映射表格进行扩展,以致播放器知道必须交错和解码基本流和辅助流中的哪些剪辑,即, 流的部分,以便显示播放器已跳至的视频的区段。利用所提议的增强的入口点表格,解决这 个问题。 0041 图4显示播放列表的基本结构。该示例以BD以及EP映射41(控制信息CPI中的 说 明 书CN 102428706 A CN 102428713 A 7/9页 11 入口点表格)在这个结构中所起的作用为基础。对于某个PTS值,EP映射提供逻辑地址,例。

40、 如,为MPEG编码基本流的剪辑AV流文件中的对应源分组编号。参考图6-11进一步描述该 结构。 0042 图5显示用于显示三维(3D)视频数据的系统。例如光盘播放器之类的3D源设备 50耦合到3D显示设备53,以便传送3D显示信号56。3D源设备具有用于接收图像信息的输 入单元51。例如,输入单元设备可以包括光盘单元58,用于从如同DVD或蓝光光盘之类的 光学记录载体54中检索各种类型的图像信息。替代地,输入单元可以包括用于耦合到例如 因特网或广播网之类的网络55的网络接口单元59,其中这样的设备通常被称为机顶盒。图 像数据可以从远程媒体服务器57进行检索。源设备也可以是卫星接收机或直接提供。

41、显示 信号的媒体服务器,即,输出3D显示信号以便直接地被耦合到显示单元的任何适当设备。 0043 3D显示设备53用于显示3D图像数据。该设备具有用于接收包括从源设备10传 送的3D图像数据的3D显示信号56的输入接口单元。该设备具有用于显示处理的图像数 据的3D显示器,例如,双或透镜LCD。显示设备53可以是任何类型的也被称为3D显示器的 立体显示器,并且具有利用箭头44指示的显示深度范围。 0044 3D源设备50具有与输入单元51相耦合的图像处理单元52,用于处理图像信息, 以生成将经由输出接口单元12被传送至显示设备的3D显示信号56。处理单元52被安排 用于生成包括在3D显示信号56。

42、中的图像数据,以便显示在显示设备13上。源设备配备有 用户控制元件,用于控制诸如对比度或颜色参数之类的图像数据的显示参数。这样的用户 控制元件是众所周知的,并且可以包括具有各种按钮和/或光标控制功能的遥控单元,以 控制3D源设备的各种功能,诸如正常回放和记录功能,以及用于例如借助于直接按钮或借 助于图形用户界面和/或菜单来选择特技播放模式。 0045 源设备50具有用于在特技播放模式中处理3D视频数据的特技播放处理单元48。 3D视频数据在特技播放期间通过根据入口点表格检索和解码2D子流中的非相邻分段以及 检索和依赖性解码辅助子流中的对应分段而被再生。对于相应的分段,独立解码2D子流, 并且3。

43、D信息以基于辅助入口点从视频数据流中检索的辅助流的对应分段为基础来添加。 0046 图5进一步显示记录载体54作为3D图像数据的载体。该记录载体是盘状的,并 具有轨道和中心孔。利用一系列物理可检测的标记构成的轨道根据在信息层上构成大致平 行轨道的螺旋或同心图案的圈来排列。该记录载体可以是光学可读的,其被称为光盘,例如 CD、DVD或BD(蓝光光盘)。在信息层上利用沿着轨道的例如坑和脊的光学可检测标记来表 示信息。该轨道结构也包括用于指示通常被称为信息块的信息单元的位置的位置信息,例 如标题和地址。记录载体54在如同DVD或BD格式之类的预定义记录格式中运送代表数字 编码的3D视频数据的信息,其。

44、中3D视频数据例如根据MPEG2或MPEG4编码系统来编码。 0047 下文描述的是基于蓝光光盘规范的EP映射表格的语法的相关部分。我们提议对 这个表格进行扩展,以致它可能也包含对于在EP映射表的顶部列出的主要流上的解码而 言是依赖性的相关联流的入口。 0048 在实践中,这将意味着:对于与另一个流联合编码的每一个辅助流,在与其依赖来 解码的流相同的表格中具有EP映射(EP_map)。相反的即用于辅助流的附加表格也是有可 能的,并且在与2D解码向后兼容性的情况中是更有效的。在这种情况中,对于包含辅助流 的剪辑,具有EP映射。在这个EP映射中也具有用于辅助流中的入口点所依赖来解码的基 说 明 书。

45、CN 102428706 A CN 102428713 A 8/9页 12 本视图流的部分的入口点位置。在多视图编码视频的回放情况中,播放器则仅需要加载辅 助流的EP映射,并且随后具有用于基本视图流的接入点,其中基本视图流必须被解码,以 便能在辅助流的接入点上解码该帧。 0049 详细地,提议新的EP映射,其包含入口点至用于多流编码3D视频流的文件地址的 映射。蓝光光盘规范当前定义唯一一种类型的EP映射,这指示在如下所示的规范的表格 示。 0050 图6显示输入点表格指示符表格。该表格显示现有的EP映射类型。用于指示EP 映射类型的指示符值可以在描述例如蓝光光盘之类的记录格式的标准中进行定义。。

46、提议在 称为“EP_map_MVC”或如同用于立体3D视频的EP_map_ST之类的某种类似命名的这个表格 中添加用于多视图编码(MVC)3D视频的新类型。这个EP_MVC_map_type可以利用值2来指 示。 0051 图7显示增强的入口点表格指示符表格。该表格显示现有EP映射类型以及为MVC 3D视频提议的在这个表格中称为EP_map_MVC的新类型。在一个实施例中,相应的EP映射 类型在生成3D视频数据流时被包括在EP映射数据结构中,并被传送到回放设备。该回放 设备现在能够容易检测新的EP映射表格类型,并使得特技播放操作适应于相应的EP映射。 0052 图8显示增强的流类型表格。作为图。

47、6、7的替代,新的EP映射现在使用该表格中 显示的EP_stream_type值来指示,其中该表格对于EP_map(EP映射)中引用的流的类型具 有新的值(该表格中的8)。在一个实施例中,相应的EP流类型在生成3D视频数据流时被包 括在3D视频流数据结构中,并被传送到回放设备。回放设备现在能够容易检测新的EP流 类型,并从该流中检索增强的入口点表格,且使得特技播放操作适合于增强的入口点表格。 0053 图9显示具有两个子流的3D视频流。该图显示使用分层B图片来MVC编码两个 流的区段的示例。标记为L的上序列是独立可解码的2D子流,而标记为R的较低序列是依 赖性可解码的,这是因为它需要来自第一流。

48、的数据。箭头指示:来自第一I帧的数据用于编 码较低子流中的第一P图片。 0054 在图9所示的示例中,在L和R流二者中具有三个入口点。在L流中,具有I、B(T2) 和B(T4)图片,而在R流中具有P、B(T2)和B(T4)图片。在中间的B图片是非参考帧,并且 不能用作入口点。注意:在实践中,入口点之间的距离将是相当大的。 0055 我们现在将通过调查在用户想跳到位置T2时发生什么来继续。如果解码开始于 T2,那么解码器也必须为L流在T0访问I图片,而对于R流,它必须访问来自L流的I图片 和来自R流的P图片。因此,它需要I图片在L流中的位置以及P图片在R流中的位置。于 是,它需要针对P图片的位置。

49、的时间矢量以及针对L帧中的I图片的空间矢量。 0056 在盘上,L和R流均可以在盘上的不同区段中进行交错,或者可以被包含在一个流 中。因此,对于一个入口点,可能需要文件中的位置和盘上的位置二者,这是因为对于一个 入口点来说,需要来自L和R流二者的信息,如上所述。因此,在子流L中的主要入口点以 及依赖性可解码的子流R中的辅助入口点将被提供。 0057 因此,详细地,我们提议对于MVC编码的视频扩展EP映射,以致每一个入口点包含 两个地址,其也被称为矢量。一个时间矢量指向PTS,而一个空间矢量指向对于入口点而言 充当参考帧的帧的分组编号。 0058 图10显示也被称为EP_map_syntax的入口点图的定义。该表格显示被扩展用于 说 明 书CN 102428706 A CN 102428713 A 9/9页 13 与MVC编码视频一起使用的当前EP映射的一个示例。该映射包括用于相应子流的子表格。 注意:该表格定义例如在诸如蓝光光盘格式中的控制信息CPI 41之类的记录载体上的控 制信息中利用3D视频数据流而包括的入口点表格的数。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1