数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法.pdf

上传人:b*** 文档编号:659819 上传时间:2018-03-02 格式:PDF 页数:112 大小:10.44MB
返回 下载 相关 举报
摘要
申请专利号:

CN201380020188.X

申请日:

2013.02.13

公开号:

CN104221402A

公开日:

2014.12.17

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):H04S 3/00申请日:20130213|||公开

IPC分类号:

H04S3/00; H04R5/02; H04N21/439

主分类号:

H04S3/00

申请人:

三星电子株式会社

发明人:

金钟和; 金秀英; 罗日柱; 尹硕振; 李在珉; 李庚宰

地址:

韩国京畿道

优先权:

2012.11.02 KR 10-2012-0123638; 2012.02.15 US 61/599,154; 2012.02.24 US 61/602,975; 2012.02.24 US 61/602,978; 2012.02.29 US 61/604,892; 2012.02.29 US 61/604,844; 2012.03.16 US 61/611,822; 2012.03.21 US 61/613,629; 2012.04.23 US 61/636,879; 2012.04.23 US 61/636,901; 2012.05.02 US 61/641,580; 2012.05.16 US 61/647,628

专利代理机构:

北京市柳沈律师事务所 11105

代理人:

刘虹;邵亚丽

PDF下载: PDF下载
内容摘要

本发明提供了一种数据发送装置。该数据发送装置包括:分组生成器,被配置为生成关于多通道音频采样数据的多个分组;以及发送器,被配置为将所生成的多个分组发送到数据接收装置。多个分组中的每一个包括区分所述分组的位置或次序的标识符字段。

权利要求书

1.  一种数据发送装置,包括:
分组生成器,其生成关于多通道音频采样数据的多个分组;以及
发送器,其将所生成的多个分组发送到数据接收装置,
其中,所生成的多个分组中的每一个包括区分所述分组的位置或次序的标识符字段。

2.
  如权利要求1所述的数据发送装置,其中,所述标识符字段包括指示具有标识符字段的分组是否是多通道音频采样数据的第一分组的预定比特。

3.
  如权利要求1所述的数据发送装置,其中,所述标识符字段包括指示具有标识符字段的分组索引的预定比特。

4.
  如权利要求1所述的数据发送装置,其中,所生成的多个分组中的每一个包括至少一个子分组,而且所述至少一个子分组存储多通道音频采样数据的一部分。

5.
  如权利要求4所述的数据发送装置,其中,所生成的多个分组中的每一个包括采样存在比特和采样平比特中的至少一个,所述采样存在比特指示所述至少一个子分组是否具有多通道音频采样数据,而且所述采样平比特指示子分组中包括的音频采样数据是否有效。

6.
  如权利要求1所述的数据发送装置,其中,所述多通道音频采样数据包括9个或更多通道的音频信号。

7.
  如权利要求1所述的数据发送装置,其中,所述多通道音频采样数据是根据国际电工委员会(IEC)60958格式配置的。

8.
  一种数据接收装置,包括:
接收器,其接收从数据发送装置发送的关于多通道音频采样数据的多个分组;以及
分组解析器,其解析接收到的多个分组,
其中,接收到的多个分组中的每一个包括区分所述分组的位置或次序的标识符字段。

9.
  如权利要求8所述的数据接收装置,其中,所述标识符字段包括指示具有标识符字段的分组是否是一个多通道音频采样数据的第一分组的预定比特。

10.
  如权利要求8所述的数据接收装置,其中,接收到的多个分组中的每一个包括至少一个子分组,而且所述至少一个子分组存储多通道音频采样数据的一部分。

11.
  如权利要求10所述的数据接收装置,其中,接收到的多个分组中的每一个包括采样存在比特和采样平比特中的至少一个,所述采样存在比特指示所述至少一个子分组是否具有多通道音频采样数据,而且所述采样平比特指示子分组中包括的音频采样数据是否有效。

12.
  如权利要求8所述的数据接收装置,其中,所述多通道音频采样数据包括9个或更多通道的音频信号。

13.
  如权利要求8所述的数据接收装置,其中,所述多通道音频采样数据是根据国际电工委员会(IEC)60958格式配置的。

14.
  一种数据发送方法,包括:
生成关于多通道音频采样数据的多个分组;以及
将所生成的多个分组发送到数据接收装置,
其中,所生成的多个分组中的每一个包括区分所述分组的位置或次序的标识符字段。

15.
  一种数据接收方法,包括:
接收从数据发送装置发送的关于多通道音频采样数据的多个分组;以及
解析接收到的多个分组,
其中,接收到的多个分组中的每一个包括区分所述分组的位置或次序的标识符字段。

说明书

数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
技术领域
与本文所公开的示例性实施例一致的装置和方法涉及数据收发装置和方法,而且更具体地,涉及在有线接口环境中发送多通道音频信号的数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法。
背景技术
由于多媒体环境已经被实施,因此已经提出了用于发送数据的各种有线接口环境。例如,高清晰度多媒体接口(HDMI)和移动高清链路(MHL)规定了各种格式的视频数据、音频信号以及控制信号的传输标准。特别地,根据多媒体环境的发展,多通道音频信号的传输标准正在被积极地讨论,以便实现高质量声音的传输。
到目前为止,关于2到8个通道的音频通道的标准已经被提出。然而,在多媒体环境中,可能需要具有9个或多于9个通道的音频信号的传输标准。当传输多通道音频信号时,应该考虑常规使用的各种格式和设备环境。
发明内容
技术问题
示例性实施例可以克服上述缺点和上面未描述的其他缺点。而且,示例性实施例不需要克服上述缺点,而且示例性实施例可以不克服上述任何问题。
技术方案
提出了示例性实施例以解决上述问题,而且示例性实施例的一方面提供了一种数据发送装置,其可以包括:分组生成器,其生成关于多通道音频采样数据的多个分组;以及发送器,其将所生成的多个分组发送到数据接收装置。所生成的多个分组中的每一个可以包括区分所述分组的位置或次序的标识符字段。
标识符字段可以包括指示具有该字段的分组是否是多通道音频采样数据的第一分组的预定比特。
标识符字段可以包括指示具有标识符字段的分组索引的预定比特。
所生成的多个分组中的每一个可以包括至少一个子分组,而且所述至少一个子分组存储多通道音频采样数据的一部分。
所生成的多个分组中的每一个可以包括采样存在比特(sample present bit)和采样平比特(sample flat bit)中的至少一个,所述采样存在比特指示所述至少一个子分组是否具有多通道音频采样数据,而且所述采样平比特指示子分组中包括的音频采样数据是否有效。
所生成的多个分组中的每一个可以包括多个子分组,而且多个子分组中的每一个可以存储多通道音频采样数据的一部分。
多通道音频采样数据可以包括9个或更多通道的音频信号。
多通道音频采样数据可以是根据IEC 60958格式配置的。
根据示例性实施例的另一方面,提供了一种数据接收装置,其可以包括:接收器,其接收从数据发送装置发送的关于多通道音频采样数据的多个分组;以及分组解析器,其解析接收到的多个分组。接收到的多个分组中的每一个可以包括区分所述分组的位置或次序的标识符字段。
标识符字段可以包括指示具有标识符字段的分组是否是多通道音频采样数据的第一分组的预定比特。
接收到的多个分组中的每一个可以包括至少一个子分组,而且所述至少一个子分组存储多通道音频采样数据的一部分。
接收到的多个分组中的每一个可以包括采样存在比特和采样平比特中的至少一个,所述采样存在比特指示所述至少一个子分组是否具有多通道音频采样数据,而且所述采样平比特指示子分组中包括的音频采样数据是否有效。
接收到的多个分组中的每一个可以包括多个子分组,而且多个子分组中的每一个可以存储多通道音频采样数据的一部分。
多通道音频采样数据可以包括9个或更多通道的音频信号。
多通道音频采样数据可以是根据IEC 60958格式配置的。
根据示例性实施例的另一方面,提供了数据收发系统,其可以包括:数据发送装置,其生成关于多通道音频采样数据的多个分组并且发送所生成的分组;以及数据接收装置,其接收发送的多个分组并且解析接收到的分组。 多个分组中的每一个可以包括区分所述分组的位置或次序的标识符字段。
标识符字段可以包括指示具有标识符字段的分组是否是多通道音频采样数据的第一分组的预定比特。
根据示例性实施例的另一方面,提供了一种数据发送方法,其可以包括生成关于多通道音频采样数据的多个分组并且将所生成的多个分组发送到数据接收装置。所生成的多个分组中的每一个可以包括区分所述分组的位置或次序的标识符字段。
标识符字段可以包括指示具有标识符字段的分组是否是多通道音频采样数据的第一分组的预定比特。
根据示例性实施例的另一方面,提供了一种数据接收方法,其可以包括接收从数据发送装置发送的关于多通道音频采样数据的多个分组,并且解析接收到的多个分组。接收到的多个分组中的每一个可以包括区分所述分组的位置或次序的标识符字段。
标识符字段可以包括指示具有标识符字段的分组是否是多通道音频采样数据的第一分组的预定比特。
根据示例性实施例的另一方面,提供了一种数据收发方法,其可以包括从第一装置向第二装置发送扩展的显示标识数据(Extended Display Identification Data,EDID)块,EDID块包括指示多通道音频数据的3D音频特征的第一子块和指示多通道音频数据的3D扬声器分配信息的第二子块中的至少一个;从第二装置向第一装置发送元数据分组,其包括指示多通道音频数据的通道分配标准类型的音频通道分配标准类型(ACAT)字段、指示通道数目的通道计数字段、以及指示通道/扬声器分配信息的3D通道/扬声器分配字段中的至少一个;从第二装置向第一装置发送至少一个多通道音频采样数据分组;以及在第一装置中对至少一个发送的多通道音频采样数据分组执行解析并基于经解析的至少一个发送的多通道音频采样数据分组来输出音频。至少一个多通道音频采样数据分组可以包括多个子分组、以及区分多个子分组的位置或次序的标识符字段。
根据示例性实施例的另一方面,提供了一种数据收发方法,其可以包括从第一装置向第二装置发送扩展的显示标识数据(EDID)块,EDID块包括指示多通道音频数据的多流音频特征的子块;从第二装置向第一装置发送音频信息帧分组,其包括指示多通道音频数据的通道数目的通道计数字段、以 及指示通道/扬声器分配信息的通道/扬声器分配字段中的至少一个;从第二装置向第一装置发送至少一个音频采样数据分组;以及在第一装置中对至少一个发送的音频采样数据分组执行解析并基于经解析的至少一个音频采样数据分组来输出音频。至少一个音频采样数据分组可以包括多个子分组,而且多个子分组可以包括与多个内容中的任一内容相对应的音频数据。
技术效果
根据上述各种示例性实施例,示例性实施例可以生成关于多通道音频采样数据的多个分组,其中,所生成的多个分组中的每一个可以包括标识符字段,并因此提供具有多于9个通道的音频信号的传输标准。
附图说明
通过参照附图描述某些示例性实施例,示例性实施例的以上和/或其他方面将更加明显,在附图中:
图1示出了3维(3D)音频信号的传输定时;
图2是根据示例性实施例的数据收发系统的框图;
图3是根据示例性实施例的数据收发系统中的数据发送装置的框图;
图4是根据示例性实施例的数据收发系统中的数据接收装置的框图;
图5示出了根据示例性实施例的音频采样分组的传输流;
图6示出了根据另一示例性实施例的音频采样分组的传输流;
图7示出了根据示例性实施例的传输流格式;
图8示出了根据示例性实施例的音频采样分组的传输流;
图9和图10示出了根据示例性实施例的多流音频采样分组的传输流;
图11示出了根据示例性实施例的多流音频采样分组的传输流;
图12示出了根据示例性实施例的使用CEC发送扬声器位置的操作;
图13示出了根据示例性实施例的将3D音频采样从BDP发送到TV的操作;
图14示出了根据示例性实施例的将多流音频从BDP发送到TV的操作;
图15示出了根据示例性实施例的用于3D音频通道的扬声器设置;
图16到图19是提供对根据各种示例性实施例的数据发送方法和数据接收方法的解释的流程图。
具体实施方式
现在将参照附图详细地描述某些示例性实施例。
在下面的描述中,即使在不同的附图中,相同的参照标记也被用于相同的元件。描述中定义的、诸如详细结构和元件的事项被提供以便有助于全面理解示例性实施例。因此,显而易见的是,示例性实施例可以在没有这些具体定义的事项的情况下实现。此外,没有详细描述公知的功能或结构,因为它们会以不必要的细节模糊示例性实施例。
如本文所用的术语“多通道音频”表示具有2个以上通道的音频信号。在示例性实施例的以下描述中,将多通道音频划分为2维(2D)音频通道和3维(3D)音频通道。“2D音频通道”具有2个通道到8个通道的多个音频通道,并且表示这样的音频通道,其中与各通道相对应的扬声器被放置在平面上。与此相对,在“3D音频通道”具有包括9个以上通道的多个音频通道,而且与各通道相对应的扬声器被放置在3D空间中。
举例来说,示例性实施例可以使用在TTA(10.2ch),SMPTE2036-2(22.2ch)或IEC62574(30.2ch)中定义的使用通道布局来实现3D音频。3D音频可以包括如本文所定义的降混(down mix)音频流。
术语“多流音频”表示这样的音频信号,其具有与多视图环境中的每个视图相对应地被分类的音频信号,在所述多视图环境中可以观看两个或更多个有区别的内容。每个视图的音频信号可以是多通道音频。例如,如果支持多视图视频,诸如与双视图游戏或四视图游戏相关联的多视图视频,则多流音频可以是与使用3D视频格式发送的视频流相关的一类音频流。
下文中,将基于从HDMI1.4b规范的音频扩展的、具有9到32个(或更多)通道的3D音频、以及用于多视图显示装置的多流音频,来解释示例性实施例。更重要的是,包括下面描述的改变以支持新的音频特征。
然而,因为示例性实施例可以应用到各种有线接口的传输标准,诸如本技术领域的等效范围之内的移动高清链路(MHL)标准和高清多媒体接口(HDMI)标准,所以下面描述的示例性实施例在类似的有线接口传输标准中也可以是有效的。
在下面的描述,将描述通过数据岛(data island)时段发送的HDMI分组的新的定义(包括3D音频采样分组、3D一比特音频采样分组、音频元数据分组、多流音频采样分组和多流一比特音频采样分组)、对于分组的打包处理、 以及在扩展显示标识数据(E-EDID)内的HDMI音频数据块的定义以支持根据新的特征的发现功能。除非本文另有定义,根据示例性实施例,所述规范基本上按照HDMI1.4b,而且不改变HDMI1.4b。
与HDMI1.4b相反的解释可以被替换为以下新定义的特征,然而,其他解释可以与HDMI1.4b的规范一致。所述规范是指以下规范。
HDMI、HDMI Licensing、LLC,High-Definition Multimedia Interface Specification Version 1.4b,2011年10月11日
TTA,TTAK.KO-07.0098,Audio Signal Formats for Ultra High Definition(UHD)Digital TV,2011年12月21日
SMPTE,SMPTE 2036-2:2008,UHDTV Audio characteristics and audio channel mapping for program production,2008
IEC,IEC 62574ed.1.0,Audio,video and multimedia systems General channel assignment of multichannel audio,2011年4月7日
MHL,LLC,Mobile High-definition Link version 2.0,2012年2月
*TTA:电信技术协会(Telecommunications Technology Association)
概述
基本音频功能包括与采样率为32kHz、44.1kHz或48kHz的IEC 60958的线性脉码调制(L-PCM)音频流相关的功能。这个音频流可以包含普通立体声流。可选地,HDMI可以以192kHz的采样率发送具有3到32个音频通道的音频。HDMI可以以比特率达49.152Mbps(例如,环绕声)的IEC 61937压缩格式发送音频流。HDMI可以发送具有2到32个音频通道以及直接流传输(DST)的一比特音频,即,压缩格式中的一比特音频。HDMI可以发送3D音频流,其中扬声器可以放置在3D空间中的任何地方。3D音频流可以最多包括32个音频通道,其在数据岛时段通过连续分组发送。如果支持多视图视频流传输(例如,在每个视图中具有多个音频的双视图或四视图游戏),则HDMI可以发送多个音频流。关于这种情况,可以支持四个立体声音频流。
数据岛分组(data island packet)定义
在HDMI1.4b规范的5.3.1节分组首标中,可以将表5-8替换为下表。
表1-分组类型

*对于InfoFrame(信息帧)的分组布局,应该参考HDMI 1.4b规范的8.2节。
参照表1,从区域0x0B到0x0F定义新的分组。在0x0B中定义3D音频采样分组。在0x0C中定义3D一比特音频采样分组。此外,在0x0D中定义音频元数据分组,在0x0E中定义多流音频采样分组,而且在0x0F中定义多 流一比特音频采样分组。下面将详细说明新定义的分组。
此外,还将说明没有新定义分组的各种可替换的建议。表1中的分组定义将被称为第一示例性实施例。各种可替代的建议将被称为第二示例性实施例、第三示例性实施例、等等。各种可替代的建议将基于与第一示例性实施例的区别进行说明。
1-1.3D音频采样分组
第一示例性实施例
在第一示例性实施例中,可以使用新定义的3D音频采样分组发送L-PCM格式的3D音频。如上所述,“3D音频”被定义为这样的音频:在其中,扬声器可以根据3D音频标准(例如,10.2ch、22.2ch、30.2ch、或更多)被放置在3D空间中的确定的位置上。
3D音频流可以包括32个(或更多个)音频通道,并在数据岛时段中通过连续的分组发送。每个分组可以具有多达8个音频通道。分组首标可以包括采样起始(sample-start)和采样存在(sample-present)比特,以通知(指示)3D音频采样内的分组位置,这将在下面描述。下表显示3D音频采样分组首标。
表2-3D音频采样分组首标

每个字段包括以下信息。
sample_start:[1比特]指示:如果采样起始是1,则当前分组是3D音频采样的第一个分组。因此,sample_start指示3D音频流的开始。接收器(sink)区分采样的起始部分与所述采样起始。
sample_start=1,除了指示当前3D音频采样分组是3D音频采样的第一个分组之外,还指示当前3D音频采样分组被完全打包到8个音频通道。但是,如果低于8个音频通道降混的3D音频被发送,则只有8个或更少的音频通道可以被打包。sample_start=0指示:当前3D音频采样分组是3D音频采样的中间或最后的分组,并且包括8个或更少个音频通道。可以仅存在3D音频采样分组的5个有效sample_present比特的设置。
sample_present.spX:[4个字段,每个字段1比特]指示子分组X是否包括音频采样。一条3D音频采样数据可以被包括在两个或多个3D音频采样分组中,并且每个3D音频采样分组可以具有四个子分组。因此,每个3D音频采样分组首标可以具有总共四个采样存在(sample-present)比特,其对应于四个子分组。每个sample_present比特表示相应的子分组是否具有3D音频采样的一部分。
sample_flat.spX:[4个字段,每个字段1比特]指示子分组X是否是指扁平线(flatline)采样。如果sample_present.spX被建立,则它是有效的。如果没有发现可以在源处使用的可用音频数据,则4个sample_flat.spX比特可以被建立。当采样率改变时或当存在临时流中断时,则可以发生所述建立。如果sample_flat.spX被建立,则子分组X仍然是指采样时段,但是,不包括可用的音频数据。只有在相应的sample_present.spX比特被建立的情况下,sample_flat.spX才有效。
在发送具有L-PCM音频的9到32个通道(或更多)的一个3D音频采样(即,帧是5到16个IEC 60958帧)时,可以利用相邻的3D音频采样分组。
表3示出了有效的sample_present比特值。
表3-用于3D音频发送的有效的sample_present比特配置

SP0SP1SP2SP3描述0000没有包含音频采样的部分的子分组。1000只有子分组0包含音频采样的一部分

1100子分组0和1包含音频采样的两个连续部分1110子分组0、1和2包含音频采样的三个连续部分1111子分组0、1、2和3包含音频采样的四个连续部分

BX:[4个字段,每个字段1比特]指示:如果子分组X包括由IEC 60958块构成的192个帧中的第一帧,则B.X=1。否则,B.X=0。
3D音频采样分组包括如表2所示的音频采样分组首标、和四个子分组。3D音频采样分组中的每个子分组都具有根据IEC 60958定义的3D音频采样数据。
如果源要求3D音频流的降混,则可以使用3D音频采样分组发送降混的音频流。如果接收器不支持3D音频,则源可以不发送3D音频采样分组。将3D音频转换为遗留音频格式可能超出本说明书的范围。基于通道编号,可以存在彼此不同的多个子分组布局。在下文中,表4至表6分别指示对于12、24和32个通道的3D音频分组布局的例子。
表4-对于12个通道的3D音频采样分组布局的例子

表5-对于24个通道的3D音频采样分组布局的例子

表6-对于32个通道(最大)的3D音频采样分组布局的例子

图1示出了发送3D音频信号的定时。
参照图1,在水平消隐间隔,发送8个通道的三个2D音频信号采样中的每一个。在以上发送三个2D音频信号采样所使用的相同的持续时间中,发送24个通道的3D音频信号中的一个采样。
在下面,将描述根据第一示例性实施例的数据收发系统1000。
图2是示出根据示例性实施例的数据收发系统1000的配置的框图,图3是示出根据示例性实施例的数据收发系统1000的数据发送装置100的配置的框图,而且图4是示出根据示例性实施例的数据收发系统1000的数据接收装置200的配置的框图。
参照图2,根据示例性实施例的数据收发系统1000包括数据发送装置100和数据接收装置200。
参照图3,根据示例性实施例的数据发送装置100包括分组生成器110和发送器120。
分组生成器110可以生成关于多通道音频采样数据的多个分组。如上所述,可以生成关于具有9个通道或更多通道的音频采样数据的多个分组。所生成的分组中的每一个可以包括区分它的位置或序列的标识符字段。
标识符字段可以包括指示具有标识符字段的分组是否是多通道音频采样 数据的第一分组的预定比特。在第一示例性实施例中,sample_start比特可以是指示具有标识符字段的分组是否是第一分组的预定比特的例子。
此外,标识符字段可以包括指示具有标识符字段的分组的索引的预定比特。这个例子是从第一示例性实施例改变而来的,而且具有更有效地区分分组的效果。
发送器120将所生成的多个分组发送到数据接收装置200。
参照图4,根据示例性实施例的数据接收装置200包括接收器210和分组解析器220。
接收器210可以接收从数据发送装置100发送的关于多通道音频采样数据的多个分组。同样地,接收到的多个分组中的每一个可以包括区分它的位置或序列的标识符字段。
分组解析器220执行解析接收到的多个分组的操作。
视频依赖(video dependency)
表7示出了可以用来在CEA-861-F中描述(在D或E中也有描述)的各种视频格式定时发送3D音频的采样率。假设在水平消隐间隔的58TMDS时钟周期必需用于内容保护重新同步。发送3D音频可以通过3D音频采样分组来支持。
表7示出了对于24比特视频格式定时的3D音频的最大采样频率。
表7-对于视频格式定时的3D音频的最大采样频率



第二示例性实施例
根据不同于第一实施方式的第二示例性实施例,常规的音频采样分组格式可以被修改和使用。
如下面的表8所示,常规的音频采样分组的保留区域可以用作segment_indicator(段指示符)。根据示例性实施例,segment_indicator可以利用两个比特表示。如果segment_indicator=00,则指示第一分组。此外,如果 segment_indicator=01,则指示分组是中间分组的奇分组,如果segment_indicator=10,则指示分组是中间分组的偶分组,如果segment_indicator=11,则指示分组是最后的偶分组。此外,上述标识符仅仅是示例,而且与比特匹配的分组可以是不同的。
无论段是否被损坏,都可以发现上述结构。如果一个段被损坏,则具有损坏的段的第n个采样可以被丢弃,或者只有损坏的音频采样分组可以被丢弃。段指示一个或多个音频采样分组被划分到的组中的单独的音频采样分组。
Layout(布局)指示关于HDMI1.4b中的采样和通道的数目的信息。例如,一个音频采样分组可以包括两个通道的四个音频采样或8个通道的一个音频采样。在本说明书进行了扩展,常规的保留区域中的layout_ext字段被创建,这指示关于3D音频是否被提供了布局的信息。
例如,如果layout_ext=0而且layout=0,1,则按照常规方法类似地指示2D音频采样和通道的数目。然而,如果layout_ext=1而且layout=0,则指示3D音频采样。如果layout_ext=1而且layout=1时,则指示多流音频采样。
除了具体描述的字段外,第二示例性实施例中的其它字段可以与第一示例性实施例中的字段相同。
表8-修改的音频采样分组

表8-1segment_indicator字段
Segment_indicator描述

00起始段Start_segment01中间段(奇)mid_segment(odd)10中间段(偶)mid_segment(even)11结束段End_segment

表8-2layout和layout_ext之间的关系:参照表7-6HDMI 1.4b
Layout_extlayout描述002个通道/4个采样018个通道/1个采样103D音频11保留

图5示出了根据第二示例性实施例的音频采样分组的传输流。
参照图5,当在水平消隐间隔中发送关于22.2通道的3D音频的两个采样分组时,每个字段值被建立。在第一分组中,segment_indicator=00,在第二分组中,segment_indicator=10,而且在最后的分组中,segment_indicator=11。因为上述实施例是3D音频信号,所以layout_ext=1而且layout=0。在10.2通道的3D音频中发现类似的字段值。
第三示例性实施例
根据第三示例性实施例,常规的音频采样分组格式也被改变和使用,虽然与第二示例性实施例相比指示更少的信息。
参照下面的表9,常规的音频采样分组的保留区域可以用作multichannel_indicator(多通道指示符)。与第二示例性实施例的segment_indicator不同,multichannel_indicator指示关于音频采样分组是否是3D音频的信息。根据multichannel_indicator的比特信息,由布局字段指示的信息可以改变。
因此,multichannel_indicator可以利用一比特来表示。如果multichannel_indicator=0,则布局字段指示传统的HDMI1.4b中定义的通道/采样布局。如果multichannel_indicator=1,则布局字段指示使用多于8个通道发送多通道音频采样数据的布局。在这种情况下,参照采样的起始来使用布 局。如果layout=1,则指示当前音频采样分组中包括采样的起始。如果layout(start)=0,则指示当前音频采样分组不包括采样的起始。另外,以上描述仅是示例性的,而且与比特匹配的分组可以是不同的。除了所描述的字段外,第三示例性实施例中其它的字段可以与第一示例性实施例中的字段相同。
表9-修改的音频采样分组首标

表9-1Mmultichannel_indicator和Layout/start

上述结构使对传统的音频采样分组的保留区域的改变最小化,同时指示关于3D音频是否与音频采样分组一起被包括的信息。因此,根据第三示例性实施例的分组结构比第二实施例更简单。
图6示出了第三示例性实施例中的音频采样分组的传输流。
参照图6,当在水平消隐间隔发送关于22.2通道的3D音频的两个采样 分组时,每个字段值被建立。在第一分组中,layout=1,而且在第二分组和第三分组中,layout=0。然而,因为每一个分组都是3D音频信号的一部分,所以multichannel_indicator=1。在10.2通道的3D音频中建立类似的字段值。
第四示例性实施例
根据第四示例性实施例,常规的音频采样分组格式也被改变和使用,但是不同于第二示例性实施例,还提供了关于是否提供多流音频的信息。
参照下面的表10,常规的音频采样分组的保留区域可以用作Stream_ID和multiASP_layout。multiASP_layout执行与第三示例性实施例中的multichannel_indicator相同的功能。换句话说,multiASP_layout指示3D音频是否被提供。根据multiASP_layout比特信息,由layout字段指示的信息是不同的。
如果提供多流音频,则Stream_ID指示流编号。根据示例性实施例,一个比特可以用于Stream_ID中,而且0指示第一个流而且1指示第二个流。每个流对应彼此不同的内容的视图。另外,以上描述仅是示例性的,而且与比特匹配的分组可以是不同的。
如果与多流音频相对应的一个视图具有8个或更少通道的音频信号,则在一个音频采样分组中Stream_ID和multiASP_layout将不会同时是0。
表10修改的音频采样分组首标

表10-1Stream_ID的描述
Stream_ID描述0流11流2

上述结构在通过一个数据采样分组显示多流音频和3D音频二者的信息时具有实现兼容性的效果。此外,如果Stream_ID字段和流的标识符被创建,则多个流在发送时可以彼此区分开。因此,超过一个分组大小的多流音频采样数据可以被发送。另外,在第四示例性实施例中,除了所描述的字段外的字段与第一示例性实施例中的字段相同。
也可以考虑将Stream_ID字段、multiASP_layout字段和layout/start字段的值相结合的音频数据传输流。如果multiASP_layout=1,则指示3D音频传输流,而且layout/start指示关于分组的起始的信息。如果Stream_ID=1,则指示多流,而且根据layout/start建立通道和采样的数量。例如,接收Stream_ID=1的分组的接收器识别出,多流音频数据被发送而且当前接收的分组是两个多流音频数据中的第二个流音频数据。
第五示例性实施例
根据第五示例性实施例,常规的音频采样分组格式也被改变和使用。
参照下面的表11,常规的音频采样分组的保留区域可以用作Supports_Multistream(支持多流)和multiASP_layout(多ASP布局)。multiASP_layout执行与第四示例性实施例中的multiASP_layout相同的功能。换句话说,multiASP_layout指示3D音频是否被提供。由layout字段指示的信息根据multiASP_layout的比特信息而不同。
Supports_Multistream指示关于多流音频是否被提供的信息。根据示例性实施例,一比特可以用于Supports_Multistream中。1指示多流音频被提供。此外,以上描述仅是示例性的,而且与比特匹配的分组可以是不同的。
根据第五示例性实施例,一个音频采样分组可以最大包括2个通道的四个多流音频采样。可以与四个子分组中的每一个相对应地发送每个视图中的音频采样。
如果与多流音频相对应的一个视图具有8个或更少通道的音频信号,则在一个音频采样分组中Supports_Multistream和multiASP_layout将不会同时是0。
表11-修改的音频采样分组首标

上述结构在通过一个数据采样分组显示多流音频和3D音频二者的信息时具有实现兼容性的效果。此外,将要支持的每一个特征可以被写入一个音频采样分组中。此外,在第五示例性实施例中,除了所描述的字段外的字段与第一示例性实施例中的字段相同。
可以考虑将Supports_Multistream字段、multiASP_layout字段和layout/start字段的值组合的音频数据传输流的特征。如果Supports_Multistream=0而且multiASP_layout=1,则指示3D音频传输流,而且layout/start指示关于分组的起始的信息。如果Supports_Multistream=1,则指示多流,而且根据layout/start建立通道和采样的数量。
第六示例性实施例
根据第六示例性实施例,建议与第四示例性实施例类似地改变常规的音频采样分组格式。
参照下面的表12,常规的音频采样分组的保留区域可以用作Stream_ID和multiASP_layout。Stream_ID和multiASP_layout执行与第四示例性实施例中的Stream_ID和multiASP_layout相同的功能。由layout字段指示的信息根据multiASP_layout的比特信息而不同。
由于利用2比特表示Stream_ID,因此如果多流音频被提供,则可以写入4个流编号。彼此不同的比特的组合对应于彼此不同的内容的视图。
如果多流音频的一个视图具有8个或更少通道的音频信号,则在一个音频采样分组中将不会发现Stream_ID大于1且multiASP_layout是1。
表12修改的音频采样分组首标

表12-1Stream_ID的描述
Stream_ID描述00流101流210流311流4

上述结构在通过一个数据采样分组显示多流音频和3D音频二者的信息时具有实现兼容性的效果。具体而言,相比于第四示例性实施例,更多数量 的多流可以被识别。在第六示例性实施例中,除了描述的字段外的字段与第一示例性实施例中的字段相同。
表13示出将Stream_ID字段、multiASP_layout字段和layout/start字段的值组合的音频数据传输流的特征。如果multiASP_layout=1,则指示3D音频传输流,而且layout/start指示关于分组的起始的信息。如果Stream_ID=01~11,则指示多流,而且根据layout/start建立通道和采样的数量。
表13根据示例性实施例的与提出的特征有关的能力

第七示例性实施例
根据第七示例性实施例,使用在第一示例性实施例中新定义的3D音频采样分组来发送3D音频采样分组和多流音频采样分组。
第七示例性实施例类似于第一实施方式,并且还包括指示多流音频是否 被发送的ext_layout字段的特征。如果ext_layout=0,则该字段指示多流音频被发送。如果ext_layout=1,则该字段指示3D音频被发送。
除了sample_start字段、sample_present.spX字段和sample_flat.spX字段的额外字段与第一个示例性实施例中的字段相同,并且将不会在下面进一步描述。表14指示根据第七示例性实施例的音频采样分组结构。
表14-扩展的音频采样分组(24个通道,频率=96kHz)
N/通道1,2N/通道9,10N/通道17,18N+1/通道1,2N/通道3,4N/通道11,12N/通道19,20N+1/通道3,4N/通道5,6N/通道13,14N/通道21,22N+1/通道5,6N/通道7,8N/通道15,16N/通道23,24N+1/通道7,8

表14-1-扩展的音频采样分组的例子

表15指示根据ext_layout的字段值的分组主体结构。参照表15,关于多 流的例子,与一个视图相对应的音频信号可以包括2个通道,并且因此一个分组可以包括与4个视图相对应的音频信号。此外,关于3D音频信号,可以表示关于多个通道的音频信号。上述各个示例性实施例描述了具有32个通道的音频信号。然而,示例性实施例不限于具有32个通道的音频信号,而且可以根据其它示例性实施方式创建具有多于或少于32个通道的音频信号。
表15EASP打包

在上述示例性实施例中,多流音频信号可以被包括在与垂直同步消隐间隔中放置有每个视图的图像数据的区域相对应的区域中并且被发送。图7示出了上面描述的传输流格式。参照图7,音频信号对应于与图像信号相对应的每个视图的左侧区域。
1-2.3D一比特音频采样分组
第一示例性实施例
根据第一示例性实施例,使用新定义的3D一比特音频采样分组来发送一个比特音频格式的3D音频。如上所述,根据示例性实施例的3D音频的定 义使得扬声器可以放置在3D空间中的任何位置。
3D一比特音频流包括32个或更多个音频通道,其在数据岛时段通过连续分组发送。分组首标具有sample_start和sample_present比特,用于指示分组在一比特音频采样内的位置。
表16-一比特3D采样分组首标

sample_start:[1比特]指示:如果sample_start=1,则当前分组是3D一比特音频采样的第一个分组。sample_start与上面在3D音频分组中描述的sample_start相同,因此将不作进一步说明。
samples_present.spX:[4个字段,每个字段1比特]指示子分组X是否包括音频采样。四个sample_present比特可以被包括在3D一比特音频采样分组首标中,并且每个sample_present比特为每个子分组而创建。如果子分组包括音频采样,则相应的比特被建立。sample_present.spX与上面描述的相同。
samples_invalid.spX:[4个字段,每个字段1比特]指示子分组X是否是指无效采样。如果sample_invalid=1,则子分组X的采样无效。0指示子分组X的采样有效。只有在sample_present.spX被建立的情况下,上述比特才有效。如果没有发现可以在源处使用的可用音频数据,则4个sample_invalid.spX比特被建立。如果sample_invalid.spX被建立,则子分组X是指连续的采样时段。然而,不包括任何可用的数据。
在3D一比特音频中,采样频率信息被包括在音频信息帧中并且被发送(请参见HDMI1.4b第8.2.2节)。
3D一比特音频采样分组的采样分组包括如表16所示的一比特音频采样分组首标、和四个子分组。每个子分组可以包括用于最多四个音频通道的一比特音频比特。
在发送9到32个音频通道的3D一比特音频采样时,可以使用相邻的3D一比特音频采样分组。用于3D一比特音频采样分组的sample_present比特的可用组合可以通过分配允许的通道来确定。不同于3D音频采样分组,3D一比特音频采样分组没有B0~B3字段,因为3D一比特音频采样分组不符合IEC60958块格式。
各种替代方案
同时,关于3D音频采样分组的各种示例性实施例,可以分别定义相应的3D一比特音频采样分组。除了上述sample_invalid.spX字段不同外,3D一比特音频采样分组可以被定义为与3D音频采样分组相同,而且只有B0~B3字段被从3D音频采样分组中排除。其他解释与上面的描述相同,因此将不再进一步描述。
1-3.多流音频采样分组
在下面,将说明新建议的多流音频采样分组结构。将描述第一示例性实施例,并且基于与第一示例性实施例的不同来说明其它各种可替换的示例性实施例。
第一示例性实施例
根据第一示例性实施例,使用多流音频采样分组来发送L-PEM和IEC 61937压缩音频格式的多个音频流。包括多流音频采样中的每个音频流具有两个或更多个音频通道。通过使用分组首标的stream_present比特来确定建立子分组。表17表示多流音频采样分组的首标结构。
表17-多流音频采样分组首标


stream_present.spX:[4个字段,每个字段1比特]指示子分组X是否包括流X的音频采样。四个stream_present比特在多流音频采样分组首标中创建,并且每个stream_present比特为相应的子分组而创建。stream_present比特指示相应的子分组是否包含音频流。由于stream_present.spX基本上执行与3D音频采样分组中的sample_present.spX相同的功能,因此将不对这个功能的描述进行说明。
stream_flat.spX:[4个字段,每个字段1比特]指示子分组X是否是指流X的扁平线采样。只有在stream_present.spX被建立的情况下stream_flat.spX才是有效的。如果在源处没有发现可用的音频数据,则4个stream_flat.spX比特被建立。当采样率改变时或当存在临时流中断时,则执行stream_flat.spX比特的建立。如果stream_flat.spX比特被建立,则子分组X继续指示采样时段,但是,不包括可用的音频数据。由于stream_flat.spX基本上与3D音频采样分组中的stream_flat.spX相同,因此将不对这个功能进行说明。
如果子分组X包括构成IEC 60958的192个帧中的第一帧,则B.X=1。否则,B.X=0。
多流音频采样分组使用表17所示的分组首标、和四个子分组。每个子分组具有相同的结构。
如果支持多视图视频流传输(例如,在每个视图中具有不同音频的双视图或四视图游戏),则HDMI允许源可以同时传输四个音频流。
包括在多流音频采样中的每个音频流涉及一个单一视图,并且包括两个音频通道。每个多流音频采样分组的子分组具有根据由0或1定义的IEC 60958或IEC 61937块配置的帧。三个子分组布局被定义。下面的表18至表20示出了对于2、3和4个音频流的多流音频分组布局的例子。
表18对于2个音频流的多流音频采样分组布局的例子

表19-对于3个音频流的多流音频采样分组布局的例子

表20-对于4个音频流的多流音频采样分组布局的例子


图8示出了根据第一示例性实施例的音频采样分组的传输流。
参照图8,关于针对双视图的2通道音频采样分组,在水平消隐间隔中发送包括两个采样的一个采样分组。关于针对四视图的2通道音频采样分组,在水平消隐间隔中发送包括四个采样的一个采样分组。尽管该图描述了发送最多2通道的多流音频采样,但是根据其他示例性实施例可以通过一个多流音频采样分组发送具有多个通道(其包括两个以上通道)的多流音频采样。简言之,与每个视图相对应的音频可以通过相应的子分组发送;此外,可以通过一个或多个连续的多流音频采样分组发送具有多个通道(其包括两个以上通道)的多流音频采样数据。
根据示例性实施例,多流音频采样分组发送四个立体声音频采样。每个采样对应于单独的音频流。例如,如果HDMI源发送两个分开的音频流,则可以在发送流0的音频采样时使用子分组0,而且可以在发送流1的音频采样时使用子分组1。
第二示例性实施例
根据第二示例性实施例,常规的音频采样分组格式被改变和使用,并且同时还提供关于多流音频是否被提供的信息。
参照下面的表21,常规的音频采样分组的保留区域可以用作 Stream_Identifier(Stream_ID)。如果多流音频被提供,则Stream_ID指示流编号。根据示例性实施例,Stream_ID可以使用两个比特;00指示第一流,01指示第二流,依此类推。每个流对应彼此不同的内容的视图。另外,以上描述仅是示例性的,而且与比特匹配的分组可以是不同的。
在HDMI1.4b中,layout(布局)指示关于采样和通道的数目的信息。例如,一个音频采样分组可以包括2通道音频的四个采样和8通道音频的一个采样。
表21-修改的音频采样分组首标

表21-1-Stream_Identifier的描述
Stream_Identifer描述00流101流210流311流4

上述结构实现了使用常规的保留区域以简单的方式提供多流的ID的优势。
图9和图10示出了根据第二示例性实施例的多流音频采样分组的传输 流。
参照图9,关于针对双视图的2通道音频采样分组,在水平消隐间隔中发送包括相同内容的采样数据的四个单元的一个采样分组。换句话说,一个采样分组包括关于一个视图的音频信号。关于针对四视图的2通道音频采样分组,在水平消隐间隔中发送针对四个视图的四个采样分组。另外,可以连续发送任一视图的采样分组,或者可以以与另一视图交替的方式发送采样分组。图9示出了2通道音频采样分组的例子;然而,也可以应用具有多个通道(其包括2个以上通道)的音频采样分组。此外,如图所示,可以在每一个视图中包括并发送相同的确定数目的采样数据;然而,也可以发送不同数目的采样数据。
图10示出了在水平消隐间隔中发送针对双视图的8通道音频采样分组,其包括指示8通道和两个采样分组的采样数据。利用一个采样分组,可以完成关于一个视图的采样数据的发送。可以连续发送,或者可以以与另一视图的采样分组交替的方式发送,每个视图的采样分组。关于针对四视图的8通道音频采样分组,在水平消隐间隔中发送包括针对一种类型的内容的采样数据的一个采样分组;然而,应该发送四个视图的每个采样分组。
类似于第二示例性实施例,如果Stream_Identifier被使用,并且如果音频时钟再生分组包括上述信息,则可以更有效地实现同步视频和音频的操作。下面的表22提供了根据第二示例性实施例的修改的音频时钟再生分组的结构。
表22音频时钟再生分组首标和子分组
表22-1音频时钟再生分组首标

表22-2音频时钟再生子分组


表22-3Stream_Identifier的描述
Stream_Identifer描述00流101流210流311流4

参照表22,通过在音频时钟再生分组的保留区域中包括关于多流索引的信息,可以有效地实现多视图系统的视频和音频的同步。具体地,关于不同时显示多视图的系统,上述分组结构可以是有用的。
第三示例性实施例
第三示例性实施例类似于第四实施例的3D音频采样分组。传统的音频采样分组格式被改变和使用,同时具有提供多流识别信息的功能。
参照下面的表23,常规的音频采样分组的保留区域可以用作Stream_ID和multiASP_layout。Stream_ID和multiASP_layout与第四示例性实施例的3D音频采样分组中描述的Stream_ID和multiASP_layout相同。
表23修改的音频采样分组首标


表23-1Stream_Identifier的描述
Stream_ID描述0流11流2

上述结构在通过一个数据采样分组显示多流音频和3D音频二者的信息时具有实现兼容性的优点。
根据Stream_ID字段、multiASP_layout字段和layout/start字段的值的结合的音频数据传输流的特征与上面相对于第四示例性实施例的3D音频采样分组描述的特征相同。
第四示例性实施例
根据第四示例性实施例,常规的音频采样分组格式可以被改变和使用。第四示例性实施例对应于第五示例性实施例的3D音频采样分组。
参照下面的表24,常规的音频采样分组的保留区域可以用作Supports_Multistream和multiASP_layout。Supports_Multistream和multiASP_layout与在第五示例性实施例的3D音频采样分组中描述的Supports_Multistream和multiASP_layout相同。
表24修改的音频采样分组首标


上述结构在通过一个数据采样分组显示多流音频和3D音频二者的信息时具有实现兼容性的优点。此外,上述结构还实现另一个优点:要被支持的每个特征可以被写入一个音频采样分组中。
音频数据传输流的特征可以根据Supports_Multistream字段、multiASP_layout字段和layout/start字段的值的组合来实现。每个字段的值与上面描述的3D音频采样分组的表13中的字段的值相同。
同时,在上述示例性实施例中,多流音频信号可以被包括在与垂直同步消隐间隔中放置有每个视图的图像数据的区域相对应的区域中并且被发送。图7的描述提供了这个特征的详细描述。
第五示例性实施例
第五示例性实施例提出了与第三示例性实施例类似的常规的音频采样分组格式的修改方法。
参照下面的表25,常规的音频采样分组的保留区域可以用作Stream_ID和multiASP_layout。Stream_ID和multiASP_layout分别执行与第三示例性实施例中的Stream_ID和multiASP_layout相同的功能。
由于利用2比特表示Stream_ID,因此如果多流音频被提供,则可以指示4个流编号。比特的每个不同组合对应于彼此不同的内容的视图。
如果多流音频的一个视图具有8个或更少通道的音频信号,则在一个音频采样分组中将不会发现Stream_ID大于1且multiASP_layout是1。
表25修改的音频采样分组首标

表25-1Stream_Identifer的描述
Stream_Identifer描述00流101流210流311流4

上述结构在通过一个数据采样分组显示多流音频和3D音频二者的信息时具有实现兼容性的优点。具体而言,相比于第三示例性实施例,更多数量的多流可以被区分。
表26示出将Stream_ID字段、multiASP_layout字段和layout/start字段的值组合的音频数据传输流的特征。如果multiASP_layout=1,则指示3D音频传输流,而且layout/start指示关于分组的起始的信息。如果Stream_ID=01~11,则指示多流,而且根据layout/start建立通道和采样的数量。
表26根据示例性实施例的与提出的特征有关的能力

第六示例性实施例
第六示例性实施例提出将Stream_ID添加到根据第一示例性实施例的音频采样分组。Stream_ID与上面描述的相同,而且其它字段与第一示例性实施例中描述的字段相同。表27示出了根据第六示例性实施例的音频采样分组首标。然而,虽然在表中利用4比特建立Stream_ID,但是也可以利用1至3比特、或者5比特或更多比特来建立Stream_ID。分组类型指示新定义的分组类型。
为了区分每个流中的音频,使用Stream_ID。因此,相比于第一示例性实施例,一个多流音频采样分组包括用于一个流的音频采样数据。
表27扩展音频采样分组


第七示例性实施例
第七示例性实施例提出了在第1.1节的第一示例性实施例中新定义的3D音频采样分组和使用3D音频采样分组的多流音频采样分组。
第七示例性实施例类似于第一实施例,并且还包括指示多流音频是否被提供的ext_layout字段。因此,如果ext_layout=0,则该字段指示多流音频被发送。如果ext_layout=1,则该字段指示3D音频被发送。
包括sample_start字段、sample_present.spX字段和sample_flat.spX字段的其他字段与第一个示例性实施例中所描述的字段相同,并且将不会进一步描述。表28示出根据第七示例性实施例的音频采样分组结构。
表28扩展的音频采样分组(2通道2流频率=96kHz)

表28-1扩展的音频采样分组的例子

表29指示根据ext_layout的字段值的分组主体结构。如表所示,在多流中,与一个视图相对应的音频信号可以包括2个通道,并且因此一个分组可以包括用于4个视图的音频信号。可替换地,在3D音频信号中,可以指示多个通道的音频信号。即使在本说明书中描述的各个示例性实施例描述了多达32个通道的3D音频,但是示例性实施例不限于此。例如,示例性实施方式可以被应用于具有32个或更多个通道的音频信号。
表29EASP打包


表30示出有效的Sample_Present比特。
表30用于多音频流发送的有效的Sample_Present比特配置
SP0SP1SP2SP3描述0000没有包含音频采样的子分组。1000只有子分组0包含流0的音频采样1100子分组0和1包含流0和1的音频采样1110子分组0、1和2包含流0、1和2的音频采样1111所有子分组都包含流0、1、2和3的音频采样

图11示出了上述第七示例性实施例中的多流音频采样分组的传输流。
参照图11,关于针对双视图的2通道音频采样分组,可以在水平消隐间隔中发送包括两个视图的采样的一个采样分组。关于针对四视图的2通道音频采样分组,在水平消隐间隔中发送包括四个采样的一个采样分组。换句话说,一个采样分组包括并发送四个视图的采样。尽管图11示出了2通道音频采样分组的例子,但是根据其他示例性实施例可以应用具有多个通道(其包括两个以上通道)的音频采样分组。
如上相对于以上各示例性实施例所述,多流音频信号可以被包括在与垂直同步消隐间隔中放置有每个视图的图像数据的区域相对应的区域中并且被发送。图11示出在这种情况下的传输流格式。在图11中,可以包括与每个视图中的图像信号的左侧区域相对应的音频信号。
1-4.多流一比特音频分组
第一示例性实施例
根据第一示例性实施例,多流一比特音频的新的分组被定义。这对应于3D音频采样分组。
如果发送多流一比特音频,则每个子分组可以包括用于0、1、2或更多音频通道的一比特音频比特。多流一比特音频采样包括四个stream_present比特,每个比特为相应的子分组而创建。
如果子分组包括每个流中的音频采样,则相应的比特可以被建立。如果没有发现可以使用的可用音频数据,则4个stream_invalid.spX比特可以被建立。如果stream_invalid.spX比特被建立,则子分组X继续指示采样时段,但是,不包括任何可用的数据。
表31多流一比特音频分组首标

stream_present.spX:[4个字段,每个字段1比特]指示子分组X是否包括流X的音频采样。stream_present.spX基本上执行与上面相对于以上3D音频采样分组描述的sample_present.spX相同的功能,并因而将不作进一步说明。
stream_invalid.spX:[4个字段,每个字段1比特]指示子分组X是否是指流X的无效采样。如果包含在子分组X中的采样无效,则stream_invalid=1。否则,stream_invalid=0。在相关的stream_present.spX被建立的情况下,比特有效。stream_present.spX基本上执行与上面相对于以上3D音频采样分组描述的sample_present.spX相同的功能,并因而将不作进一步说明。
关于多流一比特音频,根据示例性实施例,采样频率信息被包括在音频信息帧中并且被发送(请参见HDMI1.4b第8.2.2节)。
多流一比特音频采样分组使用与表31中所示的一比特音频采样子分组相同的四个子分组。因为多流一比特音频采样分组不符合IEC 60958块格式,所以一比特多流音频采样分组不具有B0至B3字段,这不同于多流音频采样分组。
各种替代方案
关于多流音频采样分组的各种上述示例性实施例,可以分别定义相应的一比特多流音频采样分组。换句话说,除了如上所述的samples_invalid.spX之外,一比特多流音频采样分组还可以被定义多流音频采样分组,并且可以使用来自多流音频采样分组的B0至B3字段。
2-1.用于3D音频/元数据分组的信息帧
第一示例性实施例
如上所述,在第一示例性实施例中,可以通过利用新定义的音频元数据分组,而不是信息帧,来发送与3D音频有关的附加信息。每当发送3D音频流时,源对于至少两个视频场发送一次音频元数据。
音频元数据可以指示各种特性,诸如通道的数量、音频通道分配标准类型(ACAT)和3D音频流的通道/扬声器的分配。下表示出新定义的音频元数据分组首标。
表32音频元数据分组首标

表33音频元数据分组内容

上述分组中的每个字段的定义如下。
3D_CC:[5比特]指示发送的3D音频的通道计数。如果音频信息帧中的音频通道计数(CC0,...,CC2)与音频元数据分组中的3D音频通道计数(3D_CCO,...,3D_CC4)不一致,则音频信息帧的通道计数被忽略。表34示出根据3D_CC的值的音频通道。
ACAT:[4比特]指示由源提供的音频通道分配标准类型。表35示出了ACAT字段值。表36说明:如果ACAT被建立为0x01(10.2通道),则分配扬声器位置。类似地,表37和表38包括用于22.2通道和30.2通道的信息。
3D_CA:[8比特]指示用于3D音频的通道/扬声器的分配。进一步的解释在表36至表38中示出。对于IEC61937压缩音频流,3D_CA字段是无效的。
表343D_CC字段


表35音频通道分配标准类型字段

表36用于10.2通道(ACAT=0x01)的3D_CA字段


表37用于22.2通道(ACAT=0x02)的3D_CA字段


表38用于30.2通道(ACAT=0x03)的3D_CA字段





每当发送有效3D音频流时,对于两个视频场,可以至少发送一次正确的音频元数据分组。如果新的3D音频流开始,或者在3D音频流中包括可以由音频元数据分组和音频信息帧指示的变化,则可以不迟于最初受影响的非静音(non-silent)音频采样之后的一个视频帧地发送改变的且正确的音频元数据分组。改变的且正确的音频元数据分组的发送可以恰好在发送最初影响的音频采样之前发生。音频元数据可以在任何时间(包括数据岛间隔内的水平消隐间隔或垂直消隐间隔)发送。如果3D音频通过流传输来处理,则接收器忽略包括在音频信息帧中的CC和CA字段,并且参照包括在音频元数据中的3D_CC和3D_CA。
然而,如果发送上述音频元数据,则传统的音频信息帧仍然可以被利用。换句话说,如果音频元数据被新用于分配3D音频的通道,则音频信息帧被用于分配2D音频的通道。
另外,虽然上述示例性实施例描述了ACAT的10.2通道、22.2通道和30.2通道,但是示例性实施例的技术领域并不限于此,并且可以应用于,例如,小于10.2通道、超过30.2通道、以及10.2至30.2通道。
第二示例性实施例
第二示例性实施例与第一示例性实施例的不同之处在于:根据第二示例性实施例可以考虑HDMI1.4b中定义的音频信息帧的更改。表39示出在这种情况下的音频信息帧。CC字段指示发送的音频的通道计数,而且CA字段指示通道/扬声器分配的信息。
通常,利用三比特表示CC字段。然而,第二示例性实施例使用保留区域的两个附加比特。因此,通道计数信息可以通过利用5个比特:CC0、CC1、CC2、CC3、CC4来指示。
此外,通道/扬声器分配的信息被添加到CEA861-D的保留区域,如上面 在表20中所示。相比于第一示例性实施例,第二示例性实施例不具有ACAT字段。
表39修改的音频信息帧
表39-1修改的音频信息帧分组首标

表39-2音频信息帧分组内容


第三示例性实施例
第三示例性实施例扩展了第二示例性实施例,并改变HDMI1.4b中定义的音频信息帧。表40示出根据第三示例性实施例的音频信息帧结构。类似于第二示例性实施例,CC字段指示发送的音频的通道计数,而且CA字段指示通道/扬声器分配的信息。
第三示例性实施例提供了CA字段的进一步扩展,同时基本上类似于第二示例性实施例。保留区域的一个比特被建立为channel_extension比特。如果channel_extension=0,则CEA861-D中定义的CC#和CA#字段被使用。换句话说,第三示例性实施例支持2D音频模式。如果channel_extension=1,则PB2[7:6]被用作CC的扩展比特(CC4,CC3),而且PB6的保留区域被用作CA_ext字段。3D音频的扩展比特被使用。
在这种情况下,类似于第二示例性实施例,常规的CC字段利用三个比特表示。然而,第三示例性实施例还使用保留区域的两个比特。因此,通道计数信息可以通过利用5个比特:CC0、CC1、CC2、CC3、CC4,来指示。
另外,PB6字段可以被添加并被用于CA比特(PB4)。在表20中所示的CEA861-D的保留区域(或者,表28中所示的CEA861-E),可以包括用于具有10.2或更多个通道的音频的通道/扬声器的信息的定义。可以在每个标准中定义额外的表。结果,CA字段扩展到16比特,并且因此,可以发送多通道音频。
此外,新的8比特字段可以通过代替传统的CA字段来被定义并被使用,这不同于以上描述。例如,新的CA比特可以使用PB6字段或PB7字段来定义。
表40修改的音频信息帧2
表40-1音频信息帧分组首标

表40-2音频信息帧分组内容


第四示例性实施例
第四示例性实施例结合了第二示例性实施例和第三示例性实施例。根据第四示例性实施例,传统的音频信息帧包括3D_CH_present字段、PB4的CA字段、和PB6的3D_CC字段。
3D_CH_present字段执行与上面在第三示例性实施例中描述的channel_extension相同的功能。因此,如果3D_CH_present=0,则在CEA861-D中定义的CC#和CA#字段仍然被利用。换句话说,第四示例性实施例支持2D音频模式。另外,如果3D_CH_present=1,则PB6[4:0]被用作CC的扩充比特(CC4,CC3,CC2,CC1,CC0),而且PB4的保留区域被用作CA字段,这类似于第二示例性实施例。3D音频的扩展比特被使用。类似于第二和第三示例性实施例,ACAT字段没有被定义。没有特别描述的其它特征与相对于第一至第三示例性实施例描述的特征相同。
表41修改的音频信息帧3
表41-1修改的音频信息帧分组首标

表41-2修改的音频信息帧分组内容


2-2.用于多流音频的信息帧
关于多流音频,可以不定义新的元数据分组,而且可以使用HDMI1.4b中定义的信息帧。如果使用多流音频采样分组发送多个有效音频流,则对于两个视频场,正确的音频信息帧可以被发送至少一次。音频信息帧可以在描述每个有效音频流的音频特征时使用。
如果新的音频数据流开始而且如果在音频流中包括可以由多个新的音频 流或音频信息帧来实现的变化,则可以不迟于最初受影响的非静音的音频采样之后的一个视频场,发送改变的和正确的音频信息帧。流的发送可以恰好在发送最初影响的音频采样之前实现。对于一比特音频流,音频信息帧可以在最初受影响的采样之前发送。
信息帧的改变
与上述示例性实施例相比,关于Stream_ID的利用(例如,3D音频采样分组的第四和第六示例性实施例,以及多流音频采样分组的第二、第三、第五和第六示例性实施例),Stream_ID可以被包括在音频信息帧中,例如,如在下面的表42所示。
参照表42,Stream_ID指示当前音频信息帧的流ID,而且Stream_Count指示要发送的音频流的总数目。根据示例性实施例,代替不使用流标识符,采样可以被加载并在由多流音频采样分组主体构成的四个子分组上发送,其不改变信息帧。
表42修改的信息帧
表42-1音频信息帧分组首标

表42-2音频信息帧分组内容


3-1.用于3D音频的EDID
通过利用下列操作中的至少一个:操作1),改变传统的短音频描述符和扬声器分配数据块,2)在保留区域中定义新的数据块以用于扩展的标记代码上的音频相关的块,以及3)在保留区域中定义一个新的数据块以用于扩展的标记代码上的HDMI音频数据块,可以将3D音频的音频特征和分配扬声器的信息包括在EDID中。
例如,在CEA-861-F(D或E)中描述的EDID数据块可以被用于指示两个接收器音频特征和扬声器分配支持。接收器音频特征和扬声器分配支持由位于CEA扩展的数据块集合的一系列短音频描述符来指示。这样的数据包括由接收器支持的音频编码列表以及与编码相关的参数,诸如通道号,以支 持格式。扬声器分配描述符可以被包括在数据块集合中,而且由支持用于2D音频或多通道(达到8个通道)1比特音频的多通道(达到8个通道)L-PCM的接收器请求。
第一示例性实施例
如果接收器支持发送多流音频和/或3D音频,则具有扩展的标记代码18的HDMI音频数据块可以被用于指示3D音频特征、3D扬声器分配信息和多流音频特征。
如果接收器支持发送3D音频,则HDMI音频数据块包括具有四个字节的至少一个HDMI 3D音频描述符(HDMI_3D_AD)。此外,HDMI音频数据块可以包括跟在最后的HDMI 3D音频描述符之后的一个HDMI 3D扬声器分配描述符(HDMI_3D_SAD)。
如果接收器支持发送多流音频同时不支持发送3D音频,则HDMI音频数据块可以包括跟在3个字节之后的至少一个CEA短音频描述符(CEA_SAD)。CEA短音频描述符在CEA-861-F(D或E)中指示。
如果接收器支持发送多流音频和3D音频,则HDMI音频数据块可以包括跟在HDMI 3D扬声器分配描述符之后的至少一个CEA短音频描述符。表43提供了根据示例性实施例的附加细节。
上面的HDMI 3D音频描述符指示支持在CEA-861-F(D或E)中定义的音频编码。HDMI设备可以支持根据TTA(10.2通道)、SMPTE2036-2(22.2通道)或IEC62574(30.2通道)的3D音频格式。表45至表49提供进一步的解释。这些表按照CEA-861-F(D或E)的表24和表26中所示的音频格式码进行分类。
如上所述,HDMI 3D扬声器分配描述符可以被包括在HDMI音频数据块中,并由支持3D音频的接收器请求。HDMI 3D扬声器分配描述符的结构在表50中示出。接收器通过表达扬声器,例如,一对扬声器,来指示音频能力,并建立相应的标记。HDMI 3D扬声器分配描述符可以具有四比特的ACAT字段,其指示音频通道分配标准类型。表50至表52提供进一步的细节。此外,CEA短音频描述符可以被包括在HDMI音频数据块中,并且被支持发送多流音频的接收器请求。上面的描述符描述了每个音频流的音频特征。最大通道计数可以被限制为每个音频流中2个通道;然而,示例性实施例不限于此, 并且根据示例性实施例,通道计数可以多于每个音频流中2个通道。
表43HDMI音频数据块

*随后数据块有效负载的长度(以字节为单位):2+4*X+4+3*Y
**3+4*X+1
表43中所示的HDMI音频数据块的每个字段的描述如下。
NUM_HDMI_3D_AD[3比特]指示HDMI 3D音频描述符的数量。
NUM_CEA_SAD[3比特]指示CEA短音频描述符的数量。
Max_Stream_Count-1[2比特]指示:数目=传输数据流的数目-1。表44提供了附加的细节。
HDMI_3D_AD指示HDMI 3D音频描述符。
HDMI_3D_SAD指示HDMI 3D扬声器分配描述符。
CEA_SAD CEA指示CEA短音频描述符。
表44Max_Stream_Count-1字段
Max_Stream_Count-1描述00不支持多流音频012个音频流103个音频流114个音频流

表45用于音频格式码=1(LPCM)的HDMI 3D音频描述符

表46用于音频格式码2到8的HDMI 3D音频描述符

表47用于音频格式码9到13的HDMI 3D音频描述符

表48用于音频格式码14(WWA Pro)的HDMI 3D音频描述符

表49用于音频格式码15(扩展)的HDMI 3D音频描述符

表50用于10.2通道(TTA标准)的HDMI 3D扬声器分配描述符

上表中的粗体比特指示已经按照10.2通道分配的扬声器。
表51用于22.2通道(SMPTE2036-2)的HDMI 3D扬声器分配描述符

上表中的粗体比特指示已经按照22.2通道分配的扬声器。
表52用于30.2通道(IEC62574/Ed.1)的HDMI 3D扬声器分配描述符

上表中的粗体比特指示已经按照30.2通道分配的扬声器。
虽然第一示例性实施例利用三个字节描述多通道3D音频扬声器的扬声器分配,但是这仅是示例性的。具有30.2或更多个通道的3D音频数据可能需要比上面相对于该示例性实施例描述的信息更多的扬声器分配信息。在这种情况下,3D扬声器分配描述符可以使用四个以上字节来指示扬声器分配。
表53音频通道分配类型(ACAT)字段

根据制造商的需要,ACAT字段中的保留比特可以被分配并且被用于各种通道类型,例如,将被标准化的杜比(Dolby)、USC或ITU-R格式。
第二示例性实施例
第二示例性实施例与第一示例性实施例的不同之处在于:第二示例性实施例改变了音频数据块。具体地,CEA短音频描述符的保留区域可以用于扩展和指示通道的最大数目。例如,参照下面的表54,通道的最大数目可以通过利用字节1[7]和字节2[7]来扩展。通过此扩展,可以指示3D音频。CEA短音频描述符可以根据音频格式而具有不同的字段区域。
表54CEA短音频描述符表54-1用于音频码=1(LPCM)的CEA短音频描述符

表54-2用于音频码2到8的CEA短音频描述符

表54-3用于音频码9到15的CEA短音频描述符


与上述第二示例性实施例无关,ACAT可以通过改变扬声器分配数据块来建立。ACAT可以使用扬声器分配数据块有效载荷的保留区域中的字节3[7:4]来识别,而且每种类型中的扬声器分配数据块可以被定义为新的表。ACAT字段的位置可以在字节2[7:3]到字节3[7:0]的范围内不同地定义。
参照下面的表55,ACAT=0001指示TTA标准的10.2通道,而且ACAT=0010指示22.2通道。
表55扬声器分配数据块有效载荷(参照CEA861-E)

表55-1ACAT字段
ACAT描述0000参照CEA861-D(E,F)0001参照10.2通道(TTA标准)0010参照22.2通道(SMPTE2036-2)0011~1111保留0011~1111保留

表55-2扬声器分配数据块有效载荷(用于22.2通道)

表55-3扬声器分配数据块有效载荷(用于10.2通道)

扬声器分配数据块可以根据制造商来不同地定义。制造商可以考虑使用公共扬声器分配来提高兼容性。下面的表56提出了具有22.2通道的3D音频的SMPTE2036-2标准。粗体比特指的是若干厂商的公共扬声器分配。
表56扬声器分配数据块有效载荷2(参照CEA861-E)

表56-1ACAT字段
ACAT描述0000参照CEA861-D(E,F)0001参照10.2通道(TTA标准)0010参照22.2通道(SMPTE2036-2)0011~1111保留

表56-2扬声器分配数据块有效载荷(用于22.2通道)

表56-3扬声器分配数据块有效载荷(用于10.2通道)

在扬声器分配数据块有效负载的上述示例性实施例中,每种类型的分类,例如,10.2通道(TTA)、22.2通道(SMPTE2036-2)和13.1通道(杜比),可以通过参照源中扬声器分配数据有效负载中设置的比特的位置和排序来确定,而无需单独定义ACAT字段。确定类型的分类的操作可以执行,因为通 道的数目可以利用改变的音频数据块找到。
第三示例性实施例
第三示例性实施例没有定义HDMI音频数据块,而且在EDID中新定义了扩展的标记代码的扩展扬声器分配数据块类型。新的数据块的大小最大可以是32个字节。表57示出了4个字节的例子。ACAT的大小可以根据用户或制造商的需要而改变和定义。
ACAT通过利用保留区域(字节3[7:4])来实现,而且每个类型的扬声器分配数据块可以被定义。有效载荷可以以与上述示例性实施例相同的方式来形成。另外,ACAT字段可以被放置在不同于以上保留区域的区域中。
根据制造商,ACAT字段中的保留比特可以被分配并且被用于各种通道类型,例如,将被标准化的杜比、USC或ITU-R格式。
表57修改的扬声器分配数据块

表57-1ACAT描述
ACAT描述0000参照CEA861-D(E,F)0001参照10.2通道(TTA标准)0010参照22.2通道(SMPTE2036-2)0011~1111保留

表57-2扩展的扬声器分配数据块有效载荷(用于10.2通道)

表57-3扩展的扬声器分配数据块有效载荷(用于22.2通道)

表57-4扩展的扬声器分配数据块有效载荷(用于30.2通道)

第四示例性实施例
第四示例性实施例类似于第三实施例,但是区别之处在于,根据第四示例性实施例,每个扬声器分配标准类型(例如,10.2通道(TTA)、22.2通道(NHK)、13.1通道(杜比)中)的数据块被定义,而且每种类型中的数据块被添加到扩展的标记代码。
例如,数据块标记代码19指示用于TTA 10.2通道的扬声器分配数据块,数据块标记代码20指示用于NHK 22.2通道的扬声器分配数据块,而且数据块标记代码21指示用于杜比13.1通道的扬声器分配数据块。
表58修改的扬声器分配数据块

表58-1扬声器分配数据块有效载荷(用于多通道)

第五示例性实施例
第五示例性实施例定义了扩展的音频数据块。扩展的音频数据块对应于扩展的标记代码。此外,扩展的音频数据块包括至少一个扩展CEA短音频描述符。每个扩展CEA短音频描述符包括关于通道的数量的信息。每个字段的大小和格式可以与音频数据块中的短音频描述符的大小和格式相同,但是, 大小和格式也可以不同地定义。
表59扩展的音频数据块

表59-1扩展的音频数据块


表59-2扩展的CEA段音频描述符

如上表所述,扩展的CEA短音频描述符可以包括未压缩的音频格式码。未压缩的音频格式码可以被定义如下。
表60未压缩的音频格式码

扩展的扬声器分配数据块可以被定义为包括扩展的标记代码的值。扩展的扬声器分配数据块可以包括如下表所示的ACAT字段。保留区域可以被用于扩展。此外,根据制造商,保留比特可以被分配并且被用于各种通道类型,例如,将被标准化的杜比、USC或ITU-R格式。
表61扩展的扬声器分配数据块


表61-1扩展的扬声器分配数据块


表61-2ACAT描述

在这个示例性实施例中,扩展的扬声器分配数据块的有效载荷在下表中示出。阴影区域被用于为每个通道分配类型分配扬声器。
表62通道分配配兼容性




用于新的扬声器位置EDID/CEC
可以定义扬声器位置数据块以用于传送新的扬声器位置信息到到源。数据块包括每个扬声器位置的坐标值(x,y,z)和位置角度值。利用上述信息,源可以被用在各种处理操作,诸如降混或对象音频编码中。由于根据示例性实施例之一分配下表中扩展的标记代码的值,所以扬声器位置数据块可以利用上面定义的数据块来定义并使用。
表63扬声器位置数据块


扬声器位置数据块可以如下表所述那样来定义。字节[1]到字节[5]存储一个扬声器的位置信息。根据同一个示例性实施例,字节[6]到字节[30]存储其他扬声器的扬声器位置信息。字节31和字节32被定义为保留区域。
如果使用上面的示例性实施例,则一个数据块最大可以携带六个扬声器位置信息。因此,对于N个通道,可以需要共(N/6)个扬声器位置数据块。
表64扬声器位置数据块

表64-1Speaker_id(扬声器ID)字段
Speaker_id描述00000FL00001FR00010~11111

使用CEC发送扬声器位置信息
图12示出了根据示例性实施例的使用CEC发送扬声器位置信息的操作。
参照图12,如果源向接收器发送对扬声器位置的请求,则接收器利用扬声器位置信息进行响应。
3-1.用于3D音频的EDID
在扩展的标记代码中可以新定义多流音频数据块。多流音频数据块包括Max_stream_count-1字段和CEA短音频描述符区域。Max_stream_count-1指示发送流的数量。CEA短音频描述符大于1,并且可以通过CEA861-D来定义。
表65多流音频数据块

表65-1CEA数据块标记代码


根据示例性实施例,是否提供多流视频/音频可以在特定于供应商的数据块中指示。multistream_indicator(多流指示符)字段被使用。如果接收器支持多流,则multistream_indicator=1。另外,multistream_indicator字段可以在数据块的另一区域以及HDMI VSDB中定义。
表66供应商特定的数据块


如果使用超过2比特定义multistream_indicator,则可以识别各个多流。
表67特定于供应商的数据块



第二示例性实施例
第二示例性实施例使用扩展的标记代码新定义了多音频流数据块。新定义的多音频流数据块包括CEA短音频描述符区域、音频流的长度、Max_stream_count字段、和/或其它信息。每个字段可以与上面的示例性实施例中描述的字段相同,并且将不作进一步说明。
表68多音频流数据块

表68-1多音频流数据块


第三示例性实施例
同时,类似于第一示例性实施例,可以考虑利用HDMI音频数据块的另一种方法。
扩展的标记代码被新定义。类似于第一示例性实施例,标签代码18可以被用于增加扩展的HDMI音频数据块。
下表提供了扩展的HDMI音频数据块的结构。根据第三示例性实施例的扩展的HDMI音频数据块包括扩展的CEA短音频描述符(ECSAD)、扩展的扬声器分配描述符(ESAD)、和多音频流描述符(MASD)。
如果接收器设备支持3D音频功能,则ECSAD包括与Num_ECSAD字段的值的数目相同数目的描述符。如果接收器设备支持3D音频通道功能并且如果Num_ECSAD字段的值大于0,则ESAD包括一个描述符。如果接收器设备支持多流音频功能,则MASD包括与Num_MASD字段的值的数目相同数目的描述符。
Max_stream_count-1字段被定义为接收器设备能够接收的流的最大数目减去1。由于利用一个音频采样分组发送多流音频,因此每个视图中的音频流指示相同的音频特征,诸如编码类型和采样频率。
Num_MASD字段定义扩展的CEA短音频描述符的数量。可以包括多达 七个扩展的CEA短音频描述符。如果该字段为0,则指示可以不支持3D音频功能。
Num_ECSAD字段定义包含在数据块中的多流音频描述符的数量。可以包括多达四个多流音频描述符。如果该字段为0时,指示可以不支持多流音频。如果Max_stream_count-1不为0,则应该定义至少一个MASA。如果ECSAD包括使用利用四个字节定义的方法,则根据示例性实施例可以最多定义六个多流音频描述符。
表69扩展的HDMI音频数据块

X:ECSAD的数目
Y:MASD的数目
表69-1Max_Stream_Count-1字段
Max_Stream_Count-1描述00不支持多音频流012个音频流103个音频流114个音频流

上面的第三示例性实施例可以包括以下替代建议。
例如,扩展的HDMI音频数据块可以仅包括ECSAD,而且其他两个ESAD和MASD可以使用其它扩展的标记代码来定义。
利用其他扩展的标记代码定义的两个描述符可以被定义为单独的数据块或定义为彼此不同的数据块。在上表内定义PB3的字段中,Max_stream_count-1被包含在定义多流音频描述符的数据块中。
在上面的描述相比,扩展的HDMI音频数据块可以包括与3D音频相关的ECSAD和ESAD,而且MASD可以使用其它扩展的标记代码来定义。
ECSAD结构通过参照下表来描述,在下表中,ECSAD结构对应于粗体字符。
参照左下表,描述符当前可以从两种编码类型诸如LPCM和DSD中选择。另外,可以使用UAFC字段的保留区域来添加其他未压缩的音频格式。
通道的数目可以利用5个比特来分配,而且可以选择多达32个通道。
表70扩展的CEA短音频描述符
表70-1扩展的HDMI音频数据块结构


表70-2未压缩的音频格式码字段

表70-3扩展的CEA短音频描述符

此外,关于上述方法,根据示例性实施例的附加特征如下。
下表将描述符的总数扩展到4个字节。而且,从CEA861-E中定义的表参音频格式码。因此,在CEA861-E中定义的压缩和未压缩的编码类型二者 可以被分配。
当描述符数量增加时,可以被包括在数据块中的ECSAD的数目被限制为最大6个描述符。此外,上述示例性实施例可以包括4个描述符。
根据音频格式编码类型的更改,PB3和PB4的语法被定义为与CEA861-E中的表45到表49的字节2和3相同。
表71扩展的CEA短音频描述符
表71-1扩展的HDMI音频数据块结构

表71-2扩展的CEA短音频描述符


根据第三示例性实施例,描述ESAD结构。
下面表中的粗体字符指示ESAD结构。
当前,ESAD可以选择多达30.2通道的扬声器分配信息。然而,使用ACAT字段的保留区域,可以另外包括另一扬声器放置格式。
表72扩展的扬声器分配描述符
表72-1扩展的HDMI音频块结构


表72-2音频通道分配类型字段

表72-3扩展的扬声器分配描述符

下表指示ESAD。每个表的粗体字符被用来分配相应通道分配类型的扬声器。
表73扩展的扬声器分配描述符




下面说明根据第三示例性实施例的ESAD的结构。表中的粗体字符指示ESAD的结构。
按照规定使用在CEA861-E中定义的CEA短音频描述符。另外,虽然包括CEA短音频描述符中的每个字段,但是可以使用部分地改变/修改已定义的字段布置或量的新格式。当发送多流音频时,可以仅包括所述描述符。如果使用,则包括所述描述符中的至少一个。
表74多音频流描述符
表74-1扩展的HDMI音频数据块结构


表74-2多音频流描述符

下表新定义多流音频描述符的结构。代替按照规定使用CEA短音频描述符,可以使用新的描述符。
多流音频中的通道数目被限制为2。因此,在这些描述符中,不必要的通道计数字段被删除,而且流的最大数目-1被定义为2比特。扩展的HDMI音频数据块的PB3中规定的Max_stream_count-1被定义为每个描述符中的Max_stream_count-1的最大值。
下面的每个表指示每个音频格式码中的描述符。
表75多音频流描述符
表75-1用于音频码1(LPCM)的多音频流描述符


表75-2用于音频格式码2到8的多音频流描述符

表75-3用于音频格式码9到13的多音频流描述符

表75-4用于音频格式码14(WWA Pro)的多音频流描述符

表75-5用于音频格式码15(扩展)的多音频流描述符


4-1.3D音频和多流音频的应用场景
在下面的描述中,提供了用于3D音频和根据第一示例性实施例中的多流音频的应用场景。下面的示例性实施例示出了接收器装置传输HDMI2.0源、3D音频和多流音频的能力。
用于3D音频的场景
图13示出了3D音频采样被从蓝光播放器(BDP)发送到TV。这个示例性实施例假设如下。
诸如BDP的源和诸如TV的接收器是符合HDMI 2.0的设备。
源向接收器发送L-PCM 48kHz 22.2通道的音频流。
接收器接收L-PCM 48kHz 22.2通道的音频采样,并且将每个音频流发送到相应的扬声器。根据示例性实施例,发送的视频格式是1080p/60Hz。
TV包括符合CEA-861-F(D或E)的E-EDID数据结构,其能够利用DDC访问。为了支持发送3D音频,除了其他必要的数据块外,E-EDID还包括HDMI音频数据块。BDP接收HDMI音频数据块,并识别表76中描述的TV的3D音频能力。
表76用于22.2通道的HDMI音频数据块的例子


字节1、2、3指示HDMI音频数据块首标。NUM_HDMI_3D_AD被建立为1,其指示发送3D音频。NUM_CEA_SAD和Max_stream_count-1被设定为0,因为在这个示例性场景中BDP不处理多流音频。
字节4、5、6、7构成描述TV的3D音频特征的HDMI 3D音频描述符。音频格式码、最大通道数量-1、采样频率和采样大小被定义。
字节8、9、10、11构成描述用于22.2通道的有效扬声器(SMPEG 2036-2)的HDMI 3D分配描述符。
BDP从TV接收EDID,并且向TV发送音频信息帧和音频元数据分组。在这种情况下,音频元数据分组被用来代替发送通道计数和通道/扬声器分配信息的音频信息帧。
音频元数据分组中所包括的3D_CC和3D_CA分别描述用于22.2通道音频流的通道计数和通道/扬声器分配信息。下面的表77给出了发送22.2通道音频的音频信息帧有效载荷的例子。表78给出了发送22.2通道音频的音频元数据分组有效载荷。
表77用于22.2通道的音频信息帧有效载荷的例子

表78音频元数据分组有效载荷


BDP通过3D音频采样分组发送22.2通道音频采样。每个3D音频采样分组支持多达8个音频通道,并且因此,需要三个连续的3D音频采样分组来发送22.2通道音频采样。sample_start被用于分配第一个3D音频采样分组。在这个示例性实施例中,三个3D音频采样分组可以被定义为如表79到表81所规定的那样。
表79用于22.2通道的第一个3D音频采样分组的例子


表80用于22.2通道的第二个3D音频采样分组的例子


表81用于22.2通道的第三个3D音频采样分组的例子


4-2用于多流音频的场景的例子
图14示出了根据示例性实施例的、多流音频被从BDP发送到TV。这个示例性实施例假设如下。
诸如BDP的源和诸如TV的接收器是符合HDMI 2.0的设备。
源/接收器进入双视图游戏模式。
源发送每个视图的两个音频流。
接收器可以向彼此不同的两个耳机发送两个音频流。
发送的视频格式是HDMI 3D 1080p/60Hz。
TV包括符合CEA-861-F(D或E)的E-EDID数据结构,其能够利用DDC访问。为了支持多流音频,除了其他必要的数据块外,E-EDID还包括HDMI音频数据块。BDP接收HDMI音频数据块,并识别表76中描述的TV的多流音频能力。
表82用于两个音频流的HDMI音频数据块的例子


字节1、2、3指示HDMI音频数据块首标。NUM_CEA_SAD被建立为2,因为接收器支持用于多流音频的两种类型的音频格式码。Max_stream_count-1被建立为1,因为接收器能够处理如上面所描述的两个独立的音频流。NUM_HDMI_3D_AD被建立为0,因为在这个示例性场景中BDP可以处理发送3D音频。
字节4、5、6构成描述音频特征的第一CEA短音频描述符。关于发送多流音频,最大通道计数被限制为2。因此,通道的最大数量-1是1。
字节7、8、9指示描述音频特征的第二CEA短音频描述符。如上所述,通道的最大数量-1是1。BDP在从TV接收EDID之后,可以发送音频信息帧到TV。与3D音频发送场景相反,CC和CA被分别用于发送通道计数和通道/扬声器分配信息。音频元数据分组可以不被用于发送多流音频。表83示出了发送两个音频流的音频信息帧有效载荷的例子。
表83用于两个音频流的音频信息帧有效载荷的例子


BDP发送用于两个独立的音频流的具有立体声音频采样的多流音频采样分组。因此,第一子分组具有来自第一音频流的立体声音频采样,而且第二子分组具有来自第二音频流的立体声音频采样。在这个示例性实施例中,多流音频采样分组可以被定义为如表84中所示。
表84用于两个音频流的多流音频采样分组的例子


3D音频扬声器放置和通道分配
在下面的描述中,将说明用于3D音频通道的扬声器放置(placement)和通道分配。
图15示出了根据示例性实施例的用于3D音频通道的扬声器放置。
根据表85中描述的示例性实施例,在IEC 30.2通道标准类型的情况下,FL表示前左扬声器,FR表示前右扬声器,LFF1表示低频效果1扬声器,FC表示前中扬声器,BL表示后左扬声器,BR表示后右扬声器,FLW表示前左增宽扬声器,FRW表示前右增宽扬声器,TpFL表示顶部前左扬声器,TPFR表示顶部前右扬声器,BC表示后中扬声器,LS表示左环绕扬声器,RS表示右环绕扬声器,LFE2表示低频效果2扬声器,FLC指示前左中扬声器,FRC表示前右中扬声器,TpFC表示顶部前中扬声器,TpC表示顶部中扬声器,SiL表示左侧扬声器,SiR表示右侧扬声器,TpBL表示顶部后左扬声器,TpBR表示顶部后右扬声器,TpSiL表示顶部左侧扬声器,TpSiR表示顶部右侧扬声器,BtFC表示底部前中扬声器,BtFL表示底部前左扬声器,BtFR表示底部前右扬声器,TpBC表示顶部后中扬声器,TpLS表示顶部左环绕扬声器,TpRS表示顶部右环绕扬声器,LSd表示左环绕直接扬声器,RSd表示右环绕直接 扬声器。
然而,根据标准类型,扬声器名称可以彼此不同。例如,前中扬声器在上述的IEC标准中被写为FC,然而,TTA标准将前中扬声器写为C。除了下面的表中所述的名称外的其它各种扬声器名称也可以被使用。下表和图15的描述说明了示例性实施例之一;扬声器和通道分配可以根据其它示例性实施例不同地配置。
不同于2D音频数据,利用多通道支持的3D音频数据具有共同特征:在3D空间的顶部、中央和底部分别具有彼此不同的扬声器。图15示出了一个区域中的扬声器放置的示例性实施例。
表85音频通道描述和缩写比较(CEA/TTA/SMPTE/IEC)


5数据发送方法和数据接收方法
在下文中,将参照图16到图19解释符合上述标准的发送和接收数据的方法。
图16到图19是示出根据各种示例性实施例的数据发送方法和数据接收方法的流程图。
首先,参照图16,根据各种示例性实施例的数据发送方法可以包括在操 作S1610中生成关于用于多通道音频采样数据的多个分组,并且在操作S1620中将所生成的多个分组发送到数据接收器。所生成的多个分组中的每一个可以包括用于识别区分它们在分组当中的位置和/或次序的标识符字段。每个操作已经如上所述,因此重复描述将不再解释。
参照图17,根据各种示例性实施例的数据接收方法可以包括在操作S1710中接收从数据发送器发送的关于用于多通道音频采样数据的多个分组,并且在操作S1720中对接收到的多个分组执行解析。接收到的多个分组中的每一个可以包括用于区分它们在分组当中的位置和/或次序的标识符字段。每个操作已经如上所述,因此将不再解释。
标识符字段可以包括预设比特,其指示具有标识字段的分组是否是多通道音频采样数据的第一分组。
参照图18,根据各种示例性实施例的数据发送方法可以包括在操作S1810中生成包括多个子分组的分组,并且在操作S1820中将所生成的分组发送到数据接收装置。每个操作已经如上所述,因此将不再解释。
参照图19,根据各种示例性实施例的数据接收方法可以包括在操作S1910中接收包括多个子分组的分组,并且在操作S1920中对接收到的分组执行解析。每个操作已经如上所述,因此将不再解释。
多个子分组中的每一个可以包括与多个内容中的任一内容相对应的音频数据。
前述示例性实施例和优点仅仅是示例性的,并且不应当被解释为限制示例性实施例。本教导可以容易地应用于其它类型的装置。此外,示例性实施例的描述旨在是说明性的,而不是限制权利要求书的范围,而且许多替代、修改和变化对本领域技术人员将是显而易见的。

数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法.pdf_第1页
第1页 / 共112页
数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法.pdf_第2页
第2页 / 共112页
数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法.pdf_第3页
第3页 / 共112页
点击查看更多>>
资源描述

《数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法.pdf》由会员分享,可在线阅读,更多相关《数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法.pdf(112页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104221402A43申请公布日20141217CN104221402A21申请号201380020188X22申请日20130213102012012363820121102KR61/599,15420120215US61/602,97520120224US61/602,97820120224US61/604,89220120229US61/604,84420120229US61/611,82220120316US61/613,62920120321US61/636,87920120423US61/636,90120120423US61/641,58020120502US。

2、61/647,62820120516USH04S3/00200601H04R5/02200601H04N21/43920060171申请人三星电子株式会社地址韩国京畿道72发明人金钟和金秀英罗日柱尹硕振李在珉李庚宰74专利代理机构北京市柳沈律师事务所11105代理人刘虹邵亚丽54发明名称数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法57摘要本发明提供了一种数据发送装置。该数据发送装置包括分组生成器,被配置为生成关于多通道音频采样数据的多个分组;以及发送器,被配置为将所生成的多个分组发送到数据接收装置。多个分组中的每一个包括区分所述分组的位置或次序的标识符字段。

3、。30优先权数据85PCT国际申请进入国家阶段日2014101586PCT国际申请的申请数据PCT/KR2013/0011292013021387PCT国际申请的公布数据WO2013/122386EN2013082251INTCL权利要求书2页说明书96页附图13页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书96页附图13页10申请公布号CN104221402ACN104221402A1/2页21一种数据发送装置,包括分组生成器,其生成关于多通道音频采样数据的多个分组;以及发送器,其将所生成的多个分组发送到数据接收装置,其中,所生成的多个分组中的每一个包括区分所述分组的。

4、位置或次序的标识符字段。2如权利要求1所述的数据发送装置,其中,所述标识符字段包括指示具有标识符字段的分组是否是多通道音频采样数据的第一分组的预定比特。3如权利要求1所述的数据发送装置,其中,所述标识符字段包括指示具有标识符字段的分组索引的预定比特。4如权利要求1所述的数据发送装置,其中,所生成的多个分组中的每一个包括至少一个子分组,而且所述至少一个子分组存储多通道音频采样数据的一部分。5如权利要求4所述的数据发送装置,其中,所生成的多个分组中的每一个包括采样存在比特和采样平比特中的至少一个,所述采样存在比特指示所述至少一个子分组是否具有多通道音频采样数据,而且所述采样平比特指示子分组中包括的。

5、音频采样数据是否有效。6如权利要求1所述的数据发送装置,其中,所述多通道音频采样数据包括9个或更多通道的音频信号。7如权利要求1所述的数据发送装置,其中,所述多通道音频采样数据是根据国际电工委员会IEC60958格式配置的。8一种数据接收装置,包括接收器,其接收从数据发送装置发送的关于多通道音频采样数据的多个分组;以及分组解析器,其解析接收到的多个分组,其中,接收到的多个分组中的每一个包括区分所述分组的位置或次序的标识符字段。9如权利要求8所述的数据接收装置,其中,所述标识符字段包括指示具有标识符字段的分组是否是一个多通道音频采样数据的第一分组的预定比特。10如权利要求8所述的数据接收装置,其。

6、中,接收到的多个分组中的每一个包括至少一个子分组,而且所述至少一个子分组存储多通道音频采样数据的一部分。11如权利要求10所述的数据接收装置,其中,接收到的多个分组中的每一个包括采样存在比特和采样平比特中的至少一个,所述采样存在比特指示所述至少一个子分组是否具有多通道音频采样数据,而且所述采样平比特指示子分组中包括的音频采样数据是否有效。12如权利要求8所述的数据接收装置,其中,所述多通道音频采样数据包括9个或更多通道的音频信号。13如权利要求8所述的数据接收装置,其中,所述多通道音频采样数据是根据国际电工委员会IEC60958格式配置的。14一种数据发送方法,包括生成关于多通道音频采样数据的。

7、多个分组;以及将所生成的多个分组发送到数据接收装置,其中,所生成的多个分组中的每一个包括区分所述分组的位置或次序的标识符字段。15一种数据接收方法,包括权利要求书CN104221402A2/2页3接收从数据发送装置发送的关于多通道音频采样数据的多个分组;以及解析接收到的多个分组,其中,接收到的多个分组中的每一个包括区分所述分组的位置或次序的标识符字段。权利要求书CN104221402A1/96页4数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法技术领域0001与本文所公开的示例性实施例一致的装置和方法涉及数据收发装置和方法,而且更具体地,涉及在有线接口环境中发。

8、送多通道音频信号的数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法。背景技术0002由于多媒体环境已经被实施,因此已经提出了用于发送数据的各种有线接口环境。例如,高清晰度多媒体接口HDMI和移动高清链路MHL规定了各种格式的视频数据、音频信号以及控制信号的传输标准。特别地,根据多媒体环境的发展,多通道音频信号的传输标准正在被积极地讨论,以便实现高质量声音的传输。0003到目前为止,关于2到8个通道的音频通道的标准已经被提出。然而,在多媒体环境中,可能需要具有9个或多于9个通道的音频信号的传输标准。当传输多通道音频信号时,应该考虑常规使用的各种格式和设备环境。发。

9、明内容0004技术问题0005示例性实施例可以克服上述缺点和上面未描述的其他缺点。而且,示例性实施例不需要克服上述缺点,而且示例性实施例可以不克服上述任何问题。0006技术方案0007提出了示例性实施例以解决上述问题,而且示例性实施例的一方面提供了一种数据发送装置,其可以包括分组生成器,其生成关于多通道音频采样数据的多个分组;以及发送器,其将所生成的多个分组发送到数据接收装置。所生成的多个分组中的每一个可以包括区分所述分组的位置或次序的标识符字段。0008标识符字段可以包括指示具有该字段的分组是否是多通道音频采样数据的第一分组的预定比特。0009标识符字段可以包括指示具有标识符字段的分组索引的。

10、预定比特。0010所生成的多个分组中的每一个可以包括至少一个子分组,而且所述至少一个子分组存储多通道音频采样数据的一部分。0011所生成的多个分组中的每一个可以包括采样存在比特SAMPLEPRESENTBIT和采样平比特SAMPLEFLATBIT中的至少一个,所述采样存在比特指示所述至少一个子分组是否具有多通道音频采样数据,而且所述采样平比特指示子分组中包括的音频采样数据是否有效。0012所生成的多个分组中的每一个可以包括多个子分组,而且多个子分组中的每一个可以存储多通道音频采样数据的一部分。0013多通道音频采样数据可以包括9个或更多通道的音频信号。说明书CN104221402A2/96页5。

11、0014多通道音频采样数据可以是根据IEC60958格式配置的。0015根据示例性实施例的另一方面,提供了一种数据接收装置,其可以包括接收器,其接收从数据发送装置发送的关于多通道音频采样数据的多个分组;以及分组解析器,其解析接收到的多个分组。接收到的多个分组中的每一个可以包括区分所述分组的位置或次序的标识符字段。0016标识符字段可以包括指示具有标识符字段的分组是否是多通道音频采样数据的第一分组的预定比特。0017接收到的多个分组中的每一个可以包括至少一个子分组,而且所述至少一个子分组存储多通道音频采样数据的一部分。0018接收到的多个分组中的每一个可以包括采样存在比特和采样平比特中的至少一个。

12、,所述采样存在比特指示所述至少一个子分组是否具有多通道音频采样数据,而且所述采样平比特指示子分组中包括的音频采样数据是否有效。0019接收到的多个分组中的每一个可以包括多个子分组,而且多个子分组中的每一个可以存储多通道音频采样数据的一部分。0020多通道音频采样数据可以包括9个或更多通道的音频信号。0021多通道音频采样数据可以是根据IEC60958格式配置的。0022根据示例性实施例的另一方面,提供了数据收发系统,其可以包括数据发送装置,其生成关于多通道音频采样数据的多个分组并且发送所生成的分组;以及数据接收装置,其接收发送的多个分组并且解析接收到的分组。多个分组中的每一个可以包括区分所述分。

13、组的位置或次序的标识符字段。0023标识符字段可以包括指示具有标识符字段的分组是否是多通道音频采样数据的第一分组的预定比特。0024根据示例性实施例的另一方面,提供了一种数据发送方法,其可以包括生成关于多通道音频采样数据的多个分组并且将所生成的多个分组发送到数据接收装置。所生成的多个分组中的每一个可以包括区分所述分组的位置或次序的标识符字段。0025标识符字段可以包括指示具有标识符字段的分组是否是多通道音频采样数据的第一分组的预定比特。0026根据示例性实施例的另一方面,提供了一种数据接收方法,其可以包括接收从数据发送装置发送的关于多通道音频采样数据的多个分组,并且解析接收到的多个分组。接收到。

14、的多个分组中的每一个可以包括区分所述分组的位置或次序的标识符字段。0027标识符字段可以包括指示具有标识符字段的分组是否是多通道音频采样数据的第一分组的预定比特。0028根据示例性实施例的另一方面,提供了一种数据收发方法,其可以包括从第一装置向第二装置发送扩展的显示标识数据EXTENDEDDISPLAYIDENTICATIONDATA,EDID块,EDID块包括指示多通道音频数据的3D音频特征的第一子块和指示多通道音频数据的3D扬声器分配信息的第二子块中的至少一个;从第二装置向第一装置发送元数据分组,其包括指示多通道音频数据的通道分配标准类型的音频通道分配标准类型ACAT字段、指示通道数目的通。

15、道计数字段、以及指示通道/扬声器分配信息的3D通道/扬声器分配字段中的至少一个;从第二装置向第一装置发送至少一个多通道音频采样数据分组;以及在第说明书CN104221402A3/96页6一装置中对至少一个发送的多通道音频采样数据分组执行解析并基于经解析的至少一个发送的多通道音频采样数据分组来输出音频。至少一个多通道音频采样数据分组可以包括多个子分组、以及区分多个子分组的位置或次序的标识符字段。0029根据示例性实施例的另一方面,提供了一种数据收发方法,其可以包括从第一装置向第二装置发送扩展的显示标识数据EDID块,EDID块包括指示多通道音频数据的多流音频特征的子块;从第二装置向第一装置发送音。

16、频信息帧分组,其包括指示多通道音频数据的通道数目的通道计数字段、以及指示通道/扬声器分配信息的通道/扬声器分配字段中的至少一个;从第二装置向第一装置发送至少一个音频采样数据分组;以及在第一装置中对至少一个发送的音频采样数据分组执行解析并基于经解析的至少一个音频采样数据分组来输出音频。至少一个音频采样数据分组可以包括多个子分组,而且多个子分组可以包括与多个内容中的任一内容相对应的音频数据。0030技术效果0031根据上述各种示例性实施例,示例性实施例可以生成关于多通道音频采样数据的多个分组,其中,所生成的多个分组中的每一个可以包括标识符字段,并因此提供具有多于9个通道的音频信号的传输标准。附图说。

17、明0032通过参照附图描述某些示例性实施例,示例性实施例的以上和/或其他方面将更加明显,在附图中0033图1示出了3维3D音频信号的传输定时;0034图2是根据示例性实施例的数据收发系统的框图;0035图3是根据示例性实施例的数据收发系统中的数据发送装置的框图;0036图4是根据示例性实施例的数据收发系统中的数据接收装置的框图;0037图5示出了根据示例性实施例的音频采样分组的传输流;0038图6示出了根据另一示例性实施例的音频采样分组的传输流;0039图7示出了根据示例性实施例的传输流格式;0040图8示出了根据示例性实施例的音频采样分组的传输流;0041图9和图10示出了根据示例性实施例的。

18、多流音频采样分组的传输流;0042图11示出了根据示例性实施例的多流音频采样分组的传输流;0043图12示出了根据示例性实施例的使用CEC发送扬声器位置的操作;0044图13示出了根据示例性实施例的将3D音频采样从BDP发送到TV的操作;0045图14示出了根据示例性实施例的将多流音频从BDP发送到TV的操作;0046图15示出了根据示例性实施例的用于3D音频通道的扬声器设置;0047图16到图19是提供对根据各种示例性实施例的数据发送方法和数据接收方法的解释的流程图。具体实施方式0048现在将参照附图详细地描述某些示例性实施例。0049在下面的描述中,即使在不同的附图中,相同的参照标记也被用。

19、于相同的元件。描说明书CN104221402A4/96页7述中定义的、诸如详细结构和元件的事项被提供以便有助于全面理解示例性实施例。因此,显而易见的是,示例性实施例可以在没有这些具体定义的事项的情况下实现。此外,没有详细描述公知的功能或结构,因为它们会以不必要的细节模糊示例性实施例。0050如本文所用的术语“多通道音频”表示具有2个以上通道的音频信号。在示例性实施例的以下描述中,将多通道音频划分为2维2D音频通道和3维3D音频通道。“2D音频通道”具有2个通道到8个通道的多个音频通道,并且表示这样的音频通道,其中与各通道相对应的扬声器被放置在平面上。与此相对,在“3D音频通道”具有包括9个以上。

20、通道的多个音频通道,而且与各通道相对应的扬声器被放置在3D空间中。0051举例来说,示例性实施例可以使用在TTA102CH,SMPTE20362222CH或IEC62574302CH中定义的使用通道布局来实现3D音频。3D音频可以包括如本文所定义的降混DOWNMIX音频流。0052术语“多流音频”表示这样的音频信号,其具有与多视图环境中的每个视图相对应地被分类的音频信号,在所述多视图环境中可以观看两个或更多个有区别的内容。每个视图的音频信号可以是多通道音频。例如,如果支持多视图视频,诸如与双视图游戏或四视图游戏相关联的多视图视频,则多流音频可以是与使用3D视频格式发送的视频流相关的一类音频流。。

21、0053下文中,将基于从HDMI14B规范的音频扩展的、具有9到32个或更多通道的3D音频、以及用于多视图显示装置的多流音频,来解释示例性实施例。更重要的是,包括下面描述的改变以支持新的音频特征。0054然而,因为示例性实施例可以应用到各种有线接口的传输标准,诸如本技术领域的等效范围之内的移动高清链路MHL标准和高清多媒体接口HDMI标准,所以下面描述的示例性实施例在类似的有线接口传输标准中也可以是有效的。0055在下面的描述,将描述通过数据岛DATAISLAND时段发送的HDMI分组的新的定义包括3D音频采样分组、3D一比特音频采样分组、音频元数据分组、多流音频采样分组和多流一比特音频采样分。

22、组、对于分组的打包处理、以及在扩展显示标识数据EEDID内的HDMI音频数据块的定义以支持根据新的特征的发现功能。除非本文另有定义,根据示例性实施例,所述规范基本上按照HDMI14B,而且不改变HDMI14B。0056与HDMI14B相反的解释可以被替换为以下新定义的特征,然而,其他解释可以与HDMI14B的规范一致。所述规范是指以下规范。0057HDMI、HDMILICENSING、LLC,HIGHDEFINITIONMULTIMEDIAINTERFACESPECICATIONVERSION14B,2011年10月11日0058TTA,TTAKKO070098,AUDIOSIGNALFORM。

23、ATSFORULTRAHIGHDENITIONUHDDIGITALTV,2011年12月21日0059SMPTE,SMPTE203622008,UHDTVAUDIOCHARACTERISTICSANDAUDIOCHANNELMAPPINGFORPROGRAMPRODUCTION,20080060IEC,IEC62574ED10,AUDIO,VIDEOANDMULTIMEDIASYSTEMSGENERALCHANNELASSIGNMENTOFMULTICHANNELAUDIO,2011年4月7日0061MHL,LLC,MOBILEHIGHDENITIONLINKVERSION20,2012年2月。

24、0062TTA电信技术协会TELECOMMUNICATIONSTECHNOLOGYASSOCIATION说明书CN104221402A5/96页80063概述0064基本音频功能包括与采样率为32KHZ、441KHZ或48KHZ的IEC60958的线性脉码调制LPCM音频流相关的功能。这个音频流可以包含普通立体声流。可选地,HDMI可以以192KHZ的采样率发送具有3到32个音频通道的音频。HDMI可以以比特率达49152MBPS例如,环绕声的IEC61937压缩格式发送音频流。HDMI可以发送具有2到32个音频通道以及直接流传输DST的一比特音频,即,压缩格式中的一比特音频。HDMI可以发送。

25、3D音频流,其中扬声器可以放置在3D空间中的任何地方。3D音频流可以最多包括32个音频通道,其在数据岛时段通过连续分组发送。如果支持多视图视频流传输例如,在每个视图中具有多个音频的双视图或四视图游戏,则HDMI可以发送多个音频流。关于这种情况,可以支持四个立体声音频流。0065数据岛分组DATAISLANDPACKET定义0066在HDMI14B规范的531节分组首标中,可以将表58替换为下表。0067表1分组类型0068说明书CN104221402A6/96页90069对于INFOFRAME信息帧的分组布局,应该参考HDMI14B规范的82节。0070参照表1,从区域0X0B到0X0F定义新。

26、的分组。在0X0B中定义3D音频采样分组。在0X0C中定义3D一比特音频采样分组。此外,在0X0D中定义音频元数据分组,在0X0E中定义多流音频采样分组,而且在0X0F中定义多流一比特音频采样分组。下面将详细说明新定义的分组。0071此外,还将说明没有新定义分组的各种可替换的建议。表1中的分组定义将被称为第一示例性实施例。各种可替代的建议将被称为第二示例性实施例、第三示例性实施例、说明书CN104221402A7/96页10等等。各种可替代的建议将基于与第一示例性实施例的区别进行说明。0072113D音频采样分组0073第一示例性实施例0074在第一示例性实施例中,可以使用新定义的3D音频采样。

27、分组发送LPCM格式的3D音频。如上所述,“3D音频”被定义为这样的音频在其中,扬声器可以根据3D音频标准例如,102CH、222CH、302CH、或更多被放置在3D空间中的确定的位置上。00753D音频流可以包括32个或更多个音频通道,并在数据岛时段中通过连续的分组发送。每个分组可以具有多达8个音频通道。分组首标可以包括采样起始SAMPLESTART和采样存在SAMPLEPRESENT比特,以通知指示3D音频采样内的分组位置,这将在下面描述。下表显示3D音频采样分组首标。0076表23D音频采样分组首标00770078每个字段包括以下信息。0079SAMPLE_START1比特指示如果采样起。

28、始是1,则当前分组是3D音频采样的第一个分组。因此,SAMPLE_START指示3D音频流的开始。接收器SINK区分采样的起始部分与所述采样起始。0080SAMPLE_START1,除了指示当前3D音频采样分组是3D音频采样的第一个分组之外,还指示当前3D音频采样分组被完全打包到8个音频通道。但是,如果低于8个音频通道降混的3D音频被发送,则只有8个或更少的音频通道可以被打包。SAMPLE_START0指示当前3D音频采样分组是3D音频采样的中间或最后的分组,并且包括8个或更少个音频通道。可以仅存在3D音频采样分组的5个有效SAMPLE_PRESENT比特的设置。0081SAMPLE_PRES。

29、ENTSPX4个字段,每个字段1比特指示子分组X是否包括音频采样。一条3D音频采样数据可以被包括在两个或多个3D音频采样分组中,并且每个3D音频采样分组可以具有四个子分组。因此,每个3D音频采样分组首标可以具有总共四个采样说明书CN104221402A108/96页11存在SAMPLEPRESENT比特,其对应于四个子分组。每个SAMPLE_PRESENT比特表示相应的子分组是否具有3D音频采样的一部分。0082SAMPLE_FLATSPX4个字段,每个字段1比特指示子分组X是否是指扁平线FLATLINE采样。如果SAMPLE_PRESENTSPX被建立,则它是有效的。如果没有发现可以在源处使。

30、用的可用音频数据,则4个SAMPLE_FLATSPX比特可以被建立。当采样率改变时或当存在临时流中断时,则可以发生所述建立。如果SAMPLE_FLATSPX被建立,则子分组X仍然是指采样时段,但是,不包括可用的音频数据。只有在相应的SAMPLE_PRESENTSPX比特被建立的情况下,SAMPLE_FLATSPX才有效。0083在发送具有LPCM音频的9到32个通道或更多的一个3D音频采样即,帧是5到16个IEC60958帧时,可以利用相邻的3D音频采样分组。0084表3示出了有效的SAMPLE_PRESENT比特值。0085表3用于3D音频发送的有效的SAMPLE_PRESENT比特配置00。

31、86SP0SP1SP2SP3描述0000没有包含音频采样的部分的子分组。1000只有子分组0包含音频采样的一部分1100子分组0和1包含音频采样的两个连续部分1110子分组0、1和2包含音频采样的三个连续部分1111子分组0、1、2和3包含音频采样的四个连续部分00870088BX4个字段,每个字段1比特指示如果子分组X包括由IEC60958块构成的192个帧中的第一帧,则BX1。否则,BX0。00893D音频采样分组包括如表2所示的音频采样分组首标、和四个子分组。3D音频采样分组中的每个子分组都具有根据IEC60958定义的3D音频采样数据。0090如果源要求3D音频流的降混,则可以使用3D。

32、音频采样分组发送降混的音频流。如果接收器不支持3D音频,则源可以不发送3D音频采样分组。将3D音频转换为遗留音频格式可能超出本说明书的范围。基于通道编号,可以存在彼此不同的多个子分组布局。在下文中,表4至表6分别指示对于12、24和32个通道的3D音频分组布局的例子。0091表4对于12个通道的3D音频采样分组布局的例子0092说明书CN104221402A119/96页120093表5对于24个通道的3D音频采样分组布局的例子00940095表6对于32个通道最大的3D音频采样分组布局的例子00960097图1示出了发送3D音频信号的定时。说明书CN104221402A1210/96页130。

33、098参照图1,在水平消隐间隔,发送8个通道的三个2D音频信号采样中的每一个。在以上发送三个2D音频信号采样所使用的相同的持续时间中,发送24个通道的3D音频信号中的一个采样。0099在下面,将描述根据第一示例性实施例的数据收发系统1000。0100图2是示出根据示例性实施例的数据收发系统1000的配置的框图,图3是示出根据示例性实施例的数据收发系统1000的数据发送装置100的配置的框图,而且图4是示出根据示例性实施例的数据收发系统1000的数据接收装置200的配置的框图。0101参照图2,根据示例性实施例的数据收发系统1000包括数据发送装置100和数据接收装置200。0102参照图3,根。

34、据示例性实施例的数据发送装置100包括分组生成器110和发送器120。0103分组生成器110可以生成关于多通道音频采样数据的多个分组。如上所述,可以生成关于具有9个通道或更多通道的音频采样数据的多个分组。所生成的分组中的每一个可以包括区分它的位置或序列的标识符字段。0104标识符字段可以包括指示具有标识符字段的分组是否是多通道音频采样数据的第一分组的预定比特。在第一示例性实施例中,SAMPLE_START比特可以是指示具有标识符字段的分组是否是第一分组的预定比特的例子。0105此外,标识符字段可以包括指示具有标识符字段的分组的索引的预定比特。这个例子是从第一示例性实施例改变而来的,而且具有更。

35、有效地区分分组的效果。0106发送器120将所生成的多个分组发送到数据接收装置200。0107参照图4,根据示例性实施例的数据接收装置200包括接收器210和分组解析器220。0108接收器210可以接收从数据发送装置100发送的关于多通道音频采样数据的多个分组。同样地,接收到的多个分组中的每一个可以包括区分它的位置或序列的标识符字段。0109分组解析器220执行解析接收到的多个分组的操作。0110视频依赖VIDEODEPENDENCY0111表7示出了可以用来在CEA861F中描述在D或E中也有描述的各种视频格式定时发送3D音频的采样率。假设在水平消隐间隔的58TMDS时钟周期必需用于内容保。

36、护重新同步。发送3D音频可以通过3D音频采样分组来支持。0112表7示出了对于24比特视频格式定时的3D音频的最大采样频率。0113表7对于视频格式定时的3D音频的最大采样频率0114说明书CN104221402A1311/96页140115说明书CN104221402A1412/96页150116说明书CN104221402A1513/96页160117第二示例性实施例0118根据不同于第一实施方式的第二示例性实施例,常规的音频采样分组格式可以被修改和使用。0119如下面的表8所示,常规的音频采样分组的保留区域可以用作SEGMENT_INDICATOR段指示符。根据示例性实施例,SEGMEN。

37、T_INDICATOR可以利用两个比特表示。如果SEGMENT_INDICATOR00,则指示第一分组。此外,如果SEGMENT_INDICATOR01,则指示分组是中间分组的奇分组,如果SEGMENT_INDICATOR10,则指示分组是中间分组的偶分组,如果SEGMENT_INDICATOR11,则指示分组是最后的偶分组。此外,上述标识符仅说明书CN104221402A1614/96页17仅是示例,而且与比特匹配的分组可以是不同的。0120无论段是否被损坏,都可以发现上述结构。如果一个段被损坏,则具有损坏的段的第N个采样可以被丢弃,或者只有损坏的音频采样分组可以被丢弃。段指示一个或多个音频。

38、采样分组被划分到的组中的单独的音频采样分组。0121LAYOUT布局指示关于HDMI14B中的采样和通道的数目的信息。例如,一个音频采样分组可以包括两个通道的四个音频采样或8个通道的一个音频采样。在本说明书进行了扩展,常规的保留区域中的LAYOUT_EXT字段被创建,这指示关于3D音频是否被提供了布局的信息。0122例如,如果LAYOUT_EXT0而且LAYOUT0,1,则按照常规方法类似地指示2D音频采样和通道的数目。然而,如果LAYOUT_EXT1而且LAYOUT0,则指示3D音频采样。如果LAYOUT_EXT1而且LAYOUT1时,则指示多流音频采样。0123除了具体描述的字段外,第二示。

39、例性实施例中的其它字段可以与第一示例性实施例中的字段相同。0124表8修改的音频采样分组01250126表81SEGMENT_INDICATOR字段0127SEGMENT_INDICATOR描述00起始段START_SEGMENT01中间段奇MID_SEGMENTODD10中间段偶MID_SEGMENTEVEN11结束段END_SEGMENT0128说明书CN104221402A1715/96页180129表82LAYOUT和LAYOUT_EXT之间的关系参照表76HDMI14B0130LAYOUT_EXTLAYOUT描述002个通道/4个采样018个通道/1个采样103D音频11保留0131。

40、图5示出了根据第二示例性实施例的音频采样分组的传输流。0132参照图5,当在水平消隐间隔中发送关于222通道的3D音频的两个采样分组时,每个字段值被建立。在第一分组中,SEGMENT_INDICATOR00,在第二分组中,SEGMENT_INDICATOR10,而且在最后的分组中,SEGMENT_INDICATOR11。因为上述实施例是3D音频信号,所以LAYOUT_EXT1而且LAYOUT0。在102通道的3D音频中发现类似的字段值。0133第三示例性实施例0134根据第三示例性实施例,常规的音频采样分组格式也被改变和使用,虽然与第二示例性实施例相比指示更少的信息。0135参照下面的表9,常。

41、规的音频采样分组的保留区域可以用作MULTICHANNEL_INDICATOR多通道指示符。与第二示例性实施例的SEGMENT_INDICATOR不同,MULTICHANNEL_INDICATOR指示关于音频采样分组是否是3D音频的信息。根据MULTICHANNEL_INDICATOR的比特信息,由布局字段指示的信息可以改变。0136因此,MULTICHANNEL_INDICATOR可以利用一比特来表示。如果MULTICHANNEL_INDICATOR0,则布局字段指示传统的HDMI14B中定义的通道/采样布局。如果MULTICHANNEL_INDICATOR1,则布局字段指示使用多于8个通道。

42、发送多通道音频采样数据的布局。在这种情况下,参照采样的起始来使用布局。如果LAYOUT1,则指示当前音频采样分组中包括采样的起始。如果LAYOUTSTART0,则指示当前音频采样分组不包括采样的起始。另外,以上描述仅是示例性的,而且与比特匹配的分组可以是不同的。除了所描述的字段外,第三示例性实施例中其它的字段可以与第一示例性实施例中的字段相同。0137表9修改的音频采样分组首标0138说明书CN104221402A1816/96页190139表91MMULTICHANNEL_INDICATOR和LAYOUT/START01400141上述结构使对传统的音频采样分组的保留区域的改变最小化,同时指。

43、示关于3D音频是否与音频采样分组一起被包括的信息。因此,根据第三示例性实施例的分组结构比第二实施例更简单。0142图6示出了第三示例性实施例中的音频采样分组的传输流。0143参照图6,当在水平消隐间隔发送关于222通道的3D音频的两个采样分组时,每个字段值被建立。在第一分组中,LAYOUT1,而且在第二分组和第三分组中,LAYOUT0。然而,因为每一个分组都是3D音频信号的一部分,所以MULTICHANNEL_INDICATOR1。在102通道的3D音频中建立类似的字段值。0144第四示例性实施例0145根据第四示例性实施例,常规的音频采样分组格式也被改变和使用,但是不同于第二示例性实施例,还。

44、提供了关于是否提供多流音频的信息。0146参照下面的表10,常规的音频采样分组的保留区域可以用作STREAM_ID和MULTIASP_LAYOUT。MULTIASP_LAYOUT执行与第三示例性实施例中的MULTICHANNEL_INDICATOR相同的功能。换句话说,MULTIASP_LAYOUT指示3D音频是否被提供。根据说明书CN104221402A1917/96页20MULTIASP_LAYOUT比特信息,由LAYOUT字段指示的信息是不同的。0147如果提供多流音频,则STREAM_ID指示流编号。根据示例性实施例,一个比特可以用于STREAM_ID中,而且0指示第一个流而且1指示第。

45、二个流。每个流对应彼此不同的内容的视图。另外,以上描述仅是示例性的,而且与比特匹配的分组可以是不同的。0148如果与多流音频相对应的一个视图具有8个或更少通道的音频信号,则在一个音频采样分组中STREAM_ID和MULTIASP_LAYOUT将不会同时是0。0149表10修改的音频采样分组首标01500151表101STREAM_ID的描述0152STREAM_ID描述0流11流20153上述结构在通过一个数据采样分组显示多流音频和3D音频二者的信息时具有实现兼容性的效果。此外,如果STREAM_ID字段和流的标识符被创建,则多个流在发送时可以彼此区分开。因此,超过一个分组大小的多流音频采样数。

46、据可以被发送。另外,在第四示例性实施例中,除了所描述的字段外的字段与第一示例性实施例中的字段相同。0154也可以考虑将STREAM_ID字段、MULTIASP_LAYOUT字段和LAYOUT/START字段的值相结合的音频数据传输流。如果MULTIASP_LAYOUT1,则指示3D音频传输流,而且LAYOUT/START指示关于分组的起始的信息。如果STREAM_ID1,则指示多流,而且根据LAYOUT/START建立通道和采样的数量。例如,接收STREAM_ID1的分组的接收器识别出,多流音频数据被发送而且当前接收的分组是两个多流音频数据中的第二个流音频数据。0155第五示例性实施例说明书C。

47、N104221402A2018/96页210156根据第五示例性实施例,常规的音频采样分组格式也被改变和使用。0157参照下面的表11,常规的音频采样分组的保留区域可以用作SUPPORTS_MULTISTREAM支持多流和MULTIASP_LAYOUT多ASP布局。MULTIASP_LAYOUT执行与第四示例性实施例中的MULTIASP_LAYOUT相同的功能。换句话说,MULTIASP_LAYOUT指示3D音频是否被提供。由LAYOUT字段指示的信息根据MULTIASP_LAYOUT的比特信息而不同。0158SUPPORTS_MULTISTREAM指示关于多流音频是否被提供的信息。根据示例性。

48、实施例,一比特可以用于SUPPORTS_MULTISTREAM中。1指示多流音频被提供。此外,以上描述仅是示例性的,而且与比特匹配的分组可以是不同的。0159根据第五示例性实施例,一个音频采样分组可以最大包括2个通道的四个多流音频采样。可以与四个子分组中的每一个相对应地发送每个视图中的音频采样。0160如果与多流音频相对应的一个视图具有8个或更少通道的音频信号,则在一个音频采样分组中SUPPORTS_MULTISTREAM和MULTIASP_LAYOUT将不会同时是0。0161表11修改的音频采样分组首标01620163上述结构在通过一个数据采样分组显示多流音频和3D音频二者的信息时具有实现兼。

49、容性的效果。此外,将要支持的每一个特征可以被写入一个音频采样分组中。此外,在第五示例性实施例中,除了所描述的字段外的字段与第一示例性实施例中的字段相同。0164可以考虑将SUPPORTS_MULTISTREAM字段、MULTIASP_LAYOUT字段和LAYOUT/START字段的值组合的音频数据传输流的特征。如果SUPPORTS_MULTISTREAM0而且MULTIASP_LAYOUT1,则指示3D音频传输流,而且LAYOUT/START指示关于分组的起始的信息。如果SUPPORTS_MULTISTREAM1,则指示多流,而且根据LAYOUT/START建立通道和采样的数量。0165第六示例性实施例0166根据第六示例性实施例,建议与第四示例性实施例类似地改变常规的音频采样分说明书CN104221402A2119/96页22组格式。0167参照下面的表12,常规的音频采样分组的保留区域可以用作STREAM_ID和MULTIASP_LAYOUT。STREAM_ID和MULTIASP_LAYOUT执行与第四示例性实施例中的STREAM_ID和MULTIASP_LAYOUT相同的功能。由LAYOUT字段指示的信息根据MULTIASP_LAYOUT的比特信息而不同。0168由于利用2比特表示STREAM_ID,因此。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1