高清音像HVD光盘 【技术领域】
本发明涉及的是一种用于信息记录的介质,尤其是一种记录音频及高清视频压缩码流和导航信息的信息介质。属于音像传播技术领域。
背景技术
目前用于记录数据的物理介质主要有CD、DVD。物理介质结合相应的信息记录方法一起被视为信息介质。音频信息和视频信息的记录介质按格式可以分为AUDIO(音乐)CD、VCD、超级VCD、DVD-Video(DVD视盘)和DVD-Audio(音频DVD)等等。AUDIO(音乐)CD只能记录数字音频信息,VCD只能记录按MPEG1标准编码的视频信息,DVD-Video(DVD视盘)只能记录普通的720*480(NTSC制式)或720*576(PAL制式)的按MPEG2标准编码的视频信息。这些格式的信息介质都不能支持高清视频源的播放。
经对专利的文献检索时发现,申请人为:三星电子株式会社,中国专利申请名称为:DVD盘、再现DVD盘的装置和方法,专利申请号为:97114147.9,专利申请公开号为:1195170A,该专利申请自述为:一种与再现DVD视盘的装置互换使用并记录多信道音频数据的盘。再现DVD音频盘的装置包括:视频标题组的视频属性、子图像属性、包括扩展音频流的视频/子图像包,扩展音频流具有扩展音频流头标和帧,该头标具有存储扩展音频数据地音频编码模式、采样频率、量化比特数和使用数据并指示比特、带宽和信道扩展的使用区。视频/子图像包组成为有选择地记录扩展音频数据的音频包并可通过组合基本音频包的再现数据与扩展音频包再现音频数据。
从该专利申请的内容中可以发现,该DVD视盘标准制定时间较早,一些方面还存在不足之处,如:
1、DVD视盘“用MPEG-1/MPEG-2视频系统压缩的数据存储DVD视盘的视频区”(该专利说明书部分)。目前现有的MPEG-4视频压缩技术及其扩展技术有着更高的数据压缩率,在目前最流行的红光技术DVD盘容量大小一样的情况下,可以获得支持片长更长的视频信息流。
2、DVD视盘在其实施例中定义的VTS-V-ATR结构中定义的源图像清晰度只涉及720*480(525/60制)、720*576(625/50系统)、704*480(525/60系统)、704*576(625/50系统)、325*480(525/60系统)、352*576(625/50系统)、252*240(525/60系统)和352*288(625/50系统)。随着人们对高清视频播放机的要求增加,很需要一种能够在红光技术盘片上支持高清视频源的盘片格式。
3、从该发明说明书以及DVD Format/Logo Licensing Corporation提供的DVD Specifications for Read-Only Disc Part 3 VIDEO SPECIFICATIONSVersion 1.12中提供的更详细的DVD视盘的规范中可以发现DVD视盘所采用导航系统是一个非常强大的导航系统;但是,其导航系统非常复杂,使得播放机的实现对盘片播放时很难覆盖所有的情况,造成在播放过程中对不同的盘片的播放可能会产生各种问题。另外,DVD视盘用来专为导航系统的数据结构需要较多的存储空间,使得盘片所能用来存储真正播放音频、视频流内容的空间减少。
4、从该发明专利说明书的附图中以及DVD Format/Logo LicensingCorporation提供的DVD Specifications for Read-Only Disc Part 3 VIDEOSPECIFICATIONS Version 1.12中提供的更详细的DVD视盘的规范中可以发现DVD视盘中有部分的控制信息(PCI/DSI信息)和播放的音频、视频流是存储在同一文件上的,如果文件有损坏,会直接影响的效果,如果备份整个文件,从盘片本身容量的角度几乎是不可能的。
考虑到目前世界上价格低廉的高密度大容量盘片仍然以红光技术为主,随着人们对高清视频播放机的要求增加,很需要一种能够在红光技术盘片上支持高清视频源的盘片格式。由于高清视频流的数据量很大及红光盘片容量的限制,此盘片格式必须在保证必需的导航功能的前提下尽量使用较小的系统开销且易于实现。
【发明内容】
本发明的目的在于克服现有技术中的不足,提供了一种高清音像HVD光盘。使其记录了用于播放的各个音频及高清视频压缩码流和一种用于音、视频播放盘播放控制的导航系统,其导航控制信息都与音频、视频播放流分开,并都可备份,提高了盘片的容错性能,而且导航信息及音频视频信息结构层次结构简单,易于实现。
本发明是通过以下技术方案实现的。本发明由HVD系统层,包括总体控制文件和音视频播放控制文件组;音视频播放控制文件组层,包括各个具体音频、视频播放信息文件、索引文件和命令控制文件中组成,用于控制各个播放流;播放流层,包括音频流、视频流和字幕流,用于音频、视频和字幕的再现。
在所述的总体控制文件中存储盘片上播放所需要的总导航信息,包括存储各个音频、视频对应的音视频播放控制信息文件组中的与各个具体音频、视频播放的控制信息,以及盘片上的总体信息、各个音视频信息文件的信息、盘片菜单信息、盘片播放入口信息。
所述的音视频播放控制文件组是存储播放控制信息的文件,每个音频、视频播放流都有一组音视频信息文件与之相配,每组音视频播放控制文件组由三个文件组成:属性信息文件、索引信息文件和命令控制文件。
所述的属性信息文件中包含有此音频、视频播放流的音频、视频和字幕的属性,以及关于索引信息文件和控制信息文件的信息,播放章节信息。
所述的索引信息文件是用来存储音频、视频播放流中提取出的可用来作为时间搜索及特技播放,如快进、快退、慢进、慢退需要的信息的文件,对于视频流包括有采用MPEG标准编码的I帧图象所在的位置以及视频流头信息的位置。
所述的命令控制文件是用来存储盘片所要求的用来控制盘片播放顺序及播放效果的信息的文件,包括有各个音频、视频播放流之间的播放连接的控制信息,音频及字幕的设置控制信息,字幕及高亮区显示效果的控制信息等。以一系列的命令的方式来实现对上述功能的控制。
总体控制文件和音视频播放控制文件组中的属性信息文件、索引信息文件和命令控制文件都是播放机实现播放过程中很重要的文件,可以选择增加一组后缀为BAK的备份文件存储在同一张盘片上,这些备份文件的内容和原文件相同,仅在以上所提及的文件被破坏时使用。DVD-Video(DVD视盘)中有部分的控制信息和播放的音频、视频流是存储在同一文件上的,如果文件有损坏,会直接影响播放的效果,如果备份整个文件,从盘片本身容量的角度几乎是不可能的;而HVD盘的所有控制相关的导航信息都是与音频、视频流分开存放的,都可以备份,提高了盘片播放的容错性能。为最终的消费者提供了一个更佳的选择。此为HVD盘格式的另一个优点。
通过以上描述的总体控制文件和音频控制文件组中存储的信息可以使得播放机在音频、视频流盘片播放的过程中能方便、简单地实现复杂的导航功能。HVD盘导航系统对于盘片上的文件名命名有着一定的灵活性。音频、视频播放流可以由符合一定命名规则的多个文件组成,同样可以达到连续播放的功能;而且除了总体控制文件之外其它文件的文件名都可由盘片制作者制定,这些都有利于盘片制作系统对文件存储顺序的安排,使得制作过程简单易行。
在以上所述的所有记录在HVD盘上的文件中,所有牵涉到物理位置的信息都以该文件开始位置的相对位置记录。这种避免使用盘片绝对位置的作法大大方便了盘片的制作过程,更有利于音频、视频播放流的增加、删除及调整。
本发明具有实质性特点和显著进步,具有以下的特点:支持多种标准(MPEG1、MPEG2、MPEG4、H.264、WMV9、AVS图像压缩标准)压缩制作的视频流。HVD盘片中使用的导航系统简单,便于盘片的制作过程及播放过程的实现。HVD盘具有较小的非音频、视频播放流本身的数据系统的开销。提供强大的播放控制功能,支持各种特技播放及用户互动控制。HVD盘上的导航控制信息都与音频、视频播放流分开,并都可备份,提高了盘片的容错性能。HVD盘的导航信息及音频视频信息结构层次结构简单,易于实现。
DVD-VIDEO(DVD视盘)记录的视频流的分辨率为720*480(NTSC制式)或720*576(PAL制式);而HVD盘记录的视频流可支持多种不同的电视系统(NTSC制、PAL制、高清制式)及分辨率(分辨率最高可达1920*1080)。综合考虑各种因素,目前基于红光盘片上的HVD盘中的视频流主要采用960*720的高清格式。同时,HVD盘可以采用于按MPEG1、MPEG2、MPEG4、H.264、WMV9、AVS标准进行压缩的视频流。
【附图说明】
图1为本发明HVD盘中导航信息及音频、视频播放流层次结构示意图。
图2为本发明HVD盘中记录的命令控制文件的结构图。
图3为本发明HVD盘中记录的导航信息工作原理及播放流程图。
【具体实施方式】
在描述根据本发明的最佳实施例之前,先给出在描述实施例时会用到的约定、数字表示法和基本类型说明,这些信息是构成最佳实施例的基本知识或数据描述方法的说明,有助于比较好地理解最佳实施例。
约定
比特排序:所有多位比特数的图示表示为最高有效位(msb)在左边,最低有效位(lsb)在右边。最高有效位比特是具有最高比特位号的比特。比特i表示比特位置为i的比特。
如表1 8比特字节地排序举例
msh lsb
b7 b6 b5 b4 b3 b2 b1 b0
字节排序:需要超过8位比特来表示的数据,在视盘中占有一个以上的字节。对于所有这些数据来说,在视盘上的字节排列次序是:最高有效字节(MSB)在最前面,而最低有效字节(LSB)在最后。
多字节数据的图示表示为:左边或更高的字节是最高有效字节,右边或更低的字节是最低有效宇节。
表2两个字节地数据排序举例
MSB LSB b15… b8 b7… b0 字节B1 字节B2
数字表示法
十进制表示法:数字的十进制标记用十进制数字表示,最高有效位在左边,最低有效位在右边。
十六进制表示法:数字的十六进制标记用一个或多个十六进制数字的序列后跟一个“h”表示,最高有效位在左边,最低有效位在右边。
十六进制数字0 1 2 3 4 5 6 7 8 9 A B C D E F
十进制值 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
二进制数的标识:所有的二进制数后面都加上一个b,最高有效位在左边,最低有效位在右边。一个二进制数由0、1或*表示,(*可为0或1)。
基本类型
INTn n位的有符号整数(n可以为8,16,32,64)。
UINTn n位的无符号整数(n可以为8,16,32,64)。
Bytes 无确切含义的多个字节,填充内容是从低字节开始,未填充的内容必须全部置为0。
LSN 逻辑扇区号,其实逻辑扇区的逻辑扇区号为0,以后每个逻辑扇区的逻辑扇区号为前一个逻辑扇区的逻辑扇区号加1。
RBP 相对字节位置
RLSN 相对逻辑扇区号
STRING 以ASCII编码的字符串
ZERO 表示对应字节的所以比特均为零
HVD盘信息组成
HVD盘上的数据由盘片总体信息文件和音视频播放控制文件组(属性信息文件、索引信息文件和命令控制文件)和音视、视频播放流数据文件组成。参见图1。
总体信息文件
总体信息文件中包含有该盘片的总体信息,以及关于各个音频、视频播放流文件的信息,盘片的菜单信息,盘片的播放入口信息等。其数据结构见下表3:
相对偏移RBP 数据段名称说明字节数 数据类型0-7 NAV_VER总体信息文件版本号8 STRING8-39 DISC_NAME盘片名32 STRING40-71 PVR_IFO出版商名称32 STRING72-73 TITLE_NO音视频流数目2 UINT1674 FP_TITLE首播放流号1 UINT8
75 FP_CHAPTER首播放流章节号 1 UINT876-107 MENU_IFO菜单信息文件名 32 STRING108-139 T1_IFO播放流1信息文件名(可选项) 32 STRING140-171 T2_IFO播放流2信息文件名(可选项) 32 STRING202-233 T3_IFO播放流3信息文件名(可选项) 32 STRING …… Tn_IFO播放流n信息文件名(可选项) 32 STRING
HVD盘片的总体信息文件名使用固定的hvd.ifo。此为唯一的固定文件名,标志着该盘片为HVD盘片。该文件记录在DVD物理介质上。是整个HVD盘的引导文件。
音视频播放控制文件组
音视频播放控制文件组由三个文件组成:属性信息文件、索引信息文件和命令控制文件。
属性信息文件
属性信息文件中包含有此音频、视频播放流的音频、视频及字幕的属性,以及关于索引信息文件和控制信息文件的信息,播放章节信息等。其数据结构见下表4:
相对偏移RBP 数据段名称 说明字节数 数据类型0-7 NAVT_VER 属性信息文件版本号8 STRING8-39 TITLE_NAME 音视频播放流名称32 STRING40-71 PVR_IFO 出版商名称32 STRING72-73 CHAPTER_NO 章节数目2 UINT1674 File_NO 音视频播放流所含文件数1 UINT8
75 VIDEO_Ns音视频播放流所含视频数目1 UINT8 VIDEO_ATTR[i]音视频播放流所含各个视频的属性2*Video_Ns AUDIO_Ns音视频播放流所含音频数目2 UINT16 AUDIO_ATTR[i]音视频播放流所含各个音频的属性2*Audio_Ns CAPTION_Ns音视频播放流所含字幕数目2 UINT16 CAPTION_ATTR[ i]音视频播放流所含各个字幕的属性2*CAPTION_Ns PLAY_STREAM音视频播放流压缩数据文件的文件名称32 STRING INDEX_IFO音视频播放流索引信息文件的文件名称32 STRING PLAYBACK_INO音视频播放流命令控制文件的文件名称32 STRING CAPTION_LIB音视频播放流字幕所用字体库的文件名称32 STRING CHAP1_NAME章节一的名称32 STRING CHAP1_S_TIME章节一的开始时间4 UINT32 CHAP2_NAME章节二的名称(可选)32 STRING CHAP2_S_TIME章节二的开始时间(可选)4 UINT32 CHAP3_NAME章节三的名称(可选)32 STRING CHAP3_S_TIME章节三的开始时间(可选)4 UINT32 ……(可选) CHAPn_NAME章节n的名称(可选)32 STRING CHAPn_S_TIME章节n的开始时间(可选)4 UINT32
其中VIDEO_TTR[i]记录音频、视频播放流所含各个视频的属性。该音频、视频播放流所包含的不同视频节目的属性。其数据结构如下表5:B15B14 B13 B12 B11 B10 B9 B8每秒显示频率视频系统类型 电视系统模式 长宽比 显示方式B7B6 B5 B4 B3 B2 B1 B0 加密方式 图像分辨率 视频压缩模式
15:每秒显示频率
0: 60HZ
1: 50HZ
14:视频系统类型
0:PES
1:ES
13-12:电视系统模式
00:525/60
01:625/50
10:720p/60/50
11:1080i/60/50
11-10:长宽比
00:4∶3
01:1∶1
10:保留
11:16∶9
9-8:显示方式
00:Pan-scan和LetterBox
01:只有Pan-scan
10:只有LetterBox
11:保留7-6:加密方式
00:未加密
01:加密方式1
10:加密方式2
11:加密方式3
5-3:图像分辨率
525/60系统:
000:720×480
001:704×480
010:352×480
011:352×240
Others:保留625/50系统:
000:720×576
001:704×576
010:352×576
011:352×288
Others:保留720p/60系统:
000:1280×720
001:960×720
010:720×720
Others:保留1080i/60系统:
000:1920×1080
001:1280×1080
010:1280×540
011:960×540
Others:保留
2-0:视频压缩模式
000:Mpeg-1
001:Mpeg-2
010:Mpeg-4/Divx
011:Jpeg
100:H.264
101:WMV9
110:AVS
111:保留
此数据结构对HVD盘上视频播放流的格式做了详细的定义。视频压缩模式可以采用MPEG1、MPEG2、MPEG4、H.264、WMV9、AVS及JPEG标准;图像分辨率主要采用960*720的高清格式,最高可达1920*1080。
索引信息文件
所有音频、视频播放流文件在播放过程中如果要做时间搜索及特技播放(比如快进、快退、慢进和慢退等等)都需要得到与之相配的I帧图像的在播放流中的偏移位置。
为了使得播放机的控制简单,本导航系统采用固定的时间间隔,作为时间索引的单位。索引信息文件中包含有每个时间索引单位所对应的I帧图像在播放流中的偏移位置,以及对应的I帧图像是否有视频流信息头信息与之相对应。
对视频流进行分析后,将所得到的该视频流的索引信息专门存放于一个单独的文件(索引信息文件)中,使文件的结构如下表6:
相对偏移RBP数据段名称说明字节数 数据类型0-7IDX_VER索引文件版本号8 STRING8-11ENTRY_NUM时间索引总数4 UNIT3212-15SECTOR_OFF000.0秒的偏移位置4 UNIT32
16-19 SECTOR_OFF050.5秒的偏移位置 4 UNIT32 20-23 SECTOR_OFF101.0秒的偏移位置 4 UNIT32 24-27 SECTOR_OFF151.5秒的偏移位置 4 UNIT32 SEQ_INFO_NUMBER视频信息头变化次数 4 UNIT32 SEQ_INFO_OFFSET视频信息头数据在索引文件中位置 4*SEQ_IN FO_NUMBER UNIT32 SEQ_INFO_SECTOR视频信息头在视频压缩码流中的偏移位置 4 UNIT32 SEQ_INFO_LENGTH视频信息头的数据长度 4 UNIT32 SEQ_INFO视频信息头数据 SEQ_INFO _LENGTH ……
命令控制文件
命令控制文件是用来存储盘片所要求的用来控制盘片播放顺序及播放效果的信息的文件。所有的控制信息是以命令的形式存在的。命令文件由若干命令集组成,每个命令集由若干命令组成。此命令控制文件的结构如图2所示。
命令控制文件的格式为表7:
相对偏移RBP数据段名称 说明 字节数 数据类型0-7 CTR_VER 控制文件版本号 8 STRING 8-11 CMD_TABLE_NUM 指令集总数 4 UNIT32 CMD_TABLE_1 指令集1 CMD_TABLE_2 指令集2 。。。 CMD_TABLE_n 指令集n
指令集说明
指令集中的指令按其功能可划分为四类:
1、播放过程控制
控制各个音视频流的播放状态及相互之间的播放连接。
2、播放参数的设置
设置播放机播方过程中使用的一些参数,比如音频及字幕语言的选择。
3、字幕参数的设置
设置字幕所用的调色板及与视频层的混合程度。使用命令控制的方式来设置字幕的参数,可使得字幕的显示效果更多样化及便于播放机实现。
4、字幕高亮区的控制
用户参与互动的操作功能已成为音视频盘片播放不可缺少的功能之一,因此按钮的显示及操作也成为导航系统的必备功能。本导航系统采用字幕高亮方式与视频图像的配合来形成用户参与互动选择的按钮。将所有高亮控制全部集成在此命令控制文件中方便了盘片制作系统的制作,而且使得播放机的播放实现变得较为简单。高亮区控制命令主要包括高亮区域的设定、高亮调色板及与视频层混合度的设置,按钮之间相对切换信息的设置和按钮功能的设置等。
所有的命令按执行时间存储于不同的命令之中,相同执行时间的命令存储于同一个命令之中,按存储的顺序执行。
指令集中支持的命令见表8:
指令类型 指令名称说明参数数目 1 CMD_PLAY_END播放流结束标志0 2 CMD_PLAY_POINT下一次播放入口2 3 SET_SUB_ATTR设置字幕显示参数16 4 SET_BUTTON_NUM设置按钮个数1 5 SET_HLI_AREA设置高亮显示区域5 6 SET_BUTTON_ACTION设置按钮对应功能2 7 SET_HLI_BUTTON设置选中按钮1 8 CMD_PLAY_RSM记忆播放开始0 9 SET_STILL_TIME设置静止画面时间1 10 SET_HLI_ATTR设置高亮区显示参数16 11 SET_SEL_ATTR设置高亮选中区显示参数16 12 ENABLE_HLI允许高亮显示0 13 DISABLE_HLI禁止高亮显示0 14 CMD_STOP停止播放0 15 SET_AUDIO选择音频语言1
16 SET_CAPTI_ON 选择字幕语言 1 255 CMD_END 命令结尾 0
备份文件
总体控制文件和音视频播放控制文件组中的属性信息文件、索引信息文件和命令控制文件都是播放机实现播放过程中很重要的文件,可以选择增加一组后缀为BAK的备份文件存储在同一张盘片上,这些备份文件的内容和原文件相同,仅在以上所提及的文件被破坏时使用。HVD盘的所有控制相关的导航信息都是与音频、视频流分开存放的,都可以备份,提高了盘片播放的容错性能。
HVD盘导航工作原理、流程,参见图3。HVD盘导航工作分为以下几个步骤:
1、盘引导过程:检测盘片上是否存在HVD盘的总体控制文件(hvd.ifo);如果该文件存在,读取其控制信息并分析若总体控制文件中的版本号信息是否为“HVD-xxxx”;如果信息正确,则判定该盘为HVD盘。
2、确定首播音频、视频播放流过程:分析步骤1读取的总体控制文件,从中提取出预先设置的HVD盘首播的音频、视频播放流号;读取该音频、视频播放流首播的章节号。
3、播放音频、视频播放流过程:根据取得的音频、视频播放流号,在HVD盘上找相应的音视频播放控制文件组文件;读取并读取相应的属性信息文件、索引信息文件和命令控制文件;根据取得的音频、视频播放流的章节号,检索索引信息文件并或得记录真实音频、视频播放流的位置信息;读取音频、视频播放流数据,由解码器解码播放。
4、播放过程中控制盘片播放顺序及播放效果过程:读取音视频播放控制文件组中的命令控制文件;根据和命令集相关联的时间,执行特定的命令集中的命令;根据不同的命令,执行后达到不同的播放顺序及播放效果。
5、播放过程中实现各种特技播放操作过程:读取音视频播放控制文件组中的索引信息文件;按照用户的要求检索索引信息文件,提取欲播放的音频、视频流信息的物理位置;由解码器读取特定点的音频、视频流信息,从而实现各种特技播放操作,例如快进、慢进、快退、慢退、时间搜索、编程播放、随机播放、播放流重复、章节重复、两点重复及标签设置等等。