在数字视频压缩码流中快速索引播放信息的方法.pdf

上传人:54 文档编号:536246 上传时间:2018-02-21 格式:PDF 页数:15 大小:730.84KB
返回 下载 相关 举报
摘要
申请专利号:

CN200410016540.5

申请日:

2004.02.26

公开号:

CN1561111A

公开日:

2005.01.05

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回|||实质审查的生效|||公开

IPC分类号:

H04N7/26

主分类号:

H04N7/26

申请人:

晶晨半导体(上海)有限公司;

发明人:

钟培峰; 陈实

地址:

200030上海市淮海西路55号5楼A座

优先权:

专利代理机构:

上海交达专利事务所

代理人:

王锡麟;王桂忠

PDF下载: PDF下载
内容摘要

一种在数字视频压缩码流中快速索引播放信息的方法,属于数字视频播放领域。本发明预先分析视频压缩码流,从中提取有用的索引信息,包括视频流头信息及I帧图像的具体位置信息,同时采用固定的时间间隔的方式存储索引信息;通过查找记录I帧图像数据的相对偏移位置及是否有视频流信息头与之相对应,由播放时间一次查找出相对位置,从而实现多种视频压缩码流的时间搜索和特技播放。本发明是一种简单、高效、系统开销非常低、支持多种视频压缩码流、支持多种特技播放方式的快速索引方法。

权利要求书

1: 一种在数字视频压缩码流中快速索引播放信息的方法,其特征在于,预先分 析视频压缩码流,从中提取有用的索引信息,包括视频流头信息及I帧图像的具体 位置信息,同时采用固定的时间间隔的方式存储索引信息;通过查找记录I帧图像数 据的相对偏移位置及是否有视频流信息头与之相对应,由播放时间一次查找出相对位 置,从而实现多种视频压缩码流的时间搜索和特技播放。
2: 根据权利要求1所述的在数字视频压缩码流中快速索引播放信息的方法,其 特征是,以下对本发明方法的进一步限定,方法包括两个部分: (1)索引文件的生成: 通过分析视频压缩码流,若找到视频流头,则从码流中提取该视频流头信息,并 记录下来;若找到I帧图像,则根据本I帧图像的时间点x和固定时间间隔单位y, 计算出本I帧图像的索引点n,n=round(x/y);round函数表示四舍五入,即找到离 本I帧图像最近的索引点,若索引数组index[n]的值是初始值0xffffffff,则表示本索 引点没有对应的I帧图像,将本帧图像在码流中的相对位置m记录到index[n];否 则对比index[n]对应的I帧图像的时间点x’和当前I帧图像的时间点x,若|x’-n*y|> |x-n*y|,即当前I帧图像的时间点x更靠近索引时间n*y,则将本帧图像在码流中的 相对位置m记录到index[n];否则保留index[n]的值; (2)索引文件的使用: 播放机读取索引文件信息、控制信息,根据控制信息开始播放,随时响应用户输 入,若用户需要作时间搜索或特技播放,则根据时间搜索或特技播放的某个时间点, 在索引文件中查找对应时间点的I帧图像在码流中的相对位置,然后跳到该位置开始 播放。
3: 根据权利要求1或2所述的在数字视频压缩码流中快速索引播放信息的方法, 其特征是,所述的时间搜索或特技播放,具体流程如下: (1)获取索引信息; (2)判断是否有搜索命令; (3)若是则根据搜索时间点在索引文件中查找对应I帧图像数据在压缩码流中 的相对位置; (4)若相对位置的值是0xffffffff,则向前或向后搜索另一个I帧图像数据在压 缩码流中的相对位置,直到若相对位置的值不是0xffffffff; (5)判断本I帧图像数据是否有对应的视频信息头; (6)若是则开始播放,否则找到上一个视频流头,将该视频流头信息插到I帧 图像之前,重新开始播放。
4: 根据权利要求1或2所述的在数字视频压缩码流中快速索引播放信息的方法, 其特征是,索引信息文件还包含有此压缩码流中视频信息头变化的次数、位置及数据, 通过记录视频流信息头变化的次数、位置及数据,从而方便快速的从任意的I帧图像 开始播放。

说明书


在数字视频压缩码流中快速索引播放信息的方法

    【技术领域】

    本发明涉及的是一种信息索引和播放的方法,特别是一种在数字视频压缩码流中快速索引播放信息的方法。属于数字视频播放领域。

    背景技术

    目前来说,常用的数字视频的格式有MPEG-1、MPEG-2、MPEG-4,在数字视频的播放过程中经常需要通过时间搜索实现从某一特定点开始播放的功能。VCD采用MPEG-1(参见ISO/IEC 11172-2)编码,采用固定码率编码,其播放点可通过播放时间*编码率直接找到,但是其视频的压缩效率受限,对图像的质量有很大影响,且实现特技播放有较大的困难或根本无法实现,因此VCD已经逐渐被DVD所替代。

    经对相关文献的检索发现,DVD标准规格书第三部份视频规格(DVD Speci-fieations for Read-Only Disc Part3 Video Specifications Version 1.12)有对时间搜索的详细说明,DVD视盘采用MPEG-2(参见ISO/IEC 13818-2),它是可变码率编码,压缩效率及图像质量都有很大提高,但是其索引数据是复合在压缩码流中专门的控制包内,而且每一个索引包后面都必须有一个视频流信息头,所以其索引数据的系统开销较大。虽然其索引数据的格式很灵活,可以使得特技播放的效果多样化,但也同时造成了播放机的实现相对困难,很难做到对所有种类地盘都能进行完美播放,并且视频码流压缩也需要专门的软件才能够用到DVD视盘的所有功能;同时随着科技的进步,特别是HDTV的出现,消费者需要更高的分辨率,而DVD视盘的D1格式已不能满足消费者的需求,高清格式的盘片应运而生,但高质量同时也带来了高系统开销的问题;且各种各样的视频压缩格式也越来越多,采用某些视频压缩格式压缩的码流中根本没有索引信息,即无法使用DVD的索引方法。

    综上所述,目前DVD的搜索方式还存在一些不足之处:

    1、虽然DVD标准规格书规定的搜索方法功能强大,索引数据的格式灵活,但非常复杂,使得播放机的实现对盘片播放时很难覆盖所有的情况,很难做到对所有种类的盘都能进行完美播放。

    2、由于索引数据是复合在压缩码流中专门的控制包内,而且每一个索引包后面都必须有一个视频流信息头,所以其索引数据的系统开销较大。

    3、DVD标准规格书规定的搜索方法主要是针对MPEG-2的特点而设置,没有充分考虑其他格式的视频压缩的码流的搜索。

    考虑到成本、市场需求等因素,需要有一个低系统开销、支持多种视频压缩码流、支持多种特技播放方式的索引办法来满足消费者的需要,同时简化播放机的实现方式,降低生产成本。

    【发明内容】

    本发明针对现有技术中存在的以上不足和缺陷,提供一种在数字视频压缩码流中快速索引播放信息的方法。使其成为一种简单、高效、系统开销非常低、支持多种视频压缩码流且能支持多种特技播放方式的快速索引方法。

    本发明是通过以下技术方案来实现的,本发明预先分析视频压缩码流,从中提取有用的索引信息,包括视频流头信息及I帧图像的具体位置信息,同时采用固定的时间间隔的方式存储索引信息;通过查找记录I帧图像数据的相对偏移位置及是否有视频流信息头与之相对应,由播放时间一次查找出相对位置,从而实现多种视频压缩码流的时间搜索和特技播放。

    以下对本发明方法作进一步的说明,方法分为两部分:

    (1)索引文件的生成:

    通过分析视频压缩码流,若找到视频流头,则从码流中提取该视频流头信息,并记录下来;若找到I帧图像,则根据本I帧图像的时间点x和固定时间间隔单位y,计算出本I帧图像的索引点n(n=round(x/y);round函数表示四舍五入,即找到离本I帧图像最近的索引点),若索引数组index[n]的值是0xffffffff(初始值),则表示本索引点没有对应的I帧图像,将本帧图像在码流中的相对位置m记录到index[n];否则对比index[n]对应的I帧图像的时间点x’和当前I帧图像的时间点x,若|x’-n*y|>|x-n*y|,(即当前I帧图像的时间点x更靠近索引时间n*y),则将本帧图像在码流中的相对位置m记录到index[n];否则保留index[n]的值。如此重复,直到码流结束,然后把所有提取出来的视频流头信息和时间点的索引信息index存储起来,就得到了索引文件。

    (2)索引文件的使用:

    播放机读取索引文件信息、控制信息,根据控制信息开始播放,随时响应用户输入,若用户需要作时间搜索或特技播放,则根据时间搜索或特技播放的某个时间点,在索引文件中查找对应时间点的I帧图像在码流中的相对位置,然后跳到该位置开始播放。

    所述的时间搜索或特技播放,具体流程如下:

    1)、获取索引信息;

    2)、判断是否有搜索命令;

    3)、若是则根据搜索时间点在索引文件中查找对应I帧图像数据在压缩码流中的相对位置;

    4)、若相对位置的值是0xffffffff,则向前或向后搜索另一个I帧图像数据在压缩码流中的相对位置,直到若相对位置的值不是0xffffffff;

    5)、判断本I帧图像数据是否有对应的视频信息头;

    6)、若是则开始播放,否则找到上一个视频流头,将该视频流头信息插到I帧图像之前,重新开始播放。

    为了适应不同的编码软件所产生的不同格式的压缩视频流,此索引信息文件还包含有此压缩码流中视频信息头变化的次数、位置及数据,便于播放机在播放时使用,可以方便快速的从没有视频流头信息的I帧图像开始播放。

    与现有技术相比,本发明具有以下特点:1)采用固定的时间间隔去存储索引信息,使得索引文件的结构简单明了,大大的方便了盘片制作系统制作盘片的过程及播放机时间搜索和特技播放的实现。为了使得播放机的控制简单,本发明所定义的索引方法采用固定的时间间隔,比如0.5秒,作为时间索引的单位。2)记录I帧图像数据的相对偏移位置及是否有视频流信息头与之相对应,可由播放时间一次查找出相对位置,从而达到方便快捷地检索信息的目的。3)记录视频流信息头变化的次数、位置及数据,可以方便快速的从没有视频流头信息的I帧图像开始播放。

    【附图说明】

    图1为索引文件例图

    图2为索引文件的制作流程图

    图3为索引文件的播放流程图

    具体实现方式

    如图所示,下面将描述发明的最佳实施例

    在描述根据本发明的最佳实施例之前,先给出在描述实施例时会用到的约定、数字表示法和基本类型说明,这些信息是构成最佳实施例的基本知识或数据描述方法的说明,有助于比较好地理解最佳实施例。

    约定

    比特排序:所有多位比特数的图示表示为最高有效位(msb)在左边,最低有效位(lsb)在右边。最高有效位比特是具有最高比特位号的比特。

    如下表,比特i表示比特位置为i的比特。

    表1  8比特字节地排序举例

    msb                                             lsb

    字节排序:需要超过8位比特来表示的数据,在视盘中占有一个以上的字节。对于所有这些数据来说,在视盘上的字节排列次序是:最高有效字节(MSB)在最前面,而最低有效字节(LSB)在最后。

    多字节数据的图示表示为:左边或更高的字节是最高有效字节,右边或更低的字节是最低有效宇节。

    表2  两个字节地数据排序举例

    数字表示法

    十进制表示法:数字的十进制标记用十进制数字表示,最高有效位在左边,最低有效位在右边。

    十六进制表示法:数字的十六进制标记用一个或多个十六进制数字的序列后跟一个“h”表示,最高有效位在左边,最低有效位在右边。

    十六进制数字0 1 2 3 4 5 6 7 8 9 A B C  D  E F

    十进制值0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

    二进制数的标识:所有的二进制数后面都加上一个b,最高有效位在左边,最低有效位在右边。一个二进制数由0、1或*表示,(*可为0或1)。

    基本类型

    INTn   n位的有符号整数(n可以为8,16,32,64)。

    UINTn  n位的无符号整数(n可以为8,16,32,64)。

    Bytes  无确切含义的多个字节,填充内容是从低字节开始,未填充的内容必须全部置为0。

    LSN   逻辑扇区号,起始逻辑扇区的逻辑扇区号为0,以后每个逻辑扇区的逻辑扇区号为前一个逻辑扇区的逻辑扇区号加1。

    RBP   相对字节位置

    RLSN  相对逻辑扇区号

    STRING以ASCII编码的字符串

    ZERO表示对应字节的所以比特均为零

    索引方法的实施例

    根据索引方法的原理和说明,它的实施例可分为三部分分别描述:索引文件的定义;索引文件的生成;索引文件的使用。

    1、索引文件的定义:

    所有音视频文件播放过程中如果要做时间搜索及特技播放(比如快进、快退、慢进和慢退)等等都需要得到与之相配的I帧图像的在播放码流中的偏移位置。为了使得播放机的控制简单,本索引方法采用固定的时间间隔,比如0.5秒,作为时间索引的单位。索引信息文件中包含有每个时间索引单位的所对应的I帧图像的在播放码流中的偏移位置,以及对应的I帧图像是否有视频流信息头信息与之相对应。为了适应不同的编码软件所产生的不同格式的压缩视频流,此索引信息文件还包含有此压缩码流中视频信息头变化的次数、位置及数据,便于播放机在播放时使用。

    根据这些要求,首先需要一个存储索引信息的文件,根据索引信息的特点,定义了索引文件的结构,如下表3: 相对偏移RBP  数据段名称  说明  字节数  数据类型 0-7  IDX_VER  索引文件版本号  8  STRING 8-11  ENTRY_NUM  时间索引总数  4  UNIT32 12-15  SECTOR_OFF00  0.0秒的偏移位置  4  UNIT32 16-19  SECTOR_OFFO5  0.5秒的偏移位置  4  UNIT32 20-23  SECTOR_OFF10  1.0秒的偏移位置  4  UNIT32 24-27  SECTOR_OFF15  1.5秒的偏移位置  4  UNIT32  ……  SEQ_INFO_NUMBER  视频信息头变化次数  4  UNIT32  SEQ_INFO_OFFSET  视频信息头数据在索引  文件中位置  4*SEQ_INFO_  NUMBER  UNIT32  SEQ_INFO_SECTOR  视频信息头在视频压缩  码流中的偏移位置  4  UNIT32  SEQ_INFO_LENGTH  视频信息头的数据长度  4  UNIT32  SEQ_INFO  视频信息头数据  SEQ_INFO_LE  NGTH……

    IDX_VER  索引文件版本号

    索引信息文件版本号,类型为ASCII字符串,供播放机播放时使用。

    比如“NAVI0100”表明版本1.00。

    ENTRY_NUM  时间索引总数

    该视频播放流的时间索引总数,类型为整数。

    因为采用固定时间间隔存储,可由此参数算出该视频播放流的总播放时间,例如固定时间间隔为0.5秒则该视频播放流的总播放时间为(0.5*时间索引总数)秒。

    SECTOR_OFF00  0.0秒的偏移位置

    其格式为表4:  B31    B30  B29  B28  B27  B26    B25    B24  视频流信息头  标志位                        I帧图像偏移位置(30:24)  B23    B22  B21  B20  B19  B18    B17    B16                                        I帧图像偏移位置(23:16)  B15    B14  B13  B12  B11  B10    B9    B8                                        I帧图像偏移位置(15:8)  B7    B6    B5    B4    B3    B2    B1    B0                                        I帧图像偏移位置(7:0)

    播放时间为0.0秒的I帧图像相对位置及视频流信息头标志位

    视频流信息头标志位:0---无相对应视频流信息头

                        1---有相对应视频流信息头

    I帧图像偏移位置:I帧图像离视频播放流起始位置的偏移量(偏移字节数/2048),类型为整数。如偏移量为0xFFFFFFFF,表明无相应的I帧图像对应指定的时间;

    SECTOR_OFF05  0.5秒的偏移位置

    播放时间为0.5秒的I帧图像相对位置及视频流信息投标志位,其格式同上;

    SECTOR_OFF10  1.0秒的偏移位置

    播放时间为1.0秒的I帧图像相对位置及视频流信息投标志位,其格式同上;

    SECTOR_OFF15  1.5秒的偏移位置

    播放时间为1.5秒的I帧图像相对位置及视频流信息投标志位,其格式同上;

    ……  

    SEQ_INFO_NUMBER视频信息头变化次数

    视频信息头在整个视频播放流中变化的次数类型为整数。因为一般来讲在整个视频播放流中,视频信息头几乎是不变的,而只有不同的视频信息头才会记录在索引信息文件中,因此此参数应是一个很小的数。

    SEQ_INFO_OFFSET视频信息头数据在索引文件中位置

    此为各个视频信息头数据在索引文件中的偏移字节数,类型为整数。

    SEQ_INFO_SECTOR视频信息头在视频压缩码流中的偏移位置

    此为各个视频信息头数据在视频压缩文件中的偏移量(偏移字节数/2048),类型为整数。

    SEQ_INFO_LENGTH视频信息头的数据长度

    此为各个视频信息头数据的字节数,类型为整数。

    SEQ_INFO视频信息头数据

    此为各个视频信息头数据的数据,长度为视频信息头的数据长度。

    索引文件的提取举例,如图1所示,有一段用MPEG-2标准编码的视频流,其开始几秒的I帧分布情况为0.0秒、0.7秒、1.4秒、2.1秒;且0.0秒和2.1秒的I帧前附加有视频信息头数据。按本发明所定义的索引文件结构,我们以0.5秒作为固定间隔。记录在索引文件中的数据为:0.0秒时,SECTOR_OFF00为0x80000000(表明有相对应视频流信息头且I帧图像离视频播放流起始位置的偏移量为0);0.5秒时,SECTOR_OFF05为0x00000120(表明无相对应视频流信息头且I帧图像离视频播放流起始位置的偏移量为0x120);1.0秒时,SECTOR_OFF10为0xffffffff(表明无相应的I帧图像对应指定的时间,视频流1.4秒记录的I帧由于更靠近1.5秒的间隔点,因此被记录在1.5秒对应的位置中);1.5秒时,SECTOR_OFF15为0x00000250(表明无相对应视频流信息头且I帧图像离视频播放流起始位置的偏移量为0x250);2.0秒时,SECTOR_OFF00为0x80000360(表明有相对应视频流信息头且视频信息头数据在索引文件中位置为0x360)。

    2、索引文件的生成:

    得到具体的索引文件的结构之后,根据生成索引文件的具体流程,对视频压缩码流进行分析,不同视频压缩码流的分析方法不尽相同,但基本原理都是一样:通过分析视频压缩码流,若找到视频流头,则从码流中提取该视频流头信息,并记录下来;若找到I帧图像,则根据本I帧图像的时间点x和固定时间间隔单位y,计算出本I帧图像的索引点n(n=round(x/y)),若索引文件SECTOR_OFFn(即index[n])的值是0xffffffff(初始值),则表示本索引点没有对应的I帧图像,将本帧图像在码流中的相对位置m记录到SECTOR_OFFn,同时根据该I帧的前面是否有视频流信息头来设置视频流信息头标志位;否则对比SECTOR_OFFn对应的I帧图像的时间点x’和当前I帧图像的时间点x,若|x’-n*y|>|x-n*y|,(即当前I帧图像的时间点x更靠近索引时间n*y),则将本帧图像在码流中的相对位置m记录到SECTOR_OFFn,同时根据该I帧的前面是否有视频流信息头来设置视频流信息头标志位;否则保留SECTOR_OFFn的值。如此重复,直到码流结束。

    这里用MPEG-2码流作为本发明实施例的说明,如图2所示,首先顺序读取MPEG-2的视频压缩码流,根据MPEG-2的标准,对压缩码流逐字分析:

    若碰到视频流头信息,视频信息头变化次数(SEQ_INFO_NUMBER)加一,记录下视频信息头在视频压缩码流中的偏移位置(SEQ_INFO_SECTOR),同时把视频信息头的长度和内容分别从压缩码流中提取出来,记录到SEQ_INFO_LENGTH和SEQ_INFO数据项;

    若碰到视频I帧,把该视频I帧在码流中的偏移位置m和播放时间点x记录下来,根据固定时间间隔单位y,计算出本I帧图像的索引点n(n=round(x/y)),若索引SECTOR_OFFn的值是0xffffffff(初始值),则表示本索引点没有对应的I帧图像,将本帧图像在码流中的相对位置m记录到SECTOR_OFFn;否则对比SECTOR_OFFn对应的I帧图像的时间点x’和当前I帧图像的时间点x,若|x’-n*y|>|x-n*y|,(即当前I帧图像的时间点x更靠近索引时间n*y),则将本帧图像在码流中的相对位置m记录到SECTOR_OFFn,同时根据该I帧的前面是否有视频流信息头来设置SECTOR_OFF数据项的视频流信息头标志位;否则保留SECTOR_OFFn的值;

    如图1所示,有一段用MPEG-2标准编码的视频流,其开始几秒的I帧分布情况为0.0秒、0.7秒、1.4秒、2.1秒;若我们用固定时间间隔单位y=0.5秒生成索引文件,则每个I帧的索引点n为0,1,3,4,得到的索引点的值是0x80000000,0x00000120,0xffffffff,0x00000250,0x80000360。

    最后将所分析得到的索引信息存放在上述定义的索引文件中,并将本索引文件、其他的控制文件和视频压缩码流记录在信息记录介质上,就完成了索引文件的生成。

    3、索引文件的使用:

    索引文件的使用非常简单,也就是说播放器的实现将非常简单。如图3所示,在视频的播放过程中,若用户需要做时间搜索及特技播放(比如快进、快退、慢进和慢退),则根据用户需要的时间点,例如2分30秒,即150秒,因为此处定义的固定时间片为0.5秒,所以该时间点在索引文件中的偏移SECTOR_OFF300的值是8(IDX_VER)+4(ENTRY_NUM)+300*4=1212,根据偏移值从索引文件中读出I帧图像相对位置及视频流信息头标志位,若I帧图像相对位置是0xffffffff,则表示当前时间点没有对应的I帧图像,这时候可从当前时间点向前或向后搜索,直到找到一个I帧图像,具体向前或向后搜索可根据不同播放器的实现自由选择,找到I帧图像后,再根据视频流信息头标志位判断本I帧图像是否有视频流信息头,若有,则把它加在I帧图像前,开始播放,否则在索引文件中查找上一个视频流信息头,把它加在I帧图像前,然后开始播放。

    综上所述,根据本发明的方法,利用简单的数据结构,实现了多种数字视频压缩码流的时间搜索和特技播放,是一种新颖、高效、低成本、应用范围广泛的索引方法。这里仅特别描述了本发明的某个具体的实施案例,可根据实际需求,在没有脱离本发明的精神和范围内可以作出各种修改。

在数字视频压缩码流中快速索引播放信息的方法.pdf_第1页
第1页 / 共15页
在数字视频压缩码流中快速索引播放信息的方法.pdf_第2页
第2页 / 共15页
在数字视频压缩码流中快速索引播放信息的方法.pdf_第3页
第3页 / 共15页
点击查看更多>>
资源描述

《在数字视频压缩码流中快速索引播放信息的方法.pdf》由会员分享,可在线阅读,更多相关《在数字视频压缩码流中快速索引播放信息的方法.pdf(15页珍藏版)》请在专利查询网上搜索。

一种在数字视频压缩码流中快速索引播放信息的方法,属于数字视频播放领域。本发明预先分析视频压缩码流,从中提取有用的索引信息,包括视频流头信息及I帧图像的具体位置信息,同时采用固定的时间间隔的方式存储索引信息;通过查找记录I帧图像数据的相对偏移位置及是否有视频流信息头与之相对应,由播放时间一次查找出相对位置,从而实现多种视频压缩码流的时间搜索和特技播放。本发明是一种简单、高效、系统开销非常低、支持多种。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1