利用层间相关性编码层内标记的方法、及解码方法和设备.pdf

上传人:111****112 文档编号:697456 上传时间:2018-03-05 格式:PDF 页数:27 大小:1.06MB
返回 下载 相关 举报
摘要
申请专利号:

CN200610136257.5

申请日:

2006.10.19

公开号:

CN1976458A

公开日:

2007.06.06

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):H04N 7/26公开日:20070606|||实质审查的生效|||公开

IPC分类号:

H04N7/26(2006.01); H04N7/32(2006.01); H04N7/50(2006.01)

主分类号:

H04N7/26

申请人:

三星电子株式会社;

发明人:

李培根; 韩宇镇

地址:

韩国京畿道

优先权:

2005.10.19 US 60/727,851; 2006.01.13 KR 4139/06

专利代理机构:

北京市柳沈律师事务所

代理人:

李芳华;邸万奎

PDF下载: PDF下载
内容摘要

一种基于层间相关性对在基于多层的可伸缩视频编解码器中使用的各种标记进行有效编码的方法和设备。该编码方法包括:判断在指定单元区域中包括的当前层的标记是否全部等于基本层的标记;根据该判断结果而设置指定预测标记;和如果判断当前层的标记等于基本层的标记,则跳过当前层的标记,并将基本层的标记和预测标记插入到比特流中。

权利要求书

1.  一种利用与基本层的对应标记的相关性而对在基于多层的视频中使用的当前层的标记进行编码的方法,该方法包括:
确定在指定单元区域中包括的当前层的标记是否等于基本层的标记;
根据该确定结果而设置预测标记;和
如果确定当前层的标记等于基本层的标记,则将基本层的标记和预测标记插入到比特流中。

2.
  根据权利要求1的方法,还包括:如果确定当前层的标记不等于基本层的标记,则对当前层的标记进行熵编码,并将基本层的标记、预测标记、和熵编码后的当前层的标记插入到该比特流中。

3.
  根据权利要求2的方法,还包括在熵编码之前对当前层的标记和基本层的标记执行异或运算,
其中所述熵编码后的当前层的标记是通过执行异或运算而获得的值。

4.
  根据权利要求1的方法,其中该单元区域对应于帧、码片、宏块、或子块。

5.
  根据权利要求1的方法,其中当前层的标记和基本层的标记包括残留预测标记、基本层内标记、运动预测标记、基本模式标记、和细分系数的符号标记中的至少一个。

6.
  根据权利要求1的方法,其中,如果确定当前层的标记等于基本层的标记,则将预测层设置为“1”,而如果确定当前层的标记不等于基本层的标记,则将预测层设置为“0”。

7.
  一种利用与基本层的对应标记的相关性而对在基于多层的视频中使用的当前层的标记进行编码的方法,该方法包括:
对当前层的标记和基本层的标记执行异或运算;
对通过执行异或运算获得的值进行熵编码;和
将熵编码后的值和基本层的标记插入到比特流中。

8.
  根据权利要求7的方法,其中该熵编码包括可变长度编码、算术编码、和霍夫曼编码中的至少一个。

9.
  根据权利要求7的方法,其中当前层的标记和基本层的标记包括残留预测标记、基本层内标记、运动预测标记、基本模式标记、和细分系数的符号标记中的至少一个。

10.
  一种在基于多层的视频中利用与基本层的标记的相关性而对编码后的当前层的标记进行解码的方法,该方法包括:
从输入比特流中读取预测标记和基本层的标记;
如果预测标记具有第一比特值,则在预测标记所被分配到的特定单元区域中,用所读取的基本层的标记替换当前层的标记;和
输出所替换的当前层的标记。

11.
  根据权利要求10的方法,还包括:
从输入比特流中读取编码后的当前层的标记;
如果该预测标记具有第二比特值,则对编码后的当前层的标记执行熵解码;
对熵解码的结果和所读取的基本层的标记执行异或运算;和
输出执行异或运算的结果。

12.
  根据权利要求11的方法,其中该熵解码包括可变长度解码、算术解码、和霍夫曼解码中的至少一个。

13.
  根据权利要求10的方法,其中该单元区域对应于帧、码片、宏块、或子块。

14.
  根据权利要求10的方法,其中当前层的标记和基本层的标记包括残留预测标记、基本层内标记、运动预测标记、基本模式标记、和细分系数的符号标记中的至少一个。

15.
  一种在基于多层的视频中利用与基本层的标记的相关性而对编码后的当前层的标记进行解码的方法,该方法包括:
从输入比特流中读取基本层的标记和编码后的当前层的标记;
对编码后的当前层的标记进行熵解码;
对熵解码的结果和所读取的基本层的标记执行异或运算;和
输出执行异或运算的结果。

16.
  根据权利要求15的方法,其中该熵解码包括可变长度解码、算术解码、和霍夫曼解码中的至少一个。

17.
  根据权利要求15的方法,其中当前层的标记和基本层的标记包括残留预测标记、基本层内标记、运动预测标记、基本模式标记、和细分系数的符号标记中的至少一个。

18.
  一种利用与基本层的对应标记的相关性而对在基于多层的视频中使用的当前层的标记进行编码的设备,该设备包括:
预测标记设置单元,用于确定在指定单元区域中包括的当前层的标记是否等于基本层的标记,并根据该确定结果而设置预测标记;和
插入单元,用于如果确定当前层的标记等于基本层的标记,则将基本层的标记和预测标记插入到比特流中。

19.
  一种利用与基本层的对应标记的相关性而对在基于多层的视频中使用的当前层的标记进行编码的设备,该设备包括:
运算单元,用于对当前层的标记和基本层的标记执行异或运算;
熵编码单元,用于对通过异或运算获得的值执行熵编码;和
插入单元,用于将熵编码的结果和基本层的标记插入到比特流中。

20.
  一种在基于多层的视频中利用与基本层的标记的相关性而对编码后的当前层的标记进行解码的设备,该设备包括:
比特流读出单元,用于从输入比特流中读取预测标记和基本层标记;和
替换单元,用于如果预测标记具有第一比特值,则在预测标记所被分配到的特定单元区域中,用所读取的基本层的标记替换当前层的标记,并输出所替换的当前层的标记。

21.
  一种在基于多层的视频中利用与基本层的标记的相关性而对编码后的当前层的标记进行解码的设备,该设备包括:
比特流读出单元,用于从输入比特流中读取基本层的标记和编码后的当前层的标记;
熵解码单元,用于对编码后的当前层的标记执行熵解码;
运算单元,用于对熵解码的结果和所读取的基本层的标记执行异或运算,并输出异或运算的结果。

说明书

利用层间相关性编码层内标记的方法、及解码方法和设备
相关申请的交叉引用
本申请要求2006年1月13日向韩国知识产权局提交的韩国专利申请第10-2006-0004139号以及2005年10月19日向美国专利和商标局提交的美国临时专利申请第60/727851号的优先权,通过引用而在这里全部合并其公开。
技术领域
符合本发明的方法和设备涉及视频压缩,并更具体地,涉及在基于多层的编解码器中利用层间相关性对标记的有效编码。
背景技术
随着信息和通信技术的发展,除了文本和语音通信之外,多媒体通信正在增长。现有的以文本为中心的通信系统不足以满足客户的各种需求,并由此,可容纳各种形式信息(例如文本、图像、音乐、和其它)的多媒体服务正在增长。由于多媒体数据很大,所以需要大容量存储介质和宽带宽来存储和发送多媒体数据。因此,需要压缩编码技术来发送多媒体数据。
数据压缩的基本原理是去除数据冗余。可通过去除例如图像中同一颜色或对象的重复的空间冗余、例如活动图像中的相似相邻帧或声音的连续重复的时间冗余、和考虑到人对高频的敏感度的可视/知觉冗余,而压缩数据。
在一般视频编码方法中,通过基于运动补偿的时间滤波而去除时间冗余,并通过空间变换而去除空间冗余。
其中去除了冗余的结果数据在量化处理中根据特定量化操作被有损耗编码。量化结果最终通过熵编码被无损耗编码。
如在联合视频组(JVT)已正式发布的当前可伸缩视频编码草案(下面称为SVC草案)中提出的,正对基于现有H.264标准实现多层视频编解码器进行研究,其中该联合视频组是国际标准化组织/国际电工委员会(ISO/IEC)和国际电信联盟(ITU)的视频专家组。
图1图示了利用多层结构的可伸缩视频编码结构。在该视频编码结构中,第一层被设置为15Hz(帧频)的四分之一公共中间格式(Quarter CommonIntermediate Format:QCIF),第二层被设置为30Hz的公共中间格式(CIF),而第三层被设置为60Hz的标准定义(SD)。如果需要CIF的0.5Mbps的流,那么该比特流可被截短,使得在具有CIF、帧频30Hz、和比特率0.7Mbps的第二层中的比特率为0.5Mbps。以这种方式,可实现空间、时间和信噪比(SNR)可伸缩性。由于在各层之间存在一些相似性,所以,在对相应层进行编码时,经常使用用于利用来自另一层的预测信息来提高某一层(例如纹理数据、运动数据等)的编码效率的方法。
另一方面,在可伸缩视频编码中,存在与是否使用层间信息相关的各种标记,该标记可以由码片(slice)、宏块、子块、或者甚至系数来设置。因此,在视频编码中,不能忽视由这些标记增加的开销。
然而,现在,与纹理数据或运动数据不同,在不考虑层间相关性的情况下,标记还没有被单独编码或从未被编码。
发明内容
本发明的示例性非限制性的实施例克服了上述缺点和上面未描述的其他缺点。而且,不要求本发明克服上述缺点,并且本发明的示例性非限制性的实施例可以不克服任何上述问题。
本发明提供了一种用于基于层间相关性而有效编码在基于多层的可伸缩视频编解码器中使用的各种标记的方法和设备。
根据本发明的一个方面,提供了一种利用与基本层的对应标记的相关性而对在基于多层的视频中使用的当前层的标记进行编码的方法,该方法包括:判断在指定单元区域中包括的当前层的标记是否全部等于基本层的标记;根据该判断结果而设置预测标记;和如果判断当前层的标记等于基本层的标记,则跳过当前层的标记,并将基本层的标记和预测标记插入到比特流中。
根据本发明的另一方面,提供了一种利用与基本层的对应标记的相关性而对在基于多层的视频中使用的当前层的标记进行编码的方法,该方法包括:获得当前层的标记和基本层的标记的异或值;对获得的异或值执行熵编码;和将熵编码的结果和基本层的标记插入到比特流中。
根据本发明的另一方面,提供了一种在基于多层的视频中利用与基本层的标记的相关性而对编码后的当前层的标记进行解码的方法,该方法包括:从输入比特流中读取预测标记和基本层标记;如果预测标记具有第一比特值,则在预测标记所被分配到的特定单元区域中,用所读取的基本层的标记替换当前层的标记;和输出所替换的当前层的标记。
根据本发明的另一方面,提供了一种在基于多层的视频中利用与基本层的标记的相关性而对编码后的当前层的标记进行解码的方法,该方法包括:从输入比特流中读取基本层的标记和编码后的当前层的标记;对编码后的当前层的标记进行熵解码;对熵解码的结果和所读取的基本层的标记执行异或运算;和输出异或运算的结果。
附图说明
通过结合附图对示范实施例的以下详细描述,本发明的以上和其它方面将变得更明显,其中:
图1是图示了利用多层结构的可伸缩视频编码结构的图;
图2是图示了包括离散层和至少一个FGS层的FGS编码结构的图;
图3是解释在可伸缩视频编码中提供的三种预测技术的概念视图;
图4是图示了根据本发明示范实施例的标记编码设备的构造的方框图;
图5是图示了细分(refinement)系数的例子的图;
图6是图示了根据本发明示范实施例的标记解码设备的构造的方框图;
图7是图示了根据本发明示范实施例的标记编码方法的流程图;
图8是图示了根据本发明另一示范实施例的标记编码方法的流程图;
图9是图示了根据本发明示范实施例的标记解码方法的流程图;
图10是图示了根据本发明另一示范实施例的标记解码方法的流程图;
图11是图示了可应用图4的标记编码设备的示范性的基于多层的视频编码器的构造的方框图;和
图12是图示了可应用图6的标记解码设备的示范性的基于多层的视频解码器的构造的方框图。
具体实施方式
下面,将参考附图来详细描述本发明的示范实施例。通过参考要结合附图详细描述的示范实施例,本发明的各个方面和特征以及实现这些方面和特征的方法将更明显。然而,本发明不限于下面公开的示范实施例,而可以以各种形式实现。例如详细构造和元件的在描述中定义的内容只是用来帮助本领域普通技术人员全面理解本发明的特定细节,并且本发明仅被限定在所附权利要求的范围内。在本发明的整体描述中,相同的附图标记用于各图中的相同元件。
在第16届JVT会议中由J Ridge和M.Karczewicz所提交的论文“Variablelength code for SVC”(JVT-P056,波兹南,第16届JVT会议;下面称为“JVT-P056”)中,提出了考虑可伸缩视频编码(SVC)特性的上下文自适应可变长度编码(CAVLC)技术。JVT-P056在离散层中遵循与现有H.264标准相同的处理,但是在细粒度可伸缩性层(fine granular scalability layer:FGS层)中使用按照统计特性的分离VLC技术。FGS层是FGS编码中的等于或高于第二层的层,而离散层是FGS编码中的第一层。
如图2所示,在对组成一个离散层和至少一个FGS层的系数执行熵编码时,使用三个扫描阶段(passes),即有效(significance)阶段、细分阶段、和剩余阶段。不同的方法根据他们的统计特性被应用到相应的扫描阶段。特别是,对于细分阶段,使用在熵编码中基于值“0”优于其他值的事实而获得的VLC表格。一般来说,对应离散层系数为“0”的FGS层系数被称为有效系数,而对应离散层系数不为“0”的FGS层系数被称为细分系数。该有效系数由有效阶段编码,而该细分系数由细分阶段编码。
在JVT-P056中,已提出了FGS层的VLC技术。根据该技术,在离散层中使用传统CAVLC技术,而在FGS层中使用利用统计特性的分离技术。具体来说,在三个扫描阶段中的细分阶段中对细分系数进行编码时,JVT-P056按照4个一组对细分系数的绝对值进行分组,利用VLC表格对分组的细分系数进行编码,并与分组的细分系数分离地、对用于区分细分系数的正/负符号的符号标记进行编码。由于为每一细分系数给出了细分系数的符号标记(除了细分系数为“0”的情况),所以由此引起的开销增大。因此,为了降低符号标记的开销,向该符号标记应用例如运行水平(run-level)编码的熵编码。然而,这是仅利用对应FGS层中的信息进行的,而没有利用其他FGS层的信息。
然而,作为观察各种视频样本的结果,可以知道第一FGS层中的细分系数的符号与离散层中的对应细分系数的符号相同。尽管如此,在对第一FGS层中的细分系数的符号标记进行编码时仅使用对应层的信息,这还是效率很低的。
根据当前可伸缩视频编码草案,除了符号标记之外,在执行FGS层的熵编码时,使用例如残留预测标记、基本层内(intra base)标记、运动预测标记、基本模式标记等的各种标记。这些标记被包括在比特流中,并被发送到视频解码器侧。
残留预测标记是表示是否使用残留预测的标记。残留预测是可通过利用基本层的对应残留信号预测某一层的残留信号、而降低残留信号的层间冗余的技术。由于基本层是为了另一层的有效编码而提到的某一层,所以其不限于第一层,并不必意味着更低层。
是否使用残留预测由传递到视频解码器侧的残留预测标记表明。如果该标记为“1”,则这表明使用了残留预测,而如果该标记为“0”,则这表明没有使用残留预测。
基本层内标记是表明是否使用基本层内预测的标记。根据当前可伸缩视频编码草案,除了已在现有H.264标准中使用的层间预测(①)和层内预测(②)之外,还支持通过利用基本层图像预测当前层的帧而降低要编码的数据的基本层内预测(③),如图3所示。在该草案中,基本层内预测被视为一种层内预测。在该层内预测中,如果该基本层内标记为“0”,则其表明传统层内预测,而如果该基本层内标记为“1”,则其表明基本层内预测。
运动预测标记是这样的标记,其表明在通过预测当前层的运动向量获得运动向量差(MVD)的过程中、是使用了同一层的另一运动向量还是使用了基本层的运动向量。如果该标记为“1”,则表明使用了基本层的运动向量,而如果该标记为“0”,则表明使用了同一层的另一运动向量。
基本模式标记是这样的标记,其表明在表明当前层的运动信息的过程中、是否使用了基本层的运动信息。如果基本模式标记为“1”,则基本层自己的运动信息被用作当前层的运动信息,或者使用基本层的以某种方式细分的运动信息。如果基本模式标记为“0”,则其表明当前层的运动信息被单独恢复和记录,而与基本层的运动信息无关。运动信息包括宏块类型mb_type、层间预测期间的画面参考方向(即前向、后向、和双向)、和运动向量。
上述标记稍微具有相应层之间的相关性。也就是说,很可能当前层的标记与基本层的对应标记具有相同的值。而且,在典型的熵编码中,随着在要编码的值中包括的值“0”的数目的变大,可改进压缩效率,这是公知的。这是因为在熵编码中,一串值“0”被处理为一个游程(run),或参考偏置到“0”的表格而被处理。考虑到这些因素,通过在基本层的标记与当前层的对应标记相等的情况下将标记设置为“0”、否则将标记设置为“1”,可改进执行熵编码时的压缩效率。
图4是图示了根据本发明示范实施例的标记编码设备的构造的方框图。该标记编码设备100可包括标记读出单元110、预测标记设置单元120、运算单元130、熵编码单元140、和插入单元150。
标记读出单元110读取在特定存储区中存储的标记值。一般来说,标记值由1比特(“1”或“0”)表明,但不限于此。这些标记包括当前层的标记FC和基本层的对应标记FB
预测标记设置单元110在特定单元区中判断当前层的标记FC是否全部与基本层的对应标记FB相等,如果是,则将预测标记P_flag设置为“0”,否则,将预测标记P_flag设置为“1”。单元区可以是帧、码片、宏块、或子块。如果单元区中包括的标记在各层中彼此相等,则可跳过当前层的标记FC,而不是被设置为“1”。在该情况下,仅较低层的标记FB和预测标记P_flag被插入到比特流中,并被发送到视频解码器侧。
在预测标记被设置为“0”的情况下,运算单元130对当前层的标记FC和基本层的对应标记FB执行异或运算。异或运算是这样的逻辑运算,如果两个输入的比特值彼此相等,则输出“0”,而如果它们彼此不等,则输出“1”。如果对应层的标记FC和FB很可能彼此相等,则由该运算所获得的大多数输出变为“0”,并由此可改进熵编码效率。
例如,如果假设第一FGS层是当前层,则第一FGS层的每一子块的细分系数如图5的阴影部分所示。如果这些细分系数按照图5的虚线箭头(按照Z字形方式)的顺序排列,则当前层的符号标记变为{10101},而基本层(即离散层)的对应符号标记变为{10100},其中正号被表示为“0”,而负号被表示为“1”。通过对一组标记执行异或运算,该运算结果变为{00001}。在该情况下,对当前层的运算结果{00001}执行熵编码(而不是对符号标记{10101}执行熵编码),这对于压缩效率是有利的。
再次参考图4,熵编码单元140对从运算单元130输出的运算结果执行无损耗编码。可变长度编码(包括CAVLC)、算术编码(包括基于上下文的自适应二进制算术编码)、霍夫曼编码等可用作无损耗编码方法。
在预测标记P_flag为“1”的情况下,插入单元150将该预测标记和基本层的标记FB插入到比特流(BS)中。相反,如果预测标记P_flag为“0”,则插入单元150将该预测标记、基本层的标记FB、和熵编码后的运算结果RC’插入到比特流(BS)中。比特流(BS)是已由多层视频编码器进行有损耗编码的数据,并且最终比特流作为插入结果被输出。
图6是图示了标记解码设备的构造的方框图。该标记解码设备200可包括比特流读出单元210、预测标记读出单元220、替换单元230、熵解码单元240、和运算单元250。
比特流读出单元210通过对该最终比特流进行语法分析(parsing)而提取基本层的标记FB和预测标记P_flag。如果该比特流中存在熵编码后的运算结果RC’,则比特流读出单元210也提取它。
预测标记读出单元220读取所提取的预测标记P_flag,并且如果预测标记值为“0”,则其操作运算单元250,而如果预测标记值为“1”,则其操作替换单元230。
如果预测标记读出单元220通知该预测标记为“1”,则替换单元230用基本层的标记FB替换当前层的标记FC。因此,所输出的基本层的标记FB和当前层的标记FC变得彼此相等。
熵解码单元240对运算结果RC’执行无损耗解码。该解码操作与熵编码单元140执行的无损耗编码操作互逆。
如果预测标记读出单元220通知该预测标记为“0”,则运算单元250对基本层的标记FB和无损耗编码的结果RC执行异或运算。初始地,运算单元130通过下述等式(1)的运算而计算RC(其中,^是异或运算的标志),并且通过在等式(1)的两侧代入“^FB”,等式(1)的右侧的“^FB^FB”被删除,从而产生下述等式(2)的结果。
RC=FC^FB    …(1)
RC^FC=FC    …(2)
因此,运算单元250可通过对于RC和FB执行异或运算,而恢复当前层的标记FC。最后,标记解码设备200的输出变为基本层的标记FB和当前层的标记FC
可通过在存储器的特定区域中执行的任务、类、子例程、过程、对象、执行线程、例如程序的软件、例如FPGA(现场可编程门阵列)或ASIC(特定用途集成电路)的硬件、或软件和硬件的组合,而实现图4和6的相应组成元件。这些组成元件可被包括在计算机可读存储介质中,或者它们的部件可分布在多个计算机中。
图7是图示了根据本发明示范实施例的标记编码方法的流程图。
首先,标记读出单元110读取基本层的标记FB和当前层的标记FC(S11)。然后,预测标记设置单元120判断在单元区域中读取的标记FB和对应标记FC是否彼此相等(S12)。
如果作为判断结果的标记FB和FC彼此相等(操作S12中的“是”),则预测标记设置单元120将预测标记P_flag设置为“1”(S17),并且插入单元150将预测标记P_flag和FB插入到比特流中(S18)。
如果作为判断结果的标记FB和FC彼此不相等(操作S12中的“否”),则预测标记设置单元120将预测标记P_flag设置为“0”(S13)。然后,运算单元130对FB和FC执行异或运算(S14)。在本发明的另一示范实施例中,可省略操作S14的处理(在该情况下,FC将直接被熵编码)。
熵编码单元140对运算结果RC执行熵编码(S15)。最终,插入单元150将预测标记P_flag、基本层的标记FB、和熵编码的结果RC’插入到比特流中(S16)。
图8是图示了根据本发明另一示范实施例的标记编码方法的流程图。该标记编码方法排除了预测标记设置处理。在图8所示方法中,执行异或运算,而不管FB和FC在单元区域中是否彼此相等。
首先,标记读出单元110读取基本层的标记FB和当前层的标记FC(S21)。然后,运算单元130对FB和FC执行异或运算(S22)。熵编码单元140对运算结果RC执行熵编码(S23)。最终,插入单元150将预测标记P_flag、基本层的标记FB、和熵编码的结果RC’插入到比特流中(S24)。
图9是图示了根据本发明示范实施例的标记解码方法的流程图。
首先,比特流读出单元210读取最终比特流(BS),并提取基本层的标记FB、熵编码后的运算结果RC’、和预测标记P_flag(S31)。然后,预测标记读出单元220判断所提取的预测标记P_flag是否为“0”(S32)。
如果作为判断结果的预测标记P_flag为“1”(操作S32中的“否”),则替换单元230用所提取的基本层的标记FB替换当前层的标记FC(S35),并输出所替换的当前层的标记FC(S36)。单元区域可对应于帧、码片、宏块、或子块。
如果作为判断结果的预测标记P_flag为“0”(操作S32中的“是”),则熵解码单元240通过对熵编码后的运算结果RC’进行解码而恢复运算结果RC(S33)。该解码运算与熵编码运算互逆。
运算单元250通过对基本层的标记FB和无损耗编码的结果RC执行异或运算,而恢复当前层的标记FC(S34)。然后,运算单元250输出所恢复的当前层的标记FC(S36)。
图10是图示了根据本发明另一示范实施例的标记解码方法的流程图。该标记解码方法排除与预测标记相关的处理。在图10所示方法中,应用了熵解码处理(S42)和异或运算(S43),而不考虑预测标记P_flag的值。
首先,比特流读出单元210读取最终比特流(BS),并提取基本层的标记FB和熵编码后的运算结果RC’(S41)。然后,熵解码单元240通过对熵编码的运算结果RC ’进行解码而恢复运算结果RC(S42)。运算单元250通过对基本层的标记FB和无损耗编码的结果RC执行异或运算而恢复当前层的标记FC(S43),并然后输出所恢复的当前层的标记FC(S44)。
图11是图示了可应用图4的标记编码设备的基于多层的视频编码器的构造的方框图。
原始视频序列被输入到当前层编码器400,并(仅在各层之间的分辨率改变的情况下)由下采样单元350进行下采样,以输入到基本层编码器300。
预测单元410通过以特定方法从当前宏块中减去预测图像,而获得残留图像。定向层内预测、层间预测、基本层内预测、和残留预测可用作该预测方法。
变换单元420利用例如离散余弦变换(DCT)和小波变换的空间变换技术而变换所获得的残留信号,并生成变换系数。
量化单元430通过特定量化操作而量化该变换系数(随着量化操作的变大,数据损耗或压缩率也变大),并生成量化系数。
熵编码单元440执行量化系数的无损耗编码,并输出当前层比特流。
标记设置单元450根据各种操作中获得的信息而设置标记。例如,通过从预测单元410获得的信息而设置残留预测标记和基本层内标记,并通过从熵编码单元440获得的信息而设置细分系数的符号标记。如上所述设置的当前层的标记FC被输入到标记编码设备100。
以与当前层编码器400相同的方式,基本层编码器300包括:预测单元310、变换单元320、量化单元330、熵编码单元340、和标记设置单元350,它们与当前层编码器400的组件具有相同的功能。熵编码单元340将基本层比特流输出到多路复用器(mux)360,而标记设置单元350将基本层标记FB提供到标记编码设备100。
多路复用器360组合当前层比特流和基本层比特流,以生成比特流(BS),并将所生成的比特流提供到标记编码设备100。
标记编码设备100利用FB和FC之间的相关性而对FC进行编码,并将所编码的FC和FB插入到所提供的比特流中,以输出最终比特流(最终BS)。
图12是图示了可应用图6的标记解码设备的基于多层的视频解码器的构造的方框图。
输入最终比特流(最终BS)被输入到标记解码设备200和解多路复用器(demux)650。解多路复用器650将最终比特流分离为当前层比特流和基本层比特流,并将当前层比特流和基本层比特流分别提供到当前层解码器700和基本层解码器600。
熵解码单元710通过执行与熵编码单元440执行的无损耗编码对应的无损耗解码,而恢复量化系数。
逆量化单元720通过在量化单元430中使用的量化操作而执行所恢复的量化系数的逆量化。
逆变换单元730使用例如逆DCT和逆小波变换的逆空间变换技术而对逆量化的结果执行逆变换。
逆预测单元740以相同方式获得预测单元410所获得的预测图像,并通过将逆变换的结果添加到所获得的预测图像中而恢复视频序列。
以与当前层解码器700相同的方式,基本层解码器600包括熵解码单元610、逆量化单元620、逆变换单元630、和逆预测单元640。
另一方面,标记解码设备200从最终比特流中提取基本层标记FB和当前层标记FC的所编码的值,并根据FB和所编码的值而恢复当前层标记FC
所提取的基本层标记FB用于基本层解码器600的组成元件610、620、630和640的对应操作,而所恢复的当前层标记FC用于当前层解码器700的组成元件710、720、730和740的对应操作。
如上所述,根据本发明,可改进在基于多层的可伸缩视频编解码器中使用的各种标记的编码效率。
已为了示意性的目的而描述了本发明的示范实施例,并且本领域普通技术人员将理解,在不脱离所附权利要求中公开的本发明的范围和精神的情况下,各种修改、添加和替换都是可能的。所以,本发明的范围应该由所附权利要求及其法定等同限定。

利用层间相关性编码层内标记的方法、及解码方法和设备.pdf_第1页
第1页 / 共27页
利用层间相关性编码层内标记的方法、及解码方法和设备.pdf_第2页
第2页 / 共27页
利用层间相关性编码层内标记的方法、及解码方法和设备.pdf_第3页
第3页 / 共27页
点击查看更多>>
资源描述

《利用层间相关性编码层内标记的方法、及解码方法和设备.pdf》由会员分享,可在线阅读,更多相关《利用层间相关性编码层内标记的方法、及解码方法和设备.pdf(27页珍藏版)》请在专利查询网上搜索。

一种基于层间相关性对在基于多层的可伸缩视频编解码器中使用的各种标记进行有效编码的方法和设备。该编码方法包括:判断在指定单元区域中包括的当前层的标记是否全部等于基本层的标记;根据该判断结果而设置指定预测标记;和如果判断当前层的标记等于基本层的标记,则跳过当前层的标记,并将基本层的标记和预测标记插入到比特流中。 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1