《产生额外合并候选者.pdf》由会员分享,可在线阅读,更多相关《产生额外合并候选者.pdf(43页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104126302A43申请公布日20141029CN104126302A21申请号201280054674922申请日2012110761/556,74620111107US61/562,28420111121US61/562,94020111122US13/669,99220121106USH04N19/119201401H04N19/52201401H04N19/96201401H04N19/10920140171申请人高通股份有限公司地址美国加利福尼亚州72发明人郑云非翔林王马尔塔卡切维奇74专利代理机构北京律盟知识产权代理有限责任公司11287代理人宋献涛54发明名。
2、称产生额外合并候选者57摘要在产生用于帧间预测视频译码的候选者列表时,视频译码器可在将空间候选者和时间候选者添加到候选者列表时执行修剪操作,而在将人工产生的候选者添加到候选者列表时不执行修剪操作。人工产生的候选者可具有与已在候选者列表中的空间候选者或时间候选者的运动信息相同的运动信息。30优先权数据85PCT国际申请进入国家阶段日2014050786PCT国际申请的申请数据PCT/US2012/0639322012110787PCT国际申请的公布数据WO2013/070757EN2013051651INTCL权利要求书4页说明书27页附图11页19中华人民共和国国家知识产权局12发明专利申请权。
3、利要求书4页说明书27页附图11页10申请公布号CN104126302ACN104126302A1/4页21一种对视频数据进行译码的方法,所述方法包含确定与当前视频帧的当前部分相关联的空间候选者的集合,其中空间候选者的所述集合对应于所述当前视频帧的邻近所述当前部分的相邻部分且其中所述空间候选者中的每一者具有相关联的运动信息;确定与所述当前视频帧的所述当前部分相关联的时间候选者,其中所述时间候选者对应于参考视频帧的一部分且其中所述时间候选者具有相关联的运动信息;基于空间候选者的所述集合的子集和所述时间候选者产生候选者列表;以及,响应于所述候选者列表包含少于指定数目的候选者,将人工产生的候选者添加。
4、到所述候选者列表,其中所述人工产生的候选者具有与所述子集的空间候选者的运动信息相同或与所述时间候选者的运动信息相同的运动信息。2根据权利要求1所述的方法,其中空间候选者的所述集合包含具有相同运动信息的两个或更多空间候选者,且其中空间候选者的所述子集仅包括所述两个或更多空间候选者中的一者。3根据权利要求1所述的方法,其中基于空间候选者的所述集合的所述子集和所述时间候选者产生所述候选者列表包含执行修剪操作以从所述候选者列表排除具有重复运动信息的候选者。4根据权利要求1所述的方法,其中将所述人工产生的候选者添加到所述候选者列表包含在不对所述人工产生的候选者执行一或多个修剪操作的情况下添加所述人工产生。
5、的候选者。5根据权利要求1所述的方法,其中所述人工产生的候选者为非缩放双向预测性候选者。6根据权利要求1所述的方法,其中所述人工产生的候选者为零候选者。7根据权利要求1所述的方法,其中所述人工产生的候选者为运动向量偏移候选者。8根据权利要求1所述的方法,其进一步包含产生第二人工产生的候选者,其中所述人工产生的候选者和所述第二人工产生的候选者并行地产生。9根据权利要求1所述的方法,其进一步包含使用合并模式对所述当前视频帧的所述当前部分进行译码,其中用于所述合并模式的运动信息是基于所述候选者列表而确定。10根据权利要求1所述的方法,其中所述方法由视频编码器执行,其中所述方法进一步包含从所述候选者列。
6、表选择候选者以及产生指示所述选定候选者的索引的语法元素。11根据权利要求1所述的方法,其中所述方法由视频解码器执行,且其中所述方法进一步包含接收识别来自所述候选者列表的候选者的语法元素以及使用所述所识别候选者的运动信息对所述当前视频帧的所述当前部分进行解码。12一种用于对视频数据进行译码的装置,所述装置包含视频译码器,其经配置以确定与当前视频帧的当前部分相关联的空间候选者的集合,其中空间候选者的所述集合对应于所述当前视频帧的邻近所述当前部分的相邻部分且其中所述空间候选者中的每一者具有相关联的运动信息;确定与所述当前视频帧的所述当前部分相关联的时间候选者,其中所述时间候选者对应于参考视频帧的一部。
7、分且其中所述时权利要求书CN104126302A2/4页3间候选者具有相关联的运动信息;基于空间候选者的所述集合的子集和所述时间候选者产生候选者列表;以及,响应于所述候选者列表包含少于指定数目的候选者,将人工产生的候选者添加到所述候选者列表,其中所述人工产生的候选者具有与所述子集的空间候选者的运动信息相同或与所述时间候选者的运动信息相同的运动信息。13根据权利要求12所述的装置,其中空间候选者的所述集合包含具有相同运动信息的两个或更多空间候选者,且其中空间候选者的所述子集仅包括所述两个或更多空间候选者中的一者。14根据权利要求12所述的装置,其中所述视频译码器通过执行修剪操作以从所述候选者列表。
8、排除具有重复运动信息的候选者而基于空间候选者的所述集合的所述子集和所述时间候选者产生所述候选者列表。15根据权利要求12所述的装置,其中所述视频译码器通过在不对所述人工产生的候选者执行一或多个修剪操作的情况下添加所述人工产生的候选者来将所述人工产生的候选者添加到所述候选者列表。16根据权利要求12所述的装置,其中所述人工产生的候选者为非缩放双向预测性候选者。17根据权利要求12所述的装置,其中所述人工产生的候选者为零候选者。18根据权利要求12所述的装置,其中所述人工产生的候选者为运动向量偏移候选者。19根据权利要求12所述的装置,其中所述视频译码器进一步经配置以产生第二人工产生的候选者,其中。
9、所述人工产生的候选者和所述第二人工产生的候选者并行地产生。20根据权利要求12所述的装置,其中所述视频译码器进一步经配置以使用合并模式对所述当前视频帧的所述当前部分进行译码,其中用于所述合并模式的运动信息是基于所述候选者列表而确定。21根据权利要求12所述的装置,其中所述视频译码器为视频编码器且其中所述视频编码器经配置以从所述候选者列表选择候选者以及产生指示所述选定候选者的索引的语法元素。22根据权利要求12所述的装置,其中所述视频译码器为视频解码器,且其中所述视频解码器经配置以接收识别来自所述候选者列表的候选者的语法元素以及使用所述所识别候选者的运动信息对所述当前视频帧的所述当前部分进行解码。
10、。23根据权利要求12所述的装置,其中所述装置包含以下各者中的至少一者集成电路;微处理器;以及,无线通信装置,其包括所述视频译码器。24一种用于对视频数据进行译码的装置,所述装置包含用于确定与当前视频帧的当前部分相关联的空间候选者的集合的装置,其中空间候选者的所述集合对应于所述当前视频帧的邻近所述当前部分的相邻部分且其中所述空间候选者中的每一者具有相关联的运动信息;用于确定与所述当前视频帧的所述当前部分相关联的时间候选者的装置,其中所述时间候选者对应于参考视频帧的一部分且其中所述时间候选者具有相关联的运动信息;权利要求书CN104126302A3/4页4用于基于空间候选者的所述集合的子集和所述。
11、时间候选者产生候选者列表的装置;以及,用于响应于所述候选者列表包含少于指定数目的候选者而将人工产生的候选者添加到所述候选者列表的装置,其中所述人工产生的候选者具有与所述子集的空间候选者的运动信息相同或与所述时间候选者的运动信息相同的运动信息。25根据权利要求24所述的装置,其中空间候选者的所述集合包含具有相同运动信息的两个或更多空间候选者,且其中空间候选者的所述子集仅包括所述两个或更多空间候选者中的一者。26根据权利要求24所述的装置,其中所述用于基于空间候选者的所述集合的所述子集和所述时间候选者产生所述候选者列表的装置包含用于执行修剪操作以从所述候选者列表排除具有重复运动信息的候选者的装置。。
12、27根据权利要求24所述的装置,其中所述用于将所述人工产生的候选者添加到所述候选者列表的装置包含用于在不对所述人工产生的候选者执行一或多个修剪操作的情况下添加所述人工产生的候选者的装置。28根据权利要求24所述的装置,其中所述人工产生的候选者为非缩放双向预测性候选者。29根据权利要求24所述的装置,其中所述人工产生的候选者为零候选者。30根据权利要求24所述的装置,其中所述人工产生的候选者为运动向量偏移候选者。31根据权利要求24所述的装置,其进一步包含用于产生第二人工产生的候选者的装置,其中所述人工产生的候选者和所述第二人工产生的候选者并行地产生。32根据权利要求24所述的装置,其进一步包含。
13、用于使用合并模式对所述当前视频帧的所述当前部分进行译码的装置,其中用于所述合并模式的运动信息是基于所述候选者列表而确定。33根据权利要求24所述的装置,其中所述装置包含视频编码器,且其中所述装置进一步包含用于从所述候选者列表选择候选者的装置和用于产生指示所述选定候选者的索引的语法元素的装置。34根据权利要求24所述的装置,其中所述装置包含视频解码器,且其中所述装置进一步包含用于接收识别来自所述候选者列表的候选者的语法元素的装置和用于使用所述所识别候选者的运动信息对所述当前视频帧的所述当前部分进行解码的装置。35一种存储指令的计算机可读存储媒体,所述指令在被执行时致使一或多个处理器执行以下操作确。
14、定与当前视频帧的当前部分相关联的空间候选者的集合,其中空间候选者的所述集合对应于所述当前视频帧的邻近所述当前部分的相邻部分且其中所述空间候选者中的每一者具有相关联的运动信息;确定与所述当前视频帧的所述当前部分相关联的时间候选者,其中所述时间候选者对应于参考视频帧的一部分且其中所述时间候选者具有相关联的运动信息;基于空间候选者的所述集合的子集和所述时间候选者产生候选者列表;以及,权利要求书CN104126302A4/4页5响应于所述候选者列表包含少于指定数目的候选者而将人工产生的候选者添加到所述候选者列表,其中所述人工产生的候选者具有与所述子集的空间候选者的运动信息相同或与所述时间候选者的运动信。
15、息相同的运动信息。36根据权利要求35所述的计算机可读存储媒体,其中空间候选者的所述集合包含具有相同运动信息的两个或更多空间候选者,且其中空间候选者的所述子集仅包括所述两个或更多空间候选者中的一者。37根据权利要求35所述的计算机可读存储媒体,其中所述指令致使所述一或多个处理器通过执行修剪操作以从所述候选者列表排除具有重复运动信息的候选者来基于空间候选者的所述集合的所述子集和所述时间候选者产生所述候选者列表。38根据权利要求35所述的计算机可读存储媒体,其中所述指令致使所述一或多个处理器在不对所述人工产生的候选者执行一或多个修剪操作的情况下将所述人工产生的候选者添加到所述候选者列表。39根据权。
16、利要求35所述的计算机可读存储媒体,其中所述人工产生的候选者为非缩放双向预测性候选者。40根据权利要求35所述的计算机可读存储媒体,其中所述人工产生的候选者为零候选者。41根据权利要求35所述的计算机可读存储媒体,其中所述人工产生的候选者为运动向量偏移候选者。42根据权利要求35所述的计算机可读存储媒体,其存储在被执行时致使所述一或多个处理器执行以下操作的其它指令产生第二人工产生的候选者,其中所述人工产生的候选者和所述第二人工产生的候选者并行地产生。43根据权利要求35所述的计算机可读存储媒体,其存储在被执行时致使所述一或多个处理器执行以下操作的其它指令使用合并模式对所述当前视频帧的所述当前部。
17、分进行译码,其中用于所述合并模式的运动信息是基于所述候选者列表而确定。44根据权利要求35所述的计算机可读存储媒体,其中所述一或多个处理器包含视频编码器,其中所述计算机可读存储媒体存储其它指令,所述指令在被执行时致使所述一或多个处理器从所述候选者列表选择候选者以及产生指示所述选定候选者的索引的语法元素。45根据权利要求35所述的计算机可读存储媒体,其中所述一或多个处理器包含视频解码器,其中所述计算机可读存储媒体存储其它指令,所述指令在被执行时致使所述一或多个处理器接收识别来自所述候选者列表的候选者的语法元素以及使用所述所识别候选者的运动信息对所述当前视频帧的所述当前部分进行解码。权利要求书CN。
18、104126302A1/27页6产生额外合并候选者0001本申请案主张以下各者的权益00022011年11月7日申请的美国临时申请案第61/556,746号;00032011年11月21日申请的美国临时申请案第61/562,284号;和00042011年11月22日申请的美国临时申请案61/562,940,0005其中每一者的全部内容以引用的方式并入本文中。技术领域0006本发明涉及视频译码,且更特定来说涉及视频数据的合并模式预测。背景技术0007可将数字视频能力并入于广泛范围的装置中,包括数字电视、数字直播系统、无线广播系统、个人数字助理PDA、膝上型或桌上型计算机、数码相机、数字记录装置、。
19、数字媒体播放器、视频游戏装置、视频游戏机、蜂窝式或卫星无线电电话、视频电话会议装置和其类似者。数字视频装置实施视频压缩技术例如,在由MPEG2、MPEG4、ITUTH263、ITUTH264/MPEG4第10部分高级视频译码AVC定义的标准、目前在开发中的高效视频译码HEVC标准和这些标准的扩展中所描述的视频压缩技术以更有效率地发射、接收和存储数字视频信息。0008视频压缩技术执行空间图片内预测和/或时间图片间预测,以减少或移除视频序列中固有的冗余。对于基于块的视频译码,可将视频块分割成视频块,视频块还可被称作树块、译码单元CU和/或译码节点。使用关于同一图片中的相邻块中的参考样本的空间预测来。
20、编码图片的帧内译码I切片中的视频块。图片的帧间译码P或B切片中的视频块可使用关于同一图片中的相邻块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。发明内容0009本发明描述用于在视频编码器处产生供帧间预测译码使用的候选者列表和用于在视频解码器处产生相同候选者列表的技术。视频编码器和视频解码器可通过实施用于建构候选者列表的相同技术来产生相同候选者列表。举例来说,视频编码器和视频解码器两者可建构具有相同数目的候选者的列表。视频编码器和解码器可首先考虑空间候选者例如,同一图片中的相邻块,接着考虑时间候选者例如,不同图片中的候选者,且最后可考虑。
21、人工产生的候选者,直到将所要数目的候选者添加到列表为止。根据本发明的技术,可在候选者列表建构期间针对某些类型的候选者利用修剪操作,以便从候选者列表移除重复,而对于其它类型的候选者,可能不使用修剪以便减小译码器复杂性。0010在一实例中,一种对视频数据进行译码的方法包括确定与当前视频帧的当前部分相关联的空间候选者的集合,其中空间候选者的所述集合对应于所述当前视频帧的邻近所述当前部分的相邻部分,且其中所述空间候选者中的每一者具有相关联的运动信息;确说明书CN104126302A2/27页7定与所述当前视频帧的所述当前部分相关联的时间候选者,其中所述时间候选者对应于参考视频帧的一部分,且其中所述时间。
22、候选者具有相关联的运动信息;基于空间候选者的所述集合的子集和所述时间候选者产生候选者列表;以及,响应于所述候选者列表包含的候选者少于指定数目,将人工产生的候选者添加到所述候选者列表,其中所述人工产生的候选者具有与所述子集的空间候选者的运动信息或所述时间候选者的运动信息相同的运动信息。0011在另一实例中,一种用于对视频数据进行译码的装置包括视频译码器,所述视频译码器经配置以确定与当前视频帧的当前部分相关联的空间候选者的集合,其中空间候选者的所述集合对应于所述当前视频帧的邻近所述当前部分的相邻部分,且其中所述空间候选者中的每一者具有相关联的运动信息;确定与所述当前视频帧的所述当前部分相关联的时间。
23、候选者,其中所述时间候选者对应于参考视频帧的一部分,且其中所述时间候选者具有相关联的运动信息;基于空间候选者的所述集合的子集和所述时间候选者产生候选者列表;以及,响应于所述候选者列表包含的候选者少于指定数目,将人工产生的候选者添加到所述候选者列表,其中所述人工产生的候选者具有与所述子集的空间候选者的运动信息或所述时间候选者的运动信息相同的运动信息。0012在另一实例中,一种用于对视频数据进行译码的装置包括用于确定与当前视频帧的当前部分相关联的空间候选者的集合的装置,其中空间候选者的所述集合对应于所述当前视频帧的邻近所述当前部分的相邻部分,且其中所述空间候选者中的每一者具有相关联的运动信息;用于。
24、确定与所述当前视频帧的所述当前部分相关联的时间候选者的装置,其中所述时间候选者对应于参考视频帧的一部分,且其中所述时间候选者具有相关联的运动信息;用于基于空间候选者的所述集合的子集和所述时间候选者产生候选者列表的装置;以及,用于响应于所述候选者列表包含的候选者少于指定数目而将人工产生的候选者添加到所述候选者列表的装置,其中所述人工产生的候选者具有与所述子集的空间候选者的运动信息或所述时间候选者的运动信息相同的运动信息。0013在另一实例中,一种计算机可读存储媒体存储在被执行时致使一或多个处理器执行以下操作的指令确定与当前视频帧的当前部分相关联的空间候选者的集合,其中空间候选者的所述集合对应于所。
25、述当前视频帧的邻近所述当前部分的相邻部分,且其中所述空间候选者中的每一者具有相关联的运动信息;确定与所述当前视频帧的所述当前部分相关联的时间候选者,其中所述时间候选者对应于参考视频帧的一部分,且其中所述时间候选者具有相关联的运动信息;基于空间候选者的所述集合的子集和所述时间候选者产生候选者列表;以及,响应于所述候选者列表包含的候选者少于指定数目而将人工产生的候选者添加到所述候选者列表,其中所述人工产生的候选者具有与所述子集的空间候选者的运动信息或所述时间候选者的运动信息相同的运动信息。0014一或多个实例的细节陈述于附图和以下描述中。其它特征、目标和优势将从所述描述和所述图式以及从权利要求书显。
26、而易见。附图说明0015图1说明可利用本发明的技术的实例视频译码系统的框图。0016图2说明经配置以实施本发明的技术的实例视频编码器的框图。说明书CN104126302A3/27页80017图3说明经配置以实施本发明的技术的实例视频解码器的框图。0018图4说明帧间预测模块的实例配置的框图。0019图5说明实例合并操作的流程图。0020图6说明实例高级运动向量预测AMVP操作的流程图。0021图7说明由视频解码器执行的实例运动补偿操作的流程图。0022图8说明译码单元CU和与CU相关联的实例源位置的概念图。0023图9说明实例候选者列表建构操作的流程图。0024图10展示将经组合候选者添加到合。
27、并候选者列表的图形实例。0025图11展示将经缩放候选者添加到合并候选者列表的图形实例。0026图12展示将零候选者添加到合并候选者列表的图形实例。0027图13A和图13B展示产生MV_OFFSET候选者的图形实例。0028图14说明本发明中所描述的技术的实例的流程图。具体实施方式0029视频编码器可执行帧间预测以减少图片之间的时间冗余。如下文所描述,译码单元CU可具有多个预测单元PU。换句话说,多个PU可属于CU。当视频编码器执行帧间预测时,视频编码器可用信号通知用于PU的运动信息。PU的运动信息可包括例如参考图片索引、运动向量和预测方向指示符。运动向量可指示PU的视频块与PU的参考块之间。
28、的位移。PU的参考块可为类似于PU的视频块的参考图片的一部分。参考块可定位于由参考图片索引和预测方向指示符指示的参考图片中。0030为了减少表示PU的运动信息所需要的位的数目,视频编码器可根据合并模式或高级运动向量预测AMVP过程产生用于PU中的每一者的候选者列表。用于PU的候选者列表中的每一候选者可指示运动信息。由候选者列表中的一些候选者指示的运动信息可基于其它PU的运动信息。如果候选者指示指定空间候选者位置或时间候选者位置中的一者的运动信息,则本发明可将所述候选者称作“原始”候选者。举例来说,对于合并模式,可存在五个原始空间候选者位置和一个原始时间候选者位置。在一些实例中,视频编码器可通过。
29、组合来自不同原始候选者的部分运动向量、修改原始候选者或仅插入零运动向量作为候选者来产生额外候选者。这些额外候选者不被视为原始候选者且在本发明中可称作人工产生的候选者。0031本发明的技术一般涉及用于在视频编码器处产生候选者列表的技术和用于在视频解码器处产生相同候选者列表的技术。视频编码器和视频解码器可通过实施用于建构候选者列表的相同技术来产生相同候选者列表。举例来说,视频编码器和视频解码器两者可建构具有相同数目的候选者例如,五个候选者的列表。视频编码器和解码器可首先考虑空间候选者例如,同一图片中的相邻块,接着考虑时间候选者例如,不同图片中的候选者,且最后可考虑人工产生的候选者直到将所要数目的候。
30、选者添加到列表为止。根据本发明的技术,可在候选者列表建构期间针对某些类型的候选者利用修剪操作以便从候选者列表移除重复,而对于其它类型的候选者,可能不使用修剪以便减小译码器复杂性。举例来说,对于空间候选者集合和对于时间候选者,可执行修剪操作以从候选者的列表排除具有重复运动信息的候选者。然而,当将人工产生的候选者添加到候选者的列表时,可在不对人说明书CN104126302A4/27页9工产生的候选者执行修剪操作的情况下添加人工产生的候选者。0032在产生用于CU的PU的候选者列表之后,视频编码器可从候选者列表选择候选者且在位流中输出候选者索引。选定候选者可为具有产生最紧密地匹配正被译码的目标PU的。
31、预测子的运动向量的候选者。候选者索引可指示在候选者列表中选定候选者的位置。视频编码器还可基于由PU的运动信息指示的参考块产生用于PU的预测性视频块。可基于由选定候选者指示的运动信息确定PU的运动信息。举例来说,在合并模式中,PU的运动信息可与由选定候选者指示的运动信息相同。在AMVP模式中,PU的运动信息可基于PU的运动向量差和由选定候选者指示的运动信息确定。视频编码器可基于CU的PU的预测性视频块和用于CU的原始视频块产生用于CU的一或多个残余视频块。视频编码器可接着编码一或多个残余视频块且在位流中输出一或多个残余视频块。0033位流可包括识别PU的候选者列表中的选定候选者的数据。视频解码器。
32、可基于由PU的候选者列表中的选定候选者指示的运动信息确定PU的运动信息。视频解码器可基于PU的运动信息识别用于PU的一或多个参考块。在识别PU的一或多个参考块之后,视频解码器可基于PU的一或多个参考块产生用于PU的预测性视频块。视频解码器可基于用于CU的PU的预测性视频块和用于CU的一或多个残余视频块来重构用于CU的视频块。0034为了易于解释,本发明可将位置或视频块描述为与CU或PU具有各种空间关系。此描述可解译为是指位置或视频块和与CU或PU相关联的视频块具有各种空间关系。此外,本发明可将视频译码器当前在译码的PU称作当前PU。本发明可将视频译码器当前在译码的CU称作当前CU。本发明可将视。
33、频译码器当前在译码的图片称作当前图片。0035附图说明实例。由附图中的参考数字指示的元件对应于由以下描述中的相似参考数字指示的元件。在本发明中,具有以序数词例如,“第一”、“第二”、“第三”等等开始的名称的元件未必暗示元件具有特定次序。而是,这些序数词仅用以指代相同或类似类型的不同元件。0036图1说明可利用本发明的技术的实例视频译码系统10的框图。如本文中所使用描述,术语“视频译码器”一般指代视频编码器和视频解码器两者。在本发明中,术语“视频译码”或“译码”一般可指代视频编码和视频解码。0037如图1中所展示,视频译码系统10包括源装置12和目的地装置14。源装置12产生经编码视频数据。因此。
34、,源装置12可称作视频编码装置。目的地装置14可解码由源装置12产生的经编码视频数据。因此,目的地装置14可称作视频解码装置。源装置12和目的地装置14可为视频译码装置的实例。0038源装置12和目的地装置14可包含广泛范围的装置,包括桌上型计算机、移动计算装置、笔记型例如,膝上型计算机、平板计算机、机顶盒、例如所谓的“智能型”手机的电话手机、电视、相机、显示装置、数字媒体播放器、视频游戏机、车用计算机或其类似者。在一些实例中,源装置12和目的地装置14可经配备以用于无线通信。0039目的地装置14可经由通道16从源装置12接收经编码视频数据。通道16可包含能够将经编码视频数据从源装置12移动。
35、到目的地装置14的一类型的媒体或装置。在一实例中,通道16可包含使得源装置12能够即时地将经编码视频数据直接发射到目的地装置14的通信媒体。在此实例中,源装置12可根据通信标准例如无线通信协议调制经编码视频数据,且可将经调制视频数据发射到目的地装置14。通信媒体可包含无线或有线通信说明书CN104126302A5/27页10媒体,例如射频RF频谱或一或多个物理传输线。通信媒体可形成基于包的网络例如,局域网络、广域网络或例如因特网的全球网络的部分。通信媒体可包括路由器、交换器、基站或促进从源装置12到目的地装置14的通信的其它设备。0040在另一实例中,通道16可对应于存储由源装置12产生的经编。
36、码视频数据的存储媒体。在此实例中,目的地装置14可经由磁盘存取或卡存取来存取存储媒体。存储媒体可包括多种本端存取的数据存储媒体,例如蓝光光碟、DVD、CDROM、快闪存储器或用于存储经编码视频数据的其它合适数字存储媒体。在另一实例中,通道16可包括文件服务器或存储由源装置12产生的经编码视频的另一中间存储装置。在此实例中,目的地装置14可经由串流或下载存取存储于文件服务器或其它中间存储装置处的经编码视频数据。文件服务器可为能够存储经编码视频数据且将经编码视频数据发射到目的地装置14的一类型的服务器。实例文件服务器包括网络服务器例如,用于网站、文件传送协议FTP服务器、网络附接存储NAS装置和本。
37、地磁盘驱动器。目的地装置14可经由标准数据连接包括因特网连接存取经编码视频数据。数据连接的实例类型可包括无线通道例如,WIFI连接、有线连接例如,DSL、缆线调制解调器等或适合用于存取存储于文件服务器上的经编码视频数据的无线通道与有线连接的组合。经编码视频数据从文件服务器的传输可为串流传输、下载传输,或两者的组合。0041本发明的技术不限于无线应用或设定。所述技术可应用于视频译码以支持多种多媒体应用中的任一者,例如空中电视广播、有线电视传输、卫星电视传输、例如经由因特网的串流视频传输、数字视频的编码以供存储于数据存储媒体上、存储于数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,视频译。
38、码系统10可经配置以支持单向或双向视频传输以支持例如视频串流、视频播放、视频广播和/或视频电话的应用。0042在图1的实例中,源装置12包括视频源18、视频编码器20和输出接口22。在一些状况下,输出接口22可包括调制器/解调器调制解调器和/或发射器。在源装置12中,视频源18可包括例如视频俘获装置的源,例如视频摄影机、含有先前俘获的视频数据的视频存档、从视频内容提供者接收视频数据的视频馈送接口,和/或用于产生视频数据的计算机图形系统,或这些源的组合。0043视频编码器20可编码所俘获、预俘获或计算机产生的视频数据。经编码视频数据可经由源装置12的输出接口22直接发射到目的地装置14。经编码视。
39、频数据还可存储到存储媒体或文件服务器上以供稍后由目的地装置14存取以用于解码和/或播放。0044在图1的实例中,目的地装置14包括输入接口28、视频解码器30和显示装置32。在一些状况下,输入接口28可包括接收器和/或调制解调器。目的地装置14的输入接口28经由通道16接收经编码视频数据。经编码视频数据可包括由视频编码器20产生的表示视频数据的多种语法元素。这些语法元素可包括于在通信媒体上发射、存储于存储媒体上或存储于文件服务器上的经编码视频数据内。0045显示装置32可与目的地装置14集成或在目的地装置14外部。在一些实例中,目的地装置14可包括集成显示装置且还可经配置以与外部显示装置介接。。
40、在其它实例中,目的地装置14可为显示装置。一般来说,显示装置32向用户显示经解码视频数据。显示装置32可包含多种显示装置中的任一者,例如液晶显示器LCD、等离子体显示器、有机发光二极管OLED显示器或另一类型的显示装置。说明书CN104126302A106/27页110046视频编码器20和视频解码器30可根据视频压缩标准例如,目前在开发中的高效视频译码HEVC标准而操作,且可符合HEVC测试模型HM。即将到来的HEVC标准的最近草案称作“HEVC工作草案6”或“WD6”描述于文件JCTVCH1003,布洛斯BROSS等人的“HIGHEFCIENCYVIDEOCODINGHEVCTEXTSPE。
41、CICATIONDRAFT6”ITUTSG16WP3和ISO/IECJTC1/SC29/WG11的视频译码联合合作小组JCTVC第8次会议美国加州圣何塞,2012年2月中,其于2012年5月1日可从HTTP/PHENIXINTEVRYFR/JCT/DOC_END_USER/DOCUMENTS/8_SAN20JOSE/WG11/JCTVCH1003V22ZIP下载,其全部内容以引用的方式并入本文中。HEVC标准的另一最近草案称作“HEVC工作草案7”或“WD7”描述于文件HCTVCI1003,布洛斯BROSS等人的“HIGHEFCIENCYVIDEOCODINGHEVCTEXTSPECICATI。
42、ONDRAFT7”ITUTSG16WP3和ISO/IECJTC1/SC29/WG11的视频译码联合合作小组JCTVC第9次会议瑞士日内瓦,2012年4月27日到2012年5月7日中,其于2012年6月5日可从HTTP/PHENIXITSUDPARISEU/JCT/DOC_END_USER/DOCUMENTS/9_GENEVA/WG11/JCTVCI1003V3ZIP下载。0047或者,视频编码器20和视频解码器30可根据例如ITUTH264标准或者被称作MPEG4第10部分高级视频译码AVC的其它专属或工业标准或这些标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准或技术。视频压缩标准。
43、和技术的其它实例包括MPEG2、ITUTH263和专属或开发原始码压缩格式例如VP8和相关格式。0048尽管未展示于图1的实例中,但视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包括适当的MUXDEMUX单元或其它硬件和软件,以处置共同数据串流或单独数据串流中的音频和视频两者的编码。如果可适用,则在一些实例中,MUXDEMUX单元可遵照ITUH223多路复用器协议,或例如用户数据报协议UDP的其它协议。0049再次,图1仅为实例且本发明的技术可应用于视频译码设定例如,视频编码或视频解码,其未必包括编码装置与解码装置之间的任何数据通信。在其它实例中,数据可被从本地存储器检索、。
44、经由网络串流传输或其类似者。编码装置可编码数据且将所述数据存储到存储器,和/或解码装置可从存储器检索数据且解码所述数据。在许多实例中,编码和解码由不与彼此通信而是仅将数据编码到存储器和/或从存储器检索数据且解码所述数据的装置执行。0050视频编码器20和视频解码器30各自可实施为多种合适电路中的任一者,例如一或多个微处理器、数字信号处理器DSP、专用集成电路ASIC、现场可编程门阵列FPGA、离散逻辑、硬件或其任何组合。当所述技术部分以软件实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读存储媒体中且可使用一或多个处理器来在硬件中执行指令以执行本发明的技术。视频编码器20和视频解码器。
45、30中的每一者可包括于一或多个编码器或解码器中,其中任一者可集成为相应装置中的组合编码器/解码器CODEC的部分。0051如上文简短地提及,视频编码器20编码视频数据。视频数据可包含一或多个图片。图片中的每一者为形成视频的部分的静态图像。在一些例子中,图片可称作视频“帧”。当视频编码器20编码视频数据时,视频编码器20可产生位流。位流可包括形成视频数据的经译码表示的位序列。位流可包括经译码图片和相关联的数据。经译码图片为图片的经说明书CN104126302A117/27页12译码表示。0052为了产生位流,视频编码器20可对视频数据中的每一图片执行编码操作。当视频编码器20对图片执行编码操作时。
46、,视频编码器20可产生一系列经译码图片和相关联的数据。相关联的数据可包括序列参数集、图片参数集、调适参数集和其它语法结构。序列参数集SPS可含有可应用于零或更多个图片序列的参数。图片参数集PPS可含有可应用于零或更多个图片的参数。调适参数集APS可含有可应用于零或更多个图片的参数。APS中的参数可为比PPS中的参数更可能改变的参数。0053为了产生经译码图片,视频编码器20可将图片分割为视频块。视频块可为二维样本阵列。视频块中的每一者与树块相关联。在一些例子中,树块可称作最大译码单元LCU。HEVC的树块可宽泛地类似于先前标准例如H264/AVC的宏块。然而,树块不一定限于特定大小且可包括一或。
47、多个译码单元CU。视频编码器20可使用四叉树分割以将树块的视频块分割为与CU相关联的视频块,因此得名“树块”。0054在一些实例中,视频编码器20可将图片分割为多个切片。切片中的每一者可包括整数个CU。在一些例子中,切片包含整数个树块。在其它例子中,切片的边界可在树块内。0055作为对图片执行编码操作的部分,视频编码器20可对图片的每一切片执行编码操作。当视频编码器20对切片执行编码操作时,视频编码器20可产生与切片相关联的经编码数据。与切片相关联的经编码数据可称作“经译码切片”。0056为了产生经译码切片,视频编码器20可对切片中的每一树块执行编码操作。当视频编码器20对树块执行编码操作时,。
48、视频编码器20可产生经译码树块。经译码树块可包含表示树块的经编码版本的数据。0057当视频编码器20产生经译码切片时,视频编码器20可根据光栅扫描次序对切片中的树块执行编码操作即,进行编码。换句话说,视频编码器20可以跨越切片中的最顶部行的树块从作到右进行,接着跨越下一较低行的树块从左到右进行等等的次序编码切片的树块,直到视频编码器20已编码切片中的树块的每一者为止。0058作为根据光栅扫描次序编码树块的结果,给定树块上方和左方的树块可能已编码,但给定树块的下方和右方的树块尚未编码。因此,视频编码器20可能够在编码给定树块时存取通过编码给定树块的上方和左方的树块产生的信息。然而,视频编码器20。
49、可能不能在编码给定树块时存取通过编码给定树块的下方和右方的树块产生的信息。0059为了产生经译码树块,视频编码器20可递归地对树块的视频块执行四叉树分割以将视频块划分为逐渐变小的视频块。较小视频块中的每一者可与不同CU相关联。举例来说,视频编码器20可将树块的视频块分割为四个同等大小的子块,将子块中的一或多者分割为四个同等大小的子子块等等。已分割CU可为其视频块经分割为与其它CU相关联的视频块的CU。非分割CU可为其视频块未分割为与其它CU相关联的视频块的CU。0060位流中的一或多个语法元素可指示视频编码器20可分割树块的视频块的最大次数。CU的视频块形状可为正方形的。CU的视频块的大小即,CU的大小可在88像素直到具有6464像素或更大的最大值的树块的视频块大小即,树块的大小的范围内。0061视频编码器20可根据Z扫描次序对树块的每一CU执行编码操作即,进行编码。换句话说,视频编码器20可以彼次序编码左上CU、右上CU、左下CU和接着右下CU。当视频编码器20对已分割CU执行编码操作时,视频编码器20可根据Z扫描次序编码与已分割CU说明书CN104126302A128/27页13的视频块的子块相关联的CU。换句话说,视频编码器20可以所述次序编码与左上子块相关联的CU、与右上子块相关联的CU、与左下子块相关联的CU,和接着与右下子块相关联的CU。0062作为根据Z。