一种视频编码的编码模式选择方法及装置.pdf

上传人:li****8 文档编号:4331712 上传时间:2018-09-14 格式:PDF 页数:15 大小:438.26KB
返回 下载 相关 举报
摘要
申请专利号:

CN201110403133.X

申请日:

2011.12.07

公开号:

CN102790878A

公开日:

2012.11.21

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):H04N 7/26申请日:20111207|||公开

IPC分类号:

H04N7/26; H04N7/32

主分类号:

H04N7/26

申请人:

北京邮电大学

发明人:

崔岩松; 蔡晓霞; 任维政; 邓中亮; 刘欣; 段大高

地址:

100876 北京市海淀区西土城路10号

优先权:

专利代理机构:

北京三高永信知识产权代理有限责任公司 11138

代理人:

罗振安

PDF下载: PDF下载
内容摘要

本发明公开了一种视频编码的编码模式选择方法及装置,属于视频编码领域。所述方法包括:当前帧是I帧时,对当前I帧的增强层进行预测编码,得到帧内最优编码模式;当前帧不是I帧时,根据编码量化步长和当前帧的前一个I帧的图像的相对复杂度计算得到当前最佳编码模式的提前终止条件,如果当前最佳编码模式的率失真代价满足提前终止条件,则将当前待检验编码模式作为帧间最优编码模式。本发明分别针对帧间、帧内编码的模式选择进行了优化,帧间模式选择则使用前一个I帧的图像相对复杂度结合编码量化步长确定提前终止条件,能够快速选择编码模式,并且能够自适应编码参数变化,能够有效提高编码速度,保证编码效率。

权利要求书

1.一种视频编码的编码模式选择方法,其特征在于,所述方法包括:判断当前帧是否为I帧;当所述当前帧是I帧时,获取所述当前帧的图像的相对复杂度,并对所述当前帧的增强层进行编码预测,得到帧内最优编码模式;当所述当前帧不是I帧时,对所述当前帧的增强层依次使用预设的最大概率编码模式集合中的所有编码模式进行编码预测,得当前最佳编码模式,根据所述当前帧的当前宏块编码时使用的编码量化步长和所述当前帧的前一个I帧的图像的相对复杂度计算得到所述当前最佳编码模式的提前终止条件,如果所述当前最佳编码模式的率失真代价满足所述提前终止条件,则将所述当前最佳编码模式作为帧间最优编码模式。2.根据权利要求1所述的方法,其特征在于,所述获取所述当前帧的图像的相对复杂度,包括:获取预设的训练序列的I帧的基础层宏块编码的平均绝对差MAD均值MADref;获取所述当前帧的基础层的宏块的MAD均值MADcur;根据第一公式计算得到所述当前帧的图像的相对复杂度λ;其中,所述第一公式具体为3.根据权利要求2所述的方法,其特征在于,所述获取预设的训练序列的I帧的基础层宏块编码的平均绝对差MAD均值MADref,包括:对所述预设的训练序列的I帧的基础层宏块编码的MAD均值使用第二公式进行函数拟合,得到拟合系数α,β和γ;其中,所述第二公式具体为MADref(QP)=α·eβ·QP+γ,QP为所述预设的训练序列的I帧的基础层宏块的编码量化步长,MADref(QP)为在所述QP下所述预设的训练序列的I帧的基础层宏块编码的MAD均值;当对所述当前帧的基础层进行编码时,将当前帧的当前宏块所使用的编码量化步长QP′使用第三公式计算得到MADref;其中,所述第三公式具体为MADref=α·eβ·QP′+γ。4.根据权利要求1所述的方法,其特征在于,所述根据所述当前帧的当前宏块编码时使用的编码量化步长和所述当前帧的前一个I帧的图像的相对复杂度计算得到所述当前最佳编码模式的提前终止条件,包括:根据所述当前帧的当前宏块编码时使用的编码量化步长QP和所述当前帧的前一个I帧的图像的相对复杂度λ使用第四公式计算得到第一率失真代价门限TH′b,e;其中,所述第四公式为THb,e=λ·RDb,e(QP),RDb,e(QP)为通过公式RDb,e(QP)=a·ek·QP+d计算得到的在所述QP下所述预设的训练序列的条件模式率失真代价均值,a、k和d为拟合系数,所述条件模式率失真代价为在所述预设的训练序列的当前宏块对应的基础层宏块采用b模式进行编码的情况下,所述预设的训练序列的当前宏块采用e模式进行编码计算得到的率失真代价;相应地,所述如果所述当前最佳编码模式的率失真代价满足所述提前终止条件,则将所述当前最佳编码模式作为帧间最优编码模式,具体的为:如果所述当前最佳编码模式的率失真代价小于所述第一率失真代价门限,则将所述当前最佳编码模式作为帧间最优编码模式。5.根据权利要求4所述的方法,其特征在于,在所述根据所述当前帧的当前宏块编码时使用的编码量化步长和所述当前帧的前一个I帧的图像的相对复杂度计算得到所述当前最佳编码模式的提前终止条件之前,所述方法还包括:使用所述预设的训练序列对根据公式RD′b,e(QP)=a·ek·QP+d进行拟合,得到拟合系数a、k和d,其中,RD′b,e(QP)为根据所述QP计算得到的所述预设的训练序列的条件模式率失真代价均值。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述当前最佳编码模式的率失真代价不满足所述提前终止条件时,对所述当前帧的增强层使用除所述预设的最大概率编码模式集合之外的其他所有编码模式进行编码预测,得到帧间最优编码模式。7.根据权利要求1所述的方法,其特征在于,所述对所述当前帧的增强层进行编码预测,得到帧内最优编码模式,包括:步骤A,接收所述当前帧的增强层的当前宏块的数据输入;步骤B,判断所述当前帧的增强层为质量增强层还是空域增强层,如果是质量增强层,执行步骤C,如果是空域增强层,执行步骤D;步骤C,判断所述当前帧的增强层的当前宏块对应的基础层宏块是否采用INTRA_BL进行编码预测,如果是,执行步骤E,如果不是,执行步骤F;步骤D,判断所述当前帧的增强层的当前宏块对应的基础层宏块是否采用帧内预测编码,如果是,则所述当前帧的增强层采用INTRA_BL进行编码预测,执行步骤F,如果不是,执行步骤I;步骤E,判断所述当前帧的增强层对应的基础层宏块是否采用4x4变换的编码方式进行编码预测,如果是,则将4x4变换的编码方式作为帧内最优编码模式,如果不是,则将8x8变换的编码方式作为帧内最优编码模式;步骤F,判断所述当前帧的增强层的当前宏块的残差数据的4×4子宏块的哈达玛变换和是否小于所述当前帧的增强层当前宏块的残差数据的8×8子宏块的哈达玛变换和与(1+α8)的乘积,如果是,则将4x4变换的编码方式作为帧内最优编码模式,如果不是,执行步骤G;其中,α8为预设的8×8变换编码模式的预测系数;步骤G,判断所述当前帧的增强层的当前宏块残差数据的8×8子宏块的哈达玛变换和是否小于所述当前帧的增强层的当前宏块残差数据的4×4子宏块的哈达玛变换和与(1+α4)的乘积,如果是,则将8x8变换的编码方式作为帧内最优编码模式,如果不是,执行步骤H;其中,α4为预设的4×4变换编码模式的预测系数;步骤H,分别计算编码模式为4×4变换和8×8变换时的率失真代价,根据所述编码模式为4×4变换和8×8变换时的率失真代价确定帧内最优编码模式;步骤I,依次进行Intra 16×16、Intra 4×4和Intra 8×8,INTRA_BL和脉码调制PCM模式的预测编码,并计算得到所述Intra 16×16、Intra 4×4和Intra 8×8,INTRA_BL和PCM模式的率失真代价,选择所述Intra 16×16、Intra 4×4和Intra 8×8,INTRA_BL和PCM模式中的率失真代价的最小的模式作为帧内最优编码模式。8.一种视频编码的编码模式选择装置,其特征在于,所述装置包括:判断模块,用于判断当前帧是否为I帧;第一获取模块,用于当所述判断模块判断得出所述当前帧是I帧时,获取所述当前帧的图像的相对复杂度;第一编码确定模块,用于当所述判断模块判断得出所述当前帧是I帧时,对所述当前帧的增强层进行编码预测,得到帧内最优编码模式;预测模块,用于当所述判断模块判断得出所述当前帧不是I帧时,对所述当前帧的增强层依次使用预设的最大概率编码模式集合中的所有编码模式进行编码预测,得当前最佳编码模式;条件计算模块,用于根据所述当前帧的当前宏块编码时使用的编码量化步长和所述当前帧的前一个I帧的图像的相对复杂度计算得到所述当前最佳编码模式的提前终止条件;第二编码确定模块,用于当所述当前最佳编码模式的率失真代价满足所述提前终止条件时,将所述当前最佳编码模式作为帧间最优编码模式。

说明书

一种视频编码的编码模式选择方法及装置

技术领域

本发明涉及视频编码领域,特别涉及一种视频编码的编码模式选择方法及装置。

背景技术

SVC(Scalable Video Coding,可伸缩视频编码)技术的研究已有近20年的历史,在
SVC编码中可包括多个空间层,每层为一个SVC编码器。例如,可以包括三个空间层:基础
层、第一增强层和第二增强层,输入序列在进入每个编码器前都经过下采样以支持多空间分
辨率。对每一个空间层来说,用于预测的参考图像可以是同一层中时间上相邻的图像,也可
以是经过空间上采样之后的低层重构图像,这是因为层与层之间存在着显而易见的相关性。
为了提高增强层的编码效率,可以采用一种层间预测机制来重用低层图像的纹理、运动、以
及残差信息。当低层图像需要上采样为不同空间分辨率时,这种预测模型需进行插值运算,
SVC在不同空间层之间支持非二值的空间分辨率比例。时域预测方面视频编码标准H.264采
用了等级预测结构来支持时间可伸缩性,为了更高的编码效率,运动补偿时域滤波结构作为
预处理工具被采用。

在H.264/AVC(Advanced Video Coding,高级视频编码)标准中,根据生成的预测信号
的自由度的不同将编码图像分成了三种类型:1)I帧,支持空域的帧内预测编码;2)P帧,
支持帧内预测编码和单向的帧间预测编码;3)B帧,支持帧内预测编码和双向权重帧间预测
编码。

在现有SVC快速编码算法标准上进行视频编码时,主要通过比较层间与层内的运动信息
选择是否使用层间预测模式。首先在增强层内的参考帧中获取当前宏块的最佳匹配块,并求
出相应的层内运动矢量,然后根据当前宏块的左上角像素计算相应的基础层参考宏块,并得
到基础层参考宏块的运动矢量,再根据基础层与增强层之间的比例将基础层参考宏块的运动
矢量缩放到增强层,作为其层间预测运动矢量。比较层内运动矢量与层间预测运动矢量的大
小,若两者一致则使用层间预测模式,否则使用层内预测模式。

在实现本发明的过程中,发明人发现现有技术至少存在以下问题:

一般只针对小尺寸两层图像进行设计,应用于高清视频多层编码将导致编码性能较大的
下降,最大可达到20%,并且只针对帧间模式或者只针对帧内模式选择进行优化,编码效果
较差。

发明内容

为了解决现有视频编码技术中存在的问题,本发明实施例提供了一种视频编码的编码模
式选择方法及装置。所述技术方案如下:

一种视频编码的编码模式选择方法,所述方法包括:

判断当前帧是否为I帧;

当所述当前帧是I帧时,获取所述当前帧的图像的相对复杂度,并对所述当前帧的增强
层进行编码预测,得到帧内最优编码模式;

当所述当前帧不是I帧时,对所述当前帧的增强层依次使用预设的最大概率编码模式集
合中的所有编码模式进行编码预测,得当前最佳编码模式,根据所述当前帧的当前宏块编码
时使用的编码量化步长和所述当前帧的前一个I帧的图像的相对复杂度计算得到所述当前最
佳编码模式的提前终止条件,如果所述当前最佳编码模式的率失真代价满足所述提取终止条
件,则将所述当前最佳编码模式作为帧间最优编码模式。

一种视频编码的编码模式选择装置,所述装置包括:

判断模块,用于判断当前帧是否为I帧;

第一获取模块,用于当所述判断模块判断得出所述当前帧是I帧时,对所述当前帧基础
层进行编码,获取所述当前帧的图像的相对复杂度;

第一编码确定模块,用于当所述判断模块判断得出所述当前帧是I帧时,对所述当前帧
的增强层使用快速模式选择算法,得到帧内最优编码模式;

预测模块,用于当所述判断模块判断得出所述当前帧不是I帧时,对所述当前帧的增强
层依次使用预设的最大概率编码模式集合中的所有编码模式进行编码预测,得当前最佳编码
模式;

条件计算模块,用于根据所述当前帧的当前宏块编码时使用的编码量化步长和所述当前
帧的前一个I帧的图像的相对复杂度计算得到所述当前最佳编码模式的提前终止条件;

第二编码确定模块,用于当所述当前最佳编码模式的率失真代价满足所述提前终止条件
时,将所述当前最佳编码模式作为帧间最优编码模式。

本发明提供的技术方案带来的有益效果是:针对帧内和帧间模式的编码选择进行了优化,
使用前一个I帧的图像相对复杂度结合编码量化步长确定提前终止条件,能够快速选择编码
模式,并且能够自适应编码参数以及图像复杂度变化,能够有效提高编码效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附
图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域
普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例1中提供的一种视频编码的编码模式选择方法的流程示意图;

图2是本发明实施例2中提供的一种视频编码的编码模式选择方法的流程示意图;

图3是本发明实施例3中提供的一种视频编码的编码模式选择装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进
一步地详细描述。

实施例1

由图1所示,本实施例提供了一种视频编码的编码模式选择方法,包括:

101、判断当前帧是否为I帧,如果是,执行102,如果不是,执行103;

102、获取当前帧的图像的相对复杂度,并对当前帧的增强层进行快速编码,得到帧内最
优编码模式;

103、对当前帧的增强层依次使用预设的最大概率编码模式集合中的所有编码模式进行编
码预测,得当前最佳编码模式,根据当前帧的当前宏块编码时使用的编码量化步长和当前帧
的前一个I帧的图像的相对复杂度计算得到当前最佳编码模式的提前终止条件,如果当前最
佳编码模式的率失真代价满足提前终止条件,则将当前最佳编码模式作为帧间最优编码模式。

本发明实施例所提供的视频编码的编码模式选择方法,针对帧内和帧间模式的编码选择
进行了优化,使用前一个I帧的图像相对复杂度结合编码量化步长确定提前终止条件,能够
快速选择编码模式,并且能够自适应编码参数变化,能够有效提高编码效率。

实施例2

由图2所示,本实施例提供了一种视频编码的编码模式选择方法,是在实施例1的基础
之上进行了改进,在本方法中,执行主体为编码器,其中,该编码器可以为JSVM9.19编码
器。

需要说明的是,在实施例中所使用的编码模式均在现有协议中有规定,如下:

在帧内预测编码模式中,共提供了22种宏块帧内预测编码模式,其中有9种属于Intra
4×4模式,用于4×4子块;有9种属于Intra 8×8模式,用于8×8子块;另外4种则属
于Intra 16×16类型,用于整个16×16宏块。可伸缩性编码使用帧内预测模式进行编码时,
除了H.264/AVC中定义的帧内预测模式之外,SVC还新定义了一种INTRA_BL宏块模式。

对于Intra 4×4类型来说,宏块首先被划分为16个子块,然后每个4×4亮度子块都使
用在空间上与之相邻的子块像素值来预测。

对于Intra 8×8类型来说,宏块首先被划分为4个子块,然后每个8×8亮度子块都使用
在空间上与之相邻的子块像素值来预测。

对于Intra 16×16类型来说,整个16×16宏块被与之相邻的宏块预测编码。其预测模
式顺序排列为:垂直预测(模式0)、水平预测(模式1)、DC预测(模式2)和平面预测(模
式3)。

在P帧和B帧中,宏块被划分成为16x16,16x8,8x16,8x8块,并且当宏块被划分为
8x8块时,它还可以进一步划分成为8x4,4x4,4x8三种子宏块。使用帧内预测编码模式时,
P帧和B帧的预测模式包含了I帧中所使用的帧内预测编码模式。使用帧间预测时,对于P
帧而言,每一个块只能有一个运动矢量,而对于B帧而言,每一个块则可有两个运动矢量。
待编码宏块的参考图像可以是16x16,16x8,8x16,8x8块中的一种。此外,H.264/AVC还提
供了两种特殊的模式:直接模式以及跳过模式。P帧只可使用跳过模式,而B帧可以使用直
接模式和跳过模式两种。直接模式和跳过模式都不传送运动矢量以及参考索引,而是从前面
已传送的信息获得当前块的运动矢量和参考索引。

SVC还提供了层间残差预测编码模式。层间残差预测编码模式的使用范围比较广泛:只
要宏块使用了帧间预测——无论是传统的帧间预测还是新增加的层间帧间预测——都可以使
用层间残差预测。

低分辨率层是由高分辨率层剪裁、下采样得到的,增强层中的宏块不一定都能够找到对
应的基础层宏块。因此这部分宏块将采用传统的H.264/AVC模式选择算法进行模式选择。

基于上述SVC提供的多种编码模式,一种视频编码的编码模式选择方法具体包括如下步
骤:

201、判断当前帧是否为I帧,如果是,执行步骤202,如果不是,执行步骤205;

202、对当前帧的基础层进行编码,并获取当前帧的图像的相对复杂度λ;

其中,由于基本层的编码模式决策算法与H.264/AVC中相同,因此这里不再赘述对当前
帧的基础层进行编码的方法。

在现有的H.264编码框架中,I帧只采用帧内预测的方式进行编码,最能体现图像的复
杂度信息。并且在本发明中,I帧的基础层按照现有标准的模式选择方式最先开始编码,最
能体现视频序列的复杂度信息。因此,利用I帧的基础层编码信息进行序列复杂度估计。在
不同的应用场景中,图像复杂度的评价标准选取方法各有不同。在本发明中,MAD(Mean 
Absolute Difference,平均绝对差)表征了原始图像和预测图像之间的差值,用于描述图像
复杂度,本发明采用宏块预测后的MAD值估计图像复杂度。

相应地,获取当前帧的图像的相对复杂度λ的方法,具体包括:

202-1、获取预设的训练序列的I帧的基础层宏块编码的MAD均值MADref;

需要说明的是,预设的训练序列可以为与当前需编码的视频无关的一个视频序列,该视
频序列用以计算一般情况下I帧的基础层宏块编码的MAD均值MADref。

在本实施例中,步骤202-1具体包括:

a.对预设的训练序列的I帧的基础层宏块编码的MAD均值使式1进行函数拟合,得到拟
合系数α,β和γ;

MADref(QP)=α·eβ·QP+γ                                            (式1)

其中,QP为预设的训练序列的I帧的基础层宏块的编码量化步长,MADref(QP)为在QP
下预设的训练序列的I帧的基础层宏块编码的MAD均值;

b.当对当前帧的基础层进行编码时,将当前帧的当前宏块所使用的编码量化步长QP′使
用式2计算得到MADref;

MADref=α·eβ·QP′+γ                                               (式2)

202-2、获取当前帧的基础层的宏块的MAD均值MADcur;

202-3、根据式3计算得到当前帧的图像的相对复杂度λ。

λ = MAD ref MAD cur ]]>(式3)

其中,λ为当前帧的图像的相对复杂度,MADref表示预设的训练序列的I帧的基础层
宏块编码的MAD均值,MADcur表示当前帧的基础层的宏块的MAD均值。

203、对当前帧的增强层进行编码预测,得到帧内最优编码模式,并执行步骤204;

进一步地,本步骤203具体包括:

203-1、编码器接收当前帧的增强层的当前宏块的数据输入;

203-2、判断当前帧的增强层为质量增强层还是空域增强层,如果是质量增强层,执行步
骤203-3,如果是空域增强层,执行步骤203-4;

203-3、判断当前帧的增强层的当前宏块对应的基础层宏块是否采用INTRA_BL的编码
模式进行预测,如果是,执行步骤203-5,如果不是,执行步骤203-6;

203-4、判断当前帧的增强层的当前宏块对应的基础层宏块是否采用帧内预测编码,如果
是,则当前帧的增强层采用INTRA_BL进行编码预测,执行步骤203-6,如果不是,执行步骤
203-9;

203-5、判断当前帧的增强层对应的基础层宏块是否采用4x4变换的编码方式进行编码预
测,如果是,则将4x4变换的编码方式作为帧内最优编码模式,如果不是,则将8x8变换的
编码方式作为帧内最优编码模式;

203-6、判断当前帧的增强层的当前宏块的残差数据的4×4子宏块的hadamard(哈达玛)
变换和是否小于当前帧的增强层当前宏块的残差数据的8×8子宏块的hadamard变换和与
(1+α8)的乘积,如果是,则将4x4变换的编码方式作为帧内最优编码模式,如果不是,执
行步骤203-7;

其中,α8为8×8变换编码模式的预测系数,在本实施例中为0.1。

进一步地,通过对编码残差数据进行hadamard变换,来判断是否进行4x4和8x8变换编
码预测,可以有效的降低编码复杂度;

因此,判断当前帧的增强层的当前宏块的残差数据的4×4子宏块的hadamard变换和是
否小于前帧的增强层当前宏块的残差数据的8×8子宏块的hadamard变换和与(1+α8)的乘
积,具体包括:

a.设当前帧的增强层的当前宏块的原数据为Ms,其对应的基础层宏块解码数据为Mp,
则根据式4得到当前帧的增强层的当前宏块的残差数据M为:

M=Ms-Mp    (式4)

b.令M的每个4×4子宏块为M4,每个8×8子宏块为M8,分别根据式5、式6、式7
和式8对M4和M8宏块做hadamard变换。

M4′=H4×M4×H4    (式5)

M8′=H8×M8×H8    (式6)

H 4 = 1 1 1 1 1 1 - 1 - 1 1 - 1 - 1 - 1 1 - 1 1 - 1 ]]>(式7)

H 8 = 1 1 1 1 1 1 1 1 1 - 1 1 - 1 1 - 1 1 - 1 1 1 - 1 - 1 1 1 - 1 - 1 1 - 1 - 1 1 1 - 1 - 1 1 1 1 1 1 - 1 - 1 - 1 - 1 1 - 1 1 - 1 - 1 1 - 1 1 1 1 - 1 - 1 - 1 - 1 1 1 1 - 1 - 1 1 - 1 1 1 - 1 ]]>(式8)

其中,其中,M4′和M8′分别为子宏块M4和子宏块M8的hadamard变换结果,H4和H8
分别hadamard变换矩阵,具体如式7和式8所示。

c.根据式9和式10计算得到M4′和M8′的hadamard变换和;

L 4 = Σ i = 0 16 M 4 i ]]>(式9)

L 8 = Σ i = 0 4 M 8 i ]]>(式10)

其中,M4i′和M8i′分别为第i个子宏块M4′和M8′所有系数绝对值之和,L4和L8分别为子
宏块M4′和子宏块M8′的hadamard变换和。

d.判断L4是否小于L8×(1+α8),如果是,则将4x4变换的编码方式作为帧内最优编码模
式,如果不是,执行步骤203-7。

203-7、判断当前帧的增强层的当前宏块残差数据的8×8子宏块的hadamard变换和是否
小于当前帧的增强层的当前宏块残差数据的4×4子宏块的hadamard变换和与(1+α4)的乘
积,如果是,则将8x8变换的编码方式作为帧内最优编码模式,如果不是,执行步骤203-8;

其中,α4为4×4变换编码模式的预测系数,在本实施例中为0.1。

203-8、分别计算编码模式为4×4变换和8×8变换时的率失真代价,根据编码模式为4
×4变换和8×8变换时的率失真代价确定帧内最优编码模式;

203-9、依次进行Intra 16×16、Intra 4×4和Intra 8×8,INTRA_BL和PCM(Pulse-Code 
Modulation)模式的预测编码,并计算得到上述Intra 16×16、Intra 4×4和Intra 8×8,
INTRA_BL和PCM模式的率失真代价,选择上述Intra 16×16、Intra 4×4和Intra 8×8,
INTRA_BL和PCM模式中的率失真代价的最小的模式作为帧内最优编码模式。

204、使用帧内最优编码模式对当前帧进行编码并输出;

205、对当前帧的增强层依次使用预设的最大概率编码模式集合中的所有编码模式进行编
码预测,得当前最佳编码模式;

需要说明的是,预设的最大概率编码模式集合为根据经验数据得出的对于增强层最常用
的编码模式,对于空域增强层,BL_SKIP,DIRCT/SKIP以及MODE_16x16的中的一种的概率占
到了90%。因此选择增强层的当前最佳编码模式时,本发明拟优先检查这四种模式,特别地,
而对于质量增强层,只检查BL_SKIP模式,略去其他模式的检查。因此,在本实施例中,预
设的最大概率编码模式集合包括:BLSKIP,DIRCT/SKIP以及MODE_16x16。

相应地,对当前帧的增强层依次使用预设的最大概率编码模式集合中的所有编码模式进
行编码预测,得当前最佳编码模式,具体包括:

对当前帧的增强层依次使用预设的最大概率编码模式集合中的所有编码模式进行编码,
并计算各编码模式的率失真代价,将其中率失真代价最高的作为当前最佳编码模式。

206、根据当前帧的当前宏块编码时使用的编码量化步长和当前帧的前一个I帧的图像的
相对复杂度λ计算得到当前最佳编码模式的提前终止条件;

在本实施例中,本步骤具体的包括:

根据当前帧的当前宏块编码时使用的编码量化步长QP和当前帧的前一个I帧的图像的
相对复杂度λ使用式11计算得到第一率失真代价门限TH′b,e;

TH′b,e=λ·RDb,e(QP)                                            (式11)

其中,RDb,e(QP)为通过公式RDb,e(QP)=a·ek·QP+d计算得到的在QP下预设的
训练序列的条件模式率失真代价均值,a、k和d为拟合系数,条件模式率失真代价为在
预设的训练序列的当前宏块对应的基础层宏块采用b模式进行编码的情况下,预设的训练序
列的当前宏块采用e模式进行编码计算得到的率失真代价。

进一步地,对于上述式11,a、k和d通过使用预设的训练序列使用式12进行拟合得
到:

RD′b,e(QP)=a·ek·QP+d                                            (式12)

其中,RD′b,e(QP)为根据QP计算得到的预设的训练序列的条件模式率失真代价均值。

207、判断当前最佳编码模式的率失真代价是否满足提前终止条件如果不是,执行步骤
208,如果是,执行步骤209;

对于步骤206中提供的方法,本步骤具体的为:

判断当前最佳编码模式的率失真代价是否小于第一率失真代价门限。

例如,假设当前最佳编码模式为e,当前帧的图像的基础层的参考图像所使用的最优编
码模式为b,则当前最佳编码模式的率失真代价为RDb,e,根据本步骤判断RDb,e是否小于
TH′b,e,如果不是,执行步骤208,如果是,执行步骤209。

208、对当前帧的增强层使用除预设的最大概率编码模式集合之外的其他所有编码模式进
行编码预测,得到帧间最优编码模式;

需要说明的是,使用除预设的最大概率编码模式集合之外的其他所有编码模式进行编码
预测采取现有编码预测方式,这里不再赘述。

209、将当前最佳编码模式作为帧间最优编码模式进行编码并输出。

本发明实施例所提供的视频编码的编码模式选择方法,针对帧间模式的编码选择进行了
优化,且对帧内模型的编码选择有效,使用前一个I帧的图像相对复杂度结合编码量化步长
确定提前终止条件,能够快速选择编码模式,并且能够自适应编码参数变化,能够有效提高
编码效率。

实施例3

如图3所示,本发明实施例提供了一种视频编码的编码模式选择装置,该装置包括:

判断模块301,用于判断当前帧是否为I帧;

第一获取模块302,用于当判断模块301判断得出当前帧是I帧时,获取当前帧的图像
的相对复杂度;

第一编码确定模块303,用于当判断模块302判断得出当前帧是I帧时,对当前帧的增
强层进行编码预测,得到帧内最优编码模式;

预测模块304,用于当判断模块301判断得出当前帧不是I帧时,对当前帧的增强层依
次使用预设的最大概率编码模式集合中的所有编码模式进行编码预测,得当前最佳编码模式;

条件计算模块305,用于根据当前帧的当前宏块编码时使用的编码量化步长和当前帧的
前一个I帧的图像的相对复杂度计算得到当前最佳编码模式的提前终止条件;

第二编码确定模块306,用于当当前最佳编码模式的率失真代价满足提前终止条件时,
将当前最佳编码模式作为帧间最优编码模式。

本发明实施例所提供的视频编码的编码模式选择装置,针对帧间模式的编码选择进行了
优化,且对帧内模型的编码选择有效,使用前一个I帧的图像相对复杂度结合编码量化步长
确定提前终止条件,能够快速选择编码模式,并且能够自适应编码参数变化,能够有效提高
编码效率。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,
也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,
上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之
内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

一种视频编码的编码模式选择方法及装置.pdf_第1页
第1页 / 共15页
一种视频编码的编码模式选择方法及装置.pdf_第2页
第2页 / 共15页
一种视频编码的编码模式选择方法及装置.pdf_第3页
第3页 / 共15页
点击查看更多>>
资源描述

《一种视频编码的编码模式选择方法及装置.pdf》由会员分享,可在线阅读,更多相关《一种视频编码的编码模式选择方法及装置.pdf(15页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102790878 A (43)申请公布日 2012.11.21 C N 1 0 2 7 9 0 8 7 8 A *CN102790878A* (21)申请号 201110403133.X (22)申请日 2011.12.07 H04N 7/26(2006.01) H04N 7/32(2006.01) (71)申请人北京邮电大学 地址 100876 北京市海淀区西土城路10号 (72)发明人崔岩松 蔡晓霞 任维政 邓中亮 刘欣 段大高 (74)专利代理机构北京三高永信知识产权代理 有限责任公司 11138 代理人罗振安 (54) 发明名称 一种视频编码的编码模式选择方。

2、法及装置 (57) 摘要 本发明公开了一种视频编码的编码模式选择 方法及装置,属于视频编码领域。所述方法包括: 当前帧是I帧时,对当前I帧的增强层进行预测编 码,得到帧内最优编码模式;当前帧不是I帧时, 根据编码量化步长和当前帧的前一个I帧的图像 的相对复杂度计算得到当前最佳编码模式的提前 终止条件,如果当前最佳编码模式的率失真代价 满足提前终止条件,则将当前待检验编码模式作 为帧间最优编码模式。本发明分别针对帧间、帧内 编码的模式选择进行了优化,帧间模式选择则使 用前一个I帧的图像相对复杂度结合编码量化步 长确定提前终止条件,能够快速选择编码模式,并 且能够自适应编码参数变化,能够有效提高编。

3、码 速度,保证编码效率。 (51)Int.Cl. 权利要求书3页 说明书8页 附图3页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 3 页 说明书 8 页 附图 3 页 1/3页 2 1.一种视频编码的编码模式选择方法,其特征在于,所述方法包括: 判断当前帧是否为I帧; 当所述当前帧是I帧时,获取所述当前帧的图像的相对复杂度,并对所述当前帧的增 强层进行编码预测,得到帧内最优编码模式; 当所述当前帧不是I帧时,对所述当前帧的增强层依次使用预设的最大概率编码模式 集合中的所有编码模式进行编码预测,得当前最佳编码模式,根据所述当前帧的当前宏块 编码时使用的编码量化步长和。

4、所述当前帧的前一个I帧的图像的相对复杂度计算得到所 述当前最佳编码模式的提前终止条件,如果所述当前最佳编码模式的率失真代价满足所述 提前终止条件,则将所述当前最佳编码模式作为帧间最优编码模式。 2.根据权利要求1所述的方法,其特征在于,所述获取所述当前帧的图像的相对复杂 度,包括: 获取预设的训练序列的I帧的基础层宏块编码的平均绝对差MAD均值MAD ref ; 获取所述当前帧的基础层的宏块的MAD均值MAD cur ; 根据第一公式计算得到所述当前帧的图像的相对复杂度; 其中,所述第一公式具体为 3.根据权利要求2所述的方法,其特征在于,所述获取预设的训练序列的I帧的基础层 宏块编码的平均绝。

5、对差MAD均值MAD ref ,包括: 对所述预设的训练序列的I帧的基础层宏块编码的MAD均值使用第二公式进行函数拟 合,得到拟合系数,和; 其中,所述第二公式具体为MAD ref (QP)e QP +,QP为所述预设的训练序列的I 帧的基础层宏块的编码量化步长,MAD ref (QP)为在所述QP下所述预设的训练序列的I帧的 基础层宏块编码的MAD均值; 当对所述当前帧的基础层进行编码时,将当前帧的当前宏块所使用的编码量化步长 QP使用第三公式计算得到MAD ref ; 其中,所述第三公式具体为MAD ref e QP +。 4.根据权利要求1所述的方法,其特征在于,所述根据所述当前帧的当前。

6、宏块编码时 使用的编码量化步长和所述当前帧的前一个I帧的图像的相对复杂度计算得到所述当前 最佳编码模式的提前终止条件,包括: 根据所述当前帧的当前宏块编码时使用的编码量化步长QP和所述当前帧的前一个I 帧的图像的相对复杂度使用第四公式计算得到第一率失真代价门限TH b,e ; 其中,所述第四公式为TH b,e RD b,e (QP),RD b,e (QP)为通过公式RD b,e (QP) ae kQP +d计算得到的在所述QP下所述预设的训练序列的条件模式率失真代价均值,a、k 和d为拟合系数,所述条件模式率失真代价为在所述预设的训练序列的当前宏块对应的基 础层宏块采用b模式进行编码的情况下,。

7、所述预设的训练序列的当前宏块采用e模式进行 编码计算得到的率失真代价; 相应地,所述如果所述当前最佳编码模式的率失真代价满足所述提前终止条件,则将 所述当前最佳编码模式作为帧间最优编码模式,具体的为: 如果所述当前最佳编码模式的率失真代价小于所述第一率失真代价门限,则将所述当 权 利 要 求 书CN 102790878 A 2/3页 3 前最佳编码模式作为帧间最优编码模式。 5.根据权利要求4所述的方法,其特征在于,在所述根据所述当前帧的当前宏块编码 时使用的编码量化步长和所述当前帧的前一个I帧的图像的相对复杂度计算得到所述当 前最佳编码模式的提前终止条件之前,所述方法还包括: 使用所述预设的。

8、训练序列对根据公式RD b,e (QP)ae kQP +d进行拟合,得到拟合系 数a、k和d,其中,RD b,e (QP)为根据所述QP计算得到的所述预设的训练序列的条件模式 率失真代价均值。 6.根据权利要求1所述的方法,其特征在于,所述方法还包括: 当所述当前最佳编码模式的率失真代价不满足所述提前终止条件时,对所述当前帧的 增强层使用除所述预设的最大概率编码模式集合之外的其他所有编码模式进行编码预测, 得到帧间最优编码模式。 7.根据权利要求1所述的方法,其特征在于,所述对所述当前帧的增强层进行编码预 测,得到帧内最优编码模式,包括: 步骤A,接收所述当前帧的增强层的当前宏块的数据输入; 。

9、步骤B,判断所述当前帧的增强层为质量增强层还是空域增强层,如果是质量增强层, 执行步骤C,如果是空域增强层,执行步骤D; 步骤C,判断所述当前帧的增强层的当前宏块对应的基础层宏块是否采用INTRA_BL进 行编码预测,如果是,执行步骤E,如果不是,执行步骤F; 步骤D,判断所述当前帧的增强层的当前宏块对应的基础层宏块是否采用帧内预测编 码,如果是,则所述当前帧的增强层采用INTRA_BL进行编码预测,执行步骤F,如果不是,执 行步骤I; 步骤E,判断所述当前帧的增强层对应的基础层宏块是否采用4x4变换的编码方式进 行编码预测,如果是,则将4x4变换的编码方式作为帧内最优编码模式,如果不是,则将。

10、8x8 变换的编码方式作为帧内最优编码模式; 步骤F,判断所述当前帧的增强层的当前宏块的残差数据的44子宏块的哈达玛变 换和是否小于所述当前帧的增强层当前宏块的残差数据的88子宏块的哈达玛变换和与 (1+ 8 )的乘积,如果是,则将4x4变换的编码方式作为帧内最优编码模式,如果不是,执行 步骤G; 其中, 8 为预设的88变换编码模式的预测系数; 步骤G,判断所述当前帧的增强层的当前宏块残差数据的88子宏块的哈达玛变换 和是否小于所述当前帧的增强层的当前宏块残差数据的44子宏块的哈达玛变换和与 (1+ 4 )的乘积,如果是,则将8x8变换的编码方式作为帧内最优编码模式,如果不是,执行 步骤H;。

11、 其中, 4 为预设的44变换编码模式的预测系数; 步骤H,分别计算编码模式为44变换和88变换时的率失真代价,根据所述编码模 式为44变换和88变换时的率失真代价确定帧内最优编码模式; 步骤I,依次进行Intra 1616、Intra 44和Intra 88,INTRA_BL和脉码调制PCM 模式的预测编码,并计算得到所述Intra 1616、Intra 44和Intra 88,INTRA_BL和 PCM模式的率失真代价,选择所述Intra 1616、Intra 44和Intra 88,INTRA_BL和 权 利 要 求 书CN 102790878 A 3/3页 4 PCM模式中的率失真代价。

12、的最小的模式作为帧内最优编码模式。 8.一种视频编码的编码模式选择装置,其特征在于,所述装置包括: 判断模块,用于判断当前帧是否为I帧; 第一获取模块,用于当所述判断模块判断得出所述当前帧是I帧时,获取所述当前帧 的图像的相对复杂度; 第一编码确定模块,用于当所述判断模块判断得出所述当前帧是I帧时,对所述当前 帧的增强层进行编码预测,得到帧内最优编码模式; 预测模块,用于当所述判断模块判断得出所述当前帧不是I帧时,对所述当前帧的增 强层依次使用预设的最大概率编码模式集合中的所有编码模式进行编码预测,得当前最佳 编码模式; 条件计算模块,用于根据所述当前帧的当前宏块编码时使用的编码量化步长和所述。

13、当 前帧的前一个I帧的图像的相对复杂度计算得到所述当前最佳编码模式的提前终止条件; 第二编码确定模块,用于当所述当前最佳编码模式的率失真代价满足所述提前终止条 件时,将所述当前最佳编码模式作为帧间最优编码模式。 权 利 要 求 书CN 102790878 A 1/8页 5 一种视频编码的编码模式选择方法及装置 技术领域 0001 本发明涉及视频编码领域,特别涉及一种视频编码的编码模式选择方法及装置。 背景技术 0002 SVC(Scalable Video Coding,可伸缩视频编码)技术的研究已有近20年的历史, 在SVC编码中可包括多个空间层,每层为一个SVC编码器。例如,可以包括三个空。

14、间层:基 础层、第一增强层和第二增强层,输入序列在进入每个编码器前都经过下采样以支持多空 间分辨率。对每一个空间层来说,用于预测的参考图像可以是同一层中时间上相邻的图像, 也可以是经过空间上采样之后的低层重构图像,这是因为层与层之间存在着显而易见的相 关性。为了提高增强层的编码效率,可以采用一种层间预测机制来重用低层图像的纹理、运 动、以及残差信息。当低层图像需要上采样为不同空间分辨率时,这种预测模型需进行插值 运算,SVC在不同空间层之间支持非二值的空间分辨率比例。时域预测方面视频编码标准 H.264采用了等级预测结构来支持时间可伸缩性,为了更高的编码效率,运动补偿时域滤波 结构作为预处理工。

15、具被采用。 0003 在H.264/AVC(Advanced Video Coding,高级视频编码)标准中,根据生成的预测 信号的自由度的不同将编码图像分成了三种类型:1)I帧,支持空域的帧内预测编码;2)P 帧,支持帧内预测编码和单向的帧间预测编码;3)B帧,支持帧内预测编码和双向权重帧间 预测编码。 0004 在现有SVC快速编码算法标准上进行视频编码时,主要通过比较层间与层内的运 动信息选择是否使用层间预测模式。首先在增强层内的参考帧中获取当前宏块的最佳匹配 块,并求出相应的层内运动矢量,然后根据当前宏块的左上角像素计算相应的基础层参考 宏块,并得到基础层参考宏块的运动矢量,再根据基础。

16、层与增强层之间的比例将基础层参 考宏块的运动矢量缩放到增强层,作为其层间预测运动矢量。比较层内运动矢量与层间预 测运动矢量的大小,若两者一致则使用层间预测模式,否则使用层内预测模式。 0005 在实现本发明的过程中,发明人发现现有技术至少存在以下问题: 0006 一般只针对小尺寸两层图像进行设计,应用于高清视频多层编码将导致编码性能 较大的下降,最大可达到20,并且只针对帧间模式或者只针对帧内模式选择进行优化,编 码效果较差。 发明内容 0007 为了解决现有视频编码技术中存在的问题,本发明实施例提供了一种视频编码的 编码模式选择方法及装置。所述技术方案如下: 0008 一种视频编码的编码模式。

17、选择方法,所述方法包括: 0009 判断当前帧是否为I帧; 0010 当所述当前帧是I帧时,获取所述当前帧的图像的相对复杂度,并对所述当前帧 的增强层进行编码预测,得到帧内最优编码模式; 说 明 书CN 102790878 A 2/8页 6 0011 当所述当前帧不是I帧时,对所述当前帧的增强层依次使用预设的最大概率编码 模式集合中的所有编码模式进行编码预测,得当前最佳编码模式,根据所述当前帧的当前 宏块编码时使用的编码量化步长和所述当前帧的前一个I帧的图像的相对复杂度计算得 到所述当前最佳编码模式的提前终止条件,如果所述当前最佳编码模式的率失真代价满足 所述提取终止条件,则将所述当前最佳编码。

18、模式作为帧间最优编码模式。 0012 一种视频编码的编码模式选择装置,所述装置包括: 0013 判断模块,用于判断当前帧是否为I帧; 0014 第一获取模块,用于当所述判断模块判断得出所述当前帧是I帧时,对所述当前 帧基础层进行编码,获取所述当前帧的图像的相对复杂度; 0015 第一编码确定模块,用于当所述判断模块判断得出所述当前帧是I帧时,对所述 当前帧的增强层使用快速模式选择算法,得到帧内最优编码模式; 0016 预测模块,用于当所述判断模块判断得出所述当前帧不是I帧时,对所述当前帧 的增强层依次使用预设的最大概率编码模式集合中的所有编码模式进行编码预测,得当前 最佳编码模式; 0017 。

19、条件计算模块,用于根据所述当前帧的当前宏块编码时使用的编码量化步长和所 述当前帧的前一个I帧的图像的相对复杂度计算得到所述当前最佳编码模式的提前终止 条件; 0018 第二编码确定模块,用于当所述当前最佳编码模式的率失真代价满足所述提前终 止条件时,将所述当前最佳编码模式作为帧间最优编码模式。 0019 本发明提供的技术方案带来的有益效果是:针对帧内和帧间模式的编码选择进行 了优化,使用前一个I帧的图像相对复杂度结合编码量化步长确定提前终止条件,能够快 速选择编码模式,并且能够自适应编码参数以及图像复杂度变化,能够有效提高编码效率。 附图说明 0020 为了更清楚地说明本发明实施例中的技术方案。

20、,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图。 0021 图1是本发明实施例1中提供的一种视频编码的编码模式选择方法的流程示意 图; 0022 图2是本发明实施例2中提供的一种视频编码的编码模式选择方法的流程示意 图; 0023 图3是本发明实施例3中提供的一种视频编码的编码模式选择装置的结构示意 图。 具体实施方式 0024 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方 式作进一步地详细描述。 0025 实施例1。

21、 说 明 书CN 102790878 A 3/8页 7 0026 由图1所示,本实施例提供了一种视频编码的编码模式选择方法,包括: 0027 101、判断当前帧是否为I帧,如果是,执行102,如果不是,执行103; 0028 102、获取当前帧的图像的相对复杂度,并对当前帧的增强层进行快速编码,得到 帧内最优编码模式; 0029 103、对当前帧的增强层依次使用预设的最大概率编码模式集合中的所有编码模 式进行编码预测,得当前最佳编码模式,根据当前帧的当前宏块编码时使用的编码量化步 长和当前帧的前一个I帧的图像的相对复杂度计算得到当前最佳编码模式的提前终止条 件,如果当前最佳编码模式的率失真代价。

22、满足提前终止条件,则将当前最佳编码模式作为 帧间最优编码模式。 0030 本发明实施例所提供的视频编码的编码模式选择方法,针对帧内和帧间模式的编 码选择进行了优化,使用前一个I帧的图像相对复杂度结合编码量化步长确定提前终止条 件,能够快速选择编码模式,并且能够自适应编码参数变化,能够有效提高编码效率。 0031 实施例2 0032 由图2所示,本实施例提供了一种视频编码的编码模式选择方法,是在实施例1的 基础之上进行了改进,在本方法中,执行主体为编码器,其中,该编码器可以为JSVM9.19编 码器。 0033 需要说明的是,在实施例中所使用的编码模式均在现有协议中有规定,如下: 0034 在帧。

23、内预测编码模式中,共提供了22种宏块帧内预测编码模式,其中有9种属于 Intra44模式,用于44子块;有9种属于Intra 88模式,用于88子块;另外4种 则属于Intra 1616类型,用于整个1616宏块。可伸缩性编码使用帧内预测模式进行 编码时,除了H.264/AVC中定义的帧内预测模式之外,SVC还新定义了一种INTRA_BL宏块 模式。 0035 对于Intra 44类型来说,宏块首先被划分为16个子块,然后每个44亮度子 块都使用在空间上与之相邻的子块像素值来预测。 0036 对于Intra 88类型来说,宏块首先被划分为4个子块,然后每个88亮度子块 都使用在空间上与之相邻的。

24、子块像素值来预测。 0037 对于Intra 1616类型来说,整个1616宏块被与之相邻的宏块预测编码。其 预测模式顺序排列为:垂直预测(模式0)、水平预测(模式1)、DC预测(模式2)和平面预 测(模式3)。 0038 在P帧和B帧中,宏块被划分成为16x16,16x8,8x16,8x8块,并且当宏块被划分为 8x8块时,它还可以进一步划分成为8x4,4x4,4x8三种子宏块。使用帧内预测编码模式时, P帧和B帧的预测模式包含了I帧中所使用的帧内预测编码模式。使用帧间预测时,对于 P帧而言,每一个块只能有一个运动矢量,而对于B帧而言,每一个块则可有两个运动矢量。 待编码宏块的参考图像可以是。

25、16x16,16x8,8x16,8x8块中的一种。此外,H.264/AVC还提 供了两种特殊的模式:直接模式以及跳过模式。P帧只可使用跳过模式,而B帧可以使用直 接模式和跳过模式两种。直接模式和跳过模式都不传送运动矢量以及参考索引,而是从前 面已传送的信息获得当前块的运动矢量和参考索引。 0039 SVC还提供了层间残差预测编码模式。层间残差预测编码模式的使用范围比较广 泛:只要宏块使用了帧间预测无论是传统的帧间预测还是新增加的层间帧间预测 说 明 书CN 102790878 A 4/8页 8 都可以使用层间残差预测。 0040 低分辨率层是由高分辨率层剪裁、下采样得到的,增强层中的宏块不一定。

26、都能够 找到对应的基础层宏块。因此这部分宏块将采用传统的H.264/AVC模式选择算法进行模式 选择。 0041 基于上述SVC提供的多种编码模式,一种视频编码的编码模式选择方法具体包括 如下步骤: 0042 201、判断当前帧是否为I帧,如果是,执行步骤202,如果不是,执行步骤205; 0043 202、对当前帧的基础层进行编码,并获取当前帧的图像的相对复杂度; 0044 其中,由于基本层的编码模式决策算法与H.264/AVC中相同,因此这里不再赘述 对当前帧的基础层进行编码的方法。 0045 在现有的H.264编码框架中,I帧只采用帧内预测的方式进行编码,最能体现图 像的复杂度信息。并且。

27、在本发明中,I帧的基础层按照现有标准的模式选择方式最先开始 编码,最能体现视频序列的复杂度信息。因此,利用I帧的基础层编码信息进行序列复杂 度估计。在不同的应用场景中,图像复杂度的评价标准选取方法各有不同。在本发明中, MAD(Mean Absolute Difference,平均绝对差)表征了原始图像和预测图像之间的差值,用 于描述图像复杂度,本发明采用宏块预测后的MAD值估计图像复杂度。 0046 相应地,获取当前帧的图像的相对复杂度的方法,具体包括: 0047 202-1、获取预设的训练序列的I帧的基础层宏块编码的MAD均值MAD ref ; 0048 需要说明的是,预设的训练序列可以为。

28、与当前需编码的视频无关的一个视频序 列,该视频序列用以计算一般情况下I帧的基础层宏块编码的MAD均值MAD ref 。 0049 在本实施例中,步骤202-1具体包括: 0050 a.对预设的训练序列的I帧的基础层宏块编码的MAD均值使式1进行函数拟合, 得到拟合系数,和; 0051 MAD ref (QP)e QP + (式1) 0052 其中,QP为预设的训练序列的I帧的基础层宏块的编码量化步长,MAD ref (QP)为在 QP下预设的训练序列的I帧的基础层宏块编码的MAD均值; 0053 b.当对当前帧的基础层进行编码时,将当前帧的当前宏块所使用的编码量化步长 QP使用式2计算得到MA。

29、D ref ; 0054 MAD ref e QP + (式2) 0055 202-2、获取当前帧的基础层的宏块的MAD均值MAD cur ; 0056 202-3、根据式3计算得到当前帧的图像的相对复杂度。 0057 (式3) 0058 其中,为当前帧的图像的相对复杂度,MAD ref 表示预设的训练序列的I帧的基础 层宏块编码的MAD均值,MAD cur 表示当前帧的基础层的宏块的MAD均值。 0059 203、对当前帧的增强层进行编码预测,得到帧内最优编码模式,并执行步骤204; 0060 进一步地,本步骤203具体包括: 0061 203-1、编码器接收当前帧的增强层的当前宏块的数据输。

30、入; 0062 203-2、判断当前帧的增强层为质量增强层还是空域增强层,如果是质量增强层, 说 明 书CN 102790878 A 5/8页 9 执行步骤203-3,如果是空域增强层,执行步骤203-4; 0063 203-3、判断当前帧的增强层的当前宏块对应的基础层宏块是否采用INTRA_BL的 编码模式进行预测,如果是,执行步骤203-5,如果不是,执行步骤203-6; 0064 203-4、判断当前帧的增强层的当前宏块对应的基础层宏块是否采用帧内预测编 码,如果是,则当前帧的增强层采用INTRA_BL进行编码预测,执行步骤203-6,如果不是,执 行步骤203-9; 0065 203-。

31、5、判断当前帧的增强层对应的基础层宏块是否采用4x4变换的编码方式进 行编码预测,如果是,则将4x4变换的编码方式作为帧内最优编码模式,如果不是,则将8x8 变换的编码方式作为帧内最优编码模式; 0066 203-6、判断当前帧的增强层的当前宏块的残差数据的44子宏块的 hadamard(哈达玛)变换和是否小于当前帧的增强层当前宏块的残差数据的88子宏块的 hadamard变换和与(1+ 8 )的乘积,如果是,则将4x4变换的编码方式作为帧内最优编码模 式,如果不是,执行步骤203-7; 0067 其中, 8 为88变换编码模式的预测系数,在本实施例中为0.1。 0068 进一步地,通过对编码。

32、残差数据进行hadamard变换,来判断是否进行4x4和8x8 变换编码预测,可以有效的降低编码复杂度; 0069 因此,判断当前帧的增强层的当前宏块的残差数据的44子宏块的hadamard 变换和是否小于前帧的增强层当前宏块的残差数据的88子宏块的hadamard变换和与 (1+ 8 )的乘积,具体包括: 0070 a.设当前帧的增强层的当前宏块的原数据为Ms,其对应的基础层宏块解码数据 为Mp,则根据式4得到当前帧的增强层的当前宏块的残差数据M为: 0071 MMs-Mp (式4) 0072 b.令M的每个44子宏块为M 4 ,每个88子宏块为M 8 ,分别根据式5、式6、式7 和式8对M。

33、 4 和M 8 宏块做hadamard变换。 0073 M 4 H 4 M 4 H 4 (式5) 0074 M8H 8 M 8 H 8 (式6) 0075 (式7) 0076 (式8) 0077 其中,其中,M 4 和M 8 分别为子宏块M 4 和子宏块M 8 的hadamard变换结果,H 4 和 说 明 书CN 102790878 A 6/8页 10 H 8 分别hadamard变换矩阵,具体如式7和式8所示。 0078 c.根据式9和式10计算得到M 4 和M 8 的hadamard变换和; 0079 (式9) 0080 (式10) 0081 其中,M 4i 和M 8i 分别为第i个子宏。

34、块M 4 和M 8 所有系数绝对值之和,L 4 和L 8 分别为子宏块M 4 和子宏块M 8 的hadamard变换和。 0082 d.判断L 4 是否小于L 8 (1+ 8 ),如果是,则将4x4变换的编码方式作为帧内最优 编码模式,如果不是,执行步骤203-7。 0083 203-7、判断当前帧的增强层的当前宏块残差数据的88子宏块的hadamard变 换和是否小于当前帧的增强层的当前宏块残差数据的44子宏块的hadamard变换和与 (1+ 4 )的乘积,如果是,则将8x8变换的编码方式作为帧内最优编码模式,如果不是,执行 步骤203-8; 0084 其中, 4 为44变换编码模式的预测。

35、系数,在本实施例中为0.1。 0085 203-8、分别计算编码模式为44变换和88变换时的率失真代价,根据编码模 式为44变换和88变换时的率失真代价确定帧内最优编码模式; 0086 203-9、依次进行Intra 1616、Intra 44和Intra 88,INTRA_BL和 PCM(Pulse-Code Modulation)模式的预测编码,并计算得到上述Intra 1616、Intra 44和Intra 88,INTRA_BL和PCM模式的率失真代价,选择上述Intra 1616、Intra 44和Intra 88,INTRA_BL和PCM模式中的率失真代价的最小的模式作为帧内最优编。

36、 码模式。 0087 204、使用帧内最优编码模式对当前帧进行编码并输出; 0088 205、对当前帧的增强层依次使用预设的最大概率编码模式集合中的所有编码模 式进行编码预测,得当前最佳编码模式; 0089 需要说明的是,预设的最大概率编码模式集合为根据经验数据得出的对于增强层 最常用的编码模式,对于空域增强层,BL_SKIP,DIRCT/SKIP以及MODE_16x16的中的一种的 概率占到了90。因此选择增强层的当前最佳编码模式时,本发明拟优先检查这四种模式, 特别地,而对于质量增强层,只检查BL_SKIP模式,略去其他模式的检查。因此,在本实施例 中,预设的最大概率编码模式集合包括:BL。

37、SKIP,DIRCT/SKIP以及MODE_16x16。 0090 相应地,对当前帧的增强层依次使用预设的最大概率编码模式集合中的所有编码 模式进行编码预测,得当前最佳编码模式,具体包括: 0091 对当前帧的增强层依次使用预设的最大概率编码模式集合中的所有编码模式进 行编码,并计算各编码模式的率失真代价,将其中率失真代价最高的作为当前最佳编码模 式。 0092 206、根据当前帧的当前宏块编码时使用的编码量化步长和当前帧的前一个I帧 的图像的相对复杂度计算得到当前最佳编码模式的提前终止条件; 0093 在本实施例中,本步骤具体的包括: 0094 根据当前帧的当前宏块编码时使用的编码量化步长Q。

38、P和当前帧的前一个I帧的 说 明 书CN 102790878 A 10 7/8页 11 图像的相对复杂度使用式11计算得到第一率失真代价门限TH b,e ; 0095 TH b,e RD b,e (QP) (式11) 0096 其中,RD b,e (QP)为通过公式RD b,e (QP)ae kQP +d计算得到的在QP下预设的训 练序列的条件模式率失真代价均值,a、k和d为拟合系数,条件模式率失真代价为在预设的 训练序列的当前宏块对应的基础层宏块采用b模式进行编码的情况下,预设的训练序列的 当前宏块采用e模式进行编码计算得到的率失真代价。 0097 进一步地,对于上述式11,a、k和d通过使。

39、用预设的训练序列使用式12进行拟合 得到: 0098 RD b,e (QP)ae kQP +d (式12) 0099 其中,RD b,e (QP)为根据QP计算得到的预设的训练序列的条件模式率失真代价 均值。 0100 207、判断当前最佳编码模式的率失真代价是否满足提前终止条件如果不是,执行 步骤208,如果是,执行步骤209; 0101 对于步骤206中提供的方法,本步骤具体的为: 0102 判断当前最佳编码模式的率失真代价是否小于第一率失真代价门限。 0103 例如,假设当前最佳编码模式为e,当前帧的图像的基础层的参考图像所使用的最 优编码模式为b,则当前最佳编码模式的率失真代价为RD 。

40、b,e ,根据本步骤判断RD b,e 是否小 于TH b,e ,如果不是,执行步骤208,如果是,执行步骤209。 0104 208、对当前帧的增强层使用除预设的最大概率编码模式集合之外的其他所有编 码模式进行编码预测,得到帧间最优编码模式; 0105 需要说明的是,使用除预设的最大概率编码模式集合之外的其他所有编码模式进 行编码预测采取现有编码预测方式,这里不再赘述。 0106 209、将当前最佳编码模式作为帧间最优编码模式进行编码并输出。 0107 本发明实施例所提供的视频编码的编码模式选择方法,针对帧间模式的编码选择 进行了优化,且对帧内模型的编码选择有效,使用前一个I帧的图像相对复杂度。

41、结合编码 量化步长确定提前终止条件,能够快速选择编码模式,并且能够自适应编码参数变化,能够 有效提高编码效率。 0108 实施例3 0109 如图3所示,本发明实施例提供了一种视频编码的编码模式选择装置,该装置包 括: 0110 判断模块301,用于判断当前帧是否为I帧; 0111 第一获取模块302,用于当判断模块301判断得出当前帧是I帧时,获取当前帧的 图像的相对复杂度; 0112 第一编码确定模块303,用于当判断模块302判断得出当前帧是I帧时,对当前帧 的增强层进行编码预测,得到帧内最优编码模式; 0113 预测模块304,用于当判断模块301判断得出当前帧不是I帧时,对当前帧的增。

42、强 层依次使用预设的最大概率编码模式集合中的所有编码模式进行编码预测,得当前最佳编 码模式; 0114 条件计算模块305,用于根据当前帧的当前宏块编码时使用的编码量化步长和当 说 明 书CN 102790878 A 11 8/8页 12 前帧的前一个I帧的图像的相对复杂度计算得到当前最佳编码模式的提前终止条件; 0115 第二编码确定模块306,用于当当前最佳编码模式的率失真代价满足提前终止条 件时,将当前最佳编码模式作为帧间最优编码模式。 0116 本发明实施例所提供的视频编码的编码模式选择装置,针对帧间模式的编码选择 进行了优化,且对帧内模型的编码选择有效,使用前一个I帧的图像相对复杂度。

43、结合编码 量化步长确定提前终止条件,能够快速选择编码模式,并且能够自适应编码参数变化,能够 有效提高编码效率。 0117 本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件 来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读 存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。 0118 以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。 说 明 书CN 102790878 A 12 1/3页 13 图1 说 明 书 附 图CN 102790878 A 13 2/3页 14 图2 说 明 书 附 图CN 102790878 A 14 3/3页 15 图3 说 明 书 附 图CN 102790878 A 15 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1