视频编码的全局判决方法.pdf

摘要
申请专利号：	CN98117796.4	申请日：	1998.09.18
公开号：	CN1212578A	公开日：	1999.03.31
当前法律状态：	终止	有效性：	无权
法律详情：	专利权的终止(未缴年费专利权终止)授权公告日：2001.6.13\|\|\|授权\|\|\|公开\|\|\|
IPC分类号：	H04N7/32	主分类号：	H04N7/32
申请人：	清华大学;
发明人：	朱雪龙; 谢波
地址：	100084北京市海淀区清华园
优先权：
专利代理机构：	清华大学专利事务所	代理人：	廖元秋
PDF下载：	PDF下载

内容摘要

本发明属运动图象编码技术领域。本发明包括运动估计、帧预测与预测误差生成,变换与量化,图象重建、熵编码四部分;其特征在于:在运动估计部分,设置对分级搜索块匹配过程中每级结果进行判决的全局判决器,判断当前帧图象重建误差是否超过上一帧图象的重建误差;所说的全局判决器采用重建误差判决准则。采用本发明可大大提高了编码的速度。

权利要求书

1：一种视频编码的全局判决方法，包括运动估计、帧预测与预测误差生成，变换与量化，图象重建、熵编码四部分；其特征在于：在运动估计部分，设置对分级搜索块匹配过程中每级结果进行判决的全局判决器，判断当前帧图象重建误差是否超过上一帧图象的重建误差；这一判决器能对编码过程的各部分进行控制，即控制(ⅰ)搜索是否停止；(ⅱ)帧差信号是否送入DCT进行变换与处理；本发明所说的全局判决器采用重建误差判决准则。
2：如权利要求1所述的视频编码的全局判决方法，其特征在于，所说的重建误差判决准则为：对当前帧(第k帧)宏块1，若在运动估计中满足SAD l (k) (i,j)≤E econl (k) ,(i,j)∈S, 则当前运动估计可以结束，(i,j)即为要找的宏块l的运动向量，而且宏块 l的其它编码运算，预测误差计算及DCT、Q、IQ、IDCT都可省去。

说明书

视频编码的全局判决方法
    本发明属运动图象编码技术领域。

    在当今信息化时代，图象的存储和传输变得愈来愈重要。由于图象原始数据信息量十分巨大，要在有限容量的存储介质进行存储和有限容量的信息通道传输图象，图象数据的压缩，也就是对运动图象进行编码是必不可少的。运动图象编码是通过综合利用图象信号在时间、空间、统计三方面的冗余度，以及场景的知识、人的视觉特性来实现的。目前较为成熟的编码方法是综合了预测编码、变换编码、熵编码几种编码方法以及运动补偿技术的混合编码方法，方框图如图1所示。其编码实现实现方法如下步骤：(1)对输入的当前图象和上一重建图象作运动估计ME，运动估计得到运动向量MV；(2)根据运动向量对上一重建帧作预测P，获得对当前图象的预测图象；(3)将当前图象减去当前图象的预测图象得到预测误差PE；(4)对预测误差作离散余弦变换DCT和量化Q；(5)对(4)的结果作变长编码VLC得到当前编码图象；和(6)对(4)的结果作逆量化IQ、逆离散余弦变换IDCT得到重建的预测误差，再与当前预测图象相加得到当前重建图象，经帧存储器FM变成上一重建图象。

    图1中各步骤的功能如下：·运动估计、预测及预测误差的计算(减法器)构成预测编码，是为了消除图象信号在时间上的相关性。图象在时间上地相关性表现为当前帧图象的某一部分是由上一帧图象的某一部分经过运动而得到的。而运动是通过运动向量来描述的，运动估计就是要求得运动向量，而预测则是根据运动向量来补偿、抵消当前帧图象与上一帧图象部分之间因运动而产生的信号的变化。·离散余弦变换DCT构成变换编码，目的是为了消除图象信号在空间上的相关性。量化Q既是后面熵编码的需要，又是利用了人的视觉特性来提高编码的质量。·变长编码VLC构成熵编码，进一步消除了图象信号的统计的相关性。·逆量化IQ、逆离散余弦变换IDCT、加法器实现图象重建，为预测提供参照物。

    现有实现上述混合编码方法的编码器如图2所示。图中块DCT、块Q、块IQ、块IDCT、块VLC是指一帧(一幅)图象中一块(按国际标准为8×8象素)为单位进离散余弦变换DCT、量化Q、逆量化IQ、逆离散余弦变换IDCT、变长编码VLC。宏块P是指以一帧图象中一个宏块(按国际标准为6个块)为单位进行预测P。宏块MV指宏块的运动向量。0块是指块中8×8个元素都为0。

    该编码器实现的工作过程为：首先，一帧(一幅)图象是以一块(8×8象素)或一宏块(6个块)为单位进行编码的。其次，整个编码过程分为两部分：运动估计和编码核心如图2虚框所示。当前帧宏块首先进入运动估计部分作运动估计，运动估计得到运动向量MV，输入到编码核心对当前帧宏块进行编码，具体分为如下步骤：

    首先，对当前帧宏块和上一重建帧宏块作运动估计。运动估计分为整象素搜索和半象素搜索两步。整象素搜索采用分级运动搜索方法，即将搜索域分级：静止点、小搜索域、大搜索域。这是典型的3级，具体实现可以有变化，如2级：静止点、小搜索域，即将小搜索域与大搜索域合并；或4级：静止点、小搜索域、大搜索域、更大搜索域，即将大搜索域再细分两级。在前两级搜索域搜索结束后要进行判断，判断是否满足判据而可以停止整象素搜索进入到半象素搜索和后面的编码核心，具体的判决准则可能是多种多样的。

    其次，进到编码核心以后，根据运动估计得到宏块的运动向量对上一重建帧宏块进行预测得到当前预测帧宏块，然后用减法器将当前帧宏块减去当前预测帧宏块计算预测误差，接着做DCT、Q、熵编码(VLC)和图象重建。

    这种编码器的实现方法的不足在于编码速度不够高。对QCIF格式简单运动图象序列(如Claire序列)，利用Pentium-133 PC仍无法做到软件实时编码(25帧/秒)。

    本发明的目的在于克服已有技术的不足之处，在原有编码方法的基础上增设对图象中大量不必要运算的判断，提高编码器速度。

    本发明提出一种视频编码的全局判决方法，包括运动估计、帧预测与预测误差生成，变换与量化，图象重建、熵编码四部分；其特征在于：在运动估计部分，设置对分级搜索块匹配过程中每级结果进行判决的全局判决器，判断当前帧图象的重建误差是否超过上一帧图象的重建误差；这一判决器能对编码过程的各部分进行控制，即控制(ⅰ)搜索是否停止；(ⅱ)帧差信号是否送入DCT进行变换与处理；本发明所说的全局判决器采用重建误差判决准则。

    本发明所说的重建误差判决准则为：对当前帧(第k帧)宏块l，若在运动估计中满足

    SADl(k)(i,j)≤Ereconl(k),(i,j)∈S,则当前运动估计可以结束，(i,j)即为要找的宏块l的运动向量，而且宏块l的其它编码运算，预测误差计算及DCT、Q、IQ、IDCT都可省去；若不满足上面不等式，则继续进行运动估计。

    本发明采用的重建误差判决准则的原理简述如下：在运动估计，通常采用块匹配法，要计算宏块的SAD(Sum of AbsoluteDifference)值，SADl(k)(i,j)=Σm=1NΣn=1N|Io(k)(m,n)-Io(k-l)(m+i,n+j)|,(i,j)∈S--(1)]]>其中SADl(k)为第k帧宏块l的SAD值，(i,j)为候选的运动向量，S为搜索域，Io(k)为第k原始帧灰度值，Io(k-l)为第k-1原始帧灰度值，宏块的大小为N×N。前一帧(第k-l帧)宏块l的重建误差Ereconl(k-l)可由下式计算得到，Ereconl(k-l)=Σm=1NΣn=1N|Io(k-l)(m,n)-Ir(k-l)(m,n)|-----(2)]]>

    其中Ir(k-l)为第k-l帧重建帧。则重建误差判决准则为：对当前帧(第k帧)宏块l，若在运动估计中满足

    SADl(k)(i,j)≤Ereconl(k),(i,j)∈S,                  (3)则当前运动估计可以结束，(i,j)即为要找的宏块l的运动向量，而且宏块l的其它编码运算，预测误差计算及DCT、Q、IQ、IDCT都可省去；若不满足不等式(3)，则继续进行运动估计。

    本发明所述的新型视频编码器的实现框图如图3所示，其工作过程为：首先，对当前帧宏块和上一重建帧宏块作运动估计。运动估计包括整象素搜索和半象素搜索。整象素搜索采用分级运动搜索方法，将搜索域分级：静止点、小搜索域、大搜索域。(这是典型的3级，具体实现可以有变化，同前)。在每一级搜索域搜索结束后，都进入全局判决器G，判断在当前这一级搜索下当前输入宏块是否满足重建误差判据，若满足则不但当前宏块的搜索过程结束，而且该宏块的整个编码过程也已结束，编码转到下一宏块；若不满足则继续下一级的搜索。半象素搜索结束后得到运动向量，进入编码核心。

    其次，进到编码核心以后，根据运动估计得到宏块的运动向量对上一重建帧宏块进行预测得到当前预测帧宏块，然后用当前帧宏块减去当前预测帧宏块计算预测误差，接着做DCT、Q、熵编码(VLC)和图象重建。

    结合图3与图2，可以看出本发明与现有技术相比有如下特点：第一，在本发明的运动估计中整象素部分，在整象素搜索的每一级搜索结束后设置全局判决器G，判决器G中判据是一旦满足，则对该宏块的整个编码过程就结束了，也就是不但结束整象素搜索过程，而且连半象素搜索、整个编码核心都不必做了，从而大大提高了编码的速度。第二，对判决器G，我们采用了高效的重建误差判据。该判据不但可以控制搜索是否停止，而且还可以控制帧差信号是否送入DCT进行变换与处理。

    附图的简要说明图1为已有的混合编码方法框图图2为已有的视频编码器结构框图图3为本发明的视频编码器结构框图

    采用本发明编码方法实现视频编码器的一种实施例结构如图3所示。其工作过程同前所述。本实施例给出在Pentium-200 PC机上对QCIF格式的简单序列Claire序列和复杂序列Foreman序列的编码参数及编码速度如下：Claire序列：I帧量化参数为10，P帧量化参数为10。运动估计            中的整象素搜索采用两级搜索：静止点、小搜索域，            区域长度为5，每一级搜索算法为采样法三步法，块            匹配运算采用亚采样方法。            结果：编码帧率(速率)达到平均70帧/秒。Foreman序列：I帧量化参数为20,P帧量化参数为20。运动估             计中的整象素搜索采用三级搜索：静止点、小运             动区域(区域长度为4)，大搜索域(区域长度为10)             每一级搜索算法为三步法，块匹配运算采用亚             采样方法。             结果：编码帧率(速率)达到平均30帧/秒。