一种基于时空域混合信息的运动估计方法.pdf

上传人:a**** 文档编号:1115352 上传时间:2018-04-01 格式:PDF 页数:11 大小:450.13KB
返回 下载 相关 举报
摘要
申请专利号:

CN200910045848.5

申请日:

2009.01.23

公开号:

CN101494757A

公开日:

2009.07.29

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):H04N 5/917公开日:20090729|||实质审查的生效|||公开

IPC分类号:

H04N5/917; G06T9/00; H04N7/24; H04N7/32

主分类号:

H04N5/917

申请人:

上海广电(集团)有限公司中央研究院

发明人:

滕国伟; 程 飞; 郭 凤; 张锦辉

地址:

200233上海市宜山路757号2楼

优先权:

专利代理机构:

上海思微知识产权代理事务所

代理人:

屈 蘅;李时云

PDF下载: PDF下载
内容摘要

本发明提供了一种基于时空域混合信息的运动估计方法,利用时空域内容信息判断当前编码块的运动快慢及运动方向,并根据不同的运动强烈程度,选择不同的搜索模板,使搜索算法的性能得到进一步提高,不仅可以避免陷入局部最优,而且有效的降低了运算复杂性。

权利要求书

1、  一种基于时空域混合信息的运动估计方法,所述方法是先将当前编码帧划分为互不重叠的、固定大小的块,然后针对每个要被编码的当前块,在参考帧的一搜索区域内搜索出与当前块匹配误差最小的块,即最佳匹配块,最后根据最佳匹配块所在点,即最佳匹配点的位置,输出最佳匹配块与当前块的相对位移,即运动矢量,其特征在于,所述的搜索过程是这样实现的:
步骤1、将当前块C的相邻块中的左块C1、上块C2、左上块C3和右上块C4,以及当前块在参考帧内的对应块E及其相邻的右块E1、下块E2、左下块E3及右下块E4共9块组成3*3的块,即当前块的时空域信息块,其中块C1、块C2、块C3和块C4代表当前块的空域信息,块E、块E1、块E2、块E3和块E4代表当前块的时域信息;计算当前块C与对应块E的最小平均绝对差MAD值;
步骤2、设定阈值T1,比较MAD值与T1的大小,当MAD<T1时,判断当前块为近似静止块,执行步骤3,否则为运动块,执行步骤4;
步骤3、采用钻石搜索法进行最佳匹配点搜索,输出最佳匹配点及其坐标;
步骤4、在时空域信息块的9个块中找出当前块C的最佳匹配块,当前块与最佳匹配块的运动矢量mv=(mx,my);计算运动矢量mv的模值|mv|;
步骤5、设定阈值T2,比较|mv|与T2的大小,当|mv|<T2时,判断当前块为慢速运动块,执行步骤6;否则为快速运动块,执行步骤7;
步骤6、采用三层次近似八边形搜索法进行最佳匹配点搜索,并且根据搜索结果判断,当最佳匹配点在三层次近似八边形由里向外的第一个环内或环上时,输出最佳匹配点及其坐标;否则,当最佳匹配点在三层次近似八边形的第二个环上时,采用小钻石搜索法进行搜索,输出最佳匹配点及其坐标;否则,当最佳匹配点在三层次近似八边形的第三个环上时,再采用小钻石搜索法进行搜索,输出最佳匹配点及其坐标;
步骤7、先采用非对称十字型搜索法进行最佳匹配点搜索,然后将所得到的最佳匹配点作为起点,采用四层次近似八边形搜索法搜索;并且根据搜索结果判断,当最佳匹配点在四层次近似八边形由里向外的第一个环内或环上时,输出最佳匹配点及其坐标;否则,当最佳匹配点在四层次近似八边形的第二个环上时,采用小钻石搜索法进行搜索,输出最佳匹配点及其坐标;否则,先进行六边形搜索法搜索,然后再采用小钻石搜索法进行搜索,输出最佳匹配点及其坐标。

2、
  如权利要求1所述的基于时空域混合信息的运动估计方法,其特征在于,所述T1的取值范围为[2,3]。

3、
  如权利要求1所述的基于时空域混合信息的运动估计方法,其特征在于,所述的T2为整数,取值范围为[70,80]。

说明书

一种基于时空域混合信息的运动估计方法
技术领域
本发明涉及数字视频编码技术,尤其涉及一种基于时空域混合信息的运动估计方法。
背景技术
在现有的视频编码中,大多数视频编码方法都是通过寻找空间和时间上的冗余来达到压缩的效果。在时间域中,连续几帧的视频通常有很强的相关性,特别是当时域采样率是非常高的时候尤其如此。在空间域中,通常像素采样点之间是相互关联的,比如说,相邻象素之间很相近。时域冗余主要通过运动估计和运动补偿来消除,运动估计也是整个编码器最耗时的部分。运动估计就是在参考帧的搜索窗中找到一个最理想的块来预测当前块。目前,块匹配运动估计算法中搜索精度最高的是全搜索法FS(Full Search Method),但它计算量大,不适合实时应用。为了提高搜索速度,又提出了一些快速搜索法,如:三步搜索法(TSS)、二维对数法(LOGS)、十字型搜索法(CS)、新三步搜索法(NTSS)、四步搜索法(FSS)、梯度下降法(BBGDS)、钻石搜索法(DS)和六边型搜索法(HEXBS)等。这些方法虽然在搜索速度方面比FS有了很大的提高,但是普遍存在以下几个问题:(1)搜索时容易陷入局部最优;(2)不能同时满足不同运动情况的视频序列。目前已被H.264/AVC所采纳的运动估计算法有:EPZS算法、UMHexagonS算法、及其改进算法Simplified UMHexagonS;以及非对称十字形多层次六边形格点搜索算法(UMHexagonS),这些算法具有优良的率失真性能和较高的运动估计速度,图像质量与全搜索法很相近,但对于D1格式的实时编码器而言,它的实现复杂度太高。另外在实际应用中,图像运动量有大有小,当运动矢量很小或为零时,视频图像的大部分区域没有发生变化或变化甚微,当使用以上单一的搜索策略时可能会造成极大的搜索冗余,降低搜索效率。
发明内容
本发明解决的技术问题是提供一种基于时空域混合信息的运动估计方法,所述方法利用时空域内容信息判断当前编码块的运动快慢及运动方向,并根据不同的运动强烈程度,选择不同的搜索模板,使搜索算法的性能得到进一步提高。
为了解决上述技术问题,本发明采用了如下技术手段:一种基于时空域混合信息的运动估计方法,所述方法是先将当前编码帧划分为互不重叠的、固定大小的块,然后针对每个要被编码的当前块,在参考帧的一搜索区域内搜索出与当前块匹配误差最小的块,即最佳匹配块,最后根据最佳匹配块所在点,即最佳匹配点的位置,输出最佳匹配块与当前块的相对位移,即运动矢量,所述的搜索过程是这样实现的:
步骤1、将当前块C的相邻块中的左块C1、上块C2、左上块C3和右上块C4,以及当前块在参考帧内的对应块E及其相邻的右块E1、下块E2、左下块E3及右下块E4共9块组成3*3的块,即当前块的时空域信息块,其中块C1、块C2、块C3和块C4代表当前块的空域信息,块E、块E1、块E2、块E3和块E4代表当前块的时域信息;计算当前块C与对应块E的最小平均绝对差MAD值;
步骤2、设定阈值T1,比较MAD值与T1的大小,当MAD<T1时,判断当前块为近似静止块,执行步骤3,否则为运动块,执行步骤4;
步骤3、采用钻石搜索法进行最佳匹配点搜索,输出最佳匹配点及其坐标;
步骤4、在时空域信息块的9个块中找出当前块C的最佳匹配块,当前块与最佳匹配块的运动矢量mv=(mx,my);计算运动矢量mv的模值|mv|;
步骤5、设定阈值T2,比较|mv|与T2的大小,当|mv|<T2时,判断当前块为慢速运动块,执行步骤6;否则为快速运动块,执行步骤7;
步骤6、采用三层次近似八边形搜索法进行最佳匹配点搜索,并且根据搜索结果判断,当最佳匹配点在三层次近似八边形由里向外的第一个环内或环上时,输出最佳匹配点及其坐标;否则,当最佳匹配点在三层次近似八边形的第二个环上时,采用小钻石搜索法进行搜索,输出最佳匹配点及其坐标;否则,当最佳匹配点在三层次近似八边形的第三个环上时,再采用小钻石搜索法进行搜索,输出最佳匹配点及其坐标;
步骤7、先采用非对称十字型搜索法进行最佳匹配点搜索,然后将所得到的最佳匹配点作为起点,采用四层次近似八边形搜索法搜索;并且根据搜索结果判断,当最佳匹配点在四层次近似八边形由里向外的第一个环内或环上时,输出最佳匹配点及其坐标;否则,当最佳匹配点在四层次近似八边形的第二个环上时,采用小钻石搜索法进行搜索,输出最佳匹配点及其坐标;否则,先进行六边形搜索法搜索,然后再采用小钻石搜索法进行搜索,输出最佳匹配点及其坐标。
进一步的,所述的T1取值范围为[2,3];所述的T2为整数,取值范围为[70,80]。
由于采用了以上的运动估计方法,与现有技术相比具有以下优点:(一)在时空域信息块中找出与当前块运动最相似的块,并据此判断当前编码块的运动情况,采用不同的搜索方法,可以大大减少运动估计时间;(二)使用了时空域信息块的9个块进行搜索起始点预测,能更准确的找出与当前编码块运动最相似的块;(三)根据运动向量的中心偏移特性和运动向量向上下和左右运动的概率远远大于其他方向的运动这两个规律,设计了新的搜索模型,不仅可以避免陷入局部最优,而且可以用较少的点找到BMP点,减少了搜索点数,特别是在运动平缓区域,表现更加突出。
附图说明
本发明的运动估计方法由以下的实施例及附图详细给出。
图1为本发明实施例的搜索过程流程示意图;
图2为本发明实施例的时空域信息块示意图;
图3为本发明实施例的钻石搜索法模型示意图;
图4为本发明实施例中多层次近似八边形示意图。
具体实施方式
以下将对本发明的基于时空域混合信息的运动估计方法作进一步的详细描述。
本实施例一种基于时空域混合信息的运动估计方法,所述方法将当前编码帧划分为互不重叠的、大小为16*8的块,然后针对每个要被编码的块,在参考帧的一定范围内(搜索区域)搜索出与它匹配误差最小的块,即最佳匹配块,最后根据最佳匹配块所在点(即最佳匹配点)的位置,输出最佳匹配块与当前编码帧中的当前块的相对位移,即运动矢量,所述的搜索过程是这样实现的,其实现流程如图1所示:
S1、将当前块C的相邻块中的左块C1、上块C2、左上块C3和右上块C4,以及当前块在参考帧内的对应块E(即在参考帧内与当前编码块坐标相同的块)及其相邻的右块E1、下块E2、左下块E3及右下块E4共9块组成3*3的块,即当前块的时空域信息块,如图2所示,其中块C1、块C2、块C3和块C4代表当前块的空域信息,块E、块E1、块E2、块E3和块E4代表当前块的时域信息;计算当前块C与对应块E的最小平均绝对差MAD值;
S2、利用以上MAD值来对每幅图像的运动剧烈程度进行标识,如果MAD足够小就可以认为当前块近似静止;通过设定MAD的阈值为T1,然后比较MAD值与T1的大小;在本实例中设定T1为2,即当MAD<2时,则可以认为当前块为近似静止块,执行S3,否则为运动块,执行S4;
S3、采用钻石搜索法进行最佳匹配点搜索,钻石搜索法如图3所示输出最佳匹配点及其坐标;
S4、在时空域信息块的中9个块中找出当前块C的最佳匹配块,当前块与最佳匹配快的运动矢量mv=(mx,my);计算运动矢量mv的模值|mv|;
S5、设定阈值T2为70,比较|mv|与T2的大小,当|mv|<T2时,判断当前块为慢速运动块,执行S6;否则为快速运动块,执行S7;
S6、采用三层次近似八边形搜索法进行最佳匹配点搜索,并且根据搜索结果判断,当最佳匹配点在多层次近似八边形由里向外的第一个环内或环上时,输出最佳匹配点及其坐标;否则,当最佳匹配点在多层次近似八边形的第二个环上时,采用小钻石搜索法进行搜索,输出最佳匹配点及其坐标;否则,当最佳匹配点在多层次近似八边形的第三个环上时,再采用小钻石搜索法进行搜索,输出最佳匹配点及其坐标;
S7、先采用非对称十字型搜索法进行最佳匹配点搜索,然后将所得到的最佳匹配点作为起点,采用四层次近似八边形搜索法搜索;并且根据搜索结果判断,当最佳匹配点在多层次近似八边形由里向外的第一个环内或环上时,输出最佳匹配点及其坐标;否则,当最佳匹配点在多层次近似八边形的第二个环上时,采用小钻石搜索法进行搜索,输出最佳匹配点及其坐标;否则,先进行六边形搜索法搜索,然后再采用小钻石搜索法进行搜索,输出最佳匹配点及其坐标。
近似八边形、六边形和钻石形环及其上的搜索点如图4所示,其中实心圆表示近似八边形搜索的最佳匹配点,实心三角形表示六边形搜索到的最佳匹配点。
在其他的实施例中,如图像质量要求稍低的情况下,T1也可以取大于2小于3的值;所述的T2为整数,取值范围为[70,80]。

一种基于时空域混合信息的运动估计方法.pdf_第1页
第1页 / 共11页
一种基于时空域混合信息的运动估计方法.pdf_第2页
第2页 / 共11页
一种基于时空域混合信息的运动估计方法.pdf_第3页
第3页 / 共11页
点击查看更多>>
资源描述

《一种基于时空域混合信息的运动估计方法.pdf》由会员分享,可在线阅读,更多相关《一种基于时空域混合信息的运动估计方法.pdf(11页珍藏版)》请在专利查询网上搜索。

本发明提供了一种基于时空域混合信息的运动估计方法,利用时空域内容信息判断当前编码块的运动快慢及运动方向,并根据不同的运动强烈程度,选择不同的搜索模板,使搜索算法的性能得到进一步提高,不仅可以避免陷入局部最优,而且有效的降低了运算复杂性。 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1