智能移动终端抗噪声干扰运动目标提取方法技术领域
本发明涉及智能视频处理领域,尤其涉及一种智能移动终端抗噪声干扰运动目标
提取方法。
背景技术
近些年,各种各样的摄像头被安装在不同的公共场合,例如公路,自助取款
机,街角,大型商场,医院,学校,机场等,甚至被安装到家庭之中,以实现视
频监控的目的。传统视频监控依赖于人工对这些视频数据进行主观意识的分析判
断,对其中的动作行为做出理解,然后才得出结论做出反馈。传统视频监控也存
在诸多缺陷,尤其是监控人员一旦遗漏重要信息可能造成无法挽回的后果。因此,
智能视频处理技术显得尤为重要,成为当下研究的热点之一。
视频处理技术通过模拟人类对视觉图像响应,使用计算机对视频场景中运动
目标分类、识别、跟踪,在这些基本视频场景处理的基础上以期实现对运动目标
行为分析判断和理解。智能化视频处理的过程中,无论是运动目标的分类、识别、
跟踪,还是后续的行为的判断和理解都是建立在成功检测出运动目标的前提下进
行的,即视频场景中运动目标区域的提取的质量对智能化视频处理的结果至关重
要。运动目标提取是从序列图像中提取出正在运动或者说是变化的区域作为感兴
趣区域,为后续高级图像处理提供服务。
然而,在摄像头固定的情况下,现有方法都默认视频数据的采集是在摄像头
被固定的前提下工作的,一旦出现这样一个场景:一旦通过手持设备或其他易抖
动的设备,如相机和手机,来提取出视频中包含运动目标的区域,容易出现镜头
抖动,这些现有方法将会无用武之地,导致抖动的镜头对运动目标提取产生干扰,
不可避免的出现大面积的误检。
发明内容
本发明所要解决的技术问题是针对上述现有技术提供一种能够防止抖动的摄像头
干扰运动目标提取的智能移动终端抗噪声干扰运动目标提取方法。
本发明解决上述技术问题所采用的技术方案为:智能移动终端抗噪声干扰运动目标
提取方法,用于对图像序列运动目标的精确提取,其特征在于,依次包括以下步骤:
(1)对智能移动终端获取的原始图像S(i,j)进行灰度化处理,实现颜色空间转换,
得到灰度图像Y(i,j);其中,原始图像S(i,j)转换为灰度图像Y(i,j)采用如下转换公式:
Y(i,j)=0.257×r(i,j)+0.504×g(i,j)+0.239×b(i,j);
其中,r(i,j)、g(i,j)、b(i,j)分别对应原始图像S(i,j)的颜色空间三维坐标中的红、绿、
蓝颜色分量,Y(i,j)是该像素点对应的灰度值;
(2)对灰度图像Y进行预处理,得到预处理图像I,并采用高斯滤波对预处理图像I
进行处理,其中,高斯函数为均值是零的二维高斯函数g(i,j),其中,
g ( i , j ) = exp ( - i 2 + j 2 2 σ 2 ) , ]]>其使用的图像模板算子为 1 273 × 1 4 7 4 1 4 16 26 16 4 7 26 41 26 7 4 16 26 16 4 1 4 7 4 1 ; ]]>
(3)对连续间隔m帧的三帧预处理图像Ik-m(i,j)、Ik(i,j)和Ik+m(i,j)做差分,得到
两个差分图像D(k,k-m)(i,j)和D(k+m,k)(i,j);其中,
D(k,k-m)(i,j)=|Ik(i,j)-Ik-m(i,j)|,D(k+m,k)(i,j)=|Ik+m(i,j)-Ik(i,j)|;
其中,Ik-m(i,j)、Ik(i,j)和Ik+m(i,j)分别表示预处理序列图像I(i,j)中的某三帧预处理图像,
m表示预处理序列图像I(i,j)之间相邻间隔的帧数,m∈Z,且m∈[1,5];
(4)对所得两个差分图像D(k,k-m)(i,j)和D(k+m,k)(i,j)分别做二值化处理,得到对应的
二值化图像R(k,k-m)(i,j)和R(k+m,k)(i,j);其中,二值化处理准则如下:
R ( k , k - m ) ( i , j ) = 255 D ( k , k - m ) ( i , j ) > T 0 e l s e , R ( k + m , k ) ( i , j ) = 255 D ( k + m , k ) ( i , j ) > T 0 e l s e ; ]]>
其中,T表示阈值,m表示各序列图像I(i,j)之间相邻间隔的帧数;
(5)对所得到的两幅相邻的二值化图像R(k,k-m)(i,j)和R(k+m,k)(i,j)做逻辑“或”操作
和逻辑“与”操作,分别得到对应运算后的联合二值化“或”图像Bork(i,j)和联合二值化
“与”图像Bandk(i,j),并将联合二值化“或”图像Bork(i,j)和联合二值化“与”图像
Bandk(i,j)进行逻辑“与”运算,得到潜在运动目标区域的二值化图像Bk(i,j);其中,
联合二值化“或”图像为 Bor k ( i , j ) = 255 R ( k , k - m ) ( i , j ) ∪ R ( k + m , k ) ( i , j ) ≠ 0 0 R ( k , k - m ) ( i , j ) ∪ R ( k + m , k ) ( i , j ) = 0 , ]]>
联合二值化“与”图像为 Band k ( i , j ) = 255 R ( k , k - m ) ( i , j ) ∩ R ( k + m , k ) ( i , j ) ≠ 0 0 R ( k , k - m ) ( i , j ) ∩ R ( k + m , k ) ( i , j ) = 0 , ]]>
潜在运动目标区域的二值化图像 B k ( i , j ) = 255 Bor k ( i , j ) ∩ Band k ( i , j ) ≠ 0 0 Bor k ( i , j ) ∩ Band k ( i , j ) = 0 ; ]]>
(6)对潜在运动目标区域内进行基于高斯模型的运动目标检测,对高斯分布的参数均
值以及方差赋初值,建立背景模型;其中,
μ i j 0 = 1 / N · Σ k = 0 N - 1 x i j k , ( σ i j 0 ) 2 = 1 / N · Σ k = 0 N - 1 [ x i j k - μ i j 0 ] 2 ; ]]>
N表示被用来进行模型初始化的图像的数量,表示第k帧图像中(i,j)位置上的像素观察
值;
(7)对建立的背景模型以设定的更新方式进行实时更新;其中,设定的更新方式为:
μ i j k + 1 = ( 1 - α ) μ i j k + 1 + αx i j k , ( σ i j k + 1 ) 2 = ( 1 - α ) ( σ i j k ) 2 + α ( μ i j k + 1 - x i j k + 1 ) 2 ; ]]>
其中,α表示当前帧图像中的像素对所对应位置上的背景模型的更新所做出的贡献程度,
α=0.0025;
(8)计算像素位置上高斯分布的95%置信区间的上限和下限其中,上限
x h k + 1 = μ ij k + 1.96 × σ ij k , ]]>下限 x l k + 1 = μ ij k - 1.96 × σ ij k ; ]]>
(9)根据95%置信区间的理论,对运动前景提取得到运动目标
x i j k + 1 = 0 x l k + 1 ≥ x i j k + 1 ≥ x h k + 1 255 e l s e . ]]>
为了使做差分的相邻帧图像之间的时间间隔变短,以有效地消除动态背景所引入的
干扰,作为优选,所述步骤(3)中间隔m帧的数值为3。
进一步地,在步骤(6)中初始化高斯背景模型的图像的数量N为50。
与现有技术相比,本发明的优点在于:在本发明提供的运动目标提取方法中,通过
设定图像空间转换的优化转换参数,将原始图像转换处理,得到具有高压缩率的灰度图
像后,选择高斯滤波对预处理图像滤波,以获得纯净的预处理图像,并选取三幅相同间
隔的连续预处理图像做差分处理,以克服单独使用三帧差分法提取运动目标质量的不足;
同时,二值化处理所得差分图像后,对二值化图像做逻辑“或”、“与”操作后,再次进
行逻辑“与”处理,以得到潜在运动目标区域的二值化图像,利用逻辑“与”自动摒弃新
暴露出来的像素点,消除“鬼影”现象,然后建立背景模型并实时更新,同时基于高斯模
型检测潜在运动目标区域内的运动目标,避免了基于帧间差分方法容易引入的“空洞”问
题,最后根据95%置信区间理论,对运动前景准确提取得到运动目标,消除了镜头抖动对
视频中运动目标提取的干扰。
附图说明
图1为本发明中智能移动终端抗噪声干扰运动目标提取方法的流程示意图;
图2为利用本发明中方法对运动目标检测的性能曲线示意图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
如图1所示,为了利用智能移动终端提取图像序列中的运动目标,本实施例中提供
的智能移动终端抗噪声干扰运动目标提取方法依次包括以下步骤:
步骤1,对智能移动终端获取的原始图像S(i,j)进行灰度化处理,实现颜色空间转换,
得到灰度图像Y(i,j);其中,原始图像S(i,j)转换为灰度图像Y(i,j)采用如下转换公式:
Y(i,j)=0.257×r(i,j)+0.504×g(i,j)+0.239×b(i,j);
其中,r(i,j)、g(i,j)、b(i,j)分别对应原始图像S(i,j)的颜色空间三维坐标中的红、
绿、蓝颜色分量,Y(i,j)是该像素点对应的灰度值;通过在本实施例中,针对红、绿、蓝
颜色分量,分别设定优化的图像转换参数0.257、0.504和0.239,以得到具有高压缩率的
灰度图像,由此得到具有小容量的灰度图像,从而可以有效的节约智能移动终端的存储
空间,进一步提高智能移动终端的运行效率;
步骤2,对灰度图像Y进行预处理,得到预处理图像I,并采用高斯滤波对预处理图
像I进行处理,经高斯滤波后,得到纯净的预处理图像,从而可以弥补后续单独使用三帧差
分法难以满足对运动目标提取质量要求的不足;
其中,高斯函数为均值是零的二维高斯函数g(i,j),其中,
其使用的图像模板算子为 1 273 × 1 4 7 4 1 4 16 26 16 4 7 26 41 26 7 4 16 26 16 4 1 4 7 4 1 ; ]]>
步骤3,以帧间隔数为m帧,在预处理序列图像I中选取三幅连续的预处理图像
Ik-m(i,j)、Ik(i,j)和Ik+m(i,j)做差分,得到两个差分图像D(k,k-m)(i,j)和D(k+m,k)(i,j),由两
个差分图像D(k,k-m)(i,j)和D(k+m,k)(i,j)初步提取出包含运动目标区域的大致轮廓;其中,
D(k,k-m)(i,j)=|Ik(i,j)-Ik-m(i,j)|,D(k+m,k)(i,j)=|Ik+m(i,j)-Ik(i,j)|;
其中,Ik-m(i,j)、Ik(i,j)和Ik+m(i,j)分别表示预处理序列图像I(i,j)中的某三帧预处理图像,
m表示预处理序列图像I(i,j)之间相邻间隔的帧数,m∈Z,且m∈[1,5];
假设预处理序列图像I{I1(i,j),I2(i,j),I3(i,j),I4(i,j),I5(i,j),I6(i,j),I7(i,j)},帧
间隔数为2帧,则在预处理序列图像I中选取的三幅连续预处理图像为I1(i,j)、I3(i,j)和
I5(i,j),亦或者选取的三幅连续预处理图像为I2(i,j)、I4(i,j)和I6(i,j);对三幅连续预
处理图像I1(i,j)、I3(i,j)和I5(i,j)做差分后,可以得到两个差分图像
D(3,1)(i,j)=|I3(i,j)-I1(i,j)|,D(5,3)(i,j)=|I5(i,j)-I3(i,j)|;其中,为了使相邻帧图像之间
的时间间隔变短,在保证预处理图像像素不会发生缺失的条件下,以有效地消除动态背
景所引入的干扰,作为优选,三幅连续预处理图像的帧间隔m帧的数值为3;
步骤4,对所得两个差分图像D(k,k-m)(i,j)和D(k+m,k)(i,j)分别做二值化处理,得到对应
的二值化图像R(k,k-m)(i,j)和R(k+m,k)(i,j);其中,二值化处理准则如下:
R ( k , k - m ) ( i , j ) = 255 D ( k , k - m ) ( i , j ) > T 0 e l s e , R ( k + m , k ) ( i , j ) = 255 D ( k + m , k ) ( i , j ) > T 0 e l s e ; ]]>
其中,T表示阈值,m表示各序列图像I(i,j)之间相邻间隔的帧数;具体地,是通过设
定阈值T,过滤掉差分图像D(k,k-m)(i,j)和D(k+m,k)(i,j)中灰度差值小于阈值T的像素,同时
将灰度差值大于阈值T的像素值转化为255;二值化图像R(k,k-m)(i,j)和R(k+m,k)(i,j)中所有
的非零像素点组成前景区域,而那些零像素点则是属于背景图像的部分;
步骤5,对所得到的两幅相邻的二值化图像R(k,k-m)(i,j)和R(k+m,k)(i,j)做逻辑“或”操
作和逻辑“与”操作,分别得到对应运算后的联合二值化“或”图像Bork(i,j)和联合二值
化“与”图像Bandk(i,j),并将联合二值化“或”图像Bork(i,j)和联合二值化“与”图像
Bandk(i,j)进行逻辑“与”运算,得到潜在运动目标区域的二值化图像Bk(i,j);逻辑“与”
操作可以自动摒弃新暴露出来的像素点,有效的消除“鬼影”现象,其中,
联合二值化“或”图像为 Bor k ( i , j ) = 255 R ( k , k - m ) ( i , j ) ∪ R ( k + m , k ) ( i , j ) ≠ 0 0 R ( k , k - m ) ( i , j ) ∪ R ( k + m , k ) ( i , j ) = 0 , ]]>
联合二值化“与”图像为 Band k ( i , j ) = 255 R ( k , k - m ) ( i , j ) ∩ R ( k + m , k ) ( i , j ) ≠ 0 0 R ( k , k - m ) ( i , j ) ∩ R ( k + m , k ) ( i , j ) = 0 , ]]>
潜在运动目标区域的二值化图像 B k ( i , j ) = 255 Bor k ( i , j ) ∩ Band k ( i , j ) ≠ 0 0 Bor k ( i , j ) ∩ Band k ( i , j ) = 0 ; ]]>
步骤6,对潜在运动目标区域内进行基于高斯模型的运动目标检测,对高斯分布的参
数均值以及方差赋初值,建立背景模型;其中,
μ i j 0 = 1 / N · Σ k = 0 N - 1 x i j k , ( σ i j 0 ) 2 = 1 / N · Σ k = 0 N - 1 [ x i j k - μ i j 0 ] 2 ; ]]>
N表示被用来进行模型初始化的图像的数量,表示第k帧图像中(i,j)位置上的像素观察
值;例如,在本实施例中,进行模型初始化的图像数量N选取为50,,即参数均值
μ ij 0 = 1 50 Σ k = 0 49 x ij k , ]]>方差 ( σ ij 0 ) 2 ( σ ij 0 ) 2 = 1 50 Σ k = 0 49 [ x ij k - μ ij 0 ] 2 ; ]]>
步骤7,对建立的背景模型以设定的更新方式进行实时更新,以适应实际场景中背景
图像并随着时间动态地发生变化;其中,本实施例中设定的更新方式为:
μ i j k + 1 = ( 1 - α ) μ i j k + 1 + αx i j k , ( σ i j k + 1 ) 2 = ( 1 - α ) ( σ i j k ) 2 + α ( μ i j k + 1 - x i j k + 1 ) 2 ; ]]>
其中,α表示当前帧图像中的像素对所对应位置上的背景模型的更新所做出的贡献程
度;在本实施例中,设定贡献程度α=0.0025,以满足当前更新后的背景模型真实的反映实
际场景中的真实背景图像,而当贡献程度α设定为其他数值时,则更新后的背景模型与实
际场景中的真实背景图像发生偏移,从而导致不能建立最佳的背景模型,这样将不利于后
续从背景图像中精确的提取运动目标;
步骤8,计算像素位置上高斯分布的95%置信区间的上限和下限其中,上
限下限通过在本实施例中采用95%置信区间,
可以进一步提高对运动前景,即中运动目标的正确提取概率;
步骤9,根据95%置信区间的理论,对运动前景提取得到运动目标
x i j k + 1 = 0 x l k + 1 ≥ x i j k + 1 ≥ x h k + 1 255 e l s e ; ]]>
其中,在潜在运动目标区域范围内,像素灰度值落到95%置信区间内的像素点被提取
出来成为前景点,置信区间以外的像素点则被认为是背景点而被忽略,从而完成对运动前
景中运动目标的精确提取。
为了解本发明中所提供的智能移动终端抗噪声干扰运动目标提取方法的性能,本实
施例中利用智能移动终端进行了仿真,以伪正类率和真正类率作为运动目标提取方法性能
的评价参数:其中,本发明中的抗噪声干扰运动目标提取方法简记为PM方法,传统的
自适应混合高斯模型运功目标检测方法简记为GMM方法,PM方法与GMM方法的仿真
结果参加图2所示。
从图2中可以看出,运动目标提取方法的伪正类率随着真正类率的增加也不断变大,
实际上是阈值T的不断放宽使得真正类率的上升所必然带来的负面影响,即伪正类率的快
速攀升;在达到相同的真正类率情况下,本发明中提供的抗噪声干扰运动目标提取方法PM
的伪正类率一直低于GMM方法,表现为检测结果中的伪前景点较少,这说明利用抗噪声
干扰运动目标提取方法正确检测运动目标的概率更高,PM方法具有更好的正检性能。