一种基于Online Boosting的目标精细轮廓跟踪方法技术领域
本发明属于计算机视觉领域,具体涉及智能监控领域。
背景技术
基于视频的目标精细轮廓跟踪技术不仅需要够跟踪目标的位置,而且还要精确地
描述目标的形状,该技术是计算机视觉领域最基础的技术之一,可以得到目标轮廓的跟踪
结果。上层算法进一步根据目标轮廓跟踪结果进行分析和处理,来实现对场景的理解、对目
标动作的识别以及对人体行为的识别等应用。该技术的广泛的应用前景和很高的研究价值
激发了国内外研究人员的浓厚兴趣。
基于视频的目标精细轮廓跟踪技术的关键在于时间一致性和空间一致性的表达。
时间一致性描述了在连续帧中目标的相似性,空间一致性描述了在一帧图像中目标与背景
的分辨能力。对视频中目标的精细轮廓跟踪被认为是一个二分类的问题,目前国内外已经
出现了很多相关的算法,比如基于水平集的方法,该方法将运动的估计和目标的分割分成
了两个单独的阶段,将运动估计的结果作为分割的输入。这样当运动估计不准确时,会影响
分割的精度,在很多摄像头自身有运动的视频中,对运动的估计很难得到好的跟踪效果。为
了解决摄像头运动的情况,人们提出来一种基于图割的方法,该方法将多个线索函数融合
到一起,目标的运动信息通常是其中一个重要的线索函数,然而背景的运动场通常会干扰
目标的运动信息,使得跟踪的目标轮廓不准确。还有一些半自动的分割方法,这些方法需要
人为的标定一些目标和背景区域,这就在很大程度上限制了其应用领域。
发明内容
本发明为解决上述技术问题是,提供了一种快速准确的目标精细轮廓跟踪算法。
本发明为解决上述技术问题所采用的技术方案是,一种基于Online Boosting的
目标精细轮廓跟踪方法,包括以下步骤:
1)初始化步骤:
1-1)将视频的第1帧图像分割成超像素;
1-2)对分割成超像素后的图像提取局部对数欧式距离协方差矩阵L2ECM特征X,
L2ECM特征中每一列对应一个超像素的L2ECM特征x;将第1帧图像的L2ECM特征进行目标特
征与背景特征的区分,得到每个超像素对应的分类标签y∈{-1,+1},+1表示目标,-1表示背
景,最终得到图像的分类结果Y;
1-3)使用的L2ECM特征X和分类结果Y训练Online Boosting分类器h;
2)跟踪的步骤:
2-1)对视频中第t帧图像分割成超像素并提取L2ECM特征X,t=2,3,…,使用
Online Boosting分类器h对特征矩阵X的每一列进行分类,得到分类结果Yp;
2-2)使用膨胀法连通目标中断开的区域,得到更新后的分类结果
2-3)使用L2ECM特征X和分类结果对Online Boosting分类器h进行更新,更新t
=t+1,返回步骤2-1)处理视频中的下一帧图像;
其中,Online Boosting分类器h由M个弱分类器构成hm,弱分类器编号m∈{1,
2,…,M};Online Boosting分类器h训练的具体步骤如下:
初始化步骤:初始设置弱分类器hm分类的正确率错误率和惩罚系数λ,
训练步骤:
分类器hm接收输入的超像素的L2ECM特征x与对应的分类标签y,判断当前分类器hm
对超像素的L2ECM特征x分类结果进行判断:如果hm对超像素的L2ECM特征x分类结果正确hm
(x)=y,则更新εm表示加上惩罚系数λ
之后分类器hm的错误率;如果hm对超像素的L2ECM特征x分类结果错误hm(x)≠y,则更新
更新分类器为分类函数I:
判断是否达到结束更新条件,如否,返回训练步骤,对下
一个超像素的L2ECM特征x与对应的分类标签y进行处理,如是,结束训练步骤。
本发明采用Online Boosting在线学习的方法从视频的上一帧图像中学习到目标
和背景的分类器,并将该分类器用于下一帧图像中目标和背景的分类,使得其处理速度加
快很多。
本发明的创新之处在于:在目标精细跟踪的问题中使用超像素对含有跟踪目标的
图像进行分块,每一个超像素被看做一个点,这降低了计算的复杂度;使用在线学习的方法
来分割目标和背景。传统的Online Boosting算法中,训练样本的权重是相同的,不会随时
间的变化而变化。但是在目标精细跟踪问题里面,由于运动目标时刻变化,所以对在线的分
类器来说距离当前帧时间越久远的图像帧的权重应该越小,为了实现这种权重逐渐衰减的
效果,本发明设计了一种样本权重随时间的久远程度而递减的Online Boosting分类器,随
着视频帧数的增加,分类器的性能越来越好,从而实现准确的跟踪目标的精细轮廓。
本发明有益效果是,样本权重随时间的久远程度而递减的Online Boosting分类
器的快速分类能力使得对目标精细轮廓的跟踪达到了实时的跟踪效果。
附图说明
图1超像素示意图;
图2系统流程图。
具体实施方式
本发明使用超像素对该候选区域进行划分;使用视频第一帧图像的目标和背景来
初始化Online Boosting分类器,对以后的每一帧图片使用该分类器来分类图像中的目标
和背景区域,同时用分类的结果来更新分类器自身。最后使用膨胀的方法连通目标中断开
的区域,这样就得到分割好的目标和背景。
为了方便描述本发明的内容,首先对一些术语进行说明。
1:超像素,超像素的分割和特征的提取为现有成熟算法。超像素是指在图像中由
一系列位置相邻且颜色、亮度、纹理等特征相似的像素点组成的小区域,这些小区域大多保
留了进一步进行图像分割的有效信息,且一般不会破坏图像中物体的边界信息。在我们的
算法中用于对图像进行分块,使得一团位置相邻且特征相似的像素可以用一个超像素来表
示。超像素把一幅原本是像素级(pixel-level)的图,划分成区域级(district-level)的
图,是一种对基本信息进行的抽象。本算法中使用的超像素分割方法SLIC算法在“SLIC
Superpixels Compared to State-of-the-art Superpixel Methods”一文中有详细的说
明,其分割结果如图1所示,红色轮廓围起来的区域表示一个超像素。
2:L2ECM特征,局部对数欧式距离协方差矩阵Local Log-Euclidean Covariance
Matrix,该特征的提取为现有成熟算法。对于一幅图像,使用它的原始特征构造成公式1所
示的形式,其中I(x,y)表示图像I中(x,y)位置的像素值,|·|表示绝对值,Ix(x,y)和Iy(x,
y)分别表示对x和y方向的一阶偏导数,Ixx(x,y)和Iyy(x,y)分别表示对x和y方向的二阶偏
导数。对于一个超像素s,令其中(xi,yi)∈s,d表示原始特征
的长度,表示d维空间,Ns表示超像素s中包含的像素的个数,那么Gs是一个大小
为dxNs的矩阵,Gs的每一列是一个原始特征计算Gs的协方差矩阵Cs,那么Cs是一个d
×d的矩阵,它的纬度和Ns无关。为了避免计算协方差矩阵之间在黎曼空间中的测地线距
离,我们将Cs转换为欧式空间中的log(Cs),由于log(Cs)矩阵的对称性,我们取log(Cs)矩阵
的一半(上三角矩阵)排列成一个向量就构成了L2ECM特征,那么一个超像素对应的L2ECM特
征的长度为
3:Online Boosting分类器。一个Online Boosting分类器h由M个弱分类器hm,m∈
{1,2,…,M}构成。输入为<x,y>,其中x为120维的L2ECM特征,y∈{-1,+1}。
一个Online Boosting分类器h由M个弱分类器构成hm,弱分类器编号m∈{1,2,…,
M};Online Boosting分类器h训练的具体步骤如下:
对于1~M个弱分类器,初始化:和分别表示弱分类器hm分
类的正确率和错误率;
初始设置惩罚系数λ=1,λ一方面用于惩罚hm分类的正确性,另一方面用于惩罚样
本随时间的久远的权重衰减;
对于每一个分类器hm,根据泊松分布P(λ=1),来得到一个循环
次数k;循环结束的条件可以是达到循环次数k,也可以使其他本领域惯用循环结束条件;循
环次数k得到的方法本领域技术人员也可以通过其他方式得到;
循环k次:
求第m个弱分类器hm的最优分隔面:L0(hm,(x,y));L0(hm,(x,y))表示一个弱分类器
的训练过程,此处使用现有决策树decision stump作为弱分类器,这个训练过程与传统的
Boosting分类器相同,此处也可以使用其他现有弱分类器进行训练;
如果hm(x)分类正确,即y=hm(x),
则εm表示加上λ这个惩罚项
之后分类器hm的错误率;
如果hm(x)分类错误,即y≠hm(x),
则
新的分类器为对于一个新的
输入x,就可以对它进行分类:
在和这两种λ的更新方式中,和
这两项用于惩罚hm分类的正确性,+1的这一项用于衰减样本随时间的权重。
具体操作步骤如图2所示:
初始化步骤:
步骤1、对于视频的第一帧图像,使用SLIC算法将图像分割成超像素,设置超像素
的最大个数为200。
步骤2、对分割成超像素后的图像提取L2ECM特征,对于彩色图像,有RGB三个通道,
所以每一个超像素对应的L2ECM特征是一个120维的列向量。假设整幅图像分割成N个超像
素,则图像对应的特征X是120xN的矩阵。根据第一帧的标注信息,可以得到每个超像素对应
的分类标签y∈{-1,+1},那么整幅图像的分类结果Y就是一个Nx1的矩阵。
步骤3、使用步骤2中得到的X和Y,特征X有每一个超像素特征x组成,分类结果Y由
每一个训练超像素特征x对应的分别标签y组成,Online Boosting分类器h。
跟踪步骤:
步骤4、从视频的第二帧图像开始,对于每一帧图像,使用SLIC算法将图像分割成
超像素,提取L2ECM特征,得到对应的特征矩阵X。使用分类器h对X的每一列(即每一个超像
素)进行分类,得到分类结果Yp∈{-1,+1}。
步骤5、使用膨胀的方法连通目标中断开的区域,这样就得到新的的目标和背景的
分类结果
步骤6、使用X和对分类器h进行更新,得到新的分类器h,转到步骤4进行下一帧
图像的处理。