基于分类器的目标检测方法及装置.pdf

上传人:1** 文档编号:6130972 上传时间:2019-04-17 格式:PDF 页数:14 大小:2.22MB
返回 下载 相关 举报
摘要
申请专利号:

CN201410127358.0

申请日:

2014.03.31

公开号:

CN103914706A

公开日:

2014.07.09

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06K 9/62申请日:20140331|||公开

IPC分类号:

G06K9/62; G06T7/00

主分类号:

G06K9/62

申请人:

深圳市智美达科技有限公司

发明人:

孙海涌

地址:

518000 广东省深圳市南山区科苑路11号金融科技大厦17楼ABCD单元

优先权:

专利代理机构:

广州华进联合专利商标代理有限公司 44224

代理人:

胡海斌

PDF下载: PDF下载
内容摘要

本发明公开了一种基于分类器的目标检测方法,包括:根据预设的缩放因子,由原始图像建立图像金字塔;提取图像金字塔的中间X个图层,利用固定的滑动窗口进行遍历采样,对采样图像用分类器计算对应的置信度,得到每个图层中置信度最高的Y个采样图像对应的置信采样点;将XY个置信度最高的采样图像对应的置信采样点映射到图像金字塔各图层中的对应点,并将每个置信采样点及对应点组成一条采样链;对每条采样链中各点利用所述滑动窗口提取对应图层的窗口图像,再对各窗口图像用分类器计算对应的置信度,得到每条采样链中置信度最高的窗口图像;将各条采样链中置信度最高的窗口图像映射到原始图像中的检测结果窗口;合并原始图像中的检测结果窗口。

权利要求书

权利要求书
1.  一种基于分类器的目标检测方法,其特征在于,所述方法包括:
根据预设的缩放因子,由原始图像建立图像金字塔;
提取所述图像金字塔的中间X个图层,利用固定的滑动窗口进行遍历采样,对采样图像用分类器计算对应的置信度,得到每个图层中置信度最高的Y个采样图像对应的置信采样点,其中X、Y为正整数;
将所提取的X个图层中共计XY个置信度最高的采样图像对应的置信采样点映射到所述图像金字塔各图层中的对应点,并将每个所述置信采样点及对应点组成一条采样链;
对每条所述采样链中各点利用所述滑动窗口提取对应图层的窗口图像,再对各窗口图像用分类器计算对应的置信度,得到每条采样链中置信度最高的窗口图像;
将各条采样链中置信度最高的窗口图像映射到原始图像中的检测结果窗口;
合并所述原始图像中的检测结果窗口。

2.  根据权利要求1所述的方法,其特征在于,所述对采样图像用分类器计算对应的置信度,包括:对采样图像利用级联Adaboost分类器计算对应的置信度;
所述对各窗口图像用分类器计算对应的置信度,包括:对各窗口图像用级联Adaboost分类器计算对应的置信度;
其中,所述级联Adaboost分类器为预先训练的分类器,包括多个级联的强分类器,每个所述强分类器包含多个弱分类器;
所述对采样图像/窗口图像用级联Adaboost分类器计算对应的置信度,包括:
S1:将置信度初始值设置为0;
S2:按强分类器的级次,执行下列循环:
利用强分类器中所包含的弱分类器分别计算所述采样图像/窗口图像的分值,并将各弱分类器的分值累加作为强分类器分值;
若强分类器分值小于阈值,则未通过强分类器检测,计算强分类器的第一 归一化分值,用置信度的当前值减去第一归一化分值作为更新后的置信度,并退出所述循环;否则,通过强分类器检测,计算强分类器的第二归一化分值,用置信度的当前值加上第二归一化分值作为更新后的置信度,并继续执行所述循环。

3.  根据权利要求2所述的方法,其特征在于,所述X=3,所述Y=8。

4.  根据权利要求2所述的方法,其特征在于,在所述合并所述原始图像中的检测结果窗口的步骤之前,所述方法还包括:
对所述检测结果窗口进行滤除处理,滤除置信度小于预值或没有通过所有强分类器检测的窗口图像对应的检测结果窗口。

5.  根据权利要求1或4所述的方法,其特征在于,合并所述原始图像中的检测结果窗口的步骤,包括:
将原始图像中任意两个相重叠的检测结果窗口按照下列公式进行合并:
R=(Ri×wi+Rj×wj)/(wi+wj),其中Ri=(xi,yi,ai,bi),Rj=(xj,yj,aj,bj)为两重叠的检测结果窗口,(xi,yi)、(xj,yj)分别为检测结果窗口的顶点,ai、aj分别为检测结果窗口的长,bi、bj分别为检测结果窗口的宽,wi、wj分别为对应的置信度。

6.  一种基于分类器的目标检测装置,其特征在于,所述装置包括:
图像金字塔建立单元,用于根据预设的缩放因子,由原始图像建立图像金字塔;
置信采样点分析单元,用于提取所述图像金字塔的中间X个图层,利用固定的滑动窗口进行遍历采样,对采样图像用分类器计算对应的置信度,得到每个图层中置信度最高的Y个采样图像对应的置信采样点,其中X、Y为正整数;
采样链组建单元,用于将所提取的X个图层中共计XY个置信度最高的采样图像对应的置信采样点映射到所述图像金字塔各图层中的对应点,并将每个所述置信采样点及对应点组成一条采样链;
采样链分析单元,对每条所述采样链中各点利用所述滑动窗口提取对应图层的窗口图像,再对各窗口图像用分类器计算对应的置信度,得到每条采样链中置信度最高的窗口图像;
原始图像还原单元,用于将各条采样链中置信度最高的窗口图像映射到原始图像中的检测结果窗口;
检测结果合并单元,用于合并所述原始图像中的检测结果窗口。

7.  根据权利要求6所述的装置,其特征在于,所述置信采样点分析单元用于对所述采样图像利用级联Adaboost分类器计算对应的置信度;
所述采样链分析单元用于对各窗口图像用级联Adaboost分类器计算对应的置信度。

8.  根据权利要求7所述的装置,其特征在于,所述X=3,所述Y=8。

9.  根据权利要求7所述的装置,其特征在于,所述装置还包括过滤单元,用于对检测结果窗口进行滤除处理,滤除置信度小于预值或没有通过所有强分类器检测的窗口图像对应的检测结果窗口。

10.  根据权利要求6或9所述的装置,其特征在于,所述检测结果合并单元,用于将原始图像中任意两个相重叠的检测结果窗口按照下列公式进行合并:
R=(Ri×wi+Rj×wj)/(wi+wj),其中Ri=(xi,yi,ai,bi),Rj=(xj,yj,aj,bj)为两重叠的检测结果窗口,(xi,yi)、(xj,yj)分别为检测结果窗口的顶点,ai、aj分别为检测结果窗口的长,bi、bj分别为检测结果窗口的宽,wi、wj分别为对应的置信度。

说明书

说明书基于分类器的目标检测方法及装置
技术领域
本发明涉及智能视频监控技术领域,特别是涉及一种基于分类器的目标检测方法及装置。
背景技术
分类器算法是智能视频分析领域中常用的目标检测算法。最常见的分类器如Adaboost分类器,由Freud和Shapire等人提出。Adaboost算法通过学习标记为正负的样本,提取目标概念的知识,从而泛化为其它未见过的检测过程中。
在传统的目标检测过程中,大致分为两部分。一是将图像的分辨率进行不断缩放,形成图像金字塔。如图1所示,缩放比例δ<1为缩放因子,图层0为原始图像,图层1、图层2为原始图像缩放1次、2次后得到的图像……。二是在图像金字塔中每一图层中利用固定大小的滑动窗口进行遍历采样,利用Adaboost分类器对采样图像进行判定,当判定的输出结果为1为所要检测的目标,当输出结果为0则为非目标。
综上,传统技术中,虽然Adaboost分类器虽然对采样图像的判定时间很短(微秒级),但由于是对各个图层进行遍历采样,采样总数目(通常会达到数百万)比较庞大,这样目标检测所需要的时间就比较长。此外,由于Adaboost分类器对采样图像进行二值化判定,检测结果就非常依赖于分类器的性能,如果预先训练的Adaboost性能较高(例如训练采用的正负样本多等),检测结果就比较准确,而当Adaboost分类器不是最优,检测结果就会出现过多的虚警。
发明内容
基于此,有必要针提供一种基于Adaboost分类器的目标检测方法和装置,能够提高目标检测的速度,并且降低虚警。
一种基于分类器的目标检测方法,包括:
根据预设的缩放因子,由原始图像建立图像金字塔;
提取所述图像金字塔的中间X个图层,利用固定的滑动窗口进行遍历采样,对采样图像用分类器计算对应的置信度,得到每个图层中置信度最高的Y个采样图像对应的置信采样点,其中X、Y为正整数;
将所提取的X个图层中共计XY个置信度最高的采样图像对应的置信采样点映射到所述图像金字塔各图层中的对应点,并将每个所述置信采样点及对应点组成一条采样链;
对每条所述采样链中各点利用所述滑动窗口提取对应图层的窗口图像,再对各窗口图像用分类器计算对应的置信度,得到每条采样链中置信度最高的窗口图像;
将各条采样链中置信度最高的窗口图像映射到原始图像中的检测结果窗口;
合并所述原始图像中的检测结果窗口。
在其中一个实施例中,所述对采样图像用分类器计算对应的置信度,包括:对采样图像利用级联Adaboost分类器计算对应的置信度;
所述对各窗口图像用分类器计算对应的置信度,包括:对各窗口图像用级联Adaboost分类器计算对应的置信度;
其中,所述级联Adaboost分类器为预先训练的分类器,包括多个级联的强分类器,每个所述强分类器包含多个弱分类器;
所述对采样图像/窗口图像用级联Adaboost分类器计算对应的置信度,包括:
S1:将置信度初始值设置为0;
S2:按强分类器的级次,执行下列循环:
利用强分类器中所包含的弱分类器分别计算所述采样图像/窗口图像的分值,并将各弱分类器的分值累加作为强分类器分值;
若强分类器分值小于阈值,则未通过强分类器检测,计算强分类器的第一归一化分值,用置信度的当前值减去第一归一化分值作为更新后的置信度,并退出所述循环;否则,通过强分类器检测,计算强分类器的第二归一化分值,用置信度的当前值加上第二归一化分值作为更新后的置信度,并继续执行所述循环。
在其中一个实施例中,所述X=3,所述Y=8。
在其中一个实施例中,在所述合并所述原始图像中的检测结果窗口的步骤之前,所述方法还包括:
对所述检测结果窗口进行滤除处理,滤除置信度小于预值或没有通过所有强分类器检测的窗口图像对应的检测结果窗口。
在其中一个实施例中,合并所述原始图像中的检测结果窗口的步骤,包括:
将原始图像中任意两个相重叠的检测结果窗口按照下列公式进行合并:
R=(Ri×wi+Rj×wj)/(wi+wj),其中Ri=(xi,yi,ai,bi),Rj=(xj,yj,aj,bj)为两重叠的检测结果窗口,(xi,yi)、(xj,yj)分别为检测结果窗口的顶点,ai、aj分别为检测结果窗口的长,bi、bj分别为检测结果窗口的宽,wi、wj分别为对应的置信度。
一种基于分类器的目标检测装置,包括:
图像金字塔建立单元,用于根据预设的缩放因子,由原始图像建立图像金字塔;
置信采样点分析单元,用于提取所述图像金字塔的中间X个图层,利用固定的滑动窗口进行遍历采样,对采样图像用分类器计算对应的置信度,得到每个图层中置信度最高的Y个采样图像对应的置信采样点,其中X、Y为正整数;
采样链组建立单元,用于将所提取的X个图层中共计XY个置信度最高的采样图像对应的置信采样点映射到所述图像金字塔各图层中的对应点,并将每个所述置信采样点及对应点组成一条采样链;
采样链分析单元,对每条所述采样链中各点利用所述滑动窗口提取对应图层的窗口图像,再对各窗口图像用分类器计算对应的置信度,得到每条采样链中置信度最高的窗口图像;
原始图像还原单元,用于将各条采样链中置信度最高的窗口图像映射到原始图像中的检测结果窗口;
检测结果合并单元,用于合并所述原始图像中的检测结果窗口。
在其中一个实施例中,所述置信采样点分析单元用于对所述采样图像利用级联Adaboost分类器计算对应的置信度;
所述采样链分析单元用于对各窗口图像用级联Adaboost分类器计算对应的 置信度。
在其中一个实施例中,所述X=3,所述Y=8。
在其中一个实施例中,所述装置还包括过滤单元,用于对检测结果窗口进行滤除处理,滤除置信度小于预值或没有通过所有强分类器检测的窗口图像对应的检测结果窗口。
在其中一个实施例中,所述检测结果合并单元,用于将原始图像中任意两个相重叠的检测结果窗口按照下列公式进行合并:
R=(Ri×wi+Rj×wj)/(wi+wj),其中Ri=(xi,yi,ai,bi),Rj=(xj,yj,aj,bj)为两重叠的检测结果窗口,(xi,yi)、(xj,yj)分别为检测结果窗口的顶点,ai、aj分别为检测结果窗口的长,bi、bj分别为检测结果窗口的宽,wi、wj分别为对应的置信度。
上述基于分类器的目标检测方法和装置,只对图像金字塔中的中间X各图层进行遍历采样,计算得到置信度最高的XY个采样图像对应的置信采样点,再由置信采样点及其在各图层中相应的点建立采样链,再由每条采样链置信度最大的窗口图像映射到原始图像中的检测结果窗口,最后合并检测结果窗口作为检测的目标,相比于传统技术对图像金字塔中的所有图层进行遍历采样,减少了采样数目,从而提高了目标检测的速度,并且所用的分类器的输出为连续的置信度,而不是二值化的0或1,由此目标检测的精确度对分类器的依赖性大大降低,降低了目标检测的虚警。
附图说明
图1为图像金子塔示意图;
图2为一个实施例中的基于分类器的目标检测方法的流程示意图;
图3为一个实施例中采用基于分类器的目标检测方法进行目标检测的示意图;
图4为一个实施例中的基于分类器的目标检测装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参见图2,在一个实施例中提供了一种基于分类器的目标检测方法。该方法包括:
步骤202,根据预设的缩放因子,由原始图像建立图像金字塔。
具体的,在视频监控领域中,图像由图像传感装置获取,该图像传感装置可以是基于CMOS或CCD等工艺技术,原始图像可以是图像传感装置直接获取的图像或者经过灰度化等手段处理过的图像,在此并不限定。由本实施例中的原始图像建立图像金字塔的过程可以参考传统技术。以图3为例,图层0为原始图像,其分辨率可以为1280×720等,缩放因子δ=1/1.1,即图像金字塔中每一图层的分辨率为其上层的1.1倍。在图3中最顶层图层为图层10。
步骤204,提取图像金字塔的中间X个图层,利用固定的滑动窗口进行遍历采样,对采样图像用分类器计算对应的置信度,得到每个图层中置信度最高的Y个采样图像对应的置信采样点。
具体的,建立图像金字塔后,按图层编号提取图像金字塔中的最中间的X个图层进行遍历采样,其中X为正整数,可以根据计算量和准确度的需求进行调整。在图3中,X可以但不限于为3,相应取图层4、图层5和图层6进行遍历采样。提取图像金字塔的中间X个图层也可以是均匀提取图层编号中的X个图层,例如图层编号为0至10,可以提取图层2、图层5和图层8。遍历采样是指通过固定大小的滑动窗口在中间X个图层中由左至右、由上至下地提取图层中的采样图像,并用分类器计算采样图像对应的置信度,最后得到每个所提取的每个图层中置信度最高的Y个采样图像对应的置信采样点。在图3中,滑动窗口302的大小可以预先设置,例如可以设置为检测目标的最小图像尺寸,如40×40等。Y为正整数,可以进行设定,例如在图3中,Y=8。当在图层5中进行遍历采样时,假设图层5中滑动窗口位于5max位置处,其采样图像的置信度为图层5中置信度排序前8的位置之一,则记录5max位置处的置信采样点。置信采样点可以定义为滑动窗口(矩形)的左上角像素点、中心像素点等等。
在本实施例中,分类器为根据目标检测正负样本而预先训练的分类器。当 分类器获取采样图像后就会相应输出一个置信度的值。置信度取值在一个连续范围内。
在一个实施例中,分类器可以是预先训练的级联Adaboost分类器,级联Adaboost分类器包括多个级联的强分类器,每个强分类器中又包含多个弱分类器。由此,可以对滑动窗口进行采样的采样图像利用级联Adaboost分类器计算对应的置信度,其一般处理过程包括:
S1:将置信度初始值设置为0。
S2:按强分类器的级次,执行下列循环:
利用强分类器中所包含的弱分类器分别计算采样图像的分值,并将各弱分类器的分值累加作为强分类器分值。
若强分类器分值小于阈值,则未通过强分类器检测,计算强分类器的第一归一化分值,用置信度的当前值减去第一归一化分值作为更新后的置信度,并退出循环;否则,通过强分类器检测,计算强分类器的第二归一化分值,用置信度的当前值加上第二归一化分值作为更新后的置信度,并继续执行循环。
其用计算机代码实现的算法及注释如下:


步骤206,将所提取的X个图层中共计XY个置信度最高的采样图像对应的置信采样点映射到图像金字塔各图层中的对应点,并将每个置信采样点及对应点组成一条采样链。
具体的,在提取的X各图层中,每个图层计算得到置信度最高的Y个采样图像对应的置信采样点,则共计有X×Y个置信采样点。根据图像金字塔的缩放比例关系,将XY个置信采样点映射到图像金字塔中各个图层中的对应像素点,并将这些具有对应关系的像素点形成一条采样链。以图3为例,像素点A5为图层5中计算置信度最高的采样图像的一个置信采样点(图层5中其它置信像素 点未示出),则根据图层之间的缩放比例,将A5和A5在各图层中的对应点A0、…A4…A10组成一条采样链。
步骤208,对每条采样链中各点利用滑动窗口提取对应图层的窗口图像,再对各窗口图像用分类器计算对应的置信度,得到每条采样链中置信度最高的窗口图像。
具体的,每条采样链在各个图层中包含一个像素点,以该像素点为基础(例如作为左上角像素点或中心像素点等)利用滑动窗口提取对应图层中的窗口图像,并对窗口图像用分类器计算对应的置信度,得到每条采样链对应置信度最高的窗口图像。其中,对窗口图像用分类器计算对应的置信度,可以是对窗口图像用级联Adaboost分类器计算对应的置信度,处理过程与前述计算采样图像的置信度类似,在此不再赘述。参见图3,A0、…A4…A10组成了一条采样链,以该采样链中每个像素点为基础,在对应图层中用滑动窗口提取窗口图像,并用级联Adaboost分类器计算置信度,得到置信度最高的窗口图像,例如置信度最高的窗口图像可以是位于图层4的chain_max位置处滑动窗口所提取的窗口图像。由此,在本实施例中,一共可以计算得到XY个窗口图像。
步骤210,将各条采样链中置信度最高的窗口图像映射到原始图像中的检测结果窗口。
具体的,窗口图像的大小都是固定的,与滑动窗口的大小一致,根据窗口图像所在不同图层的编号,以及图层间的缩放关系,将上述XY个窗口图像映射到原始图像(图层0)中的检测结果窗口。在图3的例子中,图层4中的chain_max位置处的窗口图像的置信度最高,将其映射到原始图像中,其图像大小相应会根据图层4与图层0的缩放关系会进行放大,最终为图层0中的区域304。
步骤212,合并原始图像中的检测结果窗口。
具体的,经过前述步骤,会得到XY个检测结果窗口,将XY个检测结果窗口进行合并就得到所要检测的目标。当检测结果窗口为孤立的,就可以直接作为一个检测的目标。而当检测结果窗口存在重叠时,按照公式:R=(Ri×wi+Rj×wj)/(wi+wj)进行合并,其中Ri=(xi,yi,ai,bi),Rj=(xj,yj,aj,bj)为两重 叠的检测结果窗口,(xi,yi)、(xj,yj)分别为检测结果窗口的顶点,ai、aj分别为检测结果窗口的长,bi、bj分别为检测结果窗口的宽,wi、wj分别为对应的置信度。
在一个实施例中,在对XY个检测结果窗口进行合并之前,还可以对检测结果进行滤除处理,滤除置信度小于预值Th(Th可以依据监控场景而设定)或没有通过所有强分类器检测的窗口图像对应的检测结果窗口。这样根据不同监控场景的虚警度要求,可以滤除XY个检测窗口结果中的部分结果,降低虚警度。
上述实施例所提供的目标检测方法是基于如下实验事实:当用滑动窗口在图像金子塔中进行采样时,对采样图像用分类器计算得到的置信度存在连续性,同一图层中相邻位置的采样图像的置信度的差值在一定范围内,并且相邻图层的相近位置的采样图像的置信度差值也在一定范围内。由此可以通过少数几个图层中置信度较高的采样图像来获知原始图像中的检测目标,而不必对图像金字塔的所有图层进行遍历采样。
上述基于分类器的目标检测方法,只对图像金字塔中的中间X各图层进行遍历采样,计算得到置信度最高的XY个采样图像对应的置信采样点,再由置信采样点及其在各图层中相应的点建立采样链,再由每条采样链置信度最大的窗口图像映射到原始图像中的检测结果窗口,最后合并检测结果窗口作为检测的目标,相比于传统技术对图像金字塔中的所有图层进行遍历采样,减少了采样数目,从而提高了目标检测的速度,并且所用的分类器的输出为连续的置信度,而不是二值化的0或1,由此目标检测的精确度对分类器的依赖性大大降低,降低了目标检测的虚警。
参见图4,在一个实施例中,提供了一种基于分类器的目标检测装置。该装置包括:
图像金字塔建立单元402,用于根据预设的缩放因子,由原始图像建立图像金字塔。
置信采样点分析单元404,用于提取图像金字塔的中间X个图层,利用固定的滑动窗口进行遍历采样,对采样图像用分类器计算对应的置信度,得到每 个图层中置信度最高的Y个采样图像对应的置信采样点。
采样链组建单元406,用于将所提取的X个图层中共计XY个置信度最高的采样图像对应的置信采样点映射到图像金字塔各图层中的对应点,并将每个置信采样点及对应点组成一条采样链。
采样链分析单元408,对每条采样链中各点利用滑动窗口提取对应图层的窗口图像,再对各窗口图像用分类器计算对应的置信度,得到每条采样链中置信度最高的窗口图像。
原始图像还原单元410,用于将各条采样链中置信度最高的窗口图像映射到原始图像中的检测结果窗口。
检测结果合并单元414,用于合并原始图像中的检测结果窗口。
在一个实施例中,置信采样点分析单元404可以对采样图像利用级联Adaboost分类器计算对应的置信度。而采样链分析单元408可以对各窗口图像用级联Adaboost分类器计算对应的置信度。其计算原理参见前文。
在一个实施例中,根据计算量的大小以及预期检测目标的个数,可以取X=3,Y=8。则总计会需要对3个图层进行遍历采样,并且得到24条采样链及对应的检测结果窗口。
在一个实施例中,本装置还可以包括过滤单元414,对检测结果窗口进行滤除处理,滤除置信度小于预值Th或没有通过所有强分类器检测的窗口图像对应的检测结果窗口,以适应不同虚警度要求的监控场景。
检测结果合并单元414对检测结果窗口进行合并得到检测目标,具体的,当检测结果窗口为孤立的,就可以直接作为一个检测的目标。而当检测结果窗口存在重叠时,按照公式:R=(Ri×wi+Rj×wj)/(wi+wj)进行合并,其中Ri=(xi,yi,ai,bi),Rj=(xj,yj,aj,bj)为两重叠的检测结果窗口,(xi,yi)、(xj,yj)分别为检测结果窗口的顶点,ai、aj分别为检测结果窗口的长,bi、bj分别为检测结果窗口的宽,wi、wj分别为对应的置信度。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和 改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

基于分类器的目标检测方法及装置.pdf_第1页
第1页 / 共14页
基于分类器的目标检测方法及装置.pdf_第2页
第2页 / 共14页
基于分类器的目标检测方法及装置.pdf_第3页
第3页 / 共14页
点击查看更多>>
资源描述

《基于分类器的目标检测方法及装置.pdf》由会员分享,可在线阅读,更多相关《基于分类器的目标检测方法及装置.pdf(14页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103914706 A (43)申请公布日 2014.07.09 CN 103914706 A (21)申请号 201410127358.0 (22)申请日 2014.03.31 G06K 9/62(2006.01) G06T 7/00(2006.01) (71)申请人 深圳市智美达科技有限公司 地址 518000 广东省深圳市南山区科苑路 11 号金融科技大厦 17 楼 ABCD 单元 (72)发明人 孙海涌 (74)专利代理机构 广州华进联合专利商标代理 有限公司 44224 代理人 胡海斌 (54) 发明名称 基于分类器的目标检测方法及装置 (57) 摘要 本发。

2、明公开了一种基于分类器的目标检测方 法, 包括 : 根据预设的缩放因子, 由原始图像建立 图像金字塔 ; 提取图像金字塔的中间 X 个图层, 利 用固定的滑动窗口进行遍历采样, 对采样图像用 分类器计算对应的置信度, 得到每个图层中置信 度最高的 Y 个采样图像对应的置信采样点 ; 将 XY 个置信度最高的采样图像对应的置信采样点映射 到图像金字塔各图层中的对应点, 并将每个置信 采样点及对应点组成一条采样链 ; 对每条采样链 中各点利用所述滑动窗口提取对应图层的窗口图 像, 再对各窗口图像用分类器计算对应的置信度, 得到每条采样链中置信度最高的窗口图像 ; 将各 条采样链中置信度最高的窗口图。

3、像映射到原始图 像中的检测结果窗口 ; 合并原始图像中的检测结 果窗口。 (51)Int.Cl. 权利要求书 2 页 说明书 8 页 附图 3 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书8页 附图3页 (10)申请公布号 CN 103914706 A CN 103914706 A 1/2 页 2 1. 一种基于分类器的目标检测方法, 其特征在于, 所述方法包括 : 根据预设的缩放因子, 由原始图像建立图像金字塔 ; 提取所述图像金字塔的中间 X 个图层, 利用固定的滑动窗口进行遍历采样, 对采样图 像用分类器计算对应的置信度, 得到每个图层中置信度最。

4、高的 Y 个采样图像对应的置信采 样点, 其中 X、 Y 为正整数 ; 将所提取的 X 个图层中共计 XY 个置信度最高的采样图像对应的置信采样点映射到所 述图像金字塔各图层中的对应点, 并将每个所述置信采样点及对应点组成一条采样链 ; 对每条所述采样链中各点利用所述滑动窗口提取对应图层的窗口图像, 再对各窗口图 像用分类器计算对应的置信度, 得到每条采样链中置信度最高的窗口图像 ; 将各条采样链中置信度最高的窗口图像映射到原始图像中的检测结果窗口 ; 合并所述原始图像中的检测结果窗口。 2. 根据权利要求 1 所述的方法, 其特征在于, 所述对采样图像用分类器计算对应的置 信度, 包括 : 。

5、对采样图像利用级联 Adaboost 分类器计算对应的置信度 ; 所述对各窗口图像用分类器计算对应的置信度, 包括 : 对各窗口图像用级联 Adaboost 分类器计算对应的置信度 ; 其中, 所述级联 Adaboost 分类器为预先训练的分类器, 包括多个级联的强分类器, 每 个所述强分类器包含多个弱分类器 ; 所述对采样图像 / 窗口图像用级联 Adaboost 分类器计算对应的置信度, 包括 : S1 : 将置信度初始值设置为 0 ; S2 : 按强分类器的级次, 执行下列循环 : 利用强分类器中所包含的弱分类器分别计算所述采样图像 / 窗口图像的分值, 并将各 弱分类器的分值累加作为强。

6、分类器分值 ; 若强分类器分值小于阈值, 则未通过强分类器检测, 计算强分类器的第一归一化分值, 用置信度的当前值减去第一归一化分值作为更新后的置信度, 并退出所述循环 ; 否则, 通过 强分类器检测, 计算强分类器的第二归一化分值, 用置信度的当前值加上第二归一化分值 作为更新后的置信度, 并继续执行所述循环。 3. 根据权利要求 2 所述的方法, 其特征在于, 所述 X=3, 所述 Y=8。 4. 根据权利要求 2 所述的方法, 其特征在于, 在所述合并所述原始图像中的检测结果 窗口的步骤之前, 所述方法还包括 : 对所述检测结果窗口进行滤除处理, 滤除置信度小于预值或没有通过所有强分类器。

7、检 测的窗口图像对应的检测结果窗口。 5.根据权利要求1或4所述的方法, 其特征在于, 合并所述原始图像中的检测结果窗口 的步骤, 包括 : 将原始图像中任意两个相重叠的检测结果窗口按照下列公式进行合并 : R (Riwi+Rjwj)/(wi+wj), 其中 Ri (xi,yi,ai,bi), Rj (xj,yj,aj,bj) 为两重叠的 检测结果窗口, (xi,yi)、 (xj,yj) 分别为检测结果窗口的顶点, ai、 aj分别为检测结果窗口的 长, bi、 bj分别为检测结果窗口的宽, wi、 wj分别为对应的置信度。 6. 一种基于分类器的目标检测装置, 其特征在于, 所述装置包括 :。

8、 图像金字塔建立单元, 用于根据预设的缩放因子, 由原始图像建立图像金字塔 ; 权 利 要 求 书 CN 103914706 A 2 2/2 页 3 置信采样点分析单元, 用于提取所述图像金字塔的中间 X 个图层, 利用固定的滑动窗 口进行遍历采样, 对采样图像用分类器计算对应的置信度, 得到每个图层中置信度最高的 Y 个采样图像对应的置信采样点, 其中 X、 Y 为正整数 ; 采样链组建单元, 用于将所提取的X个图层中共计XY个置信度最高的采样图像对应的 置信采样点映射到所述图像金字塔各图层中的对应点, 并将每个所述置信采样点及对应点 组成一条采样链 ; 采样链分析单元, 对每条所述采样链中。

9、各点利用所述滑动窗口提取对应图层的窗口图 像, 再对各窗口图像用分类器计算对应的置信度, 得到每条采样链中置信度最高的窗口图 像 ; 原始图像还原单元, 用于将各条采样链中置信度最高的窗口图像映射到原始图像中的 检测结果窗口 ; 检测结果合并单元, 用于合并所述原始图像中的检测结果窗口。 7. 根据权利要求 6 所述的装置, 其特征在于, 所述置信采样点分析单元用于对所述采 样图像利用级联 Adaboost 分类器计算对应的置信度 ; 所述采样链分析单元用于对各窗口图像用级联 Adaboost 分类器计算对应的置信度。 8. 根据权利要求 7 所述的装置, 其特征在于, 所述 X=3, 所述 。

10、Y=8。 9. 根据权利要求 7 所述的装置, 其特征在于, 所述装置还包括过滤单元, 用于对检测结 果窗口进行滤除处理, 滤除置信度小于预值或没有通过所有强分类器检测的窗口图像对应 的检测结果窗口。 10.根据权利要求6或9所述的装置, 其特征在于, 所述检测结果合并单元, 用于将原始 图像中任意两个相重叠的检测结果窗口按照下列公式进行合并 : R (Riwi+Rjwj)/(wi+wj), 其中 Ri (xi,yi,ai,bi), Rj (xj,yj,aj,bj) 为两重叠的 检测结果窗口, (xi,yi)、 (xj,yj) 分别为检测结果窗口的顶点, ai、 aj分别为检测结果窗口的 长,。

11、 bi、 bj分别为检测结果窗口的宽, wi、 wj分别为对应的置信度。 权 利 要 求 书 CN 103914706 A 3 1/8 页 4 基于分类器的目标检测方法及装置 技术领域 0001 本发明涉及智能视频监控技术领域, 特别是涉及一种基于分类器的目标检测方法 及装置。 背景技术 0002 分类器算法是智能视频分析领域中常用的目标检测算法。最常见的分类器如 Adaboost 分类器, 由 Freud 和 Shapire 等人提出。Adaboost 算法通过学习标记为正负的样 本, 提取目标概念的知识, 从而泛化为其它未见过的检测过程中。 0003 在传统的目标检测过程中, 大致分为两部。

12、分。 一是将图像的分辨率进行不断缩放, 形成图像金字塔。如图 1 所示, 缩放比例 1 为缩放因子, 图层 0 为原始图像, 图层 1、 图 层2为原始图像缩放1次、 2次后得到的图像。 二是在图像金字塔中每一图层中利用固 定大小的滑动窗口进行遍历采样, 利用 Adaboost 分类器对采样图像进行判定, 当判定的输 出结果为 1 为所要检测的目标, 当输出结果为 0 则为非目标。 0004 综上, 传统技术中, 虽然 Adaboost 分类器虽然对采样图像的判定时间很短 (微秒 级) , 但由于是对各个图层进行遍历采样, 采样总数目 (通常会达到数百万) 比较庞大, 这样 目标检测所需要的时。

13、间就比较长。此外, 由于 Adaboost 分类器对采样图像进行二值化判 定, 检测结果就非常依赖于分类器的性能, 如果预先训练的 Adaboost 性能较高 (例如训练 采用的正负样本多等) , 检测结果就比较准确, 而当 Adaboost 分类器不是最优, 检测结果就 会出现过多的虚警。 发明内容 0005 基于此, 有必要针提供一种基于 Adaboost 分类器的目标检测方法和装置, 能够提 高目标检测的速度, 并且降低虚警。 0006 一种基于分类器的目标检测方法, 包括 : 0007 根据预设的缩放因子, 由原始图像建立图像金字塔 ; 0008 提取所述图像金字塔的中间 X 个图层,。

14、 利用固定的滑动窗口进行遍历采样, 对采 样图像用分类器计算对应的置信度, 得到每个图层中置信度最高的 Y 个采样图像对应的置 信采样点, 其中 X、 Y 为正整数 ; 0009 将所提取的 X 个图层中共计 XY 个置信度最高的采样图像对应的置信采样点映射 到所述图像金字塔各图层中的对应点, 并将每个所述置信采样点及对应点组成一条采样 链 ; 0010 对每条所述采样链中各点利用所述滑动窗口提取对应图层的窗口图像, 再对各窗 口图像用分类器计算对应的置信度, 得到每条采样链中置信度最高的窗口图像 ; 0011 将各条采样链中置信度最高的窗口图像映射到原始图像中的检测结果窗口 ; 0012 合。

15、并所述原始图像中的检测结果窗口。 0013 在其中一个实施例中, 所述对采样图像用分类器计算对应的置信度, 包括 : 对采样 说 明 书 CN 103914706 A 4 2/8 页 5 图像利用级联 Adaboost 分类器计算对应的置信度 ; 0014 所述对各窗口图像用分类器计算对应的置信度, 包括 : 对各窗口图像用级联 Adaboost 分类器计算对应的置信度 ; 0015 其中, 所述级联 Adaboost 分类器为预先训练的分类器, 包括多个级联的强分类 器, 每个所述强分类器包含多个弱分类器 ; 0016 所述对采样图像 / 窗口图像用级联 Adaboost 分类器计算对应的置。

16、信度, 包括 : 0017 S1 : 将置信度初始值设置为 0 ; 0018 S2 : 按强分类器的级次, 执行下列循环 : 0019 利用强分类器中所包含的弱分类器分别计算所述采样图像 / 窗口图像的分值, 并 将各弱分类器的分值累加作为强分类器分值 ; 0020 若强分类器分值小于阈值, 则未通过强分类器检测, 计算强分类器的第一归一化 分值, 用置信度的当前值减去第一归一化分值作为更新后的置信度, 并退出所述循环 ; 否 则, 通过强分类器检测, 计算强分类器的第二归一化分值, 用置信度的当前值加上第二归一 化分值作为更新后的置信度, 并继续执行所述循环。 0021 在其中一个实施例中,。

17、 所述 X=3, 所述 Y=8。 0022 在其中一个实施例中, 在所述合并所述原始图像中的检测结果窗口的步骤之前, 所述方法还包括 : 0023 对所述检测结果窗口进行滤除处理, 滤除置信度小于预值或没有通过所有强分类 器检测的窗口图像对应的检测结果窗口。 0024 在其中一个实施例中, 合并所述原始图像中的检测结果窗口的步骤, 包括 : 0025 将原始图像中任意两个相重叠的检测结果窗口按照下列公式进行合并 : 0026 R (Riwi+Rjwj)/(wi+wj), 其中 Ri (xi,yi,ai,bi), Rj (xj,yj,aj,bj) 为两重 叠的检测结果窗口, (xi,yi)、 (。

18、xj,yj) 分别为检测结果窗口的顶点, ai、 aj分别为检测结果窗 口的长, bi、 bj分别为检测结果窗口的宽, wi、 wj分别为对应的置信度。 0027 一种基于分类器的目标检测装置, 包括 : 0028 图像金字塔建立单元, 用于根据预设的缩放因子, 由原始图像建立图像金字塔 ; 0029 置信采样点分析单元, 用于提取所述图像金字塔的中间 X 个图层, 利用固定的滑 动窗口进行遍历采样, 对采样图像用分类器计算对应的置信度, 得到每个图层中置信度最 高的 Y 个采样图像对应的置信采样点, 其中 X、 Y 为正整数 ; 0030 采样链组建立单元, 用于将所提取的X个图层中共计XY。

19、个置信度最高的采样图像 对应的置信采样点映射到所述图像金字塔各图层中的对应点, 并将每个所述置信采样点及 对应点组成一条采样链 ; 0031 采样链分析单元, 对每条所述采样链中各点利用所述滑动窗口提取对应图层的窗 口图像, 再对各窗口图像用分类器计算对应的置信度, 得到每条采样链中置信度最高的窗 口图像 ; 0032 原始图像还原单元, 用于将各条采样链中置信度最高的窗口图像映射到原始图像 中的检测结果窗口 ; 0033 检测结果合并单元, 用于合并所述原始图像中的检测结果窗口。 0034 在其中一个实施例中, 所述置信采样点分析单元用于对所述采样图像利用级联 说 明 书 CN 103914。

20、706 A 5 3/8 页 6 Adaboost 分类器计算对应的置信度 ; 0035 所述采样链分析单元用于对各窗口图像用级联 Adaboost 分类器计算对应的置信 度。 0036 在其中一个实施例中, 所述 X=3, 所述 Y=8。 0037 在其中一个实施例中, 所述装置还包括过滤单元, 用于对检测结果窗口进行滤除 处理, 滤除置信度小于预值或没有通过所有强分类器检测的窗口图像对应的检测结果窗 口。 0038 在其中一个实施例中, 所述检测结果合并单元, 用于将原始图像中任意两个相重 叠的检测结果窗口按照下列公式进行合并 : 0039 R (Riwi+Rjwj)/(wi+wj), 其中。

21、 Ri (xi,yi,ai,bi), Rj (xj,yj,aj,bj) 为两重 叠的检测结果窗口, (xi,yi)、 (xj,yj) 分别为检测结果窗口的顶点, ai、 aj分别为检测结果窗 口的长, bi、 bj分别为检测结果窗口的宽, wi、 wj分别为对应的置信度。 0040 上述基于分类器的目标检测方法和装置, 只对图像金字塔中的中间 X 各图层进行 遍历采样, 计算得到置信度最高的 XY 个采样图像对应的置信采样点, 再由置信采样点及其 在各图层中相应的点建立采样链, 再由每条采样链置信度最大的窗口图像映射到原始图像 中的检测结果窗口, 最后合并检测结果窗口作为检测的目标, 相比于传。

22、统技术对图像金字 塔中的所有图层进行遍历采样, 减少了采样数目, 从而提高了目标检测的速度, 并且所用的 分类器的输出为连续的置信度, 而不是二值化的 0 或 1, 由此目标检测的精确度对分类器的 依赖性大大降低, 降低了目标检测的虚警。 附图说明 0041 图 1 为图像金子塔示意图 ; 0042 图 2 为一个实施例中的基于分类器的目标检测方法的流程示意图 ; 0043 图 3 为一个实施例中采用基于分类器的目标检测方法进行目标检测的示意图 ; 0044 图 4 为一个实施例中的基于分类器的目标检测装置的结构示意图。 具体实施方式 0045 为了使本发明的目的、 技术方案及优点更加清楚明白。

23、, 以下结合附图及实施例, 对 本发明进行进一步详细说明。 应当理解, 此处所描述的具体实施例仅仅用以解释本发明, 并 不用于限定本发明。 0046 参见图 2, 在一个实施例中提供了一种基于分类器的目标检测方法。该方法包括 : 0047 步骤 202, 根据预设的缩放因子, 由原始图像建立图像金字塔。 0048 具体的, 在视频监控领域中, 图像由图像传感装置获取, 该图像传感装置可以是基 于CMOS或CCD等工艺技术, 原始图像可以是图像传感装置直接获取的图像或者经过灰度化 等手段处理过的图像, 在此并不限定。由本实施例中的原始图像建立图像金字塔的过程可 以参考传统技术。以图 3 为例, 。

24、图层 0 为原始图像, 其分辨率可以为 1280720 等, 缩放因 子 1/1.1, 即图像金字塔中每一图层的分辨率为其上层的 1.1 倍。在图 3 中最顶层图 层为图层 10。 0049 步骤 204, 提取图像金字塔的中间 X 个图层, 利用固定的滑动窗口进行遍历采样, 说 明 书 CN 103914706 A 6 4/8 页 7 对采样图像用分类器计算对应的置信度, 得到每个图层中置信度最高的 Y 个采样图像对应 的置信采样点。 0050 具体的, 建立图像金字塔后, 按图层编号提取图像金字塔中的最中间的 X 个图层 进行遍历采样, 其中 X 为正整数, 可以根据计算量和准确度的需求进。

25、行调整。在图 3 中, X 可以但不限于为 3, 相应取图层 4、 图层 5 和图层 6 进行遍历采样。提取图像金字塔的中间 X 个图层也可以是均匀提取图层编号中的 X 个图层, 例如图层编号为 0 至 10, 可以提取图层 2、 图层5和图层8。 遍历采样是指通过固定大小的滑动窗口在中间X个图层中由左至右、 由 上至下地提取图层中的采样图像, 并用分类器计算采样图像对应的置信度, 最后得到每个 所提取的每个图层中置信度最高的 Y 个采样图像对应的置信采样点。在图 3 中, 滑动窗口 302 的大小可以预先设置, 例如可以设置为检测目标的最小图像尺寸, 如 4040 等。Y 为正 整数, 可以。

26、进行设定, 例如在图 3 中, Y=8。当在图层 5 中进行遍历采样时, 假设图层 5 中滑 动窗口位于 5max 位置处, 其采样图像的置信度为图层 5 中置信度排序前 8 的位置之一, 则 记录 5max 位置处的置信采样点。置信采样点可以定义为滑动窗口 (矩形) 的左上角像素点、 中心像素点等等。 0051 在本实施例中, 分类器为根据目标检测正负样本而预先训练的分类器。当分类器 获取采样图像后就会相应输出一个置信度的值。置信度取值在一个连续范围内。 0052 在一个实施例中, 分类器可以是预先训练的级联 Adaboost 分类器, 级联 Adaboost 分类器包括多个级联的强分类器,。

27、 每个强分类器中又包含多个弱分类器。 由此, 可以对滑动 窗口进行采样的采样图像利用级联 Adaboost 分类器计算对应的置信度, 其一般处理过程 包括 : 0053 S1 : 将置信度初始值设置为 0。 0054 S2 : 按强分类器的级次, 执行下列循环 : 0055 利用强分类器中所包含的弱分类器分别计算采样图像的分值, 并将各弱分类器的 分值累加作为强分类器分值。 0056 若强分类器分值小于阈值, 则未通过强分类器检测, 计算强分类器的第一归一化 分值, 用置信度的当前值减去第一归一化分值作为更新后的置信度, 并退出循环 ; 否则, 通 过强分类器检测, 计算强分类器的第二归一化分。

28、值, 用置信度的当前值加上第二归一化分 值作为更新后的置信度, 并继续执行循环。 0057 其用计算机代码实现的算法及注释如下 : 0058 说 明 书 CN 103914706 A 7 5/8 页 8 0059 说 明 书 CN 103914706 A 8 6/8 页 9 0060 步骤 206, 将所提取的 X 个图层中共计 XY 个置信度最高的采样图像对应的置信 采样点映射到图像金字塔各图层中的对应点, 并将每个置信采样点及对应点组成一条采样 链。 0061 具体的, 在提取的X各图层中, 每个图层计算得到置信度最高的Y个采样图像对应 的置信采样点, 则共计有 XY 个置信采样点。根据图。

29、像金字塔的缩放比例关系, 将 XY 个置 信采样点映射到图像金字塔中各个图层中的对应像素点, 并将这些具有对应关系的像素点 形成一条采样链。以图 3 为例, 像素点 A5为图层 5 中计算置信度最高的采样图像的一个置 信采样点 (图层 5 中其它置信像素点未示出) , 则根据图层之间的缩放比例, 将 A5和 A5在各 图层中的对应点 A0、A4A10组成一条采样链。 0062 步骤 208, 对每条采样链中各点利用滑动窗口提取对应图层的窗口图像, 再对各窗 口图像用分类器计算对应的置信度, 得到每条采样链中置信度最高的窗口图像。 说 明 书 CN 103914706 A 9 7/8 页 10 。

30、0063 具体的, 每条采样链在各个图层中包含一个像素点, 以该像素点为基础 (例如作为 左上角像素点或中心像素点等) 利用滑动窗口提取对应图层中的窗口图像, 并对窗口图像 用分类器计算对应的置信度, 得到每条采样链对应置信度最高的窗口图像。 其中, 对窗口图 像用分类器计算对应的置信度, 可以是对窗口图像用级联 Adaboost 分类器计算对应的置 信度, 处理过程与前述计算采样图像的置信度类似, 在此不再赘述。参见图 3, A0、 A4A10 组成了一条采样链, 以该采样链中每个像素点为基础, 在对应图层中用滑动窗口提取窗口 图像, 并用级联 Adaboost 分类器计算置信度, 得到置信。

31、度最高的窗口图像, 例如置信度最 高的窗口图像可以是位于图层 4 的 chain_max 位置处滑动窗口所提取的窗口图像。由此, 在本实施例中, 一共可以计算得到 XY 个窗口图像。 0064 步骤 210, 将各条采样链中置信度最高的窗口图像映射到原始图像中的检测结果 窗口。 0065 具体的, 窗口图像的大小都是固定的, 与滑动窗口的大小一致, 根据窗口图像所在 不同图层的编号, 以及图层间的缩放关系, 将上述 XY 个窗口图像映射到原始图像 (图层 0) 中的检测结果窗口。在图 3 的例子中, 图层 4 中的 chain_max 位置处的窗口图像的置信度 最高, 将其映射到原始图像中, 。

32、其图像大小相应会根据图层4与图层0的缩放关系会进行放 大, 最终为图层 0 中的区域 304。 0066 步骤 212, 合并原始图像中的检测结果窗口。 0067 具体的, 经过前述步骤, 会得到 XY 个检测结果窗口, 将 XY 个检测结果窗口进行合 并就得到所要检测的目标。 当检测结果窗口为孤立的, 就可以直接作为一个检测的目标。 而 当检测结果窗口存在重叠时, 按照公式 : R (Riwi+Rjwj)/(wi+wj) 进行合并, 其中 Ri (xi,yi,ai,bi), Rj (xj,yj,aj,bj) 为两重叠的检测结果窗口, (xi,yi)、 (xj,yj) 分别为检测结 果窗口的顶。

33、点, ai、 aj分别为检测结果窗口的长, bi、 bj分别为检测结果窗口的宽, wi、 wj分别 为对应的置信度。 0068 在一个实施例中, 在对 XY 个检测结果窗口进行合并之前, 还可以对检测结果进行 滤除处理, 滤除置信度小于预值 Th(Th 可以依据监控场景而设定) 或没有通过所有强分类 器检测的窗口图像对应的检测结果窗口。这样根据不同监控场景的虚警度要求, 可以滤除 XY 个检测窗口结果中的部分结果, 降低虚警度。 0069 上述实施例所提供的目标检测方法是基于如下实验事实 : 当用滑动窗口在图像金 子塔中进行采样时, 对采样图像用分类器计算得到的置信度存在连续性, 同一图层中相。

34、邻 位置的采样图像的置信度的差值在一定范围内, 并且相邻图层的相近位置的采样图像的置 信度差值也在一定范围内。 由此可以通过少数几个图层中置信度较高的采样图像来获知原 始图像中的检测目标, 而不必对图像金字塔的所有图层进行遍历采样。 0070 上述基于分类器的目标检测方法, 只对图像金字塔中的中间 X 各图层进行遍历采 样, 计算得到置信度最高的 XY 个采样图像对应的置信采样点, 再由置信采样点及其在各图 层中相应的点建立采样链, 再由每条采样链置信度最大的窗口图像映射到原始图像中的检 测结果窗口, 最后合并检测结果窗口作为检测的目标, 相比于传统技术对图像金字塔中的 所有图层进行遍历采样,。

35、 减少了采样数目, 从而提高了目标检测的速度, 并且所用的分类器 的输出为连续的置信度, 而不是二值化的 0 或 1, 由此目标检测的精确度对分类器的依赖性 大大降低, 降低了目标检测的虚警。 说 明 书 CN 103914706 A 10 8/8 页 11 0071 参见图 4, 在一个实施例中, 提供了一种基于分类器的目标检测装置。该装置包 括 : 0072 图像金字塔建立单元 402, 用于根据预设的缩放因子, 由原始图像建立图像金字 塔。 0073 置信采样点分析单元 404, 用于提取图像金字塔的中间 X 个图层, 利用固定的滑动 窗口进行遍历采样, 对采样图像用分类器计算对应的置信。

36、度, 得到每个图层中置信度最高 的 Y 个采样图像对应的置信采样点。 0074 采样链组建单元 406, 用于将所提取的 X 个图层中共计 XY 个置信度最高的采样图 像对应的置信采样点映射到图像金字塔各图层中的对应点, 并将每个置信采样点及对应点 组成一条采样链。 0075 采样链分析单元 408, 对每条采样链中各点利用滑动窗口提取对应图层的窗口图 像, 再对各窗口图像用分类器计算对应的置信度, 得到每条采样链中置信度最高的窗口图 像。 0076 原始图像还原单元 410, 用于将各条采样链中置信度最高的窗口图像映射到原始 图像中的检测结果窗口。 0077 检测结果合并单元 414, 用于。

37、合并原始图像中的检测结果窗口。 0078 在一个实施例中, 置信采样点分析单元404可以对采样图像利用级联Adaboost分 类器计算对应的置信度。而采样链分析单元 408 可以对各窗口图像用级联 Adaboost 分类 器计算对应的置信度。其计算原理参见前文。 0079 在一个实施例中, 根据计算量的大小以及预期检测目标的个数, 可以取 X=3, Y=8。 则总计会需要对 3 个图层进行遍历采样, 并且得到 24 条采样链及对应的检测结果窗口。 0080 在一个实施例中, 本装置还可以包括过滤单元 414, 对检测结果窗口进行滤除处 理, 滤除置信度小于预值 Th 或没有通过所有强分类器检测。

38、的窗口图像对应的检测结果窗 口, 以适应不同虚警度要求的监控场景。 0081 检测结果合并单元 414 对检测结果窗口进行合并得到检测目标, 具体的, 当检测 结果窗口为孤立的, 就可以直接作为一个检测的目标。 而当检测结果窗口存在重叠时, 按照 公式 : R (Riwi+Rjwj)/(wi+wj) 进行合并, 其中 Ri (xi,yi,ai,bi), Rj (xj,yj,aj,bj) 为两重叠的检测结果窗口, (xi,yi)、 (xj,yj) 分别为检测结果窗口的顶点, ai、 aj分别为检测 结果窗口的长, bi、 bj分别为检测结果窗口的宽, wi、 wj分别为对应的置信度。 0082 。

39、以上所述实施例仅表达了本发明的几种实施方式, 其描述较为具体和详细, 但并 不能因此而理解为对本发明专利范围的限制。应当指出的是, 对于本领域的普通技术人员 来说, 在不脱离本发明构思的前提下, 还可以做出若干变形和改进, 这些都属于本发明的保 护范围。因此, 本发明专利的保护范围应以所附权利要求为准。 说 明 书 CN 103914706 A 11 1/3 页 12 图 1 说 明 书 附 图 CN 103914706 A 12 2/3 页 13 图 2 说 明 书 附 图 CN 103914706 A 13 3/3 页 14 图 3 图 4 说 明 书 附 图 CN 103914706 A 14 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1