《运动目标检测与跟踪系统.pdf》由会员分享,可在线阅读,更多相关《运动目标检测与跟踪系统.pdf(65页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103903278 A (43)申请公布日 2014.07.02 CN 103903278 A (21)申请号 201210583625.6 (22)申请日 2012.12.28 G06T 7/20(2006.01) G06T 7/00(2006.01) (71)申请人 重庆凯泽科技有限公司 地址 400050 重庆市九龙坡区袁家岗兴隆湾 141-8-8 号 (72)发明人 屈景春 吴军 (54) 发明名称 运动目标检测与跟踪系统 (57) 摘要 本发明涉及一种运动目标检测与跟踪系统, a 背景提取 ; b 运动点团提取和背景更新 ; c.兴趣 区提取 ; d.运动点。
2、团的位置提取 ; e.运动跟踪。 本 发明的运动目标检测与跟踪系统, 背景提取采用 改进的基于均值的背景提取算法 ; 背景提取同时 提取兴趣区 ; 运动点团提取采用欧氏距离背景差 法 ; 阴影处理使用改进的基于 RGB 空间的阴影处 理算法 ; 运动点团位置提取采用改进的线段编码 算法 ; 运动跟踪采用基于预测的运动跟踪算法。 (51)Int.Cl. 权利要求书 1 页 说明书 29 页 附图 34 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书1页 说明书29页 附图34页 (10)申请公布号 CN 103903278 A CN 103903278 A 1/1 页。
3、 2 1. 一种运动目标检测与跟踪系统, 其特征具体步骤是 : a背景提取 :(1) 彩色图像的背景提取 ;(2) 灰度图像的背景提取 ;(3) 边缘图像的背 景提取 ; b运动点团提取和背景更新 :(1) 彩色图像的运动点团提取 ;(2) 阴影处理 ;(3) 灰度 图像的运动点团提取 ;(4) 边缘图像的运动点团提取 ;(5) 基于帧间差的运动点团提取和背 景更新 ; c. 兴趣区提取 :(1) 在背景提取阶段, 对按时间采样得到的图样样本, 统计每个像素 点前景和背景出现的次数得出兴趣区 ;(2) 道路繁忙度获取 ; d. 运动点团的位置提取 :(1) 数学形态学处理 ;(2) 轮廓追踪 。
4、;(3) 线段编码 ;(4) 改 进的线段编码 ;(5) 运动点团层运动跟踪, 使用改进的线段编码算法提取运动点团的位置 和大小之后, 进行运动点团层运动跟踪 ; e. 运动跟踪 :(1) 卡尔曼滤波 ;(2) 基于预测的运动跟踪 ;(3) 运动跟踪算法的计算复 杂性分析 ;(4) 基于边缘图像的运动跟踪 ;(5) 基于预测的运动跟踪算法在不同采样率下的 健壮性。 2. 根据权利要求 1 所述的运动目标检测与跟踪系统, 其特征是 : 所述的彩色图像的背 景提取包括基于均质的彩色图像背景提取、 改进的基于均值的彩色图像背景提取和基于中 值滤波的彩色背景图像提取。 权 利 要 求 书 CN 103。
5、903278 A 2 1/29 页 3 运动目标检测与跟踪系统 技术领域 0001 本发明涉及一种运动目标检测与跟踪系统。 背景技术 0002 在道路交通控制管理领域, 管理部门需要掌握道路上车辆的速度、 车辆的数量等 等数据以控制红绿灯平衡道路车流量、 对超速和闯红灯的车辆进行处罚。 早期, 人们一般采 用感应线圈的方式获得车辆的速度、 车辆的数量等数据。 这种方法, 需要在检测路段埋入感 应线圈, 这需要对道路施工, 会影响交通, 严重影响道路寿命, 并且感应线圈设备容易被重 型车辆压坏, 维护起来又要对道路施工, 非常麻烦。 0003 随着计算机技术的发展, 道路交通数据获取不再需要复杂。
6、的线圈设备了。只需在 检测路段固定摄像头, 摄像头拍摄的道路数字化视频压缩后通过传输线路 (如光纤) 传输 到监控中心, 监控中心的计算机采用数字图像处理的方法将道路交通的数据计算出来。与 早期的方法相比, 这种方法利用了软件算法通过计算机的强大计算能力得到我们需要的数 据, 而不是复杂的硬件设备 (如感应线圈) 对数据直接测量。这极大的增加了方便性和灵活 性。 如何让计算机从视频图像序列中获得道路交通数据, 例如车辆的速度等, 近年来很多人 对此展开了研究。 0004 从视频图像序列中获得运动物体的数据的方法除了能运用在道路交通外, 也能运 用于各种监控领域, 例如小区防盗、 银行监控等等,。
7、 用以检测和跟踪进入场景的人或物体, 应用范围非常广泛。 0005 在道路视频图像序列中获得车辆的速度, 可以使用简单的方法, 就是在图像中的 道路位置设置虚拟检测线, 模拟感应线圈, 根据虚拟检测线上的像素颜色的变化得到经过 虚拟检测线的车辆的速度, 同时也可以对经过虚拟检测线的车辆计数。这种方法有很大的 局限性。首先, 它需要人工标定虚拟检测线, 摄像头一旦换位置, 就需要重新设定一次虚拟 检测线, 很不方便 ; 其次, 它只能检测通过虚拟检测线的车辆, 而对图像其他区域的车辆一 无所知, 图像的大量信息丢失掉了。 发明内容 0006 本发明要解决的技术问题是 : 提供一种运动目标检测与跟。
8、踪系统。 0007 本发明解决其技术问题所采用的技术方案是 : 一种运动目标检测与跟踪系统, 其 具体步骤是 : a 背景提取 : 背景就是场景中静止不动的景物。 因为摄像机不动, 因此图像中的每个像 素点都有一个对应的背景值, 在一段时间内这个值比较固定。背景提取的目标就是根据视 频图像序列, 找出图像中每一点的背景值。 这是下一步运动点团提取的基础。 在运动点团提 取中, 背景提取这一步提取出来的背景图像将作为参考图像, 每一帧图像都要与背景图像 作差, 把背景去除, 以得到运动点团前景。因此, 这一步提取出的背景图像的好坏将直接影 响到之后每一帧的运动点团提取的质量。背景会随着时间的变化。
9、而发生变化, 例如光照变 说 明 书 CN 103903278 A 3 2/29 页 4 化导致背景亮度、 色度变化 ; 运动物体停止运动成为背景的一部分 ; 又如背景的一部分运 动起来成为运动前景等。 因此背景需要不断更新, 而背景的更新一般需要运动前景的信息, 即在没有运动前景的任何信息的情况下提取背景图像, 输入是视频图像序列, 每帧图像都 包括运动物体和静止景物, 输出是只含静止景物的背景图像。 (1) 彩色图像的背景提取 ; 原 始彩色图像的背景提取, 基本思想是, 图像中的某个像素按时间抽样, 其作为背景像素的时 间比作为运动前景的时间长, 即其作为背景的概率比作为前景的概率大, 。
10、而且背景和前景 在颜色上和亮度上都有很大不同。 这是因为, 对于固定场景, 运动物体在运动, 其转瞬即逝, 大多数时间我们看到的都是静止背景, 因此图像上某个像素点作为前景的时间相对作为背 景的时间短得多 ; 而且, 运动物体和静止背景在色彩上有明显区别, 人能轻易分辨出前景物 体, 即使在一张静止图像上 (2) 灰度图像的背景提取, 运动目标检测和跟踪可以不直接使用 原始彩色图像序列, 而使用灰度图像序列, 即将彩色视频图像序列转换成灰度图像序列, 然 后在灰度图像序列上提取背景, 以及之后提取运动点团、 运动跟踪等 ;(3) 边缘图像的背景 提取, 背景提取的目的是为了去除背景, 取得每一。
11、帧图像的运动前景。 而前景背景分离最重 要的信息是物体的边缘信息。 因此, 可以首先将每一帧原始图像做边缘提取, 得到边缘图像 序列, 然后提取边缘图像背景, 再提取运动前景、 做运动跟踪 ; b 运动点团提取和背景更新 : 运动点团提取也称背景去除、 背景抑制, 就是把每一帧的 非背景部分提取出来, 根据运动物体和场景中的静止背景在亮度、 色度上的不同, 将图像序 列的每一帧图像与背景图像作差, 然后二值化, 就可以得到每一帧的运动点团 : 图像中的一 个像素, 如果它与背景图像对应像素的距离大于一个阈值, 则认为它是前景, 输出 1, 否则为 背景, 输出 0。最后得到的二值图像就是运动点。
12、团图像, 阴影的处理是运动点团提取这一步 重要的一环。 阴影不应该作为前景的一部分, 然而阴影与背景有差别, 背景差法会把阴影归 到前景中去, 这样就会导致阴影将不同的运动物体连接成一个物体, 降低运动目标检测的 精确度。由于背景会随时间变化而改变, 需要对背景进行更新。背景更新有两种策略。第 一种策略是每隔一段时间使用背景提取算法重新提取背景, 将新背景取代旧背景 ; 第二种 策略是对每一帧在提取运动前景的同时更新背景,(1) 彩色图像的运动点团提取, 彩色图像 的基于背景差的运动点团提取, 根据前景与背景的颜色不同, 将原始彩色图像序列的每一 帧图像与彩色背景图像作差, 然后将结果图像二值。
13、化, 两帧彩色图像的差是指两帧中对应 像素矢量的距离。常用的矢量距离是欧氏距离和马氏距离 ;(2) 阴影处理, 阴影不是运动物 体的一部分, 但用背景差的方法提取运动点团会把阴影也作为运动前景, 这将导致不同的 前景物体被阴影连成一片, 严重影响运动目标检测与跟踪的精确度。 为了判断阴影, 可以将 提取出的运动前景像素点的某些属性和对应背景比较, 满足某些条件的就是阴影。有基于 RGB 空间的阴影处理和基于 HSI 间的阴影处理 ;(3) 灰度图像的运动点团提取 ;(4) 边缘图 像的运动点团提取 ;(5) 基于帧间差的运动点团提取和背景更新 ; c. 兴趣区提取 : 兴趣区是图像中有可能出现。
14、运动物体的区域。在背景提取阶段, 对 按时间采样得到的图像样本, 统计每个像素点前景和背景出现的次数, 就可以得到兴趣区, (1) 在背景提取阶段, 对按时间采样得到的图样样本, 统计每个像素点前景和背景出现的次 数得出兴趣区 ;(2) 道路繁忙度获取 ; d. 运动点团的位置提取, 运动点团图像是二值图像。在位置提取之前, 需要对其进行 数学形态学处理, 去除比较小的噪音点 :(1) 数学形态学处理, 运动点团图像是二值图像, 说 明 书 CN 103903278 A 4 3/29 页 5 黑色像素是背景点, 白色像素是前景点。图像中存在噪声, 即孤立的白像素和孤立的黑像 素。可以使用数学形。
15、态学的方法将二值图像中的孤立噪声点去除。数学形态学算法主要有 腐蚀、 膨胀、 开运算、 闭运算, 数学形态学处理与卷积类似, 输出图像的某个像素由输入图像 的对应像素及其领域像素依据结构元素决定 ;(2) 轮廓追踪, 首先, 找到轮廓上的第一点, 然后按顺时针或逆时针找轮廓上的下一个点, 不断重复找下去, 直到回到找到的第一个点 为止 ;(3) 线段编码, 线段编码算法通过逐行扫描获取运动点团的位置和大小。我们举例说 明这个算法 ;(4) 改进的线段编码 ;(5) 运动点团层运动跟踪。使用改进的线段编码算法提 取运动点团的位置和大小之后, 进行运动点团层运动跟踪 e. 运动跟踪 :(1) 卡尔。
16、曼滤波 ;(2) 基于预测的运动跟踪 ;(3) 运动跟踪算法的计算复 杂性分析 ;(4) 基于边缘图像的运动跟踪 ;(5) 基于预测的运动跟踪算法在不同采样率下的 健壮性。 0008 所述的彩色图像的背景提取包括基于均质的彩色图像背景提取、 改进的基于均值 的彩色图像背景提取和基于中值滤波的彩色背景图像提取。 0009 本发明的有益效果是 : 本发明的运动目标检测与跟踪系统, 背景提取采用改进的 基于均值的背景提取算法 ; 背景提取同时提取兴趣区 ; 运动点团提取采用欧氏距离背景差 法 ; 阴影处理使用改进的基于 RGB 空间的阴影处理算法 ; 运动点团位置提取采用改进的线 段编码算法 ; 运。
17、动跟踪采用基于预测的运动跟踪算法。 附图说明 0010 下面结合附图和实施例对本发明进一步说明。 0011 图 1 是本发明的结构框图 ; 图 2 是本发明的实验数据一基于均值的背景图像 ; 图 3 是本发明的实验数据二基于均值的背景图像 ; 图 4 是本发明的实验数据一改进的基于均值的背景图像 ; 图 5 是本发明的实验数据二改进的基于均值的背景图像 ; 图 6 是本发明的实验数据一基于中值滤波的背景图像 ; 图 7 是本发明的实验数据二基于中值滤波的背景图像 ; 图 8 是本发明的实验数据一基于共同区域的背景图像 ; 图 9 是本发明的实验数据二基于共同区域的背景图像 ; 图 10 是本发。
18、明的基于均值的背景提取方法的时间与采样率关系图 ; 图 11 是本发明的改进的基于均值的背景提取方法的时间与采样率关系图 ; 图 12 是本发明的基于中值滤波的背景提取方法的时间与采样率关系图 ; 图 13 是本发明是基于共同区域的背景提取方法的时间与采样率关系图 ; 图 14 是本发明的实验数据一所有 376 帧图像得到的标准图像 ; 图 15 是本发明的实验数据二所有 576 帧图像得到的标准图像 ; 图 16 是本发明的实验数据一不同提取背景的算法 PSNR 与处理时间关系图 ; 图 17 是本发明的实验数据一不同提取背景的算法 PSNR 与处理时间关系图 (局部) ; 图 18 是本发。
19、明的实验数据二不同提取背景的算法 PSNR 与处理时间关系图 ; 图 19 是本发明的实验数据二不同提取背景的算法 PSNR 与处理时间关系图 (局部) ; 说 明 书 CN 103903278 A 5 4/29 页 6 图 20 是本发明的灰度图像序列的基于均值的背景图像 ; 图 21 是本发明的灰度图像序列的改进的基于均值的背景图像 ; 图 22 是本发明的灰度图像序列的基于中值滤波的背景图像 ; 图 23 是本发明的灰度图像序列的基于共同区域的背景图像 ; 图 24 是本发明的 Color-Prewitt 边缘图像序列的基于均值的背景图像 ; 图 25 是本发明的 Color-Sobel。
20、 边缘图像序列的基于均值的背景图像 ; 图 26 是本发明的 Color-Prewitt 边缘图像序列的改进的基于均值的背景图像 ; 图 27 是本发明的 Color-Sobel 边缘图像序列的改进的基于均值的背景图像 ; 图 28 是本发明的基于马氏距离的运动点团提取结果的示意图 ; 图 29 是本发明的基于马氏距离的运动点团提取结果的示意图 ; 图 30 是本发明的基于马氏距离的运动点团提取结果的示意图 ; 图 31 是本发明的实验数据一的基于欧氏距离的运动点团提取实验结果的示意图 ; 图 32 是本发明的实验数据二的基于欧氏距离的运动点团提取实验结果的示意图 ; 图 33 是本发明的实验。
21、数据一的基于欧氏距离的运动点团提取实验结果的示意图 ; 图 34 是本发明的实验数据二的基于欧氏距离的运动点团提取实验结果的示意图 ; 图 35 是本发明的实验数据一的基于欧氏距离的运动点团提取实验结果的示意图 ; 图 36 是本发明的实验数据二的基于欧氏距离的运动点团提取实验结果的示意图 ; 图 37 是本发明的实验数据一基于 RGB 空间的阴影处理结果的示意图 ; 图 38 是本发明的实验数据二基于 RGB 空间的阴影处理结果的示意图 ; 图 39 是本发明的实验数据一改进的基于 RGB 空间的阴影处理结果的示意图 ; 图 40 是本发明的实验数据二改进的基于 RGB 空间的阴影处理结果的。
22、示意图 ; 图 41 是本发明的实验数据一基于 HSI 空间的阴影处理结果的示意图 ; 图 42 是本发明的实验数据二基于 HSI 空间的阴影处理结果的示意图 ; 图 43 是本发明的实验数据一的灰度图像序列运动点团提取结果的示意图 ; 图 44 是本发明的实验数据二的灰度图像序列运动点团提取结果的示意图 ; 图 45 是本发明的基于灰度图像的运动点团图像与参考图像差别随阈值变化关系图 ; 图 46 是本发明的实验数据一的 Color-Prewitt 边缘图像序列运动点团提取结果的示 意图 ; 图 47 是本发明的实验数据一的 Color-Sobel 边缘图像序列运动点团提取结果的示意 图 ;。
23、 图 48 是本发明的实验数据一基于帧间差的运动点团提取结果的示意图 ; 图 49 是本发明的实验数据一的背景统计灰度图 ; 图 50 是本发明的兴趣区示意图 ; 图 51 是本发明的实验数据一的运动点团图开运算结果的示意图 ; 图 52 是本发明的实验数据一的 Color-Sobel 边缘运动点团图开运算结果的示意图 ; 图 53 是本发明的实验数据一运动点团层跟踪结果的示意图 ; 图 54 是本发明的卡尔曼滤波器的结构的示意图 ; 图 55 是本发明的物体位置预测示意图 ; 图 56 是本发明的实验数据一基于预测的运动跟踪结果的示意图 ; 说 明 书 CN 103903278 A 6 5/。
24、29 页 7 图 57 是本发明的实验数据二基于预测的运动跟踪结果的示意图 ; 图 58 是本发明的实验数据一基于 Color-Prewitt 边缘图像的运动跟踪结果的示意 图 ; 图 59 是本发明的实验数据一基于 Color-Sobel 边缘图像的运动跟踪结果的示意图 ; 图 60 是本发明的实验数据一在 15 帧 / 秒采样率下运动跟踪结果的示意图 ; 图 61 是本发明的实验数据一在 10 帧 / 秒采样率下运动跟踪结果的示意图 ; 图 62 是本发明的实验数据一在 5 帧 / 秒采样率下运动跟踪结果的示意图 ; 图 63 是本发明的实验数据二在 15 帧 / 秒采样率下运动跟踪结果的。
25、示意图 ; 图 64 是本发明的实验数据二在 10 帧 / 秒采样率下运动跟踪结果的示意图 ; 图 65 是本发明的实验数据二在 5 帧 / 秒采样率下运动跟踪结果的示意图 ; 图 66 是本发明的实验数据一运动跟踪的最终结果的示意图 ; 图 67 是本发明的实验数据二运动跟踪的最终结果的示意图。 图 68 是本发明的实验数据一的运动点团图线段编码算法结果的示意图。 具体实施方式 0012 现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图, 仅以 示意方式说明本发明的基本结构, 因此其仅显示与本发明有关的构成。 0013 如图 1 所示的运动目标检测与跟踪系统, 其具体步骤是 。
26、a背景提取 :(1) 彩色图像的背景提取 : 1. 基于均值的彩色图像背景提取 : 这是背景提取的最简单的方法。因为视频中的某个 像素对时间采样, 背景出现的次数比前景多, 因此, 将一定的时间段中的视频序列采样, 比 如2.5帧/秒, , 对每一个像素, 将这一段时间中的所有图像帧取平均, 那么这个平均值会接 近背景, 背景出现的次数比前景越多, 则这个平均值就越接近背景。前面已经说过, 运动前 景是转瞬即逝的。就以这个平均值作为这个像素的背景值。同时, 求取平均值还可以在一 定程度上抑制噪声。具体算法如下 : 1) 在某时间段采样得到 N 个图像帧 Fi, i=1,2N ; 2) 对每一个。
27、像素点 (x,y), 背景 设图像的总像素数为 M, 对每一个像素都要遍历 N 个图像帧, 因此这个算法的时间复杂 度是 O(MN), 2.5 帧 / 秒采样 10 秒得到的背景如图 2, 2.5 帧 / 秒采样 10 秒得到的背景如图 3 ; 2. 改进的基于均值的彩色图像背景提取 : 根据背景出现的次数比前景多, 且前景颜色 和背景不同, 可以知道, 对于某个像素点, 其对时间的采样点在彩色 RGB 空间中会以背景点 为中心点聚集在一起, 而前景点会离中心点比较远。 可以认为, 像素颜色矢量的一个分量离 中心点的距离超过这个分量的标准差的点不大可能是背景, 即使是背景, 也叠加了比较大 的。
28、噪声。标准差计算公式为, c=r,g,b 表示矢量的红、 绿、 蓝三 种颜色分量, X0是样本的平均值。因此, 可以对基于均值的彩色图像背景提取算法做改进 : 说 明 书 CN 103903278 A 7 6/29 页 8 在求平均值之后求标准差, 然后把与均值大于标准差的采样点去除, 最后再求余下的点的 平均值, 把此值作为背景值。改进的算法如下 : 1) 在某时间段采样得到 N 个图像帧 Fi, i=1,2N ; 2) 对每一个像素点 (x,y) : a) 求中心点; b) 求标准差, c=r,g,b ; c) 求集合中所有元素 的平均值, 这个值就是所求背景 B(x,y)。 0014 设。
29、图像的总像素数为M, 则对每一个像素都要遍历3次N个图像帧求中心点一 次, 求标准差一次, 最后再求均值一次, 因此这个算法的时间复杂度是 O(3MN)=O(MN), 比原 来的单纯求平均值的算法费时。实验数据一 2.5 帧 / 秒采样 10 秒得到的背景如图 4 ; 实验 数据二 2.5 帧 / 秒采样 10 秒得到的背景如图 5。可以看到, 此方法得到的背景图像比单纯 求平均值的算法好, 单纯求平均值的方法得到的背景图像留有不少运动前景的痕迹, 而此 改进算法得到的背景图像中运动前景痕迹就少多了。 0015 2. 基于中值滤波的彩色背景图像提取 : 中值滤波器能有效的去除图像的噪声, 因 。
30、为噪声点的灰度与非噪声点差别大, 而且图像有空间局部性, 也就是说, 对于没有被噪声污 染的图像, 里面的每一个像素和它相邻的像素的灰度差别不大。我们将这个像素和它相邻 的像素排序, 噪声点将被排到两边, 排在中间的像素就是没被噪声污染的像素, 把它作为滤 波结果。这就是中值滤波器能有效去除图像噪声的原因。 0016 上面说的是灰度图像的中值滤波, 彩色图像一般使用 RGB 空间表示, 每个像素点 是一三维矢量, 各个分量分别代表红、 绿、 蓝三个颜色的灰度。可以分别将这三种颜色的灰 度图做中值滤波, 然后合成。然而这种方法将导致滤波后一个像素的三个分量来自不同的 像素点, 合成后的颜色不可避。
31、免的被扭曲。 可以采取另外一种方法。 考虑到噪声点的颜色与 非噪声点差别大, 在滤波时的排序中排到两边, 可以将彩色图像转换成灰度图像, 在转换后 的灰度图像中噪声点和非噪声点也会有较大的差别, 排序后, 取排在中间的像素对应的原 始彩色图像的像素矢量作为滤波结果。 这样滤波结果的每一个像素都是原始彩色图像中真 实存在的像素, 避免了同一个像素的三个颜色分量来源于不同的像素导致的颜色扭曲。将 中值滤波扩展到彩色图像的算法如下 : 将彩色图像转换成灰度图像, 遍历灰度图像的每一个像素, 将它和与它相邻的八个像 素的灰度排序, 取排在中间的像素对应的原始彩色图像的像素矢量作为输出图像的这个像 素。。
32、 0017 中值滤波是对单幅图像在空间采样点上的滤波, 不能直接用于背景提取。对于背 景提取, 我们需要将此算法扩展。视频中的某个像素对时间采样, 背景出现的次数比前景 多, 可以认为前景是 “噪声” , 这样我们就可以对一个像素在时间上采样得到的样本进行滤 波对它们排序, 噪声将排在两边, 即前景排在两边, 排在中部的是背景, 取排在中间的 说 明 书 CN 103903278 A 8 7/29 页 9 像素作为背景结果。 我们处理的是彩色图像序列, 因此如前所述, 将彩色图像转换成灰度图 像, 然后在滤波的排序后, 选择排在中间的像素对应的原始彩色图像的像素矢量作为滤波 结果。具体算法如下。
33、 : 1) 在某时间段采样得到 N 个图像帧 Fi, i=1,2N ; 2) 对每一个像素点 (x,y): a) 将彩色像素矢量 Fi(x,y) 转换成灰度 Gi(x,y), i=1,2N; b) 将集合 Gi(x,y)|i=1,2N 中的元素排序 ; c) 设排在中间的是 Gk(x,y), 则像素矢量 Fk(x,y) 作为滤波结果。 0018 对 n 个元素排序的时间复杂度是 O(nlogn) 或者 O(n2), 取决于算法, 其不是线性 的, 随着 n 的增大迅速增大。设图像的像素数是 M, 对每个像素都要对采样的 N 个样本进行 排序, 因此此算法的时间复杂度是 O(MNlogN) 或者。
34、 O(MN2), 是比较耗时的算法。 0019 实验数据一 2.5 帧 / 秒采样 10 秒得到的背景如图 6, 实验数据二 2.5 帧 / 秒采样 10 秒得到的背景如图 7 ; 3. 基于共同区域的彩色图像背景提取 : 在一个像素的所有随时间采样的样本中, 在求 均值之前, 如果能去除不大可能是背景的样本, 那么求出来的平均值会更加接近背景。 像素 在图像对中的差别用像素矢量 (彩色图像, 像素是RGB空间的矢量) 的欧氏距离来量度, 如果 其大于一阈值, 则认为差别大, 否则认为差别小。 这个阈值可以和第四章运动点团前景提取 的二值化阈值相同, 因为它们的内涵都是前景和背景差别的量度。这。
35、个阈值如何确定将在 第四章详细讲述。另外, 考虑阈值的极端情况, 如果这个阈值很小, 任何像素在图像对中的 差别都大于这个阈值, 则找不到任何共同区域, 这时每一个像素的背景都是单纯用所有采 样图像帧的平均值得到 ; 如果这个阈值很大, 任何像素在图像对中的差别都小于这个阈值, 则每个图像对中的所有像素都是共同区域, 这时每一个像素的背景也是由所有采样图像帧 的均值得到。 在这两种极端情况下, 基于均值的图像背景提取算法, 所以基于均值的图像背 景提取算法是基于共同区域的图像背景提取算法的特殊情况。详细算法如下 : 1) 在某时间段采样得到 N 个图像帧 Fi, i=1,2N ; 2) 对每一。
36、个像素点 (x,y): a) 集合 A= ; b) 对每一个图像对 Fi(x,y) 和 Fi+N/2(x,y), i=1,2N/2 如果, 则将 Fi(x,y) 和 Fi+N/2(x,y) 加入集合 A, 其中 Ta是阈值 ; c) 计算集合 A 中所有元素的均值作为像素点 (x,y) 的背景值。 0020 设图像的总像素数为 M, 则对每一个像素都要遍历 2 次 N 个图像帧产生集合 A 的点一次, 求平均值一次, 因此这个算法的时间复杂度是 O(2MN)=O(MN)。 0021 实验数据一 2.5 帧 / 秒采样 10 秒得到的背景如图 8 ; 实验数据二 2.5 帧 / 秒采样 10 秒。
37、得到的背景如图 9。从图中可以看到, 提取出的背景并不平滑, 这是因为每个像素计算 均值的集合的大小不一样所致。此算法每个像素计算均值的集合 (即上述集合 A) 的大小的 变化范围要比改进的基于均值的方法大得多, 这导致了其提取出的背景图像在这几种方法 中最不平滑。 说 明 书 CN 103903278 A 9 8/29 页 10 0022 4. 彩色图像背景提取的实验分析 : 实验采用 10 秒道路交通视频数据, 在上面做均 匀采样, 例如采样率是1帧/秒 (1f/s) , 就是每秒取1帧, 总共在10秒中均匀取10帧 ; 采样 率 5 帧 / 秒 (5f/s) , 就是每秒取 5 帧, 总。
38、共在 10 秒中均匀取 50 帧。实验在赛扬 1.0G CPU、 384 兆内存的计算机上进行。表一是前述四种方法在不同采样率下处理完毕实际所需的时 间, 只包括处理时间, 不包括图像序列读取和背景图像输出的时间。 不同采样率意味着处理 的总图像数不同, 采样率与时间 (这里 10 秒) 之积就是总图像数。采样率越高, 处理的时间 越长, 见表一。 0023 我们可以由表一作出不同算法处理时间与采样率的关系图。 基于均值的背景提取 方法的时间与采样率关系图见图 10 ; 改进的基于均值的背景提取方法的时间与采样率关 系图见图 11 ; 基于中值滤波的背景提取方法的时间与采样率关系图见图 12 。
39、; 基于共同区域 的背景提取方法的时间与采样率关系图见图 13。 0024 从表一和图10至图13可以看到, 背景提取所需时间随采样率的增加而增加 ; 除了 基于中值滤波的背景提取方法外, 其他方法处理时间随采样率增加线性增加 ; 而基于中值 滤波的背景提取方法, 处理时间随采样率增加显著增长 ; 基于均值的背景提取方法和基于 共同区域的背景提取方法所需时间差别不大 ; 改进的基于均值的背景提取方法比基于均值 和基于共同区域的方法需要时间多。这个和前面每种方法的时间复杂度分析是一致的。 0025 为了比较不同算法求得的背景图像的效果, 需要获得标准背景作为比较标准。这 是因为此算法根据标准差先。
40、将不大可能是背景的像素去除了, 比单纯用平均值准确, 同时 在一定程度上抑制了噪声, 并且由于使用了尽可能多的图像, 比只使用 10 秒的图像有更多 信息。实验数据一所有 376 帧图像得到的标准图像见图 14 ; 实验数据二所有 576 帧图像得 到的标准图像见图 15。 0026 确定了标准图像后, 考虑比较标准。越接近标准图像的背景图像越好。如何比较 两幅图像是否接近?我们使用峰值信噪比 PSNR 来衡量图像的接近程度。峰值信噪比的计 算公式如下 : 其中, 对数中分子的 255 表示像素灰度最大的差值, 在 256 级灰度中, 这个最大差值是 255(255-0=255) ; 对数中分。
41、母的 M 是图像的像素总数, F1(i)、 F2(i) 表示两幅图像中的某个 像素, 整个分母表示两幅图像的所有对应像素的差的平方的平均值, 如果是彩色图像,“对 应像素的差的平方” 用对应像素矢量的分量的差的平方和除以 3 计算。 0027 可以看到, 当两幅图像越接近, 对数中的分母就越小, 峰值信噪比就越大 ; 当两幅 图像差别越大, 对数中的分母就越大, 峰值信噪比就越小。 极端情况, 当两幅图像一样时, 峰 值信噪比为无穷大 ; 两幅图像差别最大时, 峰值信噪比为 0。我们就以峰值信噪比衡量两幅 说 明 书 CN 103903278 A 10 9/29 页 11 图像的相近程度, 峰。
42、值信噪比越大, 图像越接近。 0028 实验数据一不同方法在不同采样率下得到的背景的图像与标准背景图像比较的 PSNR 见表二。 采样率 (f/s)122.556.2512.525 基于均值34.8337.0537.2537.4237.4037.6537.62 改进的基于均值36.2640.6540.7540.8240.8241.4141.36 基于中值滤波35.1937.5337.7137.8037.6137.8337.76 基于共同区域34.5838.1038.3339.0539.1439.9540.01 表二 实验数据一不同方法得到的背景与标准背景图像比较的 PSNR 比较同一采样率下不。
43、同方法的 PSNR 不能说明问题, 因为同一采样率下不同方法需要 的实际处理时间不相同。在处理时间一定的情况下, PSNR 越大的方法越好。因此, 结合表 二和表一, 得到不同方法的 PSNR 随处理时间变化关系图。实验数据一不同方法的 PSNR 随 处理时间变化关系图如图 16。将图十九中横坐标 0, 10 区间部分作局部放大, 得到图 17。 实验数据二不同方法在不同采样率下得到的背景的图像与标准背景图像比较的 PSNR 见表 三。 采样率 (f/s)122.556.2512.525 基于均值24.0524.6324.7624.8824.8824.9524.94 改进的基于均值27.772。
44、9.1329.4329.8329.8629.9730.01 基于中值滤波26.3928.2828.7229.2329.2429.4029.47 基于共同区域25.1026.2526.4927.0727.1428.0228.16 0029 表三 实验数据二不同方法得到的背景与标准背景图像比较的 PSNR 实验数据二不同方法的 PSNR 随处理时间变化关系图, 如图 18。将图二十一中横坐标 0, 10 区间部分作局部放大, 得到图 19。 0030 从图 17 和图 19 这两组实验数据的结果中, 我们可以得到以下结论 : 、 并不是采样率越高 (处理时间越长) , PSNR 就越高。不同的方法。
45、在 4 秒之后, 尽管采 样率不同, 但 PSNR 值都基本不变了。这是因为不同的图像帧区别只在于运动前景不同, 背 景是相同的, 因此不同图像帧之间存在着信息冗余, 增加采样率, 只会增加处理时间, 不会 增加 PSNR, 也即不会提高背景提取的质量。也就是说, 在背景提取的时候, 我们不需要很高 的采样率即可得到不错的背景图像。 0031 、 基于均值的算法是效果最差的算法, 因为其只是简单的平均, 没有做更多的处 理。 0032 、 共同区域法需要更高的采样率才能得到好效果。这是因为要找到更多的共同 区域, 就需要更高的采样率。 从提取出来的背景图像的人眼视觉效果来说, 基于共同区域的 。
46、算法的背景图像最不平滑。 0033 、 基于中值滤波的背景提取算法, 只是取排序中位于中间的元素作输出, 舍弃掉 了其他元素, 没有充分利用其他元素的信息, 并且排序比较耗时, 因此基于中值滤波的背景 提取算法不是很好的算法。 0034 、 效果最好的算法是改进的基于均值的背景提取算法。 0035 综上所述, 对于10秒的视频图像序列, 采用每秒2帧的采样率, 使用改进的基于均 值的背景提取算法, 不到 4 秒就可以得到优秀的背景图像。而背景提取对实时性本来要求 就不高, 不需要像物体运动跟踪那样对所有输入帧都进行处理, 这种方法完全能达到应用 的要求。 说 明 书 CN 103903278 。
47、A 11 10/29 页 12 0036 (2) 灰度图像的背景提取 ; 运动目标检测和跟踪可以不直接使用原始彩色图像序 列, 而使用灰度图像序列, 即将彩色视频图像序列转换成灰度图像序列, 然后在灰度图像序 列上提取背景, 以及之后提取运动点团、 运动跟踪等。 0037 1. 彩色图像转换成灰度图像 : 彩色图像每个像素点在 RGB 空间中是一个三维矢 量, 每个分量分别代表红、 绿、 蓝三种颜色的灰度。最简单的将彩色图像转换成灰度图像的 方法是将这三个分量取平均值。但是这种方法和人眼视觉感知不符。人眼感知红、 绿、 蓝三 种颜色的权重是不一样的。JPEG 图像压缩格式采用的是 YUV 空间。
48、, YUV 空间是 RGB 空间的 线性变换。转换公式是 : R、 G、 B 分别表示红、 绿、 蓝三种颜色分量的灰度值。Y 分量表示图像的亮度, 这是符合人 眼对颜色感知的。我们就以 Y 分量作为图像像素的灰度。将彩色像素转换为灰度像素的公 式为 将彩色图像转换为灰度图像的算法如下 : 遍历彩色图像的每一个像素矢量, 设矢量的红、 绿、 蓝三色分量值为 R、 G、 B, 则输出的灰 度图像的对应像素的值为 0.299R+0.587G+0.114B。 0038 2. 灰度图像的背景提取 : 前面所述的所有彩色图像背景提取的算法都能用在灰 度图像的背景提取上, 只要在计算距离的时候将矢量的欧氏距。
49、离改为标量差的绝对值即 可。 0039 图 20 至图 23 分别是实验数据一的灰度图像序列的基于均值的背景提取、 改进的 基于均值的背景提取、 基于中值滤波的背景提取和基于共同区域的背景提取结果。 0040 (3) 边缘图像的背景提取 : 背景提取的目的是为了去除背景, 取得每一帧图像的运 动前景。而前景背景分离最重要的信息是物体的边缘信息。因此, 可以首先将每一帧原始 图像做边缘提取, 得到边缘图像序列, 然后提取边缘图像背景, 再提取运动前景、 做运动跟 踪 ; 1. 彩色图像的边缘提取 : 对灰度图像, 边缘提取就是求每个像素的梯度, 以梯度大小 作为边缘的量度。用 x、 y 两个方向的离散偏微分算子边缘检测算子对图像做卷积, 就 得到这两个方向上的梯度, 以这两个方向的量为分量的矢量就是这个像素的梯度矢量, 这 个矢量长度的大小就是这个像素的边缘值。设 f(x,y) 是离散灰度图像, g(x,y) 是卷积核, f 和 g 的卷积是 如果卷积核是的矩阵, 则此卷积运算的时间复杂度是 O(9M), M 是图像的像素总数。 常用的。