《用于改进的多模式背景去除的模式移除.pdf》由会员分享,可在线阅读,更多相关《用于改进的多模式背景去除的模式移除.pdf(31页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102917159 A (43)申请公布日 2013.02.06 C N 1 0 2 9 1 7 1 5 9 A *CN102917159A* (21)申请号 201210214482.1 (22)申请日 2012.06.26 2011203219 2011.06.30 AU H04N 5/14(2006.01) (71)申请人佳能株式会社 地址日本东京 (72)发明人 PJ帕库洛斯基 AK谷帕塔 (74)专利代理机构中国国际贸易促进委员会专 利商标事务所 11038 代理人魏小薇 (54) 发明名称 用于改进的多模式背景去除的模式移除 (57) 摘要 用于改进的多模。
2、式背景去除的模式移除。一 种用于更新与场景相关联的场景模型(230)的视 觉元素模型(240)的方法和系统,该视觉元素模 型(240)包括用于场景的位置的视觉元素的模式 模型(260,270)的集合。该方法接收图像序列的 帧(210)的输入视觉元素(220),对于每个模式模 型(260,270),通过比较输入视觉元素(220)的外 观与相应模式模型(260,270)的视觉特性的集合 而将相应模式模型(260,270)分类为匹配模式模 型或疏远模式模型。该方法基于匹配模式模型的 超过成熟度阈值的第一时间特性以及疏远模式模 型的小于稳定性阈值的第二时间特性而从视觉元 素模型(240)中移除疏远模式。
3、模型。 (30)优先权数据 (51)Int.Cl. 权利要求书4页 说明书16页 附图10页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 4 页 说明书 16 页 附图 10 页 1/4页 2 1.一种更新与图像序列相关联的场景模型的视觉元素模型的方法,所述视觉元素模型 包括在所述场景模型的预定位置的模式模型的集合,所述方法包括以下步骤: 接收在所述图像序列的当前帧的所述预定位置的输入视觉元素; 确定在所述预定位置的前景匹配之后所述输入视觉元素匹配在所述场景模型中的所 述预定位置的背景模型;以及 基于所述确定步骤,删除在所述前景匹配中使用的至少一个前景模型,在所述背。
4、景模 型之后创建的所述前景模型在所述预定位置先前被匹配过。 2.一种更新与图像序列中捕获的场景相关联的场景模型的视觉元素模型的方法,所述 视觉元素模型包括用于与所述场景的位置相对应的视觉元素的模式模型的集合,所述方法 包括以下步骤: 接收所述图像序列的当前帧的输入视觉元素; 对于所述视觉元素模型中的每个模式模型,取决于所述输入视觉元素的外观与相应模 式模型的视觉特性的集合之间的比较,将相应模式模型分类为匹配模式模型和疏远模式模 型中的一个;以及 基于匹配模式模型的超过成熟度阈值的第一时间特性以及疏远模式模型的小于稳定 性阈值的第二时间特性而从所述视觉元素模型中移除该疏远模式模型。 3.如权利要。
5、求2所述的方法,其中,如果满足以下标准中的至少一个,则所述匹配模式 模型的所述第一时间特性超过所述成熟度阈值: (a)所述匹配模式模型的创建时间大于预定阈值; (b)所述匹配模式模型被分类为背景;以及 (c)所述匹配模式模型已经被匹配至少预定次数。 4.如权利要求2所述的方法,其中,如果满足以下标准中的至少一个,则所述疏远模式 模型的所述第二时间特性小于所述稳定性阈值: (a)所述疏远模式模型不超过所述成熟度阈值; (b)所述疏远模式模型的创建时间小于预定阈值; (c)所述疏远模式模型被分类为前景;以及 (d)所述疏远模式模型已经被匹配小于预定次数。 5.如权利要求2所述的方法,其中,所述成熟。
6、度阈值和所述稳定性阈值彼此相关,如果 一对匹配模式模型和疏远模式模型的期满时间相差大于阈值量,则该对匹配模式模型和疏 远模式模型被看作分别大于成熟度阈值和小于稳定性阈值。 6.如权利要求2所述的方法,其中,所述成熟度阈值和所述稳定性阈值彼此相关,如果 与所述匹配模式模型相比另一模式模型已经被匹配大于给定次数,则所述匹配模式模型被 看作大于成熟度阈值。 7.如权利要求2所述的方法,其中,所述成熟度阈值和所述稳定性阈值彼此相关,如果 在相同视觉元素处根据与所述匹配模式模型有关的以上标准的组合的第一计算分数大于 根据与所述疏远模式模型有关的以上标准的组合的第二计算分数,则所述匹配模式模型被 看作大于。
7、成熟度阈值。 8.一种计算机可读非易失性存储介质,在该存储介质上记录有用于命令处理器执行更 新与图像序列相关联的场景模型的视觉元素模型的方法的计算机程序,所述视觉元素模型 权 利 要 求 书CN 102917159 A 2/4页 3 包括在所述场景模型的预定位置的模式模型的集合,所述计算机程序包括用于执行以下步 骤的代码: 接收在所述图像序列的当前帧的所述预定位置的输入视觉元素; 确定在所述预定位置的前景匹配之后所述输入视觉元素匹配在所述场景模型中的所 述预定位置的背景模型;以及 基于所述确定步骤,删除在所述前景匹配中使用的至少一个前景模型,在所述背景模 型之后创建的所述前景模型在所述预定位置。
8、先前被匹配过。 9.一种计算机可读非易失性存储介质,在该存储介质上记录有用于命令处理器执行更 新与在图像序列中捕获的场景相关联的场景模型的视觉元素模型的方法的计算机程序,所 述视觉元素模型包括用于与所述场景的位置相对应的视觉元素的模式模型的集合,所述计 算机程序包括用于执行以下步骤的代码: 接收所述图像序列的当前帧的输入视觉元素; 对于所述视觉元素模型中的每个模式模型,取决于所述输入视觉元素的外观与相应模 式模型的视觉特性的集合之间的比较,将相应模式模型分类为匹配模式模型和疏远模式模 型中的一个;以及 基于匹配模式模型的超过成熟度阈值的第一时间特性以及疏远模式模型的小于稳定 性阈值的第二时间特。
9、性而从所述视觉元素模型中移除该疏远模式模型。 10.一种用于捕获图像序列的相机系统,所述相机系统包括: 透镜系统; 传感器; 存储设备,用于存储计算机程序; 控制模块,耦合到所述透镜系统和所述传感器中的每一个以捕获所述图像序列;以及 处理器,用于执行程序,所述程序包括: 用于接收在所述图像序列的当前帧的预定位置的输入视觉元素的计算机程序代码; 用于确定在所述预定位置的前景匹配之后所述输入视觉元素匹配在所述场景模型中 的所述预定位置的背景模型的计算机程序代码;以及 用于基于所述确定步骤删除在所述前景匹配中使用的至少一个前景模型的计算机程 序代码,在所述背景模型之后创建的所述前景模型在所述预定位置。
10、先前被匹配过。 11.一种用于捕获图像序列的相机系统,所述相机系统包括: 透镜系统; 传感器; 存储设备,用于存储计算机程序; 控制模块,耦合到所述透镜系统和所述传感器中的每一个以捕获所述图像序列;以及 处理器,用于执行程序,所述程序包括: 用于更新与图像序列中捕获的场景相关联的场景模型的视觉元素模型的计算机程序 代码,所述视觉元素模型包括用于与所述场景的位置相对应的视觉元素的模式模型的集 合,所述更新包括以下步骤: 接收所述图像序列的当前帧的输入视觉元素; 对于所述视觉元素模型中的每个模式模型,取决于所述输入视觉元素的外观与相应模 权 利 要 求 书CN 102917159 A 3/4页 4。
11、 式模型的视觉特性的集合之间的比较,将相应模式模型分类为匹配模式模型和疏远模式模 型中的一个;以及 基于匹配模式模型的超过成熟度阈值的第一时间特性以及疏远模式模型的小于稳定 性阈值的第二时间特性而从所述视觉元素模型中移除该疏远模式模型。 12.一种通过利用与场景相关联的场景模型来执行所述场景的视频监控的方法,所述 场景模型包括多个视觉元素,其中,每个视觉元素与包括模式模型的集合的视觉元素模型 相关联,所述方法包括以下步骤: 通过以下步骤来更新所述场景模型的视觉元素模型: 接收所述图像序列的当前帧的输入视觉元素; 对于所述视觉元素模型中的每个模式模型,取决于所述输入视觉元素的外观与相应模 式模型。
12、的视觉特性的集合之间的比较,将相应模式模型分类为匹配模式模型和疏远模式模 型中的一个;以及 基于匹配模式模型的超过成熟度阈值的第一时间特性以及疏远模式模型的小于稳定 性阈值的第二时间特性而从所述视觉元素模型中移除该疏远模式模型。 13.一种更新与图像序列中捕获的场景相关联的场景模型的视觉元素模型的方法,所 述视觉元素模型包括用于与所述场景的位置相对应的视觉元素的多个模式模型,每个模式 模型与期满时间相关联,所述方法包括以下步骤: 接收所述图像序列的当前视频帧的输入视觉元素; 对于所述视觉元素模型中的每个模式模型,基于所述输入视觉元素的视觉特性与相应 模式模型的视觉特性之间的比较,将相应模式模型。
13、分类为匹配模式模型和疏远模式模型中 的一个;以及 取决于识别具有超过成熟度阈值的第一时间特性的匹配模式模型和识别具有不超过 稳定性阈值的第二时间特性的疏远模式模型而减少识别出的疏远模式模型的期满时间,以 更新所述视觉元素模型。 14.如权利要求13所述的方法,其中,如果满足以下中的至少一个,则所述匹配模式模 型的所述第一时间特性超过所述成熟度阈值: (a)所述匹配模式模型的创建时间大于期满阈值; (b)所述匹配模式模型被分类为背景;以及 (c)所述匹配模式模型已经匹配至少预定次数。 15.如权利要求13和14中任一项所述的方法,其中,如果满足以下中的至少一个,则所 述疏远模式模型的所述第二时间。
14、特性小于所述稳定性阈值: (a)所述匹配模式模型不超过所述成熟度阈值; (b)所述匹配模式模型的创建时间小于期满阈值; (c)所述匹配模式模型被分类为前景;以及 (d)所述匹配模式模型已经匹配小于预定次数。 16.如权利要求13所述的方法,其中,所述成熟度阈值和所述稳定性阈值彼此相关,如 果一对匹配模式模型和疏远模式模型的期满时间相差大于阈值量,则该对匹配模式模型和 疏远模式模型被看作分别大于成熟度阈值和小于稳定性阈值。 17.如权利要求13所述的方法,其中,所述成熟度阈值和所述稳定性阈值彼此相关,如 权 利 要 求 书CN 102917159 A 4/4页 5 果与所述匹配模式模型相比另一模。
15、式模型已经被匹配大于给定次数,则所述匹配模式模型 被看作大于成熟度阈值。 18.如权利要求13所述的方法,其中,所述成熟度阈值和所述稳定性阈值彼此相关,如 果在相同视觉元素处根据以上测试的某种组合的计算分数大于根据与另一模式模型有关 的以上测试的某种组合的计算分数,则所述匹配模式模型被看作大于成熟度阈值。 权 利 要 求 书CN 102917159 A 1/16页 6 用于改进的多模式背景去除的模式移除 技术领域 0001 本公开涉及用于图像中的前景检测的背景去除,具体地说,涉及用于图像序列的 多外观背景模型的维持。 背景技术 0002 视频是图像的序列,其也可以被称为视频序列或图像序列。图像。
16、也被称为帧。术 语“帧”和“图像”在整个说明书中互换地使用,以描述图像序列中的单个图像。图像由视 觉元素(例如像素)构成,或者由88DCT(离散余弦变换)块构成,如JPEG图像中使用的那 样。 0003 场景建模,又称为背景建模,涉及基于对场景进行描述的图像序列来对场景的视 觉内容进行建模。场景建模允许视频分析系统通过背景差异化操作来在瞬变前景对象与非 瞬变背景之间进行区分。 0004 一种用于场景建模的方法使用视觉元素模型中的周全考虑(discreet)数量的模 式模型来表示场景中的每个位置,其中,每个模式模型具有外观。也就是说,场景中的每个 位置与和场景关联的场景模型中的视觉元素模型相关联。
17、。每个视觉元素模型包括模式模型 的集合。在基本情况下,模式模型的集合包括一个模式模型。在多模式实现的情况下,模式 模型的集合包括至少一个模式模型,并且可以包括多个模式模型。场景中的每个位置与输 入视频帧中的每一个中的视觉元素对应。在一些现有技术中,视觉元素是像素值。在其它 技术中,视觉元素是DCT(离散余弦变换)块。来自视频帧的每个输入视觉元素在场景模型 中的对应位置处针对对应视觉元素模型中的模式模型的集合进行匹配。如果输入视觉元素 与现有模式模型足够相似,则输入视觉元素被看作是对于现有模式模型的匹配。如果没发 现匹配,则创建新的模式模型以表示输入视觉元素。在一些技术中,如果视觉元素匹配于视 。
18、觉元素模型中的现有模式模型,则视觉元素被看作背景,否则是前景。在其它技术中,作为 前景或背景的视觉元素的状态取决于视觉元素所匹配的模式模型的属性。这样的属性可以 包括例如视觉元素模型的“年龄(age)”。 0005 因为多模式模型技术可以表示并且补偿循环往复(recurring)外观(例如门正打 开以及门正关闭或在红色、绿色与关闭之间循环的状态灯),所以多模式模型技术相对于单 模式模型系统具有明显优点。如上所述,多视觉元素模型技术存储每个视觉元素模型中的 模式模型的集合。然后对输入视觉元素模型与和输入视觉元素的位置相对应的视觉元素模 型中的每个模式模型进行比较。 0006 然而,多视觉元素模型。
19、方法的特定难度是过度建模(over-modelling)。随着时间 过去,在相同视觉元素位置处创建越来越多的模式模型,直到任何输入视觉元素被识别并 且看作背景,这是因为先前已经在相同位置看见了相似的外观。作为存储总是增加数量的 模式模型的结果,处理时间增加,并且存储器需求增大。更重要的是,即使一些视觉元素与 视频中的新的先前未看见的对象相对应但具有与历史中的任何其它先前可见对象相似的 视觉外观,这些视觉元素也被看作背景。 说 明 书CN 102917159 A 2/16页 7 0007 一种用于克服这个困难的方法是,将用于场景的给定视觉元素的视觉元素模型中 的所存储的模式模型的数量限制为固定数。
20、量K(例如5)。K的优化值对于不同场景和不同 应用是不同的。 0008 另一已知方法是为每个模式模型给出有限的寿命或期满时间。已知的方法根据模 式模型已经被匹配多少次、何时创建模式模型或者模式模型上次被匹配的时间来设置期满 时间。然而,在所有情况下,在适用于语义地作为对于背景的改变的外观与允许语义地作为 前景对象的外观的速度之间存在折衷。 0009 因此,需要提供一种用于维持在图像序列的前景-背景分离中使用的场景模型的 改进的方法和系统。 发明内容 0010 本发明的目的在于基本上克服或至少改进现有布置的一个或多个缺点。 0011 根据本公开的第一方面,提供一种更新与图像序列中捕获的场景相关联。
21、的场景模 型的视觉元素模型的方法,该视觉元素模型包括用于与场景的位置相对应的视觉元素的模 式模型的集合。该方法接收图像序列的当前帧的输入视觉元素,对于视觉元素模型中的每 个模式模型,取决于输入视觉元素的外观与相应模式模型的视觉特性的集合之间的比较而 将相应模式模型分类为匹配模式模型和疏远模式模型中的一个。该方法然后基于匹配模式 模型的超过成熟度阈值的第一时间特性以及疏远模式模型的小于稳定性阈值的第二时间 特性而从视觉元素模型中移除该疏远模式模型。 0012 根据本公开的第二方面,提供一种计算机可读存储介质,在该存储介质上已经记 录有用于命令处理器执行更新与在图像序列中捕获的场景相关联的场景模型。
22、的视觉元素 模型的方法的计算机程序,所述视觉元素模型包括用于与场景的位置相对应的视觉元素的 模式模型的集合。该计算机程序包括用于执行以下步骤的代码:接收图像序列的当前帧的 输入视觉元素;对于视觉元素模型中的每个模式模型,取决于输入视觉元素的外观与相应 模式模型的视觉特性的集合之间的比较,将相应模式模型分类为匹配模式模型和疏远模式 模型中的一个;以及基于匹配模式模型的超过成熟度阈值的第一时间特性以及疏远模式模 型的小于稳定性阈值的第二时间特性而从视觉元素模型中移除该疏远模式模型。 0013 根据本公开的第三方面,提供一种用于捕获图像序列的相机系统。该相机系统包 括:透镜系统;传感器;存储设备,用。
23、于存储计算机程序;控制模块,耦合到透镜系统和传感 器中的每一个以捕获图像序列;以及处理器,用于执行程序。所述程序包括用于更新与图像 序列中捕获的场景相关联的场景模型的视觉元素模型的计算机程序代码,所述视觉元素模 型包括用于与场景的位置相对应的视觉元素的模式模型的集合,所述更新包括以下步骤: 接收图像序列的当前帧的输入视觉元素;对于视觉元素模型中的每个模式模型,取决于输 入视觉元素的外观与相应模式模型的视觉特性的集合之间的比较,将相应模式模型分类为 匹配模式模型和疏远模式模型中的一个;以及基于匹配模式模型的超过成熟度阈值的第一 时间特性以及疏远模式模型的小于稳定性阈值的第二时间特性而从视觉元素模。
24、型中移除 该疏远模式模型。 0014 根据本公开的第四方面,提供一种通过利用与场景相关联的场景模型来执行场景 的视频监控的方法,所述场景模型包括多个视觉元素,其中,每个视觉元素与包括模式模型 说 明 书CN 102917159 A 3/16页 8 的集合的视觉元素模型相关联。该方法包括以下步骤:通过以下步骤来更新场景模型的视 觉元素模型:接收图像序列的当前帧的输入视觉元素;对于视觉元素模型中的每个模式模 型,取决于输入视觉元素的外观与相应模式模型的视觉特性的集合之间的比较,将相应模 式模型分类为匹配模式模型和疏远模式模型中的一个;以及基于匹配模式模型的超过成熟 度阈值的第一时间特性以及疏远模式。
25、模型的小于稳定性阈值的第二时间特性而从视觉元 素模型中移除该疏远模式模型。 0015 根据本公开的第五方面,提供一种更新与图像序列中捕获的场景相关联的场景模 型的视觉元素模型的方法,所述视觉元素模型包括用于与场景的位置相对应的视觉元素的 多个模式模型,每个模式模型与期满时间相关联。该方法包括以下步骤:接收图像序列的当 前视频帧的输入视觉元素;对于视觉元素模型中的每个模式模型,基于所述输入视觉元素 的视觉特性与相应模式模型的视觉特性之间的比较而将相应模式模型分类为匹配模式模 型和疏远模式模型中的一个;取决于识别具有超过成熟度阈值的第一时间特性的匹配模式 模型以及识别具有不超过稳定性阈值的第二时间。
26、特性的疏远模式模型而减少识别出的疏 远模式模型的期满时间,以更新所述视觉元素模型。 0016 根据本公开的另一方面,提供一种用于实现上述方法中的任一个的装置。 0017 根据本公开的另一方面,提供一种包括其上记录有用于实现上述方法中的任一个 的计算机程序的计算机可读介质的计算机程序产品。 0018 还公开了本发明的其它方面。 附图说明 0019 现将参照以下附图描述本公开的一个或更多个实施例,其中: 0020 图1是对其执行前景/背景分割的相机的功能框图; 0021 图2是输入帧以及包括视觉元素模型的场景模型的示意性框图表示,视觉元素模 型进而包括模式模型; 0022 图3是示出用于把输入图像。
27、元素与视觉元素模型匹配的处理的流程图; 0023 图4示出来自输入视频的五个帧、以及在单个视觉元素位置处的三个对应的视觉 元素模型,展示了当前方法的问题; 0024 图5通过示出来自长视频的六个帧而展示所解决的问题的一个示例,其中在视觉 元素位置的集合处的相似外观最终产生失败的检测; 0025 图6是示出模型的删除的方法的流程图; 0026 图7示出参照图5的六个帧的本发明实施例的效果; 0027 图8A和图8B形成在上面可以实践所描述的布置的通用计算机系统的示意性框 图;以及 0028 图9示出与图4相同的五个帧,展示了对当前问题的解决方案。 具体实施方式 0029 在任一个或更多个附图中引。
28、用具有相同标号的步骤和/或特征的情况下,为了该 描述的目的这些步骤和/或特征具有相同的功能或操作,除非相反意图出现。 0030 本发明提供一种用于维持与图像序列中描述的场景相关联的场景模型的方法和 说 明 书CN 102917159 A 4/16页 9 系统。所述方法通过从场景模型中有选择地移除可能另外产生副效果的那些元素而运作。 具体地说,所述方法适于当与背景相对应的模式模型与输入视觉元素匹配时从视觉元素模 型移除与前景相对应的那些模式模型。 0031 本公开提供一种更新场景模型的视觉元素模型的方法。场景模型与图像序列中捕 获的场景相关联。所述视觉元素模型包括用于与场景的位置相对应的视觉元素。
29、的模式模型 的集合。该方法接收图像序列的当前帧的输入视觉元素。 0032 在一种布置中,对于该视觉元素模型中的每个模式模型,该方法将各个模式模型 分类为匹配模式模型和疏远模式模型中的一个。该分类取决于输入视觉元素的外观与各个 模式模型的视觉特性的集合之间的比较。在一个实现中,输入视觉元素的外观是由与输入 视觉元素相关联的输入视觉特性的集合提供的。该方法然后基于超过成熟度阈值的匹配模 式模型的第一时间特性和小于稳定性阈值的疏远模式模型的第二时间特性,从所述视觉元 素模型移除所述模式模型中的被分类为所述疏远模式模型的一个。 0033 在另一布置中,对于所述视觉元素模型中的每个模式模型,该方法将各个。
30、模式模 型分类为匹配模式模型和疏远模式模型中的一个。该分类是基于输入视觉元素的视觉特 性与各个模式模型的视觉特性之间的比较而进行的。该方法然后取决于识别具有超过(即 旧于)成熟度阈值的第一时间特性的匹配模式模型和识别具有第二时间特性的疏远模式模 型,来减少识别出的疏远模式模型的期满时间。 0034 图1示出在上面可以执行前景/背景分割的相机100的功能框图。相机100是摇 摄倾斜变焦相机(PTZ),包括相机模块101、摇摄和倾斜模块103以及透镜系统114。相机模 块101典型地包括至少一个处理器单元105、存储器单元106、光敏传感器阵列115、耦合到 传感器阵列115的输入/输出(I/O)。
31、接口107、耦合到通信网络116的输入/输出(I/O)接 口108、以及用于摇摄和倾斜模块103和透镜系统114的输入/输出(I/O)接口113。相机 模块101的组件107、105、108、113和106典型地经由互连总线104并且以产生本领域技术 人员已知的常规操作模式的方式进行通信。 0035 相机100用于捕获表示场景的视觉内容的也被称为输入图像的视频帧,其中,场 景的至少一部分出现在相机100的视场中。相机100捕获的每个帧包括多于一个的视觉元 素。视觉元素定义为图像采样。在一个实施例中,视觉元素是像素(例如红-绿-蓝(RGB) 像素)。在另一实施例中,每个视觉元素包括一组像素。在又。
32、一实施例中,视觉元素是变换 系数,例如对运动JPEG帧进行解码所需的离散余弦变换(DCT)系数、或在JPEG-2000标准 中所使用的离散小波变换(DWT)系数的8乘8的块。彩色模型是YUV,其中,Y分量表示亮 度,U和V表示色度。 0036 在一种布置中,存储器单元106存储包括用于执行用于根据本公开来维持场景模 型的方法的计算机代码指令的计算机程序,其中,所述指令可以由处理器单元105执行。在 替代布置中,远程计算设备上的视频分析系统处理由相机100捕获的一个或更多个输入 帧,其中,远程计算设备包括用于执行用于实现根据公开来维持场景模型的方法的计算机 代码指令的处理器。 0037 图8A和。
33、图8B描述在上面可以实践所描述的各种布置的通用计算机系统800。 0038 如图8A可见,计算机系统800包括:计算机模块801;输入设备,例如键盘802、鼠 标指点设备803、扫描仪826、相机827以及麦克风880;以及输出设备,包括打印机815、显 说 明 书CN 102917159 A 5/16页 10 示设备814和外放扬声器817。计算机模块801可以使用外部调制解调器(Modem)收发机 设备816,以用于经由连接821而与通信网络820进行通信。通信网络820可以是广域网 (WAN,例如互联网),蜂窝通信网络、或私有WAN。在连接821是电话线路的情况下,调制解调 器816可以。
34、是传统“拨号”调制解调器。或者,在连接821是高容量(例如缆线)连接的情况 下,调制解调器816可以是宽带调制解调器。无线调制解调器也可以用于到通信网络820 的无线连接。 0039 计算机模块801典型地包括至少一个处理器单元805、以及存储器单元806。例如, 存储器单元806可以具有半导体随机存取存储器(RAM)和半导体只读存储器(ROM)。计算 机模块801还包括多个输入/输出(I/O)接口,其包括:音频视频接口807,其耦合到视频 显示器814、外放扬声器817和麦克风880;I/O接口813,其耦合到键盘802、鼠标803、扫描 仪826、相机827,并且可选地包括操纵杆或其它人类。
35、接口设备(未示出);以及接口808,用 于外部调制解调器816和打印机815。在一些实现中,调制解调器816可以合并到计算机模 块801内,例如在接口808内。计算机模块801还具有本地网络接口811,其允许计算机系 统800经由连接823耦合到局域通信网络822(被称为局域网(LAN)。如图8A所示,本地 通信网络822也可以经由将典型地包括所谓的“防火墙”设备或相似功能的设备的连接824 而耦合到广域网络820。本地网络接口811可以包括以太网 TM 电路卡、蓝牙 TM 无线布置或 IEEE 802.11无线布置;然而,对于接口811可以实践大量其它类型的接口。 0040 相机827可以与。
36、图1的PTZ相机100对应。在替代布置中,计算机模块801经由 广域通信网820和/或局域通信网822而耦合到相机100。 0041 I/O接口808和813可以提供串行和并行连接中的一个或二者,前者通常根据通用 串行总线(USB)标准而实现,并且具有对应的USB连接器(未示出)。存储设备809被提供, 并且通常包括硬盘驱动器(HDD)810。也可以使用其它存储设备(例如软盘驱动器和磁带驱 动器(未示出)。光盘驱动器812被通常提供来充当非易失性数据源。便携式存储器设备 (例如光盘(例如CD-ROM、DVD、蓝光盘 TM )、USB-RAM、便携式外部硬盘驱动器以及软盘)例如 可以用作系统80。
37、0的适当数据源。 0042 计算机模块801的组件805至813通常经由互连总线804并且以产生本领域技术 人员已知的计算机系统800的常规操作模式的方式进行通信。例如,处理器805使用连接 818耦合到系统总线804。类似地,存储器806和光盘驱动器812通过连接819而耦合到 系统总线804。在上面可以实践所描述的布置的计算机的示例包括IBM-PC和兼容机、Sun Sparcstation、Apple Mac TM 等计算机系统。 0043 可以使用计算机系统800来实现更新场景模型的视觉元素模型的方法,其中,在 此描述的图2至图7的处理可以实现为计算机系统800内可执行的一个或多个软件应。
38、用程 序833。具体地说,接收输入视觉元素、对模式模型进行分类并且移除模式模型的方法的步 骤由计算机系统800内执行的软件833中的指令831(见图8B)执行。软件指令831可以 形成为一个或更多个代码模块,每一代码模块用于执行一个或多个特定任务。软件也可以 划分为两个单独部分,其中,第一部分和对应代码模块执行视觉元素模型更新方法,第二部 分和对应代码模块管理第一部分与用户之间的用户接口。 0044 软件833通常存储在HDD810或存储器806中。软件从计算机可读介质加载到计 算机系统800中,并且由计算机系统800执行。因此,例如,软件833可以存储在由光盘驱 说 明 书CN 102917。
39、159 A 10 6/16页 11 动器812读取的光学可读盘存储介质(例如CD-ROM)825上。上面记录有这样的软件或计算 机程序的计算机可读介质是计算机程序产品。计算机系统800中的计算机程序产品的使用 优选地实现用于更新场景模型中的视觉元素模型的装置,其可以用于在例如安全性监控和 视觉分析的应用中对图像序列执行前景/背景分离以检测前景对象。 0045 在一些例子中,应用程序833可以提供给一个或多个CD-ROM825上编码的用户,并 且经由对应驱动器812读取,或者,可以由用户从网络820或822读取。此外,软件也可以从 其它计算机可读介质加载到计算机系统800。计算机可读存储介质是指。
40、将记录的指令和/ 或数据提供给计算机系统800以用于执行和/或处理的任何非易失性有形存储介质。这些 存储介质的示例包括软盘、磁带、CD-ROM、DVD、蓝光盘、硬盘驱动器、ROM或集成电路、USB存 储器、磁光盘、或计算机可读卡(例如PCMCIA卡等),无论这些设备在计算机模块801的内部 还是外部。也可以参与软件、应用程序、指令和/或数据对计算机模块801的提供的易失性 或非有形计算机可读传输介质的示例包括无线电或红外传输信道以及对另一计算机或联 网设备的网络连接、以及包括电子邮件传输和在网站等上记录的信息的互联网或内部网。 0046 上述应用程序833的第二部分以及对应代码模块可以执行来实。
41、现要在显示器814 上呈现或另外表示的一个或多个图形用户接口(GUI)。通过典型地操控键盘802和鼠标 803,计算机系统800和应用的用户可以通过功能自适应方式操控接口,以将控制命令和/ 或输入提供给与GUI关联的应用。也可以实现功能自适应用户接口的其它形式,例如利用 经由外放扬声器817输出的语音提示以及经由麦克风880输入的用户话音命令的音频接 口。 0047 图8B是处理器805和“存储器”834的详细示意性框图。存储器834表示图8A中 的计算机模块801可以访问的所有存储器模块(包括HDD 809和半导体存储器806)的逻辑 集合。 0048 当计算机模块801被初始供电时,上电自。
42、检(POST)程序850执行。POST程序850 通常存储在图8A的半导体存储器806的ROM849中。硬件设备(例如存储软件的ROM849) 有时被称为固件。POST程序850检查计算机模块801内的硬件,以确保正确运行并且通常 检查处理器805、存储器834(809、806)、以及也通常存储在ROM849中的基本输入输出系统 软件(BIOS)模块851用于正确操作。一旦POST程序850已经成功地运行,BIOS851就激活 图8A的硬盘驱动器810。硬盘驱动器810的激活使得经由处理器805执行硬盘驱动器810 上驻留的引导(bootstrap)加载程序852。这将操作系统853加载到RA。
43、M存储器806中,在 其上操作系统853开始工作。操作系统853是可由处理器805执行以完成各种高级别功能 (包括处理器管理、存储器管理、设备管理、存储管理、软件应用接口以及通用用户接口)的 系统级别应用。 0049 操作系统853管理存储器834(809、806)以确保计算机模块801上运行的每个处 理或应用具有足够的存储器,其中在不与分配给另一处理的存储器冲突的情况下执行。此 外,必须适当地使用图8A的系统800中可用的不同类型的存储器,以使得每个处理可以有 效地运行。 0050 相应地,集合的存储器834并非意图示出如何分配特定的存储器分段(除非另外 声明),而是提供可由计算机系统800。
44、访问的存储器以及如何使用它的概览。 0051 如图8B所示,处理器805包括多个功能模块,包括控制单元839、算术逻辑单元 说 明 书CN 102917159 A 11 7/16页 12 (ALU)840以及本地或内部存储器848(有时称为缓存存储器)。缓存存储器848通常包括 寄存器区段中的多个存储寄存器844-846。一个或多个内部总线841将这些功能模块在功 能上互连。处理器805通常还具有用于使用连接818经由系统总线804与外部设备进行通 信的一个或多个接口842。存储器834使用连接819耦合到总线804。 0052 应用程序833包括可以包括条件分支和循环指令的指令831的序列。。
45、程序833也 可以包括在执行程序833中使用的数据832。分别在存储器位置828、829、830和835、836、 837中存储指令831和数据832。取决于指令831和存储器位置828-830的相对大小,可以 在单个存储器位置中存储特定指令,如存储器位置830所示的指令所描述的那样。或者,可 以将指令分段为多个部分,每一个部分存储在单独的存储器位置中,如存储器位置828和 829中所示的指令分段所描述的那样。 0053 通常,处理器805被给予在处理器中执行的指令的集合。处理器1105等待后续输 入,处理器805通过执行另一指令集合来对后续输入做出反应。可以从以下多个源中的一 个或多个提供每。
46、一输入:这些源包括由输入设备802、803中的一个或多个生成的数据、跨 网络820、802中的一个从外部源接收的数据、从存储设备806、809中的一个提取的数据或 从插入到对应读取器812的存储介质825提取的数据,全部都在图8中有描述。指令集合的 执行可以在一些情况下产生数据的输出。执行也可以涉及将数据或变量存储到存储器834。 0054 所公开的视觉元素模型更新布置使用在对应存储器位置855、856、857中的存储 器834中存储的输入变量854。视觉元素模型更新布置产生在对应存储器位置862、863、864 中的存储器834中存储的输出变量861。可以在存储器位置859、860、866和。
47、867中存储中 间变量858。 0055 参照图8B的处理器805,寄存器844、845、846、算术逻辑单元(ALU)840和控制单 元839一起工作,以针对构成程序833的指令集合中的每个指令执行用于执行“取得、解码 和执行”周期所需的微操作的序列。每个取得、解码和执行周期包括: 0056 (a)取得操作,其从存储器位置828、829、830取得或读取指令831; 0057 (b)解码操作,其中,控制单元839确定已经取得哪个指令;以及 0058 (c)执行操作,其中,控制单元839和/或ALU 840执行指令。 0059 此后,可以执行用于下一指令的另一取得、解码和执行周期。相似地,可以。
48、执行:控 制单元839将值存储或写入到存储器位置832的存储周期。 0060 图2至图7的处理中的每一步骤或子处理与程序833的一个或多个分段关联,并 且由一起工作的处理器805中的寄存器区段844、845、847、ALU 840以及控制单元839执 行,以执行用于程序833的标注分段的指令集合中的每个指令的取得、解码和执行周期。 0061 可以替代地在专用硬件(比如一个或多个门阵列和/或集成电路)中实现更新场景 模型中的视觉元素模型的方法,这些专用硬件(比如一个或多个门阵列和/或集成电路)执 行接收输入视觉元素、将模式模型分类为匹配或疏远以及移除疏远模式模型以更新视觉元 素模型的功能或子功能。
49、。该专用硬件也可以包括图形处理器、数字信号处理器或一个或多 个微处理器以及关联存储器。如果使用门阵列,则图3和图6中的处理流程图转换为硬件 描述语言(HDL)形式。该HDL描述转换为设备级别网表(netlist),其由布局和布线(P&R) 工具用于产生下载到门阵列以通过HDL描述中指定的设计来对该门阵列编程的文件。 0062 图2描述输入帧210以及与输入帧210中捕获的场景相关联的场景模型230的示 说 明 书CN 102917159 A 12 8/16页 13 意性框图表示。输入帧210包括多个视觉元素,其包括示例性视觉元素220。场景模型230 包括对应的多个视觉元素模型,其包括与输入帧210的视觉元素220的方位或位置对应的 视觉元素模型240。在一个布置中,在相机100的存储器106中存储场景模型230。在另一 布置中,在远程服务器或数据库的存储器中存储场景模型230。在一个实现中,服务器或数 据库通过通信链路而耦合到相机100。通信链路可以包括有线或无线传输路径,并且可以是 专用链路、广域网(WAN)、局域网(L。