《监控摄像机的标定方法和系统.pdf》由会员分享,可在线阅读,更多相关《监控摄像机的标定方法和系统.pdf(16页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103824278 A (43)申请公布日 2014.05.28 CN 103824278 A (21)申请号 201310670982.0 (22)申请日 2013.12.10 G06T 7/00(2006.01) (71)申请人 清华大学 地址 100084 北京市海淀区 100084-82 信箱 (72)发明人 周杰 邓磊 喻川 张昊飏 (74)专利代理机构 北京清亦华知识产权代理事 务所 ( 普通合伙 ) 11201 代理人 宋融冰 (54) 发明名称 监控摄像机的标定方法和系统 (57) 摘要 本发明公开一种监控摄像机的标定方法及系 统。方法包括 : 利用采。
2、集设备在待标定监控摄像 机的场景中采集多幅图像, 利用待标定监控摄像 机采集图像 ; 对采集设备采集的多幅图像进行特 征匹配以获取多幅图像之间的匹配关系 ; 根据多 幅图像之间的匹配关系重构监控场景的三维点 集 ; 以及根据重构出的三维点集和待标定监控摄 像机采集的图像计算待标定监控摄像机的参数。 本发明可同时对多个监控摄像机的内、 外参进行 标定, 可计算出一个区域内的所有监控摄像机的 相对位置、 朝向等信息 ; 能处理监控摄像机视场 没有交叠的情况, 且不要求监控摄像机之间同步 ; 只需要采集设备采集图像或视频将待标定的各个 监控摄像机的视场相连接, 就能计算出多个摄像 机的内参和外参。 。
3、(51)Int.Cl. 权利要求书 3 页 说明书 9 页 附图 3 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书3页 说明书9页 附图3页 (10)申请公布号 CN 103824278 A CN 103824278 A 1/3 页 2 1. 一种监控摄像机的标定方法, 其特征在于, 包括 : 利用采集设备在所述待标定监控摄像机的监控场景中采集多幅图像, 以及利用待标定 监控摄像机采集图像 ; 对所述采集设备采集的多幅图像进行特征匹配以获取所述多幅图像之间的匹配关 系 ; 根据所述多幅图像之间的匹配关系重构所述待标定监控摄像机的监控场景的三维点 集 ; 根据所述重。
4、构出的三维点集和所述待标定监控摄像机采集的图像计算所述待标定监 控摄像机的参数。 2. 根据权利要求 1 所述的方法, 其特征在于, 所述利用采集设备在所述待标定监控摄 像机的监控场景中采集多幅图像包括 : 标定所述采集设备的内参 ; 利用已经标定好内参的所述采集设备在所述待标定监控摄像机的监控场景中主动采 集多幅图像, 其中所述多幅图像中的至少一些与所述待标定监控摄像机的视场的重叠部分 超过预设值。 3.根据权利要求1或2所述的方法, 其特征在于, 所述对所述采集设备采集的多幅图像 进行特征匹配以获取所述多幅图像之间的匹配关系包括 : 当所述采集设备具有 GPS 传感器时, 利用所述采集设备。
5、采集图像时获取的 GPS 位置信 息获取每幅图像的相邻图像, 并对相邻的图像进行两两匹配 ; 以及 当所述采集设备不具有 GPS 传感器时, 对所述多幅图像进行两两匹配。 4. 根据权利要求 1 所述的方法, 其特征在于, 所述根据所述多幅图像之间的匹配关系 重构所述待标定监控摄像机的监控场景的三维点集包括 : 从所述多幅图像中选择满足预设条件的两幅图像作为初始图像, 其中所述预设条件为 两幅图像上匹配点的数目多, 且图像间退化不严重 ; 根据所述初始图像上的匹配点对计算所述初始图像的摄像机矩阵 ; 利用所述初始图像间的匹配关系和所述初始图像的摄像机矩阵重构所述监控场景的 三维点 ; 利用所述。
6、三维点和除所述初始图像外的其他图像扩充所述监控场景的三维点集。 5. 根据权利要求 4 所述的方法, 其特征在于, 所述利用所述三维点和所述初始图像外 的其他图像扩充所述监控场景的三维点集包括 : 判断是否所述采集设备采集的多幅图像均已经参与计算所述重构监控场景的三维点 集 ; 如果否, 则从未参与计算所述重构的图像中找到与已经重构出的三维点最匹配的图 像, 并计算所述与已经重构出的三维点最匹配的图像对应的摄像机矩阵 ; 利用所述与已经重构出的三维点最匹配的图像和已经计算出摄像机矩阵的其他图像 的匹配点扩充所述监控场景的三维点集 ; 对所述获得的摄像机矩阵和三维点进行优化。 6. 根据权利要求。
7、 1 所述的方法, 其特征在于, 所述根据所述多幅图像之间的匹配关系 重构所述待标定监控摄像机的监控场景的三维点集包括 : 权 利 要 求 书 CN 103824278 A 2 2/3 页 3 获取所述多幅图像对应的采集设备的 GPS 位置和姿态信息, 并根据所述 GPS 位置和姿 态信息计算出每幅图像对应的摄像机矩阵 ; 对于每两幅图像, 利用所述摄像机矩阵和所述多幅图像之间的匹配关系通过三角法获 得所述两幅图像上的匹配点对的三维坐标 ; 利用光束平差法对所述摄像机矩阵和所述匹配点对的三维坐标进行优化。 7. 根据权利要求 1 所述的方法, 其特征在于, 所述根据所述重构出的三维点集和所述 。
8、待标定监控摄像机采集的图像计算所述待标定监控摄像机的参数包括 : 将所述待标定监控摄像机采集的图像与参与所述重构的图像进行特征匹配以获取相 匹配的第一特征点集, 并计算出所述第一特征点集与所述三维点集在参与重构的图像中的 对应特征点集的交集 ; 判断所述交集中的特征点的数目是否大于预设阈值 ; 如果否, 则主动采集新的图像, 并根据所述新的图像扩充所述三维点集以更新所述交 集 ; 重复上述步骤直至所述交集中的特征点的数目大于所述预设阈值 ; 根据所述交集对应的三维点集合以及所述交集计算所述待标定监控摄像机的参数。 8. 一种监控摄像机的标定系统, 其特征在于, 所述系统包括 : 至少一个采集设。
9、备, 用于在所述待标定监控摄像机的监控场景中采集多幅图像 ; 计算装置, 用于根据所述至少一个采集设备采集的多幅图像进行特征匹配以获取所述 多幅图像之间的匹配关系, 并根据所述多幅图像之间的匹配关系重构所述待标定监控摄像 机的监控场景的三维点集, 以及根据所述重构出的三维点集和所述待标定监控摄像机采集 的图像计算所述待标定监控摄像机的参数。 9. 根据权利要求 8 所述的系统, 其特征在于, 所述至少一个采集设备的内参已经被标 定, 且已经标定好内参的至少一个采集设备在所述待标定监控摄像机的监控场景中主动采 集多幅图像, 其中所述多幅图像中的至少一些与所述待标定监控摄像机的视场的重叠部分 超过。
10、预设值。 10. 根据权利要求 8 所述的系统, 其特征在于, 所述计算装置用于 : 从所述多幅图像中选择满足预设条件的两幅图像作为初始图像, 其中所述预设条件为 两幅图像上匹配点的数目多, 且图像间退化不严重 ; 根据所述初始图像上的匹配点对计算所述初始图像的摄像机矩阵 ; 利用所述初始图像间的匹配关系和所述初始图像的摄像机矩阵重构所述监控场景的 三维点 ; 利用所述三维点和除所述初始图像外的其他图像扩充所述监控场景的三维点集。 11. 根据权利要求 10 所述的系统, 其特征在于, 所述计算装置进一步用于 : 判断是否所述采集设备采集的多幅图像均已经参与计算所述重构监控场景的三维点 集 ;。
11、 如果否, 则从未参与计算所述重构的图像中找到与已经重构出的三维点最匹配的图 像, 并计算所述与已经重构出的三维点最匹配的图像对应的摄像机矩阵 ; 利用所述与已经重构出的三维点最匹配的图像和已经计算出摄像机矩阵的其他图像 的匹配点扩充所述监控场景的三维点集 ; 权 利 要 求 书 CN 103824278 A 3 3/3 页 4 对所述获得的摄像机矩阵和三维点进行优化。 12. 根据权利要求 8 所述的系统, 其特征在于, 所述计算装置用于 : 获取所述多幅图像对应的采集设备的 GPS 位置和姿态信息, 并根据所述 GPS 位置和姿 态信息计算出每幅图像对应的摄像机矩阵 ; 对于每两幅图像, 。
12、利用所述摄像机矩阵和所述多幅图像之间的匹配关系通过三角法获 得所述两幅图像上的匹配点对的三维坐标 ; 利用光束平差法对所述摄像机矩阵和所述匹配点对的三维坐标进行优化。 13. 根据权利要求 8 所述的系统, 其特征在于, 所述计算装置用于 : 将所述待标定监控摄像机采集的图像与参与所述重构的图像进行特征匹配以获取相 匹配的第一特征点集, 并计算出所述第一特征点集与所述三维点集在参与重构的图像中的 对应特征点集的交集 ; 判断所述交集中的特征点的数目是否大于预设阈值 ; 如果否, 则主动采集新的图像, 并根据所述新的图像扩充所述三维点集以更新所述交 集 ; 重复上述步骤直至所述交集中的特征点的数。
13、目大于所述预设阈值 ; 根据所述交集对应的三维点集合和所述交集计算所述待标定监控摄像机的参数。 权 利 要 求 书 CN 103824278 A 4 1/9 页 5 监控摄像机的标定方法和系统 技术领域 0001 本发明涉及图像处理领域, 尤其涉及一种监控摄像机的标定方法和系统。 背景技术 0002 视频监控是安全防护系统的重要部分, 其中一个关键问题是如何对监控摄像机进 行标定, 得到其内部参数 (主点坐标、 脚距、 扭曲因子等) 和外部参数 (摄像机坐标系相对于 一个统一坐标系的旋转矩阵和平移向量) , 从而得到监控系统中各个摄像机的相对架设位 置、 朝向和监控视场范围等。 0003 监控。
14、摄像机的标定方法主要有三种 : 传统的摄像机标定方法、 基于主动视觉的摄 像机标定方法和摄像机自标定方法。第一种方法需要将经过精密加工的标定物体 (如标定 块、 标定板、 标定棒等) 放在摄像机的视场中, 通过建立标定物体上的已知三维坐标的点与 其在图像上的坐标的对应关系来计算摄像机的内部参数和外部参数。 这种方法由于需要在 每个摄像机上进行上述操作, 因此标定过程费时费力 ; 而且由于室外监控场景范围往往较 大, 而标定物体相对较小, 因此其在图像上所占比例较小, 导致标定误差较大。第二种方法 主动控制摄像机做特殊运动 (例如纯平移运动或绕光心旋转等) , 利用运动的特殊性来计算 摄像机的内。
15、部参数和外部参数。但是, 由于大多数监控摄像机的安装位置固定且运动很难 控制, 因此这种方法的适用性差 ; 而且这种方法也需要对每个摄像机逐一进行标定, 工作量 大。 第三种方法不需要标定物体, 也不需要摄像机做特殊运动, 而是直接利用待标定的摄像 机 (可以是多个) 采集的多幅图像之间像素点的对应关系和内、 外参的约束来进行标定。目 前已有一些自标定技术能通过多视图几何的方法对多个摄像机同时进行标定, 但是其要求 多个摄像机的视场必须有较大的重叠区域, 否则由于图像匹配失败, 将无法进行标定。此 外, 一般要求多个监控摄像机采集的视频图像同步。但是, 在监控系统的实际架设中, 多数 监控摄像。
16、机之间的重叠视场较小, 而且由于联网条件等限制很难获得这些摄像机的同步视 频, 因此现有的自标定技术很难实现对多个摄像机同时进行标定。 发明内容 0004 本发明旨在至少在一定程度上解决现有技术中的上述技术问题之一。 0005 为此, 本发明的一个目的在于提出一种能够标定无重叠视场下的监控摄像机的内 部参数和外部参数的监控摄像机的标定方法。 0006 本发明的另一个目的在于提出一种能够标定无重叠视场下的监控摄像机的内部 参数和外部参数的监控摄像机的标定系统。 0007 为达到上述目的, 本发明第一方面的实施例提出一种监控摄像机的标定方法, 包 括 : 利用采集设备在待标定监控摄像机的场景中采集。
17、多幅图像, 以及利用所述待标定监控 摄像机采集图像 ; 对所述采集设备采集的多幅图像进行特征匹配以获取所述多幅图像之间 的匹配关系 ; 根据所述多幅图像之间的匹配关系重构所述待标定监控摄像机的监控场景的 三维点集 ; 以及根据所述重构出的三维点集和所述待标定监控摄像机采集的图像计算所述 说 明 书 CN 103824278 A 5 2/9 页 6 待标定监控摄像机的参数。 0008 在本发明的一个实施例中, 所述利用采集设备在所述待标定监控摄像机的监控场 景中采集多幅图像包括 : 标定所述采集设备的内参 ; 利用已经标定好内参的所述采集设备 在所述待标定监控摄像机的监控场景中主动采集多幅图像,。
18、 其中所述多幅图像中的至少一 些与所述待标定监控摄像机的视场的重叠部分超过预设值。 0009 在本发明的一个实施例中, 所述对所述采集设备采集的多幅图像进行特征匹配以 获取所述多幅图像之间的匹配关系包括 : 当所述采集设备具有 GPS 传感器时, 利用所述采 集设备采集图像时获取的 GPS 位置信息获取每幅图像的相邻图像, 并对相邻的图像进行两 两匹配 ; 以及当所述采集设备不具有 GPS 传感器时, 对所述多幅图像进行两两匹配。 0010 在本发明的一个实施例中, 所述根据所述多幅图像之间的匹配关系重构所述待标 定监控摄像机的监控场景的三维点集包括 : 从所述多幅图像中选择满足预设条件的两幅。
19、图 像作为初始图像, 其中所述预设条件为两幅图像上匹配点的数目多, 且图像间退化不严重 ; 根据所述初始图像上的匹配点对计算所述初始图像的摄像机矩阵 ; 利用所述初始图像间的 匹配关系和所述初始图像的摄像机矩阵重构所述监控场景的三维点 ; 利用所述三维点和除 所述初始图像外的其他图像扩充所述监控场景的三维点集。 0011 在本发明的一个实施例中, 所述利用所述三维点和除所述初始图像外的其他图像 扩充所述监控场景的三维点集包括 : 判断是否所述采集设备采集的多幅图像均已经参与计 算所述重构监控场景的三维点集 ; 如果否, 则从未参与所述重构的图像中找到与已经重构 出的三维点最匹配的图像, 并计算。
20、所述与已经重构出的三维点最匹配的图像对应的摄像机 矩阵 ; 利用所述与已经重构出的三维点最匹配的图像和已经计算出摄像机矩阵的其他图像 的匹配点扩充所述监控场景的三维点集 ; 对所述获得的摄像机矩阵和三维点进行优化。 0012 在本发明的另一个实施例中, 所述根据所述多幅图像之间的匹配关系重构所述待 标定监控摄像机的监控场景的三维点集包括 : 获取所述多幅图像对应的采集设备的 GPS 位 置和姿态信息, 并根据所述 GPS 位置和姿态信息计算出每幅图像对应的摄像机矩阵 ; 对于 每两幅图像, 利用所述摄像机矩阵通过三角法获得所述两幅图像上的匹配点对的三维坐 标 ; 利用光束平差法对所述摄像机矩阵。
21、和所述匹配点对的三维坐标进行优化。 0013 在本发明的一个实施例中, 所述根据所述重构出的三维点集和所述待标定监控摄 像机采集的图像计算所述待标定监控摄像机的参数包括 : 将所述待标定监控摄像机采集的 图像与参与所述重构的图像进行特征匹配以获取相匹配的第一特征点集, 并计算出所述第 一特征点集与所述三维点集在参与重构的图像中的对应特征点集的交集 ; 判断所述交集中 的特征点的数目是否大于预设阈值 ; 如果否, 则主动采集新的图像, 并根据所述新的图像扩 充所述三维点集以更新所述交集 ; 重复上述步骤直至所述交集中的特征点的数目大于所述 预设阈值 ; 根据所述交集对应的三维点集合和所述交集计算。
22、所述待标定监控摄像机的参 数。 0014 本发明第二方面的实施例提供一种监控摄像机的标定系统。所述系统包括 : 采集 设备, 用于在所述待标定监控摄像机的监控场景中采集多幅图像 ; 以及计算装置, 用于根据 所述采集设备采集的多幅图像进行特征匹配以获取所述多幅图像之间的匹配关系, 并根据 所述多幅图像之间的匹配关系重构所述待标定监控摄像机的监控场景的三维点集, 以及根 据所述重构出的三维点集和所述待标定监控摄像机采集的图像计算所述待标定监控摄像 说 明 书 CN 103824278 A 6 3/9 页 7 机的参数。 0015 在本发明的一个实施例中, 所述采集设备的内参已经被标定, 且所述已。
23、经标定好 内参的采集设备在所述待标定监控摄像机的监控场景中主动采集多幅图像, 其中所述多幅 图像中的至少一些与所述待标定监控摄像机的视场的重叠部分超过预设值。 0016 在本发明的一个实施例中, 所述计算装置用于 : 从所述多幅图像中选择满足预设 条件的两幅图像作为初始图像, 其中所述预设条件为两幅图像上匹配点的数目多, 且图像 间退化不严重 ; 根据所述初始图像上的匹配点对计算所述初始图像的摄像机矩阵 ; 利用所 述初始图像间的匹配关系和所述初始图像的摄像机矩阵重构所述监控场景的三维点 ; 利用 所述三维点和除所述初始图像外的其他图像扩充所述监控场景的三维点集。 0017 在本发明的一个实施。
24、例中, 所述计算装置进一步用于 : 判断是否所述采集设备采 集的多幅图像均已经参与计算所述重构监控场景的三维点集 ; 如果否, 则从未参与计算所 述重构的图像中找到与已经重构出的三维点最匹配的图像, 并计算所述与已经重构出的三 维点最匹配的图像对应的摄像机矩阵 ; 利用所述与已经重构出的三维点最匹配的图像和已 经计算出摄像机矩阵的其他图像的匹配点扩充所述监控场景的三维点集 ; 对所述获得的摄 像机矩阵和三维点进行优化。 0018 在本发明的一个实施例中, 所述计算装置用于 : 获取所述多幅图像对应的采集设 备的 GPS 位置和姿态信息, 并根据所述 GPS 位置和姿态信息计算出每幅图像对应的摄。
25、像机 矩阵 ; 对于每两幅图像, 利用所述摄像机矩阵和所述多幅图像之间的匹配关系通过三角法 获得所述两幅图像上的匹配点对的三维坐标 ; 利用光束平差法对所述摄像机矩阵和所述匹 配点对的三维坐标进行优化。 0019 在本发明的一个实施例中, 所述计算装置用于 : 将所述待标定监控摄像机采集的 图像与参与所述重构的图像进行特征匹配以获取相匹配的第一特征点集, 并计算出所述第 一特征点集与所述三维点集在参与重构的图像中的对应特征点集的交集 ; 判断所述交集中 的特征点的数目是否大于预设阈值 ; 如果否, 则主动采集新的图像, 并根据所述新的图像扩 充所述三维点集以更新所述交集 ; 重复上述步骤直至所。
26、述交集中的特征点的数目大于所述 预设阈值 ; 根据所述交集对应的三维点集合和所述交集计算所述待标定监控摄像机的参 数。 0020 本发明可以首先利用采集设备得到比较完整的监控场景的图像信息, 然后精确地 重构出监控场景的三维点, 最后利用这些三维点和监控摄像机采集的图像上特征点的匹配 关系计算出监控摄像机的摄像机矩阵, 从而实现对监控摄像机进行标定。 同时, 标定过程是 动态的, 即如果发现恢复的监控场景的三维点不足以对监控摄像机进行标定, 可以再次拍 摄更多的图像扩充监控场景的三维点集, 从而可以保证所有待标定的监控摄像机最终都能 得到标定。本发明不同于传统的摄像机标定方法需要标定物、 摄像。
27、机做特殊运动或者要求 摄像机视场之间有重叠区域, 而只需要用标定好的采集设备主动拍摄的监控场景图像将待 标定的各个监控摄像机的视场相连接, 就能对多个监控摄像机同时进行标定, 得到其内参 和相对位置关系。本发明的方法不要求待标定的监控摄像机之间同步, 且能处理监控摄像 机视场没有交叠的情况。如果用街景车进行图像采集, 则可以进行城市级别的监控摄像机 网络的智能分析。 0021 本发明附加的方面和优点将在下面的描述中部分给出, 部分将从下面的描述中变 说 明 书 CN 103824278 A 7 4/9 页 8 得明显, 或通过本发明的实践了解到。 附图说明 0022 本发明上述的和 / 或附加。
28、的方面和优点从下面结合附图对实施例的描述中将变 得明显和容易理解, 其中 : 0023 图 1 是本发明一个实施例的监控摄像机的标定方法的流程图 ; 0024 图 2 是本发明一个实施例的根据多幅图像之间的匹配关系重构待标定监控摄像 机的监控场景的三维点集的方法的流程图 ; 0025 图 3 是本发明一个实施例的根据重构出的三维点集和待标定监控摄像机采集的 图像计算待标定监控摄像机的参数的方法的流程图 ; 以及 0026 图 4 是本发明一个实施例的监控摄像机的标定系统的结构框图。 具体实施方式 0027 下面详细描述本发明的实施例, 所述实施例的示例在附图中示出, 其中自始至终 相同或类似的。
29、标号表示相同或类似的元件或具有相同或类似功能的元件。 下面通过参考附 图描述的实施例是示例性的, 旨在用于解释本发明, 而不能理解为对本发明的限制。 0028 在本发明的描述中, 需要理解的是, 术语 “第一” 、“第二” 仅用于描述目的, 而不能 理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此, 限定有 “第 一” 、“第二” 的特征可以明示或者隐含地包括一个或者多个该特征。在本发明的描述中,“多 个” 的含义是两个或两个以上, 除非另有明确具体的限定。 0029 图 1 是本发明一个实施例的监控摄像机的标定方法的流程图。如图 1 所示, 根据 本发明一个实施例的监控摄像。
30、机的标定方法包括如下步骤。 0030 步骤 S1, 利用采集设备在待标定监控摄像机的监控场景中采集多幅图像, 以及利 用待标定监控摄像机采集图像。 0031 在本发明的一个实施例中, 可首先利用传统的摄像机标定方法标定采集设备的内 部参数 (焦距、 长宽比、 主点、 扭曲等) 。由此可以增加场景重建的精度, 从而使得最终的监控 摄像机的标定更为精确。在本发明的一个实施例中, 采集设备可以是相机、 手机、 PTZ 镜头、 全景采集设备等。 0032 然后, 利用标定好的采集设备在监控场景中主动采集多幅图像或多段视频 (如果 是视频, 则截取其中的多幅图像) , 从而获取比较完整的监控场景图像信息。
31、, 便于实现后续 的场景三维重构。采集时要保证采集的多幅图像中的某些图像和待标定摄像机的视场有 较大的重叠部分, 从而保证通过这些图像能将各个待标定摄像机的视场连接起来。图像或 视频可以是等间隔距离地均匀拍摄得到 (例如, google 街景、 百度街景、 soso 街景等拍摄方 式) , 也可以是不等间隔拍摄得到 (例如, 同时利用互联网上已有的该监控场景的图像) 。在 本发明的实施例中, 不要求采集设备的图像或视频和待标定摄像机采集的图像同步。 此外, 在本发明中, 可以通过多个位置和姿态不同的采集设备采集多幅图像, 或者通过一个采集 设备在不同位置和姿态下采集多幅图像。换句话说, 只要保。
32、证多幅图像对应的位置和姿态 不同即可。 0033 步骤 S2, 对采集设备采集到的多幅图像进行特征匹配以获取多幅图像之间的匹配 说 明 书 CN 103824278 A 8 5/9 页 9 关系。 0034 具体地, 首先提取每幅图像的特征点 (例如, Sift、 Surf、 Harris 等特征点) , 获取 每个特征点在图像中的位置和描述子。然后对每两幅图像进行特征点匹配以获取两幅图 像上的特征点的对应关系。这个步骤既可以通过计算机自动完成, 也可以通过人工手动完 成 (即, 人工指定两幅图像上匹配的特征点对) 。而且, 目前已有很多自动完成特征点匹配 的算法, 例如用特征点描述子的最近邻。
33、次近邻比约束进行特征点匹配的算法 (参见 lowe, D.G.,“Distinctive Image Feature from Scale-Invariant Keypoints” ,International Journal of Computer Vision,60, 2, 91-110 页, 2004) 、 用特征点位置的对极几何约束进 行特征点匹配的算法 (参见 M.A.Fischer 和 R.C.Bolles,“Random sample consensus:A paradigm for model fitting with applications to image analysi。
34、s and automated cartography” , Commun.Acm, 卷 24,381-395 页, 1981 年 6 月) 、 用基于图匹配的 WGTM 方法进 行特征点匹配的算法 (参见Saeedi P, Izadi M.A Robust Weighted Graph Transformation Matching for Rigid and Non-rigid Image RegistrationJ.2012) , 此处不再进行详细 描述。 0035 由于图像两两匹配的计算量较大, 因此在本发明的一个实施例中, 可以首先找到 每个图像的相邻图像, 然后只对相邻的图像进行两。
35、两匹配, 从而减少匹配工作量。具体地, 可以用图像的 Gist 全局特征对图像先进行聚类然后找到相邻图像, 或者利用图像 Sift 等 特征建词典树对每个图像进行量化从而找到近邻, 或者利用采集设备采集图像时获取的 GPS 位置信息找到图像的相邻图像, 或者使用从视频中截取的相邻帧的图像作为相邻图像。 0036 步骤 S3, 根据多幅图像之间的匹配关系重构待标定监控摄像机的监控场景的三维 点集。 0037 这 个 步 骤 可 以 通 过 很 多 方 法 实 现, 例 如, 基 于 IBA(Incremental Bundle Adjustment, 增量式捆集调整)框架的 SFM(Struct。
36、ure From Motion, 运动恢复结构) 算 法 (参 见 S.Agarwal, N.Snavely, I.Simon,S.Seitz,R.Szeliski.Building Rome in a Day,ICCV,2009) , 基于离散置信传播和列文伯格 - 马夸尔特法的 SFM 方法 (参见论 文 Crandall D,Owens A,Snavely N,et al.Discrete-continuous optimization for large-scale structure from motionC,CVPR,2011) , 或者利用采集设备上传感器获取的 GPS 和姿态信。
37、息直接重构场景。 0038 在本发明的一个实施例中, 可以基于 IBA 框架的 SFM 方法重构监控场景的三维点 集, 具体地包括以下步骤。 0039 步骤 S311, 从采集设备采集的多幅图像中选择满足以下要求的两幅图像作为初始 图像 : 两幅图像上的匹配点的数目多, 且图像间退化不严重。 0040 步骤 S312, 利用上面得到的两幅初始图像重构场景的三维点。 0041 具体地, 首先利用两幅初始图像上的所有匹配的特征点对 (xj1,xj2) 计算出满 足的本质矩阵 E(例如使用 David Nister 提出的五点法, 参见 Nistr D.An efficient solution t。
38、o the five-point relative pose problemJ.IEEE Transactions on Pattern Analysis and Machine Intelligence,2004) 。然后对本质矩阵 E 进行分解 得到两幅初始图像对应的摄像机矩阵 P1和 P2(将其中一幅图像对应的坐标系作为世界坐 标系, 即一幅图像对应的像机矩阵为 P1=K1I|0, 其中 K1为已知的采集设备内参矩阵, I 为 说 明 书 CN 103824278 A 9 6/9 页 10 33 的单位阵, 0 为 31 的全零向量, 具体方法见 计算机视觉中的多视图几何 第八章第 六节。
39、, Richard Hartley 等著, 韦穗等译) 。最后, 利用 P1、 P2通过三角法获得这两幅初始图 像上的匹配点对 (xj1,xj2) 的三维坐标 Xj。 0042 步骤 S313, 利用上面得到的三维点和除两幅初始图像之外的其他图像扩充监控场 景的三维点集, 得到监控场景的更加稠密的表示。具体地包括如下步骤。 0043 步骤 S3131, 判断是否所有的图像均已经参与计算。如果是, 则结束并输出重构出 的三维点集。如果否, 则继续执行步骤 S3132。 0044 步骤 S3132, 从未参与重构的图像中找到与已重构出的三维点匹配最好的图像, 并 计算出其对应的摄像机矩阵。 004。
40、5 设已重构出的三维点集为 X_set, 对应的在已计算出摄像机矩阵的图像中的特征 点的集合为 x_set, 从未参与重构的图像中找一张图像使得其特征点和 x_set 中的特征点 匹配数目最多 ; 设这些匹配上的特征点为 x_set1, 这些点对应的三维点集为 X_set 的子集 记作X_set1, 利用已知的X_set1和x_set1用直接线性变换计算出新加入的图像对应的摄像 机矩阵。 0046 步骤 S3133, 利用上面得到的最佳匹配的图像和已计算出摄像机矩阵的其他图像 的匹配结果扩充场景的三维点集, 并对得到的所有摄像机矩阵和三维点进行优化。 0047 具体地, 读取上面得到的最佳匹配。
41、的图像与已计算出摄像机矩阵的图像相匹配的 所有特征点 (即, 可以直接读取上述步骤 S2 中获得的匹配结果) , 并将这些点加入到 x_set 中。然后, 用三角法计算出新加入的点的三维坐标, 并将这些三维点坐标加入到 X_set 中。 0048 此外, 可采用光束平差法对得到的摄像机矩阵和三维点进行优化 : 将已计算出 的摄像机矩阵 Pi和三维点坐标 Xj作为变量进行迭代优化, 使得总反投影误差最小, 求解 (其中 n 为已经计算出摄像机矩阵的个数, m 为已重构出的三维 点的个数, xij为第 j 个特征点在第 i 个图像中的齐次坐标, 0049 这是一个非线性最小二乘问题, 可用 LM 。
42、算法求解 ( 用已计算出的 Pi和 Xj作为优化的初始值, 算法实现见论文 Kenneth Levenberg(1944).“A Method for the Solution of Certain Non-Linear Problems in Least Squares“.Quarterly of Applied Mathematics2:164168)。 0050 重复上述步骤 S3131 至 S3133 直至不能找到更多的三维点。 0051 在本发明的另一实施例中, 可以利用上述步骤 S2 中的图像匹配结果, 使用基于 离散置信传播和列文伯格 - 马夸尔特算法的 SFM 方法同样可以重构。
43、场景, 得到场景的三 维点集 X_set。具体的做法可参见 Crandall,D.,Owens,A.,Snavely,N.,Huttenlocher, D.P.:Discrete-continuous optimization for large-scale structure from motion. CVPR,2011, 此处不再详细描述。记参与重构的图像集合为 I_set, X_set 在 I_set 的中的特 征点集为 x_set。 0052 在本发明的又另一个实施例中, 还可以利用采集设备上的传感器获取的 GPS 位置 和姿态信息直接重构监控场景的三维点集。具体地, 首先获取每幅图像。
44、对应的采集设备的 说 明 书 CN 103824278 A 10 7/9 页 11 GPS 位置和姿态信息, 计算出每幅图像对应的摄像机矩阵 Pi。然后, 对于每两幅图像, 利用 其摄像机矩阵通过三角法获得每两幅图像上的匹配点对 (xj1,xj2)(步骤 S2 中已计算出的 匹配点对) 的三维坐标 Xj; 利用步骤 S3133 中描述的光束平差法对得到的摄像机矩阵和三 维点坐标进行优化。记用于场景重构的图像集合为 I_set(有的图像由于和其他图像都没 有匹配的特征点, 所以没有被用于场景重构) , 此时得到了场景的三维点集 X_set, 以及这些 点在 I_set 中的特征点集 x_set。。
45、 0053 应理解, 本领域的技术人员可以根据不同的需求和情况选择上面三种方法中的任 一种进行场景重构。例如, 如果使用带 GPS 和角度传感器的采集设备主动拍摄场景, 那么就 可以容易地获得传感器信息 (GPS 和角度传感器获得的位置和角度信息) , 从而就可以使用 第三种方法利用采集设备上的传感器获取的 GPS 位置和姿态信息简单、 高效地重构监控场 景的三维点集。但是, 如果缺失图片的角度、 位置和内参信息 (例如, 互联网图片、 室内采集 的图像等) , 就可以使用基于 IBA 框架的 SFM 方法重构监控场景的三维点集, 尽管这种方法 的计算速度较慢。而基于离散置信传播和列文伯格 -。
46、 马夸尔特算法的 SFM 方法适合大规模 的场景重建, 在重建的过程中可加入图片中的各种先验信息 (如图片中的直线) 使得重构更 精确, 这种方法对噪声 (如 GPS、 角度传感器等的噪声) 的鲁棒性更高。 0054 步骤 S4, 根据重构出的三维点集和待标定监控摄像机采集的图像计算待标定监控 摄像机的参数。具体地, 可包括如下步骤。 0055 步骤 S411, 将待标定监控摄像机采集的图像和参与场景重构的图像进行特征匹配 以获得特征点集。 0056 步骤 S412, 将步骤 S411 中获得的特征点集与重构出监控场景的三维点集的特征 点集进行匹配。 0057 将待标定监控摄像机采集的图像和 。
47、I_set 中每幅图像进行两两匹配。记匹配上的 特征点集为 x_set, 计算出 x_set和 x_set 的交集, 记为 x_result。x_result 中的点的 三维坐标已被恢复出来(记录在X_set中), 如果x_result中的点足够多, 则可以用这些点 计算出待标定的监控摄像机的摄像机矩阵。 0058 步骤S413, 判断x_result中的点的数目是否大于预设阈值。 在本发明的一个实施 例中, 该预设阈值为 10。 0059 步骤 S414, 如果 x_result 中的点的数目小于预设阈值, 则主动采集新的图像。 0060 如果 x_result 中的点的数目小于某个阈值, 。
48、则再采集和监控摄像机视场相近、 并 且和之前主动采集的图像的视场重叠区域较大的图像 (如监控摄像机安装高度为 10m, 而步 骤 S1 中的采集设备的架设高度为 2m, 则可以在高度为 4m、 6m、 8m 等位置再采集一些图像) 。 采集更多图像的目的是为了扩大监控场景的三维点集, 使得待标定的监控摄像机的图像能 和重建出来的监控场景的三维点集匹配上较多的点, 从而增加标定的精度。 0061 步骤 S415, 用新拍摄的图像扩充已重构的监控场景的三维点集 X_set 和 x_ result。 0062 具体地, 提取这些新采集图像的特征点并和 I_set 中所有图像进行两两匹配 (方 法同步。
49、骤S2) , 设这些匹配上的特征点为x_new, 记x_set2为x_set和x_new的交集 ; x_set2 对应的三维点集为 X_set 的子集, 记作 X_set2, 利用已知的 X_set2和 x_set2用直接线性变 换计算出这些新采集的图像对应的摄像机矩阵 ; 将新采集的图像加入 I_set, 将 x_new 中所 说 明 书 CN 103824278 A 11 8/9 页 12 有点加入到 x_set 中 ; 通过三角法计算出新加入点 (x_new 中除 x_set2的点为新加入的点) 的三维坐标, 并将这些点加入 X_set 中。 0063 重复上述步骤直至 x_result 中的点的数目大于预设阈值。 0064 步骤 S416, 如果 x_result 中的点的数目大于预设阈值, 计算待标定监控摄像机的 摄像机参数。 0065 找到 x_result 对应的三维点集合 X_result( 为 X_set 的一个子集 ) ; 利用 X_ result 和 x_result 用直。