CN200580023541.5
2005.07.15
CN1985223A
2007.06.20
授权
有权
授权|||实质审查的生效|||公开
G05D1/12(2006.01)
G05D1/12
雷声公司;
迈克尔·D·霍华德; 戴维·佩顿; 温德尔·布拉德肖; 蒂莫西·史密斯
美国马萨诸塞
2004.07.15 US 10/892,747
永新专利商标代理有限公司
林锦辉
一种系统和方法,用于进行地理和其它搜索任务的一组代理的分散协作控制。该方法是基于行为的,对于搜索问题使用了概率质点方法。代理被虚拟概率质点形式的概率分布所吸引,所述虚拟概率质点表示与所关注对象在地理区域或数据空间中的存在有关的假设。通过在周期性的更新消息之间,模拟其它组员和所关注对象的移动,来减小对可靠的高带宽通信的依赖。
1、 一种搜索系统,包括:第一装置,用于探测所关注的对象;第二装置,用于预测所述对象的行为;以及第三装置,用于响应于用于预测行为的所述装置,将所述第一装置指引到所述对象。2、 如权利要求1所述的发明,其中,所述第一,第二和第三装置布置在移动平台内。3、 如权利要求2所述的发明,其中,所述移动平台是机器人。4、 如权利要求3所述的发明,其中,所述移动平台是无人驾驶飞行器。5、 如权利要求1所述的发明,其中,用于预测行为的所述装置包括预测模型。6、 如权利要求5所述的发明,其中,所述模型包括采用一组质点形式的概率分布。7、 如权利要求6所述的发明,其中,所述第二装置包括用于移动所述质点以反映所述对象的行为的装置。8、 如权利要求7所述的发明,其中,所述第二装置包括多个模型,每一个都针对所述对象的一个假设身份。9、 如权利要求8所述的发明,还包括,用于接收对于所述对象位置的更新的装置。10、 如权利要求9所述的发明,还包括,用于接收对于所述对象身份的更新的装置。11、 如权利要求10所述的发明,其中,所述更新包含与所述对象有关的概率信息。12、 如权利要求11所述的发明,其中,所述更新的频率或有效性是不确定的。13、 如权利要求6所述的发明,其中,所述第一装置被指引在搜索区域内。14、 如权利要求13所述的发明,其中,所述第一,第二和第三装置布置在移动平台内。15、 如权利要求14所述的发明,其中,所述平台是机器人。16、 如权利要求15所述的发明,其中,所述系统包括多个机器人。17、 如权利要求16所述的发明,其中,所述模型适于指引每个机器人搜索所述搜索空间的一个唯一的区域。18、 如权利要求17所述的发明,其中,所述模型适于使用质点形式的概率分布,来指引每个机器人搜索所述搜索空间的一个唯一的区域。19、 如权利要求18所述的发明,其中,所述模型适于使用将所述质点划分为每个搜索器一个组的群集技术,来指引每个机器人搜索所述搜索空间的一个唯一的区域。20、 如权利要求18所述的发明,其中,所述模型适于以唯一的方式将机器人分配给质点组。21、 如权利要求18所述的发明,其中,所述模型适于以由每个机器人使用所述机器人的预定特性而计算得到的方式,将所述机器人分配给质点组。22、 如权利要求19所述的发明,其中,所述群集技术是K均值。23、 如权利要求19所述的发明,其中,所述质点的所述概率分布是群集。24、 如权利要求23所述的发明,其中,每个所述机器人都被指引,以搜索由所述模型所选择的各自的群集。25、 如权利要求24所述的发明,其中,每个机器人的每个第三装置适于将其所述第一装置指引向所述质点概率分布的质心。26、 如权利要求24所述的发明,其中,所述模型适于将每个机器人的探测器指引到在由所述模型所选择的群集中的质点中所选择的一个质点上。27、 如权利要求26所述的发明,其中,每个机器人消除表示被其传感器和其它搜索器的传感器所观测的搜索空间的区域的质点。28、 如权利要求26所述的发明,其中,每个被消除的质点在一段预定时间之后再次出现。29、 如权利要求26所述的发明,其中,所述模型适于,随着每个机器人获得更多与所关注对象有关的信息,修改与所关注的对象有关的质点的分布或密度,以更好地表示新信息。30、 如权利要求18所述的发明,包括用于使用所述质点跟踪所述对象的装置。31、 如权利要求16所述的发明,还包括用于接收与其它机器人有关的更新的装置。32、 如权利要求31所述的发明,还包括用于在对于其它搜索器的活动的更新之间的时间间隔中,模拟所述其它搜索器的活动的装置。33、 如权利要求32所述的发明,其中,所述更新包括与其它搜索器的位置有关的信息。34、 如权利要求32所述的发明,其中,所述更新包括与其它搜索器的当前关注焦点有关的信息。35、 如权利要求34所述的发明,其中,所述当前关注焦点是搜索器的物理传感器的注意地域。36、 如权利要求32所述的发明,其中,所述更新包括与其它搜索器以前的关注焦点有关的信息。37、 如权利要求32所述的发明,其中,所述更新包括与其它搜索器的速度有关的信息。38、 如权利要求32所述的发明,其中,所述更新包括与其它搜索器未来移动有关的信息。39、 如权利要求32所述的发明,其中,所述更新包括与由其它搜索器所确定的对象特性有关的信息。40、 如权利要求1所述的发明,其中,所述行为是在3D物理空间中的移动。41、 如权利要求1所述的发明,其中,所述行为包括改变可观测的特性。42、 如权利要求1所述的发明,其中,所述行为是在非物理数据空间中的移动。43、 一种搜索系统,包括:多个移动平台;探测器,其安装在每个平台上,用于探测所关注的对象;以及处理器,其安装在每个平台上,用于预测所述对象的行为,及用于响应于所预测的行为,将各个平台指引到所述对象。44、 如权利要求43所述的发明,其中,所述处理器执行包括预测模型的软件。45、 如权利要求44所述的发明,其中,所述模型包括采用一组质点形式的概率分布。46、 如权利要求45所述的发明,其中,所述模型移动所述质点以反映所述对象的行为。47、 如权利要求46所述的发明,其中,所述模型包括多个模型,每一个都针对所述对象的一个假设身份。48、 如权利要求47所述的发明,其中,所述模型适于接收对于所述对象的位置的更新。49、 如权利要求48所述的发明,其中,所述模型适于接收对于所述对象的身份的更新。50、 如权利要求49所述的发明,其中,所述更新包含与所述对象有关的概率信息。51、 如权利要求50所述的发明,其中,所述更新的频率或有效性是不确定的。52、 如权利要求43所述的发明,其中,所述探测器被指引在搜索区域内。53、 如权利要求52所述的发明,其中,所述平台是机器人。54、 如权利要求53所述的发明,其中,所述系统包括多个机器人。55、 如权利要求54所述的发明,其中,所述模型适于指引每个机器人搜索所述搜索空间的一个唯一的区域。56、 如权利要求55所述的发明,其中,所述模型适于使用质点形式的概率分布,来指引每个机器人搜索所述搜索空间的一个唯一的区域。57、 如权利要求56所述的发明,其中,所述模型适于使用将所述质点划分为每个搜索器一组的群集技术,来指引每个机器人搜索所述搜索空间的一个唯一的区域。58、 如权利要求57所述的发明,其中,所述群集技术是K均值。59、 如权利要求57所述的发明,其中,所述模型适于以唯一的方式将机器人分配给质点组。60、 如权利要求57所述的发明,其中,所述模型适于以由每个机器人采用所述机器人的预定特性而计算得到的方式,将所述机器人分配给质点组。61、 如权利要求60所述的发明,其中,所述质点的所述概率分布是群集。62、 如权利要求61所述的发明,其中,每个所述机器人被指引,以搜索由所述模型所选择的各自的群集。63、 如权利要求62所述的发明,其中,每个机器人的每个第三装置适于将其所述第一装置指引向所述质点概率分布的质心。64、 如权利要求62所述的发明,其中,所述模型适于将每个机器人的探测器指引到在由所述模型所选择的群集中的质点中所选择的一个质点上。65、 如权利要求64所述的发明,其中,每个机器人消除表示被其传感器和其它搜索器的传感器所观测的搜索空间区域的质点。66、 如权利要求64所述的发明,其中,每个被消除的质点在一段预定时间之后再次出现。67、 如权利要求64所述的发明,其中,所述模型适于,随着每个机器人获得更多与所关注的对象有关的信息,修改与所关注的对象有关的质点的分布或密度,以更好地表示新信息。68、 如权利要求43所述的发明,包括用于使用所述质点跟踪所述对象的装置。69、 如权利要求53所述的发明,还包括用于接收与其它机器人有关的更新的装置。70、 如权利要求69所述的发明,还包括用于在对于其它搜索器的活动的更新之间的时间间隔中,模拟所述其它搜索器的活动的装置。71、 如权利要求70所述的发明,其中,所述更新包括与其它搜索器的位置有关的信息。72、 如权利要求70所述的发明,其中,所述更新包括与其它搜索器的当前关注焦点有关的信息。73、 如权利要求72所述的发明,其中,所述当前关注焦点是搜索器的物理传感器的注意地域。74、 如权利要求70所述的发明,其中,所述更新包括与其它搜索器以前的关注焦点有关的信息。75、 如权利要求74所述的发明,其中,所述更新包括与其它搜索器的速度有关的信息。76、 如权利要求75所述的发明,其中,所述更新包括与其它搜索器未来的移动有关的信息。77、 如权利要求76所述的发明,其中,所述更新包括与由其它搜索器所确定的对象特性有关的信息。78、 如权利要求43所述的发明,其中,所述行为是在3D物理空间中的移动。79、 如权利要求43所述的发明,其中,所述行为包括改变可观测的特性。80、 如权利要求43所述的发明,其中,所述行为是在非物理数据空间中的移动。81、 一种搜索方法,包括步骤:提供探测器,用于探测所关注的对象;采用用于预测所述对象的行为的模型,处理从所述探测器而来的数据;以及响应于由所述模型输出的数据,将所述探测器指引到所述对象。
用于由分布式部件自动搜索的系统和方法 发明领域 本发明涉及用于进行自动搜索的系统和方法。更具体的,本发明涉及用于以自主代理(autonomous agent)执行自动地理搜索的系统和方法。 背景技术 机器人越来越多地用于枯燥、肮脏和危险的工作中。对于许多不同的应用而言,需要有一种用于在协作任务中控制3到20个机器人组的系统或方法,并具有最少的人为监管。机器人组被用于在水下彻底地搜索海湾中的水雷,并且搜索者使用机器人监视海洋化学物质的变化。NASA正在考虑可能使用机器人组的任务。商业机器人变得更便宜,并将被用于调查、搜索和营救,以及其它应用。 在这点上,机器人通常由一个集中系统来控制。集中计划人员通常确定如何在机器人中划分工作,并以特定的协调基本数据单元(primitive)来分配任务。每个机器人都在搜索空间具有一个状态。与每个机器人的位置有关的数据必须传送到集中处理器,用于协调分析并传送回机器人。 这种集中方法是带宽密集的,因此不易于量测。这限制了该方法用于更多所要求的当前和将来的应用。 因此,在本技术领域中需要一种分散的方法,其允许机器人自主地但协作地运行,且在它们之间具有最少的数据流。 发明内容 在本技术领域中的该需求由本发明来解决,其提供了一种有效的自动分布式搜索机制,用于任何要求对数据空间进行搜索以寻找特定类型的目标/对象的应用。在最通常的实施中,本发明的系统包括探测器,用于探测所关注的对象;模型,用于预测该对象的行为;及机制,用于响应于模型的数据输出,将探测器指引到对象。 在一个特定应用中,本发明的系统布置在多个移动平台上。平台可以是机器人、无人驾驶飞行器(UAV)或作为实例的移动数据结构。在最佳模式中,模型是预测模型,适于以一组质点的形式提供对象或目标的概率分布特征。这些质点被移动以反映对象的行为。可以包括多个模型以解释所述对象的其它假设身份或特征。当接收到对象行为和/或特征(例如位置)的更新时,在每个移动平台中的模型也被相应的更新。这些质点被分组到群集(cluster)中,每个机器人被指定在各自群集的质心开始其搜索。 附图说明 图1是示出根据本说明的每个机器人的通信功能行为的说明性实施的流程图; 图2是示出根据本说明的说明性实施例的每个机器人所执行的传感器管理功能的流程图; 图3是根据本说明的每个机器人所执行的移动控制的说明性方法的流程图; 图4是根据本说明的移动控制方法的可替换实施; 图5示出了适于实现本发明的说明性的机器人控制体系结构的框图; 图6是根据本说明的在信息更新几分钟后的模拟情况; 图7是根据本说明的在信息更新十分钟后的模拟情况;以及 图8是对图6和7中所示情况的仿真的屏幕截图。 具体实施方式 现在将参照附图来对说明性的实施例和示例性的应用加以说明,以公开本发明有利的说明。 尽管在此参照用于特定应用的说明性实施例来描述本发明,但应理解本发明并不限于此。本领域技术人员获取了在此提供的说明之后,会认知在其范围内的其他修改、应用和实施例,以及本发明具有显著效用的其他领域。 根据本说明,以质点的动态群集表示对象存在的概率。每个质点(其仅存在于存储器内)具有相同的恒定值,因此密集的质点群集意谓着在该区域中存在对象的高概率。当获知了一个新对象的可能性时,每个机器人在其存储器内在其自己的区域地图上产生质点分布。如果它得到以前被告知的对象的更新时,它按照表示新信息的需要调整质点分布。质点具有类型,还可以具有优先级或权重。 每个机器人从系统用户处接收周期性的更新,包括与一个或多个已知或可疑对象有关的概率信息,机器人被分派任务以寻找该对象并识别它。更新可以包括对象可能属于的一个或多个可能的分类,每一个都具有相关的非零似然性。例如,移动对象可以是坦克(30%的可能性),或轿车(60%),或校车(10%)。如果没有传送分类,机器人会对每个可能性给予相等的似然性。每个接收到该消息的机器人会产生一个概率质点群集来表示每个可能性。例如,对象表示坦克的30%的概率导致了在存储器中产生坦克类的30个质点,其可能是与在对象被见到的地图上的位置有关的伪高斯分布。同样,将会在同一位置产生60个轿车类质点和10个大客车类质点。 此后机器人会周期性地运行一个行为模型(例如,多假设质点滤波器),其将根据其类型,在该模型预测的该类型对象的移动方向上移动每个质点,并带有一定随机性。因此,大客车质点通常会向附近的学校移动,尽管在缺乏周期性更新的情况下它们会向房屋或更远学校散开。 根据本发明,每个机器人都被吸引到密集的质点区域;这驱使了机器人的搜索行为。每个机器人独立地在其自己的存储器中将这些质点进行群集,并选择一个群集来进行搜索。机器人通过使用用于产生并移动质点的同一算法,还通过模拟彼此的行为来协调它们的搜索,所述彼此的行为是通过与它们位置有关的不经常的消息来更新的。这种模拟方法减少了算法对精确通信的依赖性。每个机器人用产生K个群集,每个机器人一个群集的群集技术将敌人或目标概率质点进行群集。K均值是此种群集技术的简单实例,尽管更智能的和自适应性的群集技术可以得到更好的性能。每个机器人采用平均值与它们当前位置最接近的群集。实际上,机器人选择唯一的搜索任务分配,其由质点的位置来表示。 当飞行器搜索一个区域时,在此区域中的任何质点都会在一段时间内从其内部地图中移去。这些质点稍后会返回到该内部地图中,除非发现对象。本发明还使用了在应该对其保持监视的地理区域上的质点的静态类。这种质点不移动,并且总是在被移去一段固定时间后又复原。 对本发明的目的来说,术语“机器人”应该意谓着具有移动性、传感器和通信能力的定位自主代理。机器人可以位于任意类型的维度空间中(例如,数据库)。路线跟踪,障碍物回避,及传感器管理由本发明的算法所依据的下层程序来管理。本发明做出与向何处去有关的上层决定,但并不试图提供与如何到达那里有关的细节。对本发明的目的来说,术语“对象”应该意谓着要被搜索的所关注的某物。对象可以是固定的,比如建筑物,或者是移动的,如车辆。其可以有也可以没有已知的身份。在此提供的大部分实例是假设身份是不确定的,且搜索的目的是识别该对象。当对象是诸如建筑物之类的固定物体时,通常其身份仅是次要的。将会进入或离开该建筑物的实体(entity)是要主要关注的。 在一个说明性实施例中,本发明的方法包括在图1-4中所图示的步骤。在图1-4中所示的方法表示在每个机器人上并行进行的行为,每个行为都运行在“质点存储器”上,其在称为“位置地图”的本地数据结构中。 图1是示出根据本说明的每个机器人的通信功能行为的说明性实施的流程图。方法10包括监视无线电通信的步骤12。在刚一接收到消息时,该方法在其步骤14检查在该消息中的对象更新。由于每个机器人在更新之间都模拟其队友的移动,一旦其确实接收到更新,它将必须更正该队友的位置。由于随着队友的移动,它还移去了质点以反映已经搜索过的区域,如果队友的更新与该模型显著不同,则该机器人还将必须更正质点分布。因此,如果在步骤16没有接收到对象的更新,则该方法检查与队友位置有关的更新。如果该消息是队友位置的更新,那么在步骤18,更新队友位置。如果不是,系统就继续监视无线电通信。 另一方面,如果该消息包括对象的更新,则该方法检查以明确这是否是当前模拟的对象。如果是,那么在步骤20按照需要移动与当前模拟的对象有关的质点,作为减小的不确定性的结果,其减小了离散度(dispersion)。否则,在步骤22,对于每个新的假设产生一个质点群集。在此连接中,“质点移动”指根据对象身份的每个假设的移动方式的某个模型来移动表示对象的概率分布的过程。例如,多假设质点滤波器(如在雷达跟踪文献中所述)将是可以实现此目的的一种方式。当接收到新信息时由于不确定性减小了,质点离散度也减小。 图2是示出根据本说明的说明性实施例的每个机器人所执行的传感器管理功能的流程图。传感器管理功能和通信功能两者都作用在概率质点的总体上。如在图5中所示及在以下的体系结构部分所述的,传感器管理功能和通信功能并行工作,在质点存储器上独立运行。如下所述,移动控制功能受到这些质点的影响。在图2中,在步骤32,机器人检查其传感器。在步骤34,如果没有发现对象,那么在步骤36,系统通过根据效率概率移去在其传感器覆盖区(footprint)下的那些质点,来更新其质点。 另一方面,在步骤34,如果发现了对象,那么在步骤38,系统决定是否跟踪该对象。如果系统决定跟踪该对象,那么在步骤40,所有相关的质点都被转换到所发现的对象的类型。如果系统决定不跟踪该对象,所有与对象有关的质点都被删除。是否跟踪的决定最终由用户做出,或者通过明确的通信,或者是隐含地,如为某种对象类型或环境条件所定义的策略。根据本说明,并行执行移动和传感。这些机器人子系统通过作用于质点存储器而间接地通信。 质点管理 根据本说明,用于组员之间的通信需求被最小化,并且如果通信中断,搜索性能会适度地降低。这是由于每个组员都模拟所有其它组员,并且一旦在视觉上或者是通过通信而证实了一个位置,就更新该模型。暂时的通信中断意谓着随着时间的过去,队友模型的预测会偏离队友飞行器的实际移动。该偏离是飞行器速度和机动性、遇到不可预测的障碍的似然性、以及在用于如何搜索给定群集质点的决策功能中所使用的随机性的数量的函数。图3和4示出了组织给定群集的搜索的一种可能的方式。 图3是根据本说明的每个机器人所执行的移动控制的说明性方法的流程图。移动控制回路不断地检查状态,并确保机器人在正确方向上移动。如图3所示,在步骤52,系统检查计时器,来确定是否到了质点的再群集的时间。再群集计时可以用真实的计时器实现,或是在质点上的某些度量的结果来实现,例如动态负载平衡算法。如果到了再群集的时间,那么在步骤54,质点被再群集,并且在步骤56,路点(waypoint)被设置在该群集的质心。任务分配是通过将该群集划分为K个不同的子组(subset),一组给K个机器人中的一个来进行搜索而实现的。实现此目的的一种方式是通过例如K均值的集群算法。 在步骤52,如果机器人确定没有到进行再群集的时间,则在步骤56,方法50运行移动控制回路。在步骤58,移动控制回路检查机器人是否已经到达或通过了路点。如果是,那么在步骤60,回路选择下一个路点,然后在步骤62和64按照到达那里的需要来调整前进方向(heading)。如果在步骤58机器人还没有到达路点,那么回路前进到步骤62,在此机器人检查其当前前进方向是否会将其带到该路点。如果前进方向正确,回路返回到再群集步骤的时间(步骤52)。否则,在步骤64,在返回到步骤52之前更新前进方向。 该行为可以与已经输入到的飞行器传动装置的最终控制信号其它行为或功能并行进行,例如障碍物回避。 在步骤60选择路点的步骤可以通过依据重要性(权重)、距离、和其它因素对在当前群集中质点进行排序,并选择最佳质点前往来实现。其它因素可以包括机器人的机动性考虑,例如前进到质点所需的最大转弯半径。 对质点进行群集的步骤(步骤54)包括采用以下方式将质点划分成K个唯一的子组:即所有机器人都清楚哪个机器人应搜索哪个子组或群集。在下面标题为质点群集的部分中详细说明了一种此类方法。 在一些例子中,机器人的选定群集可以是小片状(patchy)的,这些片可以被广阔的区域分离。在下面图4中所示的L2群集会揭示这些子片(sub-patch)。对每个子片依次进行搜索。对于每个子片,机器人每次选择质点之一而前往,随着其前进而清除质点(图2的每个步骤36),直到质点的密度减小到足以使其它子片变得更为迫切。 图4是根据本说明的移动控制方法的可替换实施。在图4的实施70中,系统在第一群集L1中执行质点的第二次群集。在第一群集L1中的每个子群集L2在移动到下一个子群集之前被搜索。因此,除用于L2群集的额外步骤之外,图4与图3相似。 如在图4中所示,在完成在组员之间划分整个搜索空间的第1层群集(L1)之后,每个组员将进行第2层群集(L2)。L2在成员的L1群集中找到子群集。进行L2群集的一种方式是使用K均值算法,其中K等于某个小的任意值,其大到足以找到密集的子群集。在下面称为“质点群集”的部分中对“K均值”进行了说明。K的数值完全依赖于域的需要。在不会脱离本说明的范围的情况下,更智能的群集算法可以是参数化的,以不依赖于域的方式找到群集的正确大小。 因此,在图4中,如果在步骤72确定是进行L1再群集的时间,那么在步骤74执行L1 K均值。如在上述的步骤52,再群集计时可以用真实的计时器或在质点上的一些度量的结果来实施,例如动态平衡算法。接下来,如在上述步骤56中,在步骤76将路点设定为等于L1群集的质心。在步骤78,机器人确定其是否已经到达或通过了当前路点。如果没有,则在步骤92,其进行检查以确定该机器人是在前往该路点。如果前进方向是正确的,其返回到步骤72。如果不是,其返回步骤72之前,在步骤94更新前进方向。 如果在步骤78确定已经到达当前路点,则方法70在步骤80检查L1质点的L2群集是否已经完成。如果没有,在步骤84执行L2群集,步骤86将路点设定为所选择的L2子群集的质心。无论选择哪个子群集是没有关系的,或者选择可以是基于诸如在该子群集中的质点的优先级或数量等因素而做出的。一旦选择了路点,该方法就移动到步骤92,按如上所述检查前进方向。如果步骤80确定L2子群集已经产生,那么步骤82测试是否到了从机器人正在搜索的L2子群集移动到另一个的时间。 可以有许多标准用于该决策。在任何情况下,系统应全面搜索每个区域,而不会忽略其它区域。如果步骤82判定到了移动的时间,在步骤88选择一个新的子群集,在步骤86设定路点,然后在步骤92检查前进方向。否则,机器人会通过在该子群集中选择一个新的路点来继续搜索同一L2子群集,与在图3的步骤60中所述的方式相同。 在最佳模式中,选择子片的决策是在该片中质点类型的优先级、在该片中质点数量、和该片的密度的函数。完成此目的的一种简单方式是通过对在每片中的质点的总和,依据其优先级进行加权,并以边界圆的区域来划分。选择首先前往的质点的一种方法是对该子片中的质点,依据其优先级等级和其与机器人的距离进行排序,并前往在该列表上的第一个。该方案导致了不确定的路线,其对于对手来说是更加不可预测的,但比起其它方案来说,会需要更高的机动能力且能效较低。在不会脱离本说明的范围的情况下,可以预见到用于特定应用的更智能的方案,计算最大限度清除最高优先级质点的轨迹(trajectory)。 至于何时放弃一个子片并前往另一个的决定是再次基于在前面段落中所述的子片决策函数的,但为了避免情况逆转(flip-flop),合理的是继续搜索当前子片,直到其决策函数值(例如,上述加权的总和)比下一个最佳片的值低某个阈值。 随着时间的过去,为模拟每个对象的移动而产生的质点分布由行为模型来移动。它们的移动具有一些随机性,并随着它们的移动而散开,以反映不断增加的与位置有关的不确定性。 图1示出了当接收到与这些对象中的一个有关的信息时,该对象的分布会在某种程度上进行收缩,降低其离散度,以反映对于该对象的位置的更高的可信度。消息还可以排除对象所属的一个或多个分类。这发生在另一搜索平台发现该物体并对其进行识别的时候。当机器人搜索由表示某些假设的群集所覆盖的区域,并且没有发现任何东西时,就会不太可信,因为该对象可能已经躲避了侦察。在此情况下,那些假设会被缩减但不会被排除。 操作图像的一致性 根据本说明,当告知每个机器人一个对象的位置时,机器人组成其自己的质点分布。在产生伪高斯分布时,再次包含了随机因素。随着每个机器人的移动,在其传感器扫描下,其清除具有某些概率的质点。同样,每一个机器人都模拟其队友的移动(例如,对最后报告的位置、速度、和前进方向的直接扩展),并清除其自身存储器内的位于队友的传感器扫描之下的质点。在每个机器人的存储器中,在与同一对象有关的同一假设的质点分布之间可以有一些变化。这意谓着每个机器人可以稍微不同地进行群集,并在稍有不同的时间决定进行再群集,即使它们运行同样的决策度量。 可控制的参数是在机器人状态报告之间的时间、在这些状态报告中共享的信息量、以及质点放置、移动和移去的概率和随机性。对于每个区域,参数会稍微不同,需要实验来确定最佳参数。 搜索效率 有效地搜索一个区域以搜寻移动对象所需的飞行器数量是搜索区域的地理范围、搜索机器人的速度和被搜寻对象的最大可能移动速度、以及搜索机器人在其传感器范围内探测到一个对象的可能性的函数。 体系结构 图5示出了适于执行本发明的说明的说明性的机器人控制体系结构的框图。在图5中,矩形框表示硬件,圆形或椭圆形框表示软件程序。每个机器人都具有系统100和机载传感器104,系统100包括无线电收发机102,机载传感器104包括作为实例的激光雷达(LADAR)105、红外线设备(IR)106和照相机107。另外,系统100包括信号和数据处理器110(以虚线示出),连同全球定位传感器108、移动控制子系统112和移动传动装置122。 无线电设备102从其它机器人和/或中央控制站接收消息,并将该消息传递到处理器110,用于在消息处理软件程序10中进行处理。在上面相对于图1对消息处理软件10进行了说明。从机载传感器104而来的数据被图2的传感器处理程序30所处理。通过根据组模型44或敌人模型46而作用于质点存储器48,来并行地移动和感测。 组模型和敌人模型被预先载入机器人,可以是也可以不是由经验获知的。敌人模型是按照需要产生、保存和移动概率分布,以适当的表示从用户和其它搜索队友而来的输入报告的行为模型。其模拟所关注对象的移动。组模型是参与到共同搜索中的其它飞行器的单独的行为模型,其是通过从其它队友而来的位置报告而进行更新的。组模型估计队友的移动,并移动质点以表示由其它队友所搜索的区域。这些分布传送到搜索区域选择器50,其执行如上相对于图3和4所述的,L1和L2群集的群集和选择。L1群集的选择依赖于与每个队友所在位置有关的组模型信息。 一旦选择了一个群集来进行搜索,选择路点函数70就在该群集内选择目的地。在此情况下,我们将该选择与其它所关注内容相融合,如在行为裁定单元112中回避障碍物等等。该决策由移动判别器120做出,其可以采用所引用的David Payton的发明来实现。速度和转动速率命令由移动判别器120输出,并被移动转动装置122使用,以控制机器人移动的方向和速度。 操作 “电子智能”数据(ELINT)是从该区域中人们而来的观测报告、智能分析理论、以及从卫星、飞行器和其它来源而来的传感器数据的融合。ELINT的更新表示不确定的信息;即使某物看起来举止可疑,但必须得到进一步证实其是否是敌人的坦克、民用车辆、校车等等。根据本说明,当接收到此类消息时,每个机器人或UAV将其以表示每个假设的质点群集的形式记录在称为位置地图的本地动态数据结构中。质点的不同分类表示与对象身份有关的不同理论,并与威胁等级或优先级相关联。 在ELINT的更新之间,每个UAV使用用于执行此类实体的行为模型的简单多假设质点滤波器来移动质点。例如,表示校车的质点可以移向学校地带,那些表示敌人坦克的质点会被引向潜在的目标,例如可疑的油库或电厂。这在下面的图6中被示出。 图6是根据本说明的在ELINT更新几分钟后的模拟情况。在右上角的UAV得到与可能的目标连同其身份的似然性(轿车、坦克、或大客车)有关的ELINT(电子智能)报告。每个UAV在其质点存储器中产生概率质点来表示该目标。精确的质点位置在每个UAV上是不同的,但分布在统计上是相等的。在该图中,城镇东南的高速公路和几个确定的建筑物是行为模型的吸引物。尽管质点分布与其它UAV的本地质点存储器在统计上相等,但各个质点的位置并不相同。 图7是根据本说明的在ELINT更新十分钟后的模拟情况。每个假设的概率质点分布由适当的行为模型独立地进行移动。应注意到为了使质点达到这样的散布,在一段时间内将没有对对象位置的更新。 图8是对图6和7中所示情况的计算机仿真的屏幕截图。使用了称为参与者平台(PlayerStage)(Gerkey等人2003)的公共域仿真。根据本说明配置一组UAV,其每一个都具有实际的覆盖区、GPS、多通道无线电设备、和使用置信检测的简单对象识别。在该说明性的实施例中,UAV控制系统在3个行为之间执行裁定:前往点,回避障碍物,和持续转向。裁定的结果是给移动传动装置的速度和转动速率命令(Payton等人1990),所述移动传动装置遵循相当真实的约束。在参与者平台中,每个代理都具有其自己的专用存储器,任何要共享的信息都必须在消息中明确的发送。 在图8右侧的三个黑窗口表示每个UAV的位置地图。应注意到,在这些地图中的质点分布并不相同。在左上象限中的UAV(UAV具有传感器扇形)被在其位置地图中的质点群集吸引到该区域,并探测到一个坦克。在右下象限中的UAV正好识别出一辆校车,并消除其位置地图中它的质点(顶上的一个)。其它两个UAV还没有从它们的地图中删除表示该车辆的质点。在右下的UAV现在正在沿着道路前往左下象限,在此处刚刚出现了一组质点,其表示刚由ELINT报告的坦克。 需要进行通信以接收对于目标和队友的位置的周期性ELINT更新。但在这些区域中的通信是不可靠的,并受制于干扰、天线未对准(在机动期间)、以及大气的影响。解决该问题的本发明的方法是使每个UAV在通信事件之间,概率性地模拟组员和目标的移动。这使得搜索性能在通信信号丢失期间适度地降低。 如上所述,当飞行器搜索时,其根据探测概率,从在其传感器覆盖区下的区域中的其位置地图中移去质点。在超时之后,那些质点会回到地图中。由于每个UAV具有略微不同的组,质点的清除没有在队友之间传送。作为替代,每个UAV使用队友移动的模型在其自己的地图中清除质点。当接收到报告队友位置的消息时,如果其位置与依据该模型而预测的显著不同,则可以更正质点地图。如果对象被发现,则证实其身份并且消除所有表示不正确假设的质点。对象信息被传送到其它飞行器,它们对其自己的专用位置地图做出相类似的改变。 为保持静态地理区域处于监视之下,可以使用特定类的静态质点。此类质点不移动,并总是在超时过后返回。通过调整该质点返回的速度,可以对多长时间搜索一次一个区域进行统计控制。 质点群集 每个UAV都被吸引到质点密集的区域。这驱动了搜索行为。为避免必须与队友对特定搜索区域或任务分配进行协商,每个UAV用同一群集算法来划分质点,并选择最接近的。这实施了简单的分散任务分配技术。UAV通过模拟彼此的行为来协调它们的搜索,通过不经常的(每隔几秒钟)与它们位置有关的消息来更新所述行为。 K均值算法(Lloyd 1982)用于对敌人概率质点进行群集。简要而言,如果概率质点以矢量{p1,...pn},pi∈IR2来表示,那么目的是找到K个群集,每一个都由矢量mk∈IR2,k={1...K}来表示,并且数据的分配是针对群集的,从而形成“紧凑的”群集。我们选择K作为UAV的数量;每个UAVi获得平均值与其当前位置最接近的群集。群集最小化了目标函数H: 在此,c将质点pi映射到位于mc(i)的群集上,H是对于通过映射c而表示每个质点的失真的测量。该算法通过将mc(i)设定为UAVi的位置来进行初始化。在每次重复时,将每个概率质点pi分配给最接近的群集位置mc(i),然后将每个mc(i)移动到其被分配的质点的质心,降低失真H,直到在某点不再有进一步提高为止;映射c停止变化。由于每个UAVi被映射到唯一的mc(i),这导致了对UAV进行唯一的质点分配。 在不脱离本说明的范围的情况下,可以使用其它的群集技术。标准的K均值算法不能保证每个平均值都具有分配给它的确定数量的点-一个群集可以以没有包含点而结束。此外,对于考虑诸如给予特定类型质点的优先级或紧迫性权重之类的参数(即pi∈IRd,d>2)而言,其也是有用的。 群集内搜索 根据本说明,当UAV到达其自己分配的群集的质心时,它在该群集内选择要移动前往的概率质点。这与前往最近的质点一样简单,但我们还要根据机动能力的约束,考虑质点优先级或紧迫性。因此UAV应在检查大客车假设之前,先检查完坦克假设质点。这是通过依据优先级、距离、和偏离当前速度矢量的偏航角来对在群集中的质点进行排序而实现的。较高优先级、较近距离、和所必需的较小的偏航角是最佳的。为增加一些更多的随机性,下一个路点可以是前20%的最佳质点的随机选择。 在对抗搜索中,希望避免运行会被敌人所采用的预测搜索模式。上述过程导致了极为不可预测的移动。当然,在可预测性与效率之间存在折衷,在许多方式中,搜索模式越不可预测,能效就越低。该折衷能通过在上述“下一个质点”排序中调整在偏航标准上的权重,和/或改变在随机选择中的质点数量来进行控制。 此情况是动态的。新的对象被报告,老的对象被识别并且有时被作为目标。所有数据都合并成具有优先级的质点的公共操作图像,所以做出搜索决策所需的推理是相当简单的,并服从基于行为的方法。 在不经常进行信息更新的基础上,质点分布被每个UAV独立的产生、移动和清除。当到了再群集的时间时,在被每个UAV所保存的位置图像之间的差异会导致稍微不同的群集位置(mc(i)),其会导致意外的行为。再群集的决策可以基于与在搜索所处理的质点分布中的变化有关的度量。另一种方法是使用变化得更慢的群集技术,或者是在再群集之前需要更多的协调。 信息一致发布 当ELINT消息通告一个新目标时,每个UAV基于该消息的信息组成其自己的质点伪随机分布。随后的ELINT消息可能会也可能不会更新该目标的位置和/或身份。随着每个UAV的移动,其清除在其传感器覆盖区下的具有某种概率的质点。同样地,其模拟队友的移动-当前地从最后报告的位置、速度、和前进方向进行的简单线性插值-并清除在每个队友传感器扫描之下的质点。 在图8中的右侧,每一个窗口对应三个UAV中的一个,示出了在其位置地图上的质点位置。在这三者之间的比较示出了在每个队友所模拟的质点分布之间的较小的随机变化。这意谓着当飞行器确定进行再群集时,它们的群集会在某种程度上改变。 通常,在UAV之间的群集中的差异是较小的,系统产生良好的性能。即使是每隔几分钟目标主要突然出现在地图上三个位置区域中,并主要在公路上行驶的事实也是如此。尽管这通常意谓着目标彼此靠近,但可由UAV每隔5秒钟发送仅包括位置和速度的情况报告来获得较好的结果。偶尔差异会变得相当大,从而产生显得无结果的搜索模式。在位置一致性的标题下的一些因素会促成这个问题。可控制的参数是在UAV状态报告之间的时间、在那些状态报告中共享的信息量、以及质点被放置、移动和移去的概率和随机性。参数值的最佳选择应依据目标彼此间有多近。目标越近,UAV就越近,每个UAV的位置图像就必须更加适当地不相互抵触。 另一个UAV行为的准确预测需要另一飞行器用以做出其决策的每个变量值的准确认知。优选的是避免对所要求的这种高带宽可靠通信的依赖性。较好的解决方法是对于每个UAV,更频繁的传送其当前位置和速度。在大多数情况下,当经常进行对象的ELINT更新时,能够调整UAV的报告速度,以实现在每个UAV位置图像之间的非常好的一致性。但如果ELINT更新被干扰或正好没有所关注对象的新信息,UAV就需要协调它们的再群集。根据本说明,再群集操作被周期性的通告,在那时每个UAV通告其通过位置的简短历史记录。这会是比不断保持一致的质点地图所需的消息短得多和不频繁得多的消息。每个UAV随后会修改其位置地图并进行再群集。这会导致非常相似的任务分配。在最坏情况下,可以在再群集之后增加证实步骤,以确保每个UAV计算得出的群集中心合理地相类似。 总之,在协调性变得不一致时,通信带宽能够增加。可以基于本地信息来预测这些时间,所述本地信息包括在UAV之间的距离和接收到位置更新时的速度。 本发明的终端用户会体验更集中和目标性更强的搜索。当前使用的系统性的或其它强力搜索机制(例如将区域按地理划分并运行搜索模式)必须依赖速度和/或所增加的资源,以增大成功的概率。本发明提高了发现目标对象的概率,并且既不升级搜索平台的物理容量,又不增加平台的数量。其通过为搜索平台提供一种用于在时域内缩小搜索区域的机制来实现此被增加值在概率上的增大。尽管不是必需的,通过对概率群集进行再分组以更接近地表示新信息,基于位置信息的更新时间进一步减小了该搜索区域,并使搜索更加集中。 本发明对于复杂的和动态变化的情况尤其有用,报告按照时间周期输入,并且每个报告都具有前述对象的更新信息或新对象的消息,每个对象都具有与它们身份有关的几个假设。本发明的方法使用了非常简单直接的方法来将这些报告融合成公共操作图像。通过使用放置于地图上的概率质点的总体,将对象的位置和可能的身份转换为公共表示,其驱动搜索。本发明减轻了对复杂融合引擎和任务管理的需要;融合通过概率的自然重叠来实现。因此,通过增大成功搜索的概率而又不增加任务成本,此功能会给终端用户带来价值。 本发明还提供了由许多独立用户引导的分布式搜索组的可能性。例如,如果6个UAV正在飞过一个军事战役地带,整个战场的指挥官会提供可疑的敌人行为的报告。UAV会成为总体支持资源,一旦敌人被报告,其就自动组织以搜索敌人。该组织可以是自动的-无需中央控制设备,所述中央控制设备由操作员填充要求并决定最好如何使用它们。服务可以是在优先级基础上的-例如攻击的主攻(maineffort)会具有比支援单元更高的优先级,这会反映在由每个单元的要求所导致的,放置在地图上的质点的优先级中。 最协作的控制技术要求在机器人之间频繁的和可靠的通信。作为替代的,本发明通过在更新之间依靠模拟其它队友的行为,来减轻这种依赖性。这提供了搜索效率的适度降低。 搜索任务的自动划分为用户提供对多个机器人的间接高级控制。用户通过指定在要搜索区域上的概率分布,以直观的方式直接表达搜索任务。这是在当前系统上的进步,在当前系统中,用户必须明确指定一组机器人,并分配给它们任务。然而,用户能以很高的准确性来指定哪个区域要被搜索及具有何种优先级。通过使用行为模型实际地移动表示移动目标的质点,本发明将此带到了另一个层面。 可以包括多个模型,每一个针对目标的一个假设身份。模型以多种数据来更新,所述数据例如包括位置、身份、其它搜索器当前的关注焦点、其它搜索器以前的关注焦点、其它搜索器的速度、其它搜索器将来的移动和成功。搜索可以在物理三维(3D)空间、虚拟数据结构或其它应用中执行。 这样,在此已经参考用于具体应用的具体实施例,对本发明进行了描述。获知了本说明的本领域技术人员会认识到,其他改进应用和实施例也在其范围内。 因此,所附的权利要求意欲覆盖在本发明范围内的任何及所有此类应用、改进和实施例。
《用于由分布式部件自动搜索的系统和方法.pdf》由会员分享,可在线阅读,更多相关《用于由分布式部件自动搜索的系统和方法.pdf(33页珍藏版)》请在专利查询网上搜索。
一种系统和方法,用于进行地理和其它搜索任务的一组代理的分散协作控制。该方法是基于行为的,对于搜索问题使用了概率质点方法。代理被虚拟概率质点形式的概率分布所吸引,所述虚拟概率质点表示与所关注对象在地理区域或数据空间中的存在有关的假设。通过在周期性的更新消息之间,模拟其它组员和所关注对象的移动,来减小对可靠的高带宽通信的依赖。 。
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有经营许可证编号:粤ICP备2021068784号-1