一种路段类型推测方法.pdf

上传人:1*** 文档编号:1572256 上传时间:2018-06-25 格式:PDF 页数:17 大小:2.06MB
返回 下载 相关 举报
摘要
申请专利号:

CN201410542082.2

申请日:

2014.10.14

公开号:

CN104331422A

公开日:

2015.02.04

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20141014|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

广州市香港科大霍英东研究院

发明人:

丁烨; 谭浩宇; 高民; 倪明选

地址:

511458广东省广州市南沙区南沙资讯科技园软件楼N301室

优先权:

专利代理机构:

广州三环专利代理有限公司44202

代理人:

麦小婵; 郝传鑫

PDF下载: PDF下载
内容摘要

本发明公开了一种路段类型推测方法,包括:采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征;从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征;将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量;根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型。本发明推测精确性更高,使用更灵活。

权利要求书

权利要求书
1.  一种路段类型推测方法,其特征在于,包括:
采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征;
从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征;
将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量;
根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型。

2.  如权利要求1所述的路段类型推测方法,其特征在于,在根据所述待推测路段的伪特征建立逻辑回归模型,得到所述待推测路段的第一初步推测类型之后,还包括:
从所述道路网络的拓扑结构数据中,获取所述待推测路段与所述待推测路段的相连路段之间的连接角度;
根据获取的连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第二初步推测类型。

3.  如权利要求2所述的路段类型推测方法,其特征在于,在得到所述待推测路段的第二初步推测类型之后,还包括:
根据所述第一初步推测类型和第二初步推测类型,采用集成算法计算得到所述待推测路段的最终推测类型。

4.  如权利要求1~3中任意一项所述的路段类型推测方法,其特征在于,所述采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数 据进行统计,从而获取所述待推测路段的统计特征,具体包括:
采集多辆汽车行驶的历史轨迹数据;
采用ST-Matching算法将所述多辆汽车行驶的历史轨迹数据与所述道路网络匹配,获得多辆汽车在待推测路段上行驶的历史轨迹数据;
对所述多辆汽车在待推测路段上行驶的历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。

5.  如权利要求1~3中任意一项所述的路段类型推测方法,其特征在于,在将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量之后,还包括:
采用主成分分析法降低所述伪特征矢量的维度。

6.  如权利要求2或3所述的路段类型推测方法,其特征在于,在从所述道路网络的拓扑结构数据中,获取所述待推测路段与所述待推测路段的相连路段之间的连接角度之前,还包括:
根据道路网络的拓扑结构数据和道路网络中已知路段类型的路段,采用贝叶斯分类器进行学习,得到一个多项式分布;其中,所述多项式分布是当相连接的两个路段为不同的连接角度时,当其中一个路段为不同类型时,另一路段类型的概率分布。

7.  如权利要求6所述的路段类型推测方法,其特征在于,所述根据所述连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第二初步推测类型,具体包括:
根据获取的连接角度和所述待推测路段的相连路段的类型,利用所述多项式分布,采用贝叶斯算法计算得到所述待推测路段的第二初步推测类型。

8.  如权利要求3所述的路段类型推测方法,其特征在于,所述集成算法为 堆叠泛化算法、支持向量机算法、随机森林算法中的任一种。

9.  如权利要求1~3所述的路段类型推测方法,其特征在于,所述多辆汽车具体为多辆出租车;则所述统计特征包括出租车行驶速度、空闲出租车密度、载客出租车密度和载客事件次数。

10.  如权利要求1~3所述的路段类型推测方法,其特征在于,所述拓扑特征包括路段长度、累积摆动值、相连路段和相邻路段。

说明书

说明书一种路段类型推测方法
技术领域
本发明涉及众包地图数据处理领域,尤其涉及一种路段类型推测方法。
背景技术
近几年,众包地图服务已经成为公共商业地图服务提供商(例如谷歌地图)的一个有力的竞争者。不同于由小数量的专业人员通过遥感影像和测量数据生成的商业地图服务,众包地图是由成千上万的注册用户维护的,这些用户通过精密的地图编辑器不断地创建和更新地图,例如增加、删除和修改道路。因此众包地图服务比现有的商业地图服务更符合当今地图服务变化趋势。例如,据报道,世界最大的众包地图项目开放街道地图(Open Street Map,OSM),相比其他所有的数据集,可以提供更丰富和更及时的地图更新数据。
与其他众包应用相似,众包地图服务依赖于众多用户的贡献,但是这些贡献是易于出错的,而且有严重的一致性问题。其主要的原因是地图的主题(例如,道路和地区)通常是很复杂的,这样会导致制作既特征丰富又容易使用的地图编辑器很难。为了解决这个问题,现有技术提出了一个名字为CrowdAtlas的地图更新系统,用于通过大量的历史车辆轨迹探测地图的改变。CrowdAtlas可以从轨迹中自动的生成新的或已经改变的道路的形状,生成的道路形状作为地图编辑器的推荐,用户可以直接使用生成的道路或者根据经验稍稍调整,从而减少用户绘制道路的耗时。
为了使众包地图的地图数据能够更适用于通用应用(例如导航系统和旅游规划服务),就不仅需要提供道路网络的拓扑结构和道路形状,还需要提供路段类型(例如,高速干道、主/次干道、住宅区道路等)。其中,通常一条道路包括若干路段,这些路段有可能是不同的类型。另一方面,为减少手动编辑地图 的耗时,还需要提供合适的推荐以供用户选择。
现有技术主要是根据大量的车辆历史轨迹生成道路形状,但是还没有解决根据车辆历史轨迹推测路段类型的问题。但是,道路的元数据对于很多基于地图的应用(例如导航系统和旅游规划服务)是非常重要的。典型的道路的元数据包括宽度、速度限制、方向限制和进入限制。这些元数据可以通过路段的类型有效地反应出来。例如:高速干道比次级干道的速度限制更高;高速干道或主干道通常是双向道路,但是住宅区道路很可能是单向道。因此,为了提高众包地图服务的质量,用户不仅需要提供道路形状,还需要提供路段类型。那么,为更进一步减少用户更新众包地图的耗时,就需要使道路类型的分类过程自动化。另外,虽然道路类型有可能直接从道路网络拓扑结构推测出来,例如,有相同方向的路段也许有相同的类型。但是,这种推测通常不是很精确。
发明内容
本发明所要解决的技术问题在于,提供一种路段类型推测方法,其精确性更高。
为了解决上述技术问题,本发明提供了一种路段类型推测方法,包括:
采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征;
从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征;
将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量;
根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型。
进一步的,在根据所述待推测路段的伪特征建立逻辑回归模型,得到所述待推测路段的第一初步推测类型之后,还包括:
从所述道路网络的拓扑结构数据中,获取所述待推测路段与所述待推测路 段的相连路段之间的连接角度;
根据获取的连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第二初步推测类型。
进一步的,在得到所述待推测路段的第二初步推测类型之后,还包括:
根据所述第一初步推测类型和第二初步推测类型,采用集成算法计算得到所述待推测路段的最终推测类型。
其中,所述采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征,具体包括:
采集多辆汽车行驶的历史轨迹数据;
采用ST-Matching算法将所述多辆汽车行驶的历史轨迹数据与所述道路网络匹配,获得多辆汽车在待推测路段上行驶的历史轨迹数据;
对所述多辆汽车在待推测路段上行驶的历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。
进一步的,在将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量之后,还包括:
采用主成分分析法降低所述伪特征矢量的维度。
进一步的,在从所述道路网络的拓扑结构数据中,获取所述待推测路段与所述待推测路段的相连路段之间的连接角度之前,还包括:
根据道路网络的拓扑结构数据和道路网络中已知路段类型的路段,采用贝叶斯分类器进行学习,得到一个多项式分布;其中,所述多项式分布是当相连接的两个路段为不同的连接角度时,当其中一个路段为不同类型时,另一路段类型的概率分布。
其中,所述根据所述连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第二初步推测类型,具体包括:
根据获取的连接角度和所述待推测路段的相连路段的类型,利用所述多项式分布,采用贝叶斯算法计算得到所述待推测路段的第二初步推测类型。
本发明采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史 轨迹数据进行统计,从而获取所述待推测路段的统计特征;从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征;将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量;根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型。本发明既考虑了车辆行驶的历史轨迹数据,又考虑了道路网络拓扑结构数据,因此推测精性高,推测结果更准确。另外同时还将相连路段类型之间的限制关系作为推测依据,整合两个初步推测结果,获得最终推测结果,精确度更高。其中采用的模型或算法可以使用其他算法灵活替换,灵活性更高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的路段类型推测方法的一个实施例的流程示意图;
图2是历史轨迹的采样点数据类型的示意图;
图3是两个相邻路段的示意图;
图4是路段类型的示意图;
图5是本发明提供的路段类型推测方法的另一实施例的流程示意图
图6是本发明提供的路段类型推测方法的又一实施例的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明提供的路段类型推测方法的一个实施例的流程示意图,如图1所示,包括步骤:
S101、采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。
具体的,步骤S101包括步骤:采集多辆汽车行驶的历史轨迹数据;采用ST-Matching算法将将所述多辆汽车行驶的历史轨迹数据与道路网络匹配,获得多辆汽车在待推测路段上行驶的历史轨迹数据;对所述多辆汽车在待推测路段上行驶的历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。
其中,路段是指两个十字路口或交叉点之间的道路,高速公路或大道在两个十字路口或交叉点之间可能会有两个不同的路段,因为这两个路段的方向可能不同。
其中,所述多辆汽车具体为多辆出租车,可以理解的,所述汽车也可以为其他类型汽车,例如公交车、私人车等。因其他类型车辆的数据不容易提取,特别是私人车辆涉及个人隐私问题,因此优选采用出租车的历史轨迹数据。其中,历史轨迹数据是一系列的采样点,采样频率可以为20s,每个采样点的数据具体可以如图2所示,包括:出租车ID、时间戳、经纬度、速度、角度、状态。时间戳是采样时的时间戳,经纬度是采样点的GPS定位位置,速度是出租车采样时的速度,角度是出租车采样时的驾驶方向,状态是指出租车采样时处于载客状态还是空闲状态。
其中,采样点的位置信息仅仅是经纬度信息,从经纬度信息无法得知该采样点属于哪一路段,因此,需要采用地图匹配方法将采样点数据与道路网络匹配,获取属于每一路段的采样点数据。本文采用ST-Matching算法进行匹配。ST-Matching算法是在2009年的地理信息系统国际期刊(International Journal of Geographical Information Science)上第352-361页刊登的文献名为“Map-matching for low-sampling-rate gps trajectories”的文献中公开的地图匹配算法。ST-Matching既考虑了道路网络的空间几何/拓扑结构,又考虑了历史轨迹的时间特征。ST-Matching适合于处理低抽样率的轨迹,例如 本文的出租车轨迹。
在历史轨迹和道路网络进行匹配后,获取属于待推测路段的采样点数据,对其进行统计,获得待推测路段的统计特征。其中,所述统计特征包括出租车行驶速度、空闲出租车密度、载客出租车密度和载客事件次数。待推测路段的统计特征是通过对属于待推测路段的采样点数据统计和计算得到的,即对一系列采样点的出租车ID、时间戳、经纬度、速度、角度、状态数据进行统计和计算得到的。
S102、从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征。
其中,道路网络的拓扑结构数据是已知的。采用表示道路网络,其中,τi是路段i,道路网络中共有n条路段。对于网络的拓扑结构可以采用连接矩阵Mn×n表示,连接矩阵中的元素mij表示路段i和路段j的连接角度,如果路段i和路段j不连接,元素mij为0。
其中,待推测路段的拓扑特征包括路段长度、累积摆动值、相连路段和相邻路段。其中,路段长度和累积摆动值可以有效地反映路段类型。例如,大道通常是进入限制的,并且距离较长,中间很少有交叉点。因此,有很长长度的路段很可能是大道或者高速干道。类似的,根据经验,当一个路段是直的时候,其更可能是大道,而当一个路段是弯曲的时候,其不太可能是大道。因此采用累积摆动值反应路段类型。对于相连路段,是指两个路段拓扑相连接。如果一个路段有很多相连路段,那么此路段几乎不可能是大道,因为大道或者高速干道通常是在出口或入口有一两个相连路段。对于相邻路段,是指两个路段之间的距离小于预设阈值(具体是一个小的距离,例如10米)。路段距离的计算是通过计算路段线段的每个顶点之间的平均距离。如图3所示,τ1是路段1,τ2是路段2,路段1和路段2的顶点之间的距离为d1、d2、d3,取d1、d2、d3的平均值作为路段1和路段2之间的距离,当距离小于预设阈值时,判定为两个路段相邻。两个相邻的路段可能会有相同的类型,特别是当他们方向相反时。
S103、将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量。
具体的,待推测路段的统计特征和拓扑特征共同构成待推测路段的伪特征。因为,采集数据较多,因此,伪特征矢量的维数有可能很大,因此,在步骤S103之后还可以包括步骤:采用主成分分析法降低所述伪特征矢量的维度,获取伪特征矢量的主成分。
S104、根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型。
其中,路段类型是按照国家标准规定的路段类型,如图4所示,包括7种路段类型。第一初步推测类型是逻辑回归模型输出的推测结果。
本发明实施例公开了一种路段类型推测方法,包括:采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征;从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征;将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量;根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型。本发明实施例既考虑了车辆行驶的历史轨迹数据,又考虑了道路网络拓扑结构数据,因此推测精性高,推测结果更准确。
图5是本发明提供的路段类型推测方法的另一实施例的流程示意图,如图5所示,包括步骤:
S201、采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。
具体的,步骤S201包括步骤:采集多辆汽车行驶的历史轨迹数据;采用ST-Matching算法将将所述多辆汽车行驶的历史轨迹数据与道路网络匹配,获得多辆汽车在待推测路段上行驶的历史轨迹数据;对所述多辆汽车在待推测路段上行驶的历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。
其中,路段是指两个十字路口或交叉点之间的道路,高速公路或大道在两个十字路口或交叉点之间可能会有两个不同的路段,因为这两个路段的方向可能不同。
其中,所述多辆汽车具体为多辆出租车,可以理解的,所述汽车也可以为其他类型汽车,例如公交车、私人车等。因其他类型车辆的数据不容易提取,特别是私人车辆涉及个人隐私问题,因此优选采用出租车的历史轨迹数据。其中,历史轨迹数据是一系列的采样点,采样频率可以为20s,每个采样点的数据具体可以如图2所示,包括:出租车ID、时间戳、经纬度、速度、角度、状态。时间戳是采样时的时间戳,经纬度是采样点的GPS定位位置,速度是出租车采样时的速度,角度是出租车采样时的驾驶方向,状态是指出租车采样时处于载客状态还是空闲状态。
其中,采样点的位置信息仅仅是经纬度信息,从经纬度信息无法得知该采样点属于哪一路段,因此,需要采用地图匹配方法将采样点数据与道路网络匹配,获取属于每一路段的采样点数据。本文采用ST-Matching算法进行匹配。ST-Matching算法是在2009年的地理信息系统国际期刊(International Journal of Geographical Information Science)上第352-361页刊登的文献名为“Map-matching for low-sampling-rate gps trajectories”的文献中公开的地图匹配算法。ST-Matching既考虑了道路网络的空间几何/拓扑结构,又考虑了历史轨迹的时间特征。ST-Matching适合于处理低抽样率的轨迹,例如本文的出租车轨迹。
在历史轨迹和道路网络进行匹配后,获取属于待推测路段的采样点数据,对其进行统计,获得待推测路段的统计特征。其中,所述统计特征包括出租车行驶速度、空闲出租车密度、载客出租车密度和载客事件次数。待推测路段的统计特征是通过对属于待推测路段的采样点数据统计和计算得到的,即对一系列采样点的出租车ID、时间戳、经纬度、速度、角度、状态数据进行统计和计算得到的。
S202、从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待 推测路段的拓扑特征。
其中,道路网络的拓扑结构数据是已知的。采用表示道路网络,其中,τi是路段i,道路网络中共有n条路段。对于网络的拓扑结构可以采用连接矩阵Mn×n表示,连接矩阵中的元素mij表示路段i和路段j的连接角度,如果路段i和路段j不连接,元素mij为0。
其中,待推测路段的拓扑特征包括路段长度、累积摆动值、相连路段和相邻路段。其中,路段长度和累积摆动值可以有效地反映路段类型。例如,大道通常是进入限制的,并且距离较长,中间很少有交叉点。因此,有很长长度的路段很可能是大道或者高速干道。类似的,根据经验,当一个路段是直的时候,其更可能是大道,而当一个路段是弯曲的时候,其不太可能是大道。因此采用累积摆动值反应路段类型。对于相连路段,是指两个路段拓扑相连接。如果一个路段有很多相连路段,那么此路段几乎不可能是大道,因为大道或者高速干道通常是在出口或入口有一两个相连路段。对于相邻路段,是指两个路段之间的距离小于预设阈值(具体是一个小的距离,例如10米)。路段距离的计算是通过计算路段线段的每个顶点之间的平均距离。如图3所示,τ1是路段1,τ2是路段2,路段1和路段2的顶点之间的距离为d1、d2、d3,取d1、d2、d3的平均值作为路段1和路段2之间的距离,当距离小于预设阈值时,判定为两个路段相邻。两个相邻的路段可能会有相同的类型,特别是当他们方向相反时。
S203、将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量。
具体的,待推测路段的统计特征和拓扑特征共同构成待推测路段的伪特征。因为,采集数据较多,因此,伪特征矢量的维数有可能很大,因此,在步骤S103之后还可以包括步骤:采用主成分分析法降低所述伪特征矢量的维度,获取伪特征矢量的主成分。
S204、根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型。
其中,路段类型是按照国家标准规定的路段类型,如图4所示,包括7种路段类型。第一初步推测类型是逻辑回归模型输出的推测结果,是第一个初步推测结果。
但是,因为有可能伪特征数据较少,导致第一初步推测类型不是很准确,本发明实施例还将路段的连接角度作为推测依据。
S205、从所述道路网络的拓扑结构数据中,获取所述待推测路段与所述待推测路段的相连路段之间的连接角度。
通常,相连路段的连接角度很大程度上决定了两个路段类型的关系。例如,在一个普通城市的道路网络中,如果两个路段的连接角度为180°,他们通常是同一名字的同一道路。但是当连接角度变小时,例如连接角度为90°,那么这两条路通常是不同名字的不同道路。因此,已知一个路段的类型和与相连路段的连接角度,可以在一定程度上推测相连路段的类型。
S206、根据获取的连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第二初步推测类型。
其中,第二初步推测类型是通过连接角度和相连路段的类型推测得到的第二个初步推测结果。
S207、根据所述第一初步推测类型和第二初步推测类型,采用集成算法计算得到所述待推测路段的最终推测类型。
其中,集成算法用一些相对较弱的学习模型独立地就同样的样本进行训练,然后把结果整合起来进行整体预测。本实施例中的集成算法是堆叠泛化算法、支持向量机算法、随机森林算法中的任一种,可以灵活变化。最终推测类型是综合考虑第一初步推测类型和第二初步推测类型后,获得的最后推测结果。
本发明实施例公开了一种路段类型推测方法,包括:采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征;从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征;将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量;根据待推测路段的伪特 征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型;从所述道路网络的拓扑结构数据中,获取所述待推测路段与所述待推测路段的相连路段之间的连接角度;根据获取的连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第二初步推测类型。本发明实施例既考虑了车辆行驶的历史轨迹数据,又考虑了道路网络拓扑结构数据,因此推测精性高,推测结果更准确。同时还将相连路段类型之间的限制关系作为推测依据,整合两个初步推测结果,获得最终推测结果,精确度更高。
图6是本发明提供的路段类型推测方法的又一实施例的流程示意图,如图6所示,包括步骤:
S301、采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。
具体的,步骤S301包括步骤:采集多辆汽车行驶的历史轨迹数据;采用ST-Matching算法将将所述多辆汽车行驶的历史轨迹数据与道路网络匹配,获得多辆汽车在待推测路段上行驶的历史轨迹数据;对所述多辆汽车在待推测路段上行驶的历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。
其中,路段是指两个十字路口或交叉点之间的道路,高速公路或大道在两个十字路口或交叉点之间可能会有两个不同的路段,因为这两个路段的方向可能不同。
其中,所述多辆汽车具体为多辆出租车,可以理解的,所述汽车也可以为其他类型汽车,例如公交车、私人车等。因其他类型车辆的数据不容易提取,特别是私人车辆涉及个人隐私问题,因此优选采用出租车的历史轨迹数据。其中,历史轨迹数据是一系列的采样点,采样频率可以为20s,每个采样点的数据具体可以如图2所示,包括:出租车ID、时间戳、经纬度、速度、角度、状态。时间戳是采样时的时间戳,经纬度是采样点的GPS定位位置,速度是出租车采样时的速度,角度是出租车采样时的驾驶方向,状态是指出租车采样时处于载客状态还是空闲状态。
其中,采样点的位置信息仅仅是经纬度信息,从经纬度信息无法得知该采样点属于哪一路段,因此,需要采用地图匹配方法将采样点数据与道路网络匹配,获取属于每一路段的采样点数据。本文采用ST-Matching算法进行匹配。ST-Matching算法是在2009年的地理信息系统国际期刊(International Journal of Geographical Information Science)上第352-361页刊登的文献名为“Map-matching for low-sampling-rate gps trajectories”的文献中公开的地图匹配算法。ST-Matching既考虑了道路网络的空间几何/拓扑结构,又考虑了历史轨迹的时间特征。ST-Matching适合于处理低抽样率的轨迹,例如本文的出租车轨迹。
在历史轨迹和道路网络进行匹配后,获取属于待推测路段的采样点数据,对其进行统计,获得待推测路段的统计特征。其中,所述统计特征包括出租车行驶速度、空闲出租车密度、载客出租车密度和载客事件次数。待推测路段的统计特征是通过对属于待推测路段的采样点数据统计和计算得到的,即对一系列采样点的出租车ID、时间戳、经纬度、速度、角度、状态数据进行统计和计算得到的。
S302、从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征。
其中,道路网络的拓扑结构数据是已知的。采用表示道路网络,其中,τi是路段i,道路网络中共有n条路段。对于网络的拓扑结构可以采用连接矩阵Mn×n表示,连接矩阵中的元素mij表示路段i和路段j的连接角度,如果路段i和路段j不连接,元素mij为0。
其中,待推测路段的拓扑特征包括路段长度、累积摆动值、相连路段和相邻路段。其中,路段长度和累积摆动值可以有效地反映路段类型。例如,大道通常是进入限制的,并且距离较长,中间很少有交叉点。因此,有很长长度的路段很可能是大道或者高速干道。类似的,根据经验,当一个路段是直的时候,其更可能是大道,而当一个路段是弯曲的时候,其不太可能是大道。因此采用 累积摆动值反应路段类型。对于相连路段,是指两个路段拓扑相连接。如果一个路段有很多相连路段,那么此路段几乎不可能是大道,因为大道或者高速干道通常是在出口或入口有一两个相连路段。对于相邻路段,是指两个路段之间的距离小于预设阈值(具体是一个小的距离,例如10米)。路段距离的计算是通过计算路段线段的每个顶点之间的平均距离。如图3所示,τ1是路段1,τ2是路段2,路段1和路段2的顶点之间的距离为d1、d2、d3,取d1、d2、d3的平均值作为路段1和路段2之间的距离,当距离小于预设阈值时,判定为两个路段相邻。两个相邻的路段可能会有相同的类型,特别是当他们方向相反时。
S303、将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量。
具体的,待推测路段的统计特征和拓扑特征共同构成待推测路段的伪特征。因为,采集数据较多,因此,伪特征矢量的维数有可能很大,因此,在步骤S103之后还可以包括步骤:采用主成分分析法降低所述伪特征矢量的维度,获取伪特征矢量的主成分。
S304、根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型。
其中,路段类型是按照国家标准规定的路段类型,如图4所示,包括7种路段类型。
但是,因为有可能伪特征数据较少,导致第一初步推测类型不是很准确,本发明实施例还将路段的连接角度作为推测依据。
S305、从所述道路网络的拓扑结构数据中,获取所述待推测路段与所述待推测路段的相连路段之间的连接角度。
通常,相连路段的连接角度很大程度上决定了两个路段类型的关系。例如,在一个普通城市的道路网络中,如果两个路段的连接角度为180°,他们通常是同一名字的同一道路。但是当连接角度变小时,例如90°,那么这两条路通常是不同名字的不同道路。因此,已知一个路段的类型和与相连路段的连接 角度,可以在一定程度上推测相连路段的类型。
S306、根据道路网络的拓扑结构数据和道路网络中已知路段类型的路段,采用贝叶斯分类器进行学习,得到一个多项式分布。
其中,所述多项式分布是当相连接的两个路段为不同的连接角度时,当其中一个路段为不同类型时,另一路段类型的概率分布。具体的,多项式分布是当相连接的两个路段为不同的连接角度时,当其中一个路段为不同类型时,另一路段的类型分别为如图4所示的类型1-7的概率。
S307、根据获取的连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第二初步推测类型。
具体的,步骤S206具体包括步骤:根据获取的连接角度和所述待推测路段的相连路段的类型,利用所述多项式分布,采用贝叶斯算法计算得到所述待推测路段的第二初步推测类型。
S308、根据所述第一初步推测类型和第二初步推测类型,采用集成算法计算得到所述待推测路段的最终推测类型。
其中,集成算法用一些相对较弱的学习模型独立地就同样的样本进行训练,然后把结果整合起来进行整体预测。本实施例中的集成算法是堆叠泛化算法、支持向量机算法、随机森林算法中的任一种,可以灵活变化。
本发明实施例公开了一种路段类型推测方法,包括:采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征;从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征;将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量;根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型;从所述道路网络的拓扑结构数据中,获取所述待推测路段与所述待推测路段的相连路段之间的连接角度;根据道路网络的拓扑结构数据和道路网络中已知路段类型的路段,采用贝叶斯分类器进行学习,得到一个多项式分布;根据获取的连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第 二初步推测类型。本发明实施例既考虑了车辆行驶的历史轨迹数据,又考虑了道路网络拓扑结构数据,因此推测精性高,推测结果更准确。同时还将相连路段类型之间的限制关系作为推测依据,整合两个初步推测结果,获得最终推测结果,精确度更高。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要 符合与本文所公开的原理和新颖特点相一致的最宽的范围。

一种路段类型推测方法.pdf_第1页
第1页 / 共17页
一种路段类型推测方法.pdf_第2页
第2页 / 共17页
一种路段类型推测方法.pdf_第3页
第3页 / 共17页
点击查看更多>>
资源描述

《一种路段类型推测方法.pdf》由会员分享,可在线阅读,更多相关《一种路段类型推测方法.pdf(17页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 104331422 A(43)申请公布日 2015.02.04CN104331422A(21)申请号 201410542082.2(22)申请日 2014.10.14G06F 17/30(2006.01)(71)申请人广州市香港科大霍英东研究院地址 511458 广东省广州市南沙区南沙资讯科技园软件楼N301室(72)发明人丁烨 谭浩宇 高民 倪明选(74)专利代理机构广州三环专利代理有限公司 44202代理人麦小婵 郝传鑫(54) 发明名称一种路段类型推测方法(57) 摘要本发明公开了一种路段类型推测方法,包括:采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述。

2、历史轨迹数据进行统计,从而获取所述待推测路段的统计特征;从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征;将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量;根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型。本发明推测精确性更高,使用更灵活。(51)Int.Cl.权利要求书2页 说明书10页 附图4页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书2页 说明书10页 附图4页(10)申请公布号 CN 104331422 ACN 104331422 A1/2页21.一种路段类型推测方法,其。

3、特征在于,包括:采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征;从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征;将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量;根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型。2.如权利要求1所述的路段类型推测方法,其特征在于,在根据所述待推测路段的伪特征建立逻辑回归模型,得到所述待推测路段的第一初步推测类型之后,还包括:从所述道路网络的拓扑结构数据中,获取所述待推测路段与所述待推测路段的相连路段之间的连。

4、接角度;根据获取的连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第二初步推测类型。3.如权利要求2所述的路段类型推测方法,其特征在于,在得到所述待推测路段的第二初步推测类型之后,还包括:根据所述第一初步推测类型和第二初步推测类型,采用集成算法计算得到所述待推测路段的最终推测类型。4.如权利要求13中任意一项所述的路段类型推测方法,其特征在于,所述采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征,具体包括:采集多辆汽车行驶的历史轨迹数据;采用ST-Matching算法将所述多辆汽车行驶的历史轨迹数据与所述道路网络。

5、匹配,获得多辆汽车在待推测路段上行驶的历史轨迹数据;对所述多辆汽车在待推测路段上行驶的历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。5.如权利要求13中任意一项所述的路段类型推测方法,其特征在于,在将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量之后,还包括:采用主成分分析法降低所述伪特征矢量的维度。6.如权利要求2或3所述的路段类型推测方法,其特征在于,在从所述道路网络的拓扑结构数据中,获取所述待推测路段与所述待推测路段的相连路段之间的连接角度之前,还包括:根据道路网络的拓扑结构数据和道路网络中已知路段类型的路段,采用贝叶斯分类器进行学习,得到一个多。

6、项式分布;其中,所述多项式分布是当相连接的两个路段为不同的连接角度时,当其中一个路段为不同类型时,另一路段类型的概率分布。7.如权利要求6所述的路段类型推测方法,其特征在于,所述根据所述连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第二初步推测类型,具权 利 要 求 书CN 104331422 A2/2页3体包括:根据获取的连接角度和所述待推测路段的相连路段的类型,利用所述多项式分布,采用贝叶斯算法计算得到所述待推测路段的第二初步推测类型。8.如权利要求3所述的路段类型推测方法,其特征在于,所述集成算法为堆叠泛化算法、支持向量机算法、随机森林算法中的任一种。9.如权利要。

7、求13所述的路段类型推测方法,其特征在于,所述多辆汽车具体为多辆出租车;则所述统计特征包括出租车行驶速度、空闲出租车密度、载客出租车密度和载客事件次数。10.如权利要求13所述的路段类型推测方法,其特征在于,所述拓扑特征包括路段长度、累积摆动值、相连路段和相邻路段。权 利 要 求 书CN 104331422 A1/10页4一种路段类型推测方法技术领域0001 本发明涉及众包地图数据处理领域,尤其涉及一种路段类型推测方法。背景技术0002 近几年,众包地图服务已经成为公共商业地图服务提供商(例如谷歌地图)的一个有力的竞争者。不同于由小数量的专业人员通过遥感影像和测量数据生成的商业地图服务,众包地。

8、图是由成千上万的注册用户维护的,这些用户通过精密的地图编辑器不断地创建和更新地图,例如增加、删除和修改道路。因此众包地图服务比现有的商业地图服务更符合当今地图服务变化趋势。例如,据报道,世界最大的众包地图项目开放街道地图(Open Street Map,OSM),相比其他所有的数据集,可以提供更丰富和更及时的地图更新数据。0003 与其他众包应用相似,众包地图服务依赖于众多用户的贡献,但是这些贡献是易于出错的,而且有严重的一致性问题。其主要的原因是地图的主题(例如,道路和地区)通常是很复杂的,这样会导致制作既特征丰富又容易使用的地图编辑器很难。为了解决这个问题,现有技术提出了一个名字为Crow。

9、dAtlas的地图更新系统,用于通过大量的历史车辆轨迹探测地图的改变。CrowdAtlas可以从轨迹中自动的生成新的或已经改变的道路的形状,生成的道路形状作为地图编辑器的推荐,用户可以直接使用生成的道路或者根据经验稍稍调整,从而减少用户绘制道路的耗时。0004 为了使众包地图的地图数据能够更适用于通用应用(例如导航系统和旅游规划服务),就不仅需要提供道路网络的拓扑结构和道路形状,还需要提供路段类型(例如,高速干道、主/次干道、住宅区道路等)。其中,通常一条道路包括若干路段,这些路段有可能是不同的类型。另一方面,为减少手动编辑地图的耗时,还需要提供合适的推荐以供用户选择。0005 现有技术主要是。

10、根据大量的车辆历史轨迹生成道路形状,但是还没有解决根据车辆历史轨迹推测路段类型的问题。但是,道路的元数据对于很多基于地图的应用(例如导航系统和旅游规划服务)是非常重要的。典型的道路的元数据包括宽度、速度限制、方向限制和进入限制。这些元数据可以通过路段的类型有效地反应出来。例如:高速干道比次级干道的速度限制更高;高速干道或主干道通常是双向道路,但是住宅区道路很可能是单向道。因此,为了提高众包地图服务的质量,用户不仅需要提供道路形状,还需要提供路段类型。那么,为更进一步减少用户更新众包地图的耗时,就需要使道路类型的分类过程自动化。另外,虽然道路类型有可能直接从道路网络拓扑结构推测出来,例如,有相同。

11、方向的路段也许有相同的类型。但是,这种推测通常不是很精确。发明内容0006 本发明所要解决的技术问题在于,提供一种路段类型推测方法,其精确性更高。0007 为了解决上述技术问题,本发明提供了一种路段类型推测方法,包括:0008 采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行说 明 书CN 104331422 A2/10页5统计,从而获取所述待推测路段的统计特征;0009 从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征;0010 将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量;0011 根据待推测路段的伪特征。

12、矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型。0012 进一步的,在根据所述待推测路段的伪特征建立逻辑回归模型,得到所述待推测路段的第一初步推测类型之后,还包括:0013 从所述道路网络的拓扑结构数据中,获取所述待推测路段与所述待推测路段的相连路段之间的连接角度;0014 根据获取的连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第二初步推测类型。0015 进一步的,在得到所述待推测路段的第二初步推测类型之后,还包括:0016 根据所述第一初步推测类型和第二初步推测类型,采用集成算法计算得到所述待推测路段的最终推测类型。0017 其中,所述采集多辆汽车在待推。

13、测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征,具体包括:0018 采集多辆汽车行驶的历史轨迹数据;0019 采用ST-Matching算法将所述多辆汽车行驶的历史轨迹数据与所述道路网络匹配,获得多辆汽车在待推测路段上行驶的历史轨迹数据;0020 对所述多辆汽车在待推测路段上行驶的历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。0021 进一步的,在将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量之后,还包括:0022 采用主成分分析法降低所述伪特征矢量的维度。0023 进一步的,在从所述道路网络的拓扑结构数据。

14、中,获取所述待推测路段与所述待推测路段的相连路段之间的连接角度之前,还包括:0024 根据道路网络的拓扑结构数据和道路网络中已知路段类型的路段,采用贝叶斯分类器进行学习,得到一个多项式分布;其中,所述多项式分布是当相连接的两个路段为不同的连接角度时,当其中一个路段为不同类型时,另一路段类型的概率分布。0025 其中,所述根据所述连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第二初步推测类型,具体包括:0026 根据获取的连接角度和所述待推测路段的相连路段的类型,利用所述多项式分布,采用贝叶斯算法计算得到所述待推测路段的第二初步推测类型。0027 本发明采集多辆汽车在待推。

15、测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征;从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征;将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量;根据待推测路段的伪特征矢量建说 明 书CN 104331422 A3/10页6立逻辑回归模型,得到所述待推测路段的第一初步推测类型。本发明既考虑了车辆行驶的历史轨迹数据,又考虑了道路网络拓扑结构数据,因此推测精性高,推测结果更准确。另外同时还将相连路段类型之间的限制关系作为推测依据,整合两个初步推测结果,获得最终推测结果,精确度更高。其中采用的模。

16、型或算法可以使用其他算法灵活替换,灵活性更高。附图说明0028 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。0029 图1是本发明提供的路段类型推测方法的一个实施例的流程示意图;0030 图2是历史轨迹的采样点数据类型的示意图;0031 图3是两个相邻路段的示意图;0032 图4是路段类型的示意图;0033 图5是本发明提供的路段类型推测方法的另一实施例的流程示意图0034 图6是本发。

17、明提供的路段类型推测方法的又一实施例的流程示意图。具体实施方式0035 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。0036 图1是本发明提供的路段类型推测方法的一个实施例的流程示意图,如图1所示,包括步骤:0037 S101、采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。0038 具体的,步骤S101包括步骤:采集多。

18、辆汽车行驶的历史轨迹数据;采用ST-Matching算法将将所述多辆汽车行驶的历史轨迹数据与道路网络匹配,获得多辆汽车在待推测路段上行驶的历史轨迹数据;对所述多辆汽车在待推测路段上行驶的历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。0039 其中,路段是指两个十字路口或交叉点之间的道路,高速公路或大道在两个十字路口或交叉点之间可能会有两个不同的路段,因为这两个路段的方向可能不同。0040 其中,所述多辆汽车具体为多辆出租车,可以理解的,所述汽车也可以为其他类型汽车,例如公交车、私人车等。因其他类型车辆的数据不容易提取,特别是私人车辆涉及个人隐私问题,因此优选采用出租车的历史轨迹数据。。

19、其中,历史轨迹数据是一系列的采样点,采样频率可以为20s,每个采样点的数据具体可以如图2所示,包括:出租车ID、时间戳、经纬度、速度、角度、状态。时间戳是采样时的时间戳,经纬度是采样点的GPS定位位置,速度是出租车采样时的速度,角度是出租车采样时的驾驶方向,状态是指出租车采样时处于载客状态还是空闲状态。说 明 书CN 104331422 A4/10页70041 其中,采样点的位置信息仅仅是经纬度信息,从经纬度信息无法得知该采样点属于哪一路段,因此,需要采用地图匹配方法将采样点数据与道路网络匹配,获取属于每一路段的采样点数据。本文采用ST-Matching算法进行匹配。ST-Matching算法。

20、是在2009年的地理信息系统国际期刊(International Journal of Geographical Information Science)上第352-361页刊登的文献名为“Map-matching for low-sampling-rate gps trajectories”的文献中公开的地图匹配算法。ST-Matching既考虑了道路网络的空间几何/拓扑结构,又考虑了历史轨迹的时间特征。ST-Matching适合于处理低抽样率的轨迹,例如本文的出租车轨迹。0042 在历史轨迹和道路网络进行匹配后,获取属于待推测路段的采样点数据,对其进行统计,获得待推测路段的统计特征。其中,。

21、所述统计特征包括出租车行驶速度、空闲出租车密度、载客出租车密度和载客事件次数。待推测路段的统计特征是通过对属于待推测路段的采样点数据统计和计算得到的,即对一系列采样点的出租车ID、时间戳、经纬度、速度、角度、状态数据进行统计和计算得到的。0043 S102、从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征。0044 其中,道路网络的拓扑结构数据是已知的。采用表示道路网络,其中,i是路段i,道路网络中共有n条路段。对于网络的拓扑结构可以采用连接矩阵Mnn表示,连接矩阵中的元素mij表示路段i和路段j的连接角度,如果路段i和路段j不连接,元素mij为0。0045 其中,。

22、待推测路段的拓扑特征包括路段长度、累积摆动值、相连路段和相邻路段。其中,路段长度和累积摆动值可以有效地反映路段类型。例如,大道通常是进入限制的,并且距离较长,中间很少有交叉点。因此,有很长长度的路段很可能是大道或者高速干道。类似的,根据经验,当一个路段是直的时候,其更可能是大道,而当一个路段是弯曲的时候,其不太可能是大道。因此采用累积摆动值反应路段类型。对于相连路段,是指两个路段拓扑相连接。如果一个路段有很多相连路段,那么此路段几乎不可能是大道,因为大道或者高速干道通常是在出口或入口有一两个相连路段。对于相邻路段,是指两个路段之间的距离小于预设阈值(具体是一个小的距离,例如10米)。路段距离的。

23、计算是通过计算路段线段的每个顶点之间的平均距离。如图3所示,1是路段1,2是路段2,路段1和路段2的顶点之间的距离为d1、d2、d3,取d1、d2、d3的平均值作为路段1和路段2之间的距离,当距离小于预设阈值时,判定为两个路段相邻。两个相邻的路段可能会有相同的类型,特别是当他们方向相反时。0046 S103、将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量。0047 具体的,待推测路段的统计特征和拓扑特征共同构成待推测路段的伪特征。因为,采集数据较多,因此,伪特征矢量的维数有可能很大,因此,在步骤S103之后还可以包括步骤:采用主成分分析法降低所述伪特征矢量的维。

24、度,获取伪特征矢量的主成分。0048 S104、根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型。0049 其中,路段类型是按照国家标准规定的路段类型,如图4所示,包括7种路段类型。说 明 书CN 104331422 A5/10页8第一初步推测类型是逻辑回归模型输出的推测结果。0050 本发明实施例公开了一种路段类型推测方法,包括:采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征;从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征;将所述待推测路段的所述统计特征和所述拓扑特征合。

25、并,得到所述待推测路段的伪特征矢量;根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型。本发明实施例既考虑了车辆行驶的历史轨迹数据,又考虑了道路网络拓扑结构数据,因此推测精性高,推测结果更准确。0051 图5是本发明提供的路段类型推测方法的另一实施例的流程示意图,如图5所示,包括步骤:0052 S201、采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。0053 具体的,步骤S201包括步骤:采集多辆汽车行驶的历史轨迹数据;采用ST-Matching算法将将所述多辆汽车行驶的历史轨迹数据与道路网络匹配,获。

26、得多辆汽车在待推测路段上行驶的历史轨迹数据;对所述多辆汽车在待推测路段上行驶的历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。0054 其中,路段是指两个十字路口或交叉点之间的道路,高速公路或大道在两个十字路口或交叉点之间可能会有两个不同的路段,因为这两个路段的方向可能不同。0055 其中,所述多辆汽车具体为多辆出租车,可以理解的,所述汽车也可以为其他类型汽车,例如公交车、私人车等。因其他类型车辆的数据不容易提取,特别是私人车辆涉及个人隐私问题,因此优选采用出租车的历史轨迹数据。其中,历史轨迹数据是一系列的采样点,采样频率可以为20s,每个采样点的数据具体可以如图2所示,包括:出租车I。

27、D、时间戳、经纬度、速度、角度、状态。时间戳是采样时的时间戳,经纬度是采样点的GPS定位位置,速度是出租车采样时的速度,角度是出租车采样时的驾驶方向,状态是指出租车采样时处于载客状态还是空闲状态。0056 其中,采样点的位置信息仅仅是经纬度信息,从经纬度信息无法得知该采样点属于哪一路段,因此,需要采用地图匹配方法将采样点数据与道路网络匹配,获取属于每一路段的采样点数据。本文采用ST-Matching算法进行匹配。ST-Matching算法是在2009年的地理信息系统国际期刊(International Journal of Geographical Information Science)上第。

28、352-361页刊登的文献名为“Map-matching for low-sampling-rate gps trajectories”的文献中公开的地图匹配算法。ST-Matching既考虑了道路网络的空间几何/拓扑结构,又考虑了历史轨迹的时间特征。ST-Matching适合于处理低抽样率的轨迹,例如本文的出租车轨迹。0057 在历史轨迹和道路网络进行匹配后,获取属于待推测路段的采样点数据,对其进行统计,获得待推测路段的统计特征。其中,所述统计特征包括出租车行驶速度、空闲出租车密度、载客出租车密度和载客事件次数。待推测路段的统计特征是通过对属于待推测路段的采样点数据统计和计算得到的,即对一系。

29、列采样点的出租车ID、时间戳、经纬度、速度、角度、状态数据进行统计和计算得到的。0058 S202、从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路说 明 书CN 104331422 A6/10页9段的拓扑特征。0059 其中,道路网络的拓扑结构数据是已知的。采用表示道路网络,其中,i是路段i,道路网络中共有n条路段。对于网络的拓扑结构可以采用连接矩阵Mnn表示,连接矩阵中的元素mij表示路段i和路段j的连接角度,如果路段i和路段j不连接,元素mij为0。0060 其中,待推测路段的拓扑特征包括路段长度、累积摆动值、相连路段和相邻路段。其中,路段长度和累积摆动值可以有效地反映路。

30、段类型。例如,大道通常是进入限制的,并且距离较长,中间很少有交叉点。因此,有很长长度的路段很可能是大道或者高速干道。类似的,根据经验,当一个路段是直的时候,其更可能是大道,而当一个路段是弯曲的时候,其不太可能是大道。因此采用累积摆动值反应路段类型。对于相连路段,是指两个路段拓扑相连接。如果一个路段有很多相连路段,那么此路段几乎不可能是大道,因为大道或者高速干道通常是在出口或入口有一两个相连路段。对于相邻路段,是指两个路段之间的距离小于预设阈值(具体是一个小的距离,例如10米)。路段距离的计算是通过计算路段线段的每个顶点之间的平均距离。如图3所示,1是路段1,2是路段2,路段1和路段2的顶点之间。

31、的距离为d1、d2、d3,取d1、d2、d3的平均值作为路段1和路段2之间的距离,当距离小于预设阈值时,判定为两个路段相邻。两个相邻的路段可能会有相同的类型,特别是当他们方向相反时。0061 S203、将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量。0062 具体的,待推测路段的统计特征和拓扑特征共同构成待推测路段的伪特征。因为,采集数据较多,因此,伪特征矢量的维数有可能很大,因此,在步骤S103之后还可以包括步骤:采用主成分分析法降低所述伪特征矢量的维度,获取伪特征矢量的主成分。0063 S204、根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路。

32、段的第一初步推测类型。0064 其中,路段类型是按照国家标准规定的路段类型,如图4所示,包括7种路段类型。第一初步推测类型是逻辑回归模型输出的推测结果,是第一个初步推测结果。0065 但是,因为有可能伪特征数据较少,导致第一初步推测类型不是很准确,本发明实施例还将路段的连接角度作为推测依据。0066 S205、从所述道路网络的拓扑结构数据中,获取所述待推测路段与所述待推测路段的相连路段之间的连接角度。0067 通常,相连路段的连接角度很大程度上决定了两个路段类型的关系。例如,在一个普通城市的道路网络中,如果两个路段的连接角度为180 ,他们通常是同一名字的同一道路。但是当连接角度变小时,例如连。

33、接角度为90,那么这两条路通常是不同名字的不同道路。因此,已知一个路段的类型和与相连路段的连接角度,可以在一定程度上推测相连路段的类型。0068 S206、根据获取的连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第二初步推测类型。0069 其中,第二初步推测类型是通过连接角度和相连路段的类型推测得到的第二个初步推测结果。说 明 书CN 104331422 A7/10页100070 S207、根据所述第一初步推测类型和第二初步推测类型,采用集成算法计算得到所述待推测路段的最终推测类型。0071 其中,集成算法用一些相对较弱的学习模型独立地就同样的样本进行训练,然后把结果整。

34、合起来进行整体预测。本实施例中的集成算法是堆叠泛化算法、支持向量机算法、随机森林算法中的任一种,可以灵活变化。最终推测类型是综合考虑第一初步推测类型和第二初步推测类型后,获得的最后推测结果。0072 本发明实施例公开了一种路段类型推测方法,包括:采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测路段的统计特征;从所述待推测路段所在的道路网络的拓扑结构数据中,提取所述待推测路段的拓扑特征;将所述待推测路段的所述统计特征和所述拓扑特征合并,得到所述待推测路段的伪特征矢量;根据待推测路段的伪特征矢量建立逻辑回归模型,得到所述待推测路段的第一初步推测类型;从。

35、所述道路网络的拓扑结构数据中,获取所述待推测路段与所述待推测路段的相连路段之间的连接角度;根据获取的连接角度和所述待推测路段的相连路段的类型进行推测,得到所述待推测路段的第二初步推测类型。本发明实施例既考虑了车辆行驶的历史轨迹数据,又考虑了道路网络拓扑结构数据,因此推测精性高,推测结果更准确。同时还将相连路段类型之间的限制关系作为推测依据,整合两个初步推测结果,获得最终推测结果,精确度更高。0073 图6是本发明提供的路段类型推测方法的又一实施例的流程示意图,如图6所示,包括步骤:0074 S301、采集多辆汽车在待推测路段上行驶的历史轨迹数据,并对所述历史轨迹数据进行统计,从而获取所述待推测。

36、路段的统计特征。0075 具体的,步骤S301包括步骤:采集多辆汽车行驶的历史轨迹数据;采用ST-Matching算法将将所述多辆汽车行驶的历史轨迹数据与道路网络匹配,获得多辆汽车在待推测路段上行驶的历史轨迹数据;对所述多辆汽车在待推测路段上行驶的历史轨迹数据进行统计,从而获取所述待推测路段的统计特征。0076 其中,路段是指两个十字路口或交叉点之间的道路,高速公路或大道在两个十字路口或交叉点之间可能会有两个不同的路段,因为这两个路段的方向可能不同。0077 其中,所述多辆汽车具体为多辆出租车,可以理解的,所述汽车也可以为其他类型汽车,例如公交车、私人车等。因其他类型车辆的数据不容易提取,特别。

37、是私人车辆涉及个人隐私问题,因此优选采用出租车的历史轨迹数据。其中,历史轨迹数据是一系列的采样点,采样频率可以为20s,每个采样点的数据具体可以如图2所示,包括:出租车ID、时间戳、经纬度、速度、角度、状态。时间戳是采样时的时间戳,经纬度是采样点的GPS定位位置,速度是出租车采样时的速度,角度是出租车采样时的驾驶方向,状态是指出租车采样时处于载客状态还是空闲状态。0078 其中,采样点的位置信息仅仅是经纬度信息,从经纬度信息无法得知该采样点属于哪一路段,因此,需要采用地图匹配方法将采样点数据与道路网络匹配,获取属于每一路段的采样点数据。本文采用ST-Matching算法进行匹配。ST-Matching算法是在2009年的地理信息系统国际期刊(International Journal of Geographical Information Science)上第352-361页刊登的文献名为“Map-matching for low-sampling-rate gps 说 明 书CN 104331422 A10。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1