一种采集交通事件信息的方法.pdf

上传人:xia****o6 文档编号:4636708 上传时间:2018-10-23 格式:PDF 页数:12 大小:462.96KB
返回 下载 相关 举报
摘要
申请专利号:

CN201210096509.1

申请日:

2012.04.01

公开号:

CN102610101A

公开日:

2012.07.25

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G08G 1/01申请日:20120401|||公开

IPC分类号:

G08G1/01

主分类号:

G08G1/01

申请人:

北京世纪高通科技有限公司

发明人:

王晓瑄; 李建军

地址:

100088 北京市海淀区学院路7号10层1002C室

优先权:

专利代理机构:

北京中博世达专利商标代理有限公司 11274

代理人:

申健

PDF下载: PDF下载
内容摘要

本发明公开了一种采集交通事件信息的方法,涉及道路交通信息应用领域,为提高交通事件信息的采集效率而发明。所述方法包括:获取文本信息中的至少两个关键词,所述至少两个关键词中至少包含一个事件时间关键词;将所述至少两个关键词按照预定规则进行组合,得到交通事件信息。本发明主要应用于道路信息的获取和发布。

权利要求书

1.一种采集交通事件信息的方法,其特征在于,包括:
获取文本信息中的至少两个关键词;
将所述至少两个关键词按照预定规则进行组合,得到交通事件信息。
2.根据权利要求1所述的方法,其特征在于,所述获取文本信息中的至少
两个关键词,包括:
获取文本信息中至少两种事件因素的关键词,所述事件因素包括事件位置、
事件起始时间、事件终止时间以及事件类型。
3.根据权利要求2所述的方法,其特征在于,所述获取文本信息中至少两
种事件因素的关键词,包括:
至少获取所述文本信息中事件起始时间因素或事件终止时间因素的关键
词。
4.根据权利要求3所述的方法,其特征在于,获取事件位置关键词,包括:
在所述文本信息中检索预设的位置特定词,从而得到所述事件位置关键词;
在所述文本信息中检索预设的方向特定词;
当检索到所述方向特定词时,将所述位置特定词和所述方向特定词合并,
从而得到所述事件位置关键词。
5.根据权利要求4所述的方法,其特征在于,当获取到至少两个位置特定
词时,通过预设介词将所述至少两个位置特定词进行连接,从而得到所述事件
位置关键词;
当获取到至少两个方向特定词时,通过所述预设介词将所述至少两个方向
特定词进行连接,将连接后的至少两个方向特定词与所述位置特定词合并,从
而得到所述事件位置关键词。
6.根据权利要求4或5所述的方法,其特征在于,获取事件起始时间关键
词,包括:
在所述文本信息中检索预设的起始特定词,从而得到所述事件起始时间关
键词;
获取事件终止时间关键词,包括:
在所述文本信息中检索预设的终止特定词,从而得到所述事件终止时间关
键词。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
在所述起始特定词的相邻字段内检索作为时间关键词的汉字/数字;
当检索出作为时间关键词的汉字/数字时,将所述时间关键词和所述起始特
定词合并,从而得到所述事件起始时间关键词;
在所述终止特定词的相邻字段内检索作为时间关键词的汉字/数字;
当检索出作为时间关键词的汉字/数字时,将所述时间关键词和所述终止特
定词合并,从而得到所述事件终止时间关键词。
8.根据权利要求7所述的方法,当在所述文本信息中未检索出起始特定词
和终止特定词时,其特征在于,包括:
如果在所述文本信息中检索出至少两个以汉字/数字代表的时间关键词,则
将在时序上最小的汉字/数字作为起始时间关键词,将在时序上最大的汉字/数
字作为终止时间关键词。
9.根据权利要求8所述的方法,其特征在于,获取事件类型关键词,包括:
在所述文本信息中检索预设的事件名称特定词,当检索到事件名称特定词
时,获得所述事件名称特定词的代码;
根据所述事件名称特定词的代码在预设的关系映射表中查找所述事件类型
关键词对应的事件编码,从而得到事件类型关键词。
10.根据权利要求9所述的方法,其特征在于,所述在所述文本信息中检
索预设的事件名称特定词,包括:
在所述文本信息中依次检索预设的事件大类名称特定词、事件中类名称特
定词以及事件小类名称特定词,并获得对应的代码;
所述根据所述事件名称特定词的代码在预设的关系映射表中查找所述事件
类型关键词对应的事件编码,包括:
顺序排列事件大类名称特定词的代码、事件中类名称特定词的代码以及事
件小类名称特定词的代码,得到事件名称特定词的代码序列;
根据所述代码序列在预设的关系映射表中查找事件编码,从而得到事件类
型关键词。
11.根据权利要求10所述的方法,其特征在于,所述将所述至少两个关键
词按照预定规则进行组合,得到交通事件信息,包括:
通过预设的字符将所述至少两个关键词按照与事件位置、事件起始时间、
事件终止时间以及事件类型对应的关系进行连接,从而得到交通事件信息。

说明书

一种采集交通事件信息的方法

技术领域

本发明涉及道路交通信息应用领域,尤其涉及一种采集交通事件信息的方
法。

背景技术

目前,交通事件信息采集和发布技术已日趋成熟,实时准确的交通事件信
息可以为先进的出行者信息系统(Advanced Traffic Information System,简
称ATIS)和先进的交通管理系统(Advanced Traffic Management System,简称
ATMS)实现路径诱导提供有效信息,从而便于出行者和交通管理人员进行查询
和各种决策。

现有采集交通事件信息的方式,采用穷举的方式对文本信息逐字进行匹配,
利用自然语言语法的规则分析全句表达的信息,从而获取交通事件信息。

在实现上述采集交通事件信息的过程中,发明人发现现有技术中至少存在
如下问题:在采用穷举法对文本信息逐字进行匹配时,需要对数据库中包含匹
配字的所有词组进行遍历,一般情况下文本信息中的信息量很大,对文本信息
逐字进行匹配的方式效率低,浪费运营资源。此外,现有技术通过分析文本信
息中全句表达的信息采集交通事件信息,采集的交通事件信息不易分类和检索。

发明内容

本发明的实施例提供一种采集交通事件信息的方法,能够提高采集交通事
件信息的效率,采集的交通事件信息易于分类和检索。

本发明实施例提供了一种采集交通事件信息的方法,包括:

获取文本信息中的至少两个关键词;

将所述至少两个关键词按照预定规则进行组合,得到交通事件信息。

本发明实施例提供的采集交通事件信息的方法,能够在文本信息中检索事
件因素的关键词,按照预设规则将检索到的多种事件因素的关键词进行组合,
从而得到交通事件信息。相对于现有技术中对文本信息逐字穷举匹配的方式,
可以节省信息处理量,提高采集交通事件信息的效率。同时,按照事件因素采
集交通事件信息的方式相对于分析全句表达含义的信息采集方式,便于对采集
的交通事件信息进行分类和查找。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施
例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述
中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付
出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例中采集交通事件信息的方法的流程图;

图2为本发明实施例中另一个采集交通事件信息的方法的流程图;

图3为本发明实施例中获取关键词的方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清
楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是
全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造
性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供了一种采集交通事件信息的方法,如图1所示,所述方
法包括如下步骤:

101、获取文本信息中的至少两个关键词。

所述文本信息为通过短信告知、电话爆料、广播和监控摄像头等方式获取
并转化为文本格式的交通信息。所述采集交通事件信息就是对该文本信息中的
关键词进行分析和获取,从而得到能够清楚表述一件交通时间的多个关键词的
组合。

102、将获取的至少两个关键词按照预定规则进行组合,得到交通事件信息。

将获取到的多个关键词按照预定规则进行组合,根据每个关键词所表达的
信息,得到一件交通事件的完整信息。

现有技术中采集交通事件信息的方式,是对整个文本信息进行分析和概述,
其分析的手段是对文本信息中的每一个字进行穷举和匹配。这种采集交通事件
信息的方式,需要对文本信息逐字进行匹配,在耗费大量信息处理资源的同时,
无法提高信息采集效率,不能适应出行者和交通管理者快速获取交通事件信息
的需求。同时,对于实时性要求高的交通事件,现有技术无法快速采集和发布
交通事件信息,不能适应突发性场景的需求,不利于交通管理者处理应急交通
事件。

本发明实施例提供的采集交通事件信息的方法,能够通过获取文本信息中
多个关键词的信息获取交通事件信息,避免现有技术中对文本信息逐字匹配的
问题,可以提高交通事件信息的采集效率,满足出行者和交通管理者对高时效
性交通事件信息的需求。

进一步的,本发明实施例提供了另一种采集交通事件信息的方法,如图2
所示,所述方法是对图1所示方法的进一步扩展,所述方法包括如下步骤:

201、获取文本信息中至少两种事件因素的关键词。

所述事件因素包括事件位置、事件起始时间、事件终止时间以及事件类型。
如图3所示,所述获取文本信息中至少两种事件因素的关键词的实现方式为:

301、获取事件位置关键词。

302、获取事件起始时间关键词。

303、获取事件终止时间关键词。

304、获取事件类型关键词。

具体的,步骤301获取事件位置关键词的实现方式为:在文本信息中检索
预设的位置特定词,从而得到所述事件位置关键词。所述预设的位置特定词可
以是道路名称,所述道路名称由交通信息处理人员在数据库或服务器中预先存
储的某一市、县、省或自治区内,所有市级道路、县级道路省级道路以及国道
的名称(或代码)。交通信息处理人员可以根据城市的交通流量特点及热点地区
对某一地区的道路进行更为精细的划分,并储存在数据库或服务器中,本发明
实施例对划分道路名称的粒度和数量不做限制。

可选的,还可以在文本信息中检索用于表示方向的方向特定词,例如东、
南、西、北、路口东、路口南、路口西、路口北等。如果在文本信息中检索到
方向特定词,则将检索到的道路名称和检索到的方向特定词合并,从而得到事
件位置关键词。例如,在某一文本信息中检索到“平安大街”和“西”,则得到
事件位置关键词为“平安大街西”。

进一步的,所述预设的位置特定词还可以是表示位置的地名、桥名等,方
向特定词也可以是针对地名、桥名等特点的方向特定词,例如西口、桥下、桥
南等。由此得到事件位置关键词可以诸如为:“西四路口东”、“西四北五条西口”、
“阜成门桥下”等,本发明实施例对此不做一一枚举。

在本发明实施例的一个应用场景中,当在文本信息中检索到至少两个位置
特定词时,可以通过预设介词将至少两个位置特定词进行连接,从而得到事件
位置关键词。例如,当在文本信息中检索到“官园桥”和“西直门桥”两个位
置特定词时,获取的组合事件位置关键词可以是“官园桥到西直门桥”或“西
直门桥到官园桥”。

当获取到至少两个方向特定词时,还可以通过预设的介词将多个方向特定
词进行连接,从而获取组合方向特定词。例如,“由南到北”、“从东到西”等。
其他还可以表示方向的组合方向特定词还包括:“入口到出口”、“进出收费站”
等。在连接多个方向特定词时,可以按照检索方向特定词的顺序(即多个方向
特定词在文本信息中出现的顺序),连接多个方向特定词。例如在文本信息中先
检索出“南”再检索出“北”,则得到的组合方向特定词为“从南到北”,由此
可以避免错误采集信息(“从北到南”)。

将组合方向特定词和组合位置特定词合并,即得到事件位置关键词。例如
得到的事件位置关键词可以是“官园桥至西直门桥从南到北方向”。

步骤302、获取事件起始时间关键词的实现方式具体为:

在文本信息中检索交通信息处理人员预设的起始特定词,例如“开始”、“发
生”、“出现”等关键词。当检索出起始特定词时,将接收所述文本信息的时刻
作为事件起始时间关键词。

进一步的,检索文本信息中以汉字或数字表示的时间关键词,当检索到以
汉字或数字表示的时间关键词时,将该时间关键词与上述起始特定词进行合并,
从而获取事件起始时间关键词。例如,某文本信息为“西直门内大街由西向东
方向上午十点开始道路作业。”,则根据获取的“开始”一词可知“上午十点”
为事件起始时间关键词。在检索时间关键词时,可以在已检索到的起始特定词
相邻的字段内检索时间关键词,由此可以避免将表示终止时间的时间关键词误
判为起始时间关键词。例如,某文本信息为“西直门内大街由西向东方向上午
十点开始道路作业,下午一点结束道路作业。”由于“上午十点”与“开始”相
邻,所以将“上午十点”与“开始”合并作为起始时间关键词,以避免将“下
午一点”与“开始”合并作为起始时间关键词。

可选的,对于“匝道”、“辅路”等特殊路链,还可以“打开”、“开放”等
关键词作为起始特定词,与以汉字或数字表示的时间关键词进行结合。

可选的,可以由交通信息处理人员对起始特定词相邻字段的长度进行设置,
在设置的字段长度内检索时间关键词,本发明实施例对设置起始特定词相邻字
段长度不做限制。

步骤303、获取事件终止时间关键词的实现方式具体为:

在文本信息中检索交通信息处理人员预设的终止特定词,例如“结束”、“完
成”等关键词。当检索出终止特定词时,将接收所述文本信息的时刻作为事件
终止时间关键词。

进一步的,检索文本信息中以汉字或数字表示的时间关键词,当检索到以
汉字或数字表示的时间关键词时,将该时间关键词与上述终止特定词进行合并,
从而获取事件终止时间关键词。例如,某文本信息为“西直门内大街由西向东
方向上午十点开始道路作业,下午一点结束道路作业。”,则根据获取的“结束”
一词可知“下午一点”为事件终止时间关键词。在检索时间关键词时,可以在
已检索到的终止特定词相邻的字段内检索时间关键词,由此可以避免将表示起
始时间的时间关键词误判为终止时间关键词。例如,某文本信息为“西直门内
大街由西向东方向上午十点开始道路作业,下午一点结束道路作业。”由于“下
午一点”与“结束”相邻,所以将“下午点”与“结束”合并作为终止时间关
键词,以避免将“上午十点”与“结束”合并作为终止时间关键词。

可选的,可以由交通信息处理人员对终止特定词相邻字段的长度进行设置,
在设置的字段长度内检索时间关键词,本发明实施例对设置终止特定词相邻字
段长度不做限制。

在本发明实施例的另一个应用场景中,当文本信息中不含有诸如“开始”、
“结束”等起始和终止特定词时,若在文本信息中检索到两个或多个以汉字或
数字表示的时间关键词,则将在时序上最小的汉字或数字作为事件起始时间关
键词,将在时序上最大的汉字或数字作为事件终止时间关键词。例如某文本信
息为“西直门内大街由西向东方向上午十点到下午一点进行道路作业。”,该文
本信息中不包括“开始”、“结束”等关键词。则将时序上最小的时间关键词“上
午十点”作为事件起始时间关键词,将时序上最大的时间关键词“下午一点”
作为事件终止时间关键词。

需要说明的是,所述“时序上”是指按照时间顺序对汉字或数字比较大小。
例如,在上述文本信息中,从关键词内容上判断,“十点”大于“一点”,但在
时序上判断,所述“十点”为“上午十点”,所述“一点”为“下午一点”,所
以“上午十点”小于“下午一点”。此外,所述“最大”和“最小”是以该文本
信息为判断范围,所述“上午十点”是在该文本信息中出现过的汉字或数字中
最小的时间关键词,所述“下午一点”是在该文本信息中出现过的汉字或数字
中最大的时间关键词。

步骤304、获取事件类型关键词的实现方式具体为:

A)在文本信息中检索预设的事件名称特定词,当检索到事件名称特定词时,
获得事件名称特定词的代码。

所述事件名称特定词可以是交通信息处理人员预设的事件名称特定词,例
如“交通管制”、“交通事故”、“施工作业”、“道路障碍”等。

B)根据事件名称特定词的代码在预设的关系映射表中查找事件类型关键词
对应的事件编码,从而得到事件类型关键词。

进一步的,步骤A)可以细化为:在文本信息中依次检索预设的事件大类名
称特定词、事件中类名称特定词和事件小类名称特定词,并获得对应的代码。
所述事件中类名称从属于事件大类名称并对事件大类做进一步分类。所述事件
小类名称从属于事件中类名称并对事件中类再做进一步分类。由此可以对交通
事件类型进行细化,获取更为精细的交通事件信息。

具体的,如表1所示,首先在文本信息中检索事件大类名称,例如检索到
“交通管制”,则事件大类名称代码为0。当检索到事件大类名称后,在事件大
类名称的范围内检索事件中类名称,例如检索到“转弯限制”,则事件中类名称
代码为2。同样,当检索到事件中类名称后,在事件中类名称的范围内检索事件
小类名称,例如检索到“禁止左转”,则事件小类名称代码为2。

对应步骤A)的细化,步骤B)可以进一步细化为:将步骤A)中获取的事
件大、中、小类名称特定词的代码按照大、中、小的顺序排列,得到事件名称
特定词的代码序列。然后根据该代码序列在表1中查找对应的事件编码,从而
得到事件类型关键词。例如,步骤A)中获取的事件名称特定词分别是“交通管
制”、“转弯限制”、“禁止左转”,则步骤B)中得到事件名称特定词的代码序列
为022。

然后根据该代码序列在表1中查找事件编码,从而得到事件类型关键词。
代码序列022对应的事件编码为514,即事件类型关键词为514。



表1

值得说明的是,图3中的步骤301至步骤304的执行顺序的仅为本发明实
施例采集关键词的执行顺序之一,实际应用中对于步骤301至步骤304的执行
顺序不做限制。

202、通过预设的字符将至少两个关键词按照与事件位置、事件起始时间、
事件终止时间以及事件类型对应的关系及顺序进行连接,从而得到交通事件信
息。

可以通过“+”或“、”将多个关键词进行个链接。例如某一文本信息为“西
直门内大街由东向西方向上午十点开始除雪作业,下午一点结束除雪作业。”则
采集的交通事件信息为:“西直门内大街”+“上午十点开始”+“下午一点结束”
+“9475”。

在本发明实施例的再一个应用场景中,所述至少两种事件因素的关键词中
可以不同时包括事件起始时间关键词和事件终止时间关键词,但是所述至少两
种事件因素的关键词中至少需要包括事件起始时间关键词或者事件终止时间关
键词中的一个。由于没有时间信息的交通事件信息不具备实用性,所以采集的
关键词中至少需要有一个提供时间信息的关键词,而该关键词可以是起始时间
关键词或者事件终止时间关键词。

现有技术中采集交通事件信息的方式,是对整个文本信息进行分析和概述,
其分析的手段是对文本信息中的每一个字进行穷举和匹配。这种采集交通事件
信息的方式,需要对文本信息逐字进行匹配,在耗费大量信息处理资源的同时,
无法提高信息采集效率,不能适应出行者和交通管理者快速获取交通事件信息
的需求。同时,对于实时性要求高的交通事件,现有技术无法快速采集和发布
交通事件信息,不能适应突发性场景的需求,不利于交通管理者处理应急交通
事件。

本发明实施例提供的采集交通事件信息的方法,能够通过获取文本信息中
多个关键词的信息获取交通事件信息,避免现有技术中对文本信息逐字匹配的
问题,可以提高交通事件信息的采集效率,满足出行者和交通管理者对高时效
性交通事件信息的需求。

此外,本发明实施例提供的采集交通事件信息的方法,能够按照事件因素
获取关键词,采集的交通事件信息便于分类管理和查找。例如,可以将事件类
型相同的多个交通事件信息归为一类,在该类别里可以根据事件位置进一步分
类。分类后的交通事件信息能够便于便于分类管理和查找,可以提高处理交通
事件信息的效率。

通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发
明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多
情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或
者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软
件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若
干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备
等)执行本发明各个实施例所述的方法。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于
此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到
变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应
所述以权利要求的保护范围为准。

一种采集交通事件信息的方法.pdf_第1页
第1页 / 共12页
一种采集交通事件信息的方法.pdf_第2页
第2页 / 共12页
一种采集交通事件信息的方法.pdf_第3页
第3页 / 共12页
点击查看更多>>
资源描述

《一种采集交通事件信息的方法.pdf》由会员分享,可在线阅读,更多相关《一种采集交通事件信息的方法.pdf(12页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102610101 A (43)申请公布日 2012.07.25 CN 102610101 A *CN102610101A* (21)申请号 201210096509.1 (22)申请日 2012.04.01 G08G 1/01(2006.01) (71)申请人 北京世纪高通科技有限公司 地址 100088 北京市海淀区学院路7号10层 1002C 室 (72)发明人 王晓瑄 李建军 (74)专利代理机构 北京中博世达专利商标代理 有限公司 11274 代理人 申健 (54) 发明名称 一种采集交通事件信息的方法 (57) 摘要 本发明公开了一种采集交通事件信息的方 。

2、法, 涉及道路交通信息应用领域, 为提高交通事件 信息的采集效率而发明。所述方法包括 : 获取文 本信息中的至少两个关键词, 所述至少两个关键 词中至少包含一个事件时间关键词 ; 将所述至少 两个关键词按照预定规则进行组合, 得到交通事 件信息。本发明主要应用于道路信息的获取和发 布。 (51)Int.Cl. 权利要求书 2 页 说明书 7 页 附图 2 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 7 页 附图 2 页 1/2 页 2 1. 一种采集交通事件信息的方法, 其特征在于, 包括 : 获取文本信息中的至少两个关键词 ; 将所述至少两个关。

3、键词按照预定规则进行组合, 得到交通事件信息。 2. 根据权利要求 1 所述的方法, 其特征在于, 所述获取文本信息中的至少两个关键词, 包括 : 获取文本信息中至少两种事件因素的关键词, 所述事件因素包括事件位置、 事件起始 时间、 事件终止时间以及事件类型。 3. 根据权利要求 2 所述的方法, 其特征在于, 所述获取文本信息中至少两种事件因素 的关键词, 包括 : 至少获取所述文本信息中事件起始时间因素或事件终止时间因素的关键词。 4. 根据权利要求 3 所述的方法, 其特征在于, 获取事件位置关键词, 包括 : 在所述文本信息中检索预设的位置特定词, 从而得到所述事件位置关键词 ; 在。

4、所述文本信息中检索预设的方向特定词 ; 当检索到所述方向特定词时, 将所述位置特定词和所述方向特定词合并, 从而得到所 述事件位置关键词。 5. 根据权利要求 4 所述的方法, 其特征在于, 当获取到至少两个位置特定词时, 通过预 设介词将所述至少两个位置特定词进行连接, 从而得到所述事件位置关键词 ; 当获取到至少两个方向特定词时, 通过所述预设介词将所述至少两个方向特定词进行 连接, 将连接后的至少两个方向特定词与所述位置特定词合并, 从而得到所述事件位置关 键词。 6. 根据权利要求 4 或 5 所述的方法, 其特征在于, 获取事件起始时间关键词, 包括 : 在所述文本信息中检索预设的起。

5、始特定词, 从而得到所述事件起始时间关键词 ; 获取事件终止时间关键词, 包括 : 在所述文本信息中检索预设的终止特定词, 从而得到所述事件终止时间关键词。 7. 根据权利要求 6 所述的方法, 其特征在于, 所述方法还包括 : 在所述起始特定词的相邻字段内检索作为时间关键词的汉字 / 数字 ; 当检索出作为时间关键词的汉字 / 数字时, 将所述时间关键词和所述起始特定词合 并, 从而得到所述事件起始时间关键词 ; 在所述终止特定词的相邻字段内检索作为时间关键词的汉字 / 数字 ; 当检索出作为时间关键词的汉字 / 数字时, 将所述时间关键词和所述终止特定词合 并, 从而得到所述事件终止时间关。

6、键词。 8. 根据权利要求 7 所述的方法, 当在所述文本信息中未检索出起始特定词和终止特定 词时, 其特征在于, 包括 : 如果在所述文本信息中检索出至少两个以汉字 / 数字代表的时间关键词, 则将在时序 上最小的汉字 / 数字作为起始时间关键词, 将在时序上最大的汉字 / 数字作为终止时间关 键词。 9. 根据权利要求 8 所述的方法, 其特征在于, 获取事件类型关键词, 包括 : 在所述文本信息中检索预设的事件名称特定词, 当检索到事件名称特定词时, 获得所 述事件名称特定词的代码 ; 权 利 要 求 书 CN 102610101 A 2 2/2 页 3 根据所述事件名称特定词的代码在预。

7、设的关系映射表中查找所述事件类型关键词对 应的事件编码, 从而得到事件类型关键词。 10. 根据权利要求 9 所述的方法, 其特征在于, 所述在所述文本信息中检索预设的事件 名称特定词, 包括 : 在所述文本信息中依次检索预设的事件大类名称特定词、 事件中类名称特定词以及事 件小类名称特定词, 并获得对应的代码 ; 所述根据所述事件名称特定词的代码在预设的关系映射表中查找所述事件类型关键 词对应的事件编码, 包括 : 顺序排列事件大类名称特定词的代码、 事件中类名称特定词的代码以及事件小类名称 特定词的代码, 得到事件名称特定词的代码序列 ; 根据所述代码序列在预设的关系映射表中查找事件编码,。

8、 从而得到事件类型关键词。 11. 根据权利要求 10 所述的方法, 其特征在于, 所述将所述至少两个关键词按照预定 规则进行组合, 得到交通事件信息, 包括 : 通过预设的字符将所述至少两个关键词按照与事件位置、 事件起始时间、 事件终止时 间以及事件类型对应的关系进行连接, 从而得到交通事件信息。 权 利 要 求 书 CN 102610101 A 3 1/7 页 4 一种采集交通事件信息的方法 技术领域 0001 本发明涉及道路交通信息应用领域, 尤其涉及一种采集交通事件信息的方法。 背景技术 0002 目前, 交通事件信息采集和发布技术已日趋成熟, 实时准确的交通事件信息可以 为先进的出。

9、行者信息系统 (Advanced Traffic Information System, 简称 ATIS) 和先进的 交通管理系统(Advanced Traffic Management System, 简称ATMS)实现路径诱导提供有效 信息, 从而便于出行者和交通管理人员进行查询和各种决策。 0003 现有采集交通事件信息的方式, 采用穷举的方式对文本信息逐字进行匹配, 利用 自然语言语法的规则分析全句表达的信息, 从而获取交通事件信息。 0004 在实现上述采集交通事件信息的过程中, 发明人发现现有技术中至少存在如下问 题 : 在采用穷举法对文本信息逐字进行匹配时, 需要对数据库中包含匹。

10、配字的所有词组进 行遍历, 一般情况下文本信息中的信息量很大, 对文本信息逐字进行匹配的方式效率低, 浪 费运营资源。 此外, 现有技术通过分析文本信息中全句表达的信息采集交通事件信息, 采集 的交通事件信息不易分类和检索。 发明内容 0005 本发明的实施例提供一种采集交通事件信息的方法, 能够提高采集交通事件信息 的效率, 采集的交通事件信息易于分类和检索。 0006 本发明实施例提供了一种采集交通事件信息的方法, 包括 : 0007 获取文本信息中的至少两个关键词 ; 0008 将所述至少两个关键词按照预定规则进行组合, 得到交通事件信息。 0009 本发明实施例提供的采集交通事件信息的。

11、方法, 能够在文本信息中检索事件因素 的关键词, 按照预设规则将检索到的多种事件因素的关键词进行组合, 从而得到交通事件 信息。 相对于现有技术中对文本信息逐字穷举匹配的方式, 可以节省信息处理量, 提高采集 交通事件信息的效率。同时, 按照事件因素采集交通事件信息的方式相对于分析全句表达 含义的信息采集方式, 便于对采集的交通事件信息进行分类和查找。 附图说明 0010 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本 发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳。

12、动的前提下, 还可以 根据这些附图获得其他的附图。 0011 图 1 为本发明实施例中采集交通事件信息的方法的流程图 ; 0012 图 2 为本发明实施例中另一个采集交通事件信息的方法的流程图 ; 0013 图 3 为本发明实施例中获取关键词的方法的流程图。 说 明 书 CN 102610101 A 4 2/7 页 5 具体实施方式 0014 下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案进行清楚、 完 整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是全部的实施例。基于 本发明中的实施例, 本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,。

13、 都属于本发明保护的范围。 0015 本发明实施例提供了一种采集交通事件信息的方法, 如图 1 所示, 所述方法包括 如下步骤 : 0016 101、 获取文本信息中的至少两个关键词。 0017 所述文本信息为通过短信告知、 电话爆料、 广播和监控摄像头等方式获取并转化 为文本格式的交通信息。 所述采集交通事件信息就是对该文本信息中的关键词进行分析和 获取, 从而得到能够清楚表述一件交通时间的多个关键词的组合。 0018 102、 将获取的至少两个关键词按照预定规则进行组合, 得到交通事件信息。 0019 将获取到的多个关键词按照预定规则进行组合, 根据每个关键词所表达的信息, 得到一件交通事。

14、件的完整信息。 0020 现有技术中采集交通事件信息的方式, 是对整个文本信息进行分析和概述, 其分 析的手段是对文本信息中的每一个字进行穷举和匹配。这种采集交通事件信息的方式, 需 要对文本信息逐字进行匹配, 在耗费大量信息处理资源的同时, 无法提高信息采集效率, 不 能适应出行者和交通管理者快速获取交通事件信息的需求。同时, 对于实时性要求高的交 通事件, 现有技术无法快速采集和发布交通事件信息, 不能适应突发性场景的需求, 不利于 交通管理者处理应急交通事件。 0021 本发明实施例提供的采集交通事件信息的方法, 能够通过获取文本信息中多个关 键词的信息获取交通事件信息, 避免现有技术中。

15、对文本信息逐字匹配的问题, 可以提高交 通事件信息的采集效率, 满足出行者和交通管理者对高时效性交通事件信息的需求。 0022 进一步的, 本发明实施例提供了另一种采集交通事件信息的方法, 如图 2 所示, 所 述方法是对图 1 所示方法的进一步扩展, 所述方法包括如下步骤 : 0023 201、 获取文本信息中至少两种事件因素的关键词。 0024 所述事件因素包括事件位置、 事件起始时间、 事件终止时间以及事件类型。如图 3 所示, 所述获取文本信息中至少两种事件因素的关键词的实现方式为 : 0025 301、 获取事件位置关键词。 0026 302、 获取事件起始时间关键词。 0027 3。

16、03、 获取事件终止时间关键词。 0028 304、 获取事件类型关键词。 0029 具体的, 步骤 301 获取事件位置关键词的实现方式为 : 在文本信息中检索预设的 位置特定词, 从而得到所述事件位置关键词。 所述预设的位置特定词可以是道路名称, 所述 道路名称由交通信息处理人员在数据库或服务器中预先存储的某一市、 县、 省或自治区内, 所有市级道路、 县级道路省级道路以及国道的名称(或代码)。 交通信息处理人员可以根据 城市的交通流量特点及热点地区对某一地区的道路进行更为精细的划分, 并储存在数据库 或服务器中, 本发明实施例对划分道路名称的粒度和数量不做限制。 说 明 书 CN 102。

17、610101 A 5 3/7 页 6 0030 可选的, 还可以在文本信息中检索用于表示方向的方向特定词, 例如东、 南、 西、 北、 路口东、 路口南、 路口西、 路口北等。如果在文本信息中检索到方向特定词, 则将检索到 的道路名称和检索到的方向特定词合并, 从而得到事件位置关键词。 例如, 在某一文本信息 中检索到 “平安大街” 和 “西” , 则得到事件位置关键词为 “平安大街西” 。 0031 进一步的, 所述预设的位置特定词还可以是表示位置的地名、 桥名等, 方向特定词 也可以是针对地名、 桥名等特点的方向特定词, 例如西口、 桥下、 桥南等。 由此得到事件位置 关键词可以诸如为 :。

18、“西四路口东” 、“西四北五条西口” 、“阜成门桥下” 等, 本发明实施例对 此不做一一枚举。 0032 在本发明实施例的一个应用场景中, 当在文本信息中检索到至少两个位置特定词 时, 可以通过预设介词将至少两个位置特定词进行连接, 从而得到事件位置关键词。例如, 当在文本信息中检索到 “官园桥” 和 “西直门桥” 两个位置特定词时, 获取的组合事件位置 关键词可以是 “官园桥到西直门桥” 或 “西直门桥到官园桥” 。 0033 当获取到至少两个方向特定词时, 还可以通过预设的介词将多个方向特定词进行 连接, 从而获取组合方向特定词。例如,“由南到北” 、“从东到西” 等。其他还可以表示方向 。

19、的组合方向特定词还包括 :“入口到出口” 、“进出收费站” 等。在连接多个方向特定词时, 可 以按照检索方向特定词的顺序 ( 即多个方向特定词在文本信息中出现的顺序 ), 连接多个 方向特定词。例如在文本信息中先检索出 “南” 再检索出 “北” , 则得到的组合方向特定词为 “从南到北” , 由此可以避免错误采集信息 (“从北到南” )。 0034 将组合方向特定词和组合位置特定词合并, 即得到事件位置关键词。例如得到的 事件位置关键词可以是 “官园桥至西直门桥从南到北方向” 。 0035 步骤 302、 获取事件起始时间关键词的实现方式具体为 : 0036 在文本信息中检索交通信息处理人员预。

20、设的起始特定词, 例如 “开始” 、“发生” 、 “出现” 等关键词。当检索出起始特定词时, 将接收所述文本信息的时刻作为事件起始时间 关键词。 0037 进一步的, 检索文本信息中以汉字或数字表示的时间关键词, 当检索到以汉字或 数字表示的时间关键词时, 将该时间关键词与上述起始特定词进行合并, 从而获取事件起 始时间关键词。例如, 某文本信息为 “西直门内大街由西向东方向上午十点开始道路作 业。 ” , 则根据获取的 “开始” 一词可知 “上午十点” 为事件起始时间关键词。在检索时间关键 词时, 可以在已检索到的起始特定词相邻的字段内检索时间关键词, 由此可以避免将表示 终止时间的时间关键。

21、词误判为起始时间关键词。 例如, 某文本信息为 “西直门内大街由西向 东方向上午十点开始道路作业, 下午一点结束道路作业。 ” 由于 “上午十点” 与 “开始” 相邻, 所以将 “上午十点” 与 “开始” 合并作为起始时间关键词, 以避免将 “下午一点” 与 “开始” 合 并作为起始时间关键词。 0038 可选的, 对于 “匝道” 、“辅路” 等特殊路链, 还可以 “打开” 、“开放” 等关键词作为起 始特定词, 与以汉字或数字表示的时间关键词进行结合。 0039 可选的, 可以由交通信息处理人员对起始特定词相邻字段的长度进行设置, 在设 置的字段长度内检索时间关键词, 本发明实施例对设置起始。

22、特定词相邻字段长度不做限 制。 0040 步骤 303、 获取事件终止时间关键词的实现方式具体为 : 说 明 书 CN 102610101 A 6 4/7 页 7 0041 在文本信息中检索交通信息处理人员预设的终止特定词, 例如 “结束” 、“完成” 等 关键词。当检索出终止特定词时, 将接收所述文本信息的时刻作为事件终止时间关键词。 0042 进一步的, 检索文本信息中以汉字或数字表示的时间关键词, 当检索到以汉字或 数字表示的时间关键词时, 将该时间关键词与上述终止特定词进行合并, 从而获取事件终 止时间关键词。例如, 某文本信息为 “西直门内大街由西向东方向上午十点开始道路作业, 下午。

23、一点结束道路作业。 ” , 则根据获取的 “结束” 一词可知 “下午一点” 为事件终止时间关 键词。 在检索时间关键词时, 可以在已检索到的终止特定词相邻的字段内检索时间关键词, 由此可以避免将表示起始时间的时间关键词误判为终止时间关键词。例如, 某文本信息为 “西直门内大街由西向东方向上午十点开始道路作业, 下午一点结束道路作业。 ” 由于 “下午 一点” 与 “结束” 相邻, 所以将 “下午点” 与 “结束” 合并作为终止时间关键词, 以避免将 “上 午十点” 与 “结束” 合并作为终止时间关键词。 0043 可选的, 可以由交通信息处理人员对终止特定词相邻字段的长度进行设置, 在设 置的。

24、字段长度内检索时间关键词, 本发明实施例对设置终止特定词相邻字段长度不做限 制。 0044 在本发明实施例的另一个应用场景中, 当文本信息中不含有诸如 “开始” 、“结束” 等起始和终止特定词时, 若在文本信息中检索到两个或多个以汉字或数字表示的时间关键 词, 则将在时序上最小的汉字或数字作为事件起始时间关键词, 将在时序上最大的汉字或 数字作为事件终止时间关键词。例如某文本信息为 “西直门内大街由西向东方向上午十点 到下午一点进行道路作业。 ” , 该文本信息中不包括 “开始” 、“结束” 等关键词。则将时序上 最小的时间关键词 “上午十点” 作为事件起始时间关键词, 将时序上最大的时间关键。

25、词 “下 午一点” 作为事件终止时间关键词。 0045 需要说明的是, 所述 “时序上” 是指按照时间顺序对汉字或数字比较大小。 例如, 在 上述文本信息中, 从关键词内容上判断,“十点” 大于 “一点” , 但在时序上判断, 所述 “十点” 为 “上午十点” , 所述 “一点” 为 “下午一点” , 所以 “上午十点” 小于 “下午一点” 。此外, 所述 “最大” 和 “最小” 是以该文本信息为判断范围, 所述 “上午十点” 是在该文本信息中出现过 的汉字或数字中最小的时间关键词, 所述 “下午一点” 是在该文本信息中出现过的汉字或数 字中最大的时间关键词。 0046 步骤 304、 获取事。

26、件类型关键词的实现方式具体为 : 0047 A) 在文本信息中检索预设的事件名称特定词, 当检索到事件名称特定词时, 获得 事件名称特定词的代码。 0048 所述事件名称特定词可以是交通信息处理人员预设的事件名称特定词, 例如 “交 通管制” 、“交通事故” 、“施工作业” 、“道路障碍” 等。 0049 B) 根据事件名称特定词的代码在预设的关系映射表中查找事件类型关键词对应 的事件编码, 从而得到事件类型关键词。 0050 进一步的, 步骤 A) 可以细化为 : 在文本信息中依次检索预设的事件大类名称特定 词、 事件中类名称特定词和事件小类名称特定词, 并获得对应的代码。 所述事件中类名称。

27、从 属于事件大类名称并对事件大类做进一步分类。 所述事件小类名称从属于事件中类名称并 对事件中类再做进一步分类。由此可以对交通事件类型进行细化, 获取更为精细的交通事 件信息。 说 明 书 CN 102610101 A 7 5/7 页 8 0051 具体的, 如表 1 所示, 首先在文本信息中检索事件大类名称, 例如检索到 “交通管 制” , 则事件大类名称代码为0。 当检索到事件大类名称后, 在事件大类名称的范围内检索事 件中类名称, 例如检索到 “转弯限制” , 则事件中类名称代码为 2。同样, 当检索到事件中类 名称后, 在事件中类名称的范围内检索事件小类名称, 例如检索到 “禁止左转”。

28、 , 则事件小类 名称代码为 2。 0052 对应步骤 A) 的细化, 步骤 B) 可以进一步细化为 : 将步骤 A) 中获取的事件大、 中、 小类名称特定词的代码按照大、 中、 小的顺序排列, 得到事件名称特定词的代码序列。然后 根据该代码序列在表 1 中查找对应的事件编码, 从而得到事件类型关键词。例如, 步骤 A) 中获取的事件名称特定词分别是 “交通管制” 、“转弯限制” 、“禁止左转” , 则步骤 B) 中得到事 件名称特定词的代码序列为 022。 0053 然后根据该代码序列在表 1 中查找事件编码, 从而得到事件类型关键词。代码序 列 022 对应的事件编码为 514, 即事件类。

29、型关键词为 514。 0054 0055 说 明 书 CN 102610101 A 8 6/7 页 9 0056 表 1 0057 值得说明的是, 图 3 中的步骤 301 至步骤 304 的执行顺序的仅为本发明实施例采 集关键词的执行顺序之一, 实际应用中对于步骤 301 至步骤 304 的执行顺序不做限制。 0058 202、 通过预设的字符将至少两个关键词按照与事件位置、 事件起始时间、 事件终 止时间以及事件类型对应的关系及顺序进行连接, 从而得到交通事件信息。 0059 可以通过 “+” 或 “、 ” 将多个关键词进行个链接。例如某一文本信息为 “西直门内 说 明 书 CN 1026。

30、10101 A 9 7/7 页 10 大街由东向西方向上午十点开始除雪作业, 下午一点结束除雪作业。 ” 则采集的交通事件信 息为 :“西直门内大街” +“上午十点开始” +“下午一点结束” +“9475” 。 0060 在本发明实施例的再一个应用场景中, 所述至少两种事件因素的关键词中可以不 同时包括事件起始时间关键词和事件终止时间关键词, 但是所述至少两种事件因素的关键 词中至少需要包括事件起始时间关键词或者事件终止时间关键词中的一个。 由于没有时间 信息的交通事件信息不具备实用性, 所以采集的关键词中至少需要有一个提供时间信息的 关键词, 而该关键词可以是起始时间关键词或者事件终止时间关。

31、键词。 0061 现有技术中采集交通事件信息的方式, 是对整个文本信息进行分析和概述, 其分 析的手段是对文本信息中的每一个字进行穷举和匹配。这种采集交通事件信息的方式, 需 要对文本信息逐字进行匹配, 在耗费大量信息处理资源的同时, 无法提高信息采集效率, 不 能适应出行者和交通管理者快速获取交通事件信息的需求。同时, 对于实时性要求高的交 通事件, 现有技术无法快速采集和发布交通事件信息, 不能适应突发性场景的需求, 不利于 交通管理者处理应急交通事件。 0062 本发明实施例提供的采集交通事件信息的方法, 能够通过获取文本信息中多个关 键词的信息获取交通事件信息, 避免现有技术中对文本信。

32、息逐字匹配的问题, 可以提高交 通事件信息的采集效率, 满足出行者和交通管理者对高时效性交通事件信息的需求。 0063 此外, 本发明实施例提供的采集交通事件信息的方法, 能够按照事件因素获取关 键词, 采集的交通事件信息便于分类管理和查找。 例如, 可以将事件类型相同的多个交通事 件信息归为一类, 在该类别里可以根据事件位置进一步分类。分类后的交通事件信息能够 便于便于分类管理和查找, 可以提高处理交通事件信息的效率。 0064 通过以上的实施方式的描述, 所属领域的技术人员可以清楚地了解到本发明可借 助软件加必需的通用硬件的方式来实现, 当然也可以通过硬件, 但很多情况下前者是更佳 的实施。

33、方式。基于这样的理解, 本发明的技术方案本质上或者说对现有技术做出贡献的部 分可以以软件产品的形式体现出来, 该计算机软件产品存储在可读取的存储介质中, 如计 算机的软盘, 硬盘或光盘等, 包括若干指令用以使得一台计算机设备 ( 可以是个人计算机, 服务器, 或者网络设备等 ) 执行本发明各个实施例所述的方法。 0065 以上所述, 仅为本发明的具体实施方式, 但本发明的保护范围并不局限于此, 任何 熟悉本技术领域的技术人员在本发明揭露的技术范围内, 可轻易想到变化或替换, 都应涵 盖在本发明的保护范围之内。 因此, 本发明的保护范围应所述以权利要求的保护范围为准。 说 明 书 CN 102610101 A 10 1/2 页 11 图 1 图 2 说 明 书 附 图 CN 102610101 A 11 2/2 页 12 图 3 说 明 书 附 图 CN 102610101 A 12 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 信号装置


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1