一种海量位置签到数据的可视化方法.pdf

上传人:111****112 文档编号:1898814 上传时间:2018-07-23 格式:PDF 页数:11 大小:1.14MB
返回 下载 相关 举报
摘要
申请专利号:

CN201410799227.7

申请日:

2014.12.19

公开号:

CN104537024A

公开日:

2015.04.22

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20141219|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

河海大学

发明人:

李正学; 许捍卫; 徐静波; 金文韬; 王海君

地址:

211100江苏省南京市江宁开发区佛城西路8号

优先权:

专利代理机构:

南京苏高专利商标事务所(普通合伙)32204

代理人:

娄嘉宁

PDF下载: PDF下载
内容摘要

本发明公布了一种海量位置签到数据的可视化方法,包括以下步骤:步骤1:从数据采集终端抓取位置签到数据,将采集到的数据存储到数据库中;步骤2:对步骤1中采集到的位置签到数据进行管理;步骤3:根据需要采集地理范围确定图幅范围;步骤4:采用NodeCanvas技术绘制地理底图;步骤5:在步骤4中获得地理地图上绘制采集到的位置签到数据;步骤6:输出结果图片。本发明可以根据不同的比例尺进行可视化,可视化效果美观,直观体现数据的分布规律。同时,本发明能够更加灵活的操作数据,有效解决了大数据可视化中数据读取的问题。使用本方法进行海量数据的可视化方法更加简单,绘图效率高,易于实现,效果好,能够绘制复杂图形。

权利要求书

权利要求书
1.  一种海量位置签到数据的可视化方法,其特征在于:包括以下步骤:
步骤1:从数据采集终端抓取位置签到数据,将采集到的数据存储到数据库中;
步骤2:对步骤1中采集到的位置签到数据进行管理;
步骤3:根据需要采集地理范围确定图幅范围;
步骤4:采用NodeCanvas技术绘制地理底图;
步骤5:在步骤4中获得地理地图上绘制采集到的位置签到数据;
步骤6:输出结果图片。

2.  根据权利要求1所述的海量位置签到数据的可视化方法,其特征在于:所述步 骤2中的数据管理包括以下步骤:
步骤201:数据预处理;去除数据中重复的和无效的位置数据;
步骤202:根据位置数据的唯一标识符建立唯一值索引;
步骤203:建立空间索引。

3.  根据权利要求1所述海量位置签到数据的可视化方法,其特征在于:所述步骤3 中确定图幅范围的方法,包括以下步骤:
步骤301:确定绘制地理范围的最小包围矩形;
步骤302:确定绘制图幅的大小;
步骤303:确定图幅左上角的坐标作为基准坐标。

4.  根据权利要求1所述海量位置签到数据的可视化方法,其特征在于:所述步骤4 中的绘制地理底图的方法,包括以下步骤:
步骤401:设置地理地图边线颜色、背景色和标注颜色;
步骤402:循环读取地理底图数据中的每个地理要素的经纬度信息绘制地理底图。

5.  根据权利要求1所述海量位置签到数据的可视化方法,其特征在于:所述步骤5 中绘制采集到的位置签到数据的方法包括以下步骤:
步骤501:从数据库中读取需要绘制的位置签到数据;
步骤502:将位置签到数据的经纬度坐标转成图幅像素坐标,在将转换后的图幅像
素坐标进行像素的海量的数据抽稀聚合;
步骤503:将位于同一像素位置数据的签到次数求和;
步骤504:统计每一像素签到次数的分布;
步骤505:根据统计结果确定签到次数到颜色映射;
步骤506:绘制位置签到数据。

6.  根据权利要求1所述海量位置签到数据的可视化方法,其特征在于:所述签到数 据为兴趣点数据。

7.  根据权利要求1所述海量位置签到数据的可视化方法,其特征在于:所述步骤2 中采用MongoDB进行数据的存储和管理。

说明书

说明书一种海量位置签到数据的可视化方法
技术领域
本发明涉及地理信息可视化处理领域,特别涉及一种海量位置签到数据的可视化方 法。
技术背景
数据可视化起源于1960年计算机图形学,采用计算机创建图形图表,通过可视化, 将数据的各种属性和变量呈现出来。随着数据采集设备和数据保存设备等计算机硬件的 发展,以及创建更复杂规模更大的数字模型的需求,于是乎发展了数据采集设备和数据 保存设备,需要更高级的计算机图形学技术及方法来创建这些规模庞大的数据集。随着 数据可视化平台的拓展,应用领域的增加,表现形式的不断变化,以及增加了诸如实时 动态效果、用户交互使用等功能,数据可视化像所有新兴概念一样边界在不断扩大。
针对大规模数据可视化的关键在于精简的概括性及自然的交互性,通过对映射 (mapping)、交互(interaction)这两个基本环节的设计来实现。映射是指将抽象数 据转换为可视化表示的过程,例如通过颜色映射数值关系。通过设计准确巧妙的映射, 可以将复杂抽象的数据形象直观地概括到一张或多张形象的图中,有利于有效地理解数 据;交互,是指计算机对人所作出某种特定行为的反应。通过设计便捷有效的交互有利 于人类自由地对复杂数据进行探索。对于传统数据而言,良好的映射与交互效果都可以 很好地实现。但是,对于海量异构数据,想要实现良好的映射与交互效果,无论是对算 法设计还是硬件设施都提出了更高的要求。
地图是一种简便、直观,也是目前非常流行的展现地理信息的可视化方式。它主要 根据地理位置的不同,将不同地区的数据展示在地图上。当前,随着移动互联网的爆炸 性发展,我们可以越来越方便地获取到更加精确的地理位置信息。在这大量地理数据的 背后,还有很多有意思的东西正等待着人们去挖掘发现。
借助对地理信息大数据的可视化可以直观地发现人类的空间行为特征。通过对不同 城市位置签到数据的可视化可以清楚地看出人口空间分布和轨迹特征,这是传统的人口 调查统计无法做到的。可以用来研究群体活动的地理空间分布、聚落规模、区位、空间 结构及功能区分布。但是在现有技术中还没有方法可以高效的将海量的签到数据可视 化。
发明内容
发明目的:本发明的目的在于针对现有技术的不足,提出了一种能够高效的、更加 直观的反应数据规律分布的海量的签到数据可视化方法。
技术方案:本发明提供了一种海量位置签到数据的可视化方法,包括以下步骤:
步骤1:从数据采集终端抓取位置签到数据,将采集到的数据存储到数据库中;
步骤2:对步骤1中采集到的位置签到数据进行管理;
步骤3:根据需要采集地理范围确定图幅范围;
步骤4:采用NodeCanvas技术绘制地理底图;NodeCanvas是一种使用NodeJS实现 的Canvas后端绘图技术。
步骤5:在步骤4中获得地理地图上绘制采集到的位置签到数据并输出结果图片;
步骤6:输出结果图片。
进一步,所述步骤2中的数据管理包括以下步骤:
步骤201:数据预处理;去除数据中重复的和无效的位置数据;
步骤202:根据位置数据的唯一标识符建立唯一值索引;
步骤203:建立空间索引。
进一步,所述步骤3中确定图幅范围的方法,包括以下步骤:
步骤301:确定绘制地理范围的最小包围矩形;
步骤302:确定绘制图幅的大小;
步骤303:确定图幅左上角的坐标作为基准坐标。
进一步,所述步骤4中的绘制地理底图的方法,包括以下步骤:
步骤401:设置地理地图边线颜色、背景色和标注颜色;
步骤402:循环读取地理底图数据,其中地理数据中每个地理要素的经纬度信息绘制 地理底图。
进一步,所述步骤5中绘制采集到的位置签到数据的方法包括以下步骤:
步骤501:从数据库中读取需要绘制的位置签到数据;
步骤502:将位置签到数据的经纬度坐标转成图幅像素坐标,在将转换后的图幅像素 坐标进行像素的海量的数据抽稀聚合;
步骤503:将位于同一像素位置数据的签到次数求和;
步骤504:统计每一像素签到次数的分布;
步骤505:根据统计结果确定签到次数到颜色映射;
步骤506:绘制位置签到数据。
进一步,所述签到数据为兴趣点(下文简称POI)数据。
进一步,所述步骤2中采用MongoDB进行数据的存储和管理。其中,MongoDB是一 种非关系数据库芒果数据库。采用MongoDB存储管理海量的POI签到数据,利用 MongoDBNoSQL设计方式,可以更加灵活的操作数据,对于大数据处理MongoDB选择最大 程度的利用内存资源作为缓存提高性能,解决大数据可视化中数据读取的问题。
有益效果:与现有技术相比,本发明可以根据不同的比例尺进行可视化,可视化效 果美观,直观体现数据的分布规律。同时,本发明能够更加灵活的操作数据,有效解决 了大数据可视化中数据读取的问题。使用本方法进行海量数据的可视化方法更加简单, 绘图效率高,易于实现,效果好,能够绘制复杂图形。再者,本发明对于海量数的绘制 采用了一种基于像素的数据抽稀聚合算法,该算法可以大大减少数据量而且不影响数据 的可视化效果。
附图说明
图1为本发明的流程示意图;
图2为实施例的图幅范围示意图;
图3为实施例的绘制地理底图结果;
图4为实施例的可视化结果图。
具体实施方式
以下结合附图和实例对本发明的实施作进一步说明,但本发明的实施和包含不限于 此。
如图1所示,本发明提供的一种海量位置数据的可视化方法,包括以下步骤:其中, 本发明利用新浪微博兴趣点(下文简称POI)签到数据作为实验数据。
步骤1:数据获取;该步骤包括以下步骤:
步骤101:抓取新浪微博POI签到数据,具体实施时,根据新浪微博编写爬虫程序, 其中,API为应用程序编程接口,抓取全国范围的内的所有POI数据;
步骤102:将数据存储到MongoDB数据库中。选择具有空间数据引擎功能的任意一 种数据库存储抓取的POI数据。
步骤2:数据的管理;主要包括以下步骤:
步骤201:数据预处理,预处理主要去除数据中重复的和无效的位置数据;
步骤202:根据数据的兴趣点序号(简称为POI ID)建立唯一索引,抓取的微博数据 具有POIID字段,POIID字段是POI的唯一标识符,在MongoDB数据库中,以POIID建 立唯一索引的命令为:
db.weibo.ensureIndex({POIid:1},{unique:true});
其含义为:使用数据库命令工具以POIID建立唯一值索引
步骤203:建立空间索引;在MongoDB中空间数据以GeoJSON格式的地理要素格式 存储,其中,GeoJSON是一种对各种地理数据结构进行编码的格式。根据位置(简称 location)字段建立空间索引的命令如下:
db.weibo.ensureIndex({<location field>:"2dsphere"});
其含义为:根据location字段建立空间索引命令行代码。
步骤3:确定图幅范围;主要包括以下步骤:
步骤301:确定绘制地理范围的最小包围矩形;计算需要绘制地理边界的范围,本 实例以江苏省为例,起始经纬度为(116.3672,30.7562)终止经纬度为(122.0032, 35.1233)
步骤302:确定绘制图幅的大小;首先确定图幅的缩放等级,缩放等级为绘制比例 尺的一种计算方法,一个缩放等级对应一个比例尺,取值为在0~20之间进行图像绘制。 本实例采用Google地图切片方案作为标准,根据地图的缩放等级和地图范围确定所绘
制区域包含的瓦片行列号。其中与经纬度坐标转成Google瓦片坐标系的公式为:
x = [ 2 z - 1 &CenterDot; ( λ 180 + 1 ) ] ]]>

其中,x和y分别表示Google瓦片坐标系的行号和列号,z为缩放等级,λ和分 别表示地理边界的经度和纬度。
根据步骤301中计算获得的绘制地理边界的经纬度范围和缩放等级两个参数可根据 上文公式计算出绘制区域的图幅大小。缩放等级为7时计算得瓦片范围左上角行列号 (105,50),右下角的行号为(107,52)瓦片大小为256*256px,因此绘制江苏省区域需 要3*3的九个地图瓦片。如图2所示,图幅所在的瓦片范围。图幅大小计算公式如下所 示:
Width=(Xmax-Xmin+1)*256px
Height=(Ymax-Ymin+1)*256px
式中Xmax、Xmin分别为瓦片最大、最小行号,Ymax、Ymin分别为最、大最小列号。
步骤303:确定图幅左上角的坐标作为基准坐标;根据步骤302计算左上角瓦片可 以计算出图幅左上角的像素坐标即为图幅的基准坐标(X,Y)。
计算公式:
X=R*256
Y=C*256
式中R、C为图幅左上角所在的行列号,即为步骤302中的Xmin和Ymin。
步骤4:绘制地理底图;主要包括以下步骤:
步骤401:设置地理地图边线颜色;本发明绘图采用NodeCanvas技术实现本地绘图, 绘图之前需要进行颜色等属性的配置,确定地理底图背景色,边线颜色,标注颜色。
步骤402:绘制地理底图;地理底图数据格式为GeoJSON格式,通过循环读取数据 中的每个地理要素的经纬度信息进行绘制,其中GeoJSON格式为一种轻量级的数据交换 格式。Canvas绘图是基于像素的,图幅的左上角为(0,0)坐标,需要将经纬度坐标转 为像素坐标。首先将经纬度坐标转为瓦片像素坐标(X1,Y1),然后减去步骤303中获 得的基准像素坐标,即可得到该经纬度所在的画布像素坐标。如图3所示,根据像素坐 标即可把地理底图绘制到画布上。
其中,经纬度坐标转成瓦片像素坐标的公式为
X1=(int)((λ+180)*16777216/180+0.5)/2(17-z)

其中,X1和Y1分别为瓦片像素坐标横坐标和纵坐标,z为缩放等级,λ和分别表 示地理边界的经度和纬度。
步骤5:绘制位置签到数据;主要包括以下步骤:
步骤501:从数据库读取需要绘制的POI数据,可以根据地理范围、属性查询需要 可视化的POI数据。
步骤502:将位置签到数据的经纬度坐标转成图幅像素坐标,转换方法和步骤402 的转换方法一致,在将转换后的数据进行像素的海量的数据抽稀聚合。该步骤为本发明 的核心步骤,即基于像素的海量的数据抽稀聚合方法,该方法在数据抽稀具有较好的压 缩比,全国范围内880多万条POI数据采用,缩放等级设置为5使用该方法抽稀聚合之 后,结果数据为12多万条,大大减少数据量,而且不影响可视化效果。
步骤503:位于同一像素的数据将签到次数求和,遍历需要可视化的POI签到数据, 将位于同一像素的POI数据聚合。聚合结果根据像素坐标存储在二维数组中,数组元素 的值为每个像素所聚合POI点签到次数的总和。
步骤504:统计每一像素签到次数的分布,统计503数组中的签到次数分布。
步骤505:根据统计结果确定签到次数颜色映射;根据每个像素点的签到次数的统 计值进行相应的颜色映射。
步骤506:绘制位置签到数据,采用NodeCanvas将每一像素根据对应的颜色绘制到 画布上。Canvas是用于网页绘制图形的技术,NodeCanvas是利用Nodejs实现并扩展了 Canvas用于后端绘图,NodeCanvas是基于像素的绘制技术,Google V8引擎执行绘图 程序的速度非常快,性能非常好。
数据采用基于像素的算法进行抽稀聚合,采用NodeCanvas基于像素的技术绘图更能 提高效率。NodeCanvas绘制点数据每秒种可绘制上百万点,这是普通的软件绘图做不到 的,而且NodeCanvas可以随意自定义绘制颜色。
步骤6:如图4所示,输出结果图片,是将NodeCanvas绘制的画布保存到本地。

一种海量位置签到数据的可视化方法.pdf_第1页
第1页 / 共11页
一种海量位置签到数据的可视化方法.pdf_第2页
第2页 / 共11页
一种海量位置签到数据的可视化方法.pdf_第3页
第3页 / 共11页
点击查看更多>>
资源描述

《一种海量位置签到数据的可视化方法.pdf》由会员分享,可在线阅读,更多相关《一种海量位置签到数据的可视化方法.pdf(11页珍藏版)》请在专利查询网上搜索。

本发明公布了一种海量位置签到数据的可视化方法,包括以下步骤:步骤1:从数据采集终端抓取位置签到数据,将采集到的数据存储到数据库中;步骤2:对步骤1中采集到的位置签到数据进行管理;步骤3:根据需要采集地理范围确定图幅范围;步骤4:采用NodeCanvas技术绘制地理底图;步骤5:在步骤4中获得地理地图上绘制采集到的位置签到数据;步骤6:输出结果图片。本发明可以根据不同的比例尺进行可视化,可视化效果美。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1