基于信息可视化技术的房产数据可视化系统 技术领域 本发明涉及到计算机图形学、 人机交互及心理学等多领域交叉的信息可视化和可 视分析技术, 尤其是一种房产数据可视化系统。
背景技术 信息可视化是可视化技术的新发展, 它将可视化技术从科学计算领域延伸到大型 数据库领域, 通过将数据库中的数据项转换为图形图像的形式, 发现数据内在的联系和发 展规律。随着数据集的容量不断增大、 复杂性 ( 如维度 ) 的不断提高, 使用传统的数据分析 和数据挖掘工具进行处理分析, 已经显得力不从心, 因此需要更加有效的方式来对数据进 行可视分析。 信息可视化是利用计算机图形学和图像处理技术将抽象数据以可视化的形式 展示出来, 辅助以相应的交互技术, 最终达到增强用户认知的目的。 利用信息可视化进行可 视分析, 可以帮助人们 :
1) 合成繁杂的、 动态的及带有歧义和冲突的数据, 并从中获得对数据的深入理 解;
2) 检测到预期希望的结果, 发现未知的趋势和现象 ;
3) 提供对数据实时的、 可靠的、 可理解的评估 ;
4) 通过协同技术, 与他人协同分析评估结果。
在当今经济高速发展的中国, 房地产业的蓬勃发展。 2001 年随着中国经济的腾飞, 为了刺激消费, 房地产市场也飞速发展, 越来越繁荣。2003 年 4 月是中国房地产业的一大 转折点, 不断飚升的房价使得老百姓无力承受, 为此中国政府实施了宏观调控政策, 同年 7 月, 国家政府又开始着手于整顿土地市场。2007 年 1 月国家建设部正式开始规范房地产经 纪行业。同时国税总局又清算了土地增值税该项举措标志了 2007 年的又一轮宏观调控的 开始。该年 3 月央行 2007 年再次加息, 6 月中国政府通过加强对外资的管理从而进一步扼 制房地产市场外资过热的势态, 这一系列的举措无非都保障了老百姓的民生问题, 解决了 老百姓无房可住的问题。2008 年 1 月国务院颁布了一系列有关政策严厉打击囤地。2010 年, 各地政府出台房屋限购令, 严格控制家庭购房套数。
房地产业在一定程度上成为了我国的支柱产业之一, 但其不良的发展趋势已对我 国的经济发展产生不良影响, 因而在国家对房地产业的宏观调控和在房地产市场经济自我 调节下, 使得对房地产数据的分析和深入挖掘成了当前促进该产业健康发展的一个重要任 务。 本发明以杭州房地产为例, 涉及到可视化技术中的地学可视化、 平行坐标、 树图、 时间流 图等技术, 旨在通过对杭州房地产数据的可视分析, 并辅助以用户交互来挖掘房产数据中 包含的重要信息。 本发明对购房者和房地产研究人员分析房产当前发展态势以及促进房产 业健康发展均有重要意义。
当前对针对房地产数据的可视化方式主要有如下几点不足 :
1) 将房产数据直接绘制在地图上, 如将楼盘节点信息直接绘制在地图上, 用颜色 表示楼盘的均价 ( 或者其他信息如在售、 未售等 )。当楼盘数量过多时, 这种单一的方式就
会出现绘制杂乱的现象, 也不便于用户选择感兴趣的楼盘。
2) 当前对于房产数据的时间变化的可视化, 往往采用的是比较单一的折线图, 如 绘制一个城市各个区块 ( 或楼盘 ) 近几年均价 ( 或房屋销售数量 ) 的变化, 当区块或者楼 盘数量较多时, 同样会出现绘制杂乱的情况, 用户难以直观看出各个数据项的趋势。
3) 当前房地产数据可视化方式往往处于静态的可视化展示上, 缺乏探索挖掘能 力, 缺少用户的交互, 很难发现隐藏在数据中的未知的信息和知识。
4) 可视化各个组件之间难以连接, 缺少协同分析的能力, 无法有效地使跟数据相 关的信息、 知识、 证据、 判断在不同组件之间传递, 使得难以深入挖掘数据中的信息。 发明内容
为了克服已有现有房产可视化技术的数据绘制混乱、 静态展示、 缺乏挖掘能力、 交 互性较差的不足, 本发明提供一种数据绘制统一、 动态展示、 具有良好挖掘能力和交互性的 基于信息可视化技术的房产数据可视化系统。
本发明解决其技术问题所采用的技术方案是 :
一种基于信息可视化技术的房产数据可视化系统, 所述房产数据可视化系统包 括: 楼盘地图可视化组件, 用以依照地图和楼盘地理位置数据, 在地图上标注出各个 销售楼盘的实际地理位置, 用户在地图上浏览、 查询所有楼盘位置信息, 指定某一些楼盘突 出或隐藏显示 ; 在地图操作上, 用户可任意缩放、 移动地图查看详细房屋位置 ; 当用户选择 某一楼盘标签时, 地图组件以提示框方式呈现该房屋的隐藏信息, 所述隐藏信息包括售价、 开盘时间和面积 ;
树图可视化组件, 用以采用一个矩形方块表示一个楼盘, 用矩形方块的颜色或面 积大小来展示对应楼盘的某一数值型数据, 树图其 100%的展示空间利用率使得其可以一 次性将所有楼盘绘制在指定的矩形区域内 ; 采用正方化布局方式, 该布局方式使得所有矩 形方块的长宽比尽量趋近于 1, 当在当前阶段展示区域中新加入矩形方块后得到长宽比相 对于上一阶段是有利的, 那么就继续添加矩形方块 ; 否则就结束当前阶段, 开始新的下一阶 段, 如此递归下去 ; 采用空间有序布局方式, 使用偏移原有地理图形位置的数据投影技术, 使得树图中矩形方块的布局位置接近实际地图中的位置 ;
平行坐标可视化组件, 用于可视化多维数据, 平行坐标通过绘制 n 条平行坐标轴, 每个数据项根据其各个属性值的大小分布在各个坐标轴上, 从而形成横跨 n 条平行坐标轴 的折线 ;
时间流图可视化组件, 用以使用时间流图来可视化时序数据, 时间流图用某一坐 标轴表示时间, 时间从左到右或从下到上依次递增, 均匀分布, 另一坐标轴表示数据项的数 值大小, 每一数据条带表示一个数据项, 数据条带的宽度表示数值项的大小, 通过层层叠加 的形式来展示出不同数据项间的相对大小 ; 采用堆栈布局方式, 数据条带在各个时间上使 用的基线均为一致 ; 采用对称布局方式, 让各个数据条针对于某一条轴线上下对称 ;
协同分析组件, 用以紧密地连接各个可视化组件, 用户在不同可视化组件进行不 同的选择操作时, 相应的在另外组件中实时显示所选数据的不同可视化效果。
进一步, 所述树图可视化组件中, 在矩形方块的排序上, 树图可视化组件采用矩形
方块的面积大小表示某一属性, 并根据面积大小在展示区域上对矩形方块从左上角到右下 角进行排列, 通过这样的排序方式, 显著突出面积比较大的矩形方块, 供用户重点选择查 看;
采用矩形方块的颜色深浅表示某一属性, 并根据颜色深浅在展示区域上对矩形方 块从左上角到右下角进行排列, 通过这样的排序方式, 可以显著区分出不同颜色的矩形方 块, 并呈现一种过渡趋势, 供用户选择相应的区块并查看。
再进一步, 所述平行坐标可视化组件中, 采用坐标轴重排, 通过选中某一坐标轴, 并拖动至另一坐标轴附近, 即可实现两坐标轴位置的互换 ;
采用坐标轴缩放调节坐标轴范围的最大最小值, 同时改变坐标轴范围的最大值最 小值或只改变坐标轴范围的最大 \ 最小值, 同样坐标轴缩放改变数据项在平行坐标中的分 布;
采用刷技术, 选中某一坐标轴上的某一数值范围, 进而在平行坐标中将属于这一 数值范围的数据项高亮起来, 便于用户查看这些数据项在其他维度上分布。
本发明的技术构思为 : 地学可视化用以对地理数据的可视探索、 分析、 合成和展 现, 且着重于传统的支持可视化探索过程的动态地图。地学可视化的一个显著特点是其技 术来源于多个领域, 如地理学、 地理信息科学、 制图学、 数据挖掘等领域。
据估计当今世界上产生的数据中有 80%包含空间参考信息 ( 如地理坐标、 地址、 邮政编码等 )。通过空间参考信息, 可以将大量的不同信息集成起来, 即将同一空间上的不 同数据集结合起来。传统的静态地图对数据的解释能力有限, 地学可视化可以实现更加动 态的、 交互性更强的地图, 如查看地图的不同层次、 放大缩小地图及改变地图的可视化展示 等。地学可视化实现了一系列的制图学技术和实践技术, 可以实时根据用户的选择来显示 动态地图数据, 其中最具代表性的可视化方式为地图展示方式。
平行坐标 (Parallel Coordinates) 是信息可视化、 可视分析等领域重要技术之 一, 用以可视化多维数据。平行坐标通过绘制 n 条平行坐标轴, 并将数据映射到二维平面 上, 每一个坐标轴表示一个维度, 该维度的取值范围在该坐标轴上的从最小值到最大值均 匀分布 ( 或以其他方式分布 )。因此, 对于每一个数据项, 就可以用一条横跨 n 条平行坐标 轴的折线表示, 相似的数据项就会得到相似的折线段。 平行坐标提供了刷技术、 坐标轴重排 ( 维度重排 )、 坐标轴缩放等交互技术, 使人们可以更深入地挖掘高维数据。 在当前 “数据爆 炸” 的时代, 平行坐标已经成为信息可视化、 可视分析等领域的主流技术之一。
树图是一种用矩形层次嵌套方式可视化层次结构数据的技术, 矩形节点大小、 颜 色及布局方式可以用以表示数据的属性 ( 如数值大小, 空间位置等 ), 树图是能有效地呈现 极高层次数据的信息可视化方法, 通过矩形节点绘制全部数据层次, 可以 100%地使用展示 空间。
信息世界有相当大一部分数据是层次结构数据, 当数据规模较小时人们可以直观 的理解它们, 但当数据规模增大时, 数据间的组织关系和所包含的信息便会变得复杂、 易混 淆。树图提供了一种从整体上查看全部层次组织的视角, 它高效地利用了指定的展示区域 并能提供明确的结构信息和节点包含的文本信息。与传统静态展示层次结构数据方法 ( 如 传统的树形结构 ) 空间利用率低、 交互性差等问题相比, 树图的交互控制使得用户可以指 定数据结构 ( 深度、 边界 ) 和内容 ( 展示属性如颜色绘制 ), 有效地进行可视分析。时间流图用以可视化时间序列数据, 在笛卡尔坐标系中, 时间流图用一个坐标轴 表示时间维度, 另外一个坐标轴表示数据项的数值大小, 每一数据条带表示一个数据项, 并 使用不同的颜色加以区分, 条带的宽度表示该数据项在某一时刻的大小, 宽度随着时间的 变化而变化。
时间流图改进了传统的堆栈图 (Stacked Graph), 其将每一个数据条带以一种特 殊的有机形式展现出来, 极大的增强了每一个数据条带的可辨认性, 同时增强了美观性, 克 服了传统的折线图在数据量多情况下, 容易出现杂乱的情况。
本发明的有益效果主要表现在 : 数据绘制统一、 动态展示、 具有良好挖掘能力和交 互性。 附图说明
图 1 是基于信息可视化技术的房产数据可视化系统的架构图。 具体实施方式
下面结合附图对本发明作进一步描述。 参照图 1, 一种基于信息可视化技术的房产数据可视化系统, 所述房产数据可视化 系统包括 :
楼盘地图可视化组件, 用以依照地图和楼盘地理位置数据, 在地图上标注出各个 销售楼盘的实际地理位置, 用户在地图上浏览、 查询所有楼盘位置信息, 指定某一些楼盘突 出或隐藏显示 ; 在地图操作上, 用户可任意缩放、 移动地图查看详细房屋位置 ; 当用户选择 某一楼盘标签时, 地图组件以提示框方式呈现该房屋的隐藏信息, 所述隐藏信息包括售价、 开盘时间和面积 ;
树图可视化组件, 用以采用一个矩形方块表示一个楼盘, 用矩形方块的颜色或面 积大小来展示对应楼盘的某一数值型数据, 树图其 100%的展示空间利用率使得其可以一 次性将所有楼盘绘制在指定的矩形区域内 ; 采用正方化布局方式, 该布局方式使得所有矩 形方块的长宽比尽量趋近于 1, 当在当前阶段展示区域中新加入矩形方块后得到长宽比相 对于上一阶段是有利的, 那么就继续添加矩形方块 ; 否则就结束当前阶段, 开始新的下一阶 段, 如此递归下去 ; 采用空间有序布局方式, 使用偏移原有地理图形位置的数据投影技术, 使得树图中矩形方块的布局位置接近实际地图中的位置 ;
平行坐标可视化组件, 用于可视化多维数据, 平行坐标通过绘制 n 条平行坐标轴, 每个数据项根据其各个属性值的大小分布在各个坐标轴上, 从而形成横跨 n 条平行坐标轴 的折线 ;
时间流图可视化组件, 用以使用时间流图来可视化时序数据, 时间流图用某一坐 标轴表示时间, 时间从左到右或从下到上依次递增, 均匀分布, 另一坐标轴表示数据项的数 值大小, 每一数据条带表示一个数据项, 数据条带的宽度表示数值项的大小, 通过层层叠加 的形式来展示出不同数据项间的相对大小 ; 采用堆栈布局方式, 数据条带在各个时间上使 用的基线均为一致 ; 采用对称布局方式, 让各个数据条针对于某一条轴线上下对称 ;
协同分析组件, 用于紧密地连接各个可视化组件, 用户在不同可视化组件进行不 同的选择操作时, 相应的在另外组件中实时显示所选数据的不同可视化效果。
本实施例中, 本发明采集杭州市住房保障和房产管理局、 杭州市国土资源局、 杭州 市规划局等多个官方网络平台上的数据作为可视化测试数据, 筛选其中可用数据, 整理出 楼盘的预售证、 所在区块、 楼盘房屋套数、 已售套数、 可售套数、 房屋面积、 均价、 总价等大量 数据, 并按年份和月份分类数据存为 CSV 格式文件。
本发明在获取楼盘的具体坐标位置后, 在地图上标注楼盘的实际地理位置, 用户 通过缩放地图查看楼盘的具体位置 ; 使用平行坐标来可视化楼盘的多维属性, 并辅助以刷 技术、 维度重排、 坐标轴缩放等交互技术 ; 使用树图来可视化所有楼盘在某一属性上的分 布, 并使用了多个布局方式 ; 将时间流图用以可视化时间序列数据, 同时也使用了多种布局 方式。
将以上的可视化方式相结合, 本发明对房地产数据的展示方式进行了创新。参照 图 1, 一种基于信息可视化技术的房产数据可视化系统, 所述房产数据可视化系统包括 :
1) 楼盘地图可视化组件 :
本组件根据杭州市地图和楼盘地理位置数据, 在地图上标注出杭州各个销售楼盘 的实际地理位置, 用户可以清楚地了解各个楼盘在杭州的分布信息, 该组件为购房者和房 地产研究人员提供必要地楼盘地理信息。 本发明使用的杭州地图来源于 Google Maps, 地图 上标注的房屋位置均为准确地实际位置。 在地图显示基础上, 本发明添加了如下交互功能 :
1. 用户可以在地图上浏览杭州市所有楼盘位置信息, 也可指定某一些楼盘突出或 隐藏显示, 减少楼盘标签间的覆盖率。
2. 提供查询功能, 根据输入名称搜索特定楼盘并在地图上显示该楼盘的具体信 息。
3. 在地图操作上, 用户可任意缩放、 移动地图查看详细房屋位置。
4. 当用户选择某一楼盘标签时, 地图组件以提示框方式呈现该房屋的隐藏信息 ( 如售价、 开盘时间、 面积等 ), 在选中某个楼盘后可在其他组件中查看该楼盘的其他信息, 各功能组件间的协同可视分析使得分析工作变得更加透彻。
2) 树图可视化组件 :
树图可视化组件用一个矩形方块表示一个楼盘 ( 也可以为其他属性如地理板块 等 ), 用矩形方块的颜色 ( 或面积大小 ) 来展示对应楼盘的某一数值型数据 ( 如楼盘均价、 可售套数等 ), 树图其 100%的展示空间利用率使得其可以一次性将杭州市所有楼盘绘制 在指定的矩形区域内。矩形方块颜色越深, 则该楼盘所选属性 ( 如均价等 ) 的数值越大, 反之 ; 同时也可以用矩形方块的面积来表示属性, 矩形方块的面积越大, 则该楼盘所选属性 ( 如均价等 ) 的数值越大, 反之。
在矩形方块布局方式上, 本可视化组件实现了如下几种布局方式 :
1. 正方化布局方式, 该布局方式使得所有矩形方块的长宽比尽量趋近于 1, 该布 局算法是一种自适应的算法, 算法的每一步在展示空间中进入添加更多的矩形, 当在当前 阶段展示区域中新加入矩形方块后得到长宽比相对于上一阶段是有利的, 那么就继续添加 矩形方块 ; 否则就结束当前阶段, 开始新的下一阶段, 如此递归下去。正方化布局方式可以 达到很好的显示效果, 它可以让用户在交互过程中, 更方便的选中某一矩形区块, 使得用户 交互更加友好, 同时正方化的布局方式更适合于文本在矩形方块中的填充。
2. 空间有序布局方式, 该布局方式使用偏移原有地理图形位置的数据投影技术, 使得树图中矩形方块的布局位置尽量接近实际地图中的位置, 同时利用正方化布局方式使 得矩形方块的长宽比尽量趋近于 1。 通过空间有序布局方式, 将矩形方块在树图中的位置和 在实际地图中的位置有机连接起来, 用户可以根据实际地理位置就可以在树图中快速的找 到该矩形方块, 大大增强用户体验。
在矩形方块的排序上, 本可视化组件实现了如下几种排序方式 :
1. 用矩形方块的面积大小表示某一属性, 并根据面积大小在展示区域上对矩形方 块从左上角到右下角进行排列, 通过这样的排序方式, 可以显著突出面积比较大的矩形方 块, 供用户重点选择查看 ;
用矩形方块的颜色深浅表示某一属性, 并根据颜色深浅在展示区域上对矩形方 块从左上角到右下角进行排列, 通过这样的排序方式, 可以显著区分出不同颜色的矩形方 块, 并呈现一种过渡趋势, 供用户选择相应的区块并查看。
3) 平行坐标可视化组件 :
在本发明中使用的平行坐标可视化组件中, 提供如下功能用以可视化房产数据 :
1. 设置用以显示的维度, 设置了预售证号、 销售状态、 均价、 可售套数、 可售限房这 五个维度, 每个数据项根据其各个属性值的大小分布在各个坐标轴上, 从而形成横跨 n 条 平行坐标轴的折线, 用以显示的维度可以随意地添加和删除。 2. 坐标轴重排, 通过选中某一坐标轴, 并拖动至另一坐标轴附近, 即可实现两坐标 轴位置的互换, 通过坐标轴重排的交互实现, 改变了数据项在平行坐标中的分布, 使得用户 可以进一步挖掘数据在平行坐标中分布的趋势。
3. 坐标轴缩放, 用以调节坐标轴范围的最大最小值, 可以同时改变坐标轴范围的 最大值最小值或只改变坐标轴范围的最大 \ 最小值, 同样坐标轴缩放可以改变数据项在平 行坐标中的分布。
4. 刷技术, 用以选中某一坐标轴上的某一数值范围, 进而在平行坐标中将属于这 一数值范围的数据项高亮起来, 便于用户查看这些数据项在其他维度上分布, 本发明使用 刷技术高亮了楼盘均价比较高的一部分。
4) 时间流图可视化组件
本发明使用时间流图来可视化时序数据, 时间流图用某一坐标轴表示时间, 时间 从左到右 ( 或从下到上 ) 依次递增, 均匀分布, 另一坐标轴表示数据项的数值大小, 每一数 据条带表示一个数据项, 数据条带的宽度表示数值项的大小, 通过层层叠加的形式来展示 出不同数据项间的相对大小。时间流图结构清晰、 合理, 符合一般人的审美习惯。本发明使 用时间流图展示了历年来年杭州各区块楼盘销售数量和杭州热门楼盘销售数量。
本时间流图可视化组件实现了如下功能 :
1. 堆栈布局方式, 在该布局方式中, 数据条带在各个时间上使用的基线均为一致, 因此使得布局方式呈现出类似于堆栈形式, 适合于用户直观地比较不同数据项的大小, 更 加迎合用户的使用习惯。
2. 对称布局方式, 该布局方式尽让让各个数据条针对于某一条轴线上下对称, 使 得不同时间点间的数值变化更加平滑, 斜率更小, 更加美观, 同时其对空间的利用率更高。
3. 便捷的用户交互, 随着用户鼠标在展示区域的滑动, 时间流图可视化组件就会
实时的高亮用户所划过的区域, 用户就可以查看不同数据项随着时间的变化, 如有些数据 项随着时间变化不大, 总体比较平缓, 而有的数据会呈现短暂性的突变等情况 ( 如楼盘开 盘, 热卖等情形 ) ; 同时, 该组件会以提示框的方式显示该时间点该数据项所含的信息 ( 如 详细时间, 均价数字信息等 ), 并且以线段表示该处的高度。
5) 协同分析组件
本发明通过实现协同可视化组件, 将各个可视化组件内部紧密地连接在一起, 使 得对房地产数据的分析不再是用单一的组件分析, 通过协同分析可以大大提高用户对房地 产数据的感知与认知能力。
用户在地图组件中选中某一楼盘后, 在平行坐标可视化组件中就看到高亮的折 线, 折线包含了该楼盘各属性的详细信息以及显示了该楼盘的各个属性值在所有楼盘各个 属性所处的位置。
同样, 当用户在平行坐标中使用刷技术高亮一部分数据项时, 在地图组件上就会 实时显示出相应数据项的地理位置, 供用户查看探索。
本发明所设计的针对杭州房地产数据可视化的系统具有以下优点 :
1) 将信息可视化技术运用到房地产数据的分析和处理中, 该房地产数据可视分析 和可视数据挖掘的新方法, 满足了不同用户对房产数据信息的获取、 研究和探索的需要, 填 补了国内房地产数据可视分析的空白。
2) 使用树图可视化组件来展示房产数据的概况, 以矩形方块的大小和颜色深浅表 示房产某一属性, 并辅助以良好便捷的交互方式, 让用户对房产数据的概况一目了然。
3) 使用平行坐标可视化来可视分析房产多维数据, 用户可以通过多种交互方式, 在平行坐标中自由地探索房产数据, 深入地挖掘房产数据, 增强对房产数据的感知和认知, 同时平行坐标其良好的数学基础使得分析结果更加可靠。
4) 使用时间流图来可视化房产时序数据, 保证每个数据项的可辨识性, 同时增强 了可视化的美感, 让用户能快速感知房产数据的整体时序变化。
5) 协同分析组件将信息可视化中的动态地图, 树图、 平行坐标及时间流图等可视 化组件与用户的行为关联起来, 其根据用户在某一组件里的操作, 实时地动态地在相关联 的组件中给出不同的可视化结果, 大大提高可是分析效率。