一种用于生成可视化视图的方法与设备.pdf

上传人:Y948****062 文档编号:4909277 上传时间:2018-11-26 格式:PDF 页数:24 大小:3.71MB
返回 下载 相关 举报
摘要
申请专利号:

CN201310284826.0

申请日:

2013.07.08

公开号:

CN103412871A

公开日:

2013.11.27

当前法律状态:

授权

有效性:

有权

法律详情:

登录超时

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

北京百度网讯科技有限公司

发明人:

杨骥; 林志峰

地址:

100085 北京市海淀区上地十街10号百度大厦2层

优先权:

专利代理机构:

北京汉昊知识产权代理事务所(普通合伙) 11370

代理人:

罗朋;周建华

PDF下载: PDF下载
内容摘要

本发明的目的是提供一种用于生成可视化视图的方法与设备。视图设备获取待展现的数据集,确定与所述数据集相对应的元素映射信息,如像素或图形等,并根据所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息,最后根据所述绘制参数信息,生成与所述数据集所对应的可视化视图;与现有技术相比,本发明通过实现了对各种类型的数据集(包括大数据量)进行可视化呈现,尤其是实现了在web端对大数据量的绘制,减少了服务器端的资源消耗,并通过对数据的直观呈现,提高了用户的信息获取效率,便于用户进行数据挖掘与处理,改善了用户的使用体验。

权利要求书

权利要求书
1.  一种用于生成可视化视图的方法,其中,该方法包括以下步骤:
a获取待展现的数据集;
b确定与所述数据集相对应的元素映射信息;
c根据所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息;
d根据所述绘制参数信息,生成与所述数据集所对应的可视化视图。

2.  根据权利要求1所述的方法,其中,所述步骤a包括:
-根据所选定的显示区域,确定与所述显示区域相对应的数据集,以作为待展现的数据集。

3.  根据权利要求1或2所述的方法,其中,所述步骤b包括:
-根据所述数据集所对应的数据量信息,确定与所述数据集相对应的元素映射信息。

4.  根据权利要求3所述的方法,其中,所述步骤b包括:
-根据所述数据集所对应的数据量信息,结合与所述数据集所相对应的显示设置信息,确定与所述数据集相对应的元素映射信息。

5.  根据权利要求1或2所述的方法,其中,所述步骤b包括:
b1确定所述数据集的量级类型信息;
-根据所述量级类型信息,确定与所述数据集相对应的元素映射信息。

6.  根据权利要求5所述的方法,其中,所述步骤b1包括:
-根据所述数据集的数据相关信息,确定所述数据集的量级类型信息;
其中,所述数据相关信息包括以下至少任一项:
-所述数据集的数据量信息;
-所述数据集的数据类型信息;
-所述数据集所对应的应用相关信息。

7.  根据权利要求1至6中任一项所述的方法,其中,所述步骤c包括:
-根据与所述数据集中的数据项相对应的数据值,确定与所述数据项所相对应的颜色信息;
-根据所述元素映射信息,结合与所述数据项所相对应的颜色信息,确定与所述数据集中的数据信息相对应的绘制参数信息。

8.  根据权利要求1至6中任一项所述的方法,其中,所述步骤c包括:
-根据与所述数据集中的数据项相对应的数据值,确定与所述数据集相对应的坐标系信息;
-根据所述元素映射信息,结合与所述数据集相对应的坐标系信息,确定与所述数据集中的数据信息相对应的绘制参数信息。

9.  根据权利要求1至6中任一项所述的方法,其中,所述步骤c包括:
-根据所述数据集所对应的数据量信息,对所述数据集中的数据项进行分段处理;
-根据所述分段处理后所获取的分段数据集,以及所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息。

10.  一种用于生成可视化视图的视图设备,其中,该设备包括:
获取装置,用于获取待展现的数据集;
映射装置,用于确定与所述数据集相对应的元素映射信息;
参数装置,用于根据所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息;
绘制装置,用于根据所述绘制参数信息,生成与所述数据集所对应的可视化视图。

11.  根据权利要求10所述的视图设备,其中,所述获取装置用于:
-根据所选定的显示区域,确定与所述显示区域相对应的数据集,以作为待展现的数据集。

12.  根据权利要求10或11所述的视图设备,其中,所述映射装置 用于:
-根据所述数据集所对应的数据量信息,确定与所述数据集相对应的元素映射信息。

13.  根据权利要求12所述的视图设备,其中,所述映射装置用于:
-根据所述数据集所对应的数据量信息,结合与所述数据集所相对应的显示设置信息,确定与所述数据集相对应的元素映射信息。

14.  根据权利要求10或11所述的视图设备,其中,所述映射装置包括:
量级确定单元,用于确定所述数据集的量级类型信息;
元素映射单元,用于根据所述量级类型信息,确定与所述数据集相对应的元素映射信息。

15.  根据权利要求14所述的视图设备,其中,所述量级确定单元包括:
-根据所述数据集的数据相关信息,确定所述数据集的量级类型信息;
其中,所述数据相关信息包括以下至少任一项:
-所述数据集的数据量信息;
-所述数据集的数据类型信息,;
-所述数据集所对应的应用相关信息。

16.  根据权利要求10至15中任一项所述的视图设备,其中,所述参数装置用于:
-根据与所述数据集中的数据项相对应的数据值,确定与所述数据项所相对应的颜色信息;
-根据所述元素映射信息,结合与所述数据项所相对应的颜色信息,确定与所述数据集中的数据信息相对应的绘制参数信息。

17.  根据权利要求10至15中任一项所述的视图设备,其中,所述参数装置用于:
-根据与所述数据集中的数据项相对应的数据值,确定与所述数据集相对应的坐标系信息;
-根据所述元素映射信息,结合与所述数据集相对应的坐标系信息,确定与所述数据集中的数据信息相对应的绘制参数信息。

18.  根据权利要求10至15中任一项所述的视图设备,其中,所述参数装置用于:
-根据所述数据集所对应的数据量信息,对所述数据集中的数据项进行分段处理;
-根据所述分段处理后所获取的分段数据集,以及所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息。

19.  一种浏览器,包括如权利要求10至18中任一项所述的用于生成可视化视图的视图设备。

20.  一种浏览器插件,包括如权利要求10至18中任一项所述的用于生成可视化视图的视图设备。

说明书

说明书一种用于生成可视化视图的方法与设备
技术领域
本发明涉及互联网领域,尤其涉及一种用于生成可视化视图的技术。
背景技术
利用可视化视图进行信息的呈现与分析,能够直观地呈现数据统计结果,可视化的解读各项数据组成,因此,是当前数据工作者们常用的数据分析方法。例如,常用的数据统计图表工具如微软公司开发的Microsoft Office中的组件Excel,其可以根据特定的数据项生成指定的数据统计图表。
随着用户所需处理的数据越来越复杂,所需处理的数据量越来越大,用户需要能够对大量数据进行可视化呈现。然而,现有的可视化视图工具对大数据量可视化的支持较差,无法直观清楚地对大量数据进行可视化呈现。并且,当前的可视化视图工具仅能通过获取表单来获取所述大量数据,无法通过与可视化视图的交互对数据进行进一步挖掘。
发明内容
本发明的目的是提供一种用于生成可视化视图的方法与设备。
根据本发明的一个方面,提供了一种用于生成可视化视图的方法,其中,该方法包括以下步骤:
a获取待展现的数据集;
b确定与所述数据集相对应的元素映射信息;
c根据所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息;
d根据所述绘制参数信息,生成与所述数据集所对应的可视化视图。
根据本发明的另一方面,还提供了一种用于生成可视化视图的视图设备,其中,该设备包括:
获取装置,用于获取待展现的数据集;
映射装置,用于确定与所述数据集相对应的元素映射信息;
参数装置,用于根据所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息;
绘制装置,用于根据所述绘制参数信息,生成与所述数据集所对应的可视化视图。
根据本发明的再一方面,还提供了一种浏览器,包括如上述所述的用于生成可视化视图的视图设备。
根据本发明的又一方面,还提供了一种浏览器插件,包括如上述所述的用于生成可视化视图的视图设备。
与现有技术相比,本发明通过获取待展现的数据集,确定与所述数据集相对应的元素映射信息,如像素或图形等,并根据所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息,最后根据所述绘制参数信息,生成与所述数据集所对应的可视化视图;从而实现了对各种类型的数据集(包括大数据量)进行可视化呈现,尤其是实现了在web端对大数据量的绘制,减少了服务器端的资源消耗,并通过对数据的直观呈现,提高了用户的信息获取效率,便于用户进行数据挖掘与处理,改善了用户的使用体验。
而且,本发明还可以根据所选定的显示区域,确定与所述显示区域相对应的数据集,以作为待展现的数据集;从而使得用户可以根据与可视化视图的交互,直观地对数据集与可视化视图进行挖掘、呈现与处理,提高了数据处理效率与用户的信息获取效率,改善了用户的使用体验。
而且,本发明还可以根据所述数据集所对应的数据量信息,确定与所述数据集相对应的元素映射信息,从而实现了对所述数据集中的数 据量大小的判定,进而准确的选择相适应的元素映射信息,能够直观、清楚地对所述数据集进行呈现,提高了用户的信息获取效率,便于用户进行数据挖掘与处理,改善了用户的使用体验;进一步地,还可以根据所述数据集所对应的数据量信息,结合与所述数据集所相对应的显示设置信息,确定与所述数据集相对应的元素映射信息,从而根据不同的显示设置信息,对不同的显示屏幕或不同的用户设置下的显示屏幕提供不同的数据量大小的判定,进而准确的选择相适应的元素映射信息,能够直观、清楚地对所述数据集进行呈现,提高了用户的信息获取效率,便于用户进行数据挖掘与处理,改善了用户的使用体验。
而且,本发明还可以确定所述数据集的量级类型信息,根据所述量级类型信息,确定与所述数据集相对应的元素映射信息;进一步地,还可以根据所述数据集的数据相关信息,确定所述数据集的量级类型信息;从而根据不同的量级类型信息,准确的选择相适应的元素映射信息,能够直观、清楚地对所述数据集进行呈现,提高了用户的信息获取效率,便于用户进行数据挖掘与处理,改善了用户的使用体验。
而且,本发明可以根据与所述数据集中的数据项相对应的数据值,确定与所述数据项所相对应的颜色信息,根据所述元素映射信息,结合与所述数据项所相对应的颜色信息,确定与所述数据集中的数据信息相对应的绘制参数信息;或者,可以根据与所述数据集中的数据项相对应的数据值,确定与所述数据集相对应的坐标系信息,根据所述元素映射信息,结合与所述数据集相对应的坐标系信息,确定与所述数据集中的数据信息相对应的绘制参数信息;或者,可以根据所述数据集所对应的数据量信息,对所述数据集中的数据项进行分段处理,根据所述分段处理后所获取的分段数据集,以及所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息;从而实现了对各种类型的数据集(包括大数据量)进行可视化呈现,尤其是实现了在web端对大数据量的绘制,减少了服务器端的资源消耗,能够直观的呈现出所述数据集、尤其是大数据集的数据信息,提高了用户的信息获取效率,便于用户进行数据挖掘与处理,改善了用户的使用体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的一种用于生成可视化视图的视图设备示意图;
图2示出根据本发明一个优选实施例的一种用于生成可视化视图的视图设备示意图;
图3示出根据本发明另一个方面的一种用于生成可视化视图的方法流程图;
图4示出根据本发明一个优选实施例的一种用于生成可视化视图的方法流程图;
图5示出根据本发明的一个优选实施例的一种数据量很大时的可视化视图;
图6示出根据本发明的一个优选实施例的一种确定待展现的数据集的示意图;
图7示出了对图6所述待展现的区域进行重绘制后的可视化视图;
图8示出根据本发明的一个优选实施例的一种确定待展现的数据集的示意图;
图9示出了对图8所述待展现的区域进行重绘制后的可视化视图;
图10示出了根据本发明的一个优选实施例的一种以“某公司男女身高体重分布数据集”为例的可视化视图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的一种用于生成可视化视图的视图设备示意图;其中,所述视图设备包括获取装置1、映射装置2、参数装置3、绘制装置4。具体地,获取装置1获取待展现的数据集; 映射装置2确定与所述数据集相对应的元素映射信息;参数装置3根据所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息;绘制装置4根据所述绘制参数信息,生成与所述数据集所对应的可视化视图。
在此,所述视图设备包括但不限于网络设备、用户设备、或网络设备与用户设备通过网络相集成所构成的设备。其中,所述网络设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述用户设备其包括但不限于任何一种可与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例如计算机、智能手机、PDA、游戏机、或IPTV等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。
视图设备还包括能够用于生成可视化视图的浏览器、浏览器插件或其他可视化视图生成应用,例如基于flash、svg(可缩放矢量图形,Scalable Vector Graphics)或HTML5中画图(canvas)的相关应用。本领域技术人员应能理解,其他的视图设备同样适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
上述各装置之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各装置分别实时地,或者按照设定的或实时调整的工作模式要求,进行待展现的数据集的获取、元素映射信息的确定、绘制参数信息的确定、可视化视图的生成等,直至视图设备停止获取待展现的数据集。
获取装置1获取待展现的数据集。
具体地,所述获取装置1通过基于各种通信协议(Communications Protocol),与其他能够获取待展现的数据集的设备,如存储数据集的数据库或其他第三方设备进行交互,直接获取待展现的数据集;或者所述获取装置1通过基于各种通信协议(Communications Protocol),与输入设备(如鼠标、键盘、触摸屏等)进行交互,获取用户通过点击、输入、触摸等方式所选择或输入的待展现的数据集的名称,然后与存储数据集的数据库或其他第三方设备进行交互,获取用户指定的待展现的数据集;或者,所述获取装置1通过基于各种通信协议(Communications Protocol),与输入设备(如鼠标、键盘、触摸屏等)进行交互,获取用户通过选定方式所选择的待展现的数据集的范围,并根据所述范围,确定待展现的数据集,例如,用户可以对全屏和部分屏幕进行选择,通过选定一个或多个待展现的数据集的名称、一个或多个待展现的数据项等方式,获取待展现的数据集。
其中,所述数据集中包含一个或多个数据项,所述数据集中的数据项的数量不受限制。
例如,用户可以在客户端(包括但不限于如浏览器端或其他客户端)选定数据集名称“某公司男女身高体重分布数据集”,客户端通过基于各种网络协议,与服务器端相交互,获取服务器端所发送的与该数据集相对应的一组或多组数据,从而获取待展现的数据集。在此,若当客户端已经获取所述“某公司男女身高体重分布数据集”时,若用户再次选定该数据集中的一组或多组数据,则既可以与服务器端相交互以获取所述一组或多组数据,也可以在客户端缓存中直接获取与用户选定相对应的一组或多组数据。
在此,“通信协议”包括计算机通信的传送协议,如TCP/IP、UDP、FTP、ICMP、NetBEUI等,或者存在于计算机中的其他形式通信,例如面向对象编程里面对象之间的通信或操作系统内不同程序或计算机不同模块之间的消息传送协议。
优选地,所述获取装置1可以根据所选定的显示区域,确定与所述显示区域相对应的数据集,以作为待展现的数据集。
具体地,所述获取装置1通过基于各种通信协议(Communications Protocol),与输入设备(如鼠标、键盘、触摸屏等)进行交互,获取用户通过点选、拖拽选择等一种或多种选定方式所选择的显示区域,将所述显示区域所对应的显示内容转换成与所述显示区域相对应的数据集,并将所述数据集作为待展现的数据集。
其中,所述显示区域包括但不限于全屏或部分屏幕,所述显示区域可以是文字区域、表格区域,也可以是可视化视图。
例如,如图5所示,图5为根据本发明的一个优选实施例的一种数据量很大时(数据量为30万组数据)的可视化视图,图6为根据本发明的一个优选实施例的一种确定待展现的数据集的示意图。用户通过拖拽选择的方式,选定了图6中方块所示的区域,所述获取装置1首先确定所选定的显示区域的范围;根据所选定的显示区域,确定与所述显示区域中的显示元素;并通过与缓存进行交互或者与服务器进行交互等方式,确定所述显示元素相对应的数据集,将所述数据集作为待展现的数据集。从而,本发明可以根据与用户的交互(包括但不限于放大或缩小),以确定待展现的数据集,直观地对数据集与可视化视图进行挖掘、呈现与处理,提高了数据处理效率与用户的信息获取效率,改善了用户的使用体验。
映射装置2确定与所述数据集相对应的元素映射信息。
具体地,所述映射装置2根据所述获取装置1所获取的待展现的数据集,通过根据所述数据集所对应的数据量大小、待展现的数据集的类别(如二元组数据、三元组数据、多元组数据;或者根据数据集的具体内容所划分的类别,如数据集对应男性数据或女性数据等)、待展现的数据集所对应的应用信息(如用于不同终端的应用等)等中的一种或多种信息,确定与所述数据集相对应的元素映射信息。
在此,所述元素映射信息包括但不限于用于呈现所述数据集中的数据项的数据样式信息,所述数据样式信息包括但不限于如像素或图形等。进一步地,所述元素映射信息还包括但不限于二维或三维图像中的像素或图形等。
优选地,所述映射装置2可以根据所述数据集所对应的数据量信息,确定与所述数据集相对应的元素映射信息。
具体地,所述映射装置2可以根据所述数据集所对应的数据量信息,例如,根据系统缺省设置的数据量判定阈值,或者根据用户所设定的数据量判定阈值,或者根据用户的操作信息进行自学习所确定的数据量判定阈值,对所述数据集所对应的数据量大小进行判定,根据所述数据量信息,确定与所述数据集相对应的元素映射信息,如像素或图形等。
例如,系统缺省设置的数据量判定阈值为2000,则当所述数据集中的数据量大于2000时,则将所述数据集中的数据项映射为像素;若所述数据集中的数据量小于等于2000时,则将所述数据集中的数据项映射为图形(如圆形、方形、三角形等各种图形)。
进一步地,例如,还可以结合所述数据集或数据集中的数据的类型信息,确定元素映射信息,例如,当“某公司男女身高体重分布数据集”的数据量小于2000时,首先将所述数据集中的数据项映射为图形;同时根据所述数据集中的数据类型信息,将男性所对应的数据映射为方块图,将女性所对应的数据映射为圆形图等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,其他根据所述数据集所对应的数据量信息,确定与所述数据集相对应的元素映射信息的方式,均应包含在本发明的范围内。
更优选地,所述映射装置2可以根据所述数据集所对应的数据量信息,结合与所述数据集所相对应的显示设置信息,确定与所述数据集相对应的元素映射信息。
具体地,所述映射装置2还可以结合与所述数据集所相对应的显示设置信息,例如,屏幕分辨率信息或用于生成可视化视图的绘图区域的大小信息等,根据所述数据集所对应的数据量信息,确定与所述数据集相对应的元素映射信息。
例如,当所述显示屏幕的分辨率为1280*800及其以上时,系统 缺省设置当数据集中的数据量大于2000以上则采用像素作为元素映射信息,小于2000则采用图形作为元素映射信息;当所述显示屏幕的分辨率为960*640或1024*768时,系统缺省设置当数据集中的数据量大于1000以上则采用像素作为元素映射信息,小于1000则采用图形作为元素映射信息;当所述显示屏幕的分辨率为800*480及其以下时,系统缺省设置当数据集中的数据量大于500以上则采用像素作为元素映射信息,小于500则采用图形作为元素映射信息。
同时,所述映射装置2还能够支持根据用户个性化设置的、结合所述显示设置信息的其他用于确定元素映射信息的数据量信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,其他任何结合所述显示设置信息的用于确定元素映射信息的数据量信息,均应包含在本发明的范围内。
参数装置3根据所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息。
具体地,所述参数装置3根据所述映射装置2所确定的元素映射信息,根据所述数据集中的每一个数据项,如所述数据项所对应的数据值信息、数据类型信息等,确定与所述数据集中的每一个数据项所对应的绘制参数信息,进而确定与所述数据集中的数据信息相对应的绘制参数信息。
其中,所述数据集中包含一个或多个数据项,所述数据集中的数据项的数量不受限制。所述数据集中的数据信息则包括但不限于所有数据项的数据值信息、数据类型信息等。
其中,所述绘制参数信息包括但不限于每一个数据项所对应的绘制元素(如像素或图形)、颜色、形状、大小等。由于所生成的可视化视图可以是二维视图或三维视图,因此所述绘制参数信息中也可以包含对应二维视图或三维视图的其他参数。
优选地,所述参数装置3可以根据与所述数据集中的数据项相对应的数据值,确定与所述数据项所相对应的颜色信息;根据所述元素映 射信息,结合与所述数据项所相对应的颜色信息,确定与所述数据集中的数据信息相对应的绘制参数信息。
具体地,所述参数装置3可以根据与所述数据集中的数据项相对应的数据值,通过基于预设的计算方式,将所述数据值与颜色信息进行映射,确定与所述数据项所相对应的颜色信息;并根据所述颜色信息,以及所述元素映射信息(如像素或图形等),确定与所述数据集中的数据信息相对应的绘制参数信息(如像素的颜色或图形的颜色等)。例如,在一个直角坐标系中,使用像素或图形来代表数据,使用不同的颜色系列来代表不同数据组,使用同一颜色系列的不同深浅的颜色来代表数据的数据值。
例如,如图10所示,图10示出了根据本发明的一个优选实施例的一种以“某公司男女身高体重分布数据集”为例的可视化视图。其中,横坐标表示身高,纵坐标表示体重,每个坐标点颜色值的公式为(数据个数*权重/256)*颜色值;该图所对应的数据集的数据量大小小于2000,因此与该数据集所对应的元素映射信息为形状,在此,采用方块表示男性,圆形表示女性;同时,采用红色rgb(256,0,0)代表女性,蓝色rgb(0,0,256)代表男性。
假设,每一个员工权重为1,身高160mm且体重50kg的女性有100个,那么坐标(160,50)点的颜色为(100*1/256)*rgb(256,0,0)=rgb(100,0,0);反之,若坐标(180,70)点的颜色为rgb(0,0,200),那么身高180mm体重70kg的男生的人数为rgb(0,0,200)/rgb(0,0,256)*256/1=200个。
在此,本领域技术人员应能理解,当所述元素映射信息为像素时,可以根据所述数据值计算所对应的像素的颜色信息;当所述元素映射信息为形状时,可以根据所述数据值计算所对应的形状的颜色信息,还可以根据所述数据值计算所对应形状的大小,如数据值越大,所对应的形状越大等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,其他任何根据与所述 数据集中的数据项相对应的数据值,确定与所述数据项所相对应的颜色信息,进而确定绘制参数信息的方式,均应包含在本发明的范围内。
优选地,所述参数装置3可以根据与所述数据集中的数据项相对应的数据值,确定与所述数据集相对应的坐标系信息;根据所述元素映射信息,结合与所述数据集相对应的坐标系信息,确定与所述数据集中的数据信息相对应的绘制参数信息。
具体地,所述参数装置3可以根据所述数据集中的数据项所对应的数据值,例如通过获取所有数据项的最大值、最小值或数据值的分布等信息,确定与所述数据集相对应的坐标系信息;并根据所述元素映射信息,结合与所述数据集相对应的坐标系信息,将所述数据集中的数据信息以元素映射信息的形式映射至所述坐标系中,从而确定与所述数据集中的数据信息相对应的绘制参数信息。
例如,所述数据集中的最大值为10000,最小值为1,则根据(1,10000)确定相对应的坐标系信息;当用户对生成的可视化视图进行选择后,所选择的范围所对应的数据值为(100,1000),则根据(100,1000)重新确定新的相对应的坐标系信息,进而基于新的所述坐标系信息来确定所述绘制参数信息。从而避免了简单的图形放大缩小后,所依据的坐标系并非最优解导致的可视化视图不清楚等问题。
例如,图6示出根据本发明的一个优选实施例的一种确定待展现的数据集的示意图;图7示出了对所述待展现的区域进行重绘制后的可视化视图,在图7中,所述参数装置3对图6所选择的区域的数据的数据值进行获取,重新生成坐标系信息后,重新绘制。
例如,图8示出根据本发明的一个优选实施例的一种确定待展现的数据集的示意图;图9示出了对图8所述待展现的区域进行重绘制后的可视化视图,在图9中,所述参数装置3对图8所选择的区域的数据的数据值进行获取,重新生成坐标系信息后,重新绘制。在此,图8的绘制参数信息是像素,经过重新选择后,图9中由于数据量变少,因此,所述图9中的元素映射信息为图形,同时根据所选择的区域的数据的数据值,重新生成坐标系信息后,基于新的元素映射信息及坐标系信息, 重新绘制。
优选地,所述参数装置3可以根据所述数据集所对应的数据量信息,对所述数据集中的数据项进行分段处理;根据所述分段处理后所获取的分段数据集,以及所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息。
具体地,所述参数装置3可以根据所述数据集所对应的数据量信息,通过基于预定的或缺省的分段设置信息,对所述数据集中的数据项进行分段处理;根据所述分段处理后所获取的分段数据集,对不同分段的数据集的颜色、大小、形状等进行区分,进而结合所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息。
例如,所述数据集对应10万个数据项,按照所述数据项的数据值大小,将所述10万个数据划分为10个区段,每个区段内包含1万个数据项;将第一个区段内的1万个数据采用红色显示,按照红色的深浅表示数据值的大小,将第二个区段内的1万个数据采用蓝色显示,按照蓝色的深浅表示数据值的大小等,以此类推,从而为用户提供更为清晰的可视化视图。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,其他任何根据所述数据集所对应的数据量信息,对所述数据集中的数据项进行分段处理,并根据所述分段处理后所获取的分段数据集,以及所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息的方式,均应包含在本发明的范围内。
绘制装置4根据所述绘制参数信息,生成与所述数据集所对应的可视化视图。
具体地,所述绘制装置4根据所述参数装置3所确定的绘制参数信息,将所述数据集在对应的画布上以二维或三维的方式进行绘制,从而生成与所述数据集所对应的可视化视图。
在此,所述可视化视图包括二维可视化视图或三维可视化视图;所述可视化视图包括但不限于散点图、K线图、折线图、柱状图或其 他类型的图等。
图2示出根据本发明一个优选实施例的一种用于生成可视化视图的视图设备示意图;其中,所述视图设备包括获取装置1’、映射装置2’、参数装置3’、绘制装置4’,所述映射装置2’包括量级确定单元21’、元素映射单元22’。具体地,获取装置1’获取待展现的数据集;量级确定单元21’确定所述数据集的量级类型信息;元素映射单元22’根据所述量级类型信息,确定与所述数据集相对应的元素映射信息;参数装置3’根据所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息;绘制装置4’根据所述绘制参数信息,生成与所述数据集所对应的可视化视图。其中,视图设备中的获取装置1’、参数装置3’、绘制装置4’与图1所示对应装置相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
上述各装置之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各装置分别实时地,或者按照设定的或实时调整的工作模式要求,进行待展现的数据集的获取、量级类型信息的确定、元素映射信息的确定、绘制参数信息的确定、可视化视图的生成等,直至视图设备停止获取待展现的数据集。
量级确定单元21’确定所述数据集的量级类型信息。
具体地,所述量级确定单元21’基于预定规则,通过对所述数据集中的数据信息进行获取,基于如数据量信息等确定所述数据集的量级类型信息;其中,所述量级类型信息包括但不限于大数据、小数据或其他类型的量级类型等。
优选地,所述量级确定单元21’可以根据所述数据集的数据相关信息,确定所述数据集的量级类型信息。
具体地,所述量级确定单元21’根据所述数据集的数据相关信息,根据所述数据相关信息中的一项或多项,基于预定的或机器学习的阈值等信息,确定所述数据集的量级类型信息。
其中,所述数据相关信息包括以下至少任一项:
-所述数据集的数据量信息,例如,当所述数据集的数据量大于一 定的阈值时,所述数据集的量级类型信息为大数据,当所述数据集的数据量小于一定的阈值时,所述数据级的量级类型信息为小数据等;
-所述数据集的数据类型信息,例如,对于同样数据量的两个不同类型的数据集,根据所述数据集的数据类型信息,为两个数据集确定不同的量级类型信息,如同样数据量的“身高体重”类型数据和“产品销售省份分布”类型数据,将前者确定为小数据,后者确定为大数据等;
-所述数据集所对应的应用相关信息,例如,根据所述数据集所对应的应用的数据分析类型,为所述数据集确定不同类型的量级类型信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,其他任何根据所述数据集的数据相关信息,确定所述数据集的量级类型信息的方式或其他数据相关信息,均应包含在本发明的范围内。
元素映射单元22’根据所述量级类型信息,确定与所述数据集相对应的元素映射信息。
具体地,所述元素映射单元22’根据所述量级类型信息,根据预定的映射关系,确定与所述数据集相对应的元素映射信息。例如,当所述量级类型信息为大数据时,则所对应的元素映射信息为像素,若所述量级类型信息为小数据时,则对应的元素映射信息为图形。
图3示出根据本发明另一个方面的一种用于生成可视化视图的方法流程图。具体地,在步骤s1中,所述视图设备获取待展现的数据集;在步骤s2中,所述视图设备确定与所述数据集相对应的元素映射信息;在步骤s3中,所述视图设备根据所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息;在步骤s4中,所述视图设备根据所述绘制参数信息,生成与所述数据集所对应的可视化视图。
上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各步骤分别实时地,或者按照设定的或实时调整的工作模式要求,进行待展现的数据集的获取、元素映射信息的确定、 绘制参数信息的确定、可视化视图的生成等,直至视图设备停止获取待展现的数据集。
在步骤s1中,所述视图设备获取待展现的数据集。
具体地,在步骤s1中,所述视图设备通过基于各种通信协议(Communications Protocol),与其他能够获取待展现的数据集的设备,如存储数据集的数据库或其他第三方设备进行交互,直接获取待展现的数据集;或者在步骤s1中,所述视图设备通过基于各种通信协议(Communications Protocol),与输入设备(如鼠标、键盘、触摸屏等)进行交互,获取用户通过点击、输入、触摸等方式所选择或输入的待展现的数据集的名称,然后与存储数据集的数据库或其他第三方设备进行交互,获取用户指定的待展现的数据集;或者,在步骤s1中,所述视图设备通过基于各种通信协议(Communications Protocol),与输入设备(如鼠标、键盘、触摸屏等)进行交互,获取用户通过选定方式所选择的待展现的数据集的范围,并根据所述范围,确定待展现的数据集,例如,用户可以对全屏和部分屏幕进行选择,通过选定一个或多个待展现的数据集的名称、一个或多个待展现的数据项等方式,获取待展现的数据集。
其中,所述数据集中包含一个或多个数据项,所述数据集中的数据项的数量不受限制。
例如,用户可以在客户端(包括但不限于如浏览器端或其他客户端)选定数据集名称“某公司男女身高体重分布数据集”,客户端通过基于各种网络协议,与服务器端相交互,获取服务器端所发送的与该数据集相对应的一组或多组数据,从而获取待展现的数据集。在此,若当客户端已经获取所述“某公司男女身高体重分布数据集”时,若用户再次选定该数据集中的一组或多组数据,则既可以与服务器端相交互以获取所述一组或多组数据,也可以在客户端缓存中直接获取与用户选定相对应的一组或多组数据。
在此,“通信协议”包括计算机通信的传送协议,如TCP/IP、UDP、FTP、ICMP、NetBEUI等,或者存在于计算机中的其他形式通信,例 如面向对象编程里面对象之间的通信或操作系统内不同程序或计算机不同模块之间的消息传送协议。
优选地,在步骤s1中,所述视图设备可以根据所选定的显示区域,确定与所述显示区域相对应的数据集,以作为待展现的数据集。
具体地,在步骤s1中,所述视图设备通过基于各种通信协议(Communications Protocol),与输入设备(如鼠标、键盘、触摸屏等)进行交互,获取用户通过点选、拖拽选择等一种或多种选定方式所选择的显示区域,将所述显示区域所对应的显示内容转换成与所述显示区域相对应的数据集,并将所述数据集作为待展现的数据集。
其中,所述显示区域包括但不限于全屏或部分屏幕,所述显示区域可以是文字区域、表格区域,也可以是可视化视图。
例如,如图5所示,图5为根据本发明的一个优选实施例的一种数据量很大时(数据量为30万组数据)的可视化视图,图6为根据本发明的一个优选实施例的一种确定待展现的数据集的示意图。用户通过拖拽选择的方式,选定了图6中方块所示的区域,在步骤s1中,所述视图设备首先确定所选定的显示区域的范围;根据所选定的显示区域,确定与所述显示区域中的显示元素;并通过与缓存进行交互或者与服务器进行交互等方式,确定所述显示元素相对应的数据集,将所述数据集作为待展现的数据集。从而,本发明可以根据与用户的交互(包括但不限于放大或缩小),以确定待展现的数据集,直观地对数据集与可视化视图进行挖掘、呈现与处理,提高了数据处理效率与用户的信息获取效率,改善了用户的使用体验。
在步骤s2中,所述视图设备确定与所述数据集相对应的元素映射信息。
具体地,在步骤s2中,所述视图设备根据所述步骤s1所获取的待展现的数据集,通过根据所述数据集所对应的数据量大小、待展现的数据集的类别(如二元组数据、三元组数据、多元组数据;或者根据数据集的具体内容所划分的类别,如数据集对应男性数据或女性数据等)、待展现的数据集所对应的应用信息(如用于不同终端的应用 等)等中的一种或多种信息,确定与所述数据集相对应的元素映射信息。
在此,所述元素映射信息包括但不限于用于呈现所述数据集中的数据项的数据样式信息,所述数据样式信息包括但不限于如像素或图形等。进一步地,所述元素映射信息还包括但不限于二维或三维图像中的像素或图形等。
优选地,在步骤s2中,所述视图设备可以根据所述数据集所对应的数据量信息,确定与所述数据集相对应的元素映射信息。
具体地,在步骤s2中,所述视图设备可以根据所述数据集所对应的数据量信息,例如,根据系统缺省设置的数据量判定阈值,或者根据用户所设定的数据量判定阈值,或者根据用户的操作信息进行自学习所确定的数据量判定阈值,对所述数据集所对应的数据量大小进行判定,根据所述数据量信息,确定与所述数据集相对应的元素映射信息,如像素或图形等。
例如,系统缺省设置的数据量判定阈值为2000,则当所述数据集中的数据量大于2000时,则将所述数据集中的数据项映射为像素;若所述数据集中的数据量小于等于2000时,则将所述数据集中的数据项映射为图形(如圆形、方形、三角形等各种图形)。
进一步地,例如,还可以结合所述数据集或数据集中的数据的类型信息,确定元素映射信息,例如,当“某公司男女身高体重分布数据集”的数据量小于2000时,首先将所述数据集中的数据项映射为图形;同时根据所述数据集中的数据类型信息,将男性所对应的数据映射为方块图,将女性所对应的数据映射为圆形图等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,其他根据所述数据集所对应的数据量信息,确定与所述数据集相对应的元素映射信息的方式,均应包含在本发明的范围内。
更优选地,在步骤s2中,所述视图设备可以根据所述数据集所对应的数据量信息,结合与所述数据集所相对应的显示设置信息,确定与 所述数据集相对应的元素映射信息。
具体地,在步骤s2中,所述视图设备还可以结合与所述数据集所相对应的显示设置信息,例如,屏幕分辨率信息或用于生成可视化视图的绘图区域的大小信息等,根据所述数据集所对应的数据量信息,确定与所述数据集相对应的元素映射信息。
例如,当所述显示屏幕的分辨率为1280*800及其以上时,系统缺省设置当数据集中的数据量大于2000以上则采用像素作为元素映射信息,小于2000则采用图形作为元素映射信息;当所述显示屏幕的分辨率为960*640或1024*768时,系统缺省设置当数据集中的数据量大于1000以上则采用像素作为元素映射信息,小于1000则采用图形作为元素映射信息;当所述显示屏幕的分辨率为800*480及其以下时,系统缺省设置当数据集中的数据量大于500以上则采用像素作为元素映射信息,小于500则采用图形作为元素映射信息。
同时,在步骤s2中,所述视图设备还能够支持根据用户个性化设置的、结合所述显示设置信息的其他用于确定元素映射信息的数据量信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,其他任何结合所述显示设置信息的用于确定元素映射信息的数据量信息,均应包含在本发明的范围内。
在步骤s3中,所述视图设备根据所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息。
具体地,在步骤s3中,所述视图设备根据所述步骤s2中所确定的元素映射信息,根据所述数据集中的每一个数据项,如所述数据项所对应的数据值信息、数据类型信息等,确定与所述数据集中的每一个数据项所对应的绘制参数信息,进而确定与所述数据集中的数据信息相对应的绘制参数信息。
其中,所述数据集中包含一个或多个数据项,所述数据集中的数据项的数量不受限制。所述数据集中的数据信息则包括但不限于所有 数据项的数据值信息、数据类型信息等。
其中,所述绘制参数信息包括但不限于每一个数据项所对应的绘制元素(如像素或图形)、颜色、形状、大小等。由于所生成的可视化视图可以是二维视图或三维视图,因此所述绘制参数信息中也可以包含对应二维视图或三维视图的其他参数。
优选地,在步骤s3中,所述视图设备可以根据与所述数据集中的数据项相对应的数据值,确定与所述数据项所相对应的颜色信息;根据所述元素映射信息,结合与所述数据项所相对应的颜色信息,确定与所述数据集中的数据信息相对应的绘制参数信息。
具体地,在步骤s3中,所述视图设备可以根据与所述数据集中的数据项相对应的数据值,通过基于预设的计算方式,将所述数据值与颜色信息进行映射,确定与所述数据项所相对应的颜色信息;并根据所述颜色信息,以及所述元素映射信息(如像素或图形等),确定与所述数据集中的数据信息相对应的绘制参数信息(如像素的颜色或图形的颜色等)。例如,在一个直角坐标系中,使用像素或图形来代表数据,使用不同的颜色系列来代表不同数据组,使用同一颜色系列的不同深浅的颜色来代表数据的数据值。
例如,如图10所示,图10示出了根据本发明的一个优选实施例的一种以“某公司男女身高体重分布数据集”为例的可视化视图。其中,横坐标表示身高,纵坐标表示体重,每个坐标点颜色值的公式为(数据个数*权重/256)*颜色值;该图所对应的数据集的数据量大小小于2000,因此与该数据集所对应的元素映射信息为形状,在此,采用方块表示男性,圆形表示女性;同时,采用红色rgb(256,0,0)代表女性,蓝色rgb(0,0,256)代表男性。
假设,每一个员工权重为1,身高160mm且体重50kg的女性有100个,那么坐标(160,50)点的颜色为(100*1/256)*rgb(256,0,0)=rgb(100,0,0);反之,若坐标(180,70)点的颜色为rgb(0,0,200),那么身高180mm体重70kg的男生的人数为rgb(0,0,200)/rgb(0,0,256)*256/1=200个。
在此,本领域技术人员应能理解,当所述元素映射信息为像素时,可以根据所述数据值计算所对应的像素的颜色信息;当所述元素映射信息为形状时,可以根据所述数据值计算所对应的形状的颜色信息,还可以根据所述数据值计算所对应形状的大小,如数据值越大,所对应的形状越大等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,其他任何根据与所述数据集中的数据项相对应的数据值,确定与所述数据项所相对应的颜色信息,进而确定绘制参数信息的方式,均应包含在本发明的范围内。
优选地,在步骤s3中,所述视图设备可以根据与所述数据集中的数据项相对应的数据值,确定与所述数据集相对应的坐标系信息;根据所述元素映射信息,结合与所述数据集相对应的坐标系信息,确定与所述数据集中的数据信息相对应的绘制参数信息。
具体地,在步骤s3中,所述视图设备可以根据所述数据集中的数据项所对应的数据值,例如通过获取所有数据项的最大值、最小值或数据值的分布等信息,确定与所述数据集相对应的坐标系信息;并根据所述元素映射信息,结合与所述数据集相对应的坐标系信息,将所述数据集中的数据信息以元素映射信息的形式映射至所述坐标系中,从而确定与所述数据集中的数据信息相对应的绘制参数信息。
例如,所述数据集中的最大值为10000,最小值为1,则根据(1,10000)确定相对应的坐标系信息;当用户对生成的可视化视图进行选择后,所选择的范围所对应的数据值为(100,1000),则根据(100,1000)重新确定新的相对应的坐标系信息,进而基于新的所述坐标系信息来确定所述绘制参数信息。从而避免了简单的图形放大缩小后,所依据的坐标系并非最优解导致的可视化视图不清楚等问题。
例如,图6示出根据本发明的一个优选实施例的一种确定待展现的数据集的示意图;图7示出了对所述待展现的区域进行重绘制后的可视化视图,在图7中,所述视图设备对图6所选择的区域的数据的数据值进行获取,重新生成坐标系信息后,重新绘制。
例如,图8示出根据本发明的一个优选实施例的一种确定待展现的数据集的示意图;图9示出了对图8所述待展现的区域进行重绘制后的可视化视图,在图9中,所述视图设备对图8所选择的区域的数据的数据值进行获取,重新生成坐标系信息后,重新绘制。在此,图8的绘制参数信息是像素,经过重新选择后,图9中由于数据量变少,因此,所述图9中的元素映射信息为图形,同时根据所选择的区域的数据的数据值,重新生成坐标系信息后,基于新的元素映射信息及坐标系信息,重新绘制。
优选地,在步骤s3中,所述视图设备可以根据所述数据集所对应的数据量信息,对所述数据集中的数据项进行分段处理;根据所述分段处理后所获取的分段数据集,以及所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息。
具体地,在步骤s3中,所述视图设备可以根据所述数据集所对应的数据量信息,通过基于预定的或缺省的分段设置信息,对所述数据集中的数据项进行分段处理;根据所述分段处理后所获取的分段数据集,对不同分段的数据集的颜色、大小、形状等进行区分,进而结合所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息。
例如,所述数据集对应10万个数据项,按照所述数据项的数据值大小,将所述10万个数据划分为10个区段,每个区段内包含1万个数据项;将第一个区段内的1万个数据采用红色显示,按照红色的深浅表示数据值的大小,将第二个区段内的1万个数据采用蓝色显示,按照蓝色的深浅表示数据值的大小等,以此类推,从而为用户提供更为清晰的可视化视图。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,其他任何根据所述数据集所对应的数据量信息,对所述数据集中的数据项进行分段处理,并根据所述分段处理后所获取的分段数据集,以及所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息的方式,均应包含在本发明的范围内。
在步骤s4中,所述视图设备根据所述绘制参数信息,生成与所述数据集所对应的可视化视图。
具体地,在步骤s4中,所述视图设备根据所述步骤s3中所确定的绘制参数信息,将所述数据集在对应的画布上以二维或三维的方式进行绘制,从而生成与所述数据集所对应的可视化视图。
在此,所述可视化视图包括二维可视化视图或三维可视化视图;所述可视化视图包括但不限于散点图、K线图、折线图、柱状图或其他类型的图等。
图4示出根据本发明一个优选实施例的一种用于生成可视化视图的方法流程图。具体地,在步骤s1’中,所述视图设备获取待展现的数据集;在步骤s21’中,所述视图设备确定所述数据集的量级类型信息;在步骤s22’中,所述视图设备根据所述量级类型信息,确定与所述数据集相对应的元素映射信息;在步骤s3’中,所述视图设备根据所述元素映射信息,确定与所述数据集中的数据信息相对应的绘制参数信息;在步骤s4’中,所述视图设备根据所述绘制参数信息,生成与所述数据集所对应的可视化视图。其中,视图设备中的步骤s1’、步骤s3’、步骤s4’与图3所示对应步骤相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各步骤分别实时地,或者按照设定的或实时调整的工作模式要求,进行待展现的数据集的获取、量级类型信息的确定、元素映射信息的确定、绘制参数信息的确定、可视化视图的生成等,直至视图设备停止获取待展现的数据集。
在步骤s21’中,所述视图设备确定所述数据集的量级类型信息。
具体地,在步骤s21’中,所述视图设备基于预定规则,通过对所述数据集中的数据信息进行获取,基于如数据量信息等确定所述数据集的量级类型信息;其中,所述量级类型信息包括但不限于大数据、小数据或其他类型的量级类型等。
优选地,在步骤s21’中,所述视图设备可以根据所述数据集的数 据相关信息,确定所述数据集的量级类型信息。
具体地,在步骤s21’中,所述视图设备根据所述数据集的数据相关信息,根据所述数据相关信息中的一项或多项,基于预定的或机器学习的阈值等信息,确定所述数据集的量级类型信息。
其中,所述数据相关信息包括以下至少任一项:
-所述数据集的数据量信息,例如,当所述数据集的数据量大于一定的阈值时,所述数据集的量级类型信息为大数据,当所述数据集的数据量小于一定的阈值时,所述数据级的量级类型信息为小数据等;
-所述数据集的数据类型信息,例如,对于同样数据量的两个不同类型的数据集,根据所述数据集的数据类型信息,为两个数据集确定不同的量级类型信息,如同样数据量的“身高体重”类型数据和“产品销售省份分布”类型数据,将前者确定为小数据,后者确定为大数据等;
-所述数据集所对应的应用相关信息,例如,根据所述数据集所对应的应用的数据分析类型,为所述数据集确定不同类型的量级类型信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,其他任何根据所述数据集的数据相关信息,确定所述数据集的量级类型信息的方式或其他数据相关信息,均应包含在本发明的范围内。
在步骤s22’中,所述视图设备根据所述量级类型信息,确定与所述数据集相对应的元素映射信息。
具体地,在步骤s22’中,所述视图设备根据所述量级类型信息,根据预定的映射关系,确定与所述数据集相对应的元素映射信息。例如,当所述量级类型信息为大数据时,则所对应的元素映射信息为像素,若所述量级类型信息为小数据时,则对应的元素映射信息为图形。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求 而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

一种用于生成可视化视图的方法与设备.pdf_第1页
第1页 / 共24页
一种用于生成可视化视图的方法与设备.pdf_第2页
第2页 / 共24页
一种用于生成可视化视图的方法与设备.pdf_第3页
第3页 / 共24页
点击查看更多>>
资源描述

《一种用于生成可视化视图的方法与设备.pdf》由会员分享,可在线阅读,更多相关《一种用于生成可视化视图的方法与设备.pdf(24页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103412871 A (43)申请公布日 2013.11.27 CN 103412871 A *CN103412871A* (21)申请号 201310284826.0 (22)申请日 2013.07.08 G06F 17/30(2006.01) (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街 10 号 百度大厦 2 层 (72)发明人 杨骥 林志峰 (74)专利代理机构 北京汉昊知识产权代理事务 所 ( 普通合伙 ) 11370 代理人 罗朋 周建华 (54) 发明名称 一种用于生成可视化视图的方法与设备 (57) 摘要 本发明。

2、的目的是提供一种用于生成可视化视 图的方法与设备。 视图设备获取待展现的数据集, 确定与所述数据集相对应的元素映射信息, 如像 素或图形等, 并根据所述元素映射信息, 确定与所 述数据集中的数据信息相对应的绘制参数信息, 最后根据所述绘制参数信息, 生成与所述数据集 所对应的可视化视图 ; 与现有技术相比, 本发明 通过实现了对各种类型的数据集 (包括大数据量) 进行可视化呈现, 尤其是实现了在 web 端对大数 据量的绘制, 减少了服务器端的资源消耗, 并通过 对数据的直观呈现, 提高了用户的信息获取效率, 便于用户进行数据挖掘与处理, 改善了用户的使 用体验。 (51)Int.Cl. 权利。

3、要求书 2 页 说明书 14 页 附图 7 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书14页 附图7页 (10)申请公布号 CN 103412871 A CN 103412871 A *CN103412871A* 1/2 页 2 1. 一种用于生成可视化视图的方法, 其中, 该方法包括以下步骤 : a 获取待展现的数据集 ; b 确定与所述数据集相对应的元素映射信息 ; c 根据所述元素映射信息, 确定与所述数据集中的数据信息相对应的绘制参数信息 ; d 根据所述绘制参数信息, 生成与所述数据集所对应的可视化视图。 2. 根据权利要求 1 所述的方法。

4、, 其中, 所述步骤 a 包括 : - 根据所选定的显示区域, 确定与所述显示区域相对应的数据集, 以作为待展现的数据 集。 3. 根据权利要求 1 或 2 所述的方法, 其中, 所述步骤 b 包括 : - 根据所述数据集所对应的数据量信息, 确定与所述数据集相对应的元素映射信息。 4. 根据权利要求 3 所述的方法, 其中, 所述步骤 b 包括 : - 根据所述数据集所对应的数据量信息, 结合与所述数据集所相对应的显示设置信息, 确定与所述数据集相对应的元素映射信息。 5. 根据权利要求 1 或 2 所述的方法, 其中, 所述步骤 b 包括 : b1 确定所述数据集的量级类型信息 ; - 根。

5、据所述量级类型信息, 确定与所述数据集相对应的元素映射信息。 6. 根据权利要求 5 所述的方法, 其中, 所述步骤 b1 包括 : - 根据所述数据集的数据相关信息, 确定所述数据集的量级类型信息 ; 其中, 所述数据相关信息包括以下至少任一项 : - 所述数据集的数据量信息 ; - 所述数据集的数据类型信息 ; - 所述数据集所对应的应用相关信息。 7. 根据权利要求 1 至 6 中任一项所述的方法, 其中, 所述步骤 c 包括 : - 根据与所述数据集中的数据项相对应的数据值, 确定与所述数据项所相对应的颜色 信息 ; - 根据所述元素映射信息, 结合与所述数据项所相对应的颜色信息, 确。

6、定与所述数据集 中的数据信息相对应的绘制参数信息。 8. 根据权利要求 1 至 6 中任一项所述的方法, 其中, 所述步骤 c 包括 : - 根据与所述数据集中的数据项相对应的数据值, 确定与所述数据集相对应的坐标系 信息 ; - 根据所述元素映射信息, 结合与所述数据集相对应的坐标系信息, 确定与所述数据集 中的数据信息相对应的绘制参数信息。 9. 根据权利要求 1 至 6 中任一项所述的方法, 其中, 所述步骤 c 包括 : - 根据所述数据集所对应的数据量信息, 对所述数据集中的数据项进行分段处理 ; - 根据所述分段处理后所获取的分段数据集, 以及所述元素映射信息, 确定与所述数据 集。

7、中的数据信息相对应的绘制参数信息。 10. 一种用于生成可视化视图的视图设备, 其中, 该设备包括 : 获取装置, 用于获取待展现的数据集 ; 映射装置, 用于确定与所述数据集相对应的元素映射信息 ; 权 利 要 求 书 CN 103412871 A 2 2/2 页 3 参数装置, 用于根据所述元素映射信息, 确定与所述数据集中的数据信息相对应的绘 制参数信息 ; 绘制装置, 用于根据所述绘制参数信息, 生成与所述数据集所对应的可视化视图。 11. 根据权利要求 10 所述的视图设备, 其中, 所述获取装置用于 : - 根据所选定的显示区域, 确定与所述显示区域相对应的数据集, 以作为待展现的。

8、数据 集。 12. 根据权利要求 10 或 11 所述的视图设备, 其中, 所述映射装置用于 : - 根据所述数据集所对应的数据量信息, 确定与所述数据集相对应的元素映射信息。 13. 根据权利要求 12 所述的视图设备, 其中, 所述映射装置用于 : - 根据所述数据集所对应的数据量信息, 结合与所述数据集所相对应的显示设置信息, 确定与所述数据集相对应的元素映射信息。 14. 根据权利要求 10 或 11 所述的视图设备, 其中, 所述映射装置包括 : 量级确定单元, 用于确定所述数据集的量级类型信息 ; 元素映射单元, 用于根据所述量级类型信息, 确定与所述数据集相对应的元素映射信 息。。

9、 15. 根据权利要求 14 所述的视图设备, 其中, 所述量级确定单元包括 : - 根据所述数据集的数据相关信息, 确定所述数据集的量级类型信息 ; 其中, 所述数据相关信息包括以下至少任一项 : - 所述数据集的数据量信息 ; - 所述数据集的数据类型信息, ; - 所述数据集所对应的应用相关信息。 16. 根据权利要求 10 至 15 中任一项所述的视图设备, 其中, 所述参数装置用于 : - 根据与所述数据集中的数据项相对应的数据值, 确定与所述数据项所相对应的颜色 信息 ; - 根据所述元素映射信息, 结合与所述数据项所相对应的颜色信息, 确定与所述数据集 中的数据信息相对应的绘制参。

10、数信息。 17. 根据权利要求 10 至 15 中任一项所述的视图设备, 其中, 所述参数装置用于 : - 根据与所述数据集中的数据项相对应的数据值, 确定与所述数据集相对应的坐标系 信息 ; - 根据所述元素映射信息, 结合与所述数据集相对应的坐标系信息, 确定与所述数据集 中的数据信息相对应的绘制参数信息。 18. 根据权利要求 10 至 15 中任一项所述的视图设备, 其中, 所述参数装置用于 : - 根据所述数据集所对应的数据量信息, 对所述数据集中的数据项进行分段处理 ; - 根据所述分段处理后所获取的分段数据集, 以及所述元素映射信息, 确定与所述数据 集中的数据信息相对应的绘制参。

11、数信息。 19.一种浏览器, 包括如权利要求10至18中任一项所述的用于生成可视化视图的视图 设备。 20.一种浏览器插件, 包括如权利要求10至18中任一项所述的用于生成可视化视图的 视图设备。 权 利 要 求 书 CN 103412871 A 3 1/14 页 4 一种用于生成可视化视图的方法与设备 技术领域 0001 本发明涉及互联网领域, 尤其涉及一种用于生成可视化视图的技术。 背景技术 0002 利用可视化视图进行信息的呈现与分析, 能够直观地呈现数据统计结果, 可视化 的解读各项数据组成, 因此, 是当前数据工作者们常用的数据分析方法。例如, 常用的数据 统计图表工具如微软公司开发。

12、的 Microsoft Office 中的组件 Excel, 其可以根据特定的数 据项生成指定的数据统计图表。 0003 随着用户所需处理的数据越来越复杂, 所需处理的数据量越来越大, 用户需要能 够对大量数据进行可视化呈现。然而, 现有的可视化视图工具对大数据量可视化的支持较 差, 无法直观清楚地对大量数据进行可视化呈现。 并且, 当前的可视化视图工具仅能通过获 取表单来获取所述大量数据, 无法通过与可视化视图的交互对数据进行进一步挖掘。 发明内容 0004 本发明的目的是提供一种用于生成可视化视图的方法与设备。 0005 根据本发明的一个方面, 提供了一种用于生成可视化视图的方法, 其中,。

13、 该方法包 括以下步骤 : 0006 a 获取待展现的数据集 ; 0007 b 确定与所述数据集相对应的元素映射信息 ; 0008 c 根据所述元素映射信息, 确定与所述数据集中的数据信息相对应的绘制参数信 息 ; 0009 d 根据所述绘制参数信息, 生成与所述数据集所对应的可视化视图。 0010 根据本发明的另一方面, 还提供了一种用于生成可视化视图的视图设备, 其中, 该 设备包括 : 0011 获取装置, 用于获取待展现的数据集 ; 0012 映射装置, 用于确定与所述数据集相对应的元素映射信息 ; 0013 参数装置, 用于根据所述元素映射信息, 确定与所述数据集中的数据信息相对应 。

14、的绘制参数信息 ; 0014 绘制装置, 用于根据所述绘制参数信息, 生成与所述数据集所对应的可视化视图。 0015 根据本发明的再一方面, 还提供了一种浏览器, 包括如上述所述的用于生成可视 化视图的视图设备。 0016 根据本发明的又一方面, 还提供了一种浏览器插件, 包括如上述所述的用于生成 可视化视图的视图设备。 0017 与现有技术相比, 本发明通过获取待展现的数据集, 确定与所述数据集相对应的 元素映射信息, 如像素或图形等, 并根据所述元素映射信息, 确定与所述数据集中的数据信 息相对应的绘制参数信息, 最后根据所述绘制参数信息, 生成与所述数据集所对应的可视 说 明 书 CN 。

15、103412871 A 4 2/14 页 5 化视图 ; 从而实现了对各种类型的数据集 (包括大数据量) 进行可视化呈现, 尤其是实现了 在 web 端对大数据量的绘制, 减少了服务器端的资源消耗, 并通过对数据的直观呈现, 提高 了用户的信息获取效率, 便于用户进行数据挖掘与处理, 改善了用户的使用体验。 0018 而且, 本发明还可以根据所选定的显示区域, 确定与所述显示区域相对应的数据 集, 以作为待展现的数据集 ; 从而使得用户可以根据与可视化视图的交互, 直观地对数据集 与可视化视图进行挖掘、 呈现与处理, 提高了数据处理效率与用户的信息获取效率, 改善了 用户的使用体验。 0019。

16、 而且, 本发明还可以根据所述数据集所对应的数据量信息, 确定与所述数据集相 对应的元素映射信息, 从而实现了对所述数据集中的数据量大小的判定, 进而准确的选择 相适应的元素映射信息, 能够直观、 清楚地对所述数据集进行呈现, 提高了用户的信息获取 效率, 便于用户进行数据挖掘与处理, 改善了用户的使用体验 ; 进一步地, 还可以根据所述 数据集所对应的数据量信息, 结合与所述数据集所相对应的显示设置信息, 确定与所述数 据集相对应的元素映射信息, 从而根据不同的显示设置信息, 对不同的显示屏幕或不同的 用户设置下的显示屏幕提供不同的数据量大小的判定, 进而准确的选择相适应的元素映射 信息, 。

17、能够直观、 清楚地对所述数据集进行呈现, 提高了用户的信息获取效率, 便于用户进 行数据挖掘与处理, 改善了用户的使用体验。 0020 而且, 本发明还可以确定所述数据集的量级类型信息, 根据所述量级类型信息, 确 定与所述数据集相对应的元素映射信息 ; 进一步地, 还可以根据所述数据集的数据相关信 息, 确定所述数据集的量级类型信息 ; 从而根据不同的量级类型信息, 准确的选择相适应的 元素映射信息, 能够直观、 清楚地对所述数据集进行呈现, 提高了用户的信息获取效率, 便 于用户进行数据挖掘与处理, 改善了用户的使用体验。 0021 而且, 本发明可以根据与所述数据集中的数据项相对应的数据。

18、值, 确定与所述数 据项所相对应的颜色信息, 根据所述元素映射信息, 结合与所述数据项所相对应的颜色信 息, 确定与所述数据集中的数据信息相对应的绘制参数信息 ; 或者, 可以根据与所述数据集 中的数据项相对应的数据值, 确定与所述数据集相对应的坐标系信息, 根据所述元素映射 信息, 结合与所述数据集相对应的坐标系信息, 确定与所述数据集中的数据信息相对应的 绘制参数信息 ; 或者, 可以根据所述数据集所对应的数据量信息, 对所述数据集中的数据项 进行分段处理, 根据所述分段处理后所获取的分段数据集, 以及所述元素映射信息, 确定与 所述数据集中的数据信息相对应的绘制参数信息 ; 从而实现了对。

19、各种类型的数据集 (包括 大数据量) 进行可视化呈现, 尤其是实现了在 web 端对大数据量的绘制, 减少了服务器端的 资源消耗, 能够直观的呈现出所述数据集、 尤其是大数据集的数据信息, 提高了用户的信息 获取效率, 便于用户进行数据挖掘与处理, 改善了用户的使用体验。 附图说明 0022 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述, 本发明的其它 特征、 目的和优点将会变得更明显 : 0023 图 1 示出根据本发明一个方面的一种用于生成可视化视图的视图设备示意图 ; 0024 图 2 示出根据本发明一个优选实施例的一种用于生成可视化视图的视图设备示 意图 ; 说 明 书 C。

20、N 103412871 A 5 3/14 页 6 0025 图 3 示出根据本发明另一个方面的一种用于生成可视化视图的方法流程图 ; 0026 图 4 示出根据本发明一个优选实施例的一种用于生成可视化视图的方法流程图 ; 0027 图 5 示出根据本发明的一个优选实施例的一种数据量很大时的可视化视图 ; 0028 图 6 示出根据本发明的一个优选实施例的一种确定待展现的数据集的示意图 ; 0029 图 7 示出了对图 6 所述待展现的区域进行重绘制后的可视化视图 ; 0030 图 8 示出根据本发明的一个优选实施例的一种确定待展现的数据集的示意图 ; 0031 图 9 示出了对图 8 所述待展。

21、现的区域进行重绘制后的可视化视图 ; 0032 图 10 示出了根据本发明的一个优选实施例的一种以 “某公司男女身高体重分布 数据集” 为例的可视化视图。 0033 附图中相同或相似的附图标记代表相同或相似的部件。 具体实施方式 0034 下面结合附图对本发明作进一步详细描述。 0035 图 1 示出根据本发明一个方面的一种用于生成可视化视图的视图设备示意图 ; 其 中, 所述视图设备包括获取装置 1、 映射装置 2、 参数装置 3、 绘制装置 4。具体地, 获取装置 1 获取待展现的数据集 ; 映射装置 2 确定与所述数据集相对应的元素映射信息 ; 参数装置 3 根据所述元素映射信息, 确定。

22、与所述数据集中的数据信息相对应的绘制参数信息 ; 绘制装 置 4 根据所述绘制参数信息, 生成与所述数据集所对应的可视化视图。 0036 在此, 所述视图设备包括但不限于网络设备、 用户设备、 或网络设备与用户设备通 过网络相集成所构成的设备。其中, 所述网络设备包括一种能够按照事先设定或存储的指 令, 自动进行数值计算和信息处理的电子设备, 其硬件包括但不限于微处理器、 专用集成电 路 (ASIC)、 可编程门阵列 (FPGA) 、 数字处理器 (DSP) 、 嵌入式设备等。所述网络设备其包括 但不限于计算机、 网络主机、 单个网络服务器、 多个网络服务器集或多个服务器构成的云 ; 在此, 。

23、云由基于云计算 (Cloud Computing) 的大量计算机或网络服务器构成, 其中, 云计算 是分布式计算的一种, 由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述用户 设备其包括但不限于任何一种可与用户通过键盘、 遥控器、 触摸板、 或声控设备进行人机交 互的电子产品, 例如计算机、 智能手机、 PDA、 游戏机、 或 IPTV 等。所述网络包括但不限于互 联网、 广域网、 城域网、 局域网、 VPN 网络、 无线自组织网络 (Ad Hoc 网络) 等。 0037 视图设备还包括能够用于生成可视化视图的浏览器、 浏览器插件或其他可视化视 图生成应用, 例如基于 flash、 sv。

24、g(可缩放矢量图形, Scalable Vector Graphics) 或 HTML5 中画图 (canvas) 的相关应用。本领域技术人员应能理解, 其他的视图设备同样适用于本发 明, 也应包含在本发明保护范围以内, 并在此以引用方式包含于此。 0038 上述各装置之间是持续不断工作的, 在此, 本领域技术人员应理解 “持续” 是指上 述各装置分别实时地, 或者按照设定的或实时调整的工作模式要求, 进行待展现的数据集 的获取、 元素映射信息的确定、 绘制参数信息的确定、 可视化视图的生成等, 直至视图设备 停止获取待展现的数据集。 0039 获取装置 1 获取待展现的数据集。 0040 具。

25、体地, 所述获取装置 1 通过基于各种通信协议 (Communications Protocol), 与其他能够获取待展现的数据集的设备, 如存储数据集的数据库或其他第三方设备 说 明 书 CN 103412871 A 6 4/14 页 7 进行交互, 直接获取待展现的数据集 ; 或者所述获取装置 1 通过基于各种通信协议 (Communications Protocol), 与输入设备 (如鼠标、 键盘、 触摸屏等) 进行交互, 获取用户通 过点击、 输入、 触摸等方式所选择或输入的待展现的数据集的名称, 然后与存储数据集的数 据库或其他第三方设备进行交互, 获取用户指定的待展现的数据集 ;。

26、 或者, 所述获取装置 1 通过基于各种通信协议 (Communications Protocol), 与输入设备 (如鼠标、 键盘、 触摸屏 等) 进行交互, 获取用户通过选定方式所选择的待展现的数据集的范围, 并根据所述范围, 确定待展现的数据集, 例如, 用户可以对全屏和部分屏幕进行选择, 通过选定一个或多个待 展现的数据集的名称、 一个或多个待展现的数据项等方式, 获取待展现的数据集。 0041 其中, 所述数据集中包含一个或多个数据项, 所述数据集中的数据项的数量不受 限制。 0042 例如, 用户可以在客户端 (包括但不限于如浏览器端或其他客户端) 选定数据集名 称 “某公司男女身。

27、高体重分布数据集” , 客户端通过基于各种网络协议, 与服务器端相交互, 获取服务器端所发送的与该数据集相对应的一组或多组数据, 从而获取待展现的数据集。 在此, 若当客户端已经获取所述 “某公司男女身高体重分布数据集” 时, 若用户再次选定该 数据集中的一组或多组数据, 则既可以与服务器端相交互以获取所述一组或多组数据, 也 可以在客户端缓存中直接获取与用户选定相对应的一组或多组数据。 0043 在此,“通信协议” 包括计算机通信的传送协议, 如 TCP/IP、 UDP、 FTP、 ICMP、 NetBEUI 等, 或者存在于计算机中的其他形式通信, 例如面向对象编程里面对象之间的通信或操作。

28、 系统内不同程序或计算机不同模块之间的消息传送协议。 0044 优选地, 所述获取装置 1 可以根据所选定的显示区域, 确定与所述显示区域相对 应的数据集, 以作为待展现的数据集。 0045 具体地, 所述获取装置 1 通过基于各种通信协议 (Communications Protocol), 与 输入设备 (如鼠标、 键盘、 触摸屏等) 进行交互, 获取用户通过点选、 拖拽选择等一种或多种 选定方式所选择的显示区域, 将所述显示区域所对应的显示内容转换成与所述显示区域相 对应的数据集, 并将所述数据集作为待展现的数据集。 0046 其中, 所述显示区域包括但不限于全屏或部分屏幕, 所述显示区。

29、域可以是文字区 域、 表格区域, 也可以是可视化视图。 0047 例如, 如图 5 所示, 图 5 为根据本发明的一个优选实施例的一种数据量很大时 (数 据量为 30 万组数据) 的可视化视图, 图 6 为根据本发明的一个优选实施例的一种确定待展 现的数据集的示意图。用户通过拖拽选择的方式, 选定了图 6 中方块所示的区域, 所述获取 装置 1 首先确定所选定的显示区域的范围 ; 根据所选定的显示区域, 确定与所述显示区域 中的显示元素 ; 并通过与缓存进行交互或者与服务器进行交互等方式, 确定所述显示元素 相对应的数据集, 将所述数据集作为待展现的数据集。 从而, 本发明可以根据与用户的交互。

30、 (包括但不限于放大或缩小) , 以确定待展现的数据集, 直观地对数据集与可视化视图进行 挖掘、 呈现与处理, 提高了数据处理效率与用户的信息获取效率, 改善了用户的使用体验。 0048 映射装置 2 确定与所述数据集相对应的元素映射信息。 0049 具体地, 所述映射装置2根据所述获取装置1所获取的待展现的数据集, 通过根据 所述数据集所对应的数据量大小、 待展现的数据集的类别 (如二元组数据、 三元组数据、 多 元组数据 ; 或者根据数据集的具体内容所划分的类别, 如数据集对应男性数据或女性数据 说 明 书 CN 103412871 A 7 5/14 页 8 等) 、 待展现的数据集所对应。

31、的应用信息 (如用于不同终端的应用等) 等中的一种或多种信 息, 确定与所述数据集相对应的元素映射信息。 0050 在此, 所述元素映射信息包括但不限于用于呈现所述数据集中的数据项的数据样 式信息, 所述数据样式信息包括但不限于如像素或图形等。 进一步地, 所述元素映射信息还 包括但不限于二维或三维图像中的像素或图形等。 0051 优选地, 所述映射装置 2 可以根据所述数据集所对应的数据量信息, 确定与所述 数据集相对应的元素映射信息。 0052 具体地, 所述映射装置 2 可以根据所述数据集所对应的数据量信息, 例如, 根据系 统缺省设置的数据量判定阈值, 或者根据用户所设定的数据量判定阈。

32、值, 或者根据用户的 操作信息进行自学习所确定的数据量判定阈值, 对所述数据集所对应的数据量大小进行判 定, 根据所述数据量信息, 确定与所述数据集相对应的元素映射信息, 如像素或图形等。 0053 例如, 系统缺省设置的数据量判定阈值为 2000, 则当所述数据集中的数据量大于 2000 时, 则将所述数据集中的数据项映射为像素 ; 若所述数据集中的数据量小于等于 2000 时, 则将所述数据集中的数据项映射为图形 (如圆形、 方形、 三角形等各种图形) 。 0054 进一步地, 例如, 还可以结合所述数据集或数据集中的数据的类型信息, 确定元素 映射信息, 例如, 当 “某公司男女身高体重。

33、分布数据集” 的数据量小于 2000 时, 首先将所述 数据集中的数据项映射为图形 ; 同时根据所述数据集中的数据类型信息, 将男性所对应的 数据映射为方块图, 将女性所对应的数据映射为圆形图等。 0055 需要说明的是, 上述举例仅为更好地说明本发明的技术方案, 而非对本发明的限 制, 本领域技术人员应该理解, 其他根据所述数据集所对应的数据量信息, 确定与所述数据 集相对应的元素映射信息的方式, 均应包含在本发明的范围内。 0056 更优选地, 所述映射装置 2 可以根据所述数据集所对应的数据量信息, 结合与所 述数据集所相对应的显示设置信息, 确定与所述数据集相对应的元素映射信息。 00。

34、57 具体地, 所述映射装置 2 还可以结合与所述数据集所相对应的显示设置信息, 例 如, 屏幕分辨率信息或用于生成可视化视图的绘图区域的大小信息等, 根据所述数据集所 对应的数据量信息, 确定与所述数据集相对应的元素映射信息。 0058 例如, 当所述显示屏幕的分辨率为 1280*800 及其以上时, 系统缺省设置当数据集 中的数据量大于 2000 以上则采用像素作为元素映射信息, 小于 2000 则采用图形作为元素 映射信息 ; 当所述显示屏幕的分辨率为 960*640 或 1024*768 时, 系统缺省设置当数据集中 的数据量大于 1000 以上则采用像素作为元素映射信息, 小于 10。

35、00 则采用图形作为元素映 射信息 ; 当所述显示屏幕的分辨率为 800*480 及其以下时, 系统缺省设置当数据集中的数 据量大于500以上则采用像素作为元素映射信息, 小于500则采用图形作为元素映射信息。 0059 同时, 所述映射装置 2 还能够支持根据用户个性化设置的、 结合所述显示设置信 息的其他用于确定元素映射信息的数据量信息。 0060 需要说明的是, 上述举例仅为更好地说明本发明的技术方案, 而非对本发明的限 制, 本领域技术人员应该理解, 其他任何结合所述显示设置信息的用于确定元素映射信息 的数据量信息, 均应包含在本发明的范围内。 0061 参数装置 3 根据所述元素映射。

36、信息, 确定与所述数据集中的数据信息相对应的绘 制参数信息。 说 明 书 CN 103412871 A 8 6/14 页 9 0062 具体地, 所述参数装置3根据所述映射装置2所确定的元素映射信息, 根据所述数 据集中的每一个数据项, 如所述数据项所对应的数据值信息、 数据类型信息等, 确定与所述 数据集中的每一个数据项所对应的绘制参数信息, 进而确定与所述数据集中的数据信息相 对应的绘制参数信息。 0063 其中, 所述数据集中包含一个或多个数据项, 所述数据集中的数据项的数量不受 限制。所述数据集中的数据信息则包括但不限于所有数据项的数据值信息、 数据类型信息 等。 0064 其中, 所。

37、述绘制参数信息包括但不限于每一个数据项所对应的绘制元素 (如像素 或图形) 、 颜色、 形状、 大小等。由于所生成的可视化视图可以是二维视图或三维视图, 因此 所述绘制参数信息中也可以包含对应二维视图或三维视图的其他参数。 0065 优选地, 所述参数装置 3 可以根据与所述数据集中的数据项相对应的数据值, 确 定与所述数据项所相对应的颜色信息 ; 根据所述元素映射信息, 结合与所述数据项所相对 应的颜色信息, 确定与所述数据集中的数据信息相对应的绘制参数信息。 0066 具体地, 所述参数装置 3 可以根据与所述数据集中的数据项相对应的数据值, 通 过基于预设的计算方式, 将所述数据值与颜色。

38、信息进行映射, 确定与所述数据项所相对应 的颜色信息 ; 并根据所述颜色信息, 以及所述元素映射信息 (如像素或图形等) , 确定与所述 数据集中的数据信息相对应的绘制参数信息 (如像素的颜色或图形的颜色等) 。例如, 在一 个直角坐标系中, 使用像素或图形来代表数据, 使用不同的颜色系列来代表不同数据组, 使 用同一颜色系列的不同深浅的颜色来代表数据的数据值。 0067 例如, 如图 10 所示, 图 10 示出了根据本发明的一个优选实施例的一种以 “某公司 男女身高体重分布数据集” 为例的可视化视图。 其中, 横坐标表示身高, 纵坐标表示体重, 每 个坐标点颜色值的公式为 (数据个数 * 。

39、权重 /256)* 颜色值 ; 该图所对应的数据集的数据量 大小小于 2000, 因此与该数据集所对应的元素映射信息为形状, 在此, 采用方块表示男性, 圆形表示女性 ; 同时, 采用红色 rgb(256,0,0) 代表女性, 蓝色 rgb(0,0,256) 代表男性。 0068 假设, 每一个员工权重为 1, 身高 160mm 且体重 50kg 的女性有 100 个, 那么坐标 (160,50) 点的颜色为 (100*1/256)*rgb(256,0,0)=rgb(100,0,0) ; 反之, 若坐标 (180,70) 点的颜色为 rgb(0,0,200) , 那么身高 180mm 体重 7。

40、0kg 的男生的人数为 rgb(0,0,200) / rgb(0,0,256) *256/1=200 个。 0069 在此, 本领域技术人员应能理解, 当所述元素映射信息为像素时, 可以根据所述数 据值计算所对应的像素的颜色信息 ; 当所述元素映射信息为形状时, 可以根据所述数据值 计算所对应的形状的颜色信息, 还可以根据所述数据值计算所对应形状的大小, 如数据值 越大, 所对应的形状越大等。 0070 需要说明的是, 上述举例仅为更好地说明本发明的技术方案, 而非对本发明的限 制, 本领域技术人员应该理解, 其他任何根据与所述数据集中的数据项相对应的数据值, 确 定与所述数据项所相对应的颜色。

41、信息, 进而确定绘制参数信息的方式, 均应包含在本发明 的范围内。 0071 优选地, 所述参数装置 3 可以根据与所述数据集中的数据项相对应的数据值, 确 定与所述数据集相对应的坐标系信息 ; 根据所述元素映射信息, 结合与所述数据集相对应 的坐标系信息, 确定与所述数据集中的数据信息相对应的绘制参数信息。 说 明 书 CN 103412871 A 9 7/14 页 10 0072 具体地, 所述参数装置 3 可以根据所述数据集中的数据项所对应的数据值, 例如 通过获取所有数据项的最大值、 最小值或数据值的分布等信息, 确定与所述数据集相对应 的坐标系信息 ; 并根据所述元素映射信息, 结合。

42、与所述数据集相对应的坐标系信息, 将所述 数据集中的数据信息以元素映射信息的形式映射至所述坐标系中, 从而确定与所述数据集 中的数据信息相对应的绘制参数信息。 0073 例如, 所述数据集中的最大值为 10000, 最小值为 1, 则根据 (1,10000) 确定相对应 的坐标系信息 ; 当用户对生成的可视化视图进行选择后, 所选择的范围所对应的数据值为 (100,1000) , 则根据 (100,1000) 重新确定新的相对应的坐标系信息, 进而基于新的所述坐 标系信息来确定所述绘制参数信息。从而避免了简单的图形放大缩小后, 所依据的坐标系 并非最优解导致的可视化视图不清楚等问题。 0074。

43、 例如, 图 6 示出根据本发明的一个优选实施例的一种确定待展现的数据集的示意 图 ; 图 7 示出了对所述待展现的区域进行重绘制后的可视化视图, 在图 7 中, 所述参数装置 3 对图 6 所选择的区域的数据的数据值进行获取, 重新生成坐标系信息后, 重新绘制。 0075 例如, 图 8 示出根据本发明的一个优选实施例的一种确定待展现的数据集的示意 图 ; 图 9 示出了对图 8 所述待展现的区域进行重绘制后的可视化视图, 在图 9 中, 所述参数 装置 3 对图 8 所选择的区域的数据的数据值进行获取, 重新生成坐标系信息后, 重新绘制。 在此, 图 8 的绘制参数信息是像素, 经过重新选。

44、择后, 图 9 中由于数据量变少, 因此, 所述图 9 中的元素映射信息为图形, 同时根据所选择的区域的数据的数据值, 重新生成坐标系信息 后, 基于新的元素映射信息及坐标系信息, 重新绘制。 0076 优选地, 所述参数装置 3 可以根据所述数据集所对应的数据量信息, 对所述数据 集中的数据项进行分段处理 ; 根据所述分段处理后所获取的分段数据集, 以及所述元素映 射信息, 确定与所述数据集中的数据信息相对应的绘制参数信息。 0077 具体地, 所述参数装置 3 可以根据所述数据集所对应的数据量信息, 通过基于预 定的或缺省的分段设置信息, 对所述数据集中的数据项进行分段处理 ; 根据所述分。

45、段处理 后所获取的分段数据集, 对不同分段的数据集的颜色、 大小、 形状等进行区分, 进而结合所 述元素映射信息, 确定与所述数据集中的数据信息相对应的绘制参数信息。 0078 例如, 所述数据集对应 10 万个数据项, 按照所述数据项的数据值大小, 将所述 10 万个数据划分为 10 个区段, 每个区段内包含 1 万个数据项 ; 将第一个区段内的 1 万个数据 采用红色显示, 按照红色的深浅表示数据值的大小, 将第二个区段内的 1 万个数据采用蓝 色显示, 按照蓝色的深浅表示数据值的大小等, 以此类推, 从而为用户提供更为清晰的可视 化视图。 0079 需要说明的是, 上述举例仅为更好地说明。

46、本发明的技术方案, 而非对本发明的限 制, 本领域技术人员应该理解, 其他任何根据所述数据集所对应的数据量信息, 对所述数据 集中的数据项进行分段处理, 并根据所述分段处理后所获取的分段数据集, 以及所述元素 映射信息, 确定与所述数据集中的数据信息相对应的绘制参数信息的方式, 均应包含在本 发明的范围内。 0080 绘制装置 4 根据所述绘制参数信息, 生成与所述数据集所对应的可视化视图。 0081 具体地, 所述绘制装置4根据所述参数装置3所确定的绘制参数信息, 将所述数据 集在对应的画布上以二维或三维的方式进行绘制, 从而生成与所述数据集所对应的可视化 说 明 书 CN 10341287。

47、1 A 10 8/14 页 11 视图。 0082 在此, 所述可视化视图包括二维可视化视图或三维可视化视图 ; 所述可视化视图 包括但不限于散点图、 K 线图、 折线图、 柱状图或其他类型的图等。 0083 图 2 示出根据本发明一个优选实施例的一种用于生成可视化视图的视图设备示 意图 ; 其中, 所述视图设备包括获取装置1 、 映射装置2 、 参数装置3 、 绘制装置4 , 所述映 射装置 2 包括量级确定单元 21 、 元素映射单元 22 。具体地, 获取装置 1 获取待展现的 数据集 ; 量级确定单元 21 确定所述数据集的量级类型信息 ; 元素映射单元 22 根据所述量 级类型信息,。

48、 确定与所述数据集相对应的元素映射信息 ; 参数装置 3 根据所述元素映射信 息, 确定与所述数据集中的数据信息相对应的绘制参数信息 ; 绘制装置 4 根据所述绘制参 数信息, 生成与所述数据集所对应的可视化视图。其中, 视图设备中的获取装置 1 、 参数装 置3 、 绘制装置4 与图1所示对应装置相同或基本相同, 故此处不再赘述, 并通过引用的方 式包含于此。 0084 上述各装置之间是持续不断工作的, 在此, 本领域技术人员应理解 “持续” 是指上 述各装置分别实时地, 或者按照设定的或实时调整的工作模式要求, 进行待展现的数据集 的获取、 量级类型信息的确定、 元素映射信息的确定、 绘制。

49、参数信息的确定、 可视化视图的 生成等, 直至视图设备停止获取待展现的数据集。 0085 量级确定单元 21 确定所述数据集的量级类型信息。 0086 具体地, 所述量级确定单元 21 基于预定规则, 通过对所述数据集中的数据信息进 行获取, 基于如数据量信息等确定所述数据集的量级类型信息 ; 其中, 所述量级类型信息包 括但不限于大数据、 小数据或其他类型的量级类型等。 0087 优选地, 所述量级确定单元 21 可以根据所述数据集的数据相关信息, 确定所述数 据集的量级类型信息。 0088 具体地, 所述量级确定单元 21 根据所述数据集的数据相关信息, 根据所述数据相 关信息中的一项或多项, 基于预定的或机器学习的阈值等信息, 确定所述数据集的量级类 型信息。 0089 其中, 所述数据相关信息包括以下至少任一项 : 0090 - 所述数据集的数据量信息, 例如, 当所述数据集的数据量。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1