用于对电子表格数据进行报告的自动关系检测.pdf

上传人:奻奴 文档编号:4209522 上传时间:2018-09-06 格式:PDF 页数:16 大小:4.70MB
返回 下载 相关 举报
摘要
申请专利号:

CN201210377077.1

申请日:

2012.09.28

公开号:

CN102945248A

公开日:

2013.02.27

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||专利申请权的转移IPC(主分类):G06F 17/30变更事项:申请人变更前权利人:微软公司变更后权利人:微软技术许可有限责任公司变更事项:地址变更前权利人:美国华盛顿州变更后权利人:美国华盛顿州登记生效日:20150727|||实质审查的生效IPC(主分类):G06F 17/30申请日:20120928|||公开

IPC分类号:

G06F17/30; G06F9/44

主分类号:

G06F17/30

申请人:

微软公司

发明人:

A·福尔廷; S·范德 沃克 汉迪; D·M·奥本海默; A·V·格拉巴

地址:

美国华盛顿州

优先权:

2011.10.04 US 13/252,450

专利代理机构:

上海专利商标事务所有限公司 31100

代理人:

杨洁

PDF下载: PDF下载
内容摘要

描述了用于对电子表格数据进行报告的自动关系检测。用于在电子表格内创建报告的系统,包括:中央处理单元;以及编码指令的存储器,指令在由该中央处理单元执行时,使该中央处理单元创建:被编程为标识与电子表格相关联的表格的数据源模块;被编程为分析表格并标识项之间的关系的关系模块;以及被编程为显示表格之间的关系的显示模块。

权利要求书

权利要求书一种在电子表格中创建报告的系统,所述系统包括:
中央处理单元(602);以及
编码指令的存储器(604),所述指令在由所述中央处理单元(602)执行时,使所述中央处理单元(602)创建:
被编程为标识与所述电子表格相关联的表格的数据源模块(522);
被编程为分析所述表格并标识项之间的关系的关系模块(524);以及
被编程为显示表格之间的关系的显示模块。
如权利要求1所述的系统,其特征在于,当表格被添加到所述报告时,所述关系模块(524)分析并标识关系。
如权利要求1所述的系统,其特征在于,所述报告是数据汇总表(320),并且表格的每一个都包括要被添加到所述数据汇总表的一个或多个维度。
如权利要求1所述的系统,其特征在于,表格之一是在所述电子表格内被定义的数据区域。
一种用于标识电子表格中数据项之间的关系的方法,所述方法包括:
由计算设备(102)标识与所述电子表格相关联的表格;
允许用户将表格之一添加到所述电子表格中的数据汇总表(320);
分析所添加的表格以确定所添加的表格和所述数据汇总表(320)中的其它表格之间的关系;以及
当所述所添加的表格不与所述数据汇总表(320)内的其它表格相关时,自动地标识所述所添加的表格和所述数据汇总表(320)内其它表格之间的关系。
如权利要求5所述的方法,其特征在于,进一步包括显示所添加的表格和所述数据汇总表(320)中的其它表格之间的关系。
如权利要求5所述的方法,其特征在于,进一步包括当所添加的表格被添加到所述数据汇总表(320)时,通知用户需要定义关系。
如权利要求5所述的方法,其特征在于,进一步包括使用试探来自动地标识关系。
如权利要求5所述的方法,其特征在于,进一步包括贯穿对所述电子表格内的表格的使用持久保存关系。
一种用于标识电子表格的数据汇总表(320)中维度之间的关系的方法,所述方法包括:
允许用户将表格添加到所述电子表格中的所述数据汇总表(320),所述表格包括在所述电子表格中被定义的数据区域;
分析与所述表格相关联的列来确定维度和所述数据汇总表(320)中的其它表格之间的关系;
当所添加的表格不与所述数据汇总表(320)中的其它表格相关时:
在所添加的表格被添加到所述数据汇总表(320)时,通知用户需要定义关系;以及
使用试探来自动地标识所述表格和所述数据汇总表(320)中的其它表格之间的关系;以及
显示所添加的表格和所述数据汇总表(320)中的其它表格之间的关系。

说明书

说明书用于对电子表格数据进行报告的自动关系检测
技术领域
本申请涉及用于对电子表格数据进行报告的自动关系检测。
背景技术
电子表格中的数据汇总表可被用于分析大量数据。数据汇总表提供了一种高效的方式来显示并汇总由数据库程序提供的数据或在电子表格的数据列表中的数据。用户可选择数据的字段来包括在数据汇总表的过滤器区域、行、列、或数据区域内,并可选择要为所选的数据字段显示的聚集函数,诸如求和、方差、计数以及标准偏差。能从电子表格程序内查询的数据库中的数据,或包括列表的电子表格数据,可在数据汇总表中被分析。
由于电子表格包括大量的数据,用户可能难以选择要被包括在诸如数据汇总表的报告中的理想的数据。例如,跨一个或多个大量未被结构化的电子表格所提供的数据量可淹没用户,使之难以找到与特定报告场景相关的数据片断。
发明内容
在一个方面,用于在电子表格中创建报告的系统包括:中央处理单元;以及编码指令的存储器,该指令在由该中央处理单元执行时,使该中央处理单元创建:被编程为标识与电子表格相关联的表格的数据源模块;被编程为分析表格并标识项之间的关系的关系模块;以及被编程为显示表格之间的关系的显示模块。
在另一方面,用于标识电子表格内数据项之间的关系的方法,该方法包括:由计算设备标识与电子表格相关联的表格;允许用户将表格之一添加到电子表格内的数据汇总表;分析所添加的表格来确定所添加的表格和数据汇总表内其它表格之间的关系;以及当所添加的表格不与数据汇总表内的其它表格相关时,自动地标识所添加的表格和数据汇总表内其它表格之间的关系。
在另一方面,用于标识电子表格的数据汇总表内维度之间的关系的方法,该方法包括:允许用户将表格添加到电子表格内的数据汇总表,该表格包括在电子表格内定义的数据区域;分析与该表格相关联的列来确定维度和数据汇总表内的其它表格之间的关系;当所添加的表格不与数据汇总表内的其它表格相关时:当所添加的表格被添加到数据汇总表时通知用户需要定义关系;并且使用试探(heuristics)来自动地标识该表格和数据汇总表内的其它表格之间的关系;显示所添加的表格和数据汇总表内的其它表格之间的关系。
提供本发明内容是为了以简化的形式介绍将在以下具体实施方式中进一步描述的一些概念。本发明内容并不旨在标识所要求保护的主题的关键特征或必要特征,也决不旨在用于限制所要求保护的主题的范围。
附图说明
图1显示了用于在电子表格程序内生成报告的示例系统。
图2显示了电子表格内的示例数据透视表。
图3显示了用于在电子表格内生成数据透视表的示例数据区域。
图4示出了图1的客户端计算设备的示例模块。
图5显示了用于标识报告内两个或更多个表格之间的关系的示例方法。
图6显示了用于手动地标识报告内两个或更多个表格之间的关系的示例向导。
图7显示了用于标识来自外部数据存储的数据和报告中的一个或多个表格之间的关系的界面。
图8示出图1显示的计算设备的示例组件。
具体实施方式
本申请涉及用于自动地检测并建议电子表格应用中数据区域之间的关系的系统和方法。在在此描述的示例中,数据区域之间的关系被标识并呈现给用户,以允许用户更容易地将数据组合到单个可用报告中。
图1显示了示例系统100,该系统100支持基于电子表格应用内提供的数据的一个或多个报告的生成。系统100包括客户端计算机102和服务器计算机106。客户端计算机102通过网络(通常是公司内联网或因特网)连接到服务器计算机106。可使用更多或更少的客户端计算机、服务器计算机或其它计算设备。
如在以下进一步描述的,客户端计算机102可连接到服务器计算机106来获取数据,诸如电子表格文件。客户端计算机102可执行客户端计算机102上的本地电子表格应用来操纵电子表格文件。在另一示例中,客户端计算机102可利用被托管在服务器106上的一个或多个应用来访问并操纵电子表格文件。其他配置是可能的。
现在参考图2,示出了示例程序200。在该示例中,程序200是运行在计算机系统(诸如以上描述的计算机系统100)上的微软的EXCEL电子表格软件程序。程序200包括具有示例数据列表的电子表格。
用户可基于电子表格内的数据来创建一个或多个报告。在一些在此描述的示例中,报告可以是数据汇总表。然而,在其它示例中,报告可以简单的是另一“常规”表格。例如,在此描述的系统和方法可被用于基于由用户创建的表格与电子表格内的其它表格之间所标识的关联来对用户创建的该表格建议某些列。
例如,显示了程序200的示例用户界面302。用户界面302包括初始数据汇总表320(数据汇总表320在图3中是空白的)。数据汇总表320可从来自各个源的数据中创建。在图3中显示的一个示例中,数据汇总表320可从在电子表格文件内提供的数据或从一个或多个外部数据存储中创建。
程序200的用户界面302还包括示例任务窗格450,该任务窗格可被用于创建和修改数据汇总表320。例如,任务窗格450包括来自与电子表格文件相关联的数据的数据字段列表。用户可从任务窗格450中选择和取消选择字段来创建数据汇总表320。
任务窗格450一般包括字段窗格452和布局窗格454。字段窗格452包括在电子表格内可用的数据字段列表。在这些示例中,数据字段包括表格,其中每个表格具有一个或多个可被添加到报告的列。当如以下描述的列表中的数据字段被添加到布局窗格454时,与该数据字段相关联的复选框被复选。
布局窗格454包括多个区,该多个区表示使用任务窗格450来创建的数据汇总表320的各个方面。例如,布局窗格454包括行区、列区、值区以及过滤器区。行区定义用于所得到的数据汇总表320的行标记。列区定义用于数据汇总表320的列标记。值区标识在数据汇总表320上被汇总(例如,聚集、方差等)的数据。过滤器区允许对应用到其它区中的所有其它字段的过滤的选择。
来自字段窗格452的数据字段中的一个或多个被添加到布局窗格454的区中的一个或多个来创建和修改数据汇总表320。在显示的示例中,用户可将来自字段窗格452中的列表的数据字段点击、拖和放到布局窗格454的区之一来将字段添加到数据汇总表320。
现在参考图3,被用于创建报告(诸如数据汇总表320)的数据可来自于多个源。数据源对于电子表格而言可以可以是内部的也可以是外部的。
例如,图3显示的电子表格500包括两个内部数据区域502和504。数据区域被定义为具有至少两个维度(诸如行和列)的数据集。例如,数据区域502包括列EmployeeID(雇员ID(身份标识号码))、姓名和行1‑3。类似地,数据区域504包括列EmployeeID、Sales Amount(销售量)和行1‑7。
在这些示例中,多个数据区域可被包括在电子表格内的多个位置处,诸如在电子表格内的同一或不同的工作表(sheet)上。如以下注意的,数据还可从外部源合并。
在该示例中,程序200被编程为分析数据区域502和504并自动地确定区域之间的关系。例如,程序使用以下被进一步描述的各种试探来确定EmployeeID数据在两个区域中是一致的。
在这些示例中,关系是两个数据区域(有时称为“表格”)之间基于匹配的数据值来创建的链接。这些关系可包括一对一关系和/或一对多关系。例如,表格中的单个值可对应于查找或相关表格中的多个值。关系允许程序同时地查找和汇总两个表格中的数据。
在该检测后,程序200创建两个数据区域502、504之间的关系并允许用户通过在用户界面中简单地选择字段来容易地创建报告。例如,与数据区域502、504相关联的数据字段可被群集在用户界面中,使得用户能容易地标识数据区域之间的关系。关于出于该目的的示例用户界面的附加细节可在美国专利申请号为13/252,412、代理号为14917.1922US01、名称为“数据实体的自动化划分范围(Automatic Scoping Of Data Entities)”的同一天提交的申请中找到,该申请的全部内容通过引用结合于此。
能在检测到数据区域502、504之间的关系后被生成的报告的一个示例是电子表格500上的报告510。在该示例中,报告510是通过使用来自数据区域502、504的数据生成的数据汇总表,诸如数据透视表。为了创建报告510,用户以与图2中描述的方式类似的方式来从数据区域502、504和外部数据存储506中选择理想的数据字段。
除了电子表格500中提供的数据区域502、504,数据还能从外部数据存储合并到电子表格500中。例如,图3中显示了外部数据存储506。这样的外部数据存储的示例包括OLAP和非OLAP数据源。来自该外部数据存储506的数据被合并到电子表格500中。如以下进一步描述的,基于关于该外部数据存储506的信息,可标识外部数据存储506中的数据与电子表格500内的数据区域502、504之间的关系。
在一些示例中,在数据区域和外部数据存储中提供的用户可从中选择的可用数据字段的数量变得巨大。在这种情况中,用户可能难以查看可用的数据字段并选择理想的字段以供包括在报告中。
现在参看图4,示出了客户端设备102的逻辑模块。这些模块包括数据源模块522、关系模块524和界面模块526。在这些示例中,模块522、524、526和允许用户操纵电子表格文件内数据的电子表格应用相结合地执行。客户端计算机102的模块522、524、526用于标识电子表格的数据之间的关系,使得用户可更容易地标识用户可能在创建报告时想要选择的相关字段。
数据源模块522标识与特定文件(诸如电子表格文件)相关联的所有数据源。这可包括被定义在电子表格文件的一个或多个工作表上的内部数据区域。这还可包括来自外部数据存储的数据。这样的外部数据存储可包括被从电子表格内引用的数据,诸如已经被合并到电子表格文件中的外部数据。数据源模块522向关系模块524提供所有数据源以供分析。
关系模块524确定电子表格内的数据源中的哪些(如果有的话)是相关的。例如,如果用户正在创建报告(诸如数据透视表),则关系模块524确定使用各种试探来分析全部的数据区域和已经被合并到电子表格中的外部数据存储,以确定它们之间的任何关系。
例如,程序使用试探来检测数据(电子表格网格中的数据或来自用户已经导入到电子表格应用中的任何外部数据源的数据),并基于该检测来建议不同数据区域中的相关数据实体。该电子表格应用接着将信息存储在这些关系上并且其它电子表格特征现在将自动地充分利用这些关系,从而允许用户创建包括来自多个不同的数据区域的数据的报告。
可被用于标识关联的试探的一些示例包括以下中的一个或多个:
·列名称匹配(例如,具有相似标题的列);
·值匹配,诸如主键表中具有唯一值的一个列和外键表中具有重复值的一列,但其中不同的值集存在于主键列中;
·数据类型匹配(例如,日期或货币字段);
·模糊值匹配(例如,“CA”匹配“California”);以及
·使用映射表来产生一个表格中需要的标识符以创建与已经有具有这些标识符的列的另一表格的关系。
例如,参考图5,在一个场景中,当用户将来自不相关表格的数据字段添加到报告(诸如数据汇总表格)时,两个或更多个表格之间的关系被创建。
在该示例中,当在操作532处用户将字段添加到报告时,方法530开始。接着,在操作534,作出关于是否因为例如该字段与已经包括在表格中的字段不相关而需要关系的确定。如果不需要关系(即,该字段已经以某些方式相关),那么字段被添加并且方法结束。
然而,如果需要关系,控制被替代地传送到操作536,并且用户被通知关系可能缺失。用于这样的通知的一个示例方法是在用户界面内提供信息条以向用户通知关系缺失(例如,“表格之间的关系可能需要被创建。”)。
接着,在操作538,作出关于用户是否想要为新添加的字段创建关系的确定。如果否,则方法结束,并且用户可在下次用户修改报告时被再次提示需要提供关系。如果是,则控制替代地传送到操作539。在操作539,确定新添加的字段和已经被包括在报告中的字段之间的关系。在一个示例中,关系可通过使用以上描述的试探中的一个或多个来被自动地确定。在另一示例中,关系可被手动地定义。
例如,现在参考图6,示出了示例关系向导540。在该向导540中,用户可手动地定义不同的表格中字段之间的关系。在该示例中,字段Employee ID(雇员ID(身份标识号码))与表格SalesTable(销售表)和EmployeeTable(雇员表)相关。
通过关系模块524定义的关系(无论是由程序自动创建的还是由用户手动定义的)可贯穿报告的创建来被持久保存。在一些示例中,关系还可通过电子表格内的其它报告的创建来被持久保存,使得程序和/或用户不需要在每次使用电子表格内的数据字段时来重新定义关系。
再次参考图4,界面模块526向用户呈现来自数据区域和外部数据存储的可用数据字段以供包括在报告中。在该示例中,界面模块526在界面中向用户指示数据源之间的关系。这些关系在多个方式中可以是清单。在一个示例中,当用户选择表格时,界面可仅仅呈现该表格以及与该所选的表格相关的任何其它表格。在另一示例中,表格可被群集以标识关系。
如以上注意的,除了定义来自电子表格内的表格的数据字段之间的关系,程序可定义与来自外部源(诸如外部数据存储)的数据的关系。在该情况中,关系模块524被编程为分析来自外部数据存储的数据并提供该数据与被包括在电子表格内的任何其它数据之间的任何关系。
例如,参考图7,显示了示例数据连接向导550。在该示例中,数据连接向导550允许用户选择与向导中当前被选择的一个或多个表格直接相关的表格。在该示例中,外部数据存储“AdventureWorksDW2008R2”在向导550中被选择,并且用户可选择电子表格内的特定表格以与数据库相关(例如,DimEmployee被选择)。该选择可(通过用户在向导550中)被手动地完成,或它可通过程序使用以上描述的试探来自动地完成。在其它示例中,如果外部数据源具有已经在其表格之间定义的关系,这些可与来自外部数据源的数据一起被导入并且可与在电子表格应用处创建的任何其它关系一起被用在该电子表格应用中。
例如,程序可访问关于外部数据存储的方案信息,该方案信息允许程序查明表格之间的关系。(例如,以XML文件形式的)该方案可与被导入的外部数据存储内的字段以及其它外部数据存储中的其它数据相关。程序充分利用该信息来为用户将数据字段自动地相关。
参考图8,示出客户端计算机102和服务器计算机106的示例组件。在示例实施例中,客户端计算机102和服务器计算机106是计算设备。客户端计算机102和服务器计算机106可包括输入/输出设备、中央处理单元(“CPU”)、数据存储设备和网络设备。客户端计算机102还可以是移动计算设备,诸如膝上型计算机、平板、可转变的或其它手持设备,像智能手机或蜂窝式电话。服务器计算机106还可被集成为服务器网络内的一个或多个服务器计算机。在此类情景中,网络可提供云计算平台,其中为连接到云计算平台的客户端主存一个或多个应用和数据。以下关于服务器计算机106的讨论还应用于客户端计算机102的组件。
在基本配置中,服务器计算机106一般包括至少一个处理单元602和系统存储器604。取决于计算设备的确切配置和类型,系统存储器604可以是易失性的(诸如RAM)、非易失性的(诸如ROM、闪存等)或是两者的某种组合。系统存储器604一般包括适于控制服务器(诸如来自华盛顿州雷蒙德市的微软公司的微软服务器2010协作服务器)的操作的操作系统606。系统存储器604还可以包括一个或多个软件应用608并且可以包括程序数据。
服务器计算机106可具有附加特征或功能。例如,服务器计算机106还可以包括计算机可读介质。计算机可读介质可包括计算机可读存储介质和通信介质两者。
计算机可读存储介质是物理介质,诸如包括磁盘、光盘或磁带的数据存储设备(可移动和/或不可移动)。这样的附加存储在图6中由可移动存储610和不可移动存储612示出。计算机可读存储介质可以包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机可读存储介质可以包括但不限于,RAM、ROM、EEPROM、闪存或其他存储器技术、CD‑ROM、数字多功能盘(DVD)或其他光盘存储、盒式磁带、磁带、磁盘存储或其他磁存储设备,或者可用于存储所需信息并可由服务器计算机106访问的任何其他介质。任何这样的计算机可读存储介质都可以是服务器计算机106的一部分。服务器计算机106还可具有诸如键盘、鼠标、笔、语音输入设备、触摸输入设备等输入设备614。还可包括诸如显示器、扬声器、打印机等输出设备616。
根据本公开的实施例,输入设备614可包括能够检测用户的移动或姿势的任何运动检测设备。例如,输入设备614可以包括微软公司的运动捕捉设备,它包括多个相机和多个话筒。
服务器计算机106也可以包含允许该设备与其它计算设备620通信的通信连接618,诸如在分布式计算环境中通过网络,例如内联网或因特网。通信连接618是通信介质的一个示例。通信介质通常由诸如载波或其他传输机制之类的已调制数据信号中的计算机可读指令、数据结构、程序模块、或其他数据来体现,并且包括任何信息传送介质。术语“已调制数据信号”是指具有以在信号中编码信息的方式被设定或改变其一个或多个特征的信号。作为示例而非限制,通信介质包括诸如有线网络或直接线连接之类的有线介质,以及诸如声学、RF、红外及其他无线介质之类的无线介质。
可以通过片上系统(SOC)来实践本发明的实施例,其中,可以将图6中示出的每个或许多组件集成到单个集成电路上。这样的SOC设备可包括一个或多个处理单元、图形单元、通信单元、系统虚拟化单元以及各种应用功能,所有这些都被集成到(或“烧录到”)芯片基板上作为单个集成电路。当通过SOC操作时,以上所述的关于本申请的功能可以通过在单个集成电路(芯片)上集成有计算设备102和106的其它组件的专用逻辑来操作。
以上描述的各个实施例仅作为说明提供,并且不应被解释为限制。可对以上描述的实施例做出各种修改和改变,而不背离本公开的真实精神和范围。

用于对电子表格数据进行报告的自动关系检测.pdf_第1页
第1页 / 共16页
用于对电子表格数据进行报告的自动关系检测.pdf_第2页
第2页 / 共16页
用于对电子表格数据进行报告的自动关系检测.pdf_第3页
第3页 / 共16页
点击查看更多>>
资源描述

《用于对电子表格数据进行报告的自动关系检测.pdf》由会员分享,可在线阅读,更多相关《用于对电子表格数据进行报告的自动关系检测.pdf(16页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102945248 A (43)申请公布日 2013.02.27 C N 1 0 2 9 4 5 2 4 8 A *CN102945248A* (21)申请号 201210377077.1 (22)申请日 2012.09.28 13/252,450 2011.10.04 US G06F 17/30(2006.01) G06F 9/44(2006.01) (71)申请人微软公司 地址美国华盛顿州 (72)发明人 A福尔廷 S范德 沃克 汉迪 DM奥本海默 AV格拉巴 (74)专利代理机构上海专利商标事务所有限公 司 31100 代理人杨洁 (54) 发明名称 用于对电子。

2、表格数据进行报告的自动关系检 测 (57) 摘要 描述了用于对电子表格数据进行报告的自动 关系检测。用于在电子表格内创建报告的系统,包 括:中央处理单元;以及编码指令的存储器,指令 在由该中央处理单元执行时,使该中央处理单元 创建:被编程为标识与电子表格相关联的表格的 数据源模块;被编程为分析表格并标识项之间的 关系的关系模块;以及被编程为显示表格之间的 关系的显示模块。 (30)优先权数据 (51)Int.Cl. 权利要求书1页 说明书6页 附图8页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 1 页 说明书 6 页 附图 8 页 1/1页 2 1.一种在电子表格。

3、中创建报告的系统,所述系统包括: 中央处理单元(602);以及 编码指令的存储器(604),所述指令在由所述中央处理单元(602)执行时,使所述中央 处理单元(602)创建: 被编程为标识与所述电子表格相关联的表格的数据源模块(522); 被编程为分析所述表格并标识项之间的关系的关系模块(524);以及 被编程为显示表格之间的关系的显示模块。 2.如权利要求1所述的系统,其特征在于,当表格被添加到所述报告时,所述关系模块 (524)分析并标识关系。 3.如权利要求1所述的系统,其特征在于,所述报告是数据汇总表(320),并且表格的 每一个都包括要被添加到所述数据汇总表的一个或多个维度。 4.如。

4、权利要求1所述的系统,其特征在于,表格之一是在所述电子表格内被定义的数 据区域。 5.一种用于标识电子表格中数据项之间的关系的方法,所述方法包括: 由计算设备(102)标识与所述电子表格相关联的表格; 允许用户将表格之一添加到所述电子表格中的数据汇总表(320); 分析所添加的表格以确定所添加的表格和所述数据汇总表(320)中的其它表格之间的 关系;以及 当所述所添加的表格不与所述数据汇总表(320)内的其它表格相关时,自动地标识所 述所添加的表格和所述数据汇总表(320)内其它表格之间的关系。 6.如权利要求5所述的方法,其特征在于,进一步包括显示所添加的表格和所述数据 汇总表(320)中的。

5、其它表格之间的关系。 7.如权利要求5所述的方法,其特征在于,进一步包括当所添加的表格被添加到所述 数据汇总表(320)时,通知用户需要定义关系。 8.如权利要求5所述的方法,其特征在于,进一步包括使用试探来自动地标识关系。 9.如权利要求5所述的方法,其特征在于,进一步包括贯穿对所述电子表格内的表格 的使用持久保存关系。 10.一种用于标识电子表格的数据汇总表(320)中维度之间的关系的方法,所述方法 包括: 允许用户将表格添加到所述电子表格中的所述数据汇总表(320),所述表格包括在所 述电子表格中被定义的数据区域; 分析与所述表格相关联的列来确定维度和所述数据汇总表(320)中的其它表格。

6、之间的 关系; 当所添加的表格不与所述数据汇总表(320)中的其它表格相关时: 在所添加的表格被添加到所述数据汇总表(320)时,通知用户需要定义关系;以及 使用试探来自动地标识所述表格和所述数据汇总表(320)中的其它表格之间的关系; 以及 显示所添加的表格和所述数据汇总表(320)中的其它表格之间的关系。 权 利 要 求 书CN 102945248 A 1/6页 3 用于对电子表格数据进行报告的自动关系检测 技术领域 0001 本申请涉及用于对电子表格数据进行报告的自动关系检测。 背景技术 0002 电子表格中的数据汇总表可被用于分析大量数据。数据汇总表提供了一种高效的 方式来显示并汇总由。

7、数据库程序提供的数据或在电子表格的数据列表中的数据。用户可选 择数据的字段来包括在数据汇总表的过滤器区域、行、列、或数据区域内,并可选择要为所 选的数据字段显示的聚集函数,诸如求和、方差、计数以及标准偏差。能从电子表格程序内 查询的数据库中的数据,或包括列表的电子表格数据,可在数据汇总表中被分析。 0003 由于电子表格包括大量的数据,用户可能难以选择要被包括在诸如数据汇总表的 报告中的理想的数据。例如,跨一个或多个大量未被结构化的电子表格所提供的数据量可 淹没用户,使之难以找到与特定报告场景相关的数据片断。 发明内容 0004 在一个方面,用于在电子表格中创建报告的系统包括:中央处理单元;以。

8、及编码 指令的存储器,该指令在由该中央处理单元执行时,使该中央处理单元创建:被编程为标识 与电子表格相关联的表格的数据源模块;被编程为分析表格并标识项之间的关系的关系模 块;以及被编程为显示表格之间的关系的显示模块。 0005 在另一方面,用于标识电子表格内数据项之间的关系的方法,该方法包括:由计算 设备标识与电子表格相关联的表格;允许用户将表格之一添加到电子表格内的数据汇总 表;分析所添加的表格来确定所添加的表格和数据汇总表内其它表格之间的关系;以及当 所添加的表格不与数据汇总表内的其它表格相关时,自动地标识所添加的表格和数据汇总 表内其它表格之间的关系。 0006 在另一方面,用于标识电子。

9、表格的数据汇总表内维度之间的关系的方法,该方法 包括:允许用户将表格添加到电子表格内的数据汇总表,该表格包括在电子表格内定义的 数据区域;分析与该表格相关联的列来确定维度和数据汇总表内的其它表格之间的关系; 当所添加的表格不与数据汇总表内的其它表格相关时:当所添加的表格被添加到数据汇总 表时通知用户需要定义关系;并且使用试探(heuristics)来自动地标识该表格和数据汇 总表内的其它表格之间的关系;显示所添加的表格和数据汇总表内的其它表格之间的关 系。 0007 提供本发明内容是为了以简化的形式介绍将在以下具体实施方式中进一步描述 的一些概念。本发明内容并不旨在标识所要求保护的主题的关键特。

10、征或必要特征,也决不 旨在用于限制所要求保护的主题的范围。 附图说明 0008 图1显示了用于在电子表格程序内生成报告的示例系统。 说 明 书CN 102945248 A 2/6页 4 0009 图2显示了电子表格内的示例数据透视表。 0010 图3显示了用于在电子表格内生成数据透视表的示例数据区域。 0011 图4示出了图1的客户端计算设备的示例模块。 0012 图5显示了用于标识报告内两个或更多个表格之间的关系的示例方法。 0013 图6显示了用于手动地标识报告内两个或更多个表格之间的关系的示例向导。 0014 图7显示了用于标识来自外部数据存储的数据和报告中的一个或多个表格之间 的关系的。

11、界面。 0015 图8示出图1显示的计算设备的示例组件。 具体实施方式 0016 本申请涉及用于自动地检测并建议电子表格应用中数据区域之间的关系的系统 和方法。在在此描述的示例中,数据区域之间的关系被标识并呈现给用户,以允许用户更容 易地将数据组合到单个可用报告中。 0017 图1显示了示例系统100,该系统100支持基于电子表格应用内提供的数据的一个 或多个报告的生成。系统100包括客户端计算机102和服务器计算机106。客户端计算机 102通过网络(通常是公司内联网或因特网)连接到服务器计算机106。可使用更多或更少 的客户端计算机、服务器计算机或其它计算设备。 0018 如在以下进一步描。

12、述的,客户端计算机102可连接到服务器计算机106来获取数 据,诸如电子表格文件。客户端计算机102可执行客户端计算机102上的本地电子表格应 用来操纵电子表格文件。在另一示例中,客户端计算机102可利用被托管在服务器106上 的一个或多个应用来访问并操纵电子表格文件。其他配置是可能的。 0019 现在参考图2,示出了示例程序200。在该示例中,程序200是运行在计算机系统 (诸如以上描述的计算机系统100)上的微软的EXCEL电子表格软件程序。程序200包括具 有示例数据列表的电子表格。 0020 用户可基于电子表格内的数据来创建一个或多个报告。在一些在此描述的示例 中,报告可以是数据汇总表。

13、。然而,在其它示例中,报告可以简单的是另一“常规”表格。例 如,在此描述的系统和方法可被用于基于由用户创建的表格与电子表格内的其它表格之间 所标识的关联来对用户创建的该表格建议某些列。 0021 例如,显示了程序200的示例用户界面302。用户界面302包括初始数据汇总表 320(数据汇总表320在图3中是空白的)。数据汇总表320可从来自各个源的数据中创建。 在图3中显示的一个示例中,数据汇总表320可从在电子表格文件内提供的数据或从一个 或多个外部数据存储中创建。 0022 程序200的用户界面302还包括示例任务窗格450,该任务窗格可被用于创建和修 改数据汇总表320。例如,任务窗格4。

14、50包括来自与电子表格文件相关联的数据的数据字段 列表。用户可从任务窗格450中选择和取消选择字段来创建数据汇总表320。 0023 任务窗格450一般包括字段窗格452和布局窗格454。字段窗格452包括在电子 表格内可用的数据字段列表。在这些示例中,数据字段包括表格,其中每个表格具有一个或 多个可被添加到报告的列。当如以下描述的列表中的数据字段被添加到布局窗格454时, 与该数据字段相关联的复选框被复选。 说 明 书CN 102945248 A 3/6页 5 0024 布局窗格454包括多个区,该多个区表示使用任务窗格450来创建的数据汇总表 320的各个方面。例如,布局窗格454包括行区。

15、、列区、值区以及过滤器区。行区定义用于所 得到的数据汇总表320的行标记。列区定义用于数据汇总表320的列标记。值区标识在数 据汇总表320上被汇总(例如,聚集、方差等)的数据。过滤器区允许对应用到其它区中的所 有其它字段的过滤的选择。 0025 来自字段窗格452的数据字段中的一个或多个被添加到布局窗格454的区中的一 个或多个来创建和修改数据汇总表320。在显示的示例中,用户可将来自字段窗格452中的 列表的数据字段点击、拖和放到布局窗格454的区之一来将字段添加到数据汇总表320。 0026 现在参考图3,被用于创建报告(诸如数据汇总表320)的数据可来自于多个源。数 据源对于电子表格而。

16、言可以可以是内部的也可以是外部的。 0027 例如,图3显示的电子表格500包括两个内部数据区域502和504。数据区域被 定义为具有至少两个维度(诸如行和列)的数据集。例如,数据区域502包括列EmployeeID (雇员ID(身份标识号码)、姓名和行1-3。类似地,数据区域504包括列EmployeeID、Sales Amount(销售量)和行1-7。 0028 在这些示例中,多个数据区域可被包括在电子表格内的多个位置处,诸如在电子 表格内的同一或不同的工作表(sheet)上。如以下注意的,数据还可从外部源合并。 0029 在该示例中,程序200被编程为分析数据区域502和504并自动地确。

17、定区域之间 的关系。例如,程序使用以下被进一步描述的各种试探来确定EmployeeID数据在两个区域 中是一致的。 0030 在这些示例中,关系是两个数据区域(有时称为“表格”)之间基于匹配的数据值来 创建的链接。这些关系可包括一对一关系和/或一对多关系。例如,表格中的单个值可对 应于查找或相关表格中的多个值。关系允许程序同时地查找和汇总两个表格中的数据。 0031 在该检测后,程序200创建两个数据区域502、504之间的关系并允许用户通过 在用户界面中简单地选择字段来容易地创建报告。例如,与数据区域502、504相关联 的数据字段可被群集在用户界面中,使得用户能容易地标识数据区域之间的关系。

18、。关 于出于该目的的示例用户界面的附加细节可在美国专利申请号为13/252,412、代理号 为14917.1922US01、名称为“数据实体的自动化划分范围(Automatic Scoping Of Data Entities)”的同一天提交的申请中找到,该申请的全部内容通过引用结合于此。 0032 能在检测到数据区域502、504之间的关系后被生成的报告的一个示例是电子表 格500上的报告510。在该示例中,报告510是通过使用来自数据区域502、504的数据生成 的数据汇总表,诸如数据透视表。为了创建报告510,用户以与图2中描述的方式类似的方 式来从数据区域502、504和外部数据存储5。

19、06中选择理想的数据字段。 0033 除了电子表格500中提供的数据区域502、504,数据还能从外部数据存储合并到 电子表格500中。例如,图3中显示了外部数据存储506。这样的外部数据存储的示例包括 OLAP和非OLAP数据源。来自该外部数据存储506的数据被合并到电子表格500中。如以 下进一步描述的,基于关于该外部数据存储506的信息,可标识外部数据存储506中的数据 与电子表格500内的数据区域502、504之间的关系。 0034 在一些示例中,在数据区域和外部数据存储中提供的用户可从中选择的可用数据 字段的数量变得巨大。在这种情况中,用户可能难以查看可用的数据字段并选择理想的字 说。

20、 明 书CN 102945248 A 4/6页 6 段以供包括在报告中。 0035 现在参看图4,示出了客户端设备102的逻辑模块。这些模块包括数据源模块522、 关系模块524和界面模块526。在这些示例中,模块522、524、526和允许用户操纵电子表格 文件内数据的电子表格应用相结合地执行。客户端计算机102的模块522、524、526用于标 识电子表格的数据之间的关系,使得用户可更容易地标识用户可能在创建报告时想要选择 的相关字段。 0036 数据源模块522标识与特定文件(诸如电子表格文件)相关联的所有数据源。这可 包括被定义在电子表格文件的一个或多个工作表上的内部数据区域。这还可包。

21、括来自外部 数据存储的数据。这样的外部数据存储可包括被从电子表格内引用的数据,诸如已经被合 并到电子表格文件中的外部数据。数据源模块522向关系模块524提供所有数据源以供分 析。 0037 关系模块524确定电子表格内的数据源中的哪些(如果有的话)是相关的。例如, 如果用户正在创建报告(诸如数据透视表),则关系模块524确定使用各种试探来分析全部 的数据区域和已经被合并到电子表格中的外部数据存储,以确定它们之间的任何关系。 0038 例如,程序使用试探来检测数据(电子表格网格中的数据或来自用户已经导入到 电子表格应用中的任何外部数据源的数据),并基于该检测来建议不同数据区域中的相关 数据实体。

22、。该电子表格应用接着将信息存储在这些关系上并且其它电子表格特征现在将自 动地充分利用这些关系,从而允许用户创建包括来自多个不同的数据区域的数据的报告。 0039 可被用于标识关联的试探的一些示例包括以下中的一个或多个: 0040 列名称匹配(例如,具有相似标题的列); 0041 值匹配,诸如主键表中具有唯一值的一个列和外键表中具有重复值的一列,但其 中不同的值集存在于主键列中; 0042 数据类型匹配(例如,日期或货币字段); 0043 模糊值匹配(例如,“CA”匹配“California”);以及 0044 使用映射表来产生一个表格中需要的标识符以创建与已经有具有这些标识符的 列的另一表格的。

23、关系。 0045 例如,参考图5,在一个场景中,当用户将来自不相关表格的数据字段添加到报告 (诸如数据汇总表格)时,两个或更多个表格之间的关系被创建。 0046 在该示例中,当在操作532处用户将字段添加到报告时,方法530开始。接着,在 操作534,作出关于是否因为例如该字段与已经包括在表格中的字段不相关而需要关系的 确定。如果不需要关系(即,该字段已经以某些方式相关),那么字段被添加并且方法结束。 0047 然而,如果需要关系,控制被替代地传送到操作536,并且用户被通知关系可能缺 失。用于这样的通知的一个示例方法是在用户界面内提供信息条以向用户通知关系缺失 (例如,“表格之间的关系可能需。

24、要被创建。”)。 0048 接着,在操作538,作出关于用户是否想要为新添加的字段创建关系的确定。如果 否,则方法结束,并且用户可在下次用户修改报告时被再次提示需要提供关系。如果是,则 控制替代地传送到操作539。在操作539,确定新添加的字段和已经被包括在报告中的字段 之间的关系。在一个示例中,关系可通过使用以上描述的试探中的一个或多个来被自动地 确定。在另一示例中,关系可被手动地定义。 说 明 书CN 102945248 A 5/6页 7 0049 例如,现在参考图6,示出了示例关系向导540。在该向导540中,用户可手动地定 义不同的表格中字段之间的关系。在该示例中,字段Employee。

25、 ID(雇员ID(身份标识号 码)与表格SalesTable(销售表)和EmployeeTable(雇员表)相关。 0050 通过关系模块524定义的关系(无论是由程序自动创建的还是由用户手动定义的) 可贯穿报告的创建来被持久保存。在一些示例中,关系还可通过电子表格内的其它报告的 创建来被持久保存,使得程序和/或用户不需要在每次使用电子表格内的数据字段时来重 新定义关系。 0051 再次参考图4,界面模块526向用户呈现来自数据区域和外部数据存储的可用数 据字段以供包括在报告中。在该示例中,界面模块526在界面中向用户指示数据源之间的 关系。这些关系在多个方式中可以是清单。在一个示例中,当用户。

26、选择表格时,界面可仅仅 呈现该表格以及与该所选的表格相关的任何其它表格。在另一示例中,表格可被群集以标 识关系。 0052 如以上注意的,除了定义来自电子表格内的表格的数据字段之间的关系,程序可 定义与来自外部源(诸如外部数据存储)的数据的关系。在该情况中,关系模块524被编程 为分析来自外部数据存储的数据并提供该数据与被包括在电子表格内的任何其它数据之 间的任何关系。 0053 例如,参考图7,显示了示例数据连接向导550。在该示例中,数据连接向导550允 许用户选择与向导中当前被选择的一个或多个表格直接相关的表格。在该示例中,外部数 据存储“AdventureWorksDW2008R2”在。

27、向导550中被选择,并且用户可选择电子表格内的特 定表格以与数据库相关(例如,DimEmployee被选择)。该选择可(通过用户在向导550中) 被手动地完成,或它可通过程序使用以上描述的试探来自动地完成。在其它示例中,如果外 部数据源具有已经在其表格之间定义的关系,这些可与来自外部数据源的数据一起被导入 并且可与在电子表格应用处创建的任何其它关系一起被用在该电子表格应用中。 0054 例如,程序可访问关于外部数据存储的方案信息,该方案信息允许程序查明表格 之间的关系。(例如,以XML文件形式的)该方案可与被导入的外部数据存储内的字段以及 其它外部数据存储中的其它数据相关。程序充分利用该信息来。

28、为用户将数据字段自动地相 关。 0055 参考图8,示出客户端计算机102和服务器计算机106的示例组件。在示例实施例 中,客户端计算机102和服务器计算机106是计算设备。客户端计算机102和服务器计算 机106可包括输入/输出设备、中央处理单元(“CPU”)、数据存储设备和网络设备。客户端 计算机102还可以是移动计算设备,诸如膝上型计算机、平板、可转变的或其它手持设备, 像智能手机或蜂窝式电话。服务器计算机106还可被集成为服务器网络内的一个或多个服 务器计算机。在此类情景中,网络可提供云计算平台,其中为连接到云计算平台的客户端主 存一个或多个应用和数据。以下关于服务器计算机106的讨论。

29、还应用于客户端计算机102 的组件。 0056 在基本配置中,服务器计算机106一般包括至少一个处理单元602和系统存储器 604。取决于计算设备的确切配置和类型,系统存储器604可以是易失性的(诸如RAM)、非易 失性的(诸如ROM、闪存等)或是两者的某种组合。系统存储器604一般包括适于控制服务 器(诸如来自华盛顿州雷蒙德市的微软公司的微软服务器2010协作服务器) 说 明 书CN 102945248 A 6/6页 8 的操作的操作系统606。系统存储器604还可以包括一个或多个软件应用608并且可以包 括程序数据。 0057 服务器计算机106可具有附加特征或功能。例如,服务器计算机10。

30、6还可以包括 计算机可读介质。计算机可读介质可包括计算机可读存储介质和通信介质两者。 0058 计算机可读存储介质是物理介质,诸如包括磁盘、光盘或磁带的数据存储设备(可 移动和/或不可移动)。这样的附加存储在图6中由可移动存储610和不可移动存储612示 出。计算机可读存储介质可以包括以用于存储诸如计算机可读指令、数据结构、程序模块或 其它数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计 算机可读存储介质可以包括但不限于,RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、 数字多功能盘(DVD)或其他光盘存储、盒式磁带、磁带、磁盘存储或其他磁存储设备,。

31、或者可 用于存储所需信息并可由服务器计算机106访问的任何其他介质。任何这样的计算机可读 存储介质都可以是服务器计算机106的一部分。服务器计算机106还可具有诸如键盘、鼠 标、笔、语音输入设备、触摸输入设备等输入设备614。还可包括诸如显示器、扬声器、打印机 等输出设备616。 0059 根据本公开的实施例,输入设备614可包括能够检测用户的移动或姿势的任何运 动检测设备。例如,输入设备614可以包括微软公司的运动捕捉设备,它包括 多个相机和多个话筒。 0060 服务器计算机106也可以包含允许该设备与其它计算设备620通信的通信连接 618,诸如在分布式计算环境中通过网络,例如内联网或因特。

32、网。通信连接618是通信介质 的一个示例。通信介质通常由诸如载波或其他传输机制之类的已调制数据信号中的计算机 可读指令、数据结构、程序模块、或其他数据来体现,并且包括任何信息传送介质。术语“已 调制数据信号”是指具有以在信号中编码信息的方式被设定或改变其一个或多个特征的信 号。作为示例而非限制,通信介质包括诸如有线网络或直接线连接之类的有线介质,以及诸 如声学、RF、红外及其他无线介质之类的无线介质。 0061 可以通过片上系统(SOC)来实践本发明的实施例,其中,可以将图6中示出的每个 或许多组件集成到单个集成电路上。这样的SOC设备可包括一个或多个处理单元、图形单 元、通信单元、系统虚拟化。

33、单元以及各种应用功能,所有这些都被集成到(或“烧录到”)芯片 基板上作为单个集成电路。当通过SOC操作时,以上所述的关于本申请的功能可以通过在 单个集成电路(芯片)上集成有计算设备102和106的其它组件的专用逻辑来操作。 0062 以上描述的各个实施例仅作为说明提供,并且不应被解释为限制。可对以上描述 的实施例做出各种修改和改变,而不背离本公开的真实精神和范围。 说 明 书CN 102945248 A 1/8页 9 图1 说 明 书 附 图CN 102945248 A 2/8页 10 图2 说 明 书 附 图CN 102945248 A 10 3/8页 11 图3 说 明 书 附 图CN 102945248 A 11 4/8页 12 图4 说 明 书 附 图CN 102945248 A 12 5/8页 13 图5 说 明 书 附 图CN 102945248 A 13 6/8页 14 图6 说 明 书 附 图CN 102945248 A 14 7/8页 15 图7 说 明 书 附 图CN 102945248 A 15 8/8页 16 图8 说 明 书 附 图CN 102945248 A 16 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1