与显示屏和窗口大小相关的web页适配系统 本发明涉及用于组织可视材料的系统和方法,更特别地,涉及用于组织同可视化显示屏和窗口上的web网点相关的可视材料的系统和方法,在可视化显示屏和窗口内可以显示可视材料,如家庭或web页。
当前的家庭或web页一般通过广域网(例如,因特网)进行访问,没有考虑浏览web页的显示器或窗口的差别。通常,web页设计者只考虑最典型的个人电脑(PC)监视器的尺寸。如果从较小的显示器(如掌上型电脑,web电话)上访问这样的web页,用户只能浏览web页的一小部分,并且为了访问该web页的其他部分,用户必须沿他们的显示器移动相关的主页(左-右,上-下)。对拥有小显示器的用户而言,仅有地其他选择就是将web网点转换为文本格式。这对于大多数web网点用户来说是一个不能接受的方案。相反,对于拥有相对大的显示器的用户,用户可以浏览包括几个链接的整个web页。但是,在用户到达包含所需信息的链接之前,用户可能需要按层次激活几个链接。拥有较大显示器的用户如果能同时浏览多个链接的内容将会更满意,因为他的显示器尺寸可以支持这种浏览方式。如果用户在几个大小仅为整个显示器一小部分的窗口或外壳(shell)中浏览web页则会发生类似的问题。
需要指出的是这里所使用的名词“窗口”指图形外壳,它一般指提供图形用户接口的应用程序的外层部分。由于外壳典型地包括它自己的图形符号和格式,所以外壳的使用会导致显示器上仅有一小部分可以用来显示web页数据。另外,“窗口”也指广为人知的在微软窗口操作系统下运行的多种软件程序所使用的图形分区,这同样会导致仅有部分显示器可以用来显示web页数据。
网景浏览器为用户提供了从菜单中去除一些指定的条棒和按钮的选项,例如,Jim Minatel,Easy World Wide Web with Netscape,Que Corporation,1996。但是这只能释放显示器或窗口的一小部分并不能解决用户所面对的问题,即不能显示同一个web页相关的多个对象。
本发明提供同可视化显示屏和窗口上的web网点相关的可视材料的组织,在可视化显示屏和窗口内可以浏览这些web页。本发明为不同的可视化设备,例如从标准PC监视器,膝上型显示器和掌上型显示器到web电话及数字相机显示器,到任何带显示器的设备,提供了一种不同的浏览-访问策略,并从大窗口到小窗口均可浏览web。但是需要指出的是本发明的内容并不局限在上面所述的显示器类型并且该领域的一般技术之一期待同其他形式的显示器结合使用。一种新的web网点设计包含了以下特征,即可以用更为友善的方式自动显示web页内容,使用户从某种大小的显示器或窗口中浏览这些内容。例如,如果显示器或窗口的大小允许,可以显示链接及这些链接所链接的一些文字或图片。相反,如果显示器或窗口尺寸不允许在整个显示器或窗口上显示所有文本和图标信息,该互联web页将被映射到按层次链接的新的完全适合当前显示器或窗口的较小页面中。本发明独特的显示策略由在web网点服务器上实现的互联web页适配方案来提供,并且最好能部分嵌入到客户的计算机,如web页浏览器上(例如,象一个java小应用程序)。这种适配策略使用了同可视化显示器相关的提供屏幕及/或窗口大小信息的变量,该变量在对web网点的调用中进行初始化。
方便地,用户可以提供任何类型的显示设备以及相关的显示屏:例如,web电话或掌上型电脑。另外,可以在这种显示屏上显示任何大小的窗口。本发明的这种显示适配器可以有效提供可以嵌入到用于描述格式和链接层次的脚本(例如,URL)中的特殊标识。例如,使第一页(在一些标准格式中)具有图标I1,I2,I3和I4以及链接L1,L2,L3和L4。假设图标I1和I2具有可以用图标I12表示的公共主题,并且图标I3和I4具有另一个可以用图标I34表示的公共主题。类似地,假设链接L1,L2和L3同可以用链接L123表示的一些主题相关。这样,根据本发明,如果该网站在一个比标准显示器小得多的显示器上浏览,浏览者可以看到例如图标I12和I34以及链接L123和L4,也就是说,可以看到四项而不是八项。为了访问I1或I2,用户必须选择图标I12(例如,使用普通计算机鼠标在图标上点击)并且显示图标I1和I2。类似地,用户可以看到其他按层次排序的链接。相反,如果用户在一个比标准显示屏大的显示屏上浏览web网站,不仅可以显示出图标I1,I2,I3,I4和链接L1,L2,L3,L4,还可以显示其他一些同那些项层次地相关的图标和链接。
本发明最好还提供了一个语义解释器模块,用于根据显示屏或窗口的大小,不使用web页设计人员所书写的初级标识(preliminarymarks)自动判断如何折叠或展开web页内容。这个语义模块可以以有限状态自动控制(FSA)系统的形式进行组织,该系统的状态和弧对应不同的web页显现(例如,链接,标题,文字大小,在链接和标题中的语义解释文字,与有限系统相关的概念的相对位置),其状态对应一些状况,其弧对应一些转换规则。一个FSA系统可以存在于最简单的计算机中。在大量文献以及与之相关的技术中可以更好地了解FSA,例如Gerald Gazdar & Chris Mellish,“Natural Language Processing inPOP-11”,Addison-Wesley Publishing Co.,New York 1989。如其中所描述的,当得到某种语义数据时可以根据应该做什么来提供简单语义符号,该简单语义符号可以用一种形式化语言和指令表示。最自然的FSA应用情形有,首先,语义符号应与一些输入数据相关,并且第二,规则应该根据给定语义符号后的应采取的行动来生成。作为该事实的结果,一个解释模块,例如语义解释器模块可以表示为FSA。举一个例子,可以将符号“HR”的解释当作一个修饰单元。这一解释可以使用FSA方法论来完成,其中状态对应URL的一些文字及可以得到的显示画面的大小等。规则(由弧表示)会需要动作,例如,如果提供了HR并且有足够的空间,则以一些特殊方式对某些文字加下划线。但是如果它们表示链接则总是以一些方式对文字加下划线,因为链接一般被当作下划线文字。更复杂的状态和规则序列可以同图标的解释相关联。图标是状态,如果可以得到图标中的图片或图标中的标题等的话,弧对应从图标中的图片或图标中的标题(其他状态)抽取到的内容(其他状态)的规则序列。也需要指出的是也可以使用其他技术来形成语义解释器模块。例如,可以使用同专家知识系统方法论相关的正式方法。
进而,本发明提供计算一个页面的每个链接被访问次数的计数装置。链接可以按这些计数进行排序,结果,在小显示屏或窗口上,具有较高计分的链接优先显示。再进而,本发明提供一种统计方法,正如将要说明的,用于通过有关web页外观问题的决策树对web页进行格式化,也就是说,语义解释。这一决策树可以根据一组关于web页设计的样本来培养。正如将要说明的,决策树是一种特殊的表示问题的方式。结点表示一组在该结点提出的问题,连接其他结点的链接依赖于那些问题的答案。决策树中连接到第一个结点的其他结点表示另一组问题等等。例如,与一个web页相关的决策树一的第一个结点A可以问:这是一个图标吗?这一结点通往两个不同的结点。如果回答是,A连接到B1,如果回答否则A连接到B2。结点B1可能包含一个阐明问题中的一个对象如何表示的问题(这是一个链接吗?,这是一幅图片吗?,等等)。在统计树中问题(分支)以统计方式来查找(如文字所说明的)。在一个两分树中,每个(双亲)结点连接两个(儿子)结点,每个儿子结点又是下一层两个(儿子)结点的双亲结点。在两分树中的结点对应两个子集(作为问题来解释)形式的集合划分。例如,一个集合可以是图片。第一个子集有包含活动对象(人,动物)的图片组成,而第二个子集可以由不表示活动对象(如房子,汽车等)的对象组成。这种划分表示了一些关于图片内容的问题。在这里描述了用统计方法生成这种划分。
本发明的一个方面,用于在一个同用户计算机系统相关的显示屏上自动适配从广域网服务器接收到的可视信息信号的基于计算机的装置,包括:用于从用户计算机系统向网络服务器发送用户请求信号的装置,用户请求信号包括至少同一个同用户的显示屏相关的显示屏相关属性相关的信息以及同用户请求相关的信息;以及根据至少一个显示屏相关属性适配可视信息信号以同浏览时用户显示屏的相关信息保持一致的装置。
本发明的这些和其他目的,特征和优点可以通过下面对所示实施例的详细描述而变得明显,所示实施例将根据附图进行说明,在附图中,不同的图使用相同的标号以标明相同或相似的部件。
图1是根据本发明与显示屏和窗口大小相关的web页适配系统的部件示意图;
图2是用于实现本发明特征的客户机和服务器计算机的例示配置示意图;
图3是根据本发明的web页适配器服务器图;
图4是根据本发明的客户web页适配器模块示意图;
图5是根据本发明的一个例示显示模式信息示意图;
图6是一个对URL指令进行解释并匹配显示器或窗口大小例示的示意图;
图7是根据本发明的一个原始折叠web页的示意图;
图8是根据本发明的一个自动web页适配模块的示意图;
图9是根据本发明的一个操作者模块的示意图;
图10是根据本发明的一个依赖web页表示优先级的例示示意图;
图11是根据本发明的一个表示深度web页的例示示意图;
图12是根据本发明的一个数据分离例示示意图;
图13是根据本发明的一个根据语义标准适配web页的例示示意图;
图14是根据本发明的一个图标转换例示示意图;
图15是本发明的一个应用于非常规形状的显示或窗口的例示示意图;及
图16示出了根据本发明的对web页数据进行格式化的统计方法的流程图。
先参照图1,该图是一张根据本发明与显示屏和窗口大小相关的web页适配系统的部件示意图。在图1中示出了与显示屏和窗口大小相关的web页适配系统的基本部件以及与万维网(WWW)的其他部件的关系。在本发明在WWW前提下进行说明和描述时,本发明可以在其他相似的网络和/或相关的包含因特网(例如,文件传输协议)的网络上进行实现。方框100表示运行web浏览器程序101及客户web页适配器模块112的客户机(计算机),正如将要说明的,并包括一个显示设备113。客户机100与服务器104相连。服务器104与网站105,106以及web页适配器服务器107相连。web页适配器服务器107与服务器114相连。
需要指出的是只要多种现存类型的设备具有浏览网站相关数据的显示能力,客户机100就可以采用多种形式,例如,个人计算机(PC),多显示屏PC,膝上型计算机,web电话。但是,本发明并不局限在仅有的这些机器上并且可以使用其他多种经改造具有通信和浏览能力的客户机器来实现,例如,掌上型计算机,计算器,网络电视,远程控制设备,钟表,数字相机,基于交通工具(vehicle-based)的计算机,基于工业设施的计算机。当然,上面所列的并没有穷尽。另外,每种显示类型也可以显示不同大小的窗口(外壳)。这种类型窗口的样本在图1中的一些显示类型(113a-113e)上示出,并作为窗口115加以注明。
图2示出了客户机100的样本配置,它包括通过总线12同RAM14,ROM16,海量存储设备18,输入设备20以及输出设备22相连的CPU10。需要指出的是根据相关图示在这里进行描述的本发明的部件是作为存储在ROM16和/或海量存储设备22的软件模块来实现的,并据需要经由总线12装入RAM14,并由中央处理单元10来执行(运行)。CPU10可以根据输入设备20,如大键盘,小键盘,鼠标,触摸屏提供的用户输入运行软件模块。进而,运行软件模块的CPU10可以将结果输出到输出设备22,例如,显示器,打印机,扬声器。另外,调制解调设备24可以同总线12相连,总线12提供了客户计算机同服务器网络的通信接口。相应地,当可以将图1,3,4,6,8以及9作为本发明实施装置的方框图时,也可以将这些图当作流程图。在这一点考虑上,应指出由于本发明是利用一或多台适于编程的通用数字计算机来实现的,例如,如图2所示,图中示出的功能单元是通过这种编程方式在计算机中建立的功能单元的样本。这样,可以将所述图示用于说明用来实施本发明的适当且优选的处理器框架,该框架可以通过对通用处理器,例如CPU10的编程来实现。当然,也可以使用在所述图中示出的特殊用途处理器。
另外,如图1所示,可以理解,web页适配器服务器107以及服务器104和114可以具有相似的如图2所示的框架,结果如上面所说明的,在图中所示的相关功能单元可以是在一或多个通用或专用处理器上执行的软件模块。
如所提到的,本发明的关键推动力,用于客户机的显示器113可以包括不同的大小,形状和配置的监视器(显示器),如在方框113中的集合样本中所说明的,例如,标准PC监视器(113a),多显示屏PC系统(113b),膝上显示器(113c),web电话(113),以及手表显示器(113e)。当然,在方框113中所示的显示器类型是示范性的并且不打算穷尽说明根据本发明可以使用的显示器类型。另外,每个显示器可以包括用于显示图标和信息的不同大小的窗口(外壳)。图1所示的一些显示类型(113a-113d)上示出了这种窗口的例子并如窗口115一样进行了说明。
假设上面所描述的优选显示屏和窗口大小的互连同本发明的web页适配系统相关,则现在对其中的操作进行说明。客户100在一些端口使用标准TCP-IP万维网连接108发送(通过调制解调器24)请求消息102给服务器机104,该消息遵从URL(统一资源定位程序)标准。客户机100和服务器104之间的端口协议优选HTTP(超文本传输协议)。如所知的,URL用作定义万维网或任何其他因特网设施上服务器机上的文件路径地址。请求消息102遵从URL标准,这样,就可以为客户提供到web页的访问,这些web页自身具有嵌入其中的URL以提供至其他页面的超文本链接。
同请求消息102同时,客户发送显示模式消息103。这一显示模式信息103包括几个客户显示113的特性或参数。一个参数是表示为高度和宽度(例如,360乘400像素点)的显示器大小。其他特性包括,例如:字符格式和大小;同存储器相关的信息,如存储器地址;窗口大小等。
存储器地址信息同客户机100上运行的操作系统相关,即视窗95,OS2等。例如,视窗95使用线性寻址模式,可以提供直到4G字节的RAM访问空间。这4G字节的潜在地址被分为4K字节的部分,每个部分称之为一页。页表用于将虚拟地址映射到物理存储器位置。第一个百万字节存储器用作MS-DOS虚拟机操作。在4M字节与2G字节之间的地址由32位程序使用,作为它们的基操作。每个运行的32位应用获取自己这两个吉字节的地址的局部映射。当程序调用一个地址时,它由视窗95虚拟存储器管理器内部地翻译为包含程序要访问信息的物理存储器地址。DOS和视窗的以前版本将存储器划分为常规,扩充和扩展存储器规格。同存储器相关的信息可以计算有多少存储空间可以用来显示所存储的信息。这一信息对于显示数据的组织,数据的快速访问等是必须的。当给定不同类型的数据地址时,作为这些地址的区别可以找到一些数据分配的存储位置。
显示模式信息可以用模式编号来表示,该编号唯一定义了显示参数。例如,本发明期望可以创建一些表,这些表包含同给定的显示终端相关的显示特性或参数并且每张表可以由唯一模式编号来标识。最终,如果适配服务器107包含大多数同显示屏相关的常用显示参数,接着用户机100仅需要发送模式编号,作为回应,适配器服务器107可以定位适当的表并使用相应的信息。
再进而,由客户机100的用户所指定的附加需求可以优选地包含在显示模式信息103中。正如将要说明的,这些附加需求可以同图标,字体,优先级,深度等的大小和形状相关。在图5示出了带有用户需求的显示模式消息103的一个样本。显示模式消息103可以存储在一个特定文件中。在视窗95/NT机器中,显示模式消息可以存储在注册表中。可以存储显示模式消息的另一个地方是“甜饼(cookies)”。正如所知道的,甜饼是为web页浏览器提供的消息,其中带有有关用户首选项(preferences)的信息。
请求消息102定义了一条由服务器104到网站106的连接(路由)109并且web页通过连接110从网站106回送给服务器104。图1中穿过服务器104的虚线用来说明服务器执行功能的路径方向。其他常规功能也可以由服务器104来完成。尽管如此,在服务器104中,通过连接110所接收的显示模式消息103和web页内容通过连接110a被发送给web页适配器服务器107。当服务器104显示带有来自网站的web页数据的显示模式消息按路由到达网站并接着到达适配器服务器107时,可以理解这样处理是不必要的,这样显示模式消息就可以直接从服务器104发送给适配器服务器107。有优点地,web页适配器服务器107通过服务器104对从网站106接收到的web页进行转换,使web页内容适合显示器113的大小并满足用户在显示模式消息103中指定的需求。一些web页适配器服务器107所执行的操作的例子如下:在显示器113的显示画面尺寸较小时从web页中去除对象或者在在显示器113的显示画面尺寸较大时加入链接到web页的内容。web页适配器服务器107的web页适配操作的详细描述将在下面图3,8和9的阐述中给出。web页适配器服务器107也可以为从其他服务器,如图1中所注的服务器114,得到的web页以同服务器104相同的方式提供转换。也就是说,一个服务器107可以为网络上的多个其他服务器服务。
经服务器107转换后的web页集合通过连接111a被发送给服务器104,并接着通过连接111从服务器104送到客户机100。经适配后的web页集合既可以在显示设备113上显示,也可以发送到客户web页适配器模块112。适配器模块112优选地安装在客户机100上。适配器模块112可以完成web显示适配器服务器107不具备的附加指定操作。最重要的这类本地操作之一是适配web页和窗口或外壳。窗口或外壳可以占据显示设备113的显示屏的一小部分并且通常用较小的尺寸特性化。在图4的阐述中将给出对基于客户的web页适配器模块112的操作的详细描述。
现在参照图3,这张图示出了web页服务器适配器107及其操作。通过服务器104从网站106接收到的web页201的内容(例如,URL/CGI信息)被提供给URL/CGI指令解释器模块202。解释器模块202对URL/CGI指令进行解释。即解释器模块202接收包含URL/CGI指令的web页数据并从中读出同URL/CGI文字指令相关的数字数据。这类数字信息包括,例如,图标和图片大小,字体,文本长度和这些项在web页中所处的显示位置。可以理解,包括这种数字数据的基本URL/CGI指令由web页设计人员提供。由基本URL/CGI指令产生的web页一般适合设计者的计算机的显示格式或者适合平时访问设计者的网站的用户的大多数典型监视器。但是,当试图在不属于以上显示屏,即web页设计者在设计数据时所适合的显示屏的类型之一上浏览信息时,请求这类web页的人需面对这里存在的问题。如所提到的,这个问题是本发明的推动力的一部分。在图6的方框500中示出了一个包含在典型URL中的这类数字数据的一个例子。
可以理解,CGI表示公共网关接口(CGI)脚本,如所知,它是一种用脚本语言书写的程序,其功能是作为HTML(超文本标识语言-在万维网上所使用的文档格式)页面和其他程序,如数据库程序的粘合剂或接口。名词URL和URL/CGI在这里的描述中通常可以互用。
解释器模块202接着将从基本URL/CGI指令读出的数字数据提供给匹配模块203。提供给匹配模块203的还有显示模式消息200(与图1中的103相同),它包含了关于用户显示设备113(图1)的尺寸和特性信息。匹配模块203接着比较来自显示模式消息中的显示参数和从解释器模块202接收到的数字数据以确定包含在适合用户显示设备的特定大小的web页数据中的对象。
换而言之,假定显示尺寸信息包含在显示模式消息中,匹配模块203检查是否这一页面数据的所有重建部分适合显示尺寸。如果匹配模块203确定web页表现确实匹配了显示画面尺寸,也就是说,由web页设计者设计的web页数据适合用户的显示画面,则web页数据通过连接111a(图1)被发送到服务器104,并转发给客户机100。
否则,可选择将URL/CGI指令201a-201d提供给搜索模块205。需要指出的是这些可选择的URL/CGI指令201a-201d是同主URL/CGI指令201一起提供给适配器服务器107的模型URL/CGI指令并存储在存储器204中。这些可选择的模型包括文字指令,它包括可选择的数字信息,该信息同如图标和图片尺寸,字体,文本长度及这些项在所显示web页中的位置相关。优选地,可以选择的URL/CGI指令可以包括一个作为第一指令的特殊指令,该指令标识什么类型的显示屏尺寸最适合显示同具体的URL/CGI指令集相关的web页数据。这一特殊指令可以大概地或者粗略地标识想要的最优显示画面。例如,该特殊指令可以标识web页数据打算在PC显示屏,膝上型计算机显示屏,或者掌上型计算机显示屏上显示。可选择地,这一特殊指令可以精确描述想要的像素显示区域,例如,N×M像素。这样,每个可选择的URL/CGI模型中都带有这种特殊指令,搜索模块205就可以快速对各自特殊指令中的信息和显示模式消息信息(可以从匹配模块203或直接从服务器104得到)进行比较并确定哪一个,如果有的话,模型是适合用户显示屏的最优模型。如果在这种快速搜索中找到最优模型,搜索模块将这一指令集提供给服务器104,然后该服务器将该集合传送给客户机100以进行显示。还可以理解,搜索模块205会从集合201a-201d中搜索最接近匹配显示屏尺寸的指令。也就是说,如果模块205找到一个带有参数的URL/CGI文件,该参数大体同包含在消息200中的显示模式k一致,则模块205将这个URL/CGI文件通过连接111a(图1)发送给服务器104,以后再转发给客户机100。例如,如果消息200中的显示模式k包含一个有关显示尺寸的参数,例如370乘380像素,则这一尺寸会被当作充分接近显示屏尺寸为360乘400像素的匹配,在URL文件201a-201d中之一进行定义。
在下面这种情况,即可选择的URL/CGI指令没有一条如上所述的用于快速比较的特殊指令时,这一模型被发送给解释器模块202,在这里从指令中读出数字数据并发送给匹配模块203进行如上所说明的完全数据比较。因此,在适配web页数据之前,解释器模块202,匹配模块203以及搜索模块205会使用现有的由web页设计人员提供的URL/CGI(基本的和可选的)指令试图找到一个充分接近显示模式信息的匹配。
现在,如果使用原始URL/CGI指令或者使用可选模型没有找到最优匹配,则原始URL/CGI指令(web页URL/CGI201)后最接近的可选URL/CGI模型201a-201d被发送给一个适配模块207(如图3所示,穿过搜索模块205)。在web页适配模块207中,如果用户的显示尺寸比在201中定义的web页所使用的尺寸小,则web页被折叠到几个页面中,去除对象和链接并进行重新映射。另一方面,如果用户的显示尺寸比web页设计所需的大,则对象和链接被加入到web页中。自动web页适配模块207的详细描述会在下面对图8的阐述中进行说明。但是,根据本发明的两个web页适配的样本会首先在图6和7的阐述中进行描述。
图6所示出的方框500表示原始URL/CGI指令的一部分,它包含指令行502和503。指令502描述了行段(line segment)501的位置,宽度和大小。相似地,指令502描述了行501a的属性。在这些指令中,“HR”在一页中放置了一条水平线;“Width=′percent′”指定了该行作为当前显示宽度百分比的相对宽度;“Align=′left/right/center′”指定了多条长度小于页面全长的水平线的对齐方式;“Size=′number′”指定了单位为像素点的垂直线的粗细度。这些URL指令行由适配模块207的一个URL转换模块进行处理,这一处理的输入参数有新窗口显示或者web图形单元的显示大小解释,以及来自水平模块207的web内容解释器的内容。例如,模块207将符号“HR”作为一个修饰单元,一个带下划线的单元(例如,对某些词或图片加下划线)或者一个分隔单元(例如,将页面分隔为不同的部分)进行解释。根据页面内其他单元的内容(图6未示出),模块207判断出指令行503仅具有修饰目的,而指令行502则具有更重要的语义目的(例如,在某些图片或文字加下划线)。
有时在web页面上的下划线被用于显示哪些词是链接。典型地,只有带下划线的词是链接。在带下划线的词上点击鼠标来激活链接。这样,保留在经适配的web页中的这些行的功能或语义特性是十分重要的。但通常并非所有带下划线的词都是链接。更恰当地说,在一些词上加下划线是修饰性的(也就是说,不起链接的功能)。相应地,Web网站设计员可以根据本发明对URL进行修改以在URL中提供一条指令,该指令用来指示一条线是功能性的还是修饰性的。
为一个新的较小窗口或显示尺寸构造一个新的URL 507,其中指令行503(对应行501a)被完全丢弃。指令行502被转换为一条新的指令行508,其中,相应的行509占据了整个新显示区的50%(例如,由于这一新显示区较小)并且为了对齐该行移到左边(例如,由于没有足够的空间在URL 500的中央放置该行)。另外,如所示,行509的上下宽度可以比URL 500中的更小。
可以理解,这个例子有助于理解适配模块207是如何实现FSA的。这样,这种解释可以使用FSA方法论来完成,其中状态对应URL脚本的一些词以及可用的显示尺寸等。接着,用弧表示规则并且规则需要依赖所期待结果的特殊行动。
现在参照图7,这是一个原始web页面的例子并在该web页的带状文本中显示有Yahoo新闻。如所示,Yahoo是一种web服务,一种提供信息和链接其他服务的服务。特别地,原始web页面701象在常规个人计算机的显示屏上显示的那样进行显示,而作为原始web页面701的条状下翻文本的web页面702,在适配器服务器107执行适配处理之后进行显示。页面702可以在带有较小显示器的设备上进行显示,例如web电话。可以理解,在图7中的例子仅仅示出了本发明的适配处理的一个简单例子,并且如所提到的其他事物,如果用户所提供的显示尺寸比所需要的用于显示web页面201的显示尺寸大,也可以对web页面进行扩充(加入对象和链接)。
现在,给出自动web页面适配模块207的详细解释。现在参照图8,web页面数据(由模块207通过图3中的搜索模块205接收到的URL/CGI指令)表示为方框800。如所解释的,web页面数据包括不同类型的可视化对象,例如,图标,文本,图形图像。这些对象在一个显示屏上进行表示时具有不同的大小和位置。对于这些可视化对象中的一些对象,可以直接从描述对象的脚本(例如,URL)中估计出对象是否匹配某种大小的显示屏。但是对于一些可视化对象(例如,以一些格式存储的经压缩的图形图像),直到该对象在显示屏上实际显示时才能得到这些信息并且度量对象的大小。
这样,web页面数据800被首先提供给数据分离器模块801,它使用上面所描述的准则将web页面数据分离。数据分离器模块801将web页面数800中的数据项(例如,图标,链接,文本,图形图像)分离为两个组,S1和S2。第一组S1包括其大小可以从web脚本(例如,URL/CGI指令)估计出的数据项。第二组S2包括剩余项。如下面将要描述的,在组S1中的对象被送到优先器模块802在新的web页面中进行进一步的转换和组织以匹配具体的显示屏尺寸。在组S2中的对象以链接方式在web页面中进行表示,该链接被插入经适配的web数据S1中。
如所提到的,在组S1中的对象在优先器模块802中进行优先级划分。其中,根据对象的重要性列举对象。在下一步的web页面的转换中会考虑该优先级。例如,如果第一个对象比另一个对象的优先级高并且这两个对象不能一同匹配一个小显示屏,则具有较高优先级的对象在屏幕上显示,而较低优先级的对象作为一个连接到另一个web页面的超文本链接进行显示,该web页面是一个能完全显示该低优先级对象的web页面。图10示出了优先级划分的一个例子。
在图10中,方框1201表示一个为平均大小的显示屏设计的原始web页面。在这个web页面1201上,显示有两个图标:“Mybriefcase”(具有优先级1)和“Junk”(具有一个较低的优先级2)。但是,由于用户可以在尺寸缩小的显示屏上浏览原始web页面1201的内容,因此这一缩小的显示屏仅能匹配一个图标。这样,根据本发明,最高优先级图标“My briefcase”在这一显示屏上的一个缩小的web页面1201上进行显示。进而,整个图标“Junk”并不在web页面1202上进行显示,页面1202包含一个以词“Junk”(在页面1202底部)出现的文本(超文本)链接,该链接指向另一个web页面1203,该页面显示了整个图标“Junk”。当该链接被激活时(例如,用通常方式在页面202上通过在词“Junk”上点击鼠标来选择它)web页面1203被显示在用户的显示屏上,其中显示有图标“Junk”。
优先级依赖于这样一些因素,例如包含在一个对象中的信息的重要性及/或这一对象(链接)由这一特定用户或所有访问的频度。这些用于制定优先级策略的信息可以从先前用户输入的信息中获取或者抽取并存储在用户数据库803中。这一信息可以包括,例如,用户配置,用户访问特定web站点的历史,根据用户配置对特定web站点进行访问的统计信息。数据库803也可以包含带有用户喜好信息的“甜饼”。如所知道的,甜饼是一个由web服务器创建的数据文件,它可以存储在用户的计算机上并为web站点提供了一种追踪用户模式及喜好的方式。例如,甜饼可以首先包含先前由用户输入的URL,下一次用户的web浏览器程序再遇到这些URL,web浏览器将特定的甜饼发送给web服务器。这些特定的甜饼可以包含,例如,用户的标识,它可以在第二次及以后对该web站点的访问时避免用户再次输入这一信息。
另一个用于制定优先级策略以确定如何显示及显示什么web对象的准则是同这些对象相关的依赖关系。例如,假设如果下列条件之一满足,一个对象O1依赖一个对象O2:(1)O2中的每一项(或大多数项)可以通过O1来访问,这意味着如果激活对象O1(例如,通过在O1上点击鼠标)则首先显示通过O2进行访问的对象;(2)可以通过O1访问的项包含大部分可以通过O2进行访问的项中的信息;并且(3)可以通过O1访问的项以一些方式参照包含在可以通过O2访问的项中的信息,例如,在O1中的项是标题或者O2中文章的摘要。用户可以选择其他的依赖准则,例如,在甜饼中所指示的。
根据本发明对象的优先级优选考虑依赖关系。也就是,依赖于其他对象的对象具有较低的优先级。如果一个对象O2依赖于一个对象O1,并且一个对象O4依赖于一个对象O3,并且O1具有比O3更高的优先级,则O2具有比O3和O4都高的优先级。
不同的优先级可以设置在指向不同链接并具有不同依赖关系的不同的词上。例如,在Yahoo新闻web页面上一个典型的行如下所示:
Business-Headlines-Summaries-Financial-Quotes-MotleyFool 6:43 am est
在上面这一行中每个带下划线的词指向不同的链接。根据本发明,“Headlines”的优先级划分如下:
Headlines-1
Summaries-1A
Quotes-2
Financial-2A
Motley Fool-2B
Headlines对象指向故事的标题,Summaries对象指向这些故事的总结。相应地,Headlines所分配的优先级比Summaries高,因为在Summaries中描述的本质对象是通过Headlines来访问的并且在Headlines中的对象比Summaries中的对象小(也就是说,因为故事的标题比这些故事的总结短)。类似地,Quotes所分配的优先级比Financial和Motley Fool高,因为在Financial和Motley Fool中的大部分信息可以通过Quotes来访问。这种依赖关系意味着这些项的优先级可以在一列中用从顶向下优先级递减的方式进行表示。
优先级划分模块802也可以根据“深度”概念优选操作。深度定义了在一次单用户调用(也就是,如图1所示,当一个用户从客户机100发送一个请求102时)中经显示屏适配的多个页面。这面的描述更详细地解释了深度的符号。
Web页面数据800包含在单一URL/CGI文件中定义的页面。这些页面通过服务器104(图1)被下载到用户的客户机100(图1)上。这些页面可能包含到其他带有其他web站点数据的对象的链接。如果用户激活这些链接(例如,在这些链接上点击鼠标),新的web页面就在同这些链接相关的地址处生成。这些新的web页面也需要处理以适配用户的屏幕。这些新的web页面也可以包含到对象的新的链接。这一web页面的生成处理可以令人信服地无限进行下去并且结果不可能在一次用户调用中将所有可能的web页面同屏幕相适配。根据本发明,在一次单用户调用中同屏幕相适配的页面的数量可以通过一个同深度概念相关的值来限制。根据本发明实现了几个深度的定义。本发明并不仅仅局限在这里所描述的实现例子上。
考虑图11中所示的图。示出了一个web页面1(来自web站点1)。这一页面包含几个对象(圆圈)和链接。假设页面1的深度定义为零(0)。进而,在页面1上的链接参照页面2(来自web站点2)和页面3(来自web站点3)。假设页面2和3的深度定义为一(1)。再进而,页面2具有到页面4(来自web站点5)和页面5和6(来自web站点6)的链接。假设页面4,5和6的深度定义为二(2)。另外,页面4具有到页面7(来自web站点5)的链接。可以理解,页面7的深度可以定义为二(2)或三(3)。深度为3可以容易地理解这是因为页面7是通过具有深度2的页面4进行访问的。但是,也可以考虑到页面4和页面7都驻留在同一个web站点5上并且可以在一个来自页面2的单一用户请求中进行下载。这样,页面7可以具有同页面4相同的深度,也就是2。用户或者缺省设置可以对深度进行不同的定义。相应地,当在优先级划分器802中定义深度N时,将为所有属于页面的深度小于或等于N的对象定义优先级和依赖关系。
可以理解,由优先级划分器802定义的深度可以以几种方式进行使用。所期望的深度值可以由用户选择并以甜饼方式传送给适配器服务器107或者自动进行设置并以显示模式消息的方式传送给适配器服务器107。可选择地,在适配器服务器107中可以固定缺省值(例如,3)。深度也可以使用一些准则来动态定义,例如,时间或容量。
在使用时间作为动态调整深度值的准则时,可以理解,根据本发明用来适配web页面的时间会随用来匹配用户显示屏的web页面的传输量的不同而不同。例如,如果用户向web站点请求几个web页面,例如,5个页面,每个页面都需要适量的适配时间,也可能会花相同的时间适配较少的页面,例如,2个更为复杂的web页面。这样,可以指定时间阀值(再重复一遍,由用户在甜饼中,自动在显示模式信息中,或者作为服务器107的缺省值),这样,深度值就随适配所请求的web页面的时间来变化。
在使用容量作为动态调整深度值的准则时,可以对深度值进行设置以根据待适配的数据量指定一个限制值。因为在一个所经适配的页面上的每个链接都指向一个新页面,而该新页面自身可以有到其他页面的链接,可以轻易看出待适配的信息量会按指数进行增长。这样,可以指定数据量的限制值从而使深度值依赖于同用户请求的所适配的web页面相关的数据量。
可选择地,可以用语义结合时间和容量作为动态调整深度值的准则。在这种情况下,深度可以根据待适配的信息来确定。也就是说,可以指定术语“金融”(再重复一遍,由用户或者在显示模式信息中)并且只对具有这一语义上下文的web页面进行适配。但是,都需要指定时间或者容量约束以将深度限定在有限的范围内。
在模块802中对web数据进行优先级划分之后,web数据被发送到操作器模块804,在这里生成新的用来适配特定显示屏大小的web页面。操作器模块804将在下面图9的上下文中进行详细描述。
操作器模块802由去除/增加模块904和语义解释模块905组成,语义解释模块905包括一些功能模块,如语义合并/分离模块901,文本转换模块902,图标转换模块903和内容解释模块906。可以理解,在图9中示出了模块905的部件901,902,903和906的分解视图并在虚线中作为模块905进行标注。模块905的虚线视图仅仅想进一步示出模块905的实线视图的细节。
在方框901中,包含或指向带有相同或相似标题的信息的对象都并入一个集合中。在所适配的web页面上创建一个链接所并入数据的图标或按钮。选择一个新的名称来突出所并入的数据。这个名称可以在一个图标或按钮上书写(或者通过一些符号以图形方式进行表现)。例如,在图13中,示出了一个典型的指向新闻的Yahoo进入窗格的一部分(方框1501)。在方框1501中,每一行的第一个词定义了随后链接(加下划线的词)的标题。例如,第一行中的词BUSINESS定义了链接的内容,标题,摘要等,第二行的词TECHNOLOGY定义了本行随后链接的内容等。
方框1502表示一个小显示屏。通过使用相似主题的语义合并,来自web页面1501的数据被转换为方框1502中的web页面。第一行包含一个链接BUSINESS&TECHNOLOGY,它指在方框1501中第一和第二行中的信息。在方框1502中第一行的第二个链接SPORTS&ENTERTAINMENT指方框1501中第三和第四行上的数据。方框1502中第二行的第一个链接是WORLD并指向方框1501中第五行中的数据。方框1502中第二行的第二个链接是HEALTH并指向方框1501中第六行中的数据。第三个链接HEALTH指向方框1501中的第六行。第三个链接OTHERS指向方框1501中剩余的数据(也就是说,第七行的WEATHER和第八行的HUMAN INTERESTS)。如果一个用户激活方框1502中的链接BUSINESS&TECHNOLOGY,根据本发明,在方框1503中示出了一个在所适配的显示屏上进行显示的样本。web页面1503包含六个链接:在BUSINESS下的HEAD.和SUM.,在TECHNOLOGY下的HEAD.和SUM.,在FINANCES下的QUOTES和MOTLEY。在页面1503中,HEAD.是HEADLINES的缩写,SUM.是SUMMARIES的缩写,QUOTES是FINANCIALQUOTES的缩写,而MOTLEY是MOTLEY FOOT的缩写。这样,在1503中激活BUSINESS下的SUM.可以显示1501中第一行中链接SUMMARIES的内容,激活MOTLEY可以显示1501中第一行中MOTLEY FOOT的内容等。
语义解释模块905将web页面上的对象分离开来,使得这些对象指向不同的主题和具有相同或相似主题的对象的合并。这些语义操作可以基于web设计员的指令,也可以自动执行。整个模块905提供方框901所需的web对象的语义解释。例如,方框901中的语义解释可以定义为语义相近(也就是说,具有相似主题)的对象,链接定义的部分同一个主题相关等等。
在图13的例子中,相同主题(例如,由每行第一个词所标识的链接)下链接的合并可以由特定web页面的web设计员来完成。web内容的自动主题标识可以通过比较链接到对象上的标题或文本中词的频度(非功能)来进行。有一些方法可以用来标识是否两个词是语义相关的。例如,如果两个词由词汇表中一个词的相同定义链接在一起,则这两个词是语义相关的。这可以为词建立一张语义相似图,用于主题标识。
文本转换模块902在web页面上提供文本操作以将它们同新尺寸(也就是说,显示屏和/或窗口)相适配。如将要说明的,文本及词上的可能操作有:缩写,删除,插入,移动,缩放,字体改变,调整屏幕格式(例如,正方形,圆形,矩形)等。例如在图13中,词HEADLINES和SUMMARIES分别被缩写为HEAD.和SUM.。移动的例子有单词对HEAD.SUM.被放在BUSINESS和MOTLEY(在1503中)下。删除的例子有1503中的QUOTES和MOTLEY(1501中的词“Financial”和“Foot”被删除了)。这些文本转换可以由web设计员在指令(URL/CGI)中指定,也可以由语义解释器905自动产生。例如,用于缩写词的规则(例如,保留原词的至少三或四个字母或者保留一个词的词根等)可以由本发明的适配模式自动实现。另外,语义解释模块905可以定义删除或移动的内容。例如,语义解释器905可以定义链接“Financial Quotes”和“Motley Foot”同主题“FINANCE”相关并且文本转换模块902根据这一信息在1503中建立一个主题标题FINANCE并将链接QUOTES和MOTLEY移到FINANCE下,如在1503中所示。
图标转换模块903执行图标上的转换以将它们同经适配的web显示屏匹配。这种转换的例子包括:将每个图标裁剪掉一半并将两个半个图标合并在一起。图14中示出了一个图标转换的例子。在web页面1601上,画出了两个图标“My Computer”(1602)和“InternetExplorer”(1601)。根据图标转换模块903,这两个图标在适配web页面1604的显示屏中被合并为一个图标。为了激活“MyComputer”对象,用户可以点击1604中图标的左半部分,为了激活“Internet Explorer”,用户可以点击1604中图标的右半部分。图14还提供了另一个缩写图标标题文本的例子,例如将“MyComputer”缩写为“Comp.”以及将“Internet Explorer”缩写为“Intern.”。如果几个图标与同一主题相关,将会为给定主题建立一个新的图标。所创建的新图标可以来自同主题相关的图标数据库,或者来自几个图标的公共部件。例如,如果几个图标的一部分包含一个公共符号(例如,一幅计算机的图片),可以创建一个只包含这一符号的新图标。语义模块905执行判断图标(或者它们的组成部分)是否语义相关的任务。
去除/增加模块904提供web页面上的对象的增加和/或删除,如在前面图10和图13的上下文中所提到的。模块904同模块901,902和903相连并且同这些模块一起提供有关对象的删除和/或增加操作。优先级划分模块802为模块904和905提供其所使用的web页面数据。具有较高优先级的对象同具有较低优先级的对象相比从web页面中被去除(删除和/或移动到另一个页面,对象等)的可能性较小。相似地,语义解释器905使用优先级数据来判断应执行模块901,902,903中的什么操作。例如在图15中,如果用户很少访问页面1501中的对象WEATHER和HUMAN INTERESTS,则这些对象很可能被放入页面1502上的对象OTHERS中。
再重新参照图8,经转换的来自操作器模块804的web页面在模块805中同来自模块807的数据S2进行合并。来自807的对象具有不确定的大小,因此在来自模块804的经转换的web页面中它们表示为指向这些对象的链接。例如,参照图12,一个原有的web页面包含对象:属于组S1的图标1和文本2以及属于组S2的图片3。第一个经适配的web页面1402包含对象图标1和文本2以匹配用户较小尺寸的显示屏。但是,不是将图片3完全显示在页面1401上,而是在页面1402上显示一个按钮1403,作为指向图片3的链接。通过激活这个按钮用户会链接到一个新web页面1404,由于图片的尺寸在显示前不知道,因此该页面并未指定同一种显示屏来适配。这样,该图片可以在1404上显示一部分并且为了浏览该图片的其他部分,用户可以或者移动图片(上或下或左或右)或者将其缩放到一个合适的尺寸。
相应地,在组S1和S2中的web数据在合并模块805中进行合并之后,合并后的web数据由自动web页面适配模块207(图3)输出并通过连接111a发送给服务器104。服务器104接着将根据本发明经适配的web页面通过连接111发送给客户机100,供用户浏览。
现在重新参照图4,该图示出了一个客户web页面适配器模块112(图1)。如前所提到的,前面所讨论的相似的适配功能以及其他功能可以由适配器模块112来执行。适配器模块112优选地运行在客户机100上并且在许多方面同适配器107(在图3,8和9的上下文中详细示出并描述的)类似。可选择地,客户适配器模块112也可以嵌入客户机上用来浏览万维网的web浏览器软件中。在客户机100上需要对web页面进行附加适配的原因有几个。例如,用户可能想将web页面同窗口(外壳)相适配而不仅仅同显示屏适配。显示屏可以包含几个(重叠的)窗口。一个窗口一般具有比显示屏较小的区域,结果对给定窗口上的web页面来说会需要其他的转换信息。窗口尺寸可以由用户通过缩放操作进行修改。根据变化的窗口尺寸,执行不同的web页面适配。相似地,显示系统可以包含几个显示屏(如果有几个监视器连接到同一台机器),所以需要在客户机的每个显示器上指定适配操作。
同这些不同的显示情况相关的参数由客户机110以同显示模式消息103(图5)相似的消息格式提供给模块112。这种信息可以包括一个显示模式号(300a),窗口尺寸W(300b)以及/或屏幕尺寸(300c)。这样安排也使得用户可以发送请求(300d)给适配模块112,请求他所喜好的web页面的特定尺寸。例如,窗口缩放命令也可以用于web页面,结果,web页面可以根据用户请求来进行适配。用户还可以控制web页面的适配深度(例如,执行一个命令,甜饼,注册表),结果,web页面在客户机上以所请求的深度进行适配。
在客户机100上使用适配器模块112执行某些适配功能可以具有某些优于它们在适配器服务器107上执行的优点。例如,客户机比服务器机器可以存储更详细的关于用户配置的信息。客户机可以比服务器机器具有更强大和有效的语义解释工具。客户机可以关系对象尺寸并重新适配web页面。例如,运行适配器模块112的客户机可以显示来自压缩文件的图片并估计相对于显示屏的图片尺寸。这种操作对于服务器机器来说在代价上可能是不允许的,因为服务器需要处理来自许多用户的处理请求并且如果要求更多的在用户本地计算机上执行的显示功能时会造成负担。
在适配web页面的服务器URL/CGI数据301被提供给解释器模块302时,显示画面,屏幕,窗口以及/或请求信息300被提供给适配器模块112,特别地,提供给匹配模块305。解释器模块302执行同解释器模块202(图3)相同的功能,也就是说,阅读同URL/CGI指令相关的数字数据。同样地,匹配模块执行同匹配模块203(图3)相同的功能,也就是说,比较由解释器模块提供的数字数据和与显示相关的信息以确定web页面数据是否适合用户的显示屏幕。但是在这种情况下,确定的是web页面数据是否会适合在显示屏上显示的特定的窗口外壳。如果确实存在匹配,则将web页面数据发送给客户机进行显示(或者如果计算机中驻留有适配器模块112,则仅仅转发给计算机处理显示操作的部分)。如果不存在匹配,则将web页面数据发送给web页面自动适配模块306来执行同适配模块207(图3)相同的功能,也就是说,转换web页面数据以适合用户显示屏幕(特别地,在这种情况下,适合窗口外壳)。可以理解,适配web页面的服务器URL/CGI数据301是由客户机100通过连接111从web页面适配器服务器107(通过服务器104)接收到的web页面数据。因为,适配器模块112的操作实际上同适配器服务器107是相似的,相同的操作不会重复。但是,需要指出的是适配器模块112和适配器服务器107的主要不同是模块112考虑了窗口尺寸W(300b)。窗口尺寸(也就是说,在显示屏上显示的外壳的尺寸)是一个局部变量参数并且最好放在本地web适配器模块112上。这是因为窗口尺寸是可以由用户动态修改的,例如,如所知的,通过用鼠标拖动窗口外壳的边缘可以扩充或缩小外壳。相应地,因为用户可以选择外壳尺寸的极限值,因此预先为不同设备不同的显示尺寸准备一个不同URL/CGI指令的集合,如在适配器服务器107(也就是说,由搜索模块205使用的201a-201d)中所做的,是不实际的。事实上,这就是为什么在适配器模块112中没有同搜索模块205相同的模块的原因。
适配器模块112同客户机100在本地结合使用有其他一些优点。例如,用户可以在包含web页面的窗口外壳A的右角点击鼠标,从而将该外壳转换为一个图标B。这一处理在这一技术领域广为所知。现在,用于外壳A的URL信息可以存储(例如,图2中的RAM14或海量存储18)在计算机100上。如果用户接着在图标B上点击来显示外壳A,不是由模块112将web页面数据提供给它的适配器模块306,而是使用所存储的URL信息来显示外壳A及其相关的web页面数据。现在,如果用户接着改变外壳的存储来创建一个外壳C,模块112适配web页面数据。接着,如果用户再次在外壳C的角上点击来创建图标B,新适配的同外壳C相关的URL数据存储在计算机上。相应地,通过存储经适配的与用户定义的外壳尺寸相关的web页面数据节省了处理时间。
现在重新参照图15,该图示出了具有不同于典型计算机监视器的正方形或矩形的两个显示屏的例子。可以理解,在图15中所显示的屏幕示出了本发明的适配模式不仅仅局限于将web页面转换为适合正方形或矩形屏幕,而是可以在具有不同形状屏幕的系统中进行实现。屏幕1701示出了一个在圆形显示屏上显示的经适配的web页面。本发明的适配系统对所选择的web页面进行转换以沿不同半径的圆圈上显示。在较小半径的圆圈上书写的文本可以表示一个同在较大半径的圆圈上书写的文本链接相对应的链接。例如,在1701中示出的经适配的Yahoo页面。链接“IRAQ CRISIS”表示多个同链接“TOPSTORIES”相关的多个可能链接中的一个。相似地,链接“W.”,“T.”和“S.”可以表示同链接“OTHERS”相关的关于信息“World”,“Technology”及“Sports”的链接。进而,作为圆形窗口外壳,显示画面可以进行旋转以便人可以改变字母的位置(方向)。这样的圆形显示应用可以有手表面,交通工具等。
屏幕1702示出了一个在三角形显示器上显示的经适配的web页面。这种形状的显示器应用在例如视频游戏中。可以理解,本发明的视频模式可以在正方形或其他形状的显示监视器上将窗口转换为不同形状(例如,圆形,三角形等)。图15中的例子仅仅是一个示例并不打算限制可以用本发明实现的应用的范围。
可以理解,本发明的教义可以根据所嵌入的技术进行实现。嵌入技术指包含(嵌入)在用于执行某些特定应用的设备中的集成电路的使用。一般,嵌入技术使用在具有较小尺寸的设备中。例如,web数据显示驱动器芯片可以嵌入到一个较小的设备中以为该设备提供显示web数据的能力。手表是一个这种设备的一个例子。如这样,本发明的自动web页面适配特征可以根据这样的设备来实现。例如,手表可以有一个在图15中示出的圆形的显示设备,也就是屏幕1701。进而,这里所讨论的web数据适配特征可以应用在手表所嵌入的一个集成电路中。这样,根据本发明的自动适配特征而提供的优点,这种手表设备的用户可以享受接收和浏览web数据的能力。
再参照图16,这是一张根据本发明用于适配web页面的统计方法的流程图。可以理解,这种方法由自动web页面适配模块207(图3)的语义解释器模块905(图9)来执行,并且如果自动web页面适配模块306的语义解释器模块包含在系统中。
如在介绍中所讨论的,提供了两种用于语义解释的方法:(1)基于规则(例如FSA)以及(2)统计方法(例如决策树)。这两种方法都可以在模块905层来执行。这是一个所知的事实,即对带有不同计数的计算(counting)事件和分离(Separating)事件,可以用公共的语义上下文对事件进行分类。例如,如果在同一页面上的由用户访问的两个不同图标的访问次数是统计相关的-它们可以通过某些语义概念相关。例如,让一些用于股票报价的web页面表示为一些公司股票(例如,Microsoft,IBM,Apple,Warner Brothers,Columbia及Mercury)的几个图标。还假设这些图标的访问计数示出对Microsoft,IBM,Apple图标的访问是相关的。对Warner Brothers,Columbia和Mercury的访问也是相关的。
通过使用这里所描述的分离图标集合的统计技术,这六个图标被分为两组-用一个新图标表示的第一组可以到公司Microsoft,IBM,Apple这三个图标,而用另一个新图标表示的第二组则可以到WarnerBrothers,Columbia及Mercury这三个图标。一个同这种划分相关的问题是:两个图标I1和I2的访问频度是相关的吗?或者用数学格式:P(I1,I2)/P(I1)P(I2)>h?这里的P(I1)是I1的访问频度,P(I1,I2)是I1和I2的访问频度。可以看到这些公司是同计算机公司相关的或者是同娱乐公司相关的,也就是说,在这个按统计进行相关划分的例子中,产生了语义概念-设一个同计算机公司相关的组图标并设一个同娱乐公司相关的组图标。
同计算机组和娱乐组相关的新图标可以包含具体的标题。当一些图标被分组到一起时可以使用一些方法来标识一个语义概念名称。例如,一些百科全书可以包含对Microsoft,IBM和APPLE是同计算机相关的解释。这样,计算机这个词可以被独立出来并且概念计算机可以同这些图标相关。
在对这些图标的分类完成之后,可以制作一个小的仅包含两个图标COMPUTER和ENTERTAINMENT的web页面。带有COMPUTER标题的图标会链接到另一个包含计算机公司(带有股票相关信息)名称的web页面。相似地,带有词ENTERTAINMENT的图标会链接到一个带有娱乐公司股票报价的web页面。使用这种方法,带有几个图标的大页面会被打包成较小web页面的集合,该页面集合使用统计方法来进行语义标识。
再回来参照图16,web页面数据1800包含不同的对象,例如,链接,图片,图标,文本。这些对象在方框1801中进行统计评分。有许多种方式将统计评分附加到对象上,任何一种方法都是充分的。附加统计评分的方法的一个例子如下所示。对页面上的每一个对象,建立一个计数器,它与一个或几个用户对特定对象的使用次数相关。这一计数器可以根据给定页面的激活次数的总和进行划分。这可以给一个页面上的一个对象附加一个概率评分。假设一个页面上有n个不同的对象。这可以产生n个作为一个n维向量或n×1矩阵的评分,也就是说,一个具有n个单元的列(方框1802)。进而,每个单独的对象可能包含m个子对象。例如,每个对象可以包含一个可以单独激活的相关图标和链接。在这种情况下,每个对象上附加了两个评分,因此,n个对象产生一个n×2维的矩阵。
现在,假设将屏幕上的一个页面分成两个较小的页面以匹配小屏幕。这样,n个对象必须被分为两个组。进行分割的准则同所问及的特殊问题相关(方框1803)。也就是,每次将对象划分成两组都可以解释为一个问题。
相反地,任何问题都定义了对对象的划分。将要问及的这种问题的例子可能是:这个对象同金融或健康相关吗?这个对象是由儿童来访问的吗?这是一个用图画表示的对象吗?可以理解,有多种统计准则来选择“最好”的问题,或者,等价地,最好的划分。这些统计方法的参考文献描述如下:Leo Breiman,Jerome H.Freidman,Richard A.Olshen,Charles J.Stone,“Classification and RegressionTrees”,1984,Wadsworth Inc.下面的参考文献例示了问题及导致发现文本数据中的语义概念的树是如何用统计方法产生的:L.R.Bahl,P.F.Brown,P.V.deSouza and R.L.Mercer,A Tree-BasedStatistical Language Model for Language Speech Recognition,IEEETransactions on Acoustics,Speech,and Signal Processing,Vol.37,No.7,July 1989。为了将在被分为两组的对象上的评分上计算出的类熵函数最小化,这些方法定义了“最好”的问题(划分)。这样,基于该问题或所问及的问题,页面被划分为两个页面。如果一个屏幕被划分为k个屏幕或等价地相当于将n个对象放入k个子集合中,这会产生一个k路划分(方框1804)。每次将n个对象划分为k个子集合都将产生k个新的较小的屏幕或web页面(方框1805)。这些屏幕或web页面可以按层次进行组织(方框1806),在这种组织方式下用户可以首先浏览链接到其他页面的页面1。可选择地,可以执行适配以便用户可以浏览一个概括的“介绍”页面,该页面具有到其他k个页面的链接,包括每个页面的定义。这些定义依赖于所使用的用来划分页面的问题。例如,如果所使用的问题是“这个对象同金融相关吗?”,那么在介绍页面中到相关页面的链接名可能是“金融”。
尽管本发明所示例的实施例在这里是参照附图进行描述的,但可以理解,本发明本不局限在那些具体的实施例上,一个熟悉该技术领域的人可以在不脱离本发明范围或宗旨的前提下所进行的多种其他方式的改变或修正在这里均可以发生作用。