用于有机搜索优化的网站修改系统.pdf

上传人:62****3 文档编号:1026649 上传时间:2018-03-26 格式:PDF 页数:18 大小:699.56KB
返回 下载 相关 举报
摘要
申请专利号:

CN201010510627.3

申请日:

2010.08.13

公开号:

CN102004757A

公开日:

2011.04.06

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20100813|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

埃森哲环球服务有限公司

发明人:

A·P·卡梅尔; S·D·基尔克贝; P·克莱特; H·菲利普斯; A·琼斯; K·万德伯加特; J·A·库恩斯

地址:

爱尔兰都柏林

优先权:

2009.08.31 US 61/238,388

专利代理机构:

北京市金杜律师事务所 11256

代理人:

酆迅;李峥宇

PDF下载: PDF下载
内容摘要

本发明涉及用于有机搜索优化的网站修改系统。具体地,涉及一种用于修改网站以针对主题有机搜索而优化网站的主题有机搜索的系统。该系统包括:数据管理模块,配置用于接收主题的搜索项,接收用于主题的搜索项的相关项,和以及接收网站输入数据。该系统还包括:扫描模块,配置用于扫描和索引网站中的web页面和web对象,和以及识别与搜索项和相关项有关相关联的web页面和web对象的子集。该系统还包括:优化模块,配置用于通过对web页面和web对象的子集确定优先级,或针对web页面和web对象的子集测量度量,来处理来自网站的web页面和web对象的子集。根据处理,将搜索项和相关项部署到网站上的web页面和web对象的子集中。

权利要求书

1.一种配置用于修改网站以针对主题有机搜索而优化所述网站的系统,所述系统包括:数据管理模块,配置用于:接收所述主题的搜索项,接收用于所述主题的所述搜索项的相关项,以及接收网站输入数据,其中,所述网站输入数据识别来自所述网站的web页面和web对象;扫描模块,配置用于:扫描和索引所述网站中的所述web页面和web对象,以及识别与所述搜索项和所述相关项相关联的web页面和web对象的子集;以及优化模块,由计算机系统执行并配置用于:通过对web页面和web对象的所述子集确定优先级、或者针对web页面和web对象的所述子集测量度量,处理来自所述网站的web页面和web对象的所述子集,以及根据所述处理,将所述搜索项和相关项部署到所述网站上的web页面和web对象的所述子集中。2.根据权利要求1所述的系统,进一步包括:测试模块,配置用于:测试所述网站上的web页面的所述子集,以识别所述网站上的所述搜索项和相关项中的差距。3.根据权利要求1所述的系统,其中,所述度量包括准确性度量,以及所述优化模块通过验证所述搜索项或相关项中的至少一个出现在web页面的所述子集的每一个web页面上,来测量所述网站的所述准确性度量。4.根据权利要求1所述的系统,其中,所述度量包括对准度量,以及所述优化模块通过评估所述搜索项或相关项跨越web页面的所述子集的web页面属性集中的一致性应用,来测量所述网站的所述对准度量。5.根据权利要求1所述的系统,其中,所述度量包括完整性度量,以及所述优化模块通过确定具有唯一标题的web页面的所述子集的数量,来测量所述网站的所述完整性度量。6.根据权利要求1所述的系统,其中,所述优化模块配置用于:根据web页面与网站主页或其他指明网站登录页面的接近程度以及根据网站目录结构中的至少一个,对所述web页面的所述子集确定优先级。7.根据权利要求7所述的系统,其中,所述优化模块配置用于:对于具有较高优先级的所述web页面,以较大数量部署所述搜索项和所述相关项。8.根据权利要求1所述的系统,其中,所述扫描模块配置用于:通过对所述经索引的web页面和web对象与所述搜索项和所述相关项进行比较,识别来自所述网站的web页面和web对象的所述子集。9.一种用于修改网站以针对主题有机搜索而优化所述网站的方法,所述方法包括:接收所述主题的搜索项,接收用于所述主题的所述搜索项的相关项,以及接收网站输入数据,其中,所述网站输入数据包括来自所述网站的web页面和web对象;扫描和索引所述网站中的所述web页面和web对象,以及识别与所述搜索项和所述相关项相关联的web页面和web对象的子集;通过对web页面和web对象的所述子集确定优先级、或者针对web页面和web对象的所述子集测量度量,由计算机系统处理来自所述网站的web页面和web对象的所述子集,以及根据所述处理,将所述搜索项和相关项部署到所述网站上的web页面和web对象的所述子集中。10.根据权利要求9所述的方法,所述方法进一步包括:测试所述网站上的web页面的所述子集,以识别所述网站上的所述搜索项和相关项中的差距。11.根据权利要求9所述的方法,其中,所述度量包括准确性度量,以及其中所述处理包括:通过验证所述搜索项或相关项中的至少一个出现在web页面的所述子集的每一个web页面上,来测量所述网站的所述准确性度量。12.根据权利要求9所述的方法,其中,所述度量包括对准度量,以及其中所述处理包括:通过评估所述搜索项或相关项跨越所述web页面的相关子集的web页面属性集的一致性应用,来测量所述网站的所述对准度量。13.根据权利要求9所述的方法,其中,所述度量包括完整性度量,以及其中所述处理包括:通过确定具有唯一标题的web页面的相关子集的数量,来测量所述网站的所述完整性度量。14.根据权利要求9所述的方法,其中,所述处理包括:根据web页面与网站主页或其他指明网站登录页面的接近程度以及根据网站目录结构中的至少一个,对所述web页面的所述子集确定优先级。15.根据权利要求9所述的方法,其中,所述部署包括:对于具有较高优先级的所述web页面,以较大数量部署所述搜索项和所述相关项。16.根据权利要求9所述的方法,其中,所述识别包括:通过对所述经索引的web页面和web对象与所述搜索项和所述相关项进行比较,识别来自所述网站的web页面和web对象的所述子集。17.一种用于修改网站以针对主题有机搜索而优化所述网站的设备,所述设备包括:用于接收所述主题的搜索项的装置,用于接收用于所述主题的所述搜索项的相关项的装置,以及用于接收网站输入数据的装置,其中,所述网站输入数据包括来自所述网站的web页面和web对象;用于扫描和索引所述网站中的所述web页面和web对象的装置,以及用于识别与所述搜索项和所述相关项相关联的web页面和web对象的子集的装置;用于通过对web页面和web对象的所述子集确定优先级、或者针对web页面和web对象的所述子集测量度量,处理来自所述网站的web页面和web对象的所述子集的装置,以及用于根据所述处理,将所述搜索项和相关项部署到所述网站上的web页面和web对象的所述子集中的装置。18.根据权利要求17所述的设备,其中,所述度量包括准确性度量,以及所述设备包括:用于通过验证所述搜索项或相关项中的至少一个出现在web页面的所述子集的每一个web页面上,来测量所述网站的所述准确性度量的装置;以及用于生成包括所述经测量的准确性度量的报告的装置。19.根据权利要求17所述的设备,其中,所述度量包括对准度量,以及所述设备包括:用于通过评估所述搜索项或相关项跨越所述web页面的相关子集的web页面属性集的一致性应用,来测量所述网站的所述对准度量的装置。20.根据权利要求17所述的设备,其中,所述设备包括:用于为所述网站测量对准度量的装置,其中,为所述网站测量对准度量包括,评估所述搜索项或相关项跨越来自所述网站的页面和web对象的相关子集的页面属性集的一致性应用。

说明书

用于有机搜索优化的网站修改系统

优先权

本申请要求美国临时专利申请序列号为No.61/238,388的优先权,该申请于2009年8月31日提交,名称为“Precise OrganicDeployment for Search Engine Optimization(用于搜索引擎优化的精确有机部署)”,申请人为Kamel等,通过引用将其整体结合于此。

技术领域

本申请涉及用于有机搜索优化的网站修改系统。

背景技术

搜索所驱动的消费者的流量是潜在的在线销售的重要资源。比如说,像GOOGLE、YAHOO、BING、BAIDU(中国搜索引擎)以及其他的搜索引擎经常被用于找寻关于产品、服务以及感兴趣主题的信息。用户可能会基于有机搜索结果对网站的排名的驱使,而去往特定的网站。有机搜索结果是搜索引擎结果的列表,该搜索引擎结果的列表的出现是因为它们与搜索项有关而不是基于其他标准可以显示的广告。典型地,如在web页面上所示出,广告显示在所显示的有机搜索结果的一侧上。

比如,一个公司有兴趣通过因特网提升高清平板电视的销售,其目标在于,保证它的网站或者统一资源定位符(URL)响应于查询周边相关项的消费者搜索,在其他相关目标之中由主流搜索引擎显示出更为显著的特征。以通过因特网而以高清平板电视为主题的搜索项示例可以包括诸如如下搜索项,平板、高清电视(HDTV)、等离子、液晶显示器(LCD)。该公司希望,如果这些搜索项中的任何一个被使用,则该公司的URL应该在搜索结果中具有高的排名,因而该公司的URL就会在由搜索引擎所返回的搜索结果列表上显示较高排名。

为了达到搜索结果中的高排名,公司选择他们认为消费者在执行对特定产品、服务或信息化分类进行在线搜索时会使用的相关搜索项。已经选择了这些搜索项以后,这些公司继而努力地确保那些相关项被有效地部署在整个网站中,包括页面内容(包括页面标题、子标题或H1/H2标签、和页面主体内容)、相关联的元数据(或关于该内容的描述,包括元描述、元关键字),以及包括链接内文本、URL文本和相关文档属性的其他页面特征。

通过在网站中相应地部署选择项,当以搜索引擎内容分类为目的而爬取和索引网站时,搜索引擎就更可能有效地解译内容的本质。简单而言,当搜索引擎对网站内容编制索引时,就更可能识别搜索项的一致存在,并且因此将该搜索项与相应的内容和相关的网站或URL相关联。结果是,响应于利用那些搜索项搜索时,相应的URL出现的几率就会增加。这就提升了网站或URL在搜索排名或与这些搜索相关联的所呈现URL列表中的排名,因此能够使得与这些分类相关联的消费者的流量增加。

虽然搜索引擎优化已经成为一种重要的实践,但是它仍然不够准确并缺乏精度,尤其是对于大型动态网站。在相关产品、服务、或信息化分类方面,提高改进引擎排名和搜索驱动的流量常常不够有效。这是因为,虽然理论相当简单,但是优化有机搜索能力实践的有效执行是复杂的。一旦选择了相关搜索项,就可能难以识别给定网站中相应的相关页面和页面上的关键位置,以使得搜索项的密度最大化,尤其是如果谈及网站是大型的(也即,包含许多页面、文档、和其他对象)并且动态的(也即,网站内容随着时间频繁变化)。在与谈及主题或分类相关的大型和动态网站中识别和优化那些页面和页面位置的任务具有巨大的挑战。在与谈及主题或分类不相关或不密切的页面或页面位置上部署所选择的搜索项不会达到有用的目的,并且事实上可能导致市场混乱。

发明内容

根据一个实施例,一种系统被配置用于修改网站以针对主题的有机搜索而优化该网站。该系统包括:数据管理模块,配置以接收主题的搜索项,接收主题的搜索项的相关项,并且接收网站输入数据,其中,网站输入数据包括来自网站的web页面和web对象。系统还包括:扫描模块,配置以在网站中扫描和索引web页面和web对象,并且识别与搜索项和相关项相关联的web页面和web对象的子集。系统还包括优化模块,由计算机系统操作,配置以通过对web页面和web对象的子集确定优先级,或针对web页面和web对象的子集测量度量,而处理来自网站的web页面和web对象的子集,并且基于处理部署搜索项和相关项到网站上的web页面和web对象的子集中。

根据另一个实施例,该系统包括数据存储设备,配置以存储主题的搜索项、主题的搜索项的相关项、以及包括来自网站的web页面和web对象的网站输入数据。系统还包括处理器,配置以在网站中扫描和索引web页面和web对象,识别与搜索项和相关项相关联的web页面和web对象的子集,通过对web页面和web对象的子集确定优先级,或者针对web页面和web对象的子集测量度量,处理来自网站的web页面和web对象的子集,以及基于处理部署搜索项和相关项到网站上的web页面和web对象的子集中。

根据另一个实施例,一种修改网站以针对主题有机搜索而优化网站的方法,包括:接收主题的搜索项,接收主题的搜索项的相关项,并且接收网站输入数据,其中,网站输入数据包括来自网站的web页面和web对象。方法还包括在网站中扫描和索引web页面和web对象,并且识别与搜索项和相关项相关联的web页面和web对象的子集。方法还包括:通过对web页面和web对象的子集确定优先级,或者针对web页面和web对象的子集测量度量,处理来自网站的web页面和web对象的子集,并且基于处理部署搜索项和相关项到网站上的web页面和web对象的子集中。方法可以由计算机系统执行,计算机系统执行存储于非临时性计算机可读介质上的计算机可读指令。

附图说明

在下文的说明书中,参考附图对本发明的实施方式进行详细说明。

图1示出根据一个实施例的有机搜索优化(OSO)系统图;

图2A至图2C示出根据不同实施例的OSO系统的截图;

图3示出根据一个实施例使用图1所示的OSO系统的、网站的有机搜索优化方法流程图;以及

图4示出根据一个实施例的计算机系统图,该计算机系统配置以为附图1中所示的OSO系统提供硬件平台。

具体实施方式

出于简明和示意目的,通过主要涉及其示例的方式描述实施例的原理。在下面的说明中,提出了许多特定细节为实施例提供透彻的理解。但是,对于本领域普通技术人员来说,很明显实施例可以不限于这些特定细节而被实施。在某些实例中,没有详细描述公知的方法和结构以避免混淆实施例。此外,下面描述了不同的实施例。不同实施例可以以不同方式结合使用或实现。

1.概述

根据实施例,公开了修改网站(包括大型和/或动态网站)的系统和方法而用于搜索引擎优化。利用网站的搜索项和相关项的输入,该系统识别相应的相关页面,以及可选地,在给定网站中的页面上的关键位置,以使得这些项在网站中所选择的页面和页面位置上的密度最大化。如果网站是大型的(也即,包含许多页面、文档、和其他对象)和/或动态的(也即,网站内容随时间频繁变化)则尤其有效。大型网站可能包括数百或甚至数千个页面,并且是在动态网站中,动态网站中的关键页面的内容部分通常每月或每周更新,甚至更频繁,如每天、每小时或每分钟地更新。应当注意,系统和方法可以优化任何大小的网站,不管是大型的或是小型的,并且可以优化动态的或是静态的网站。优化包括在与谈及的主题或分类相关的整个网站中识别页面和页面位置,并且在与谈及的主题或分类有关或密切相关的那些页面和页面位置上部署所选择的搜索项和相关项。这就改进了网站的有机搜索排名结果。

2.系统

根据一个实施例,有机搜索优化(OSO)系统被配置以优化网站,以改进针对主题的有机搜索结果中的网站排名。OSO系统增强具有实质上是动态的web页面和web对象的网站的有机搜索结果排名,其可以包括对web页面的周期变化。主题可以是分类、标题、问题、产品等。web页面可以是能够通过因特网访问的文档或资源,并且网站可以包括一组web页面。Web对象可以是关于网站的文档或者其他信息单元。web对象的示例包括但不限于纯文本、超文本、图像、音频、视频和其他多媒体对象,以及可执行应用。web对象可以是驻留在主管网站的机器上的二进制文件或数据库条目,或者在需要时可以由网站动态生成。

图1示出根据一个实施例的OSO系统100。OSO系统100包括数据存储105、扫描模块101、优化模块102、数据管理模块103以及测试模块104。OSO系统100中的这些模块可以是单独的模块,或者也可以在OSO系统100中结合一个或多个模块。模块可以是软件、计算机硬件、或者硬件和软件的结合。数据存储105可以包括数据库或其他类型的数据存储系统,并且可以包括一个或多个数据存储设备。

如上所述,OSO系统100针对有机搜索而优化网站。OSO系统100确定可能与特定主题相关的搜索项。可以通过用户或另一个系统为OSO系统100提供搜索项。搜索项如附图1中所示的搜索项106。由于搜索项106与搜索项的主题相关,因而选择它们来修改网站以改进网站的有机搜索能力。有机搜索能力可以包括驱动网站web流量的效果。有机搜索能力受许多因素驱动,包括:反映消费者针对特定主题的搜索行为的搜索项的正确选择;在相关web页面上的搜索项部署的密度(或频率和接近程度);以及搜索项跨越那些相关页面的各种页面属性的一致对准,包括页面标题、元描述、元关键字、H1标签、URL、链接内文本和文档性质。

除了针对主题的搜索项106,还可以确定与主题相关的一个或多个相关项107。例如假设主题是高清平板电视。相关项107可以不具体描述高清平板电视这一主题,但是仍然应该被认为有益于吸引对该主题感兴趣的流量至该网站。本示例中的相关项107可以包括电子产品、家庭娱乐、电影、视频系统,等等。在数据管理模块103处接收主题的搜索项106和相关项107。并且还可以将搜索项106和相关项107存入数据存储105中。

扫描模块101扫描网站(如网站110),以确定输入数据108。输入数据108可以包括web页面、web对象和相关联的元数据。元数据还可以描述网站结构。其可以包括网站110中的web页面的层次结构。例如,主页可以为根,而其他web页面根据它们之间彼此的关系和/或与根之间彼此的关系形成分支而扩展。元数据还可以描述网站活动性,例如与web页面的交互用户行为的类型。描述web对象和web页面的输入数据108可以包括web对象和web页面的属性,如标题、文件名、图片分辨率等。输入数据108可以由扫描模块101执行的网站110的扫描以外的其他资源确定。数据管理模块103可以将输入数据108存入数据存储105。

由扫描模块101执行的扫描可以包括扫描网站上所有页面和内容,并且继而利用输入数据108索引经扫描的网站110的web页面和web对象。扫描模块101从网站110收集在web页面中可获得的、描述web页面和web对象的元数据。Web爬取器可以用于从web页面中的XML或HTML收集可用的元数据和其他数据。然后,扫描模块101从网站110标识所扫描的web页面和web对象的子集,该web页面和web对象与搜索项106和相关项107具有一定程度或尺度的关联。比如,这可以通过对经索引内容相对于所选择的搜索项和相关项的上下文分析或比对分析来实现。该扫描还可以识别可以在web页面和web对象中的何处找到选择项的位置。扫描模块101然后索引关于主题网站中的所有内容,包括每个页面上的包含主体内容和元数据属性在内的所有文本。

OSO系统100允许输入选择的搜索项以及有助于识别与那些感兴趣项相关联的页面的任何有关项。OSO系统100然后搜索扫描页,以识别包含一个或多个指定项的任意和所有实例。该扫描还可以识别在web页面和web对象中的何处找到选择项的位置。例如,扫描模块101确定在web对象或web页面中是否存在任何搜索项106或相关项107:如果存在,则对web对象或web页面加标签使其包含在子集中。标签可以是与用于web对象或web页面的输入数据一起存储的标志,其能够被OSO系统100的模块所识别。

在扫描模块101识别与搜索项106和相关项107相关联的web页面和web对象的子集后,优化模块102根据一个或多个度量处理web页面和web对象的子集,以识别网站110中web页面和web对象的子集中的搜索项106和相关项107的部署中的差距(gap)。差距为从web页面、web对象、或web页面或web对象上的位置中缺少的一个或多个搜索项106或相关项107的实例。根据上述度量确定web对象或web页面缺少搜索项或相关项的确定,也即差距。

确定差距和优化web页面的度量可以包括准确性、对准(alignment)和完整性。优化模块102测量这些度量。在测量准确性度量时,优化模块102扫描所识别的web页面和web对象的子集,以确定在由扫描模块101识别的子集中,是否存在至少一个搜索项或相关项出现在网站110的每一个web页面和web对象中。

准确性度量确定,是否每一个web页面或web对象具有至少一个所选择的搜索项或相关项出现在web页面上或web对象中的任何地方,虽然不同搜索项或相关项可以出现在子集的不同web页面或web对象上以满足该度量。例如,对于高清平板电视这个主题,优化模块102确定包括平板或高清电视的任何项是否都在web页面的子集中。针对一个特定主题集合或产品分类给出一个特定的搜索项或相关项的集合,该度量验证至少一个此类搜索项或相关项出现在web页面的每一个相关子集中。

搜索项106和相关项107可以由系统、专家确定或者由其他源来提供。Web页面的相关子集通过网站索引确定,以识别反映与相关分类、主题、产品集等相适应的内容的web页面子集。识别web页面的相关子集后,报告确认搜索项或相关项在web页面上出现,并且识别那些缺少相应搜索项或相关项的相关web页面。

Web索引可以包括测量性能驱动。驱动的示例包括搜索项或相关项的使用(也即,该项是否在每一个web页面上);搜索项或相关项的密度,以及在由此类指明搜索项或相关项的一致性部署所反映的指明页面属性中的适当对准。

对准度量测量搜索项106和相关项107跨越页面和web对象的子集的属性中的一致性应用。例如,优化模块102确定平板或高清电视的项在每一个web页面和web对象的子集中,是否出现在超文本标记语言(HTML)结构的相同的或相关位置,如HTML标题或HTML块引用。对准度量还确定在子集的每一个web页面和web对象中,至少有一个搜索项或相关项一致性地出现在相同或相关的结构化位置上。

如同在搜索准确性度量的情况,对准度量基于特定主题/内容或分类,评估跨越网站web页面的相关子集的web页面属性集合的、指明搜索项或相关项的一致性应用。为了使效果最大化,指定指明搜索项或相关项集合,并且在扫描模块101在主题网站上索引所有内容(包括每个页面上的包含主体内容和元数据属性的所有文本)后,基于上下文的扫描识别相关web页面集合。

在这些情况下,对准度量识别并报告具有对准问题的页面,也即,不存在至少一个指明关键字跨越各种页面属性始终出现,该页面属性包括页面标题、URL、元描述、元关键字、H1标签、链接内文本、文档性质和主体内容。

在缺少指定的搜索项或相关项、并缺少相应相关页的识别的情况下,报告基于现有的标题项识别未对准的页面。针对可以影响正确的网站索引、信息可检索性以及自然或有机搜索能力的内容和其他结构化执行属性,在分析中包括了三个基本的性能驱动:a)指明高产项的适当部署;b)指明项的密度;以及c)由此类指明项的一致性部署所反映的指明页面属性之间的适当对准。搜索对准通过度量至少一个指明搜索项或相关项跨页面属性集的一致性出现,来评估不同页面属性之间对准的程度,该页面属性包括页面标题、URL、元关键字、元描述、H1标签、链接内文本、文档性质以及主体内容。

完整性度量确定在具有唯一标题的子集中web页面和web对象的数量。Web页面或web对象的标题可以是与web页面或web对象相关联的标题或其他标签。web页面或web对象的标题在因特网上起到许多不同作用。因为这些不同作用,使得以有机搜索优化为目地的web页面或web对象具有唯一的标题。标题的一个作用是由主要搜索引擎用来作为关键信息以确定web页面的主题,并且因此确定web页面在搜索引擎结果中的排名。

优化模块102生成包括度量的测量值的输出数据109。准确性度量的测量值包括子集中具有至少一个搜索项或相关项的web页面和web对象的数量。准确性度量还可以指示在子集中是否有web页面和web对象缺少搜索项或相关项。将这些web页面和web对象视为差距。

对准度量的测量值包括子集中具有至少一个搜索项或相关项出现在相同或相关HTML结构中的web页面和web对象的数量。准确性度量还指示在子集中是否有任一web页面和web对象在HTML结构中缺少搜索项或相关项。完整性度量的测量值包括在子集中具有唯一标题的web页面和web对象的数量。

优化模块102使用输出数据109来优化网站110,以改进其在有机搜索结果中的排名。例如,基于在准确性中识别的差距的输出数据,为被识别为缺少搜索项或相关项的web页面提供搜索项或相关项。网站优化包括识别差距和在差距中插入搜索项和/或相关项。优化还包括,基于对准度量在HTML结构中插入搜索项和/或相关项。例如,修改图片web对象HTML结构(比如标题)以使其包括搜索项或相关项。优化还包括修改标题,以使得针对完整性度量确定的唯一标题的数量超过阈值。

优化还可以包括对相关页面进行处理,比如确定优先级,以便于所选择的搜索相关项在页面内容、元内容等中的部署。例如,根据访问由web分析或流量报告所确定的页面的流量,或根据页面与主页或其他指明登录页面的接近程度,或根据目录结构、业务或部门划分等,确定页面的优先级或对其进行分组。

部署搜索项和相关项到网站上的web页面和web对象的子集中,修改网站以将其优化用于针对主题的有机搜索结果中的出现。根据一个实施例,优化模块102为具有较高优先级的确定优先级的web页面和web对象大量部署搜索项和相关项。优化模块102可以使用除前面描述的那些优化度量以外的度量。

在将搜索项和相关项部署到网站以后,OSO系统100的测试模块104对网站进行测试,以识别网站上搜索项和相关项的部署中的差距。另外,OSO系统100的测试模块104随后可以周期性地测试网站,以识别网站中的新差距,该差距涉及与网站上的搜索项和相关项相关联的主题。

3.截图

如上针对OSO系统100所述,可以修改网站(如网站110)以对其进行优化,使其在针对主题的有机搜索的搜索结果中实现更高排名。可以对经优化的网站进行测试,以识别web页面上搜索项和相关项的部署中的差距。下面提供的截图阐明了自动报告属性和阈值,以帮助识别网站属性中的差距和确定其优先级,这些差距包括搜索项或相关项的布局中的差距,对这些差距进行处理以优化网站在针对主题的有机搜索结果中的出现。

图2A图示了描述搜索准确性度量的搜索准确性概要报告200的截图。准确性度量处理结果201显示,web页面的相关子集中的18.9%没有搜索项或相关搜索项。使用评分图例202来快速识别准确性度量。在评分图例202中,第一种颜色表示超过20%的相关页面中没有至少一个指明的搜索项或相关项,第二种颜色表示10-20%的相关web页面没有至少一个指明的搜索项或相关项,而第三种颜色表示0-10%的相关页面没有至少一个指明的搜索项或相关项。在203处,报告显示了搜索项和相关项,并且进一步将这些项细分为多个分类,以更精确更详细地报告每一个分类中的项,如204所示。

图2B图示了由分类报告210作出的搜索准确性结果的截图。该结果指示网站中哪些指定页面包括为每个分类指定的搜索项和相关项,哪些页面不包括。报告210的部分211列出了网站中的12个web页面,这些页面不包括与电池相关的分类1的搜索项和相关项。部分212显示了由网站中的4个web页面上识别的分类1的搜索项和相关项。

图2C图示了搜索对准概要报告220的截图。结果221显示web页面中3.7%的相关子集没有包括搜索项或相关项的属性(例如HTML web页面标题)。可以类似于图2A中的图例而使用图例222。报告的部分223显示web页面的其他属性的实例,以及这些属性是否包括搜索项或相关项。

4.方法

图3示出了根据一个实施方式的为有机搜索优化网站的方法300。这种优化改进网站包括在一个主题的搜索结果中的概率,也可以改进该网站在搜索结果中的排名。通过示例而非限定性方式,针对图1示出的OSO系统100而描述这些方法。该方法可以在其他系统中执行。方法中的步骤可以以不同的顺序执行,或者其中的一个或者多个步骤可以省略。

在步骤301中,针对主题而确定搜索项106和相关的搜索项107。比如,在线销售平板电视的公司可以将平板、等离子、LCD、HDTV识别为他们选择的搜索项。可以执行市场分析确定最相关的搜索项,来识别关于平板电视的信息。这些选择的搜索项由公司或者代理(比如埃森哲战略搜索分析)提供给有机搜索优化系统。

在步骤302中,待优化的网站被扫描,而它的web页面和web对象被OSO系统100中的扫描模块101索引。网站上的Web页面和web对象也可以通过使用所选择搜索项和相关项被索引。索引可以包括按照分类或者搜索项索引web对象和web页面。

在步骤303中,OSO系统100中的扫描模块101识别来自网站的web页面和web对象的相关子集,其与所选择搜索项和识别的相关项关联。比如说这可以通过上下文分析或者索引内容和选择搜索项以及相关项的对比分析来实现。这种扫描也可以识别在web页面和web对象上的何处找到选择项的位置。例如,扫描模块101可以索引主题网站上的所有内容,包括每个页面上的、包括主体内容和元数据属性的所有文本。OSO系统100允许选择的搜索项以及有助于识别与那些项相关联页面的任何感兴趣的相关项。OSO系统100继而搜索扫描页面,以识别任何以及所有包含一个或多个指定项的实例。

在步骤304中,OSO系统100中的优化模块102处理在步骤303中识别的页面和对象的子集,以确定对于web对象、web页面和对象以及web页面的元数据的修改。优化模块102所做的处理可以包括用于网站的测量度量(比如网站的精确度、对准和完整性),和/或基于预定的尺度确定web页面和web对象的优先级。比如,页面可以通过如下方式被设定优先级或分组:基于相关访问流量(如通过web分析和流量报告确定),或基于与主页或者其他指明登录页面的接近程度,或基于目录结构、业务或部门划分,等等。

在步骤305中,OSO系统100中的优化模块102部署所选的搜索项,而相关项基于步骤304处理而在页面和对象子集中被部署,从而决定优化网站的修改。举例来说,处理可以确定页面子集的优先级。具有较高优先级的页面可以在它们的内容和元数据方面接受更大数量的选择搜索项和相关项。

在步骤306中,OSO系统100中的测试模块104测试优化的网站,以识别web页面上搜索项和相关项的部署中的任何差距。这种测试可以周期性地重复,和/或被包含在自动质量和一致性管理过程中,该过程扫描正在进行的质量控制并识别与搜索项和相关项指明集合相对应的web页面子集。这种处理执行异常测试,以便识别和强调在页面和元数据内容的项部署中的不足。同样,方法300中的一个或多个步骤可能被重复,从而持续性地或周期性地为所识别项而优化网站。

5.执行软件的计算机系统

在此描述的一个或多个步骤和功能、以及在此所述的一个或多个该系统的组件可以作为计算机代码被实现,这些计算机代码包括存储在计算机可读存储设备(比如存储器和其他形式的存储设备)上的计算机可读指令。这些计算机代码在计算机系统(诸如下文所述的计算机系统400)上,由处理器(诸如专用集成电路(ASIC)或者其他类型的电路)而执行。这些代码可以作为软件程序存在,该软件程序包括以源代码、目标代码、可执行代码或者其他格式代码中的程序指令。

图4示出了可以作为OSO系统100的硬件平台的计算机系统400。计算机系统400可以作为平台用于执行在此描述的一个或多个步骤、方法以及功能;这些步骤、方法和功能可以实现为在一个或多个计算机可读存储设备(作为硬件存储设备)上存储的软件。

计算机系统400包括处理器401或者是处理电路,其可以实现或者执行软件指令,从而执行在此描述的某些或全部方法、功能以及其他步骤。来自处理器401的命令和数据通过通信总线403通信。计算机系统400还包括计算机可读存储设备402,比如随机访问存储器(RAM),用于处理器401的软件和数据在运行期间可以驻留于其中。存储设备402也可以包括非易失性数据存储。计算机系统400可以包括网络接口404用以连接至网络。对本领域普通技术人员来说,易见的是,其他已知的电子组件可以被加入或者替代至计算机系统400之中。

另外,在此阐述的系统和方法通常是出于有机搜索目的、为优化网站而就修改web页面和web对象方面进行描述的。然而,这些系统和方法适用于针对网站以外的其他构造类型而修改其他元素。

尽管本发明的实施例已经通过参考示例来描述,但是在不背离如下文权利要求书所描述的实施例的范围及其等价形式的前提下,本领域技术人员可以对所描述的实施例进行各种修改。

用于有机搜索优化的网站修改系统.pdf_第1页
第1页 / 共18页
用于有机搜索优化的网站修改系统.pdf_第2页
第2页 / 共18页
用于有机搜索优化的网站修改系统.pdf_第3页
第3页 / 共18页
点击查看更多>>
资源描述

《用于有机搜索优化的网站修改系统.pdf》由会员分享,可在线阅读,更多相关《用于有机搜索优化的网站修改系统.pdf(18页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN102004757A43申请公布日20110406CN102004757ACN102004757A21申请号201010510627322申请日2010081361/238,38820090831USG06F17/3020060171申请人埃森哲环球服务有限公司地址爱尔兰都柏林72发明人AP卡梅尔SD基尔克贝P克莱特H菲利普斯A琼斯K万德伯加特JA库恩斯74专利代理机构北京市金杜律师事务所11256代理人酆迅李峥宇54发明名称用于有机搜索优化的网站修改系统57摘要本发明涉及用于有机搜索优化的网站修改系统。具体地,涉及一种用于修改网站以针对主题有机搜索而优化网站的主题有机搜索的。

2、系统。该系统包括数据管理模块,配置用于接收主题的搜索项,接收用于主题的搜索项的相关项,和以及接收网站输入数据。该系统还包括扫描模块,配置用于扫描和索引网站中的WEB页面和WEB对象,和以及识别与搜索项和相关项有关相关联的WEB页面和WEB对象的子集。该系统还包括优化模块,配置用于通过对WEB页面和WEB对象的子集确定优先级,或针对WEB页面和WEB对象的子集测量度量,来处理来自网站的WEB页面和WEB对象的子集。根据处理,将搜索项和相关项部署到网站上的WEB页面和WEB对象的子集中。30优先权数据51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书3页说明书8页附图6页CN。

3、102004770A1/3页21一种配置用于修改网站以针对主题有机搜索而优化所述网站的系统,所述系统包括数据管理模块,配置用于接收所述主题的搜索项,接收用于所述主题的所述搜索项的相关项,以及接收网站输入数据,其中,所述网站输入数据识别来自所述网站的WEB页面和WEB对象;扫描模块,配置用于扫描和索引所述网站中的所述WEB页面和WEB对象,以及识别与所述搜索项和所述相关项相关联的WEB页面和WEB对象的子集;以及优化模块,由计算机系统执行并配置用于通过对WEB页面和WEB对象的所述子集确定优先级、或者针对WEB页面和WEB对象的所述子集测量度量,处理来自所述网站的WEB页面和WEB对象的所述子集。

4、,以及根据所述处理,将所述搜索项和相关项部署到所述网站上的WEB页面和WEB对象的所述子集中。2根据权利要求1所述的系统,进一步包括测试模块,配置用于测试所述网站上的WEB页面的所述子集,以识别所述网站上的所述搜索项和相关项中的差距。3根据权利要求1所述的系统,其中,所述度量包括准确性度量,以及所述优化模块通过验证所述搜索项或相关项中的至少一个出现在WEB页面的所述子集的每一个WEB页面上,来测量所述网站的所述准确性度量。4根据权利要求1所述的系统,其中,所述度量包括对准度量,以及所述优化模块通过评估所述搜索项或相关项跨越WEB页面的所述子集的WEB页面属性集中的一致性应用,来测量所述网站的所。

5、述对准度量。5根据权利要求1所述的系统,其中,所述度量包括完整性度量,以及所述优化模块通过确定具有唯一标题的WEB页面的所述子集的数量,来测量所述网站的所述完整性度量。6根据权利要求1所述的系统,其中,所述优化模块配置用于根据WEB页面与网站主页或其他指明网站登录页面的接近程度以及根据网站目录结构中的至少一个,对所述WEB页面的所述子集确定优先级。7根据权利要求7所述的系统,其中,所述优化模块配置用于对于具有较高优先级的所述WEB页面,以较大数量部署所述搜索项和所述相关项。8根据权利要求1所述的系统,其中,所述扫描模块配置用于通过对所述经索引的WEB页面和WEB对象与所述搜索项和所述相关项进行。

6、比较,识别来自所述网站的WEB页面和WEB对象的所述子集。9一种用于修改网站以针对主题有机搜索而优化所述网站的方法,所述方法包括接收所述主题的搜索项,接收用于所述主题的所述搜索项的相关项,以及接收网站输入数据,其中,所述网站输入数据包括来自所述网站的WEB页面和WEB对权利要求书CN102004757ACN102004770A2/3页3象;扫描和索引所述网站中的所述WEB页面和WEB对象,以及识别与所述搜索项和所述相关项相关联的WEB页面和WEB对象的子集;通过对WEB页面和WEB对象的所述子集确定优先级、或者针对WEB页面和WEB对象的所述子集测量度量,由计算机系统处理来自所述网站的WEB页。

7、面和WEB对象的所述子集,以及根据所述处理,将所述搜索项和相关项部署到所述网站上的WEB页面和WEB对象的所述子集中。10根据权利要求9所述的方法,所述方法进一步包括测试所述网站上的WEB页面的所述子集,以识别所述网站上的所述搜索项和相关项中的差距。11根据权利要求9所述的方法,其中,所述度量包括准确性度量,以及其中所述处理包括通过验证所述搜索项或相关项中的至少一个出现在WEB页面的所述子集的每一个WEB页面上,来测量所述网站的所述准确性度量。12根据权利要求9所述的方法,其中,所述度量包括对准度量,以及其中所述处理包括通过评估所述搜索项或相关项跨越所述WEB页面的相关子集的WEB页面属性集的。

8、一致性应用,来测量所述网站的所述对准度量。13根据权利要求9所述的方法,其中,所述度量包括完整性度量,以及其中所述处理包括通过确定具有唯一标题的WEB页面的相关子集的数量,来测量所述网站的所述完整性度量。14根据权利要求9所述的方法,其中,所述处理包括根据WEB页面与网站主页或其他指明网站登录页面的接近程度以及根据网站目录结构中的至少一个,对所述WEB页面的所述子集确定优先级。15根据权利要求9所述的方法,其中,所述部署包括对于具有较高优先级的所述WEB页面,以较大数量部署所述搜索项和所述相关项。16根据权利要求9所述的方法,其中,所述识别包括通过对所述经索引的WEB页面和WEB对象与所述搜索。

9、项和所述相关项进行比较,识别来自所述网站的WEB页面和WEB对象的所述子集。17一种用于修改网站以针对主题有机搜索而优化所述网站的设备,所述设备包括用于接收所述主题的搜索项的装置,用于接收用于所述主题的所述搜索项的相关项的装置,以及用于接收网站输入数据的装置,其中,所述网站输入数据包括来自所述网站的WEB页面和WEB对象;用于扫描和索引所述网站中的所述WEB页面和WEB对象的装置,以及用于识别与所述搜索项和所述相关项相关联的WEB页面和WEB对象的子集的装置;用于通过对WEB页面和WEB对象的所述子集确定优先级、或者针对WEB页面和WEB对权利要求书CN102004757ACN10200477。

10、0A3/3页4象的所述子集测量度量,处理来自所述网站的WEB页面和WEB对象的所述子集的装置,以及用于根据所述处理,将所述搜索项和相关项部署到所述网站上的WEB页面和WEB对象的所述子集中的装置。18根据权利要求17所述的设备,其中,所述度量包括准确性度量,以及所述设备包括用于通过验证所述搜索项或相关项中的至少一个出现在WEB页面的所述子集的每一个WEB页面上,来测量所述网站的所述准确性度量的装置;以及用于生成包括所述经测量的准确性度量的报告的装置。19根据权利要求17所述的设备,其中,所述度量包括对准度量,以及所述设备包括用于通过评估所述搜索项或相关项跨越所述WEB页面的相关子集的WEB页面。

11、属性集的一致性应用,来测量所述网站的所述对准度量的装置。20根据权利要求17所述的设备,其中,所述设备包括用于为所述网站测量对准度量的装置,其中,为所述网站测量对准度量包括,评估所述搜索项或相关项跨越来自所述网站的页面和WEB对象的相关子集的页面属性集的一致性应用。权利要求书CN102004757ACN102004770A1/8页5用于有机搜索优化的网站修改系统0001优先权0002本申请要求美国临时专利申请序列号为NO61/238,388的优先权,该申请于2009年8月31日提交,名称为“PRECISEORGANICDEPLOYMENTFORSEARCHENGINEOPTIMIZATION用。

12、于搜索引擎优化的精确有机部署”,申请人为KAMEL等,通过引用将其整体结合于此。技术领域0003本申请涉及用于有机搜索优化的网站修改系统。背景技术0004搜索所驱动的消费者的流量是潜在的在线销售的重要资源。比如说,像GOOGLE、YAHOO、BING、BAIDU中国搜索引擎以及其他的搜索引擎经常被用于找寻关于产品、服务以及感兴趣主题的信息。用户可能会基于有机搜索结果对网站的排名的驱使,而去往特定的网站。有机搜索结果是搜索引擎结果的列表,该搜索引擎结果的列表的出现是因为它们与搜索项有关而不是基于其他标准可以显示的广告。典型地,如在WEB页面上所示出,广告显示在所显示的有机搜索结果的一侧上。000。

13、5比如,一个公司有兴趣通过因特网提升高清平板电视的销售,其目标在于,保证它的网站或者统一资源定位符URL响应于查询周边相关项的消费者搜索,在其他相关目标之中由主流搜索引擎显示出更为显著的特征。以通过因特网而以高清平板电视为主题的搜索项示例可以包括诸如如下搜索项,平板、高清电视HDTV、等离子、液晶显示器LCD。该公司希望,如果这些搜索项中的任何一个被使用,则该公司的URL应该在搜索结果中具有高的排名,因而该公司的URL就会在由搜索引擎所返回的搜索结果列表上显示较高排名。0006为了达到搜索结果中的高排名,公司选择他们认为消费者在执行对特定产品、服务或信息化分类进行在线搜索时会使用的相关搜索项。。

14、已经选择了这些搜索项以后,这些公司继而努力地确保那些相关项被有效地部署在整个网站中,包括页面内容包括页面标题、子标题或H1/H2标签、和页面主体内容、相关联的元数据或关于该内容的描述,包括元描述、元关键字,以及包括链接内文本、URL文本和相关文档属性的其他页面特征。0007通过在网站中相应地部署选择项,当以搜索引擎内容分类为目的而爬取和索引网站时,搜索引擎就更可能有效地解译内容的本质。简单而言,当搜索引擎对网站内容编制索引时,就更可能识别搜索项的一致存在,并且因此将该搜索项与相应的内容和相关的网站或URL相关联。结果是,响应于利用那些搜索项搜索时,相应的URL出现的几率就会增加。这就提升了网站。

15、或URL在搜索排名或与这些搜索相关联的所呈现URL列表中的排名,因此能够使得与这些分类相关联的消费者的流量增加。0008虽然搜索引擎优化已经成为一种重要的实践,但是它仍然不够准确并缺乏精度,尤其是对于大型动态网站。在相关产品、服务、或信息化分类方面,提高改进引擎排名和搜索驱动的流量常常不够有效。这是因为,虽然理论相当简单,但是优化有机搜索能力实践的说明书CN102004757ACN102004770A2/8页6有效执行是复杂的。一旦选择了相关搜索项,就可能难以识别给定网站中相应的相关页面和页面上的关键位置,以使得搜索项的密度最大化,尤其是如果谈及网站是大型的也即,包含许多页面、文档、和其他对象。

16、并且动态的也即,网站内容随着时间频繁变化。在与谈及主题或分类相关的大型和动态网站中识别和优化那些页面和页面位置的任务具有巨大的挑战。在与谈及主题或分类不相关或不密切的页面或页面位置上部署所选择的搜索项不会达到有用的目的,并且事实上可能导致市场混乱。发明内容0009根据一个实施例,一种系统被配置用于修改网站以针对主题的有机搜索而优化该网站。该系统包括数据管理模块,配置以接收主题的搜索项,接收主题的搜索项的相关项,并且接收网站输入数据,其中,网站输入数据包括来自网站的WEB页面和WEB对象。系统还包括扫描模块,配置以在网站中扫描和索引WEB页面和WEB对象,并且识别与搜索项和相关项相关联的WEB页。

17、面和WEB对象的子集。系统还包括优化模块,由计算机系统操作,配置以通过对WEB页面和WEB对象的子集确定优先级,或针对WEB页面和WEB对象的子集测量度量,而处理来自网站的WEB页面和WEB对象的子集,并且基于处理部署搜索项和相关项到网站上的WEB页面和WEB对象的子集中。0010根据另一个实施例,该系统包括数据存储设备,配置以存储主题的搜索项、主题的搜索项的相关项、以及包括来自网站的WEB页面和WEB对象的网站输入数据。系统还包括处理器,配置以在网站中扫描和索引WEB页面和WEB对象,识别与搜索项和相关项相关联的WEB页面和WEB对象的子集,通过对WEB页面和WEB对象的子集确定优先级,或者。

18、针对WEB页面和WEB对象的子集测量度量,处理来自网站的WEB页面和WEB对象的子集,以及基于处理部署搜索项和相关项到网站上的WEB页面和WEB对象的子集中。0011根据另一个实施例,一种修改网站以针对主题有机搜索而优化网站的方法,包括接收主题的搜索项,接收主题的搜索项的相关项,并且接收网站输入数据,其中,网站输入数据包括来自网站的WEB页面和WEB对象。方法还包括在网站中扫描和索引WEB页面和WEB对象,并且识别与搜索项和相关项相关联的WEB页面和WEB对象的子集。方法还包括通过对WEB页面和WEB对象的子集确定优先级,或者针对WEB页面和WEB对象的子集测量度量,处理来自网站的WEB页面和。

19、WEB对象的子集,并且基于处理部署搜索项和相关项到网站上的WEB页面和WEB对象的子集中。方法可以由计算机系统执行,计算机系统执行存储于非临时性计算机可读介质上的计算机可读指令。附图说明0012在下文的说明书中,参考附图对本发明的实施方式进行详细说明。0013图1示出根据一个实施例的有机搜索优化OSO系统图;0014图2A至图2C示出根据不同实施例的OSO系统的截图;0015图3示出根据一个实施例使用图1所示的OSO系统的、网站的有机搜索优化方法流程图;以及0016图4示出根据一个实施例的计算机系统图,该计算机系统配置以为附图1中所示的OSO系统提供硬件平台。说明书CN102004757ACN。

20、102004770A3/8页7具体实施方式0017出于简明和示意目的,通过主要涉及其示例的方式描述实施例的原理。在下面的说明中,提出了许多特定细节为实施例提供透彻的理解。但是,对于本领域普通技术人员来说,很明显实施例可以不限于这些特定细节而被实施。在某些实例中,没有详细描述公知的方法和结构以避免混淆实施例。此外,下面描述了不同的实施例。不同实施例可以以不同方式结合使用或实现。00181概述0019根据实施例,公开了修改网站包括大型和/或动态网站的系统和方法而用于搜索引擎优化。利用网站的搜索项和相关项的输入,该系统识别相应的相关页面,以及可选地,在给定网站中的页面上的关键位置,以使得这些项在网站。

21、中所选择的页面和页面位置上的密度最大化。如果网站是大型的也即,包含许多页面、文档、和其他对象和/或动态的也即,网站内容随时间频繁变化则尤其有效。大型网站可能包括数百或甚至数千个页面,并且是在动态网站中,动态网站中的关键页面的内容部分通常每月或每周更新,甚至更频繁,如每天、每小时或每分钟地更新。应当注意,系统和方法可以优化任何大小的网站,不管是大型的或是小型的,并且可以优化动态的或是静态的网站。优化包括在与谈及的主题或分类相关的整个网站中识别页面和页面位置,并且在与谈及的主题或分类有关或密切相关的那些页面和页面位置上部署所选择的搜索项和相关项。这就改进了网站的有机搜索排名结果。00202系统00。

22、21根据一个实施例,有机搜索优化OSO系统被配置以优化网站,以改进针对主题的有机搜索结果中的网站排名。OSO系统增强具有实质上是动态的WEB页面和WEB对象的网站的有机搜索结果排名,其可以包括对WEB页面的周期变化。主题可以是分类、标题、问题、产品等。WEB页面可以是能够通过因特网访问的文档或资源,并且网站可以包括一组WEB页面。WEB对象可以是关于网站的文档或者其他信息单元。WEB对象的示例包括但不限于纯文本、超文本、图像、音频、视频和其他多媒体对象,以及可执行应用。WEB对象可以是驻留在主管网站的机器上的二进制文件或数据库条目,或者在需要时可以由网站动态生成。0022图1示出根据一个实施例。

23、的OSO系统100。OSO系统100包括数据存储105、扫描模块101、优化模块102、数据管理模块103以及测试模块104。OSO系统100中的这些模块可以是单独的模块,或者也可以在OSO系统100中结合一个或多个模块。模块可以是软件、计算机硬件、或者硬件和软件的结合。数据存储105可以包括数据库或其他类型的数据存储系统,并且可以包括一个或多个数据存储设备。0023如上所述,OSO系统100针对有机搜索而优化网站。OSO系统100确定可能与特定主题相关的搜索项。可以通过用户或另一个系统为OSO系统100提供搜索项。搜索项如附图1中所示的搜索项106。由于搜索项106与搜索项的主题相关,因而选。

24、择它们来修改网站以改进网站的有机搜索能力。有机搜索能力可以包括驱动网站WEB流量的效果。有机搜索能力受许多因素驱动,包括反映消费者针对特定主题的搜索行为的搜索项的正确选择;在相关WEB页面上的搜索项部署的密度或频率和接近程度;以及搜索项跨越那些相关页面的各种页面属性的一致对准,包括页面标题、元描述、元关键字、H1标签、URL、链接内文说明书CN102004757ACN102004770A4/8页8本和文档性质。0024除了针对主题的搜索项106,还可以确定与主题相关的一个或多个相关项107。例如假设主题是高清平板电视。相关项107可以不具体描述高清平板电视这一主题,但是仍然应该被认为有益于吸引。

25、对该主题感兴趣的流量至该网站。本示例中的相关项107可以包括电子产品、家庭娱乐、电影、视频系统,等等。在数据管理模块103处接收主题的搜索项106和相关项107。并且还可以将搜索项106和相关项107存入数据存储105中。0025扫描模块101扫描网站如网站110,以确定输入数据108。输入数据108可以包括WEB页面、WEB对象和相关联的元数据。元数据还可以描述网站结构。其可以包括网站110中的WEB页面的层次结构。例如,主页可以为根,而其他WEB页面根据它们之间彼此的关系和/或与根之间彼此的关系形成分支而扩展。元数据还可以描述网站活动性,例如与WEB页面的交互用户行为的类型。描述WEB对象。

26、和WEB页面的输入数据108可以包括WEB对象和WEB页面的属性,如标题、文件名、图片分辨率等。输入数据108可以由扫描模块101执行的网站110的扫描以外的其他资源确定。数据管理模块103可以将输入数据108存入数据存储105。0026由扫描模块101执行的扫描可以包括扫描网站上所有页面和内容,并且继而利用输入数据108索引经扫描的网站110的WEB页面和WEB对象。扫描模块101从网站110收集在WEB页面中可获得的、描述WEB页面和WEB对象的元数据。WEB爬取器可以用于从WEB页面中的XML或HTML收集可用的元数据和其他数据。然后,扫描模块101从网站110标识所扫描的WEB页面和W。

27、EB对象的子集,该WEB页面和WEB对象与搜索项106和相关项107具有一定程度或尺度的关联。比如,这可以通过对经索引内容相对于所选择的搜索项和相关项的上下文分析或比对分析来实现。该扫描还可以识别可以在WEB页面和WEB对象中的何处找到选择项的位置。扫描模块101然后索引关于主题网站中的所有内容,包括每个页面上的包含主体内容和元数据属性在内的所有文本。0027OSO系统100允许输入选择的搜索项以及有助于识别与那些感兴趣项相关联的页面的任何有关项。OSO系统100然后搜索扫描页,以识别包含一个或多个指定项的任意和所有实例。该扫描还可以识别在WEB页面和WEB对象中的何处找到选择项的位置。例如,。

28、扫描模块101确定在WEB对象或WEB页面中是否存在任何搜索项106或相关项107如果存在,则对WEB对象或WEB页面加标签使其包含在子集中。标签可以是与用于WEB对象或WEB页面的输入数据一起存储的标志,其能够被OSO系统100的模块所识别。0028在扫描模块101识别与搜索项106和相关项107相关联的WEB页面和WEB对象的子集后,优化模块102根据一个或多个度量处理WEB页面和WEB对象的子集,以识别网站110中WEB页面和WEB对象的子集中的搜索项106和相关项107的部署中的差距GAP。差距为从WEB页面、WEB对象、或WEB页面或WEB对象上的位置中缺少的一个或多个搜索项106或。

29、相关项107的实例。根据上述度量确定WEB对象或WEB页面缺少搜索项或相关项的确定,也即差距。0029确定差距和优化WEB页面的度量可以包括准确性、对准ALIGNMENT和完整性。优化模块102测量这些度量。在测量准确性度量时,优化模块102扫描所识别的WEB页面和WEB对象的子集,以确定在由扫描模块101识别的子集中,是否存在至少一个搜索项或相关项出现在网站110的每一个WEB页面和WEB对象中。说明书CN102004757ACN102004770A5/8页90030准确性度量确定,是否每一个WEB页面或WEB对象具有至少一个所选择的搜索项或相关项出现在WEB页面上或WEB对象中的任何地方,。

30、虽然不同搜索项或相关项可以出现在子集的不同WEB页面或WEB对象上以满足该度量。例如,对于高清平板电视这个主题,优化模块102确定包括平板或高清电视的任何项是否都在WEB页面的子集中。针对一个特定主题集合或产品分类给出一个特定的搜索项或相关项的集合,该度量验证至少一个此类搜索项或相关项出现在WEB页面的每一个相关子集中。0031搜索项106和相关项107可以由系统、专家确定或者由其他源来提供。WEB页面的相关子集通过网站索引确定,以识别反映与相关分类、主题、产品集等相适应的内容的WEB页面子集。识别WEB页面的相关子集后,报告确认搜索项或相关项在WEB页面上出现,并且识别那些缺少相应搜索项或相。

31、关项的相关WEB页面。0032WEB索引可以包括测量性能驱动。驱动的示例包括搜索项或相关项的使用也即,该项是否在每一个WEB页面上;搜索项或相关项的密度,以及在由此类指明搜索项或相关项的一致性部署所反映的指明页面属性中的适当对准。0033对准度量测量搜索项106和相关项107跨越页面和WEB对象的子集的属性中的一致性应用。例如,优化模块102确定平板或高清电视的项在每一个WEB页面和WEB对象的子集中,是否出现在超文本标记语言HTML结构的相同的或相关位置,如HTML标题或HTML块引用。对准度量还确定在子集的每一个WEB页面和WEB对象中,至少有一个搜索项或相关项一致性地出现在相同或相关的结。

32、构化位置上。0034如同在搜索准确性度量的情况,对准度量基于特定主题/内容或分类,评估跨越网站WEB页面的相关子集的WEB页面属性集合的、指明搜索项或相关项的一致性应用。为了使效果最大化,指定指明搜索项或相关项集合,并且在扫描模块101在主题网站上索引所有内容包括每个页面上的包含主体内容和元数据属性的所有文本后,基于上下文的扫描识别相关WEB页面集合。0035在这些情况下,对准度量识别并报告具有对准问题的页面,也即,不存在至少一个指明关键字跨越各种页面属性始终出现,该页面属性包括页面标题、URL、元描述、元关键字、H1标签、链接内文本、文档性质和主体内容。0036在缺少指定的搜索项或相关项、并。

33、缺少相应相关页的识别的情况下,报告基于现有的标题项识别未对准的页面。针对可以影响正确的网站索引、信息可检索性以及自然或有机搜索能力的内容和其他结构化执行属性,在分析中包括了三个基本的性能驱动A指明高产项的适当部署;B指明项的密度;以及C由此类指明项的一致性部署所反映的指明页面属性之间的适当对准。搜索对准通过度量至少一个指明搜索项或相关项跨页面属性集的一致性出现,来评估不同页面属性之间对准的程度,该页面属性包括页面标题、URL、元关键字、元描述、H1标签、链接内文本、文档性质以及主体内容。0037完整性度量确定在具有唯一标题的子集中WEB页面和WEB对象的数量。WEB页面或WEB对象的标题可以是。

34、与WEB页面或WEB对象相关联的标题或其他标签。WEB页面或WEB对象的标题在因特网上起到许多不同作用。因为这些不同作用,使得以有机搜索优化为目地的WEB页面或WEB对象具有唯一的标题。标题的一个作用是由主要搜索引擎用来作为关键信息以确定WEB页面的主题,并且因此确定WEB页面在搜索引擎结果中的排名。0038优化模块102生成包括度量的测量值的输出数据109。准确性度量的测量值包括说明书CN102004757ACN102004770A6/8页10子集中具有至少一个搜索项或相关项的WEB页面和WEB对象的数量。准确性度量还可以指示在子集中是否有WEB页面和WEB对象缺少搜索项或相关项。将这些WE。

35、B页面和WEB对象视为差距。0039对准度量的测量值包括子集中具有至少一个搜索项或相关项出现在相同或相关HTML结构中的WEB页面和WEB对象的数量。准确性度量还指示在子集中是否有任一WEB页面和WEB对象在HTML结构中缺少搜索项或相关项。完整性度量的测量值包括在子集中具有唯一标题的WEB页面和WEB对象的数量。0040优化模块102使用输出数据109来优化网站110,以改进其在有机搜索结果中的排名。例如,基于在准确性中识别的差距的输出数据,为被识别为缺少搜索项或相关项的WEB页面提供搜索项或相关项。网站优化包括识别差距和在差距中插入搜索项和/或相关项。优化还包括,基于对准度量在HTML结构。

36、中插入搜索项和/或相关项。例如,修改图片WEB对象HTML结构比如标题以使其包括搜索项或相关项。优化还包括修改标题,以使得针对完整性度量确定的唯一标题的数量超过阈值。0041优化还可以包括对相关页面进行处理,比如确定优先级,以便于所选择的搜索相关项在页面内容、元内容等中的部署。例如,根据访问由WEB分析或流量报告所确定的页面的流量,或根据页面与主页或其他指明登录页面的接近程度,或根据目录结构、业务或部门划分等,确定页面的优先级或对其进行分组。0042部署搜索项和相关项到网站上的WEB页面和WEB对象的子集中,修改网站以将其优化用于针对主题的有机搜索结果中的出现。根据一个实施例,优化模块102为。

37、具有较高优先级的确定优先级的WEB页面和WEB对象大量部署搜索项和相关项。优化模块102可以使用除前面描述的那些优化度量以外的度量。0043在将搜索项和相关项部署到网站以后,OSO系统100的测试模块104对网站进行测试,以识别网站上搜索项和相关项的部署中的差距。另外,OSO系统100的测试模块104随后可以周期性地测试网站,以识别网站中的新差距,该差距涉及与网站上的搜索项和相关项相关联的主题。00443截图0045如上针对OSO系统100所述,可以修改网站如网站110以对其进行优化,使其在针对主题的有机搜索的搜索结果中实现更高排名。可以对经优化的网站进行测试,以识别WEB页面上搜索项和相关项。

38、的部署中的差距。下面提供的截图阐明了自动报告属性和阈值,以帮助识别网站属性中的差距和确定其优先级,这些差距包括搜索项或相关项的布局中的差距,对这些差距进行处理以优化网站在针对主题的有机搜索结果中的出现。0046图2A图示了描述搜索准确性度量的搜索准确性概要报告200的截图。准确性度量处理结果201显示,WEB页面的相关子集中的189没有搜索项或相关搜索项。使用评分图例202来快速识别准确性度量。在评分图例202中,第一种颜色表示超过20的相关页面中没有至少一个指明的搜索项或相关项,第二种颜色表示1020的相关WEB页面没有至少一个指明的搜索项或相关项,而第三种颜色表示010的相关页面没有至少一。

39、个指明的搜索项或相关项。在203处,报告显示了搜索项和相关项,并且进一步将这些项细分为多个分类,以更精确更详细地报告每一个分类中的项,如204所示。0047图2B图示了由分类报告210作出的搜索准确性结果的截图。该结果指示网站中说明书CN102004757ACN102004770A7/8页11哪些指定页面包括为每个分类指定的搜索项和相关项,哪些页面不包括。报告210的部分211列出了网站中的12个WEB页面,这些页面不包括与电池相关的分类1的搜索项和相关项。部分212显示了由网站中的4个WEB页面上识别的分类1的搜索项和相关项。0048图2C图示了搜索对准概要报告220的截图。结果221显示W。

40、EB页面中37的相关子集没有包括搜索项或相关项的属性例如HTMLWEB页面标题。可以类似于图2A中的图例而使用图例222。报告的部分223显示WEB页面的其他属性的实例,以及这些属性是否包括搜索项或相关项。00494方法0050图3示出了根据一个实施方式的为有机搜索优化网站的方法300。这种优化改进网站包括在一个主题的搜索结果中的概率,也可以改进该网站在搜索结果中的排名。通过示例而非限定性方式,针对图1示出的OSO系统100而描述这些方法。该方法可以在其他系统中执行。方法中的步骤可以以不同的顺序执行,或者其中的一个或者多个步骤可以省略。0051在步骤301中,针对主题而确定搜索项106和相关的。

41、搜索项107。比如,在线销售平板电视的公司可以将平板、等离子、LCD、HDTV识别为他们选择的搜索项。可以执行市场分析确定最相关的搜索项,来识别关于平板电视的信息。这些选择的搜索项由公司或者代理比如埃森哲战略搜索分析提供给有机搜索优化系统。0052在步骤302中,待优化的网站被扫描,而它的WEB页面和WEB对象被OSO系统100中的扫描模块101索引。网站上的WEB页面和WEB对象也可以通过使用所选择搜索项和相关项被索引。索引可以包括按照分类或者搜索项索引WEB对象和WEB页面。0053在步骤303中,OSO系统100中的扫描模块101识别来自网站的WEB页面和WEB对象的相关子集,其与所选择。

42、搜索项和识别的相关项关联。比如说这可以通过上下文分析或者索引内容和选择搜索项以及相关项的对比分析来实现。这种扫描也可以识别在WEB页面和WEB对象上的何处找到选择项的位置。例如,扫描模块101可以索引主题网站上的所有内容,包括每个页面上的、包括主体内容和元数据属性的所有文本。OSO系统100允许选择的搜索项以及有助于识别与那些项相关联页面的任何感兴趣的相关项。OSO系统100继而搜索扫描页面,以识别任何以及所有包含一个或多个指定项的实例。0054在步骤304中,OSO系统100中的优化模块102处理在步骤303中识别的页面和对象的子集,以确定对于WEB对象、WEB页面和对象以及WEB页面的元数。

43、据的修改。优化模块102所做的处理可以包括用于网站的测量度量比如网站的精确度、对准和完整性,和/或基于预定的尺度确定WEB页面和WEB对象的优先级。比如,页面可以通过如下方式被设定优先级或分组基于相关访问流量如通过WEB分析和流量报告确定,或基于与主页或者其他指明登录页面的接近程度,或基于目录结构、业务或部门划分,等等。0055在步骤305中,OSO系统100中的优化模块102部署所选的搜索项,而相关项基于步骤304处理而在页面和对象子集中被部署,从而决定优化网站的修改。举例来说,处理可以确定页面子集的优先级。具有较高优先级的页面可以在它们的内容和元数据方面接受更大数量的选择搜索项和相关项。0。

44、056在步骤306中,OSO系统100中的测试模块104测试优化的网站,以识别WEB页面上搜索项和相关项的部署中的任何差距。这种测试可以周期性地重复,和/或被包含在自说明书CN102004757ACN102004770A8/8页12动质量和一致性管理过程中,该过程扫描正在进行的质量控制并识别与搜索项和相关项指明集合相对应的WEB页面子集。这种处理执行异常测试,以便识别和强调在页面和元数据内容的项部署中的不足。同样,方法300中的一个或多个步骤可能被重复,从而持续性地或周期性地为所识别项而优化网站。00575执行软件的计算机系统0058在此描述的一个或多个步骤和功能、以及在此所述的一个或多个该系。

45、统的组件可以作为计算机代码被实现,这些计算机代码包括存储在计算机可读存储设备比如存储器和其他形式的存储设备上的计算机可读指令。这些计算机代码在计算机系统诸如下文所述的计算机系统400上,由处理器诸如专用集成电路ASIC或者其他类型的电路而执行。这些代码可以作为软件程序存在,该软件程序包括以源代码、目标代码、可执行代码或者其他格式代码中的程序指令。0059图4示出了可以作为OSO系统100的硬件平台的计算机系统400。计算机系统400可以作为平台用于执行在此描述的一个或多个步骤、方法以及功能;这些步骤、方法和功能可以实现为在一个或多个计算机可读存储设备作为硬件存储设备上存储的软件。0060计算机。

46、系统400包括处理器401或者是处理电路,其可以实现或者执行软件指令,从而执行在此描述的某些或全部方法、功能以及其他步骤。来自处理器401的命令和数据通过通信总线403通信。计算机系统400还包括计算机可读存储设备402,比如随机访问存储器RAM,用于处理器401的软件和数据在运行期间可以驻留于其中。存储设备402也可以包括非易失性数据存储。计算机系统400可以包括网络接口404用以连接至网络。对本领域普通技术人员来说,易见的是,其他已知的电子组件可以被加入或者替代至计算机系统400之中。0061另外,在此阐述的系统和方法通常是出于有机搜索目的、为优化网站而就修改WEB页面和WEB对象方面进行。

47、描述的。然而,这些系统和方法适用于针对网站以外的其他构造类型而修改其他元素。0062尽管本发明的实施例已经通过参考示例来描述,但是在不背离如下文权利要求书所描述的实施例的范围及其等价形式的前提下,本领域技术人员可以对所描述的实施例进行各种修改。说明书CN102004757ACN102004770A1/6页13图1说明书附图CN102004757ACN102004770A2/6页14图2A说明书附图CN102004757ACN102004770A3/6页15图2B说明书附图CN102004757ACN102004770A4/6页16图2C说明书附图CN102004757ACN102004770A5/6页17图3说明书附图CN102004757ACN102004770A6/6页18图4说明书附图CN102004757A。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1