一种基于搜索引擎的网站优化建设方法.pdf

摘要
申请专利号：	CN201310250266.7	申请日：	2013.06.21
公开号：	CN104239358A	公开日：	2014.12.24
当前法律状态：	撤回	有效性：	无权
法律详情：	发明专利申请公布后的视为撤回IPC(主分类):G06F 17/30申请公布日:20141224\|\|\|公开
IPC分类号：	G06F17/30	主分类号：	G06F17/30
申请人：	镇江新晔网络科技有限公司
发明人：	江萍
地址：	212000 江苏省镇江市润州区官塘桥街道张家湾53号
优先权：
专利代理机构：		代理人：
PDF下载：	PDF下载

内容摘要

本发明公开了一种基于搜索引擎的网站优化建设方法，首先对网页的结构进行处理改进，来区别被转载网页容器的层级结构；然后把最主要、最核心的主题放在最浅的层；再提取网页的核心主题作为简介，以达到比被转载网页质量更高。本发明的优点是在转载他人新闻或者网页的时候，只需要做到比该网站的网页内容更加丰富，网页内容质量更高，那么就能解决转载不被收录的问题，同时也能获得比“原创”更好的排序结果，达到优化网站建设的目的。

权利要求书

权利要求书
1.  一种基于搜索引擎的网站优化建设方法，其特征在于：首先对网页的结构进行处理改进，来区别被转载网页容器的层级结构；然后把最主要、最核心的主题放在最浅的层；再提取网页的核心主题作为简介，以达到比被转载网页质量更高。

2.  根据权利要求1所述的一种基于搜索引擎的网站优化建设方法，其特征在于：对网页的结构进行处理改进方式为修改容器的层次和结构。

3.  根据权利要求1所述的一种基于搜索引擎的网站优化建设方法，其特征在于：所述最主要、最核心的主题为标题。

说明书

说明书一种基于搜索引擎的网站优化建设方法
技术领域
本发明涉及一种互联网网站开发建设方法。
背景技术
互联网是由社会上多个个人和集体在网上发布各类信息内容并为用户提供了在线阅读和下载渠道，最常见的一种例子就是新闻服务类网站。这类网站的信息基本都是一致的，他们之间互相转载、复制。但是无论是人还是搜索引擎，都不希望看到过多的重复信息，这些信息太多了就成了垃圾信息，所以现在各类搜索引擎都会通过查重来删除大量的重复信息，导致很多网站转载别人的信息之后并没有被搜索引擎收录，甚至进入搜索引擎的黑名单。
发明内容
发明目的：针对上述问题，本发明的目的是提供一种基于搜索引擎的网站优化建设方法。
技术方案：一种基于搜索引擎的网站优化建设方法，首先对网页的结构进行处理改进，来区别被转载网页容器的层级结构；然后把最主要、最核心的主题放在最浅的层；再提取网页的核心主题作为简介，以达到比被转载网页质量更高。
对网页的结构进行处理改进方式为修改容器的层次和结构。
所述最主要、最核心的主题为标题。
有益效果：与现有技术相比，本发明的优点是在转载他人新闻或者网页的时候，只需要做到比该网站的网页内容更加丰富，网页内容质量更高，那么就能解决转载不被收录的问题，同时也能获得比“原创”更好的排序结果，达到优化网站建设的目的。
具体实施方式
下面结合具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
一种基于搜索引擎的网站优化建设方法，首先对网页的结构进行处理改进，例如修改容器的层次和结构，来区别被转载网页容器的层级结构；然后把最主要、最核心的主题放在最浅的层，例如标题放在最浅的层；再提取网页的核心主题作为简介，以达到比被转载网页质量更高，还可以增加心得或者网友评论，以及相关新闻链接，以达到比被转载网页质量更高。
例如，“北川县城8.5万件档案有望5日从废墟中挖掘完毕”这条新闻在网易、中华人民共和国政府网站的中国要闻频道等多个网站都完全引用了新华网的这条新闻。但是当我们搜索这条新闻的时候排在前列的居然没有出现新华网原创的这条新闻。而搜索引擎的排序规则中一条很重要的因素就是原创性，这之间是否矛盾？由此可以看出，搜索引擎无法判断到底哪些新闻是原创的，哪些新闻是转载的，即使上述两个网站都标注了来源于新华网，那么为什么其他人转载的时候就不会被收录，而有些网站转载就会被收录？甚至获得的排序结果高于原创新闻的排序结果。其实道理很简单，就是搜索引擎只能通过调用它的各类算法来计算哪些网页内容更加丰富，内容质量更高，然后综合计算后给出一个相对合理的排序结果。

资源描述

《一种基于搜索引擎的网站优化建设方法.pdf》由会员分享，可在线阅读，更多相关《一种基于搜索引擎的网站优化建设方法.pdf（4页珍藏版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 104239358 A (43)申请公布日 2014.12.24 CN 104239358 A (21)申请号 201310250266.7 (22)申请日 2013.06.21 G06F 17/30(2006.01) (71)申请人镇江新晔网络科技有限公司地址 212000 江苏省镇江市润州区官塘桥街道张家湾 53 号 (72)发明人江萍 (54) 发明名称一种基于搜索引擎的网站优化建设方法 (57) 摘要本发明公开了一种基于搜索引擎的网站优化建设方法，首先对网页的结构进行处理改进，来区别被转载网页容器的层级结构；然后把最主要、最核心的主题。

2、放在最浅的层；再提取网页的核心主题作为简介，以达到比被转载网页质量更高。本发明的优点是在转载他人新闻或者网页的时候，只需要做到比该网站的网页内容更加丰富，网页内容质量更高，那么就能解决转载不被收录的问题，同时也能获得比 “原创” 更好的排序结果，达到优化网站建设的目的。 (51)Int.Cl. 权利要求书 1 页说明书 2 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书1页说明书2页 (10)申请公布号 CN 104239358 A CN 104239358 A 1/1 页 2 1. 一种基于搜索引擎的网站优化建设方法，其特征在于。

3、：首先对网页的结构进行处理改进，来区别被转载网页容器的层级结构；然后把最主要、最核心的主题放在最浅的层；再提取网页的核心主题作为简介，以达到比被转载网页质量更高。 2. 根据权利要求 1 所述的一种基于搜索引擎的网站优化建设方法，其特征在于：对网页的结构进行处理改进方式为修改容器的层次和结构。 3. 根据权利要求 1 所述的一种基于搜索引擎的网站优化建设方法，其特征在于：所述最主要、最核心的主题为标题。权利要求书 CN 104239358 A 2 1/2 页 3 一种基于搜索引擎的网站优化建设方法技术领域 0001 本发明涉及一种互联网网站开发。

4、建设方法。背景技术 0002 互联网是由社会上多个个人和集体在网上发布各类信息内容并为用户提供了在线阅读和下载渠道，最常见的一种例子就是新闻服务类网站。这类网站的信息基本都是一致的，他们之间互相转载、复制。但是无论是人还是搜索引擎，都不希望看到过多的重复信息，这些信息太多了就成了垃圾信息，所以现在各类搜索引擎都会通过查重来删除大量的重复信息，导致很多网站转载别人的信息之后并没有被搜索引擎收录，甚至进入搜索引擎的黑名单。发明内容 0003 发明目的：针对上述问题，本发明的目的是提供一种基于搜索引擎的网站优化建设方法。 0004 技术方案：一种基于搜索引擎。

5、的网站优化建设方法，首先对网页的结构进行处理改进，来区别被转载网页容器的层级结构；然后把最主要、最核心的主题放在最浅的层；再提取网页的核心主题作为简介，以达到比被转载网页质量更高。 0005 对网页的结构进行处理改进方式为修改容器的层次和结构。 0006 所述最主要、最核心的主题为标题。 0007 有益效果：与现有技术相比，本发明的优点是在转载他人新闻或者网页的时候，只需要做到比该网站的网页内容更加丰富，网页内容质量更高，那么就能解决转载不被收录的问题，同时也能获得比 “原创” 更好的排序结果，达到优化网站建设的目的。具体实施方式 0008 下面结合。

6、具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。 0009 一种基于搜索引擎的网站优化建设方法，首先对网页的结构进行处理改进，例如修改容器的层次和结构，来区别被转载网页容器的层级结构；然后把最主要、最核心的主题放在最浅的层，例如标题放在最浅的层；再提取网页的核心主题作为简介，以达到比被转载网页质量更高，还可以增加心得或者网友评论，以及相关新闻链接，以达到比被转载网页质量更高。 0010 例如，“北川县城 8.5。

7、万件档案有望 5 日从废墟中挖掘完毕” 这条新闻在网易、中华人民共和国政府网站的中国要闻频道等多个网站都完全引用了新华网的这条新闻。但是当我们搜索这条新闻的时候排在前列的居然没有出现新华网原创的这条新闻。而搜索引擎的排序规则中一条很重要的因素就是原创性，这之间是否矛盾？由此可以看出，搜索引擎无说明书 CN 104239358 A 3 2/2 页 4 法判断到底哪些新闻是原创的，哪些新闻是转载的，即使上述两个网站都标注了来源于新华网，那么为什么其他人转载的时候就不会被收录，而有些网站转载就会被收录？甚至获得的排序结果高于原创新闻的排序结果。其实道理很简单，就是搜索引擎只能通过调用它的各类算法来计算哪些网页内容更加丰富，内容质量更高，然后综合计算后给出一个相对合理的排序结果。说明书 CN 104239358 A 4 。

展开阅读全文