《一种基于搜索引擎的网站优化建设方法.pdf》由会员分享,可在线阅读,更多相关《一种基于搜索引擎的网站优化建设方法.pdf(4页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 104239358 A (43)申请公布日 2014.12.24 CN 104239358 A (21)申请号 201310250266.7 (22)申请日 2013.06.21 G06F 17/30(2006.01) (71)申请人 镇江新晔网络科技有限公司 地址 212000 江苏省镇江市润州区官塘桥街 道张家湾 53 号 (72)发明人 江萍 (54) 发明名称 一种基于搜索引擎的网站优化建设方法 (57) 摘要 本发明公开了一种基于搜索引擎的网站优化 建设方法, 首先对网页的结构进行处理改进, 来区 别被转载网页容器的层级结构 ; 然后把最主要、 最核心的主题。
2、放在最浅的层 ; 再提取网页的核心 主题作为简介, 以达到比被转载网页质量更高。 本 发明的优点是在转载他人新闻或者网页的时候, 只需要做到比该网站的网页内容更加丰富, 网页 内容质量更高, 那么就能解决转载不被收录的问 题, 同时也能获得比 “原创” 更好的排序结果, 达到 优化网站建设的目的。 (51)Int.Cl. 权利要求书 1 页 说明书 2 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书1页 说明书2页 (10)申请公布号 CN 104239358 A CN 104239358 A 1/1 页 2 1. 一种基于搜索引擎的网站优化建设方法, 其特征在于 。
3、: 首先对网页的结构进行处理 改进, 来区别被转载网页容器的层级结构 ; 然后把最主要、 最核心的主题放在最浅的层 ; 再 提取网页的核心主题作为简介, 以达到比被转载网页质量更高。 2. 根据权利要求 1 所述的一种基于搜索引擎的网站优化建设方法, 其特征在于 : 对网 页的结构进行处理改进方式为修改容器的层次和结构。 3. 根据权利要求 1 所述的一种基于搜索引擎的网站优化建设方法, 其特征在于 : 所述 最主要、 最核心的主题为标题。 权 利 要 求 书 CN 104239358 A 2 1/2 页 3 一种基于搜索引擎的网站优化建设方法 技术领域 0001 本发明涉及一种互联网网站开发。
4、建设方法。 背景技术 0002 互联网是由社会上多个个人和集体在网上发布各类信息内容并为用户提供了在 线阅读和下载渠道, 最常见的一种例子就是新闻服务类网站。这类网站的信息基本都是一 致的, 他们之间互相转载、 复制。但是无论是人还是搜索引擎, 都不希望看到过多的重复信 息, 这些信息太多了就成了垃圾信息, 所以现在各类搜索引擎都会通过查重来删除大量的 重复信息, 导致很多网站转载别人的信息之后并没有被搜索引擎收录, 甚至进入搜索引擎 的黑名单。 发明内容 0003 发明目的 : 针对上述问题, 本发明的目的是提供一种基于搜索引擎的网站优化建 设方法。 0004 技术方案 : 一种基于搜索引擎。
5、的网站优化建设方法, 首先对网页的结构进行处理 改进, 来区别被转载网页容器的层级结构 ; 然后把最主要、 最核心的主题放在最浅的层 ; 再 提取网页的核心主题作为简介, 以达到比被转载网页质量更高。 0005 对网页的结构进行处理改进方式为修改容器的层次和结构。 0006 所述最主要、 最核心的主题为标题。 0007 有益效果 : 与现有技术相比, 本发明的优点是在转载他人新闻或者网页的时候, 只 需要做到比该网站的网页内容更加丰富, 网页内容质量更高, 那么就能解决转载不被收录 的问题, 同时也能获得比 “原创” 更好的排序结果, 达到优化网站建设的目的。 具体实施方式 0008 下面结合。
6、具体实施例, 进一步阐明本发明, 应理解这些实施例仅用于说明本发明 而不用于限制本发明的范围, 在阅读了本发明之后, 本领域技术人员对本发明的各种等价 形式的修改均落于本申请所附权利要求所限定的范围。 0009 一种基于搜索引擎的网站优化建设方法, 首先对网页的结构进行处理改进, 例如 修改容器的层次和结构, 来区别被转载网页容器的层级结构 ; 然后把最主要、 最核心的主题 放在最浅的层, 例如标题放在最浅的层 ; 再提取网页的核心主题作为简介, 以达到比被转载 网页质量更高, 还可以增加心得或者网友评论, 以及相关新闻链接, 以达到比被转载网页质 量更高。 0010 例如,“北川县城 8.5。
7、 万件档案有望 5 日从废墟中挖掘完毕” 这条新闻在网易、 中华 人民共和国政府网站的中国要闻频道等多个网站都完全引用了新华网的这条新闻。 但是当 我们搜索这条新闻的时候排在前列的居然没有出现新华网原创的这条新闻。 而搜索引擎的 排序规则中一条很重要的因素就是原创性, 这之间是否矛盾?由此可以看出, 搜索引擎无 说 明 书 CN 104239358 A 3 2/2 页 4 法判断到底哪些新闻是原创的, 哪些新闻是转载的, 即使上述两个网站都标注了来源于新 华网, 那么为什么其他人转载的时候就不会被收录, 而有些网站转载就会被收录?甚至获 得的排序结果高于原创新闻的排序结果。其实道理很简单, 就是搜索引擎只能通过调用它 的各类算法来计算哪些网页内容更加丰富, 内容质量更高, 然后综合计算后给出一个相对 合理的排序结果。 说 明 书 CN 104239358 A 4 。