一种计算网页完整率的方法.pdf

上传人:bo****18 文档编号:6118432 上传时间:2019-04-13 格式:PDF 页数:5 大小:488.98KB
返回 下载 相关 举报
摘要
申请专利号:

CN201210439700.1

申请日:

2012.11.07

公开号:

CN103810178A

公开日:

2014.05.21

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):G06F 17/30申请公布日:20140521|||文件的公告送达IPC(主分类):G06F 17/30收件人:江苏仕德伟网络科技股份有限公司文件名称:视为撤回通知书|||文件的公告送达IPC(主分类):G06F 17/30收件人:江苏仕德伟网络科技股份有限公司文件名称:第一次审查意见通知书|||实质审查的生效IPC(主分类):G06F 17/30申请日:20121107|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

江苏仕德伟网络科技股份有限公司

发明人:

陈德阳; 黄国建; 李建中; 高涵毅; 张峰; 汪张宪; 范锋华; 朱平; 亓明敬

地址:

215000 江苏省苏州市高新区竹园路209号(苏州创业园3楼A区江苏仕德伟网络科技股份有限公司内)

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

本发明公开了一种计算网页完整率的方法,包括以下步骤:据网站地址,通过虚拟请求的方式获取到网站页面的html源码,接着可以根据html源码抓取到指向自己本网站的链接,以此类推获取到整个站点所有的网页,然后分析所有网页的html源码,找到meta标签,分析其meta标签的keywords和description属性是否已经设置,并且不是空的,最后对meta标签是否完整作出统计,计算出meta标签完整率,(公式:meta标签不完整的页面个数/网站的网页个数);计算出完整率,通过网页的显示出来。采用本发明技术方案,很方便得检查出网站meta标签设置是否完整以及对搜索引擎的收录效果。

权利要求书

1.一种计算网页完整率的方法,其特征在于:包括以下步骤:
步骤1)输入网址,并触发检测;
步骤2)获取到页面源码,并对页面源码进行分析;
步骤3)获取到所有的站内链接,通过站内链接再次深入抓取站
内链接,直到抓取到所有站内链接;
步骤4)获取并分析所有站内链接的html源码,判断每一页的
meta标签是否完整,并统计出meta标签设置不完整的页面个数和总
的页面个数;
步骤5)通过公式meta标签设置不完整的页面个数/总的页面个
数计算出meta标签完整率;
步骤6)通过页面显示出来。

说明书

一种计算网页完整率的方法

技术领域

本发明涉及网络软件技术领域,具体涉及一种计算网页完整率
的方法。

背景技术

Meta标签是HTML标记HEAD区的一个关键标签,它提供的信息
虽然用户不可见,但却是文档的最基本的元信息,除了提供文档字
符集、使用语言、作者等基本信息外,还涉及对关键词和网页等级
的设定。

各大主流搜索引擎,对于Meta标签的重视程度也是相当高,基
本上搜索引擎通过蜘蛛收录网页时,都是通过meta标签内设置的关
键词以及页面描述信息来进行分析,并分类收录。

所以保证每张页面的meta标签的完整性,对于网站的完整度、
专业度以及推广度是极为重要的。

发明内容

本发明的目的在于克服现有技术存在的以上问题,提供一种计
算网页完整率的方法,本发明很方便得检查出网站meta标签设置是
否完整以及对搜索引擎的收录效果。

为实现上述技术目的,达到上述技术效果,本发明通过以下技
术方案实现:

一种计算网页完整率的方法,包括以下步骤:

步骤1)输入网址,并触发检测;

步骤2)获取到页面源码,并对页面源码进行分析;

步骤3)获取到所有的站内链接,通过站内链接再次深入抓取站
内链接,直到抓取到所有站内链接;

步骤4)获取并分析所有站内链接的html源码,判断每一页的
meta标签是否完整,并统计出meta标签设置不完整的页面个数和总
的页面个数;

步骤5)通过公式meta标签设置不完整的页面个数/总的页面个
数计算出meta标签完整率;

步骤6)通过页面显示出来。

本发明的有益效果是:

本发明很方便得检查出网站meta标签设置是否完整以及对搜索
引擎的收录效果。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本
发明的技术手段,并可依照说明书的内容予以实施,以下以本发明
的较佳实施例并配合附图详细说明如后。本发明的具体实施方式由
以下实施例及其附图详细给出。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申
请的一部分,本发明的示意性实施例及其说明用于解释本发明,并
不构成对本发明的不当限定。在附图中:

图1是本发明的流程示意图。

具体实施方式

下面将参考附图并结合实施例,来详细说明本发明。

参照图1所示,一种计算网页完整率的方法,包括以下步骤:

步骤1)输入网址,并触发检测;

步骤2)获取到页面源码,并对页面源码进行分析;

步骤3)获取到所有的站内链接,通过站内链接再次深入抓取站
内链接,直到抓取到所有站内链接;

步骤4)获取并分析所有站内链接的html源码,判断每一页的
meta标签是否完整,并统计出meta标签设置不完整的页面个数和总
的页面个数;

步骤5)通过公式meta标签设置不完整的页面个数/总的页面个
数计算出meta标签完整率;

步骤6)通过页面显示出来。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,
对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在
本发明的精神和原则之内,所作的任何修改、等同替换、改进等,
均应包含在本发明的保护范围之内。

一种计算网页完整率的方法.pdf_第1页
第1页 / 共5页
一种计算网页完整率的方法.pdf_第2页
第2页 / 共5页
一种计算网页完整率的方法.pdf_第3页
第3页 / 共5页
点击查看更多>>
资源描述

《一种计算网页完整率的方法.pdf》由会员分享,可在线阅读,更多相关《一种计算网页完整率的方法.pdf(5页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103810178 A (43)申请公布日 2014.05.21 CN 103810178 A (21)申请号 201210439700.1 (22)申请日 2012.11.07 G06F 17/30(2006.01) (71)申请人 江苏仕德伟网络科技股份有限公司 地址 215000 江苏省苏州市高新区竹园路 209 号 ( 苏州创业园 3 楼 A 区江苏仕德 伟网络科技股份有限公司内 ) (72)发明人 陈德阳 黄国建 李建中 高涵毅 张峰 汪张宪 范锋华 朱平 亓明敬 (54) 发明名称 一种计算网页完整率的方法 (57) 摘要 本发明公开了一种计算网页完整率的。

2、方法, 包括以下步骤 : 据网站地址, 通过虚拟请求的方 式获取到网站页面的 html 源码, 接着可以根据 html 源码抓取到指向自己本网站的链接, 以此类 推获取到整个站点所有的网页, 然后分析所有网 页的html源码, 找到meta标签, 分析其meta标签 的 keywords 和 description 属性是否已经设置, 并且不是空的, 最后对 meta 标签是否完整作出统 计, 计算出 meta 标签完整率, ( 公式 : meta 标签不 完整的页面个数/网站的网页个数) ; 计算出完整 率, 通过网页的显示出来。采用本发明技术方案, 很方便得检查出网站 meta 标签设置是。

3、否完整以 及对搜索引擎的收录效果。 (51)Int.Cl. 权利要求书 1 页 说明书 2 页 附图 1 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书1页 说明书2页 附图1页 (10)申请公布号 CN 103810178 A CN 103810178 A 1/1 页 2 1. 一种计算网页完整率的方法, 其特征在于 : 包括以下步骤 : 步骤 1) 输入网址, 并触发检测 ; 步骤 2) 获取到页面源码, 并对页面源码进行分析 ; 步骤 3) 获取到所有的站内链接, 通过站内链接再次深入抓取站内链接, 直到抓取到所 有站内链接 ; 步骤 4) 获取并分析所有站内。

4、链接的 html 源码, 判断每一页的 meta 标签是否完整, 并 统计出 meta 标签设置不完整的页面个数和总的页面个数 ; 步骤 5) 通过公式 meta 标签设置不完整的页面个数 / 总的页面个数计算出 meta 标签 完整率 ; 步骤 6) 通过页面显示出来。 权 利 要 求 书 CN 103810178 A 2 1/2 页 3 一种计算网页完整率的方法 技术领域 0001 本发明涉及网络软件技术领域, 具体涉及一种计算网页完整率的方法。 背景技术 0002 Meta标签是HTML标记HEAD区的一个关键标签, 它提供的信息虽然用户不可见, 但 却是文档的最基本的元信息, 除了提供。

5、文档字符集、 使用语言、 作者等基本信息外, 还涉及 对关键词和网页等级的设定。 0003 各大主流搜索引擎, 对于 Meta 标签的重视程度也是相当高, 基本上搜索引擎通过 蜘蛛收录网页时, 都是通过 meta 标签内设置的关键词以及页面描述信息来进行分析, 并分 类收录。 0004 所以保证每张页面的 meta 标签的完整性, 对于网站的完整度、 专业度以及推广度 是极为重要的。 发明内容 0005 本发明的目的在于克服现有技术存在的以上问题, 提供一种计算网页完整率的方 法, 本发明很方便得检查出网站 meta 标签设置是否完整以及对搜索引擎的收录效果。 0006 为实现上述技术目的, 。

6、达到上述技术效果, 本发明通过以下技术方案实现 : 0007 一种计算网页完整率的方法, 包括以下步骤 : 0008 步骤 1) 输入网址, 并触发检测 ; 0009 步骤 2) 获取到页面源码, 并对页面源码进行分析 ; 0010 步骤 3) 获取到所有的站内链接, 通过站内链接再次深入抓取站内链接, 直到抓取 到所有站内链接 ; 0011 步骤 4) 获取并分析所有站内链接的 html 源码, 判断每一页的 meta 标签是否完 整, 并统计出 meta 标签设置不完整的页面个数和总的页面个数 ; 0012 步骤 5) 通过公式 meta 标签设置不完整的页面个数 / 总的页面个数计算出 。

7、meta 标签完整率 ; 0013 步骤 6) 通过页面显示出来。 0014 本发明的有益效果是 : 0015 本发明很方便得检查出网站 meta 标签设置是否完整以及对搜索引擎的收录效 果。 0016 上述说明仅是本发明技术方案的概述, 为了能够更清楚了解本发明的技术手段, 并可依照说明书的内容予以实施, 以下以本发明的较佳实施例并配合附图详细说明如后。 本发明的具体实施方式由以下实施例及其附图详细给出。 附图说明 0017 此处所说明的附图用来提供对本发明的进一步理解, 构成本申请的一部分, 本发 说 明 书 CN 103810178 A 3 2/2 页 4 明的示意性实施例及其说明用于解。

8、释本发明, 并不构成对本发明的不当限定。在附图中 : 0018 图 1 是本发明的流程示意图。 具体实施方式 0019 下面将参考附图并结合实施例, 来详细说明本发明。 0020 参照图 1 所示, 一种计算网页完整率的方法, 包括以下步骤 : 0021 步骤 1) 输入网址, 并触发检测 ; 0022 步骤 2) 获取到页面源码, 并对页面源码进行分析 ; 0023 步骤 3) 获取到所有的站内链接, 通过站内链接再次深入抓取站内链接, 直到抓取 到所有站内链接 ; 0024 步骤 4) 获取并分析所有站内链接的 html 源码, 判断每一页的 meta 标签是否完 整, 并统计出 meta 标签设置不完整的页面个数和总的页面个数 ; 0025 步骤 5) 通过公式 meta 标签设置不完整的页面个数 / 总的页面个数计算出 meta 标签完整率 ; 0026 步骤 6) 通过页面显示出来。 0027 以上所述仅为本发明的优选实施例而已, 并不用于限制本发明, 对于本领域的技 术人员来说, 本发明可以有各种更改和变化。 凡在本发明的精神和原则之内, 所作的任何修 改、 等同替换、 改进等, 均应包含在本发明的保护范围之内。 说 明 书 CN 103810178 A 4 1/1 页 5 图 1 说 明 书 附 图 CN 103810178 A 5 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1