《一种计算网页完整率的方法.pdf》由会员分享,可在线阅读,更多相关《一种计算网页完整率的方法.pdf(5页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103810178 A (43)申请公布日 2014.05.21 CN 103810178 A (21)申请号 201210439700.1 (22)申请日 2012.11.07 G06F 17/30(2006.01) (71)申请人 江苏仕德伟网络科技股份有限公司 地址 215000 江苏省苏州市高新区竹园路 209 号 ( 苏州创业园 3 楼 A 区江苏仕德 伟网络科技股份有限公司内 ) (72)发明人 陈德阳 黄国建 李建中 高涵毅 张峰 汪张宪 范锋华 朱平 亓明敬 (54) 发明名称 一种计算网页完整率的方法 (57) 摘要 本发明公开了一种计算网页完整率的。
2、方法, 包括以下步骤 : 据网站地址, 通过虚拟请求的方 式获取到网站页面的 html 源码, 接着可以根据 html 源码抓取到指向自己本网站的链接, 以此类 推获取到整个站点所有的网页, 然后分析所有网 页的html源码, 找到meta标签, 分析其meta标签 的 keywords 和 description 属性是否已经设置, 并且不是空的, 最后对 meta 标签是否完整作出统 计, 计算出 meta 标签完整率, ( 公式 : meta 标签不 完整的页面个数/网站的网页个数) ; 计算出完整 率, 通过网页的显示出来。采用本发明技术方案, 很方便得检查出网站 meta 标签设置是。
3、否完整以 及对搜索引擎的收录效果。 (51)Int.Cl. 权利要求书 1 页 说明书 2 页 附图 1 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书1页 说明书2页 附图1页 (10)申请公布号 CN 103810178 A CN 103810178 A 1/1 页 2 1. 一种计算网页完整率的方法, 其特征在于 : 包括以下步骤 : 步骤 1) 输入网址, 并触发检测 ; 步骤 2) 获取到页面源码, 并对页面源码进行分析 ; 步骤 3) 获取到所有的站内链接, 通过站内链接再次深入抓取站内链接, 直到抓取到所 有站内链接 ; 步骤 4) 获取并分析所有站内。
4、链接的 html 源码, 判断每一页的 meta 标签是否完整, 并 统计出 meta 标签设置不完整的页面个数和总的页面个数 ; 步骤 5) 通过公式 meta 标签设置不完整的页面个数 / 总的页面个数计算出 meta 标签 完整率 ; 步骤 6) 通过页面显示出来。 权 利 要 求 书 CN 103810178 A 2 1/2 页 3 一种计算网页完整率的方法 技术领域 0001 本发明涉及网络软件技术领域, 具体涉及一种计算网页完整率的方法。 背景技术 0002 Meta标签是HTML标记HEAD区的一个关键标签, 它提供的信息虽然用户不可见, 但 却是文档的最基本的元信息, 除了提供。
5、文档字符集、 使用语言、 作者等基本信息外, 还涉及 对关键词和网页等级的设定。 0003 各大主流搜索引擎, 对于 Meta 标签的重视程度也是相当高, 基本上搜索引擎通过 蜘蛛收录网页时, 都是通过 meta 标签内设置的关键词以及页面描述信息来进行分析, 并分 类收录。 0004 所以保证每张页面的 meta 标签的完整性, 对于网站的完整度、 专业度以及推广度 是极为重要的。 发明内容 0005 本发明的目的在于克服现有技术存在的以上问题, 提供一种计算网页完整率的方 法, 本发明很方便得检查出网站 meta 标签设置是否完整以及对搜索引擎的收录效果。 0006 为实现上述技术目的, 。
6、达到上述技术效果, 本发明通过以下技术方案实现 : 0007 一种计算网页完整率的方法, 包括以下步骤 : 0008 步骤 1) 输入网址, 并触发检测 ; 0009 步骤 2) 获取到页面源码, 并对页面源码进行分析 ; 0010 步骤 3) 获取到所有的站内链接, 通过站内链接再次深入抓取站内链接, 直到抓取 到所有站内链接 ; 0011 步骤 4) 获取并分析所有站内链接的 html 源码, 判断每一页的 meta 标签是否完 整, 并统计出 meta 标签设置不完整的页面个数和总的页面个数 ; 0012 步骤 5) 通过公式 meta 标签设置不完整的页面个数 / 总的页面个数计算出 。
7、meta 标签完整率 ; 0013 步骤 6) 通过页面显示出来。 0014 本发明的有益效果是 : 0015 本发明很方便得检查出网站 meta 标签设置是否完整以及对搜索引擎的收录效 果。 0016 上述说明仅是本发明技术方案的概述, 为了能够更清楚了解本发明的技术手段, 并可依照说明书的内容予以实施, 以下以本发明的较佳实施例并配合附图详细说明如后。 本发明的具体实施方式由以下实施例及其附图详细给出。 附图说明 0017 此处所说明的附图用来提供对本发明的进一步理解, 构成本申请的一部分, 本发 说 明 书 CN 103810178 A 3 2/2 页 4 明的示意性实施例及其说明用于解。
8、释本发明, 并不构成对本发明的不当限定。在附图中 : 0018 图 1 是本发明的流程示意图。 具体实施方式 0019 下面将参考附图并结合实施例, 来详细说明本发明。 0020 参照图 1 所示, 一种计算网页完整率的方法, 包括以下步骤 : 0021 步骤 1) 输入网址, 并触发检测 ; 0022 步骤 2) 获取到页面源码, 并对页面源码进行分析 ; 0023 步骤 3) 获取到所有的站内链接, 通过站内链接再次深入抓取站内链接, 直到抓取 到所有站内链接 ; 0024 步骤 4) 获取并分析所有站内链接的 html 源码, 判断每一页的 meta 标签是否完 整, 并统计出 meta 标签设置不完整的页面个数和总的页面个数 ; 0025 步骤 5) 通过公式 meta 标签设置不完整的页面个数 / 总的页面个数计算出 meta 标签完整率 ; 0026 步骤 6) 通过页面显示出来。 0027 以上所述仅为本发明的优选实施例而已, 并不用于限制本发明, 对于本领域的技 术人员来说, 本发明可以有各种更改和变化。 凡在本发明的精神和原则之内, 所作的任何修 改、 等同替换、 改进等, 均应包含在本发明的保护范围之内。 说 明 书 CN 103810178 A 4 1/1 页 5 图 1 说 明 书 附 图 CN 103810178 A 5 。