《网页内容的提取方法、装置及系统.pdf》由会员分享,可在线阅读,更多相关《网页内容的提取方法、装置及系统.pdf(23页珍藏版)》请在专利查询网上搜索。
本发明公开了一种网页内容的提取方法、装置及系统,属于互联网技术领域。方法包括:获取待提取网页,确定本地是否存储有用于提取待提取网页的网页内容的提取规则;若确定本地未存储用于提取待提取网页的网页内容的提取规则,则向服务器请求获取用于提取待提取网页的网页内容的提取规则;接收服务器下发的统一提取规则,并在确定不支持解析统一提取规则后,下载并安装用于解析统一提取规则的第三方解析库;通过第三方解析库对统一提。