《一种网站数据采集的方法及装置.pdf》由会员分享,可在线阅读,更多相关《一种网站数据采集的方法及装置.pdf(13页珍藏版)》请在专利查询网上搜索。
本发明提供一种网站数据采集的方法及装置,用以解决无法分类获取网站数据的问题,实现快速分类获取所需数据的目的。其中,该方法包括:预先配置网站的根网址;根据根网址获取网站的导航栏信息,导航栏信息中包括频道信息;从频道信息中匹配所需的频道;根据匹配出的频道逐级获取网站数据。该方法针对每个匹配出的频道,逐级获取网站数据,从而可以分类获取数据。同时,获取的数据与网站结构簇相对应,进而可以节省之后的网站数据分。