《一种基于百科数据提取集成的查询系统.pdf》由会员分享,可在线阅读,更多相关《一种基于百科数据提取集成的查询系统.pdf(12页珍藏版)》请在专利查询网上搜索。
本发明涉及一种基于百科数据提取集成的查询系统,其特征在于:它包括数据提取模块、数据集成模块和数据查询模块;数据提取模块用于从因特网上提取百科网页,定位和初步过滤各类百科网页中的表格,之后进行基于视觉特征的定位和提取;将提取的表格统一转换成行表的形式,将具有相同特征参数的表格归为一类,提取和识别出每类表格的分类信息,将分类信息保存在信息数据库和XML数据库中;数据集成模块对表格进行分类并按类别打分;。