《一种基于HADOOP的海量WEB数据挖掘方法.pdf》由会员分享,可在线阅读,更多相关《一种基于HADOOP的海量WEB数据挖掘方法.pdf(8页珍藏版)》请在专利查询网上搜索。
本发明公开一种基于Hadoop的海量web数据挖掘方法,属于计算机数据处理领域;本发明遗传算法与Hadoop的MapReduce进行融合,针对Hadoop的分布式文件存储系统HDFS中的海量Web数据进行挖掘,进一步验证该平台的高效性,在该平台上利用融合后的算法挖掘Web日志中用户的偏爱访问路径,实验结果表明,在Hadoop中运用分布式算法处理大量的Web数据,可以明显提高Web数据挖掘的效率。 。