期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Hadoop平台的并行DHP数据分析方法 被引量:4
1
作者 杨燕霞 冯林 《计算机应用》 CSCD 北大核心 2016年第12期3280-3284,3291,共6页
由候选项集G2生成频繁2-项集岛是关联规则Apriori算法的一个瓶颈。直接哈希修剪(DHP)算法利用一个生成的Hash表见H2减G2中无用的候选项集,以此提高厶的生成效率。但传统DHP算法是一个串行算法,不能有效处理较大规模数据。针对这一... 由候选项集G2生成频繁2-项集岛是关联规则Apriori算法的一个瓶颈。直接哈希修剪(DHP)算法利用一个生成的Hash表见H2减G2中无用的候选项集,以此提高厶的生成效率。但传统DHP算法是一个串行算法,不能有效处理较大规模数据。针对这一问题,提出DHP的并行化算法——H_DHP。首先,对DHP算法并行化策略的可行性进行了理论分析与证明;其次,基于Hadoop平台,把Hash表以的生成以及频繁项集L1、L3~Lk的生成方法进行了并行实现,并借助Hbase数据库生成关联规则。仿真实验结果表明:与传统DHP算法相比,H_DHP算法在数据的处理时间效率、处理数据集的规模大小,以及加速比和可扩展性等方面都有较好的性能。 展开更多
关键词 HADOOP HASH表 APRIORI算法 直接哈希修剪算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部