期刊文献+

基于MapReduce的Apriori算法增量挖掘 被引量:7

Incremental mining algorithm of Apriori based on MapReduce
在线阅读 下载PDF
导出
摘要 针对基于MapReduce框架的Apriori关联规则挖掘算法产生候选项集较长、算法执行效率低等问题,以及大数据环境中数据快速更新造成增量处理等缺陷进行了研究,提出了一种基于项集动态加权的增量挖掘算法WDU-Apriori(weighted dynamic updating-Apriori)。首先提出W-DPC(weighted dynamic passes combiner)机制作为其候选项集的结合方式,有效提高算法在大数据环境下的适应能力;其次对于新来的增量数据,设计了WBI(weighted border itemsets)策略,用于生成加权边界项集,以改进对增量数据的挖掘效率;最后构建了CTP(calculate transform probability)方法,用于量化阈值边界项集变为频繁项集的可能性,这对先前的挖掘结果有了更高效的应用,在降低节点负载的同时也解决了原始数据集扫描次数较多的问题。理论分析与实验结果共同表明,WDU-Apriori算法不仅有效提高了挖掘效率,平衡了每一个阶段的工作量,同时也有效降低了算法的时间复杂度。
出处 《计算机应用研究》 CSCD 北大核心 2020年第S02期73-75,79,共4页 Application Research of Computers
基金 国家重点研发计划资助项目(2018YFC1504705) 国家自然科学基金资助项目(41562019)
作者简介 赵欣灿(1996-),女,甘肃定西人,硕士研究生,主要研究方向为大数据、数据挖掘等;朱云(1984-),男,江西瑞金人,副教授,硕导,博士,主要研究方向为非线性系统、非线性电路等;通信作者:毛伊敏(1970-),女,新疆伊犁人,教授,硕导,博士,主要研究方向为大数据、数据挖掘、生物技术、地理信息等(mymlyc@163.com).
  • 相关文献

参考文献3

二级参考文献24

  • 1梅立军,周强,臧路,陈祖舜.知网与同义词词林的信息融合研究[J].中文信息学报,2005,19(1):63-70. 被引量:28
  • 2董振东,董强,郝长伶.知网的理论发现[J].中文信息学报,2007,21(4):3-9. 被引量:100
  • 3Dean J, Ghemmawat S. MapReduce: simplied data processing on large clusters [ C ]//Proceedings of the 6th Sympesium on Operating System Design and Implementation. New York: ACM Press, 2004:137 -150.
  • 4Ranger C, Raghuraman R, Penmetsa A. Evaluating MapReduce for multicore and mutiprocessor systems [ C ] //Proceedings of the 2007 IEEE 13th International Symposium on High Performance Computer Architecture. Washington: IEEE Computer Society, 2007 : 13 -24.
  • 5Kruuf M D, Sankaralinggam K. MapReduce for the cell B.E. architecture [ R ]. Madison: University of Wisconsin - Madison, 2007.
  • 6He Bing - sheng, Fang Wen - bin, Naga K Govindaraju, et al. Mars : a MapReduce framework on graphics processors [ C ] // Proceedings of the 17th International Conference on Parallel Architectures and Compilation Techniques. New York: ACM Press, 2008 : 260 "269.
  • 7Zaharia M, Konwinski A, Joseph A D. Improving MapReduce performance in heterogeneous environments [ C ] //Proceedings of the 8th USENIX Symposium on Operating Systems Design and Implementation. New York: ACM Press, 2008:29 -42.
  • 8Tomwhite.Hadoop权威指南:中文版[M].曾大聃,周傲英,译.北京:清华大学出版社,2010.
  • 9Chu Chen -tao, Kim S K, Lin Yian, et al. Map -Reduce for machine learning on muhicore [ C]//Twentieth Annual Conference on Neural Information Processing Systems, Vancouver: [ s. n. ], 2006 : 281 - 288.
  • 10Yang Xinyue, Liu Zhen, Fu Yan. MapReduce as a programming model for lssociation rules algorithm on hadoop[ C ]//3rd International Conference on Information Sciences and Interaction Sciences. Chengdu: [ s. n. ], 2010.

共引文献805

同被引文献61

引证文献7

二级引证文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部