期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
序列关联并行挖掘算法研究 被引量:3
1
作者 李庆华 赵峰 《计算机科学》 CSCD 北大核心 2003年第8期114-116,共3页
Ming sequential associations is becoming increasing essential in many scientific and commercial domains.Developing parallel algorithm becomes quite challenging depending on enormous size of available dataset and possi... Ming sequential associations is becoming increasing essential in many scientific and commercial domains.Developing parallel algorithm becomes quite challenging depending on enormous size of available dataset and possiblylarge number of mined associations ,the nature of input data and the timing constraints imposed on the desired associa-tions. In this paper ,we discuss several different parallel algorithms that cater to various situations to speed up thecurrent mining process. 展开更多
关键词 数据仓库 序列关联 并行挖掘算法 数据挖掘 数据集 数据库
在线阅读 下载PDF
基于MapReduce的健康大数据并行挖掘算法研究
2
作者 陈榆 何慧敏 +1 位作者 梁志胜 欧旭 《现代电子技术》 2023年第12期79-83,共5页
随着信息技术的发展,健康大数据呈指数级别剧增,但数据量过大使得较多有价值的数据被埋没,医疗服务的质量与效率难以提升。为解决上述问题,文中提出一种基于MapReduce的健康大数据并行挖掘算法。首先对健康大数据进行预处理,消除一些不... 随着信息技术的发展,健康大数据呈指数级别剧增,但数据量过大使得较多有价值的数据被埋没,医疗服务的质量与效率难以提升。为解决上述问题,文中提出一种基于MapReduce的健康大数据并行挖掘算法。首先对健康大数据进行预处理,消除一些不利因素对数据的影响;再以预处理后的健康大数据为依据,获取初始簇中心,度量健康大数据与簇中心之间的距离,聚类处理健康大数据;最后,应用MapReduce制定健康大数据并行挖掘程序,执行制定程序即可完成健康大数据的并行挖掘。实验结果表明,所提算法的健康大数据挖掘效率最大值为94 GB/s,加速比最大值为4.5,相比于其他方法,该算法对健康大数据挖掘的性能更佳。 展开更多
关键词 健康大数据 并行挖掘算法 MAPREDUCE 数据预处理 数据聚类 挖掘程序
在线阅读 下载PDF
并行挖掘频繁项目集新算法——MREclat 被引量:4
3
作者 章志刚 吉根林 唐梦梦 《计算机应用》 CSCD 北大核心 2014年第8期2175-2178,共4页
针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节... 针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节点上,且在分发数据时引入了均衡策略;接着,在各个计算节点上求出以某一前缀开头的所有频繁项目集;最后,合并各个节点的结果得到所有频繁项目集。介绍了MREclat的设计思想,研究了算法的运行性能。实验结果表明,MREclat算法效率大约是PEclat算法的2倍,加速比性能比PEclat算法提高了64%。 展开更多
关键词 频繁项目集 并行挖掘算法 列存储 MAP REDUCE Eclat算法
在线阅读 下载PDF
一种基于后缀项表的并行闭频繁项集挖掘算法 被引量:11
4
作者 唐颖峰 陈世平 《计算机应用研究》 CSCD 北大核心 2014年第2期373-377,共5页
对现有的基于MapReduce的并行频繁项集挖掘算法进行了研究,提出一种基于后缀项表的并行闭频繁项集挖掘算法,通过后缀项表的引入及以闭频繁项集挖掘的形式,减少组分间的数据传送量,提高挖掘效率。实验表明,该算法可以有效缩短平均挖掘时... 对现有的基于MapReduce的并行频繁项集挖掘算法进行了研究,提出一种基于后缀项表的并行闭频繁项集挖掘算法,通过后缀项表的引入及以闭频繁项集挖掘的形式,减少组分间的数据传送量,提高挖掘效率。实验表明,该算法可以有效缩短平均挖掘时间,对于高维大数据具有较好的性能。 展开更多
关键词 频繁项集挖掘 并行挖掘算法 MAPREDUCE 闭频繁项集 后缀项表
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部