期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
云计算平台上的Canopy-Kmeans并行聚类算法研究 被引量:1
1
作者 孙秀娟 《现代电子技术》 北大核心 2019年第19期78-81,共4页
针对大数据的高维特性及海量性,提出云计算平台中的Canopy-Kmeans并行聚类算法,通过三角不等式原理,能够使计算冗余降低,使算法执行速度得到提高。对Canopy-Kmeans并行聚类算法进行深入的研究,并且在大量不同大小数据集中的实验结果表明... 针对大数据的高维特性及海量性,提出云计算平台中的Canopy-Kmeans并行聚类算法,通过三角不等式原理,能够使计算冗余降低,使算法执行速度得到提高。对Canopy-Kmeans并行聚类算法进行深入的研究,并且在大量不同大小数据集中的实验结果表明,所设计的并行聚类算法具有良好的加速比、数据伸缩率及扩展率等特点,能够在海量数据挖掘及分析中使用。 展开更多
关键词 云计算平台 Canopy-Kmeans算法 并行聚类算法 大数据挖掘 集群数据 数据分析
在线阅读 下载PDF
基于MapReduce的FCM聚类集成算法 被引量:5
2
作者 马自堂 苟杰 《计算机应用研究》 CSCD 北大核心 2016年第12期3554-3558,共5页
模糊C-均值(FCM)聚类集成算法是一种利用集成思想提高聚类质量的方法。针对FCM聚类集成算法随着数据量的增加时间复杂度过高的问题,提出一种基于MapReduce框架的并行FCM聚类集成算法。首先利用多组随机的初始聚类中心分别进行聚类来获... 模糊C-均值(FCM)聚类集成算法是一种利用集成思想提高聚类质量的方法。针对FCM聚类集成算法随着数据量的增加时间复杂度过高的问题,提出一种基于MapReduce框架的并行FCM聚类集成算法。首先利用多组随机的初始聚类中心分别进行聚类来获取具有差异化的聚类成员;然后通过建立聚类成员簇间OVERLAP矩阵来寻找逻辑等价簇,统一所有聚类成员中的簇标记;最后利用投票法共享聚类成员中数据对象的聚类情况得出最终的聚类结果。实验结果表明,该算法具有良好的精确度、加速比和扩展性,具有处理较大规模数据集的能力。 展开更多
关键词 MAPREDUCE 集成 模糊C-均值 并行聚类算法
在线阅读 下载PDF
数据划分优化的并行k-means算法 被引量:7
3
作者 尹建君 王乐 《计算机工程与应用》 CSCD 北大核心 2010年第15期127-131,共5页
针对大规模文本聚类中对聚类算法执行效率的要求,提出了一个内容相关的纵向数据划分策略FTDV,并基于该策略提出了数据划分优化的并行DVPk-means算法,提高了常规并行k-means算法的并行化程度,达到了优化算法执行效率的目的。在实验中,与... 针对大规模文本聚类中对聚类算法执行效率的要求,提出了一个内容相关的纵向数据划分策略FTDV,并基于该策略提出了数据划分优化的并行DVPk-means算法,提高了常规并行k-means算法的并行化程度,达到了优化算法执行效率的目的。在实验中,与常规并行k-means算法和基于关键方向分解的PDDPk-means算法进行比较,DVPk-means具有更好的并行性和对数据规模的适应性,且可以生成更高质量的聚簇。 展开更多
关键词 数据划分 并行聚类算法 频繁词集 K-MEANS算法
在线阅读 下载PDF
基于FCM并行算法的微博热点发现
4
作者 冯利光 刘其成 《计算机应用与软件》 CSCD 2015年第11期232-237,共6页
微博作为发展最迅猛的信息传播平台,每天都会产生大量数据,迅速增长的数据对数据处理提出了新的要求。针对微博数据特点,对VSM模型进行改进,并在MapReduce平台上,设计微博热点话题发现并行模糊C均值(HTD-PFCM)算法。实验结果表明,基于改... 微博作为发展最迅猛的信息传播平台,每天都会产生大量数据,迅速增长的数据对数据处理提出了新的要求。针对微博数据特点,对VSM模型进行改进,并在MapReduce平台上,设计微博热点话题发现并行模糊C均值(HTD-PFCM)算法。实验结果表明,基于改进VSM模型的HTD-PFCM算法具有良好的加速比,并且能够更高效地处理微博数据,发现微博热点话题。 展开更多
关键词 微博热点发现 并行FCM算法 改进的VSM模型MapReduce框架
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部