期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
引入信息熵的CURE聚类算法 被引量:14
1
作者 伍恒 李文杰 蒋旻 《计算机应用研究》 CSCD 北大核心 2017年第8期2303-2305,共3页
为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数... 为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数据的分布;在高、低层聚类阶段,采取不同的选取策略,分别选取相应的代表点。在UCI和人造数据集上的实验结果表明,提出的算法在一定程度上提高了聚类的准确率,且在大型数据集上比传统CURE算法有着更高的聚类效率。 展开更多
关键词 层次聚类 cure算法 信息熵 代表点选取
在线阅读 下载PDF
Binary-Positive下的并行化CURE算法 被引量:3
2
作者 王民 尹超 +2 位作者 王稚慧 要趁红 高婧 《计算机工程与应用》 CSCD 2014年第11期58-61,共4页
当CURE算法在处理不均匀的海量数据时,针对随机抽样不具有代表性的问题,提出了一种健壮的并行化改进算法。该算法使用Binary-Positive算法得到原始数据的有效属性,并利用MapReduce并行框架对有效数据进行层次聚类,从而实现了正确率与效... 当CURE算法在处理不均匀的海量数据时,针对随机抽样不具有代表性的问题,提出了一种健壮的并行化改进算法。该算法使用Binary-Positive算法得到原始数据的有效属性,并利用MapReduce并行框架对有效数据进行层次聚类,从而实现了正确率与效率的一种权衡。实验分析表明,改进后的CURE算法具有更高的执行效率,且聚类效果良好。 展开更多
关键词 聚类 利用代表点聚类(cure) Binary—Positive MAPREDUCE 并行
在线阅读 下载PDF
基于改进CURE算法的不确定性移动用户数据聚类 被引量:8
3
作者 高长元 王海晶 王京 《计算机工程与科学》 CSCD 北大核心 2016年第4期768-774,共7页
随着云计算、大数据以及移动互联网的发展,移动终端用户数据呈现出数据量大、噪声大、动态性及不确定性增强的趋势,影响了移动用户数据聚类准确率与效率。针对上述问题,提出了一种改进的层次聚类算法CURE。该算法将原有算法中抽样处理... 随着云计算、大数据以及移动互联网的发展,移动终端用户数据呈现出数据量大、噪声大、动态性及不确定性增强的趋势,影响了移动用户数据聚类准确率与效率。针对上述问题,提出了一种改进的层次聚类算法CURE。该算法将原有算法中抽样处理数据的方式用Map Reduce函数实现并行化处理,同时结合区间数的概念,将移动用户数据用一个区间表示,计算其区间距离来适应移动用户数据的不确定性特点,从而提高聚类效率与准确率。最后利用MIT Reality项目数据集进行仿真,仿真结果表明了该方法的有效性及可行性,为移动用户数据的进一步利用及用户的个性化推荐提供支持。 展开更多
关键词 cure 不确定性数据 移动用户数据 Map REDUCE
在线阅读 下载PDF
基于CURE的用户聚类算法研究 被引量:8
4
作者 赵妍 赵学民 《计算机工程与应用》 CSCD 2012年第11期97-101,共5页
通过对Web网站的日志进行聚类分析,目的是获取用户兴趣访问模式,进而为不同用户群体提供定制的个性化服务。针对原始CURE算法在代表点选择的随机性、不能充分体现用户兴趣偏好方面存在的问题,提出了改进的用户聚类算法,根据用户兴趣的... 通过对Web网站的日志进行聚类分析,目的是获取用户兴趣访问模式,进而为不同用户群体提供定制的个性化服务。针对原始CURE算法在代表点选择的随机性、不能充分体现用户兴趣偏好方面存在的问题,提出了改进的用户聚类算法,根据用户兴趣的显著特征提取元素的主要属性进行预聚类,为小类合并提供合理的初始类集,实验结果证明了该方法有较好的聚类结果。 展开更多
关键词 利用代表点聚类(cure)算法 聚类分析 用户兴趣 个性化
在线阅读 下载PDF
一种基于划分的层次聚类算法 被引量:13
5
作者 沈洁 赵雷 +1 位作者 杨季文 李榕 《计算机工程与应用》 CSCD 北大核心 2007年第31期175-177,共3页
CURE算法是针对大规模数据聚类算法的典型代表。提出了一种新的算法K-CURE,该方法基于划分思想对CURE算法作了改进,同时给出了在聚类中剔除孤立点的时机选择方法。测试表明,改进后的算法效率明显高于原算法,且聚类效果良好。
关键词 数据挖掘 层次聚类 代表对象 cure 孤立点
在线阅读 下载PDF
大数据环境下超声波焊缝缺陷识别方法的研究 被引量:3
6
作者 董本志 丁文雪 《计算机工程与应用》 CSCD 北大核心 2016年第23期176-180,共5页
为了解决常规超声波焊缝缺陷识别方法分类模型固定和训练集规模有限而难以体现不同缺陷的差异性和同类缺陷的多态性的问题,结合当今大数据环境下的数据分析策略和基因缺陷识别中匹配的思想,通过主成分分析和CURE聚类算法将缺陷回波信号... 为了解决常规超声波焊缝缺陷识别方法分类模型固定和训练集规模有限而难以体现不同缺陷的差异性和同类缺陷的多态性的问题,结合当今大数据环境下的数据分析策略和基因缺陷识别中匹配的思想,通过主成分分析和CURE聚类算法将缺陷回波信号编码转换成可进行匹配的对象,进而将当前检测缺陷特征与历史检测数据进行匹配,并利用最近邻方法实现了对缺陷历史检测数据集的扩充。通过在R上应用基于基本空位罚分的Smith-Waterman比对算法进行仿真实验验证了该缺陷识别方法是可行的,有效地识别了气孔、夹渣、裂纹、未焊透和未熔合五类常见缺陷,具有较好的识别准确率。 展开更多
关键词 缺陷识别 主成分分析 cure聚类算法 比对算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部