期刊文献+
共找到109篇文章
< 1 2 6 >
每页显示 20 50 100
改进的k-means聚类算法在客户细分中的应用研究 被引量:8
1
作者 杜巍 赵春荣 黄伟建 《河北经贸大学学报》 CSSCI 北大核心 2014年第1期118-121,共4页
聚类分析是数据挖掘的一种重要方法,将它应用在客户细分中,可以识别出不同的客户群,从而针对不同的客户群制定相应的营销政策,使企业效益最大化。针对聚类分析中k-means算法的不足,运用改进的聚类算法对旅游业客户进行细分,从而使企业... 聚类分析是数据挖掘的一种重要方法,将它应用在客户细分中,可以识别出不同的客户群,从而针对不同的客户群制定相应的营销政策,使企业效益最大化。针对聚类分析中k-means算法的不足,运用改进的聚类算法对旅游业客户进行细分,从而使企业能够更合理地细分、规划客户群组,针对不同需求的客户群体进行区别对待,得到了较好的效果,验证了改进算法的可行性和高效性。 展开更多
关键词 聚类分析 客户细分 数据挖掘 改进的k—means算法 客户群
在线阅读 下载PDF
一种K-means改进算法的并行化实现与应用 被引量:52
2
作者 李晓瑜 俞丽颖 +1 位作者 雷航 唐雪飞 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第1期61-68,共8页
随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因... 随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因初始中心点的不确定性,易陷入局部最优解的问题。本算法在Canopy(罩盖)中完成K-means聚类,并在Canopy间完成簇的合并,聚类效果稳定,迭代次数少。同时,结合MapReduce分布式计算模型,给出改进后算法的并行化设计方法和策略,进一步通过改进相似度度量方法,将该方法用于文本聚类中。实验结果证明该算法具有良好的准确率和扩展性。 展开更多
关键词 canopy算法 HADOOP MAPREDUCE 并行k—means 文本聚类
在线阅读 下载PDF
基于学术文献同被引分析的K-means算法改进研究 被引量:4
3
作者 吴夙慧 成颖 +1 位作者 郑彦宁 潘云涛 《情报学报》 CSSCI 北大核心 2012年第1期82-94,共13页
K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被... K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类。算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K—means算法的初始聚类中心。第二步聚类则依据文献内容实现K-means算法。实验通过与经典K—means算法和基于凝聚层次聚类算法的改进K—means算法的对比,证明了本文提出的改进的K—means算法具备更优的聚类效果。 展开更多
关键词 k—means算法 k 初始聚类中心 同被引 文献聚类
在线阅读 下载PDF
基于初始聚类中心优化和维间加权的改进K-means算法 被引量:7
4
作者 王越 王泉 +1 位作者 吕奇峰 曾晶 《重庆理工大学学报(自然科学)》 CAS 2013年第4期77-80,共4页
针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-m... 针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-means算法的聚类结果进行对比分析。实验证明:改进后的算法稳定,且聚类的准确率达到了92%。 展开更多
关键词 聚类 k—means算法 初始聚类中心 维间加权 Iris数据集
在线阅读 下载PDF
基于2d-距离改进的K-means聚类算法研究 被引量:8
5
作者 陈福集 蒋芳 《太原理工大学学报》 CAS 北大核心 2012年第2期114-118,共5页
为了解决原始K-means算法随机选取聚类中心对聚类结果产生较大影响的不足和孤立点的存在对聚类精度的破坏,以及两者之间的相互牵制性,采用基于2d-距离的DKC值来对原始样本数据集进行预处理以分辨孤立点,同时确定初始的聚类中心,达到消... 为了解决原始K-means算法随机选取聚类中心对聚类结果产生较大影响的不足和孤立点的存在对聚类精度的破坏,以及两者之间的相互牵制性,采用基于2d-距离的DKC值来对原始样本数据集进行预处理以分辨孤立点,同时确定初始的聚类中心,达到消除两者相互影响的效果,使得聚类中心相对稳定,改进后的算法较原始的算法在准确度上得到了改进。 展开更多
关键词 2d距离 k—means算法 初始点选取 孤立点
在线阅读 下载PDF
基于MPE和改进K⁃means算法的分接开关机械故障诊断方法 被引量:14
6
作者 马宏忠 徐艳 魏海增 《高压电器》 CAS CSCD 北大核心 2020年第8期198-204,共7页
随着有载调压变压器在电网应用的增多以及有载分接开关(on⁃load tap⁃changer,OLTC)频繁地调节,分接开关的故障率在不断增加。为更有效进行OLTC机械故障诊断,提出一种基于MPE和改进K⁃means算法的OLTC机械故障诊断方法。首先,模拟OLTC的... 随着有载调压变压器在电网应用的增多以及有载分接开关(on⁃load tap⁃changer,OLTC)频繁地调节,分接开关的故障率在不断增加。为更有效进行OLTC机械故障诊断,提出一种基于MPE和改进K⁃means算法的OLTC机械故障诊断方法。首先,模拟OLTC的不同机械故障,采集振动信号;其次,为实现非线性振动信号下OLTC的故障诊断,采用多尺度排列熵(MPE)进行OLTC机械故障状态的特征提取;再次,采用粒子群(PSO)优化的K⁃means聚类算法诊断OLTC机械故障;最后,将该方法用于OLTC的机械故障诊断,并与传统K⁃means算法以及BP网络的诊断效果进行对比。结果表明,提出的基于MPE和改进K⁃means算法适用于OLTC机械故障诊断,诊断效果优于传统K⁃means算法以及BP网络,且其稳定性较高。 展开更多
关键词 OLTC kmeans算法 粒子群优化的kmeans算法 多尺度排列熵
在线阅读 下载PDF
基于k-Means改进算法的分布式拒绝服务攻击检测 被引量:4
7
作者 刘运 殷建平 +1 位作者 程杰仁 蔡志平 《计算机工程与科学》 CSCD 2008年第12期23-26,共4页
分布式拒绝服务(DDoS)攻击是当前主要的网络安全威胁之一。本文分析了DDoS攻击的本质特征,提出了结合流量及流特征分布熵的检测策略,并根据问题需要改进了k-means聚类算法,并用之建立攻击检测模型。最后,使用LLDOS1.0数据集对该模型进... 分布式拒绝服务(DDoS)攻击是当前主要的网络安全威胁之一。本文分析了DDoS攻击的本质特征,提出了结合流量及流特征分布熵的检测策略,并根据问题需要改进了k-means聚类算法,并用之建立攻击检测模型。最后,使用LLDOS1.0数据集对该模型进行测试。实验结果表明,该模型具有良好的检测精度,验证了检测策略的有效性。 展开更多
关键词 分布式拒绝服务攻击 流特征分布熵 k—means聚类算法
在线阅读 下载PDF
基于Tukey规则与初始中心点优化的K⁃means聚类改进算法 被引量:5
8
作者 柳菁 邱紫滢 +1 位作者 郭茂祖 余冬华 《数据采集与处理》 CSCD 北大核心 2023年第3期643-651,共9页
针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,... 针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,在核心子集上执行中心点逐个递增优化选择策略,选出初始中心点。在来自UCI的20个数据集上聚类结果表明,本文提出的算法优于K⁃means++聚类算法,有效地提升了聚类性能。 展开更多
关键词 数据挖掘 kmeans聚类算法 Tukey规则 中心点优化
在线阅读 下载PDF
基于改进k~*-means算法的不完整公交到站时间填充 被引量:3
9
作者 赵霞 张勇 +2 位作者 尹宝才 刘浩 张可 《北京工业大学学报》 CAS CSCD 北大核心 2018年第1期135-143,共9页
为了有效填充不完整的公交到站时间信息,提出了一种基于改进k~*-means算法的不完整到站时间的填充方法.根据到站流动人数、到站所属时段、站点间距离、站点间运行时间特征加权度量站点间相似性,对现有kmeans算法进行改进以构建公交站点... 为了有效填充不完整的公交到站时间信息,提出了一种基于改进k~*-means算法的不完整到站时间的填充方法.根据到站流动人数、到站所属时段、站点间距离、站点间运行时间特征加权度量站点间相似性,对现有kmeans算法进行改进以构建公交站点间运行时间完备信息表.以北京市地面公交运行数据为例,验证了该方法的可靠性,并与线性拟合、最近邻插值、k-means算法等填充方法进行了对比试验.结果表明:该方法对不完整到站时间的填充率高于97%,且对已知到站时间平均填充误差不高于100 s. 展开更多
关键词 公共交通 数据填充 聚类分析 改进k*-means算法
在线阅读 下载PDF
K-means算法初始聚类中心选择的优化 被引量:51
10
作者 冯波 郝文宁 +1 位作者 陈刚 占栋辉 《计算机工程与应用》 CSCD 2013年第14期182-185,192,共5页
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得... 针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 k—means算法 聚类 初始聚类中心 TDkM算法
在线阅读 下载PDF
基于最优划分的K-Means初始聚类中心选取算法 被引量:62
11
作者 张健沛 杨悦 +1 位作者 杨静 张泽宝 《系统仿真学报》 CAS CSCD 北大核心 2009年第9期2586-2590,共5页
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自... 针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率。实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高。 展开更多
关键词 k—means算法 初始聚类中心 直方图 最优划分方法
在线阅读 下载PDF
初始中心优化的K-Means聚类算法 被引量:47
12
作者 李飞 薛彬 黄亚楼 《计算机科学》 CSCD 北大核心 2002年第7期94-96,共3页
1.引言 聚类分析(clustering)是人工智能研究的重要领域.聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域.
关键词 遗传算法 随机全局优化搜索算法 k—means聚类算法 初始聚类中心 优化
在线阅读 下载PDF
基于改进K-means聚类的在线新闻评论主题抽取 被引量:17
13
作者 夏火松 李保国 杨培 《情报学报》 CSSCI 北大核心 2016年第1期55-65,共11页
新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先... 新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先在预处理阶段增加同义词替换和自动构建领域词典的部分,改善了数据稀疏性和高维性。其次,提出了K-means改进算法,用隐藏长评论-最大距离法选初始点,解决了初始点多为离群点的问题,用方差拐点确定K值,解决了预先设定聚类个数的问题,实验发现了先用BW权重选初始点,再用新提出的BW-DF权重聚类的效果最好。最后,将改进算法与原算法的聚类效果比较,实验结果表明,改进算法准确率高,抽取新闻评论主题的效果明显。 展开更多
关键词 在线新闻评论 k—means聚类改进 主题抽取 同义词替换 分词领域词典
在线阅读 下载PDF
一种分层自适应快速K-means算法 被引量:7
14
作者 张晓琳 崔宁宁 +1 位作者 杨涛 李洁 《计算机应用研究》 CSCD 北大核心 2016年第2期421-423,427,共4页
提出一种分层自适应快速K-means(hierarchical adaptive fast K-means,HAFKM)算法对图像数据库分类聚簇。HAFKM根据提出的分层策略构建一棵非平衡聚类树,通过自适应的方法 CEC(cluster evaluation criterion)确定了除根节点外的每棵子... 提出一种分层自适应快速K-means(hierarchical adaptive fast K-means,HAFKM)算法对图像数据库分类聚簇。HAFKM根据提出的分层策略构建一棵非平衡聚类树,通过自适应的方法 CEC(cluster evaluation criterion)确定了除根节点外的每棵子树的分支数目,而在聚类树的每一层聚类中使用一种提出的判别函数(cost-function)在颜色直方图上根据颜色等级直接聚类,从而可以在整棵树上快速聚类。实验表明,HAFKM算法通过在非平衡树上逐层聚类,并且通过CEC准确判断聚类数目,可以快速、高效地实现数据库的分类聚簇。 展开更多
关键词 HAFkM k—means算法 分层聚类 自适应 大数据库 聚类树
在线阅读 下载PDF
基于密度的K-Means算法及在客户细分中的应用研究 被引量:12
15
作者 向坚持 刘相滨 资武成 《计算机工程与应用》 CSCD 北大核心 2008年第35期246-248,共3页
针对K-Means算法所存在的问题进行了深入研究,提出了基于密度的K-Means算法(KMAD算法)。该算法采用聚类对象区域空间的密度分布方法来确定聚类个数K的值,然后用高密度区域的质心作为K-Means算法的初始聚类中心。理论分析与实验结果表明... 针对K-Means算法所存在的问题进行了深入研究,提出了基于密度的K-Means算法(KMAD算法)。该算法采用聚类对象区域空间的密度分布方法来确定聚类个数K的值,然后用高密度区域的质心作为K-Means算法的初始聚类中心。理论分析与实验结果表明了改进算法的有效性和稳定性,并将改进的算法应用于客户细分研究中。 展开更多
关键词 k—means算法 kMAD算法 密度 客户细分
在线阅读 下载PDF
基于初始中心优化的遗传K-means聚类新算法 被引量:17
16
作者 孙秀娟 刘希玉 《计算机工程与应用》 CSCD 北大核心 2008年第23期166-168,182,共4页
一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力。传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出... 一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力。传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出了一种优化初始中心的K-means算法,该算法选择相距最远的处于高密度区域的k个数据对象作为初始聚类中心。实验表明该算法不仅具有对初始数据的弱依赖性,而且具有收敛快,聚类质量高的特点。为体现聚类的有效性,获得更高精度的聚类结果,提出了将优化的K-means算法(PKM)和遗传算法相结合的混合算法(PGKM),该算法在提高紧凑度(类内距)和分离度(类间距)的同时自动搜索最佳聚类数k,对k个初始中心优化后再聚类,不断地循环迭代,得到满足终止条件的最优聚类。实验证明该算法具有更好的聚类质量和综合性能。 展开更多
关键词 聚类 k—means算法 遗传算法
在线阅读 下载PDF
一种基于蚁群算法的K-means算法——在公路运输枢纽宏观布局规划中的应用 被引量:8
17
作者 孟岩 刘希玉 刘艳丽 《计算机工程与应用》 CSCD 北大核心 2008年第1期179-182,共4页
公路运输的发展有效促进了我国经济持续、快速的发展,但公路建设和运输枢纽建设呈现出不平衡性。因此需采用聚类分析对公路主枢纽城市进行聚类,划分层次来进行功能分析。K-means算法是聚类分析中使用最为广泛的算法之一,但算法具有初始... 公路运输的发展有效促进了我国经济持续、快速的发展,但公路建设和运输枢纽建设呈现出不平衡性。因此需采用聚类分析对公路主枢纽城市进行聚类,划分层次来进行功能分析。K-means算法是聚类分析中使用最为广泛的算法之一,但算法具有初始中心点和聚类个数不确定等方面的缺点。针对其缺点,提出将基于蚁群算法的K-means算法应用于在公路运输枢纽布局规划中。实验结果表明,与单独使用两种算法相比,该算法更能有效地解决公路主枢纽城市的聚类问题。 展开更多
关键词 k—means算法 蚁群聚类算法 公路运输 主枢纽城市
在线阅读 下载PDF
K-means聚类算法的研究 被引量:48
18
作者 韩晓红 胡彧 《太原理工大学学报》 CAS 北大核心 2009年第3期236-239,共4页
为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初... 为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初始聚类中心后,对初值进行数据标准化处理。将改进的K-means算法应用于销售行业,结果显示,改进后的算法比原始的算法在效率上得到了提高。 展开更多
关键词 数据挖掘 k—means算法 初始聚类中心 聚类分析
在线阅读 下载PDF
基于形状相似距离的K-means聚类算法 被引量:9
19
作者 苑津莎 李中 《华北电力大学学报(自然科学版)》 CAS 北大核心 2009年第6期98-103,共6页
把向量作为空间中的物体展开相似度的评估,分析了向量间各维差值与形状差异的间的近似关系,提出了基于形状相似距离的K-means算法。在三个UCI(University of California,Irvine)标准数据集上的聚类结果表明,对于有关形状信息的数据,基... 把向量作为空间中的物体展开相似度的评估,分析了向量间各维差值与形状差异的间的近似关系,提出了基于形状相似距离的K-means算法。在三个UCI(University of California,Irvine)标准数据集上的聚类结果表明,对于有关形状信息的数据,基于形状相似距离的K-means算法比采用传统距离的K-means算法,聚类准确度显著提高。 展开更多
关键词 聚类 k—means算法 相似度 距离 形状
在线阅读 下载PDF
遥感图像K-Means并行算法研究 被引量:16
20
作者 蒋利顺 刘定生 《遥感信息》 CSCD 2008年第1期27-30,115,共5页
K-Means算法是对遥感图像在没有先验知识情况下进行无监督分类的重要算法之一,在遥感影像的分析中得到了广泛的应用。针对K-Means算法复杂,处理过程中计算时间长的缺点,人们试图寻求快速的并行处理方式。在这种并行化的探索过程中,由于K... K-Means算法是对遥感图像在没有先验知识情况下进行无监督分类的重要算法之一,在遥感影像的分析中得到了广泛的应用。针对K-Means算法复杂,处理过程中计算时间长的缺点,人们试图寻求快速的并行处理方式。在这种并行化的探索过程中,由于K-Means算法独特的流程结构,使其并行化处理方式难以顺利进行。本文在分析K-Means算法特点的基础上,对其并行化方式进行了深入的研究。针对K-Means算法并行化在处理速度和分类精度方面存在的问题,提出了一种基于分块逼近的算法并行模型,可兼顾并行效率和分类精度之间的综合要求,实现某种精度可控的并行处理。最后,根据实验结果讨论并提出了迭代算法并行化的有效途径。 展开更多
关键词 遥感 无监督分类 k—means算法 并行算法 数据并行
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部