期刊文献+
共找到195篇文章
< 1 2 10 >
每页显示 20 50 100
基于交通拥堵信息的高速公路拥堵路段ACK-Means聚类
1
作者 陈昕 阮永娇 肇毓 《科学技术与工程》 北大核心 2024年第21期9194-9200,共7页
为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇... 为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇类密度、簇类间距以及簇类强度,同时又考虑到数据样本的偶然性,对离群点进行合理分配,ACK-Means算法可实现自适应确定聚类中心C和类别K值。基于实际交通拥堵信息构建数据集,Python编程实现高速公路拥堵路段ACK-Means聚类,巧妙解决了高速公路拥堵路段聚类数目K和聚类中心C设定问题。聚类结果表明,ACK-Means算法实现高速公路拥堵路段无监督聚类,聚类结果完全基于实际的高速公路交通拥堵信息,具有更高的实用性。 展开更多
关键词 交通拥堵聚类 ACk-means算法 自适应聚类中心 自适应K值 交通拥堵信息
在线阅读 下载PDF
一种基于改进差分进化的K-Means聚类算法研究 被引量:5
2
作者 刘红达 王福顺 +3 位作者 孙小华 张广辉 王斌 何振学 《现代电子技术》 北大核心 2024年第18期156-162,共7页
为改进传统K-Means聚类算法中因随机选取初始聚类中心而导致聚类结果不稳定且效率低的缺点,提出一种基于改进差分进化的K-Means聚类算法(AGDE-KM)。首先,设计自适应操作算子来提升算法前期的全局搜索能力和后期的收敛速度;其次,设计多... 为改进传统K-Means聚类算法中因随机选取初始聚类中心而导致聚类结果不稳定且效率低的缺点,提出一种基于改进差分进化的K-Means聚类算法(AGDE-KM)。首先,设计自适应操作算子来提升算法前期的全局搜索能力和后期的收敛速度;其次,设计多变异策略并引入权重系数,在算法的不同进化阶段发挥不同变异策略的优势,平衡算法的全局和局部搜索能力,加快算法的收敛速度;最后,提出一种基于当前种群最佳个体的高斯扰动交叉操作,为个体提供更优进化方向的同时保持种群在“维”上的多样性,避免算法陷入局部最优。将算法停止执行时输出的最优解作为初始聚类中心替代传统K-Means随机选取的聚类中心。将提出算法在UCI公共数据库中的Vowel、Iris、Glass数据集和合成数据集Jcdx上进行对比实验,误差平方和(SSE)相对于传统K-Means分别减小5.65%、19.59%、13.31%、6.1%,聚类时间分别减少83.03%、81.33%、77.47%、92.63%。实验结果表明,提出的改进算法具有更快的收敛速度和更好的寻优能力,显著提升了聚类的效果、效率和稳定性。 展开更多
关键词 k-means聚类算法 差分进化算法 多变异策略 高斯扰动 UCI数据库 聚类中心优化
在线阅读 下载PDF
基于改进K-means算法的大跨屋盖结构表面风荷载分区研究 被引量:1
3
作者 李玉学 杨君保 +1 位作者 陈铁 田玉基 《防灾减灾工程学报》 CSCD 北大核心 2024年第5期1106-1114,共9页
针对K-means算法进行大跨屋盖结构表面风荷载分区中存在的分类数k值需凭经验事先给定以及所有初始聚类中心均需随机选取带来的分类情况数过多、从中寻找最优分类结果工作量大且效率低的问题,提出基于改进K-means算法的大跨屋盖结构表面... 针对K-means算法进行大跨屋盖结构表面风荷载分区中存在的分类数k值需凭经验事先给定以及所有初始聚类中心均需随机选取带来的分类情况数过多、从中寻找最优分类结果工作量大且效率低的问题,提出基于改进K-means算法的大跨屋盖结构表面风荷载分区方法。首先,建立分类数k与其相应测点风荷载的误差平方和(Sum of the Squared Errors:SSE)关系曲线,引入手肘法基本思想,实现最优分类数kst值的精准识别;其次,在首个初始聚类中心随机选取基础上,引入轮盘法基本思想,完成对剩余初始聚类中心的高效选取;然后,根据类内紧凑、类间分散的原则,通过类内紧凑性判定指标S(k)和类间分散性判定指标D(k),构造并借助SD(k)值有效性检验,得到最优的风荷载分区结果;最后,以北京奥林匹克网球中心大跨悬挑屋盖结构为例,针对风洞试验所得风荷载测试结果,采用所提方法对其表面最不利风压系数进行分区计算,并与传统K-means算法进行对比,结果表明,所提方法能够高效实现大跨屋盖结构表面风压分区计算,具有较好的工程应用价值。 展开更多
关键词 大跨屋盖结构 风荷载分区 k-means算法 分类数 聚类中心
在线阅读 下载PDF
基于改进AP聚类和双重注意力机制的区域级新能源超短期出力预测方法 被引量:1
4
作者 苏华英 林晨 +3 位作者 张俨 王融融 程春田 张俊涛 《广东电力》 北大核心 2025年第3期8-17,共10页
为提高新能源超短期出力预测的准确性,充分考虑电源的时空互补特性和关键气象信息,提出基于改进近邻传播(affinity propagation,AP)聚类和双重注意力机制的区域级新能源超短期出力预测方法。首先,建立电站之间互补性的评价指标,并计算... 为提高新能源超短期出力预测的准确性,充分考虑电源的时空互补特性和关键气象信息,提出基于改进近邻传播(affinity propagation,AP)聚类和双重注意力机制的区域级新能源超短期出力预测方法。首先,建立电站之间互补性的评价指标,并计算统计区域电站的互补性矩阵,利用改进AP聚类算法对区域电站进行空间聚类;然后,引入时序和特征2个维度的注意力机制,捕捉汇聚区的关键气象特征;最后,以此为基础建立基于双向长短期记忆网络的新能源出力超短期预测模型。实际数据验证所提预测方法相比于区域整体预测及传统AP聚类预测具有更高的精度。同时,与传统相关系数方法对比表明,融合注意力机制的预测模型更能有效捕捉汇聚区的气象特征。 展开更多
关键词 新能源出力 超短期预测 近邻传播聚类 双向长短期记忆 注意力机制
在线阅读 下载PDF
初始聚类中心优化的k-means算法 被引量:157
5
作者 袁方 周志勇 宋鑫 《计算机工程》 CAS CSCD 北大核心 2007年第3期65-66,共2页
传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表... 传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表明改进后的k-means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性。 展开更多
关键词 数据挖掘 聚类 k-means算法 聚类中心
在线阅读 下载PDF
K-means算法初始聚类中心选择的优化 被引量:51
6
作者 冯波 郝文宁 +1 位作者 陈刚 占栋辉 《计算机工程与应用》 CSCD 2013年第14期182-185,192,共5页
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得... 针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 K—means算法 聚类 初始聚类中心 TDKM算法
在线阅读 下载PDF
一种改进的k-means初始聚类中心选取算法 被引量:94
7
作者 韩凌波 王强 +1 位作者 蒋正锋 郝志强 《计算机工程与应用》 CSCD 北大核心 2010年第17期150-152,共3页
在传统的k-means聚类算法中,聚类结果会随着初始聚类中心点的不同而波动,针对这个缺点,提出一种优化初始聚类中心的算法。该算法通过计算每个数据对象的密度参数,然后选取k个处于高密度分布的点作为初始聚类中心。实验表明,在聚类类别... 在传统的k-means聚类算法中,聚类结果会随着初始聚类中心点的不同而波动,针对这个缺点,提出一种优化初始聚类中心的算法。该算法通过计算每个数据对象的密度参数,然后选取k个处于高密度分布的点作为初始聚类中心。实验表明,在聚类类别数给定的情况下,通过用标准的UCI数据库进行实验比较,发现采用改进后方法选取的初始类中心的k-means算法比随机选取初始聚类中心算法有相对较高的准确率和稳定性。 展开更多
关键词 k-means算法 聚类中心 密度参数
在线阅读 下载PDF
对k-means初始聚类中心的优化 被引量:29
8
作者 仝雪姣 孟凡荣 王志晓 《计算机工程与设计》 CSCD 北大核心 2011年第8期2721-2723,2788,共4页
针对传统k-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布选取初始聚类中心的改进k-means算法。该算法利用贪心思想构建K个数据集合,集合的大小与数据的实际分布密切相关,集合中的数据彼此间相互靠近。取集合中数据的平均... 针对传统k-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布选取初始聚类中心的改进k-means算法。该算法利用贪心思想构建K个数据集合,集合的大小与数据的实际分布密切相关,集合中的数据彼此间相互靠近。取集合中数据的平均值作为初始聚类中心,由此得到的初始聚类中心非常接近迭代聚类算法期待的聚类中心。理论分析和实验结果表明,改进算法能改善其聚类性能,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 聚类 k-means算法 数据分布 初始聚类中心 改进算法
在线阅读 下载PDF
基于最优划分的K-Means初始聚类中心选取算法 被引量:62
9
作者 张健沛 杨悦 +1 位作者 杨静 张泽宝 《系统仿真学报》 CAS CSCD 北大核心 2009年第9期2586-2590,共5页
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自... 针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率。实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高。 展开更多
关键词 K—Means算法 初始聚类中心 直方图 最优划分方法
在线阅读 下载PDF
一种有效的K-means聚类中心初始化方法 被引量:87
10
作者 熊忠阳 陈若田 张玉芳 《计算机应用研究》 CSCD 北大核心 2011年第11期4188-4190,共3页
传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上... 传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上,选取到所有已初始化聚类中心距离乘积最大的高密度点作为当前聚类中心。理论分析与对比实验结果表明,此方法相对于传统K-means算法和最大最小距离法有更快的收敛速度、更高的准确率和更强的稳定性。 展开更多
关键词 K-均值算法 基于密度 初始聚类中心 最大最小距离 最大距离积
在线阅读 下载PDF
基于全局中心的高密度不唯一的K-means算法研究 被引量:10
11
作者 何云斌 刘雪娇 +2 位作者 王知强 万静 李松 《计算机工程与应用》 CSCD 北大核心 2016年第1期48-54,共7页
传统的K-means算法敏感于初始中心点的选取,并且无法事先确定准确的聚类数目k,不利于聚类结果的稳定性。针对传统K-means算法的以上不足,提出了基于全局中心的高密度不唯一的新方法——NDK-means,该方法通过标准差确定有效密度半径,并... 传统的K-means算法敏感于初始中心点的选取,并且无法事先确定准确的聚类数目k,不利于聚类结果的稳定性。针对传统K-means算法的以上不足,提出了基于全局中心的高密度不唯一的新方法——NDK-means,该方法通过标准差确定有效密度半径,并从高密度区域中选取具有代表性的样本点作为初始聚类中心。此外算法针对最高密度点不唯一的情况进行特别分析,选取距离全局中心最远的点集作为最优的初始中心点集合。在NDK-means算法基础上结合有效性指标BWP对聚类结果进行分析,从而解决了最佳有效聚类数目无法事先确定的不足。理论研究与实验结果表明所提方法的聚类结果具有更好的稳定性和可行性。 展开更多
关键词 k-means算法 初始中心 聚类数 基于密度
在线阅读 下载PDF
最小方差优化初始聚类中心的K-means算法 被引量:91
12
作者 谢娟英 王艳娥 《计算机工程》 CAS CSCD 2014年第8期205-211,223,共8页
传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性。为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法。该... 传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性。为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法。该算法运用样本空间分布信息,通过计算样本空间分布的方差得到样本紧密度信息,选择方差最小(即紧密度最高)且相距一定距离的样本作为初始聚类中心,实现优化的K-means聚类。在UCI机器学习数据库数据集和含有噪音的人工模拟数据集上的实验结果表明,该算法不仅能得到较好的聚类结果,且聚类结果稳定,对噪音具有较强的免疫性能。 展开更多
关键词 聚类 k-means算法 方差 紧密度 初始聚类中心
在线阅读 下载PDF
一种新的k-means聚类中心选取算法 被引量:20
13
作者 黄敏 何中市 +1 位作者 邢欣来 陈英 《计算机工程与应用》 CSCD 北大核心 2011年第35期132-134,共3页
在2010年提出已有的k-means聚类中心选取算法的基础上进行改进。通过计算样本间的距离求出每个样本的密度参数,选取最大密度参数值所对应的样本作为初始聚类中心。当最大密度参数值不惟一时,提出合理选取最大密度参数值的解决方案,依次... 在2010年提出已有的k-means聚类中心选取算法的基础上进行改进。通过计算样本间的距离求出每个样本的密度参数,选取最大密度参数值所对应的样本作为初始聚类中心。当最大密度参数值不惟一时,提出合理选取最大密度参数值的解决方案,依次求出k个初始聚类中心点,由此提出了一种新的k-means聚类中心选取算法。实验证明,提出的算法与对比算法相比具有更高的准确率。 展开更多
关键词 k-means算法 聚类中心 密度参数
在线阅读 下载PDF
K-means算法的初始聚类中心的优化 被引量:75
14
作者 赖玉霞 刘建平 《计算机工程与应用》 CSCD 北大核心 2008年第10期147-149,共3页
传统的K-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动,针对K-means算法存在的问题,提出了基于密度的改进的K-means算法,该算法采取聚类对象分布密度方法来确定初始聚类中心,选择相互距离最远的K个处于高密度区域的点... 传统的K-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动,针对K-means算法存在的问题,提出了基于密度的改进的K-means算法,该算法采取聚类对象分布密度方法来确定初始聚类中心,选择相互距离最远的K个处于高密度区域的点作为初始聚类中心,理论分析与实验结果表明,改进的算法能取得更好的聚类结果。 展开更多
关键词 聚类 k-means算法 密度 聚类中心 高密度区域
在线阅读 下载PDF
基于改进K-means算法的微博舆情分析研究 被引量:17
15
作者 谢修娟 李香菊 莫凌飞 《计算机工程与科学》 CSCD 北大核心 2018年第1期155-158,共4页
为避免初始聚类中心选取到孤立点容易导致聚类结果陷入局部最优的不足,提出一种基于密度的K-means(聚类算法)初始聚类中心选择方法。该方法首先计算每个数据对象与其它数据对象间的平均相似度,找出平均相似度高于某固定阈值的对象视作... 为避免初始聚类中心选取到孤立点容易导致聚类结果陷入局部最优的不足,提出一种基于密度的K-means(聚类算法)初始聚类中心选择方法。该方法首先计算每个数据对象与其它数据对象间的平均相似度,找出平均相似度高于某固定阈值的对象视作核心对象,再从核心对象中选取彼此间最不相似的作为初始聚类中心。通过自构建的新浪微博抓取工具,分别抓取不同类别的数千条数据,经过分词、预处理及权重计算后,用改进的K-means算法对其进行聚类分析,查准/全率较传统的K-means算法要稳定,聚类的平均时间也得到缩短。实验结果表明,改进后的算法在微博聚类中有更高的准确性和稳定性,有利于从大量的微博数据中发现热点舆情。 展开更多
关键词 微博 聚类中心 k-means聚类算法 密度
在线阅读 下载PDF
优化初始聚类中心的改进k-means算法 被引量:59
16
作者 张靖 段富 《计算机工程与设计》 CSCD 北大核心 2013年第5期1691-1694,1699,共5页
传统k-means算法随机选取初始聚类中心使聚类结果不稳定,诸多优化算法的时间复杂度较高,为了提高聚类稳定性并降低时间复杂度,提出了基于个体轮廓系数自适应地选取优秀样本以确定初始聚类中心的改进k-means算法。该算法多次调用传统k-me... 传统k-means算法随机选取初始聚类中心使聚类结果不稳定,诸多优化算法的时间复杂度较高,为了提高聚类稳定性并降低时间复杂度,提出了基于个体轮廓系数自适应地选取优秀样本以确定初始聚类中心的改进k-means算法。该算法多次调用传统k-means算法聚类,根据k个类中心的个体轮廓系数以及各样本与类中心的距离,自适应地选取优秀样本,求其均值作为初始聚类中心。在多个UCI数据集上的实验表明,该算法聚类时间短,具有较高的轮廓系数和准确率。 展开更多
关键词 聚类 K均值算法 初始聚类中心 个体轮廓系数 自适应
在线阅读 下载PDF
一种结合K-means均匀分簇和数据回归的WSN能量均衡策略 被引量:13
17
作者 叶继华 万叶晶 +1 位作者 刘长红 王仕民 《小型微型计算机系统》 CSCD 北大核心 2017年第8期1688-1692,共5页
针对LEACH协议簇头节点分布不均导致无线传感网节点能量消耗不均衡等不足,提出一种结合K-means均匀分簇和数据回归的能量均衡策略.采用优化初始簇中心K-means算法构建均匀分簇的分级无线传感网,通过获取节点地理位置信息,采用K-means聚... 针对LEACH协议簇头节点分布不均导致无线传感网节点能量消耗不均衡等不足,提出一种结合K-means均匀分簇和数据回归的能量均衡策略.采用优化初始簇中心K-means算法构建均匀分簇的分级无线传感网,通过获取节点地理位置信息,采用K-means聚类算法形成k个均匀分簇,再选举簇内节点剩余能量最多者当选簇头.该成簇算法可以使网络负载均匀,延长网络生存周期.通过优化初始簇中心的选择,降低K-means算法的迭代次数,使其更快收敛,成簇时间开销更少,簇与簇之间的地理分布也更均匀.在稳定数据传输阶段,采用数据回归的方法来减少普通节点与簇首的通信量,以达到降低功耗的作用.实验结果表明,该策略能够有效降低节点的功耗,延长网络的生存时间. 展开更多
关键词 k-means算法 均匀分簇 优化初始簇中心 数据回归
在线阅读 下载PDF
基于改进K-means聚类算法的组合模型建模 被引量:18
18
作者 杨慧中 董陶 陶洪峰 《控制工程》 CSCD 北大核心 2013年第2期201-203,208,共4页
在传统的K-means聚类算法中,初始聚类是随机选取的,其聚类结果易随着不同的初始聚类中心波动。针对这一问题,首先采用最大距离积法对传统K-means聚类算法的初始聚类中心进行了优化。同时定义了一种新的目标函数并将其引用到传统的K-mean... 在传统的K-means聚类算法中,初始聚类是随机选取的,其聚类结果易随着不同的初始聚类中心波动。针对这一问题,首先采用最大距离积法对传统K-means聚类算法的初始聚类中心进行了优化。同时定义了一种新的目标函数并将其引用到传统的K-means聚类算法中,以实现对聚类结构类别数K的优化选择。将训练集样本数据经上述方法聚类后,再将各个子类分别建立基于支持向量机的子模型,通过开关切换的方式连接各子模型得到组合的支持向量机模型。将该方法应用于双酚A生产过程的缩合反应单元溶解罐出口苯酚含量的软测量建模。工业实例仿真结果表明:该算法能较好地跟踪苯酚含量的变化趋势,有效地改善了数据分类效果,提高了软测量模型的估计精度,显示了它在工业领域的应用潜力。 展开更多
关键词 k-means聚类算法 目标函数 初始聚类中心 组合支持向量机
在线阅读 下载PDF
可变网格优化的K-means聚类方法 被引量:10
19
作者 万静 张超 +1 位作者 何云斌 李松 《小型微型计算机系统》 CSCD 北大核心 2018年第1期95-99,共5页
传统k-means算法需要人为指定聚类数k,对初始中心点的选取比较敏感,只能发现球状簇.针对k-means算法的不足,提出了基于可变网格优化的k-means聚类算法,该算法通过可变网格划分解决了随机选取初始中心点不具有代表性的问题,同时排除了噪... 传统k-means算法需要人为指定聚类数k,对初始中心点的选取比较敏感,只能发现球状簇.针对k-means算法的不足,提出了基于可变网格优化的k-means聚类算法,该算法通过可变网格划分解决了随机选取初始中心点不具有代表性的问题,同时排除了噪声的干扰.此外,针对最大密度不唯一的情况进行了研究,选取各距离最大的类簇为最优类簇.最后,基于可变网格优化的k-means算法结合BWP指标对最佳聚类数进行了优化,解决了最佳聚类数事先无法确定的问题.理论和实验结果表明,基于可变网格优化的k-means算法具有更好的有效性和可行性. 展开更多
关键词 k-means聚类算法 可变网格 初始中心点 BWP指标
在线阅读 下载PDF
基于学术文献同被引分析的K-means算法改进研究 被引量:4
20
作者 吴夙慧 成颖 +1 位作者 郑彦宁 潘云涛 《情报学报》 CSSCI 北大核心 2012年第1期82-94,共13页
K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被... K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类。算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K—means算法的初始聚类中心。第二步聚类则依据文献内容实现K-means算法。实验通过与经典K—means算法和基于凝聚层次聚类算法的改进K—means算法的对比,证明了本文提出的改进的K—means算法具备更优的聚类效果。 展开更多
关键词 K—means算法 K值 初始聚类中心 同被引 文献聚类
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部