期刊文献+
共找到98篇文章
< 1 2 5 >
每页显示 20 50 100
An Improved K-Means Algorithm Based on Initial Clustering Center Optimization
1
作者 LI Taihao NAREN Tuya +2 位作者 ZHOU Jianshe REN Fuji LIU Shupeng 《ZTE Communications》 2017年第B12期43-46,共4页
The K-means algorithm is widely known for its simplicity and fastness in text clustering.However,the selection of the initial clus?tering center with the traditional K-means algorithm is some random,and therefore,the ... The K-means algorithm is widely known for its simplicity and fastness in text clustering.However,the selection of the initial clus?tering center with the traditional K-means algorithm is some random,and therefore,the fluctuations and instability of the clustering results are strongly affected by the initial clustering center.This paper proposed an algorithm to select the initial clustering center to eliminate the uncertainty of central point selection.The experiment results show that the improved K-means clustering algorithm is superior to the traditional algorithm. 展开更多
关键词 clustering k-means algorithm initial clustering center
在线阅读 下载PDF
Development of slope mass rating system using K-means and fuzzy c-means clustering algorithms 被引量:1
2
作者 Jalali Zakaria 《International Journal of Mining Science and Technology》 SCIE EI CSCD 2016年第6期959-966,共8页
Classification systems such as Slope Mass Rating(SMR) are currently being used to undertake slope stability analysis. In SMR classification system, data is allocated to certain classes based on linguistic and experien... Classification systems such as Slope Mass Rating(SMR) are currently being used to undertake slope stability analysis. In SMR classification system, data is allocated to certain classes based on linguistic and experience-based criteria. In order to eliminate linguistic criteria resulted from experience-based judgments and account for uncertainties in determining class boundaries developed by SMR system,the system classification results were corrected using two clustering algorithms, namely K-means and fuzzy c-means(FCM), for the ratings obtained via continuous and discrete functions. By applying clustering algorithms in SMR classification system, no in-advance experience-based judgment was made on the number of extracted classes in this system, and it was only after all steps of the clustering algorithms were accomplished that new classification scheme was proposed for SMR system under different failure modes based on the ratings obtained via continuous and discrete functions. The results of this study showed that, engineers can achieve more reliable and objective evaluations over slope stability by using SMR system based on the ratings calculated via continuous and discrete functions. 展开更多
关键词 SMR based on continuous functions Slope stability analysis k-means and FCM clustering algorithms Validation of clustering algorithms Sangan iron ore mines
在线阅读 下载PDF
Similarity matrix-based K-means algorithm for text clustering
3
作者 曹奇敏 郭巧 吴向华 《Journal of Beijing Institute of Technology》 EI CAS 2015年第4期566-572,共7页
K-means algorithm is one of the most widely used algorithms in the clustering analysis. To deal with the problem caused by the random selection of initial center points in the traditional al- gorithm, this paper propo... K-means algorithm is one of the most widely used algorithms in the clustering analysis. To deal with the problem caused by the random selection of initial center points in the traditional al- gorithm, this paper proposes an improved K-means algorithm based on the similarity matrix. The im- proved algorithm can effectively avoid the random selection of initial center points, therefore it can provide effective initial points for clustering process, and reduce the fluctuation of clustering results which are resulted from initial points selections, thus a better clustering quality can be obtained. The experimental results also show that the F-measure of the improved K-means algorithm has been greatly improved and the clustering results are more stable. 展开更多
关键词 text clustering k-means algorithm similarity matrix F-MEASURE
在线阅读 下载PDF
Distance function selection in several clustering algorithms
4
作者 LUYu 《Journal of Chongqing University》 CAS 2004年第1期47-50,共4页
Most clustering algorithms need to describe the similarity of objects by a predefined distance function. Three distance functions which are widely used in two traditional clustering algorithms k-means and hierarchical... Most clustering algorithms need to describe the similarity of objects by a predefined distance function. Three distance functions which are widely used in two traditional clustering algorithms k-means and hierarchical clustering were investigated. Both theoretical analysis and detailed experimental results were given. It is shown that a distance function greatly affects clustering results and can be used to detect the outlier of a cluster by the comparison of such different results and give the shape information of clusters. In practice situation, it is suggested to use different distance function separately, compare the clustering results and pick out the 搒wing points? And such points may leak out more information for data analysts. 展开更多
关键词 distance function clustering algorithms k-means DENDROGRAM data mining
在线阅读 下载PDF
一种基于改进差分进化的K-Means聚类算法研究 被引量:2
5
作者 刘红达 王福顺 +3 位作者 孙小华 张广辉 王斌 何振学 《现代电子技术》 北大核心 2024年第18期156-162,共7页
为改进传统K-Means聚类算法中因随机选取初始聚类中心而导致聚类结果不稳定且效率低的缺点,提出一种基于改进差分进化的K-Means聚类算法(AGDE-KM)。首先,设计自适应操作算子来提升算法前期的全局搜索能力和后期的收敛速度;其次,设计多... 为改进传统K-Means聚类算法中因随机选取初始聚类中心而导致聚类结果不稳定且效率低的缺点,提出一种基于改进差分进化的K-Means聚类算法(AGDE-KM)。首先,设计自适应操作算子来提升算法前期的全局搜索能力和后期的收敛速度;其次,设计多变异策略并引入权重系数,在算法的不同进化阶段发挥不同变异策略的优势,平衡算法的全局和局部搜索能力,加快算法的收敛速度;最后,提出一种基于当前种群最佳个体的高斯扰动交叉操作,为个体提供更优进化方向的同时保持种群在“维”上的多样性,避免算法陷入局部最优。将算法停止执行时输出的最优解作为初始聚类中心替代传统K-Means随机选取的聚类中心。将提出算法在UCI公共数据库中的Vowel、Iris、Glass数据集和合成数据集Jcdx上进行对比实验,误差平方和(SSE)相对于传统K-Means分别减小5.65%、19.59%、13.31%、6.1%,聚类时间分别减少83.03%、81.33%、77.47%、92.63%。实验结果表明,提出的改进算法具有更快的收敛速度和更好的寻优能力,显著提升了聚类的效果、效率和稳定性。 展开更多
关键词 k-means聚类算法 差分进化算法 多变异策略 高斯扰动 UCI数据库 聚类中心优化
在线阅读 下载PDF
基于K-means聚类算法的人事管理异常数据识别和自动处理系统 被引量:1
6
作者 韩晓萃 胡业维 +2 位作者 吴庆艳 胡敏 曾思颖 《电子设计工程》 2024年第24期27-31,共5页
针对人事管理异常数据影响人事管理水平的问题,设计基于K-means聚类算法的人事管理异常数据识别和自动处理系统。利用全局优化K-means聚类算法,对人事管理数据进行聚类处理。该算法搜寻高密度的人事管理数据作为初始聚类中心,将人事管... 针对人事管理异常数据影响人事管理水平的问题,设计基于K-means聚类算法的人事管理异常数据识别和自动处理系统。利用全局优化K-means聚类算法,对人事管理数据进行聚类处理。该算法搜寻高密度的人事管理数据作为初始聚类中心,将人事管理数据聚类为多个簇。利用K-means聚类算法构建人事管理数据的自回归模型,确定人事管理数据参量的转移概率序列。转移概率序列非聚类簇中的数据时,对应数据即为人事管理异常数据识别结果。采用指数加权移动平均数方法自动修正处理所识别的人事管理异常数据。系统测试结果表明,所设计系统能够有效识别人事管理考勤数据、薪资数据中的异常数据,能够自动修正异常数据,使人事管理数据恢复正常。 展开更多
关键词 k-means聚类算法 人事管理 异常数据识别 自动处理系统 聚类中心 转移概率
在线阅读 下载PDF
基于改进K-means算法的大跨屋盖结构表面风荷载分区研究
7
作者 李玉学 杨君保 +1 位作者 陈铁 田玉基 《防灾减灾工程学报》 CSCD 北大核心 2024年第5期1106-1114,共9页
针对K-means算法进行大跨屋盖结构表面风荷载分区中存在的分类数k值需凭经验事先给定以及所有初始聚类中心均需随机选取带来的分类情况数过多、从中寻找最优分类结果工作量大且效率低的问题,提出基于改进K-means算法的大跨屋盖结构表面... 针对K-means算法进行大跨屋盖结构表面风荷载分区中存在的分类数k值需凭经验事先给定以及所有初始聚类中心均需随机选取带来的分类情况数过多、从中寻找最优分类结果工作量大且效率低的问题,提出基于改进K-means算法的大跨屋盖结构表面风荷载分区方法。首先,建立分类数k与其相应测点风荷载的误差平方和(Sum of the Squared Errors:SSE)关系曲线,引入手肘法基本思想,实现最优分类数kst值的精准识别;其次,在首个初始聚类中心随机选取基础上,引入轮盘法基本思想,完成对剩余初始聚类中心的高效选取;然后,根据类内紧凑、类间分散的原则,通过类内紧凑性判定指标S(k)和类间分散性判定指标D(k),构造并借助SD(k)值有效性检验,得到最优的风荷载分区结果;最后,以北京奥林匹克网球中心大跨悬挑屋盖结构为例,针对风洞试验所得风荷载测试结果,采用所提方法对其表面最不利风压系数进行分区计算,并与传统K-means算法进行对比,结果表明,所提方法能够高效实现大跨屋盖结构表面风压分区计算,具有较好的工程应用价值。 展开更多
关键词 大跨屋盖结构 风荷载分区 k-means算法 分类数 聚类中心
在线阅读 下载PDF
基于AP聚类算法的RBF神经网络风速预测方法的研究
8
作者 李昊 张煜成 《太阳能》 2025年第2期54-61,共8页
近年来,江苏地区在迎峰度夏期间出现了较大的电能供给缺口,电力系统频率失稳的风险增加,因此,在电力保供工作中,稳定的风电输出功率愈发重要。考虑到风能的随机性和间歇性,准确的风速预测可以降低风电入网时的附加成本,协助电力系统调... 近年来,江苏地区在迎峰度夏期间出现了较大的电能供给缺口,电力系统频率失稳的风险增加,因此,在电力保供工作中,稳定的风电输出功率愈发重要。考虑到风能的随机性和间歇性,准确的风速预测可以降低风电入网时的附加成本,协助电力系统调度部门调整调度计划,提升电力系统的风电消纳与稳定运行能力。从提高超短期风速预测精度的角度出发,提出了1种基于近邻传播(AP)聚类算法的径向基函数(RBF)神经网络风速预测方法(即“AP-RBF方法”)。首先建立AP-RBF模型,然后以江苏地区某风电场实地采集的实际风速数据为例进行算例分析,对AP-RBF模型的预测效果进行了验证,并对各类预测方法的预测精度和预测效率进行了对比分析。研究结果表明:1)AP-RBF方法通过采用“先计算聚类结果,再计算权值矩阵”的预测模式,克服了传统聚类方法对初值敏感的缺点。2)与常规预测方法相比,AP-RBF方法在整体预测精度上表现最佳,且在保证训练数据质量的基础上具有较快的预测速度。AP-RBF方法的应用对提高风电消纳能力与电力系统频率稳定性具有重要意义。 展开更多
关键词 清洁能源 风速 风电 近邻传播聚类算法 径向基函数神经网络 风速预测 精度分析
在线阅读 下载PDF
基于最小生成树的层次K-means聚类算法 被引量:18
9
作者 贾瑞玉 李振 《微电子学与计算机》 CSCD 北大核心 2016年第3期86-88,93,共4页
针对K-means算法初始化时需要指定聚类数目,和随机选择初始聚类中心对聚类结果产生不稳定的问题,结合图论中最小生成树和层次算法的分裂、凝聚思想,提出一种基于最小生成树的层次K-means算法.该算法初始时根据数据样本生成一颗最小生成... 针对K-means算法初始化时需要指定聚类数目,和随机选择初始聚类中心对聚类结果产生不稳定的问题,结合图论中最小生成树和层次算法的分裂、凝聚思想,提出一种基于最小生成树的层次K-means算法.该算法初始时根据数据样本生成一颗最小生成树,然后利用层次分裂思想把数据分成多个较小的簇,通过K-means算法迭代操作得到每次操作的评价函数值来判断是否进行簇的合并,进一步确定聚类簇数目.实验结果证明,该算法能够较准确地判断聚类数目,并且聚类结果的稳定性比基本K-means算法要好. 展开更多
关键词 k-means算法 聚类簇数 初始聚类中心 层次结构 最小生成树 PRIM算法
在线阅读 下载PDF
一种改进的特征加权K-means聚类算法 被引量:12
10
作者 王慧 申石磊 《微电子学与计算机》 CSCD 北大核心 2010年第7期161-163,167,共4页
提出了一种改进的特征加权K-means聚类算法.该算法首先基于数据样本分布选取初始聚类中心,然后设计特征加权的K-means聚类算法.实验结果证明,该算法能产生质量较高的聚类结果,并且能处理数值、符号两类数据.
关键词 聚类 k-means算法 聚类中心 特征加权
在线阅读 下载PDF
K-means聚类算法中聚类个数的方法研究 被引量:19
11
作者 刘飞 唐雅娟 刘瑶 《电子设计工程》 2017年第15期9-13,共5页
在数据挖掘算法中,K均值聚类算法是一种比较常见的无监督学习方法,簇间数据对象越相异,簇内数据对象越相似,说明该聚类效果越好。然而,簇个数的选取通常是由有经验的用户预先进行设定的参数。本文提出了一种能够自动确定聚类个数,采用SS... 在数据挖掘算法中,K均值聚类算法是一种比较常见的无监督学习方法,簇间数据对象越相异,簇内数据对象越相似,说明该聚类效果越好。然而,簇个数的选取通常是由有经验的用户预先进行设定的参数。本文提出了一种能够自动确定聚类个数,采用SSE和簇的个数进行度量,提出了一种聚类个数自适应的聚类方法(简称:SKKM)。通过UCI数据和仿真数据对象的实验,对SKKM算法进行了验证,实验结果表明改进的算法可以快速的找到数据对象中聚类个数,提高了算法的性能。 展开更多
关键词 k-means算法 聚类个数 初始聚类中心 数据挖掘 k-means算法改进
在线阅读 下载PDF
基于密度和聚类指数改进的K-means算法 被引量:10
12
作者 毛秀 冒纯丽 丁岳伟 《电子科技》 2015年第11期47-50,64,共5页
传统K-means算法中,随机选择到的初始聚类中心不同会得到不一样的簇类,人工给定的k值与实际聚类数较难达到一致,针对这些问题,文中提出了基于密度和聚类指数改进的K-means聚类算法。根据密度获取高密度集HP,从此集合中选择相互之间距离... 传统K-means算法中,随机选择到的初始聚类中心不同会得到不一样的簇类,人工给定的k值与实际聚类数较难达到一致,针对这些问题,文中提出了基于密度和聚类指数改进的K-means聚类算法。根据密度获取高密度集HP,从此集合中选择相互之间距离最大的两对对象均值当成第一轮聚类的聚类中心,新的聚类中心可通过最大距离积法获取,并参考聚类指数确定合适的k值。通过进行实验确认了该算法有较高的准确性和有效性。 展开更多
关键词 K-均值算法 初始聚类中心 高密度集 最大距离积法 聚类指数
在线阅读 下载PDF
基于K-means算法的电子商务客户细分研究 被引量:10
13
作者 黄亚萍 李垣江 《电子设计工程》 2017年第2期63-66,70,共5页
文章将数据挖掘技术引入电子商务领域的客户细分研究,为了从客户信息中挖掘出潜在的信息,并对客户进行分类管理,本文采用了聚类算法中基于半监督近邻传播的K-means算法运用于某服装电子商务网站进行客户细分,并详细介绍了新算法的改进... 文章将数据挖掘技术引入电子商务领域的客户细分研究,为了从客户信息中挖掘出潜在的信息,并对客户进行分类管理,本文采用了聚类算法中基于半监督近邻传播的K-means算法运用于某服装电子商务网站进行客户细分,并详细介绍了新算法的改进过程、实现流程以及通过对某服装电子商务网站数据信息的具体试验,验证其算法改进后的有效优势,具体表现在对数据集中的噪声点能进行有效的排除,并能获取较为精准的初始聚类中心,以提高聚类质量,同时极大的提升了聚类的准确率和各聚类之间的紧密度。 展开更多
关键词 聚类算法 k-means算法 ap算法 客户细分
在线阅读 下载PDF
基于划分的数据挖掘K-means聚类算法分析 被引量:19
14
作者 曾俊 《现代电子技术》 北大核心 2020年第3期14-17,共4页
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K⁃means算法的基础上,提出一种改进的K⁃means算法。首先将整体数据集分为k类,然后设定一个密度参数为ϑ,该密度参数反映数据库中数据所处区域的密度大小,ϑ值与密度大小成... 为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K⁃means算法的基础上,提出一种改进的K⁃means算法。首先将整体数据集分为k类,然后设定一个密度参数为ϑ,该密度参数反映数据库中数据所处区域的密度大小,ϑ值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K⁃means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。 展开更多
关键词 数据挖掘 聚类分析 K⁃means聚类算法 聚类中心选取 K⁃means算法改进 初始中心点
在线阅读 下载PDF
一种优化初始中心的改进K-means算法 被引量:2
15
作者 赵京胜 韩凌霄 孙宇航 《青岛理工大学学报》 CAS 2015年第6期99-102,共4页
传统的K-means算法由于随机选取初始簇中心,造成聚类结果不稳定,容易陷入局部最优.针对这个问题,提出了一种优化初始中心的方法,即在高密度区域中以距离最远的两点作为初始的簇中心,然后再找到这两个初始中心距离和最大的点作为第3个初... 传统的K-means算法由于随机选取初始簇中心,造成聚类结果不稳定,容易陷入局部最优.针对这个问题,提出了一种优化初始中心的方法,即在高密度区域中以距离最远的两点作为初始的簇中心,然后再找到这两个初始中心距离和最大的点作为第3个初始中心,依此类推,直到找到k个初始中心.实验结果证明,改进的K-means算法,有较好的准确率,能够消除算法对初始中心的依赖,提高了聚类效果. 展开更多
关键词 k-means算法 初始聚类中心 高密度区域 最大距离
在线阅读 下载PDF
一种改进的简化均值粒子群K-means聚类算法 被引量:11
16
作者 靳雁霞 齐欣 +1 位作者 张晋瑞 程琦甫 《微电子学与计算机》 北大核心 2020年第5期69-74,共6页
针对粒子群优化算法容易陷入局部最优且K-means算法受聚类数及初始聚类中心的选取影响较大,提出了一种改进的简化均值粒子群K-means优化聚类算法(ISMPSO-AKM).一方面,在简化粒子群算法的基础上,加入邻域最优粒子,由个体最优位置、全局... 针对粒子群优化算法容易陷入局部最优且K-means算法受聚类数及初始聚类中心的选取影响较大,提出了一种改进的简化均值粒子群K-means优化聚类算法(ISMPSO-AKM).一方面,在简化粒子群算法的基础上,加入邻域最优粒子,由个体最优位置、全局最优位置及邻域最优位置线性组合改进位置公式.另一方面,构造一种基于余弦函数和对数函数的惯性权重,实现对惯性权重的动态调整.此外,引入AKM聚类算法确定聚类数,动态获取初始中心,进一步提高算法的准确性.仿真实验表明,改进的ISMPSO-AKM算法具有更快的收敛速度,更高的求解精度及更稳定的聚类结果. 展开更多
关键词 粒子群优化算法 简化粒子群 邻域最优粒子 k-means聚类 聚类数 初始聚类中心
在线阅读 下载PDF
基于密度的K-means初始聚类中心选取算法 被引量:8
17
作者 韩凌波 《电子科技》 2015年第7期105-107,共3页
传统K-means算法的初始聚类中心从数据集中随机抽取,聚类结果会随着初始聚类中心的不同而产生波动。针对这一问题,提出一种基于密度的优化初始聚类中心选取算法,通过计算每个数据对象的密度参数和邻域距离,选取k个处于高密度分布的点作... 传统K-means算法的初始聚类中心从数据集中随机抽取,聚类结果会随着初始聚类中心的不同而产生波动。针对这一问题,提出一种基于密度的优化初始聚类中心选取算法,通过计算每个数据对象的密度参数和邻域距离,选取k个处于高密度分布的点作为初始聚类中心。在聚类类别数给定的情况下,使用标准的UCI数据库进行对比实验,发现改进后的算法较传统算法有相对较高的准确率和稳定性。 展开更多
关键词 k-means算法 聚类中心 密度参数 邻域距离
在线阅读 下载PDF
一种有效的K-means初始中心优化算法 被引量:3
18
作者 赵京胜 孙梦丹 张丽 《信息技术与信息化》 2016年第5期77-79,共3页
局部最优是K-means算法最容易形成的一个问题,所以聚类结果会大大受初始中心的波及。。针对这一问题,找到了改进初始聚类中心的新方法:首先,选择高密度区域内距离最远的两个点为初始中心,然后将第3个初始中心位置规定在与已知初始聚类... 局部最优是K-means算法最容易形成的一个问题,所以聚类结果会大大受初始中心的波及。。针对这一问题,找到了改进初始聚类中心的新方法:首先,选择高密度区域内距离最远的两个点为初始中心,然后将第3个初始中心位置规定在与已知初始聚类中心距离乘积最大的点上,以此类推,直到找到k个初始中心。实验证明,此算法有更快的收敛速度,生成的结果稳定性更强,正确率更高。 展开更多
关键词 k-means算法 初始聚类中心 最大距离 密度 乘积最大
在线阅读 下载PDF
基于近邻传播算法的K-means聚类优化算法 被引量:1
19
作者 朱兰 张晓焱 《信息技术与信息化》 2015年第2期138-142,147,共6页
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生... K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。 展开更多
关键词 聚类 K—means算法 近邻传播算法 聚类中心
在线阅读 下载PDF
K-means算法聚类中心选取 被引量:25
20
作者 张朝 郭秀娟 张坤鹏 《吉林大学学报(信息科学版)》 CAS 2019年第4期437-441,共5页
传统K-means算法对于聚类初始点的选取和距离度量的计算异常敏感,因而很可能导致K-means算法只能收敛得到局部最优解。为此,提出一种改进的K-means算法,即K-means聚类算法最优匹配算法,并进行了相关的算法实验分析。该改进算法首先对传... 传统K-means算法对于聚类初始点的选取和距离度量的计算异常敏感,因而很可能导致K-means算法只能收敛得到局部最优解。为此,提出一种改进的K-means算法,即K-means聚类算法最优匹配算法,并进行了相关的算法实验分析。该改进算法首先对传统的K-means聚类算法进行初始点的选取,并分析聚类结果。然后,分别从初始聚类中心的选择和距离算法的确定进行实验测试,引入轮廓系数评价聚类效果,分析实验结果可知,K-means聚类算法最优匹配算法具有较好的稳定性和较高的聚类准确率。 展开更多
关键词 k-means算法 聚类中心 聚类分析
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部