期刊文献+
共找到494篇文章
< 1 2 25 >
每页显示 20 50 100
基于样本空间分布密度的初始聚类中心优化K-均值算法 被引量:53
1
作者 谢娟英 郭文娟 +1 位作者 谢维信 高新波 《计算机应用研究》 CSCD 北大核心 2012年第3期888-892,共5页
针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定... 针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定义了数据对象的邻域;在此基础上选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K-均值聚类。UCI机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集的实验测试证明,本算法不仅具有很好的聚类效果,而且运行时间短,对噪声数据有很强的抗干扰性能。基于样本空间分布密度的初始聚类中心优化K-均值算法优于传统K-均值聚类算法和已有的相关K-均值初始中心优化算法。 展开更多
关键词 k-均值 初始中心 邻域 样本分布密度
在线阅读 下载PDF
基于密度加权的粗糙K-均值聚类改进算法 被引量:25
2
作者 郑超 苗夺谦 王睿智 《计算机科学》 CSCD 北大核心 2009年第3期220-222,共3页
针对粗糙K-均值聚类算法中类均值计算式的特点,提出了一种改进的粗糙K-均值算法。改进后的算法基于数据对象所在区域的密度,在类的均值计算过程中对每个对象赋以不同的权重。不同测试数据集的实验结果表明,改进后的粗糙K-均值算法提高... 针对粗糙K-均值聚类算法中类均值计算式的特点,提出了一种改进的粗糙K-均值算法。改进后的算法基于数据对象所在区域的密度,在类的均值计算过程中对每个对象赋以不同的权重。不同测试数据集的实验结果表明,改进后的粗糙K-均值算法提高了聚类的准确性,降低了迭代次数,并且可以有效地减小孤立点对聚类的影响。 展开更多
关键词 算法 粗糙k-均值 密度 孤立点
在线阅读 下载PDF
一种基于核数据变换方法的遥感图像谱聚类算法
3
作者 赵海军 陈华月 崔梦天 《林业工程学报》 北大核心 2025年第2期130-137,共8页
随着遥感图像在各行各业的日益广泛应用,遥感图像的处理变得愈来愈重要。为了实现谱聚类算法应用于林业工程中的遥感图像处理,本研究提出了一种基于核数据变换和角距离度量的谱聚类新算法。首先,通过对基于多变量核特征提取的一般核熵... 随着遥感图像在各行各业的日益广泛应用,遥感图像的处理变得愈来愈重要。为了实现谱聚类算法应用于林业工程中的遥感图像处理,本研究提出了一种基于核数据变换和角距离度量的谱聚类新算法。首先,通过对基于多变量核特征提取的一般核熵成分分析法的分析,并运用信息论概念和核密度估计密切相关的瑞利二次熵,提出了最佳特征提取和无监督降维方法,即最佳核熵成分分析法。它根据类或聚类信息方面的数据结构,采用一个额外的旋转,使得成分之间的独立性最大化;在这些成分中最佳地捕捉数据的高信息势部分,直接找到关于保留成分的数量的最大化信息势的基,以确保得到的解比标准的核熵成分分析得到的解保留更多(或相等)的信息势;并提出了采用梯度上升法来求解最佳核熵成分分析优化问题,具体实现是采用了一种简单的提前终止方案,以确保梯度达到一个额外迭代不会显著修改成本函数的区域。其次,通过对最佳核熵成分分析变换和样本外扩展的分析,构建了一种基于角距离度量的谱聚类算法,它采用角距离度量的核k-均值聚类目标,而不是采用基于欧氏距离的度量。优化过程采用最佳核熵成分分析空间中的角距离,以保证收敛到局部最优,从而实现图像的聚类。采用多光谱卫星图像的实验结果表明,本研究提出的谱聚类算法不仅适用于遥感图像的云筛选问题,而且相比目前其他先进的聚类算法有更好的分类性能。 展开更多
关键词 遥感图像 非线性特征提取 概率密度函数 k-均值 瑞利熵
在线阅读 下载PDF
基于改进K均值聚类的语音情感识别深度学习方法 被引量:5
4
作者 李巧君 郭彍 《计算机应用与软件》 北大核心 2024年第9期224-229,共6页
针对当前语音情感识别(Speech Emotion Recognition, SER)方法中准确性低和时间复杂度高的问题,提出一种基于改进K均值聚类的语音情感识别深度学习方法。采用改进的K-均值聚类算法从整个音频信号中选取反映情感特征的关键片段;使用短时... 针对当前语音情感识别(Speech Emotion Recognition, SER)方法中准确性低和时间复杂度高的问题,提出一种基于改进K均值聚类的语音情感识别深度学习方法。采用改进的K-均值聚类算法从整个音频信号中选取反映情感特征的关键片段;使用短时傅里叶变换将所选序列转化为一个谱图;利用深度残差模型ResNet和深度双向长短时记忆Bi-LSTM网络从空间和时间上学习表征谱图中与情感相关的隐藏特征,基于Softmax分类器获得最终的情感分类。实验结果表明,所提方法比其他识别方法具有明显的优势,在改善情感识别率的同时,降低了模型的处理时间。 展开更多
关键词 语音情感识别 深度双向长短时记忆 k-均值 短时傅里叶变换
在线阅读 下载PDF
基于覆盖树的自适应均值漂移聚类算法 被引量:1
5
作者 温柳英 庞柯 《计算机工程与设计》 北大核心 2024年第2期452-458,共7页
为解决均值漂移聚类算法聚类效果依赖于带宽参数的主观选取,以及处理密度变化大的数据集时聚类结果精确度问题,提出一种基于覆盖树的自适应均值漂移聚类算法MSCT(MeanShift based on Cover-Tree)。构建一个覆盖树数据集,在计算漂移向量... 为解决均值漂移聚类算法聚类效果依赖于带宽参数的主观选取,以及处理密度变化大的数据集时聚类结果精确度问题,提出一种基于覆盖树的自适应均值漂移聚类算法MSCT(MeanShift based on Cover-Tree)。构建一个覆盖树数据集,在计算漂移向量过程中结合覆盖树数据集获得新的漂移向量结果KnnShift,在不同数据密度分布的数据集上都能自适应产生带宽参数,所有数据点完成漂移过程后获得聚类结果。实验结果表明,MSCT算法的聚类效果整体上优于MS、DBSCAN等算法。 展开更多
关键词 均值漂移 覆盖树 滑动窗口 最近邻 密度 机器学习
在线阅读 下载PDF
基于核的K-均值聚类 被引量:46
6
作者 孔锐 张国宣 +1 位作者 施泽生 郭立 《计算机工程》 CAS CSCD 北大核心 2004年第11期12-13,80,共3页
将核学习方法的思想应用于K-均值聚类中,提出了一种核K-均值聚类算法,算法的主要思想是:首先将原空间中待聚类的样本经过一个非线性映射,映射到一个高维的核空间中,突出各类样本之间的特征差异,然后在这个核空间中进行K-均值聚类。同时... 将核学习方法的思想应用于K-均值聚类中,提出了一种核K-均值聚类算法,算法的主要思想是:首先将原空间中待聚类的样本经过一个非线性映射,映射到一个高维的核空间中,突出各类样本之间的特征差异,然后在这个核空间中进行K-均值聚类。同时还将一种新的核函数应用于核K-均值聚类中以提高算法的速度。为了验证算法的有效性,分别利用人工和实际数据进行K-均值聚类和核K-均值聚类,实验结果显示对于一些特殊的类分布数据,核K-均值聚类比K-均值聚类具有更好的聚类效果。 展开更多
关键词 k-均值 k-均值 核函数 支持向量机
在线阅读 下载PDF
新的K-均值算法最佳聚类数确定方法 被引量:93
7
作者 周世兵 徐振源 唐旭清 《计算机工程与应用》 CSCD 北大核心 2010年第16期27-31,共5页
K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,... K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,将AP算法产生的聚类数作为聚类数搜索范围的上界kmax,并通过选择合适的有效性指标Silhouette指标,以及基于最大最小距离算法思想设定初始聚类中心,分析聚类效果,确定最佳聚类数。仿真实验和分析验证了以上算法方案的可行性。 展开更多
关键词 k-均值 有效性指标 初始中心
在线阅读 下载PDF
学习特征权值对K-均值聚类算法的优化 被引量:50
8
作者 王熙照 王亚东 +1 位作者 湛燕 袁方 《计算机研究与发展》 EI CSCD 北大核心 2003年第6期869-873,共5页
K 均值 (K means)算法聚类的结果依赖于距离度量的选取 传统的K 均值算法选择的相似性度量通常是欧几里德距离的倒数 ,这种距离通常涉及所有的特征 在距离公式中引入一些特征权参数后 ,其聚类结果将依赖于这些权值 ,从而可以通过调整这... K 均值 (K means)算法聚类的结果依赖于距离度量的选取 传统的K 均值算法选择的相似性度量通常是欧几里德距离的倒数 ,这种距离通常涉及所有的特征 在距离公式中引入一些特征权参数后 ,其聚类结果将依赖于这些权值 ,从而可以通过调整这些权值优化聚类效果 由于K 均值算法是迭代算法 ,很难直接确定其权值以优化聚类结果 ,因此提出了一种间接的学习权值算法以改进聚类结果 从数学意义上讲 ,这种权值学习相当于欧氏空间中对一组点进行了一个线性变换 展开更多
关键词 k-均值 相似度量 特征权值 梯度下降技术
在线阅读 下载PDF
基于改进k-均值聚类的负荷概率模型 被引量:25
9
作者 陈凡 刘海涛 +1 位作者 黄正 张雪娇 《电力系统保护与控制》 EI CSCD 北大核心 2013年第22期128-133,共6页
提出采用改进的k-均值聚类方法对电力系统小时负荷进行聚类,避免了传统k-均值聚类存在的聚类中心初始值难以确定、聚类结果不稳定的问题。在建立聚类负荷模型的基础上,进一步建立了考虑负荷不确定性和相关性的负荷概率模型。RBTS和IEEE ... 提出采用改进的k-均值聚类方法对电力系统小时负荷进行聚类,避免了传统k-均值聚类存在的聚类中心初始值难以确定、聚类结果不稳定的问题。在建立聚类负荷模型的基础上,进一步建立了考虑负荷不确定性和相关性的负荷概率模型。RBTS和IEEE RTS79算例分析结果表明,采用所建立的聚类负荷模型时的发电系统可靠性计算结果精度高,节省了状态抽样法的计算时间;负荷不确定性和相关性对发电系统可靠性有较大影响。所建立的负荷概率模型为采用解析法和状态抽样法进行发电和发输电系统可靠性评估提供了基础。 展开更多
关键词 k-均值 层次 负荷模型 不确定性 相关性
在线阅读 下载PDF
基于微粒群优化聚类数目的K-均值算法 被引量:19
10
作者 巩敦卫 蒋余庆 +1 位作者 张勇 周勇 《控制理论与应用》 EI CAS CSCD 北大核心 2009年第10期1175-1179,共5页
K-均值算法是广泛使用的聚类算法,但该算法的聚类数目难以确定,且聚类结果对初始聚类中心比较敏感.本文提出一种基于微粒群优化聚类数目的K-均值算法,该算法采用聚类中心的坐标和通配符表示微粒位置,通过定义微粒更新公式中新的加减运算... K-均值算法是广泛使用的聚类算法,但该算法的聚类数目难以确定,且聚类结果对初始聚类中心比较敏感.本文提出一种基于微粒群优化聚类数目的K-均值算法,该算法采用聚类中心的坐标和通配符表示微粒位置,通过定义微粒更新公式中新的加减运算符,动态调整聚类中心的数目及坐标,此外,以改进的聚类有效性指标Davies-Bouldin准则作为适应度函数.5个人工和真实数据集的聚类结果验证了所提算法的优越性. 展开更多
关键词 k-均值算法 微粒群优化 微粒更新
在线阅读 下载PDF
基于核K-均值聚类算法的植物叶部病害识别 被引量:28
11
作者 王守志 何东健 +1 位作者 李文 王艳春 《农业机械学报》 EI CAS CSCD 北大核心 2009年第3期152-155,共4页
针对植物叶部病害图像的特点,首先对采集到的玉米病害彩色图像采用矢量中值滤波法去除噪声,然后提取玉米病叶彩色图像的纹理特征和颜色特征作为特征向量,利用Mercer核,把输入空间的样本映射到高维特征空间进行K-均值聚类以及植物病害识... 针对植物叶部病害图像的特点,首先对采集到的玉米病害彩色图像采用矢量中值滤波法去除噪声,然后提取玉米病叶彩色图像的纹理特征和颜色特征作为特征向量,利用Mercer核,把输入空间的样本映射到高维特征空间进行K-均值聚类以及植物病害识别。试验涉及的4种玉米病害识别正确率达82.5%,核K-均值聚类方法适合玉米叶部病害分类。 展开更多
关键词 植物病害 病害识别 k-均值
在线阅读 下载PDF
基于K-均值聚类多场景时序特性分析的分布式电源多目标规划 被引量:58
12
作者 彭春华 于蓉 孙惠娟 《电力自动化设备》 EI CSCD 北大核心 2015年第10期58-65,共8页
若不考虑分布式电源出力及负荷需求的波动性及不确定性,可能导致分布式电源规划容量偏大或系统电压改善程度降低。深入分析分布式电源出力时序波动特性,并引入K-均值聚类多场景概率分析方法,以降低上述波动性及不确定性对配电网的影响;... 若不考虑分布式电源出力及负荷需求的波动性及不确定性,可能导致分布式电源规划容量偏大或系统电压改善程度降低。深入分析分布式电源出力时序波动特性,并引入K-均值聚类多场景概率分析方法,以降低上述波动性及不确定性对配电网的影响;以最大化年寿命周期收益率和电压分布改善率作为目标函数,建立分布式电源多目标规划模型,并采用多目标复合微分进化算法对其求解和基于最短归一化距离法实现多目标总体最优解决策。以IEEE33节点配电系统为例进行分布式电源多目标规划,验证了所提方法的有效性和优越性。 展开更多
关键词 分布式电源 规划 时序特性 多场景概率 k-均值 多目标决策
在线阅读 下载PDF
基于初始聚类中心优化的K-均值算法 被引量:24
13
作者 王赛芳 戴芳 +1 位作者 王万斌 张晓宇 《计算机工程与科学》 CSCD 北大核心 2010年第10期105-107,116,共4页
针对传统的K-均值算法对初始聚类中心的选取和孤立点敏感的问题,本文提出了一种基于点密度的初始聚类中心选取方法。利用该方法选出初始聚类中心,再应用K-均值算法进行聚类,同时对孤立点进行特殊处理。实验表明,该方法能够产生高质量的... 针对传统的K-均值算法对初始聚类中心的选取和孤立点敏感的问题,本文提出了一种基于点密度的初始聚类中心选取方法。利用该方法选出初始聚类中心,再应用K-均值算法进行聚类,同时对孤立点进行特殊处理。实验表明,该方法能够产生高质量的聚类结果。 展开更多
关键词 k-均值算法 密度
在线阅读 下载PDF
一个用于空间聚类分析的遗传K-均值算法 被引量:19
14
作者 王家耀 张雪萍 周海燕 《计算机工程》 CAS CSCD 北大核心 2006年第3期188-190,共3页
空间数据挖掘是数据挖掘的一个新的分支,空间聚类分析是空间数据挖掘中的一个重要研究课题。本文在分析遗传算法及K–均值算法的优越性和不足的基础上,设计了一种遗传K-均值空间聚类分析算法,该算法兼顾了局部收敛和全局收敛性能。实验... 空间数据挖掘是数据挖掘的一个新的分支,空间聚类分析是空间数据挖掘中的一个重要研究课题。本文在分析遗传算法及K–均值算法的优越性和不足的基础上,设计了一种遗传K-均值空间聚类分析算法,该算法兼顾了局部收敛和全局收敛性能。实验表明,其结果优于传统K-均值聚类方法及单纯的遗传算法聚类。 展开更多
关键词 空间数据挖掘 空间 遗传算法 k-均值算法 遗传k-均值算法
在线阅读 下载PDF
基于K-均值聚类与夹角余弦法的多光谱分类算法 被引量:14
15
作者 卫俊霞 相里斌 +1 位作者 高晓惠 段晓峰 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2011年第5期1357-1360,共4页
近年来对高光谱与多光谱进行分类去混的研究方法很多,K-均值聚类算法与光谱相似度计算算法都属于成熟的分类算法。作者在对其研究基础上,将K-均值算法进行改进,并融入光谱相似度匹配算法,形成一种新的光谱分类算法,找出两条距离最远的... 近年来对高光谱与多光谱进行分类去混的研究方法很多,K-均值聚类算法与光谱相似度计算算法都属于成熟的分类算法。作者在对其研究基础上,将K-均值算法进行改进,并融入光谱相似度匹配算法,形成一种新的光谱分类算法,找出两条距离最远的光谱作为参考光谱,用欧氏距离法或夹角余弦法对数据立方体进行分类,并且从数据立方体中删除属于这两条谱线的其余谱线,同时找出与两条参考光谱距离最远或者夹角最大者作为第三条参考光谱,对剩余数据立方体进行新的分类,并在此算法上用多光谱数据立方体进行了试验验证。通过ENVI用K-均值(K-means)进行分类,与改进的K-means算法和夹角余弦法Mat-lab仿真结果进行比较,后两种对于两种气泡的分类效果都很好,对背景的分类改进的K-means算法效果较好,尤其是欧氏距离法能将背景完整地分离出来。 展开更多
关键词 k-均值 欧氏距离 夹角余弦法 多光谱
在线阅读 下载PDF
一种改进的k-均值聚类算法 被引量:41
16
作者 徐义峰 陈春明 徐云青 《计算机应用与软件》 CSCD 北大核心 2008年第3期275-277,共3页
针对k-均值(k-means)聚类算法中随机选取初始聚类中心的缺陷,提出了一种新的基于数据样本分布选取初始聚类中心的方法。实验结果表明,改进后的算法能改善其聚类性能,并能取得较高的分类准确率。
关键词 k-均值 中心 数据分布
在线阅读 下载PDF
基于密度的K-means聚类中心选取的优化算法 被引量:49
17
作者 周炜奔 石跃祥 《计算机应用研究》 CSCD 北大核心 2012年第5期1726-1728,共3页
针对传统的K-means算法对于初始聚类中心点和聚类数的敏感问题,提出了一种优化初始聚类中心选取的算法。该算法针对数据对象的分布密度以及计算最近两点的垂直中点方法来确定k个初始聚类中心,再结合均衡化函数对聚类个数进行优化,以获... 针对传统的K-means算法对于初始聚类中心点和聚类数的敏感问题,提出了一种优化初始聚类中心选取的算法。该算法针对数据对象的分布密度以及计算最近两点的垂直中点方法来确定k个初始聚类中心,再结合均衡化函数对聚类个数进行优化,以获得最优聚类。采用标准的UCI数据集进行实验对比,发现改进后的算法相比传统的算法有较高的准确率和稳定性。 展开更多
关键词 k-均值 数据挖掘 中心 垂直中点 密度
在线阅读 下载PDF
基于K-均值聚类算法的西安市汽车行驶工况合成技术研究 被引量:24
18
作者 蔡锷 李阳阳 +2 位作者 李春明 谭晓伟 刘东民 《汽车技术》 北大核心 2015年第8期33-36,共4页
为提供排放试验所需的车速曲线,基于划分的短行程数据,采用K-均值聚类算法构建了西安市汽车行驶合成工况。首先对采集的原始数据进行短行程划分并进行特征提取,针对提取的高维特征向量之间的冗余性和非线性关系,采用核主分量分析法进行... 为提供排放试验所需的车速曲线,基于划分的短行程数据,采用K-均值聚类算法构建了西安市汽车行驶合成工况。首先对采集的原始数据进行短行程划分并进行特征提取,针对提取的高维特征向量之间的冗余性和非线性关系,采用核主分量分析法进行降维。然后基于K-均值的聚类算法,对降维后特征向量进行划分,按照离聚类中心最近的原则选择各聚类的短行程样本,将其合成为平均速度为21.51 km/h、持续时间为1 166 s、距离为6.9 km的西安市汽车行驶工况。对比表明,西安市汽车行驶工况接近于日本J10-15标准,但加速度参数要高很多。 展开更多
关键词 汽车 行驶工况合成 k-均值算法 西安市
在线阅读 下载PDF
动态的K-均值聚类算法在图像检索中的应用 被引量:12
19
作者 张白妮 骆嘉伟 汤德佑 《计算机工程与设计》 CSCD 2004年第10期1843-1846,共4页
聚类分析技术已经广泛应用于基于内容的图像信息挖掘领域,该技术提高了图像检索的速度和质量。K-均值算法和自适应算法是两个典型的聚类分析算法,但K-均值算法严重依赖于经验参数和阙值的设定;自适应算法得到的聚类个数太多,相应的就是... 聚类分析技术已经广泛应用于基于内容的图像信息挖掘领域,该技术提高了图像检索的速度和质量。K-均值算法和自适应算法是两个典型的聚类分析算法,但K-均值算法严重依赖于经验参数和阙值的设定;自适应算法得到的聚类个数太多,相应的就是类内的图像个数过少,效率不是很高。从选取初始聚类点是否具有确定性、迭代次数是否过多和聚类个数是否适当等方面考虑,提出了一种新的聚类算法,即动态的K-均值法。模拟实验的结果表明,该算法具有较好的准确性和效率,使检索的质量和速度都得到了很大的提高。 展开更多
关键词 k-均值 图像检索 k-均值算法 基于内容 算法 自适应算法 图像信息 个数 速度 技术
在线阅读 下载PDF
基于改进的k-均值聚类和数学形态学的彩色眼科图像病灶分割 被引量:13
20
作者 王兴伟 沈兰荪 +1 位作者 卫保国 刘党辉 《中国生物医学工程学报》 EI CAS CSCD 北大核心 2002年第5期443-448,共6页
病灶面积的定量化研究在眼科临床上具有重要的意义 ,为此首先需要把病灶从眼科图像中分割出来。已有的分割算法未充分利用眼科图像的整体信息 ,不适用于角膜病灶的分割。因此 ,本文提出了一种新算法 :首先利用改进的k 均值算法 ,对色度... 病灶面积的定量化研究在眼科临床上具有重要的意义 ,为此首先需要把病灶从眼科图像中分割出来。已有的分割算法未充分利用眼科图像的整体信息 ,不适用于角膜病灶的分割。因此 ,本文提出了一种新算法 :首先利用改进的k 均值算法 ,对色度和亮度进行聚类 ,再通过数学形态学运算分割角膜病灶。实验结果表明 。 展开更多
关键词 k-均值算法 色彩分割 亮度分割 数学形态学 眼科
在线阅读 下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部