期刊文献+
共找到1,254篇文章
< 1 2 63 >
每页显示 20 50 100
基于主成分分析算法和K均值聚类算法的药品库存分类管理 被引量:1
1
作者 唐蕾 邱磊 +1 位作者 俞佳慧 冀召帅 《医药导报》 北大核心 2025年第4期682-686,共5页
目的针对目前药品分类主观性较强、分类标准模糊、影响因素繁杂的问题,探讨一种科学的药品分类方法,以降低库存成本,提高库存的有效性。方法在北京某三级医院2021—2022年历史数据中随机抽取700种药品为研究对象,通过主成分分析(PCA)算... 目的针对目前药品分类主观性较强、分类标准模糊、影响因素繁杂的问题,探讨一种科学的药品分类方法,以降低库存成本,提高库存的有效性。方法在北京某三级医院2021—2022年历史数据中随机抽取700种药品为研究对象,通过主成分分析(PCA)算法和K均值聚类(K-means)算法对研究对象进行分类。结果确定轮廓系数为0.3470的分类数4为最佳分类数,将700种药品分为4类,其中有363种归为第一类,186种归为第二类,94种归为第三类,57种归为第四类。将该文研究的药品分类方法模拟运用到某三级医院2023年第二季度的药品库存管理中,模拟结果表明该分类方法能够降低库存成本,提高库存有效性。结论基于PCA算法和K-means聚类算法的药品分类方法能够为药品库存分类管理提供可靠依据。 展开更多
关键词 药品分 主成分分析算法 K均值算法 药品库存管理
在线阅读 下载PDF
基于自组织映射优化k均值聚类合成少数类算法及应用
2
作者 罗博炜 谭家驹 冯纪强 《广西大学学报(自然科学版)》 北大核心 2025年第3期679-689,共11页
针对金融数据高度不平衡使信贷违约预警模型训练和评估的复杂度大大增加的特点,为了改进重采样方法,运用自组织映射(SOM)神经网络来优化k均值聚类合成少数类(k-Means-SMOTE)算法,通过自组织映射神经网络识别和分析不平衡数据集的结构特... 针对金融数据高度不平衡使信贷违约预警模型训练和评估的复杂度大大增加的特点,为了改进重采样方法,运用自组织映射(SOM)神经网络来优化k均值聚类合成少数类(k-Means-SMOTE)算法,通过自组织映射神经网络识别和分析不平衡数据集的结构特征,将高维数据有效地映射至低维空间。在此基础上,结合k-Means算法进行数据聚类,以识别少数类样本的潜在群集,从而更准确地确定过采样的焦点区域。最后运用SMOTE技术对这些焦点区域进行过采样,增加少数类样本数量的同时保持数据的原始特征分布,从而减少过拟合的风险。在Bank marketing、Credit_Fraud等多个经典的真实金融数据集上的实验证明,该方法能够通过增加聚类稳定性来提升传统过采样算法的质量,在提升模型性能的同时降低算法复杂度。 展开更多
关键词 自组织映射神经网络 算法 k均值合成少数过采样方法 信贷违约预警
在线阅读 下载PDF
基于均值漂移聚类算法的岩体结构面产状优势分组
3
作者 彭是焱 周鑫 +1 位作者 申壮 徐千博 《科学技术与工程》 北大核心 2025年第4期1392-1399,共8页
岩体结构面产状的优势分组对于揭示不同类型结构面的分布规律和特征具有重要意义。传统的结构面极点密度图分组方法通常较为依赖地质经验,缺乏一定客观性,为此,引入均值漂移聚类算法开展岩体结构面产状优势分组研究。首先,人工生成不同... 岩体结构面产状的优势分组对于揭示不同类型结构面的分布规律和特征具有重要意义。传统的结构面极点密度图分组方法通常较为依赖地质经验,缺乏一定客观性,为此,引入均值漂移聚类算法开展岩体结构面产状优势分组研究。首先,人工生成不同离散程度岩体结构面产状数据。随后,将生成的产状数据转换为三维空间中的坐标,并以单位法向量的夹角正弦值γ作为相似性度量标准。接下来采用均值漂移算法对度量的数据集进行聚类分析,通过与传统的极点密度图法和K均值聚类算法进行比较,有效性检验指标和聚类错误识别率与K均值聚类算法接近一致。最后以重庆三功矿岩质边坡为工程实例,通过野外采集到的结构面数据验证了新方法的合理性及有效性。结果表明:该方法聚类效果优于传统的极点图分组方法和K均值聚类算法,聚类结果客观合理,对近水平产状也有良好的聚类效果。 展开更多
关键词 岩体 结构面产状 优势分组 均值漂移算法
在线阅读 下载PDF
一种基于核数据变换方法的遥感图像谱聚类算法
4
作者 赵海军 陈华月 崔梦天 《林业工程学报》 北大核心 2025年第2期130-137,共8页
随着遥感图像在各行各业的日益广泛应用,遥感图像的处理变得愈来愈重要。为了实现谱聚类算法应用于林业工程中的遥感图像处理,本研究提出了一种基于核数据变换和角距离度量的谱聚类新算法。首先,通过对基于多变量核特征提取的一般核熵... 随着遥感图像在各行各业的日益广泛应用,遥感图像的处理变得愈来愈重要。为了实现谱聚类算法应用于林业工程中的遥感图像处理,本研究提出了一种基于核数据变换和角距离度量的谱聚类新算法。首先,通过对基于多变量核特征提取的一般核熵成分分析法的分析,并运用信息论概念和核密度估计密切相关的瑞利二次熵,提出了最佳特征提取和无监督降维方法,即最佳核熵成分分析法。它根据类或聚类信息方面的数据结构,采用一个额外的旋转,使得成分之间的独立性最大化;在这些成分中最佳地捕捉数据的高信息势部分,直接找到关于保留成分的数量的最大化信息势的基,以确保得到的解比标准的核熵成分分析得到的解保留更多(或相等)的信息势;并提出了采用梯度上升法来求解最佳核熵成分分析优化问题,具体实现是采用了一种简单的提前终止方案,以确保梯度达到一个额外迭代不会显著修改成本函数的区域。其次,通过对最佳核熵成分分析变换和样本外扩展的分析,构建了一种基于角距离度量的谱聚类算法,它采用角距离度量的核k-均值聚类目标,而不是采用基于欧氏距离的度量。优化过程采用最佳核熵成分分析空间中的角距离,以保证收敛到局部最优,从而实现图像的聚类。采用多光谱卫星图像的实验结果表明,本研究提出的谱聚类算法不仅适用于遥感图像的云筛选问题,而且相比目前其他先进的聚类算法有更好的分类性能。 展开更多
关键词 遥感图像 非线性特征提取 概率密度函数 k-均值 瑞利熵
在线阅读 下载PDF
半监督的改进K-均值聚类算法 被引量:13
5
作者 汪军 王传玉 周鸣争 《计算机工程与应用》 CSCD 北大核心 2009年第28期137-139,共3页
K-均值聚类算法必须事先获取聚类数目,并且随机地选取聚类初始中心会造成聚类结果不稳定,容易在获得一个局部最优值时终止。提出了一种基于半监督学习理论的改进K-均值聚类算法,利用少量标签数据建立图的最小生成树并迭代分裂获取K-均... K-均值聚类算法必须事先获取聚类数目,并且随机地选取聚类初始中心会造成聚类结果不稳定,容易在获得一个局部最优值时终止。提出了一种基于半监督学习理论的改进K-均值聚类算法,利用少量标签数据建立图的最小生成树并迭代分裂获取K-均值聚类算法所需要的聚类数和初始聚类中心。在IRIS数据集上的实验表明,尽管随机样本构造的生成树不同,聚类中心也不同,但聚类是一致且稳定的,迭代的次数较少,验证了该文算法的有效性。 展开更多
关键词 监督学习 k-均值 标签样本 最小生成树
在线阅读 下载PDF
基于半监督学习的K-均值聚类算法研究 被引量:12
6
作者 刘涛 尹红健 《计算机应用研究》 CSCD 北大核心 2010年第3期913-916,共4页
定义了一个欧氏距离和监督信息相混合的新的最近邻计算函数,从而将K-均值算法很好地应用于半监督聚类问题。针对K-均值算法初始质心敏感的缺陷,用粒子群算法的搜索空间模拟聚类的欧氏空间,迭代搜索找到较优的聚类质心,同时提出动态管理... 定义了一个欧氏距离和监督信息相混合的新的最近邻计算函数,从而将K-均值算法很好地应用于半监督聚类问题。针对K-均值算法初始质心敏感的缺陷,用粒子群算法的搜索空间模拟聚类的欧氏空间,迭代搜索找到较优的聚类质心,同时提出动态管理种群的策略以提高粒子群算法搜索效率。算法在UCI的多个数据集上测试都得到了较好的聚类准确率。 展开更多
关键词 监督 改进的k-均值算法 动态管理种群的粒子群算法
在线阅读 下载PDF
采用混合策略联合优化的模糊C-均值聚类信息熵点云简化算法 被引量:2
7
作者 黄鹤 黄佳慧 +2 位作者 刘国权 王会峰 高涛 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第7期214-226,共13页
针对传统聚类算法处理点云简化问题时精度低、耗时长且易丢失特征信息等问题,提出了一种基于动态精英自适应混合策略的鹈鹕算法(DEAMPOA)与加权熵法联合优化的模糊C-均值聚类(FCM)信息熵点云简化算法。采用动态自适应种群混合策略,同时... 针对传统聚类算法处理点云简化问题时精度低、耗时长且易丢失特征信息等问题,提出了一种基于动态精英自适应混合策略的鹈鹕算法(DEAMPOA)与加权熵法联合优化的模糊C-均值聚类(FCM)信息熵点云简化算法。采用动态自适应种群混合策略,同时融合了精英反向化思路,显著提升了鹈鹕优化算法(POA)的收敛趋势和全局寻优能力,提高了寻找FCM最优聚类中心的成功率;利用DEAMPOA结合加权熵法对FCM进行优化,提高鲁棒性的同时增强了搜索精度,得到较好的聚类结果;在8种UCI标准数据集上与4种算法对比进行聚类性能评估实验,验证了所提方法综合性能优越;将所提方法与信息熵融合,并应用在三维点云KITTI数据集简化中。实验结果表明:与包围框简化法、随机采样简化法和特征选择简化法对比,所提方法全局误差简化前后点集之间平均欧式距离(MED)指标分别降低了2.25%、6.93%、5.74%,点云简化效果最优且运行速度满足要求。 展开更多
关键词 C-均值 鹈鹕优化算法 点云简化 信息熵
在线阅读 下载PDF
改进的采样算法与无监督聚类相结合的软件缺陷预测模型 被引量:1
8
作者 石海鹤 周世文 +1 位作者 钟林辉 肖正兴 《江西师范大学学报(自然科学版)》 CAS 北大核心 2024年第3期301-310,共10页
该文首先在自适应综合过采样算法ADASYN(adaptive synthetic sampling)的基础上,考虑少数类内部不同密度簇之间的连接性问题,将与采样点距离为中等的点纳入新样本生成范围,改进得到T-ADASYN过采样优化算法,有效地增加了少数类内部不同... 该文首先在自适应综合过采样算法ADASYN(adaptive synthetic sampling)的基础上,考虑少数类内部不同密度簇之间的连接性问题,将与采样点距离为中等的点纳入新样本生成范围,改进得到T-ADASYN过采样优化算法,有效地增加了少数类内部不同密度簇的连接性,生成了分布更为均衡的数据集.然后使用基于连接的spectral clustering算法进行聚类预测操作,将过采样算法和无监督聚类相结合,提出一种新型实用的软件缺陷预测模型TA-SC(T-ADASYN+spectral clustering).以F-score为评价指标,spectral clustering为聚类模型进行验证.实验结果表明:改进的T-ADASYN过采样算法在公开的PROMISE数据集和NASA数据集上比常用的过采样算法均有6%的性能提升,且TA-SC模型在PROMISE和NASA 2个数据集上比常用聚类算法分别有3%和2%的性能提升. 展开更多
关键词 软件缺陷预测 别不平衡 过采样算法 算法 监督学习
在线阅读 下载PDF
IIoT环境下基于聚类的工作流多雾协同调度算法 被引量:1
9
作者 吴宏伟 江凌云 陈海峰 《计算机工程与设计》 北大核心 2025年第1期52-59,共8页
为解决在IIoT(industrial internet of things)环境下,现有的调度算法调度工作流中通信频繁、数据传输量大的任务所带来的完工时间上升、成本增加等影响的问题,提出一种基于聚类的工作流多雾协同调度算法。通过二分K均值算法对工作流中... 为解决在IIoT(industrial internet of things)环境下,现有的调度算法调度工作流中通信频繁、数据传输量大的任务所带来的完工时间上升、成本增加等影响的问题,提出一种基于聚类的工作流多雾协同调度算法。通过二分K均值算法对工作流中的任务进行聚类,基于聚类结果,在多个雾服务器之间使用改进的免疫粒子群优化算法进行任务调度。实验结果表明,该算法相比其它一些传统的调度算法在完工时间、成本、负载均衡方面都有一定提升。 展开更多
关键词 工业物联网 工作流 二分K均值算法 多雾 免疫粒子群优化算法 调度算法
在线阅读 下载PDF
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:2
10
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 监督学习 机器学习 神经网络 k-MEANS 特征空间增强 mixup算法
在线阅读 下载PDF
自加权多视图k-均值算法
11
作者 林合川 徐慧英 +2 位作者 朱信忠 黄晓 刘子洋 《计算机工程》 北大核心 2025年第8期141-150,共10页
随着信息技术的不断进步,人们能够运用越来越多样化和复杂的方式来更准确地描述事物,这导致了多视图数据的出现。对多视图数据聚类是数据挖掘、机器学习、模式识别等领域的基础和重要课题。在这个信息爆炸的时代,数据的维度越来越高,如... 随着信息技术的不断进步,人们能够运用越来越多样化和复杂的方式来更准确地描述事物,这导致了多视图数据的出现。对多视图数据聚类是数据挖掘、机器学习、模式识别等领域的基础和重要课题。在这个信息爆炸的时代,数据的维度越来越高,如何有效地对这类数据进行聚类仍然是一项巨大的挑战。针对目前多视图k-均值算法在处理高维数据时能力不足的问题,提出一种全新的多视图聚类框架——自加权多视图k-均值(SwMKM)算法。首先,通过采用最小绝对准则来引导鲁棒性,降低异常值对结果的影响;然后,采用迭代重加权最小二乘法(IRLS)来求解最小绝对残差,通过自适应地调整多个权重的分布,实现重加权的控制;最后,通过引入具有l2,1范数惩罚项的投影矩阵,将原始数据集的高维特征空间转换为统计上不相关的低维的子空间,实现特征选择和噪声抑制。实验结果显示,SwMKM算法在Handwritten numerals、MSRCv1、Outdoor Scene等数据集上的表现明显优于其他多视图k-均值算法,证明了该算法聚类的优越性。 展开更多
关键词 监督学习 k-均值 多视图 L2 1范数 自加权
在线阅读 下载PDF
基于VMD和FCM聚类算法的海上风机支撑结构损伤识别方法
12
作者 任义建 刁延松 +1 位作者 吕建达 侯敬儒 《振动与冲击》 北大核心 2025年第8期184-191,286,共9页
利用响应和有监督学习算法对运行状态下海上风机支撑结构进行损伤识别时,会遇到响应中能量占比很高的谐波成分影响和有监督学习算法需人工定义标签等问题。为此,利用变分模态分解(variational modal decomposition,VMD)和模糊C均值(fuzz... 利用响应和有监督学习算法对运行状态下海上风机支撑结构进行损伤识别时,会遇到响应中能量占比很高的谐波成分影响和有监督学习算法需人工定义标签等问题。为此,利用变分模态分解(variational modal decomposition,VMD)和模糊C均值(fuzzy C-means,FCM)聚类算法进行海上风机支撑结构损伤识别。为剔除响应中的谐波成分,首先利用VMD对加速度响应进行分解,选取结构模态响应(仅含有结构自振频率)作为分析信号。然后计算模态响应的时域、能量和能量比值及样本熵特征构造特征矩阵,利用主成分分析对特征矩阵进行降维,得到损伤特征矩阵。将损伤特征矩阵输入FCM聚类算法,通过聚类分析得到结构的损伤状态。位移激励下海上风机支撑结构损伤识别模型试验数据验证了该方法的有效性。该方法属于无监督学习算法,无需标注标签且不受谐波成分的影响。 展开更多
关键词 海上风机支撑结构 损伤识别 变分模态分解(VMD) 模糊C均值(FCM)算法 监督学习算法
在线阅读 下载PDF
基于深度聚类学习的无监督行人重识别
13
作者 邓子文 段勇 《电子测量与仪器学报》 北大核心 2025年第3期208-216,共9页
无监督行人重识别是一种在没有任何标签的情况下,通过特征提取和聚类算法对行人进行识别和匹配的计算机视觉方法。针对当前无监督行人重识别方法普遍存在的特征提取不足、聚类不准确、计算复杂度高以及模型缺乏鲁棒性等问题,提出了一种... 无监督行人重识别是一种在没有任何标签的情况下,通过特征提取和聚类算法对行人进行识别和匹配的计算机视觉方法。针对当前无监督行人重识别方法普遍存在的特征提取不足、聚类不准确、计算复杂度高以及模型缺乏鲁棒性等问题,提出了一种基于深度聚类学习的无监督行人重识别方法。首先,研究了结合GeM池化方法的实例批量归一化网络(IBN-Net)作为特征提取网络,使得提取出的行人特征更具判别性;其次,针对聚类算法对于超参数较为敏感的问题,提出通过有序点识别聚类结构(OPTICS)辅助基于密度的聚类算法(DBSCAN)选取超参数,进一步降低了DBSCAN对超参数的敏感度;此外,为了更加充分利用训练集的所有数据,将离群值也视为单独的聚类参与到记忆字典的初始化与更新过程中;最后,针对记忆字典更新过程中各个聚类更新速率不一致的问题,提出了聚类级别的记忆字典,消除了聚类更新速率不一致的问题。实验结果验证了研究工作的有效性,提出的方法在无监督行人重识别任务中的精度与准确度均有明显的提升。 展开更多
关键词 行人重识别 监督学习 对比学习 深度学习 算法
在线阅读 下载PDF
基于样本空间分布密度的初始聚类中心优化K-均值算法 被引量:53
14
作者 谢娟英 郭文娟 +1 位作者 谢维信 高新波 《计算机应用研究》 CSCD 北大核心 2012年第3期888-892,共5页
针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定... 针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定义了数据对象的邻域;在此基础上选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K-均值聚类。UCI机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集的实验测试证明,本算法不仅具有很好的聚类效果,而且运行时间短,对噪声数据有很强的抗干扰性能。基于样本空间分布密度的初始聚类中心优化K-均值算法优于传统K-均值聚类算法和已有的相关K-均值初始中心优化算法。 展开更多
关键词 k-均值 初始中心 邻域 样本分布密度
在线阅读 下载PDF
基于微粒群优化聚类数目的K-均值算法 被引量:19
15
作者 巩敦卫 蒋余庆 +1 位作者 张勇 周勇 《控制理论与应用》 EI CAS CSCD 北大核心 2009年第10期1175-1179,共5页
K-均值算法是广泛使用的聚类算法,但该算法的聚类数目难以确定,且聚类结果对初始聚类中心比较敏感.本文提出一种基于微粒群优化聚类数目的K-均值算法,该算法采用聚类中心的坐标和通配符表示微粒位置,通过定义微粒更新公式中新的加减运算... K-均值算法是广泛使用的聚类算法,但该算法的聚类数目难以确定,且聚类结果对初始聚类中心比较敏感.本文提出一种基于微粒群优化聚类数目的K-均值算法,该算法采用聚类中心的坐标和通配符表示微粒位置,通过定义微粒更新公式中新的加减运算符,动态调整聚类中心的数目及坐标,此外,以改进的聚类有效性指标Davies-Bouldin准则作为适应度函数.5个人工和真实数据集的聚类结果验证了所提算法的优越性. 展开更多
关键词 k-均值算法 微粒群优化 微粒更新
在线阅读 下载PDF
新的K-均值算法最佳聚类数确定方法 被引量:93
16
作者 周世兵 徐振源 唐旭清 《计算机工程与应用》 CSCD 北大核心 2010年第16期27-31,共5页
K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,... K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,将AP算法产生的聚类数作为聚类数搜索范围的上界kmax,并通过选择合适的有效性指标Silhouette指标,以及基于最大最小距离算法思想设定初始聚类中心,分析聚类效果,确定最佳聚类数。仿真实验和分析验证了以上算法方案的可行性。 展开更多
关键词 k-均值 有效性指标 初始中心
在线阅读 下载PDF
学习特征权值对K-均值聚类算法的优化 被引量:50
17
作者 王熙照 王亚东 +1 位作者 湛燕 袁方 《计算机研究与发展》 EI CSCD 北大核心 2003年第6期869-873,共5页
K 均值 (K means)算法聚类的结果依赖于距离度量的选取 传统的K 均值算法选择的相似性度量通常是欧几里德距离的倒数 ,这种距离通常涉及所有的特征 在距离公式中引入一些特征权参数后 ,其聚类结果将依赖于这些权值 ,从而可以通过调整这... K 均值 (K means)算法聚类的结果依赖于距离度量的选取 传统的K 均值算法选择的相似性度量通常是欧几里德距离的倒数 ,这种距离通常涉及所有的特征 在距离公式中引入一些特征权参数后 ,其聚类结果将依赖于这些权值 ,从而可以通过调整这些权值优化聚类效果 由于K 均值算法是迭代算法 ,很难直接确定其权值以优化聚类结果 ,因此提出了一种间接的学习权值算法以改进聚类结果 从数学意义上讲 ,这种权值学习相当于欧氏空间中对一组点进行了一个线性变换 展开更多
关键词 k-均值 相似度量 特征权值 梯度下降技术
在线阅读 下载PDF
一种半监督K均值多关系数据聚类算法 被引量:22
18
作者 高滢 刘大有 +1 位作者 齐红 刘赫 《软件学报》 EI CSCD 北大核心 2008年第11期2814-2821,共8页
提出了一种半监督K均值多关系数据聚类算法.该算法在K均值聚类算法的基础上扩展了其初始类簇的选择方法和对象相似性度量方法,以用于多关系数据的半监督学习.为了获取高性能,该算法在聚类过程中充分利用了标记数据、对象属性及各种关系... 提出了一种半监督K均值多关系数据聚类算法.该算法在K均值聚类算法的基础上扩展了其初始类簇的选择方法和对象相似性度量方法,以用于多关系数据的半监督学习.为了获取高性能,该算法在聚类过程中充分利用了标记数据、对象属性及各种关系信息.多关系数据库Movie上的实验结果验证了该算法的有效性. 展开更多
关键词 数据挖掘 监督学习 算法 多关系数据 K均值
在线阅读 下载PDF
一个用于空间聚类分析的遗传K-均值算法 被引量:19
19
作者 王家耀 张雪萍 周海燕 《计算机工程》 CAS CSCD 北大核心 2006年第3期188-190,共3页
空间数据挖掘是数据挖掘的一个新的分支,空间聚类分析是空间数据挖掘中的一个重要研究课题。本文在分析遗传算法及K–均值算法的优越性和不足的基础上,设计了一种遗传K-均值空间聚类分析算法,该算法兼顾了局部收敛和全局收敛性能。实验... 空间数据挖掘是数据挖掘的一个新的分支,空间聚类分析是空间数据挖掘中的一个重要研究课题。本文在分析遗传算法及K–均值算法的优越性和不足的基础上,设计了一种遗传K-均值空间聚类分析算法,该算法兼顾了局部收敛和全局收敛性能。实验表明,其结果优于传统K-均值聚类方法及单纯的遗传算法聚类。 展开更多
关键词 空间数据挖掘 空间 遗传算法 k-均值算法 遗传k-均值算法
在线阅读 下载PDF
基于K-均值聚类算法的西安市汽车行驶工况合成技术研究 被引量:24
20
作者 蔡锷 李阳阳 +2 位作者 李春明 谭晓伟 刘东民 《汽车技术》 北大核心 2015年第8期33-36,共4页
为提供排放试验所需的车速曲线,基于划分的短行程数据,采用K-均值聚类算法构建了西安市汽车行驶合成工况。首先对采集的原始数据进行短行程划分并进行特征提取,针对提取的高维特征向量之间的冗余性和非线性关系,采用核主分量分析法进行... 为提供排放试验所需的车速曲线,基于划分的短行程数据,采用K-均值聚类算法构建了西安市汽车行驶合成工况。首先对采集的原始数据进行短行程划分并进行特征提取,针对提取的高维特征向量之间的冗余性和非线性关系,采用核主分量分析法进行降维。然后基于K-均值的聚类算法,对降维后特征向量进行划分,按照离聚类中心最近的原则选择各聚类的短行程样本,将其合成为平均速度为21.51 km/h、持续时间为1 166 s、距离为6.9 km的西安市汽车行驶工况。对比表明,西安市汽车行驶工况接近于日本J10-15标准,但加速度参数要高很多。 展开更多
关键词 汽车 行驶工况合成 k-均值算法 西安市
在线阅读 下载PDF
上一页 1 2 63 下一页 到第
使用帮助 返回顶部