期刊文献+
共找到1,162篇文章
< 1 2 59 >
每页显示 20 50 100
基于K-prototypes的混合属性数据聚类算法 被引量:16
1
作者 陈韡 王雷 蒋子云 《计算机应用》 CSCD 北大核心 2010年第8期2003-2005,2110,共4页
通过对基于K-prototypes算法对混合属性数据处理的聚类问题进行研究,改进了K-prototypes算法中分类属性相异度计算公式,使之能更加精确反映样本间的差异;在此基础上提出了一种用于处理混合属性数据的聚类算法,并将改进后的算法应用于英... 通过对基于K-prototypes算法对混合属性数据处理的聚类问题进行研究,改进了K-prototypes算法中分类属性相异度计算公式,使之能更加精确反映样本间的差异;在此基础上提出了一种用于处理混合属性数据的聚类算法,并将改进后的算法应用于英语借词数据的聚类分析中。实验结果表明,与K-prototypes算法相比,改进后的算法具有更好的稳定性和更高的精度。 展开更多
关键词 聚类 k-prototypes算法 混合属性数据 相异度
在线阅读 下载PDF
模糊k-prototypes聚类算法的一种改进算法 被引量:11
2
作者 王宇 杨莉 《大连理工大学学报》 EI CAS CSCD 北大核心 2003年第6期849-852,共4页
模糊k-prototypes算法是当前聚类分析中最有效算法之一.简述了模糊k-prototypes算法的发展进程和主要性质;并在此基础上,指出它在处理数值型和分类型混合数据时的不足,进而提出一种改进算法;最后,将算法应用到英语借词之中,给出计算结果... 模糊k-prototypes算法是当前聚类分析中最有效算法之一.简述了模糊k-prototypes算法的发展进程和主要性质;并在此基础上,指出它在处理数值型和分类型混合数据时的不足,进而提出一种改进算法;最后,将算法应用到英语借词之中,给出计算结果.结果表明,改进算法具有较好的稳定性和较高的精确度. 展开更多
关键词 模糊k-prototypes聚类算法 数值型属性 分类型属性 英语借词 数据挖掘
在线阅读 下载PDF
基于k-means算法的聚类个数确定方法改进 被引量:2
3
作者 王丙参 王国长 魏艳华 《统计与决策》 北大核心 2025年第7期59-64,共6页
文章基于k-means算法探讨了最优聚类个数k*的确定方法:第一类是统计量方法;第二类是聚类算法不稳定性方法,即基于两次聚类结果间的距离,利用交叉验证、随机抽样取交集、自助法来构建聚类算法估计不稳定性指标,并根据投票、最小化均值方... 文章基于k-means算法探讨了最优聚类个数k*的确定方法:第一类是统计量方法;第二类是聚类算法不稳定性方法,即基于两次聚类结果间的距离,利用交叉验证、随机抽样取交集、自助法来构建聚类算法估计不稳定性指标,并根据投票、最小化均值方法确定k^(*)。数值模拟结果显示:在给定k^(*)的情况下,聚类结果与标签的距离或相似度可作为评价聚类结果的指标,为聚类算法评价提供了新的借鉴;基于k-means算法确定k^(*)的前提是数据集根据欧氏距离可明显分为几簇,相对而言,聚类算法不稳定性方法优于统计量方法;对于不稳定性指标,交叉验证估计方法与随机抽样取交集估计方法对抽样个数稳健,抽样个数依次建议略少于样本容量的1/3、80%;自助抽样估计方法由于利用了全部样本,因此效率更高;4种不稳定性指标没有显著差异,投票与最小化均值方法也没有显著差异。 展开更多
关键词 k-MEANS算法 聚类个数 统计量 不稳定性
在线阅读 下载PDF
一种改进的加权K-prototypes算法 被引量:5
4
作者 刘强 邓磊 +1 位作者 贾振红 覃锡忠 《激光杂志》 CAS CSCD 北大核心 2014年第1期18-20,共3页
为了提高K-prototypes算法的聚类准确度,解决其随机选取聚类中心初始值导至的聚类精度较低和聚类结果不稳定的问题。通过对混合属性数据聚类算法的研究,对K-prototypes算法做了进一步的改进。提出了混合属性聚类的初始聚类中心确定方法... 为了提高K-prototypes算法的聚类准确度,解决其随机选取聚类中心初始值导至的聚类精度较低和聚类结果不稳定的问题。通过对混合属性数据聚类算法的研究,对K-prototypes算法做了进一步的改进。提出了混合属性聚类的初始聚类中心确定方法,并且通过加权算法改进了相异度计算公式。最后用UCI数据集对算法进行检验,结果表明,改进的加权K-prototype算法更加稳定,并具有较高的聚类精度。 展开更多
关键词 数据挖掘 混合属性 聚类 权重调整
在线阅读 下载PDF
基于K互近邻与核密度估计的DPC算法 被引量:2
5
作者 周玉 夏浩 +1 位作者 刘虹瑜 白磊 《北京航空航天大学学报》 北大核心 2025年第6期1978-1990,共13页
快速搜索和发现密度峰值聚类(DPC)算法是一种基于密度的聚类算法。该算法不需要迭代和过多的设定参数,但由于计算局部密度时没有考虑数据的局部结构,导致无法识别簇密度小的聚类中心。针对此问题,提出基于K互近邻(KN)和核密度估计(KDE)... 快速搜索和发现密度峰值聚类(DPC)算法是一种基于密度的聚类算法。该算法不需要迭代和过多的设定参数,但由于计算局部密度时没有考虑数据的局部结构,导致无法识别簇密度小的聚类中心。针对此问题,提出基于K互近邻(KN)和核密度估计(KDE)的DPC(KKDPC)算法。通过K近邻和核密度估计方法得到数据点的K互近邻数量和局部核密度;将K互近邻数量与局部核密度进行加和获得新的局部密度;根据数据点的局部密度得到相对距离,并通过构建决策图选取聚类中心及分配非中心点。利用人工数据集和真实数据集进行实验,并与DPC、基于密度的噪声空间聚类应用(DBSCAN)、K-means、模糊C均值聚类算法(FCM)、基于K近邻的DPC(DPCKNN)、近邻优化DPC(DPC-NNO)、基于模糊加权共享邻居的DPC(DPC-FWSN)算法进行对比。通过计算调整互信息(AMI)、调整兰德指数(ARI)、归一化互信息(NMI)来验证KKDPC算法的性能。实验结果表明:KKDPC算法能更加准确地识别聚类中心,有效地提高聚类精度。 展开更多
关键词 聚类算法 密度峰值 k近邻 k互近邻 核密度估计
在线阅读 下载PDF
量子遗传算法的模糊K-prototypes聚类 被引量:1
6
作者 叶奇明 梁根 《计算机工程与应用》 CSCD 北大核心 2010年第1期112-115,共4页
聚类分析是数据挖掘中应用最多的一种技术,它在许多领域都有重要应用。模糊h-prototypes算法是当前聚类分析中最有效算法之一,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于量子遗传算法和FKP算法的... 聚类分析是数据挖掘中应用最多的一种技术,它在许多领域都有重要应用。模糊h-prototypes算法是当前聚类分析中最有效算法之一,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于量子遗传算法和FKP算法的混合聚类算法,首先利用量子遗传算法确定FKP的初始聚类中心,再将量子遗传算法聚类结果作为后续FKP算法的初始值。实验结果显示,算法具有良好的收敛性和稳定性,聚类效果优于单一使用FKP算法和相关改进的算法。 展开更多
关键词 聚类算法 量子遗传算法 模糊k-prototypes算法 数值型属性 数据挖掘
在线阅读 下载PDF
基于平均差异度的改进k-prototypes聚类算法 被引量:4
7
作者 石鸿雁 徐明明 《沈阳工业大学学报》 EI CAS 北大核心 2019年第5期555-559,共5页
针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中... 针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中心点选取的随机性,同时利用信息熵确定数值数据的属性权重,并对分类属性度量公式进行改进,给出了一种混合属性数据度量公式.结果表明,改进后的算法具有较高的准确率,能够有效处理混合属性数据. 展开更多
关键词 k-prototypes算法 聚类 初始聚类中心 混合属性数据 平均差异度 信息熵 属性权重 度量公式
在线阅读 下载PDF
基于主成分分析算法和K均值聚类算法的药品库存分类管理 被引量:1
8
作者 唐蕾 邱磊 +1 位作者 俞佳慧 冀召帅 《医药导报》 北大核心 2025年第4期682-686,共5页
目的针对目前药品分类主观性较强、分类标准模糊、影响因素繁杂的问题,探讨一种科学的药品分类方法,以降低库存成本,提高库存的有效性。方法在北京某三级医院2021—2022年历史数据中随机抽取700种药品为研究对象,通过主成分分析(PCA)算... 目的针对目前药品分类主观性较强、分类标准模糊、影响因素繁杂的问题,探讨一种科学的药品分类方法,以降低库存成本,提高库存的有效性。方法在北京某三级医院2021—2022年历史数据中随机抽取700种药品为研究对象,通过主成分分析(PCA)算法和K均值聚类(K-means)算法对研究对象进行分类。结果确定轮廓系数为0.3470的分类数4为最佳分类数,将700种药品分为4类,其中有363种归为第一类,186种归为第二类,94种归为第三类,57种归为第四类。将该文研究的药品分类方法模拟运用到某三级医院2023年第二季度的药品库存管理中,模拟结果表明该分类方法能够降低库存成本,提高库存有效性。结论基于PCA算法和K-means聚类算法的药品分类方法能够为药品库存分类管理提供可靠依据。 展开更多
关键词 药品分类 主成分分析算法 k均值聚类算法 药品库存管理
在线阅读 下载PDF
基于信息增益的模糊K-prototypes聚类算法
9
作者 欧阳浩 王智文 +1 位作者 戴喜生 刘智琦 《计算机工程与科学》 CSCD 北大核心 2015年第5期1009-1014,共6页
K-prototypes聚类算法结合了K-means算法和K-modes算法,可用于分析混合属性的数据对象。传统的K-prototypes聚类算法在计算数据对象的相异度时,未考虑各个属性对于最终聚类结果的影响程度,而现实世界中,各属性的重要程度是不同的。使用... K-prototypes聚类算法结合了K-means算法和K-modes算法,可用于分析混合属性的数据对象。传统的K-prototypes聚类算法在计算数据对象的相异度时,未考虑各个属性对于最终聚类结果的影响程度,而现实世界中,各属性的重要程度是不同的。使用了信息论中信息增益的计算方法,来获得各个属性的权值。在计算各属性的差异度时,乘以这些权值,从而可以获得更为准确的聚类结果。为了增加算法处理模糊问题的能力,本算法引用了模糊理论,从而使其具有较好的抗干扰能力和处理不确定性问题的能力。通过对四个UCI数据集的聚类分析实验,表明了本算法的有效性。 展开更多
关键词 聚类 信息增益 模糊k-prototypes算法 混合型数据
在线阅读 下载PDF
KMDW和ISVDD方法在钻头磨损状态识别中的应用
10
作者 郝旺身 娄本池 +4 位作者 董辛旻 王林恒 朱春辉 陈世金 王亚坤 《重庆理工大学学报(自然科学)》 北大核心 2025年第7期179-186,共8页
为识别钻头的磨损状态,解决多分类过程中支持向量数据描述(SVDD)对混叠样本识别精度差的问题,提出一种基于结合K均值密度权重(KMDW)聚类和改进SVDD(ISVDD)的方法。采用小波包分解多尺度排列熵值(WPD-MPE)方法提取特征向量;结合KMDW和SVD... 为识别钻头的磨损状态,解决多分类过程中支持向量数据描述(SVDD)对混叠样本识别精度差的问题,提出一种基于结合K均值密度权重(KMDW)聚类和改进SVDD(ISVDD)的方法。采用小波包分解多尺度排列熵值(WPD-MPE)方法提取特征向量;结合KMDW和SVDD模型进行故障分类,对混叠样本采用K近邻隶属度值进行识别,并采用改进的蝴蝶优化算法(IBOA)优化SVDD模型参数。在标准数据集上验证所提方法的优越性,结果表明:加入K近邻隶属度值可使F值和准确率分别提升6.36%和6.59%;KMDW相比K均值聚类方法的ARI值和NMI值分别提升10.01%和10.75%,能够达到更好的聚类效果;经蝴蝶优化算法改进后模型识别精度进一步提高。将所提方法应用于钻头磨损状态的识别,识别准确率达到92.83%,证明其具有较好的识别精度和通用性。 展开更多
关键词 SVDD k均值密度权重聚类 蝴蝶优化算法 k近邻算法 钻头磨损状态识别
在线阅读 下载PDF
基于K-PSO和StOMP的往复压缩机激振信号盲源分离
11
作者 王金东 马智超 +2 位作者 赵海洋 李彦阳 张宇 《机床与液压》 北大核心 2025年第3期228-234,共7页
在当前信号的盲源分离中,传统“两步法”易陷入局部最优解,并且其准确率会随采集信号数的增加或稀疏性的降低而大幅下降。针对上述问题,提出一种结合K均值-粒子群(K-PSO)和分段正交匹配追踪(StOMP)的稀疏分量分析方法。对采集信号执行K... 在当前信号的盲源分离中,传统“两步法”易陷入局部最优解,并且其准确率会随采集信号数的增加或稀疏性的降低而大幅下降。针对上述问题,提出一种结合K均值-粒子群(K-PSO)和分段正交匹配追踪(StOMP)的稀疏分量分析方法。对采集信号执行K均值聚类算法,将产生的结果反馈至PSO聚类中估计混合矩阵。在获得混合矩阵后,将其源信号矩阵转化成列数为1的向量,再通过分段正交匹配追踪算法重构源信号。将实测的往复压缩机正常信号和3种单一故障信号混合成2种复合故障信号,并对复合故障信号进行试验验证。结果表明:在计算时间方面,相较模糊C均值聚类(0.335 s)和K均值聚类(0.299 s),尽管K-PSO聚类方法牺牲了一部分效率(1.561 s),但在总体角度偏差和归一化均方根误差方面表现更优,具有更好的估计精度;相较最短路径法(0.123 s),StOMP算法同样牺牲效率(2.031 s),却获得更佳的相关系数和均方根误差,表现更好的分离重构能力。这说明,该方法在盲源分离中具有可行性和实际应用价值。 展开更多
关键词 往复压缩机 欠定盲源分离 k均值聚类 粒子群算法 分段正交匹配追踪
在线阅读 下载PDF
基于RSA模型和改进K-means算法的电商行业客户细分
12
作者 杨静 《计算机应用与软件》 北大核心 2025年第8期125-131,172,共8页
针对新兴的网络购物客户数量大、客户流动性强和消费数据多的特点,提出RSA模型结合改进的K-means聚类算法实现客户细分。采用熵值法计算RSA模型各指标的权重,综合各个属性计算客户价值。结合K近邻算法和密度峰值算法,提出一种基于K近邻... 针对新兴的网络购物客户数量大、客户流动性强和消费数据多的特点,提出RSA模型结合改进的K-means聚类算法实现客户细分。采用熵值法计算RSA模型各指标的权重,综合各个属性计算客户价值。结合K近邻算法和密度峰值算法,提出一种基于K近邻和密度峰值聚类的K-means初始聚类中心选取方法,优化传统K-means算法实现客户细分。通过选取的标准数据集和某零售公司在线交易的真实数据进行实验验证,证明了RSA模型和改进K-means算法具有更加优异的性能。 展开更多
关键词 RSA模型 客户细分 k-MEANS算法 密度峰值聚类 k近邻
在线阅读 下载PDF
基于改进式k-prototypes聚类的坏数据辨识与修正 被引量:9
13
作者 王孝慈 董树锋 +2 位作者 刘育权 王莉 李俊格 《电测与仪表》 北大核心 2022年第2期9-15,共7页
工业领域很多技术的实现都以准确的负荷数据为基础,而工厂现有的负荷数据测量体系常因为通信、存储等故障,导致负荷数据中出现大量坏数据。因此,提出基于改进式k-prototypes聚类的坏数据辨识与修正方法,通过在聚类中引入非负荷数据特征... 工业领域很多技术的实现都以准确的负荷数据为基础,而工厂现有的负荷数据测量体系常因为通信、存储等故障,导致负荷数据中出现大量坏数据。因此,提出基于改进式k-prototypes聚类的坏数据辨识与修正方法,通过在聚类中引入非负荷数据特征,削弱负荷坏数据对聚类结果的影响,使坏数据辨识和修复结果更准确。改进式k-prototypes算法通过随机初始化,并行计算择优,克服了标准k-prototypes容易随初始聚类中心陷入局部最优解的缺陷;并通过聚类数量的自适应处理,解决了主观决定聚类数量的问题。基于聚类结果,根据正态分布原则确定负荷数据可行域,识别坏数据,并利用类中心置换法进行修正。实验表明,该方法较只考虑负荷数据的模糊均值聚类法效果更好,坏数据识别的召回率与修正的准确率显著提高。 展开更多
关键词 k-prototypes聚类 混合数据集聚类 坏数据辨识 类中心置换修正法 工业负荷预处理
在线阅读 下载PDF
一种有效的Gk-prototypes聚类算法 被引量:1
14
作者 郭映江 徐蔚鸿 +1 位作者 陈沅涛 文泽林 《计算机工程与科学》 CSCD 北大核心 2019年第9期1693-1699,共7页
针对传统的聚类算法对初始聚类中心敏感、只能对单一属性聚类且聚类效果有时欠佳等不足,提出了一种能处理数值属性和分类属性的Gk-prototypes聚类算法。在经典的k-prototypes聚类算法的基础上,利用去模糊相似矩阵来构造粗粒子集,结合粒... 针对传统的聚类算法对初始聚类中心敏感、只能对单一属性聚类且聚类效果有时欠佳等不足,提出了一种能处理数值属性和分类属性的Gk-prototypes聚类算法。在经典的k-prototypes聚类算法的基础上,利用去模糊相似矩阵来构造粗粒子集,结合粒计算和最大最小距离法确定初始聚类中心,并改进了目标函数。实验结果和理论分析表明,Gk-prototypes聚类算法与其他基于k-prototypes的改进算法相比,聚类更准确,有效性更好,鲁棒性更强。 展开更多
关键词 k-prototypes聚类 去模糊相似矩阵 粒计算 最大最小距离法
在线阅读 下载PDF
基于K-means算法的艾德莱斯绸色彩提取方法的优化设计
15
作者 刘恒君 饶蕾 曹远荣 《毛纺科技》 北大核心 2025年第8期82-90,共9页
为了提高艾德莱斯绸的数据化以及数字化研究,针对艾德莱斯绸本身的工艺特征优化设计一种基于K-means聚类算法的色彩提取方法。首先采用非接触扫描仪扫描样本获得图像;通过中值滤波对比图像在不同窗口尺寸下的平滑降噪效果,确定最适合艾... 为了提高艾德莱斯绸的数据化以及数字化研究,针对艾德莱斯绸本身的工艺特征优化设计一种基于K-means聚类算法的色彩提取方法。首先采用非接触扫描仪扫描样本获得图像;通过中值滤波对比图像在不同窗口尺寸下的平滑降噪效果,确定最适合艾德莱斯绸图像预处理的窗口数值;再将图像的色彩信息从RGB空间转为更符合视觉分析的HSV空间;结合艾德莱斯绸本身纹样特征,对比2种常见的最佳类簇数目k值选取办法,并进行k值选取办法的优化和对比;最后将聚类算法与数据分析相结合,采用多个k值分别确定图像单个色彩。结果表明:该优化方式可以较为准确地提取出复杂的艾德莱斯绸色彩及其占比情况,为提取复杂图像色彩提供了新的研究思路,拓宽传统纹样图像的色彩研究方式。 展开更多
关键词 k-MEANS聚类算法 艾德莱斯绸 色彩提取 数据分析
在线阅读 下载PDF
一种面向混合型数据聚类的k-prototypes聚类算法 被引量:7
16
作者 贾子琪 宋玲 《小型微型计算机系统》 CSCD 北大核心 2020年第9期1845-1852,共8页
同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高... 同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高维混合型数据聚类中的特征加权问题,提出了基于熵权的分类型相异度系数,量化的数值型相异度系数和适用于混合型数据聚类的混合型相异度系数.提出的相异度系数充分考虑了分类型特征值的重要性和数值型特征值的平均值,并具统一的准则,可以更客观的计算数据对象与簇之间的相异度.此外,将加权的混合型相异度系数应用到经典的k-prototypes算法中,提出了一种面向混合型数据聚类的k-prototypes聚类算法(KPMD).使用UCI真实数据集进行实验,结果验证了KPMD算法的有效性和鲁棒性. 展开更多
关键词 k-prototypes 混合型相异度系数 分类型数据 数值型数据 混合型数据
在线阅读 下载PDF
基于k-means聚类与标记分水岭算法的二氧化氯浓度测试方法
17
作者 何家萌 黄豪中 +1 位作者 陈其勇 许桂霞 《广西大学学报(自然科学版)》 北大核心 2025年第1期186-199,共14页
人为使用二氧化氯检测试纸与标准比色卡进行比对时无法得出具体的浓度结果,且受主观因素影响较大,测量结果准确性差的问题,对二氧化氯检测试纸进行图像采集,根据其颜色与形状特征,提出基于三通道彩色图片的k-means聚类算法与标记分水岭... 人为使用二氧化氯检测试纸与标准比色卡进行比对时无法得出具体的浓度结果,且受主观因素影响较大,测量结果准确性差的问题,对二氧化氯检测试纸进行图像采集,根据其颜色与形状特征,提出基于三通道彩色图片的k-means聚类算法与标记分水岭算法结合的分割算法,快速准确地完成对二氧化氯检测试纸的分割及定位,并对二氧化氯检测试纸的颜色值与对应溶液的浓度进行相关性分析与曲线拟合,在定位二氧化氯检测试纸后,提取其颜色值并根据拟合曲线计算出对应的二氧化氯溶液浓度。结果表明,该算法分割速度快,分割效果好,对二氧化氯溶液浓度的测量准确,质量浓度对误差不超过15 mg/L,引用误差不超过4%,能有效避免人为比对时产生的主观因素干扰以及估算误差。 展开更多
关键词 二氧化氯检测试纸 消杀效果评价 k-MEANS聚类算法 标记分水岭算法
在线阅读 下载PDF
基于渐近式k-means聚类的多行动者确定性策略梯度算法
18
作者 刘全 刘晓松 +1 位作者 吴光军 刘禹含 《吉林大学学报(理学版)》 北大核心 2025年第3期885-894,共10页
针对深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法在一些大状态空间任务中存在学习效果不佳及波动较大等问题,提出一种基于渐近式k-means聚类算法的多行动者深度确定性策略梯度(multi-actor deep deterministic po... 针对深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法在一些大状态空间任务中存在学习效果不佳及波动较大等问题,提出一种基于渐近式k-means聚类算法的多行动者深度确定性策略梯度(multi-actor deep deterministic policy gradient based on progressive k-means clustering,MDDPG-PK-Means)算法.在训练过程中,对每一时间步下的状态进行动作选择时,根据k-means算法判别结果辅佐行动者网络的决策,同时随训练时间步的增加,逐渐增加k-means算法类簇中心的个数.将MDDPG-PK-Means算法应用于MuJoCo仿真平台上,实验结果表明,与DDPG等算法相比,MDDPG-PK-Means算法在大多数连续任务中都具有更好的效果. 展开更多
关键词 深度强化学习 确定性策略梯度算法 k-MEANS聚类 多行动者
在线阅读 下载PDF
基于自组织映射优化k均值聚类合成少数类算法及应用
19
作者 罗博炜 谭家驹 冯纪强 《广西大学学报(自然科学版)》 北大核心 2025年第3期679-689,共11页
针对金融数据高度不平衡使信贷违约预警模型训练和评估的复杂度大大增加的特点,为了改进重采样方法,运用自组织映射(SOM)神经网络来优化k均值聚类合成少数类(k-Means-SMOTE)算法,通过自组织映射神经网络识别和分析不平衡数据集的结构特... 针对金融数据高度不平衡使信贷违约预警模型训练和评估的复杂度大大增加的特点,为了改进重采样方法,运用自组织映射(SOM)神经网络来优化k均值聚类合成少数类(k-Means-SMOTE)算法,通过自组织映射神经网络识别和分析不平衡数据集的结构特征,将高维数据有效地映射至低维空间。在此基础上,结合k-Means算法进行数据聚类,以识别少数类样本的潜在群集,从而更准确地确定过采样的焦点区域。最后运用SMOTE技术对这些焦点区域进行过采样,增加少数类样本数量的同时保持数据的原始特征分布,从而减少过拟合的风险。在Bank marketing、Credit_Fraud等多个经典的真实金融数据集上的实验证明,该方法能够通过增加聚类稳定性来提升传统过采样算法的质量,在提升模型性能的同时降低算法复杂度。 展开更多
关键词 自组织映射神经网络 聚类算法 k均值聚类合成少数类过采样方法 信贷违约预警
在线阅读 下载PDF
基于K-means聚类粒子群算法的海洋结构迭代型损伤识别方法
20
作者 周旭涛 赵海旭 +2 位作者 蒋玉峰 王树青 刘雨 《中国海洋大学学报(自然科学版)》 北大核心 2025年第4期134-147,共14页
为了解决传统智能优化算法在结构损伤识别中易陷入局部最优解,导致损伤识别时误判单元较多且识别精度较差的问题,本文提出了一种迭代型结构损伤识别方法。该方法创新性地引入了基于K-means聚类的新型粒子群算法,以加快算法收敛和避免陷... 为了解决传统智能优化算法在结构损伤识别中易陷入局部最优解,导致损伤识别时误判单元较多且识别精度较差的问题,本文提出了一种迭代型结构损伤识别方法。该方法创新性地引入了基于K-means聚类的新型粒子群算法,以加快算法收敛和避免陷入局部最优解,同时,采用迭代思想对传统损伤识别方法进行改进,将损伤识别结果进行迭代更新,以获得准确的损伤位置及损伤程度。以某三腿海上风机结构为例:首先,探讨了非迭代型方法在无噪声和有噪声污染时的结构损伤识别效果;其次,分析所提出的迭代型方法在无噪声和有噪声污染两种情况下的结构损伤识别效果;然后,探究了所提出方法的收敛性及稳定性;最后,采用物理模型试验对提出的方法进行了验证。结果表明,提出的迭代型聚类粒子群算法相比传统结构损伤识别方法可获得更准确的损伤位置及损伤程度,并展现出良好的噪声鲁棒性,且算法迭代次数少,识别效果稳定。 展开更多
关键词 k-means聚类粒子群算法 损伤识别 海上风机结构 迭代型方法
在线阅读 下载PDF
上一页 1 2 59 下一页 到第
使用帮助 返回顶部