-
题名基于自组织映射优化k均值聚类合成少数类算法及应用
- 1
-
-
作者
罗博炜
谭家驹
冯纪强
-
机构
深圳大学数学科学学院
华润银行总行科技部
五邑大学数学与计算科学学院
-
出处
《广西大学学报(自然科学版)》
北大核心
2025年第3期679-689,共11页
-
基金
国家自然科学基金项目(62101388)。
-
文摘
针对金融数据高度不平衡使信贷违约预警模型训练和评估的复杂度大大增加的特点,为了改进重采样方法,运用自组织映射(SOM)神经网络来优化k均值聚类合成少数类(k-Means-SMOTE)算法,通过自组织映射神经网络识别和分析不平衡数据集的结构特征,将高维数据有效地映射至低维空间。在此基础上,结合k-Means算法进行数据聚类,以识别少数类样本的潜在群集,从而更准确地确定过采样的焦点区域。最后运用SMOTE技术对这些焦点区域进行过采样,增加少数类样本数量的同时保持数据的原始特征分布,从而减少过拟合的风险。在Bank marketing、Credit_Fraud等多个经典的真实金融数据集上的实验证明,该方法能够通过增加聚类稳定性来提升传统过采样算法的质量,在提升模型性能的同时降低算法复杂度。
-
关键词
自组织映射神经网络
聚类算法
k均值聚类合成少数类过采样方法
信贷违约预警
-
Keywords
self-organizing map neural network
clustering algorithm
k-Means-SMOTE
credit default warning
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
F830.49
[经济管理—金融学]
-