-
题名面向高维混合不平衡信贷数据的单类分类方法
被引量:1
- 1
-
-
作者
张东梅
买日旦·吾守尔
古兰拜尔·吐尔洪
-
机构
新疆大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第10期233-240,共8页
-
基金
教育厅高校科研青年项目(61021800032,61021211418)
自治区高层次创新人才项目(100400016,042419006)
新疆大学博士启动基金(620312308,620312310)。
-
文摘
为实现对高维混合、不平衡信贷数据中的不良贷款者的准确预测,从降维预处理和分类算法两方面进行优化,提出一种基于混合数据主成分分析(Principal Component Analysis of Mixed Data,PCAmix)预处理的单类K近邻(K-Nearest Neighbor,KNN)计算均值算法。针对传统的主成分分析(Principal Component Analysis,PCA)不能直接处理定性变量的问题,使用PCAmix降维预处理数据,为规避不平衡数据在二分类模型中性能较差的缺点,采用单类分类和K近邻算法邻居计算的思想,仅采用多数类训练模型。利用Bootstrap方法找到最佳的决策边界,使得正负样本最大限度地分离,最终准确预测客户的违约风险。采用UCI数据库中的German和Default个人信用评分数据集进行验证,实验结果表明该算法在处理高维混合、不平衡的信贷数据上具有较好的分类效果。
-
关键词
信用评分
单类分类
不平衡数据
高维混合数据
混合数据主成分分析
-
Keywords
credit score
one-class classification
imbalance data
high-dimensional mixed data
Principal Component Analysis of Mixed Data(PCAmix)
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-