-
题名基于改进的SMOTE采样Catboost分类算法
被引量:2
- 1
-
-
作者
张德鑫
雒腾
曾志勇
-
机构
云南财经大学统计与数学学院
-
出处
《信息通信》
2020年第1期57-60,共4页
-
文摘
现实生活中往往存在着不平衡数据现象,而少数类样本通常是我们重点关注的信息。文章通过俄亥俄州真实的医疗数据中存在的不平衡现象,提出了一种新的采样处理方法AK-SMOTE采样方法,即将ALLKNN欠采样技术和SMOTE人过合成过采样技术相结合,同时结合2017年出的应用较为少的Catboost算法,最后通过准确率、查准率、召回率、f1-度量和AUC值作为模型效果的评价指标,结果发现采用AK-SMOTE采样处理之后的Catboost模型在最后的评价指标上相比于其他模型,分类的效果会更好,尤其是在召回率和AUC指标上效果最为明显,也说明了基于AK-SMOTE采样的Catboost分类算法在处理实际生活中存在的不平衡数据问题时有着较为出色的分类效果,对于整个社会具有一定的现实借鉴意义。
-
关键词
类不平衡数据
医疗数据
AK-SMOTE采样
Catboost算法
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-