-
题名基于AdaBoost的类不平衡学习算法
被引量:11
- 1
-
-
作者
秦孟梅
邱建林
陆鹏程
陈璐璐
赵伟康
-
机构
南通大学电子信息学院
南通大学计算机科学与技术学院
南通理工学院计算机与信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第11期3229-3232,3254,共5页
-
基金
国家自然科学基金资助项目(NSF61202006/61272424)
计算机软件新技术国家重点实验室开放课题(KFKT2012B29)
+1 种基金
江苏省自然科学基金资助项目(BK2010277)
江苏省科技创新基金资助项目(BC2013167)
-
文摘
处理类不平衡数据时,少数类的边界实例非常容易被错分。为了降低类不平衡对分类器性能的影响,提出了自适应边界采样算法(AB-SMOTE)。AB-SMOTE算法对少数类的边界样本进行自适应采样,提高了数据集的平衡度和有效性;同时将AB-SMOTE算法与数据清理技术融合,形成基于Ada Boost的集成算法ABTAdaBoost。ABTAda Boost算法主要包括三个阶段:对训练数据集采用AB-SMOTE算法,降低数据集的类不平衡度;使用Tomek links数据清理技术清除数据集中的噪声和抽样方法产生的重叠样例,有效提高数据的可用性;使用Ada Boost集成算法生成一个基于N个弱分类器的集成分类器。实验分别以J48决策树和朴素贝叶斯作为基分类器,在12个UCI数据集上的实验结果表明,ABTAda Boost算法的预测性能优于其他几种算法。
-
关键词
机器学习
类不平衡学习
集成学习
SMOTE
数据清理技术
-
Keywords
machine learning
class imbalance learning
ensemble learning
SMOTE
data cleaning techniques
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-