-
题名价值样本选取的不均衡分类
被引量:5
- 1
-
-
作者
徐剑
王馨月
才子昕
沈启航
景丽萍
-
机构
北京交通大学计算机与信息技术学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2020年第3期401-409,共9页
-
基金
中央高校基本科研业务费专项资金 No.2019YJS040~~
-
文摘
基于传统模型的实际分类问题,不均衡分类是一个常见的挑战问题。由于传统分类器较难学习少数类数据集内部的本质结构,导致更多地偏向于多数类,从而使少数类样本被误分为多数类样本。与此同时,样本集中的冗余数据和噪音数据也会对分类器造成困扰。为有效处理上述问题,提出一种新的不均衡分类框架SSIC,该框架充分考虑数据统计特性,自适应从大小类中选取有价值样本,并结合代价敏感学习构建不均衡数据分类器。首先,SSIC通过组合部分多数类实例和所有少数类实例来构造几个平衡的数据子集。在每个子集上,SSIC充分利用数据的特征来提取可区分的高级特征并自适应地选择重要样本,从而可以去除冗余噪声数据。其次,SSIC通过在每个样本上自动分配适当的权重来引入一种代价敏感的支持向量机(SVM),以便将少数类视为与多数类相等。
-
关键词
类的不均衡学习
分类
压缩激励网络
代价敏感度学习
-
Keywords
class imbalance learning
classification
squeeze-and-excitation networks
cost-sensitive learning
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-