稀有类识别问题在现实生活的很多方面都有广泛应用.由于数据的高度倾斜,很多传统分类算法在稀有类上效果不佳.使用一种新的集成方法,称为EDKC(ensemble of different kind of classifiers)用来分类稀有类. EDKC集成不同的分类器形成组...稀有类识别问题在现实生活的很多方面都有广泛应用.由于数据的高度倾斜,很多传统分类算法在稀有类上效果不佳.使用一种新的集成方法,称为EDKC(ensemble of different kind of classifiers)用来分类稀有类. EDKC集成不同的分类器形成组合分类器,并且通过加权投票表决对未知样本进行分类.在UCI机器学习数据库的多个稀有类数据集上的实验结果表明,EDKC对稀有类分类不仅具有较高的F-度量值,能达到目标类召回率和精度的平衡,而且能够取得很高的分类准确率.展开更多
文摘稀有类识别问题在现实生活的很多方面都有广泛应用.由于数据的高度倾斜,很多传统分类算法在稀有类上效果不佳.使用一种新的集成方法,称为EDKC(ensemble of different kind of classifiers)用来分类稀有类. EDKC集成不同的分类器形成组合分类器,并且通过加权投票表决对未知样本进行分类.在UCI机器学习数据库的多个稀有类数据集上的实验结果表明,EDKC对稀有类分类不仅具有较高的F-度量值,能达到目标类召回率和精度的平衡,而且能够取得很高的分类准确率.