期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于ν-SVM的不平衡数据挖掘研究 被引量:8
1
作者 郑恩辉 许宏 +1 位作者 李平 宋执环 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2006年第10期1682-1687,共6页
针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些... 针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些界分别扩展到正例和反例.在此基础上,证明了正例的支持向量率和边界支持向量率分别依概率大于反例的支持向量率和边界支持向量率,以及正例的分类性能依概率差于反例的分类性能.针对German credit和Heart disease两个Benchmark数据集的试验研究,验证了本文假设的合理性和上述结论的正确性. 展开更多
关键词 不平衡数据 有偏分类器 支持向量机
在线阅读 下载PDF
面向不均衡数据的融合谱聚类的自适应过采样法 被引量:9
2
作者 刘金平 周嘉铭 +3 位作者 贺俊宾 唐朝晖 徐鹏飞 张国勇 《智能系统学报》 CSCD 北大核心 2020年第4期732-739,共8页
分类是模式识别领域中的研究热点,大多数经典的分类器往往默认数据集是分布均衡的,而现实中的数据集往往存在类别不均衡问题,即属于正常/多数类别的数据的数量与属于异常/少数类数据的数量之间的差异很大。若不对数据进行处理往往会导... 分类是模式识别领域中的研究热点,大多数经典的分类器往往默认数据集是分布均衡的,而现实中的数据集往往存在类别不均衡问题,即属于正常/多数类别的数据的数量与属于异常/少数类数据的数量之间的差异很大。若不对数据进行处理往往会导致分类器忽略少数类、偏向多数类,使得分类结果恶化。针对数据的不均衡分布问题,本文提出一种融合谱聚类的综合采样算法。首先采用谱聚类方法对不均衡数据集的少数类样本的分布信息进行分析,再基于分布信息对少数类样本进行过采样,获得相对均衡的样本,用于分类模型训练。在多个不均衡数据集上进行了大量实验,结果表明,所提方法能有效解决数据的不均衡问题,使得分类器对于少数类样本的分类精度得到提升。 展开更多
关键词 不自适应综合采样法 不均衡数据集 谱聚类 过采样 模式分类 数据分布 有偏分类器 数据预处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部