期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
构造性覆盖算法的SMOTE过采样方法 被引量:10
1
作者 严远亭 朱原玮 +2 位作者 吴增宝 张以文 张燕平 《计算机科学与探索》 CSCD 北大核心 2020年第6期975-984,共10页
如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数... 如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题。此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视。针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE。CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法。在12个典型的不平衡数据集上验证CMOTE算法的性能。实验结果表明,CMOTE算法在总体上优于对比方法,并且通过强化关键样本对模型性能的影响增强了模型的泛化能力。 展开更多
关键词 不平衡数据 过采样技术 合成少数类过采样技术(SMOTE) 构造性覆盖算法(CCA)
在线阅读 下载PDF
基于Lasso和构造性覆盖算法的不均衡数据分类方法 被引量:3
2
作者 蒋溢 伍书平 +1 位作者 胡昆 龙林波 《计算机应用》 CSCD 北大核心 2023年第4期1086-1093,共8页
针对机器学习分类算法在不均衡数据分类问题中对少数类样本识别能力不足的问题,以电信客户流失场景为例,提出一种不均衡数据分类方法 L-CCSmote(Lasso Constructive Covering Smote)。首先,通过套索回归(Lasso)提取流失用户特征以优化... 针对机器学习分类算法在不均衡数据分类问题中对少数类样本识别能力不足的问题,以电信客户流失场景为例,提出一种不均衡数据分类方法 L-CCSmote(Lasso Constructive Covering Smote)。首先,通过套索回归(Lasso)提取流失用户特征以优化模型输入;然后,通过构造性覆盖算法(CCA)建立神经网络生成符合样本整体分布的覆盖;最后,进一步提出单样本覆盖策略、样本多样性策略和样本密度峰值策略,通过以上策略混合采样以平衡数据。选用了KEEL数据库中的13个不均衡数据集和2个脱敏电信客户数据集,分别在逻辑回归(LR)和支持向量机(SVM)分类算法上对该方法进行验证。在LR分类算法上,与SMOTE-Enn(Synthetic Minority Oversampling TEchnique Edited nearest neighbor)相比,所提方法的平均几何平均值(G-MEAN)提升了2.32%;在SVM分类算法上,与Borderline-SMOTE(Borderline Synthetic Minority Oversampling Technique Edited)相比,所提方法的平均G-MEAN提升了2.44%。实验结果表明,所提方法能解决类别偏斜分布影响分类的问题,且对于稀有类的识别能力优于经典平衡数据方法。 展开更多
关键词 Lasso 构造性覆盖算法 不均衡数据分类 客户流失预测 混合采样
在线阅读 下载PDF
基于CCA的代价敏感三支决策模型 被引量:11
3
作者 张燕平 邹慧锦 赵姝 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第2期447-452,共6页
随着数据挖掘和机器学习技术在实际问题中的广泛应用,人们越来越多的发现实际分类问题通常具有代价敏感特性.代价敏感的分类是指在同一分类任务中错误分类的代价是不同的.介绍了一种基于构造性覆盖算法的代价敏感三支决策模型,即将代价... 随着数据挖掘和机器学习技术在实际问题中的广泛应用,人们越来越多的发现实际分类问题通常具有代价敏感特性.代价敏感的分类是指在同一分类任务中错误分类的代价是不同的.介绍了一种基于构造性覆盖算法的代价敏感三支决策模型,即将代价敏感引入到基于构造性覆盖算法的三支决策模型.该模型根据误分类之间的大小关系来减少正、负覆盖的个数,从而调整三个域,即正域、负域和边界域的大小.引入代价敏感的目的是尽可能的减少划分损失.实验对比了本文的模型分类结果和基于决策粗糙集的三支决策模型,结果表明,本文的模型分类结果稳定,并且能够通过改变三个域的大小,把分类损失最小化. 展开更多
关键词 代价敏感 三支决策 构造性覆盖算法 决策粗糙集模型
在线阅读 下载PDF
CCA三支决策模型的边界域样本处理 被引量:3
4
作者 张燕平 邹慧锦 +1 位作者 邢航 赵姝 《计算机科学与探索》 CSCD 2014年第5期593-600,共8页
构造性覆盖算法(constructive covering algorithm,CCA)三支决策模型在学习过程中根据样本分布特征,自动产生正域、负域和边界域。该模型为边界域样本处理问题提供了新的思路。重点讨论了基于CCA的三支决策的边界域样本处理问题。对边... 构造性覆盖算法(constructive covering algorithm,CCA)三支决策模型在学习过程中根据样本分布特征,自动产生正域、负域和边界域。该模型为边界域样本处理问题提供了新的思路。重点讨论了基于CCA的三支决策的边界域样本处理问题。对边界域样本处理提出了两种决策方案:一种为处理全部的边界域样本,给出了距中心最近原则、距边界最近原则、万有引力原则3种方法;另一种为处理部分的边界域样本,即只对满足一定条件的边界域样本作进一步的划分,这样使不满足条件的边界域样本仍保留在边界域,提高了边界域样本处理的正确率。用十字交叉法在5组数据集上对这两种决策方案进行了对比,实验结果表明,处理部分边界域样本时正确率更高,效果更好。 展开更多
关键词 构造性覆盖算法(CCA) 边界域样本处理 三支决策 CONSTRUCTIVE COVERING ALGORITHM (CCA)
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部