期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
构造性覆盖算法的SMOTE过采样方法
被引量:
10
1
作者
严远亭
朱原玮
+2 位作者
吴增宝
张以文
张燕平
《计算机科学与探索》
CSCD
北大核心
2020年第6期975-984,共10页
如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数...
如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题。此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视。针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE。CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法。在12个典型的不平衡数据集上验证CMOTE算法的性能。实验结果表明,CMOTE算法在总体上优于对比方法,并且通过强化关键样本对模型性能的影响增强了模型的泛化能力。
展开更多
关键词
不平衡数据
过采样技术
合成少数类过采样技术(SMOTE)
构造性覆盖算法
(CCA)
在线阅读
下载PDF
职称材料
基于Lasso和构造性覆盖算法的不均衡数据分类方法
被引量:
3
2
作者
蒋溢
伍书平
+1 位作者
胡昆
龙林波
《计算机应用》
CSCD
北大核心
2023年第4期1086-1093,共8页
针对机器学习分类算法在不均衡数据分类问题中对少数类样本识别能力不足的问题,以电信客户流失场景为例,提出一种不均衡数据分类方法 L-CCSmote(Lasso Constructive Covering Smote)。首先,通过套索回归(Lasso)提取流失用户特征以优化...
针对机器学习分类算法在不均衡数据分类问题中对少数类样本识别能力不足的问题,以电信客户流失场景为例,提出一种不均衡数据分类方法 L-CCSmote(Lasso Constructive Covering Smote)。首先,通过套索回归(Lasso)提取流失用户特征以优化模型输入;然后,通过构造性覆盖算法(CCA)建立神经网络生成符合样本整体分布的覆盖;最后,进一步提出单样本覆盖策略、样本多样性策略和样本密度峰值策略,通过以上策略混合采样以平衡数据。选用了KEEL数据库中的13个不均衡数据集和2个脱敏电信客户数据集,分别在逻辑回归(LR)和支持向量机(SVM)分类算法上对该方法进行验证。在LR分类算法上,与SMOTE-Enn(Synthetic Minority Oversampling TEchnique Edited nearest neighbor)相比,所提方法的平均几何平均值(G-MEAN)提升了2.32%;在SVM分类算法上,与Borderline-SMOTE(Borderline Synthetic Minority Oversampling Technique Edited)相比,所提方法的平均G-MEAN提升了2.44%。实验结果表明,所提方法能解决类别偏斜分布影响分类的问题,且对于稀有类的识别能力优于经典平衡数据方法。
展开更多
关键词
Lasso
构造性覆盖算法
不均衡数据分类
客户流失预测
混合采样
在线阅读
下载PDF
职称材料
基于CCA的代价敏感三支决策模型
被引量:
11
3
作者
张燕平
邹慧锦
赵姝
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2015年第2期447-452,共6页
随着数据挖掘和机器学习技术在实际问题中的广泛应用,人们越来越多的发现实际分类问题通常具有代价敏感特性.代价敏感的分类是指在同一分类任务中错误分类的代价是不同的.介绍了一种基于构造性覆盖算法的代价敏感三支决策模型,即将代价...
随着数据挖掘和机器学习技术在实际问题中的广泛应用,人们越来越多的发现实际分类问题通常具有代价敏感特性.代价敏感的分类是指在同一分类任务中错误分类的代价是不同的.介绍了一种基于构造性覆盖算法的代价敏感三支决策模型,即将代价敏感引入到基于构造性覆盖算法的三支决策模型.该模型根据误分类之间的大小关系来减少正、负覆盖的个数,从而调整三个域,即正域、负域和边界域的大小.引入代价敏感的目的是尽可能的减少划分损失.实验对比了本文的模型分类结果和基于决策粗糙集的三支决策模型,结果表明,本文的模型分类结果稳定,并且能够通过改变三个域的大小,把分类损失最小化.
展开更多
关键词
代价敏感
三支决策
构造性覆盖算法
决策粗糙集模型
在线阅读
下载PDF
职称材料
CCA三支决策模型的边界域样本处理
被引量:
3
4
作者
张燕平
邹慧锦
+1 位作者
邢航
赵姝
《计算机科学与探索》
CSCD
2014年第5期593-600,共8页
构造性覆盖算法(constructive covering algorithm,CCA)三支决策模型在学习过程中根据样本分布特征,自动产生正域、负域和边界域。该模型为边界域样本处理问题提供了新的思路。重点讨论了基于CCA的三支决策的边界域样本处理问题。对边...
构造性覆盖算法(constructive covering algorithm,CCA)三支决策模型在学习过程中根据样本分布特征,自动产生正域、负域和边界域。该模型为边界域样本处理问题提供了新的思路。重点讨论了基于CCA的三支决策的边界域样本处理问题。对边界域样本处理提出了两种决策方案:一种为处理全部的边界域样本,给出了距中心最近原则、距边界最近原则、万有引力原则3种方法;另一种为处理部分的边界域样本,即只对满足一定条件的边界域样本作进一步的划分,这样使不满足条件的边界域样本仍保留在边界域,提高了边界域样本处理的正确率。用十字交叉法在5组数据集上对这两种决策方案进行了对比,实验结果表明,处理部分边界域样本时正确率更高,效果更好。
展开更多
关键词
构造性覆盖算法
(CCA)
边界域样本处理
三支决策
CONSTRUCTIVE
COVERING
ALGORITHM
(CCA)
在线阅读
下载PDF
职称材料
题名
构造性覆盖算法的SMOTE过采样方法
被引量:
10
1
作者
严远亭
朱原玮
吴增宝
张以文
张燕平
机构
安徽大学计算机科学与技术学院
出处
《计算机科学与探索》
CSCD
北大核心
2020年第6期975-984,共10页
基金
国家自然科学基金,Nos.61806002,61673020,61872002
安徽大学博士科研启动基金。
文摘
如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题。此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视。针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE。CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法。在12个典型的不平衡数据集上验证CMOTE算法的性能。实验结果表明,CMOTE算法在总体上优于对比方法,并且通过强化关键样本对模型性能的影响增强了模型的泛化能力。
关键词
不平衡数据
过采样技术
合成少数类过采样技术(SMOTE)
构造性覆盖算法
(CCA)
Keywords
imbalanced data
over-sampling technique
synthetic minority over-sampling technique(SMOTE)
constructive covering algorithm(CCA)
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于Lasso和构造性覆盖算法的不均衡数据分类方法
被引量:
3
2
作者
蒋溢
伍书平
胡昆
龙林波
机构
重庆邮电大学计算机科学与技术学院
中国电信股份有限公司云南分公司云计算中心
出处
《计算机应用》
CSCD
北大核心
2023年第4期1086-1093,共8页
基金
国家自然科学基金资助项目(61902045)
重庆市技术创新与应用发展专项重点项目(cstc2019jscx‑mbdxX0035)。
文摘
针对机器学习分类算法在不均衡数据分类问题中对少数类样本识别能力不足的问题,以电信客户流失场景为例,提出一种不均衡数据分类方法 L-CCSmote(Lasso Constructive Covering Smote)。首先,通过套索回归(Lasso)提取流失用户特征以优化模型输入;然后,通过构造性覆盖算法(CCA)建立神经网络生成符合样本整体分布的覆盖;最后,进一步提出单样本覆盖策略、样本多样性策略和样本密度峰值策略,通过以上策略混合采样以平衡数据。选用了KEEL数据库中的13个不均衡数据集和2个脱敏电信客户数据集,分别在逻辑回归(LR)和支持向量机(SVM)分类算法上对该方法进行验证。在LR分类算法上,与SMOTE-Enn(Synthetic Minority Oversampling TEchnique Edited nearest neighbor)相比,所提方法的平均几何平均值(G-MEAN)提升了2.32%;在SVM分类算法上,与Borderline-SMOTE(Borderline Synthetic Minority Oversampling Technique Edited)相比,所提方法的平均G-MEAN提升了2.44%。实验结果表明,所提方法能解决类别偏斜分布影响分类的问题,且对于稀有类的识别能力优于经典平衡数据方法。
关键词
Lasso
构造性覆盖算法
不均衡数据分类
客户流失预测
混合采样
Keywords
Lasso(Least absolute shrinkage and selection operator)
constructive covering algorithm
imbalanced data classification
customer churn prediction
hybrid sampling
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于CCA的代价敏感三支决策模型
被引量:
11
3
作者
张燕平
邹慧锦
赵姝
机构
安徽大学计算机科学与技术学院
安徽大学计算智能与信号处理教育部重点实验室
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2015年第2期447-452,共6页
基金
国家自然科学基金(61175046
61203290)
+1 种基金
安徽省高等学校省级自然科学研究项目(KJ2013A016)
安徽大学研究生学术创新强化项目(yqh100176)
文摘
随着数据挖掘和机器学习技术在实际问题中的广泛应用,人们越来越多的发现实际分类问题通常具有代价敏感特性.代价敏感的分类是指在同一分类任务中错误分类的代价是不同的.介绍了一种基于构造性覆盖算法的代价敏感三支决策模型,即将代价敏感引入到基于构造性覆盖算法的三支决策模型.该模型根据误分类之间的大小关系来减少正、负覆盖的个数,从而调整三个域,即正域、负域和边界域的大小.引入代价敏感的目的是尽可能的减少划分损失.实验对比了本文的模型分类结果和基于决策粗糙集的三支决策模型,结果表明,本文的模型分类结果稳定,并且能够通过改变三个域的大小,把分类损失最小化.
关键词
代价敏感
三支决策
构造性覆盖算法
决策粗糙集模型
Keywords
cost-sensitive
Three-way decisions
Constructive Covering Algorithm
decision-theoretic rough set model
分类号
TP30 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
CCA三支决策模型的边界域样本处理
被引量:
3
4
作者
张燕平
邹慧锦
邢航
赵姝
机构
安徽大学计算机科学与技术学院
安徽大学计算智能与信号处理教育部重点实验室
出处
《计算机科学与探索》
CSCD
2014年第5期593-600,共8页
基金
国家自然科学基金Nos.61073117
61175046
+2 种基金
安徽省自然科学基金No.11040606M145
安徽省教育厅科学基金No.KJ2013A016
安徽大学大学生科研训练计划~~
文摘
构造性覆盖算法(constructive covering algorithm,CCA)三支决策模型在学习过程中根据样本分布特征,自动产生正域、负域和边界域。该模型为边界域样本处理问题提供了新的思路。重点讨论了基于CCA的三支决策的边界域样本处理问题。对边界域样本处理提出了两种决策方案:一种为处理全部的边界域样本,给出了距中心最近原则、距边界最近原则、万有引力原则3种方法;另一种为处理部分的边界域样本,即只对满足一定条件的边界域样本作进一步的划分,这样使不满足条件的边界域样本仍保留在边界域,提高了边界域样本处理的正确率。用十字交叉法在5组数据集上对这两种决策方案进行了对比,实验结果表明,处理部分边界域样本时正确率更高,效果更好。
关键词
构造性覆盖算法
(CCA)
边界域样本处理
三支决策
CONSTRUCTIVE
COVERING
ALGORITHM
(CCA)
Keywords
dealing with samples in boundary regions
three-way decisions
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
构造性覆盖算法的SMOTE过采样方法
严远亭
朱原玮
吴增宝
张以文
张燕平
《计算机科学与探索》
CSCD
北大核心
2020
10
在线阅读
下载PDF
职称材料
2
基于Lasso和构造性覆盖算法的不均衡数据分类方法
蒋溢
伍书平
胡昆
龙林波
《计算机应用》
CSCD
北大核心
2023
3
在线阅读
下载PDF
职称材料
3
基于CCA的代价敏感三支决策模型
张燕平
邹慧锦
赵姝
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2015
11
在线阅读
下载PDF
职称材料
4
CCA三支决策模型的边界域样本处理
张燕平
邹慧锦
邢航
赵姝
《计算机科学与探索》
CSCD
2014
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部