期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
若干评价准则对不平衡数据学习的影响
被引量:
23
1
作者
林智勇
郝志峰
杨晓伟
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第4期147-155,共9页
为解决绝大部分传统的以精度准则为优化目标而获得的分类器不适于不平衡数据学习(IDL)的问题,文中通过在支持向量机(SVM)模型上进行"元学习",研究了精度、平衡精度、几何平均、F1得分、信息增益、AUC(ROC曲线下方图面积)以及...
为解决绝大部分传统的以精度准则为优化目标而获得的分类器不适于不平衡数据学习(IDL)的问题,文中通过在支持向量机(SVM)模型上进行"元学习",研究了精度、平衡精度、几何平均、F1得分、信息增益、AUC(ROC曲线下方图面积)以及文中新提出的GAF和GBF等评价准则对IDL的影响.在16个来自UCI的不平衡数据集上进行了仿真实验.对实验结果的统计分析表明:不同准则对分类器性能的影响有显著差异;即便是对于先进的学习方法支持向量机(SVM)而言,若以精度准则最大化选择分类器,那么得到的SVM分类器也容易偏向预测多类;通过在其他准则上优化,能输出纠偏了的SVM分类器,它们的整体性能更好,尤其是在预测少类能力方面;在GAF以及GBF准则上优化所得的SVM分类器具有稳定且良好的性能.
展开更多
关键词
评价准则
不平衡数据学习
支持向量机
GAF准则
GBF准则
在线阅读
下载PDF
职称材料
极限学习机类不平衡数据学习算法研究
被引量:
2
2
作者
唐晓芬
陈莉
《计算机应用研究》
CSCD
北大核心
2018年第10期2990-2993,3002,共5页
针对目前提出的Boosting提升的加权极限学习机算法用各类总分类性能作为算法的优化目标,算法对大类样本具有性能偏向性,而且没有考虑数据中包含噪声及噪点时算法对分类性能的影响,提出基于AdaBoost提升的WELM算法。该算法利用考虑各类...
针对目前提出的Boosting提升的加权极限学习机算法用各类总分类性能作为算法的优化目标,算法对大类样本具有性能偏向性,而且没有考虑数据中包含噪声及噪点时算法对分类性能的影响,提出基于AdaBoost提升的WELM算法。该算法利用考虑各类样本分布不平衡特性的误差计算方式并对误差进行了sigmoid运算,提高了算法的对大类样本和小类样本的识别率及算法的抗噪声能力。通过在15个UCI不平衡数据集进行分析实验,实验结果表明提出的算法具有更好的分类性能。
展开更多
关键词
极限
学习
机
类
不平衡数据学习
支持向量机
ADABOOST
在线阅读
下载PDF
职称材料
类别条件噪声下的半监督AUC优化理论与算法
3
作者
姜阳邦彦
许倩倩
+3 位作者
杨智勇
郝前秀
操晓春
黄庆明
《计算机学报》
北大核心
2025年第1期136-155,共20页
现有半监督AUC优化方法通常假设数据标注是准确的。然而在许多实际应用中,研究者往往会同时面临标注量不足和不准确的问题。为此,该文首次尝试在不完整和不准确的数据标注情况下优化AUC指标。具体而言,通过分析,对称替代损失在某些情况...
现有半监督AUC优化方法通常假设数据标注是准确的。然而在许多实际应用中,研究者往往会同时面临标注量不足和不准确的问题。为此,该文首次尝试在不完整和不准确的数据标注情况下优化AUC指标。具体而言,通过分析,对称替代损失在某些情况下可以在半监督问题中具有噪声鲁棒性。在此基础上,该文构建了一个鲁棒半监督AUC优化框架,其导出的经验风险无需估计噪声率。此外,通过紧致泛化上界的分析表明,当模型基于足够大的训练数据集进行学习时,其在未见数据上能够很好地泛化。随后,使用Barrier hinge损失对该框架进行实例化。为加快训练过程,进一步开发了一种加速算法,将损失和梯度估计的复杂度从O(n^(2))降低至O(nlogn),在实验中可获得高达200倍的加速。最后,通过在15个基准数据集上进行实验验证,证明了所提方法的有效性。
展开更多
关键词
半监督
学习
AUC优化
标签噪声
二分类问题
不平衡数据学习
在线阅读
下载PDF
职称材料
题名
若干评价准则对不平衡数据学习的影响
被引量:
23
1
作者
林智勇
郝志峰
杨晓伟
机构
华南理工大学计算机科学与工程学院
广东工业大学应用数学学院
华南理工大学理学院
出处
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第4期147-155,共9页
基金
广东省教育部产学研结合项目(2007B090400031)
广东高校优秀青年创新人才培育项目(LYM08074)
文摘
为解决绝大部分传统的以精度准则为优化目标而获得的分类器不适于不平衡数据学习(IDL)的问题,文中通过在支持向量机(SVM)模型上进行"元学习",研究了精度、平衡精度、几何平均、F1得分、信息增益、AUC(ROC曲线下方图面积)以及文中新提出的GAF和GBF等评价准则对IDL的影响.在16个来自UCI的不平衡数据集上进行了仿真实验.对实验结果的统计分析表明:不同准则对分类器性能的影响有显著差异;即便是对于先进的学习方法支持向量机(SVM)而言,若以精度准则最大化选择分类器,那么得到的SVM分类器也容易偏向预测多类;通过在其他准则上优化,能输出纠偏了的SVM分类器,它们的整体性能更好,尤其是在预测少类能力方面;在GAF以及GBF准则上优化所得的SVM分类器具有稳定且良好的性能.
关键词
评价准则
不平衡数据学习
支持向量机
GAF准则
GBF准则
Keywords
evaluation metric
imbalanced data learning
support vector machine
GAF metric
GBF metric
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
极限学习机类不平衡数据学习算法研究
被引量:
2
2
作者
唐晓芬
陈莉
机构
西北大学信息科学与技术学院
宁夏大学信息工程学院
出处
《计算机应用研究》
CSCD
北大核心
2018年第10期2990-2993,3002,共5页
基金
国家自然科学基金资助项目(61461043
11561054
61379010)
文摘
针对目前提出的Boosting提升的加权极限学习机算法用各类总分类性能作为算法的优化目标,算法对大类样本具有性能偏向性,而且没有考虑数据中包含噪声及噪点时算法对分类性能的影响,提出基于AdaBoost提升的WELM算法。该算法利用考虑各类样本分布不平衡特性的误差计算方式并对误差进行了sigmoid运算,提高了算法的对大类样本和小类样本的识别率及算法的抗噪声能力。通过在15个UCI不平衡数据集进行分析实验,实验结果表明提出的算法具有更好的分类性能。
关键词
极限
学习
机
类
不平衡数据学习
支持向量机
ADABOOST
Keywords
extreme learning machine
imbalanced data learning
support vector machine
AdaBoost
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
类别条件噪声下的半监督AUC优化理论与算法
3
作者
姜阳邦彦
许倩倩
杨智勇
郝前秀
操晓春
黄庆明
机构
中国科学院大学计算机科学与技术学院
中国科学院计算技术研究所智能信息处理重点实验室
中山大学网络空间安全学院
出处
《计算机学报》
北大核心
2025年第1期136-155,共20页
基金
新一代人工智能国家科技重大专项(2018AAA0102000)
国家自然科学基金项目(62236008,U21B2038,U23B2051,61931008,62122075,62406305,62476068,62471013,62206264,92370102)
+4 种基金
中国科学院青年促进会优秀会员项目
中国科学院战略性先导科技专项(XDB0680000)
中国科学院计算技术研究所创新课题(E000000)
中国博士后科学基金项目(2023M743441)
国家资助博士后研究人员计划(GZB20230732)资助。
文摘
现有半监督AUC优化方法通常假设数据标注是准确的。然而在许多实际应用中,研究者往往会同时面临标注量不足和不准确的问题。为此,该文首次尝试在不完整和不准确的数据标注情况下优化AUC指标。具体而言,通过分析,对称替代损失在某些情况下可以在半监督问题中具有噪声鲁棒性。在此基础上,该文构建了一个鲁棒半监督AUC优化框架,其导出的经验风险无需估计噪声率。此外,通过紧致泛化上界的分析表明,当模型基于足够大的训练数据集进行学习时,其在未见数据上能够很好地泛化。随后,使用Barrier hinge损失对该框架进行实例化。为加快训练过程,进一步开发了一种加速算法,将损失和梯度估计的复杂度从O(n^(2))降低至O(nlogn),在实验中可获得高达200倍的加速。最后,通过在15个基准数据集上进行实验验证,证明了所提方法的有效性。
关键词
半监督
学习
AUC优化
标签噪声
二分类问题
不平衡数据学习
Keywords
semi-supervised learning
AUC optimization
label noise
binary classification
imbalanced data learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
若干评价准则对不平衡数据学习的影响
林智勇
郝志峰
杨晓伟
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010
23
在线阅读
下载PDF
职称材料
2
极限学习机类不平衡数据学习算法研究
唐晓芬
陈莉
《计算机应用研究》
CSCD
北大核心
2018
2
在线阅读
下载PDF
职称材料
3
类别条件噪声下的半监督AUC优化理论与算法
姜阳邦彦
许倩倩
杨智勇
郝前秀
操晓春
黄庆明
《计算机学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部