期刊文献+
共找到103篇文章
< 1 2 6 >
每页显示 20 50 100
面向AUC优化的高效对抗训练
1
作者 包世龙 许倩倩 +4 位作者 杨智勇 华聪 韩博宇 操晓春 黄庆明 《计算机学报》 北大核心 2025年第7期1551-1571,共21页
鉴于ROC曲线下面积(Area Under the ROC Curve,AUC)对数据分布的不敏感特性,面向AUC的对抗训练(AdAUC)近来已成为机器学习领域中抵御长尾分布下对抗攻击的有效范式之一。当前主流方法大多遵循基于平方替代损失的AUC对抗训练框架,并将成... 鉴于ROC曲线下面积(Area Under the ROC Curve,AUC)对数据分布的不敏感特性,面向AUC的对抗训练(AdAUC)近来已成为机器学习领域中抵御长尾分布下对抗攻击的有效范式之一。当前主流方法大多遵循基于平方替代损失的AUC对抗训练框架,并将成对比较形式的AUC对抗损失重构为一个逐样本的随机鞍点优化问题,克服端到端的计算瓶颈。然而,面向复杂的实际应用场景,基于平方损失设计的AUC对抗训练框架恐难以适应多样的下游任务需求。此外,与传统对抗训练范式类似,面向AUC的对抗训练方法在提高模型对抗鲁棒性的同时,也会降低模型在正常样本上的AUC性能,而目前鲜有针对该问题的有效解决方案。鉴于此,本文对如何构建一般化的高效AUC对抗机器学习范式展开系统研究。首先,提出了一种基于标准化分数扰动的通用AUC对抗训练框架(NSAdAUC),在相对温和的条件下,该框架可通过直接扰动模型对样本的预测得分实现对AUC指标的攻击,且不依赖于特定的AUC替代损失。在此基础上,本文进一步指出鲁棒AUC误差可分解为标准AUC误差和边界AUC误差两项之和,并据此设计了一种基于排序感知对抗正则化的AUC对抗训练框架(RARAdAUC),同时兼顾模型的标准AUC和鲁棒AUC性能。为验证所提框架的有效性,在5个长尾基准数据集上进行了大量实验,结果表明所提NSAdAUC和RARAdAUC框架在多种对抗攻击下的鲁棒性均优于现有方法,可在平均意义上分别产生0.94%、5.52%的标准AUC和5.69%、5.41%的鲁棒AUC性能提升。 展开更多
关键词 auc优化 对抗训练 对抗鲁棒性 长尾学习 机器学习
在线阅读 下载PDF
类别条件噪声下的半监督AUC优化理论与算法
2
作者 姜阳邦彦 许倩倩 +3 位作者 杨智勇 郝前秀 操晓春 黄庆明 《计算机学报》 北大核心 2025年第1期136-155,共20页
现有半监督AUC优化方法通常假设数据标注是准确的。然而在许多实际应用中,研究者往往会同时面临标注量不足和不准确的问题。为此,该文首次尝试在不完整和不准确的数据标注情况下优化AUC指标。具体而言,通过分析,对称替代损失在某些情况... 现有半监督AUC优化方法通常假设数据标注是准确的。然而在许多实际应用中,研究者往往会同时面临标注量不足和不准确的问题。为此,该文首次尝试在不完整和不准确的数据标注情况下优化AUC指标。具体而言,通过分析,对称替代损失在某些情况下可以在半监督问题中具有噪声鲁棒性。在此基础上,该文构建了一个鲁棒半监督AUC优化框架,其导出的经验风险无需估计噪声率。此外,通过紧致泛化上界的分析表明,当模型基于足够大的训练数据集进行学习时,其在未见数据上能够很好地泛化。随后,使用Barrier hinge损失对该框架进行实例化。为加快训练过程,进一步开发了一种加速算法,将损失和梯度估计的复杂度从O(n^(2))降低至O(nlogn),在实验中可获得高达200倍的加速。最后,通过在15个基准数据集上进行实验验证,证明了所提方法的有效性。 展开更多
关键词 半监督学习 auc优化 标签噪声 二分类问题 不平衡数据学习
在线阅读 下载PDF
基于自适应低秩表示的多任务AUC优化算法 被引量:1
3
作者 孙宇辰 许倩倩 +2 位作者 王子泰 杨智勇 黄庆明 《计算机学报》 EI CAS CSCD 北大核心 2024年第11期2678-2690,共13页
多任务学习是一种基于相似任务之间的关联性进行学习迁移,使得模型在数据不足场景下仍能表现出良好泛化性能的学习方法.在该领域内,大多数现有以准确率作为基准评价标准的方法只适用于平衡分布场景.然而,诸多实际应用如疾病检测、垃圾... 多任务学习是一种基于相似任务之间的关联性进行学习迁移,使得模型在数据不足场景下仍能表现出良好泛化性能的学习方法.在该领域内,大多数现有以准确率作为基准评价标准的方法只适用于平衡分布场景.然而,诸多实际应用如疾病检测、垃圾邮件检测等,均涉及样本分布不平衡问题.针对多任务学习面向任务相关性的高要求,即当模型学习和共享不相关知识时,负迁移可能会影响模型朝着错误方向训练.因此,大多数现有方法在此类场景中无法得到有效应用.为解决该实际问题,设计一种能适用于样本不平衡场景的多任务学习算法变得尤为重要.本文提出了一种基于自适应低秩表示的多任务AUC优化算法,首先引入了对标签分布不敏感的ROC曲线下面积(AUC)作为该学习任务的评价指标,并建立了一种用于AUC优化的多任务学习算法,以提高模型在样本不平衡场景下的性能表现.同时,为进一步有效优化模型,本文将原始成对优化问题重构为逐样本极大极小优化问题,使得每一轮迭代复杂度由O(Ln_(i,+)n_(i,-))降低至O(L(n_(i,+)+n_(i,-))).针对多任务学习中存在的负迁移现象,本文引入了一种自适应低秩正则项,以消除模型冗余信息,同时提高模型的泛化性能.最后,通过与多个对比方法在四个仿真数据集和三个真实数据集Landmine、MHC-I和USPS上的比较,所有实验结果一致证明了本文所提出算法的有效性. 展开更多
关键词 多任务学习 auc优化 低秩表示
在线阅读 下载PDF
BO-AUC多类分类评估方法 被引量:2
4
作者 秦锋 杨帆 +1 位作者 程泽凯 刘牛 《计算机工程与应用》 CSCD 2012年第5期156-158,共3页
分类技术是数据挖掘研究的核心技术之一,分类评估也是研究热点,基于AUC评估方法是分类评估领域的研究热点,其中B-AUC评估算法可以有效地评估分类器性能,但该评估方法有不足之处。该分类评估方法建立在不对称的两个类别上,影响了评价结果... 分类技术是数据挖掘研究的核心技术之一,分类评估也是研究热点,基于AUC评估方法是分类评估领域的研究热点,其中B-AUC评估算法可以有效地评估分类器性能,但该评估方法有不足之处。该分类评估方法建立在不对称的两个类别上,影响了评价结果;根据非完全二叉树思想存储,浪费了存储空间;基于偏二叉树的搜索效率不高。利用完全二叉树的构造思想提出了BO-AUC评估方法,该方法将n个类别的分类问题分解为独立的二类进行成对的计算,可以有效地解决B-AUC的不足,进一步扩展基于AUC的评估标准,在MBNC实验上编程实现该方法,实验结果表明BO-AUC方法的有效性。 展开更多
关键词 曲线下的面积(auc)评估 基于二叉树方法求的曲线下的面积(B-auc) 完全二叉树 优化的基于二叉树方法求的曲线下的面积(BO-auc) 分类器性能
在线阅读 下载PDF
卡铂按AUC给药对小细胞肺癌疗效和毒性的影响 被引量:13
5
作者 储大同 罗扬 +3 位作者 李峻岭 郝学志 张湘茹 李雅玲 《中国肿瘤临床》 CAS CSCD 北大核心 2001年第1期28-30,共3页
目的:探讨卡铂AUC给药的合理性。方法:对112例小细胞肺癌用卡铂和足叶乙甙联合方案治疗的疗效和毒性进行回顾性调查。卡铂按体表面积计算,范围为168~385mg/m2,折合成卡铂AUC的范围为1.62~9.5。其中AUC1.62~5.0为59例(A组)... 目的:探讨卡铂AUC给药的合理性。方法:对112例小细胞肺癌用卡铂和足叶乙甙联合方案治疗的疗效和毒性进行回顾性调查。卡铂按体表面积计算,范围为168~385mg/m2,折合成卡铂AUC的范围为1.62~9.5。其中AUC1.62~5.0为59例(A组),5.1~9.5为53例(B组)。结果:疗效的分析提示:小细胞肺癌局限期A组和B组的有效率分别为62.9%和71.4%;进展病例分别为5.7%和0;中位生存期分别为10和12个月。广泛期两组有效率分别为66.7%和68.8%;进展病例分别为12.5%和6.3%;中位生存期分别为9和11个月。在对血液学毒性的观察中:血红蛋白下降的16例中有12例为B组;Ⅲ/Ⅳ度白细胞下降的11例中有7例为B组;Ⅲ/Ⅳ度血小板下降的5例均为B组。结论:上述结果因病例数不够大未有显著统计学差异,但仍提示卡铂AUC与疗效有一定相关性。 展开更多
关键词 卡铂auc 小细胞肺癌 足叶乙甙 卡铂
在线阅读 下载PDF
制备近似球形AUC结晶的初步研究 被引量:15
6
作者 康仕芳 陈松 赵君 《原子能科学技术》 EI CAS CSCD 2001年第4期351-355,共5页
研究了沉淀剂组成、搅拌速度、溶液的过饱和度等因素对AUC沉淀结晶的影响。结果表明 :c(CO2 - 3) /c(U) >3、c(NH+4) /c(U) >6时可得到符合 (NH4 ) 4 UO2 (CO3) 3化学计量的化合物。溶液中沉淀结晶物质的过饱和度对AUC沉淀结晶的... 研究了沉淀剂组成、搅拌速度、溶液的过饱和度等因素对AUC沉淀结晶的影响。结果表明 :c(CO2 - 3) /c(U) >3、c(NH+4) /c(U) >6时可得到符合 (NH4 ) 4 UO2 (CO3) 3化学计量的化合物。溶液中沉淀结晶物质的过饱和度对AUC沉淀结晶的粒度、形貌有重要影响。过饱和度较低时 ,形成的结晶为长径比较大的棱柱形结晶 ,流动性较差 ;饱和度较高时 ,造成晶核严重泛滥 ,从而改变了晶体的生长习性 ,晶体呈同向生长 。 展开更多
关键词 auc 沉淀 结晶 二氧化铀 球形晶体 三碳酸铀酰铵 核燃料 生产 中间产物
在线阅读 下载PDF
药代动力学非房室模型AUC计算方法比较 被引量:8
7
作者 陈潮 郑青山 +2 位作者 李禄金 李雪 许羚 《中国临床药理学与治疗学》 CAS CSCD 2020年第12期1381-1387,共7页
目的:基于真值及模拟数据,评价不同非房室模型AUC计算方法的准确度和精密度,为AUC算法优选提供依据。方法:使用3种方法计算G药等效试验中0~t曲线下面积(AUC0-t):(1)线性梯形法(Linear法);(2)线性对数梯形法(Linear/Log法):血药浓度最大... 目的:基于真值及模拟数据,评价不同非房室模型AUC计算方法的准确度和精密度,为AUC算法优选提供依据。方法:使用3种方法计算G药等效试验中0~t曲线下面积(AUC0-t):(1)线性梯形法(Linear法);(2)线性对数梯形法(Linear/Log法):血药浓度最大值(Cmax)之前数据用线性梯形法则计算,Cmax之后用对数梯形法则计算;(3)上升段线性下降段对数法(Linear Up/Log Down法):药-时曲线上升段用线性梯形法则计算,下降段用对数梯形法则计算。并对对数转化后的AUC0-t进行等效性分析,等效标准为80.0%-125.0%。通过模拟数据,比较三种方法差异。结果:24位受试者服用两种制剂的G药后,使用不同AUC0-t计算方法结果不同,等效性分析结论也不全相同,其中使用Linear法和Linear Up/Log Down法得到等效结论,Linear/Log法为不等效。三种方法计算小样本模拟数据,所得AUC0-t差异较大,计算大样本数据,差异较小。结论:Linear/log法在实际工作中应用较少,口服给药及多峰曲线使用Linear Up/Log Down法更合理,小样本量试验或预实验中Linear计算简单,结果稳定。此外应根据分析计划中已制定的AUC计算方法进行计算和生物等效性分析。 展开更多
关键词 药-时曲线下面积(auc) 生物等效性 药代动力学
在线阅读 下载PDF
万古霉素AUC/MIC在多重耐药革兰阳性菌致重症感染中的应用分析 被引量:12
8
作者 符祥俊 黄莉 +1 位作者 郭丽 林良沫 《中国临床药理学与治疗学》 CAS CSCD 2021年第7期775-781,共7页
目的:探讨以药时曲线下面积(AUC)/最低抑菌浓度(MIC)作为万古霉素监测靶目标在我院多重耐药革兰阳性菌致重症感染患者中的应用情况和临床意义。方法:以确诊多重耐药革兰阳性菌感染的患者为研究对象,通过监测患者万古霉素的血药谷浓度(C_... 目的:探讨以药时曲线下面积(AUC)/最低抑菌浓度(MIC)作为万古霉素监测靶目标在我院多重耐药革兰阳性菌致重症感染患者中的应用情况和临床意义。方法:以确诊多重耐药革兰阳性菌感染的患者为研究对象,通过监测患者万古霉素的血药谷浓度(C_(t)),借助药代动力学软件Java PK^(■) for Desktop(JPKD)采用贝叶斯计算方法计算万古霉素药时AUC,并计算AUC _(24h)/MIC的值(假设MIC=1 mg/L)。比较不同C_(t)范围内AUC _(24h)/MIC的达标率,分析AUC _(24h)/MIC的影响因素并探讨以AUC _(24h)/MIC作为靶目标对患者抗感染疗效和肾毒性的临床意义。结果:多元线性回归分析显示C_(t)与AUC _(24h)/MIC有较好的相关性,当C_(t)为10~15μg/mL时,其中仅38.89%的患者AUC _(24h)/MIC达到400~600,当C_(t)为15~20μg/mL时,则有88.89%患者其AUC _(24h)/MIC达标。万古霉素抗感染疗效与患者是否入住ICU显著相关,而与AUC _(24h)/MIC无显著相关性。以C_(t)>20μg/mL或者AUC _(24h)/MIC>600评估发生急性肾损伤(AKI)的风险无统计学差异。结论:假设MIC=1 mg/L时建议多重耐药革兰阳性菌致严重感染患者维持C_(t)在15~20μg/mL,有88.89%概率其AUC _(24h)/MIC可达到400~600。为了更好地指导临床合理使用万古霉素,建议推广MIC的规范化检测。 展开更多
关键词 万古霉素 血药浓度 auc 24h/MIC 多重耐药革兰阳性菌
在线阅读 下载PDF
以UF_6水解液为原料制备AUC粉末 被引量:3
9
作者 许奎 刘锦洪 +1 位作者 胡柏贵 崔川江 《原子能科学技术》 EI CAS CSCD 北大核心 2007年第5期637-640,共4页
以UF_6水解液为原料,采用AUC工艺流程制备AUC粉末。研究了以UF_6水解液为原料制备AUC粉末的主要控制参数,讨论了氟体系制备的AUC粉末与硝酸体系制备的粉末性能间的各种差异。实验结果表明:以UF_6水解液为原料制备AUC粉末时,n(NH_3)/n(U... 以UF_6水解液为原料,采用AUC工艺流程制备AUC粉末。研究了以UF_6水解液为原料制备AUC粉末的主要控制参数,讨论了氟体系制备的AUC粉末与硝酸体系制备的粉末性能间的各种差异。实验结果表明:以UF_6水解液为原料制备AUC粉末时,n(NH_3)/n(U)控制在26~30之间,沉淀时间控制在3~4h较为适宜;按此工艺生产的AUC粉末粒度约为30μm,松装密度为1.2~1.4g/cm^3,组成恒定且质量稳定,重现性好;经分解还原得到的UO_2粉末性能稳定,烧结活性高,烧结密度大于97%T.D.(理论密度)。 展开更多
关键词 auc UO2粉末 气-液反应 沉淀
在线阅读 下载PDF
基于AUC统计量的随机森林变量重要性评分的研究 被引量:15
10
作者 张晓凤 侯艳 李康 《中国卫生统计》 CSCD 北大核心 2016年第3期537-540,542,共5页
随机森林(random forest,RF)是高维组学数据常用的分析方法,在进行判别分析时,同时能够给出变量重要性评分(variable importance measure,VIM)。RF的变量重要性评分通常有两种,一种方法是通过变量值的置换计算其重要性,第二种方法... 随机森林(random forest,RF)是高维组学数据常用的分析方法,在进行判别分析时,同时能够给出变量重要性评分(variable importance measure,VIM)。RF的变量重要性评分通常有两种,一种方法是通过变量值的置换计算其重要性,第二种方法是通过基尼(Gini)指数计算其重要性,由于置换法比Gini指数法具有更好的非偏倚性能,因此多采用置换法进行变量筛选。 展开更多
关键词 随机森林 auc 变量值 置换法 统计量 数据类别 判别分析 基尼 分类器 类中
在线阅读 下载PDF
基于数据重平衡的AUC优化Boosting算法 被引量:8
11
作者 李秋洁 茅耀斌 《自动化学报》 EI CSCD 北大核心 2013年第9期1467-1475,共9页
接收者操作特性(Receiver operating characteristics,ROC)曲线下面积(Area under the ROC curve,AUC)常被用于度量分类器在整个类先验分布上的总体分类性能.原始Boosting算法优化分类精度,但在AUC度量下并非最优.提出了一种AUC优化Boos... 接收者操作特性(Receiver operating characteristics,ROC)曲线下面积(Area under the ROC curve,AUC)常被用于度量分类器在整个类先验分布上的总体分类性能.原始Boosting算法优化分类精度,但在AUC度量下并非最优.提出了一种AUC优化Boosting改进算法,通过在原始Boosting迭代中引入数据重平衡操作,实现弱学习算法优化目标从精度向AUC的迁移.实验结果表明,较之原始Boosting算法,新算法在AUC度量下能获得更好性能. 展开更多
关键词 auc优化 BOOSTING 精度优化 数据重平衡
在线阅读 下载PDF
求解AUC优化问题的对偶坐标下降方法 被引量:2
12
作者 姜纪远 陶卿 +1 位作者 高乾坤 储德军 《软件学报》 EI CSCD 北大核心 2014年第10期2282-2292,共11页
AUC被广泛作为衡量不平衡数据分类性能的评价标准.与二分类问题不同,AUC问题的损失函数由来自两个不同类别的样本对组成.如何提高其实际收敛速度,是一个值得研究的问题.目前的研究结果表明:使用reservoir sampling技术的在线方法(OAM)... AUC被广泛作为衡量不平衡数据分类性能的评价标准.与二分类问题不同,AUC问题的损失函数由来自两个不同类别的样本对组成.如何提高其实际收敛速度,是一个值得研究的问题.目前的研究结果表明:使用reservoir sampling技术的在线方法(OAM)表现出很好的AUC性能,但OAM仍存在诸如收敛速度慢、参数选择复杂等缺点.针对AUC优化问题的对偶坐标下降(AUC-DCD)方法进行了系统的研究,给出3种算法,即AUC-SDCD,AUCSDCDperm和AUC-MSGD,其中,AUC-SDCD和AUC-SDCDperm与样本数目有关,AUC-MSGD与样本数目无关.理论分析指出,OAM是AUC-DCD的一种特殊情形.实验结果表明,AUC-DCD在AUC性能和收敛速度两方面均优于OAM.研究结果表明,AUC-DCD是求解AUC优化问题的首选方法. 展开更多
关键词 机器学习 优化方法 auc 对偶坐标下降 支持向量机
在线阅读 下载PDF
用AUC评估分类器的预测性能 被引量:2
13
作者 杨波 程泽凯 秦锋 《情报学报》 CSSCI 北大核心 2007年第2期275-279,共5页
准确率一直被作为分类器预测性能的主要评估标准,但是它存在着诸多的缺点和不足。本文将准确率与AUC(the area under the Receiver Operating Characteristic curve)进行了理论上的对比分析,并分别使用AUC和准确率对3种分类学习算法... 准确率一直被作为分类器预测性能的主要评估标准,但是它存在着诸多的缺点和不足。本文将准确率与AUC(the area under the Receiver Operating Characteristic curve)进行了理论上的对比分析,并分别使用AUC和准确率对3种分类学习算法在15个两类数据集上进行了评估。综合理论和实验两个方面的结果,显示了AUC不但优于而且应该替代准确率,成为更好的分类器性能的评估度量。同时,用AUC对3种分类学习算法的重新评估,进一步证实了基于贝叶斯定理的Naive Bayes和TAN-CMI分类算法优于决策树分类算法C4.5。 展开更多
关键词 ROC auc 准确率 交叉验证
在线阅读 下载PDF
一种线性的在线AUC优化方法 被引量:4
14
作者 朱真峰 翟艳祥 叶阳东 《计算机研究与发展》 EI CSCD 北大核心 2018年第12期2725-2733,共9页
AUC(area under the ROC curve)优化问题的损失函数由来自不同类别的样本对构成,这使得依赖于损失函数之和的目标函数与训练样本数二次相关,不能直接使用传统在线学习方法求解.当前的在线AUC优化算法聚焦于在求解过程中避免直接计算所... AUC(area under the ROC curve)优化问题的损失函数由来自不同类别的样本对构成,这使得依赖于损失函数之和的目标函数与训练样本数二次相关,不能直接使用传统在线学习方法求解.当前的在线AUC优化算法聚焦于在求解过程中避免直接计算所有的损失函数,以减小问题的规模,实现在线AUC优化.针对以上问题提出了一种AUC优化的新目标函数,该目标函数仅与训练样本数线性相关;理论分析表明:最小化该目标函数等价于最小化由L2正则化项和最小二乘损失函数组成的AUC优化的目标函数.基于新的目标函数,提出了在线AUC优化的线性方法(linear online AUC maximization,LOAM);根据不同的分类器更新策略,给出2种算法LOAMILSC和LOAMAda.实验表明:与原有方法相比,LOAMILSC算法获得了更优的AUC性能,而对于实时或高维学习任务,LOAMAda算法更加高效. 展开更多
关键词 分类 auc优化 在线学习 线性方法 最小二乘损失
在线阅读 下载PDF
按AUC与体表面积计算伯尔定用量化疗毒性和疗效比较 被引量:3
15
作者 谷力加 吴一龙 +4 位作者 冯卫能 翁毅敏 程超 钟文昭 黄绍洪 《中山医科大学学报》 CSCD 北大核心 2002年第B09期93-94,共2页
【目的】为比较按药物血浆浓度 时间曲线下面积 (AUC)与体表面积计算伯尔定用量的两种方法在化疗中对血液毒性和疗效的影响。【方法】按接收的先后顺序 ,42例病人单盲随机分为按体表面积计算组和按AUC计算两组 ,总结两组的血液性毒性... 【目的】为比较按药物血浆浓度 时间曲线下面积 (AUC)与体表面积计算伯尔定用量的两种方法在化疗中对血液毒性和疗效的影响。【方法】按接收的先后顺序 ,42例病人单盲随机分为按体表面积计算组和按AUC计算两组 ,总结两组的血液性毒性和疗效 ,并进行了对比研究。【结果】 42例病人均可评价疗效 ,AUC和体表面积两组有效率分别为 47 6 1%和 19 0 5 %。AUC组明显高于体表面积组 ,但P =0 0 5 ;AUC组和体表面积组白细胞 (WBC)减少发生率分别为 38 10 %和 76 2 0 % ,Ⅲ和Ⅳ度为 4 76 %和 2 8 5 7% (P >0 0 5 ) ;血小板 (Pt)减少发生率分别为 4 76 %和 19 0 5 % (P >0 0 5 ) ;血红蛋白 (Hb)减少发生率均为 47 6 2 % ,Ⅲ和Ⅳ度为 9 5 2 %和 4 76 % (P >0 0 5 )。【结论】应用伯尔定行全身化疗 ,按AUC计算用药剂量在提高疗效和降低血液毒性反应方面优于按体表面积计算。 展开更多
关键词 伯尔定 auc 疗效 计算方法 血液毒性
在线阅读 下载PDF
基于AUC的SVM多类分类方法的研究 被引量:3
16
作者 张晓龙 江川 《计算机工程与应用》 CSCD 北大核心 2007年第14期166-169,共4页
AUC(ROC曲线下面积)评价标准已经广泛地用于度量机器学习中各种分类算法在两类数据集上的分类性能。首先介绍了SVM(支持向量机)多类分类方法,然后对AUC方法进行了系统地介绍,最后通过实验来比较各种SVM多类分类方法在多类别数据集上的AU... AUC(ROC曲线下面积)评价标准已经广泛地用于度量机器学习中各种分类算法在两类数据集上的分类性能。首先介绍了SVM(支持向量机)多类分类方法,然后对AUC方法进行了系统地介绍,最后通过实验来比较各种SVM多类分类方法在多类别数据集上的AUC的值。实验结果表明,AUC值和核函数和多类转换方法的选取都有着密切的联系。 展开更多
关键词 支持向量机 auc 核函数 多类转换方法
在线阅读 下载PDF
基于AUC回归的不平衡数据特征选择模型研究 被引量:12
17
作者 李扬 李竟翔 王园萍 《统计与信息论坛》 CSSCI 北大核心 2015年第5期10-16,共7页
针对不平衡数据的泛化预测和特征选择问题,提出了一种引入MCP惩罚函数的AUC回归模型(MCP-AUCR)。该模型采用考虑所有阈值信息的优化目标函数,具有处理不平衡数据的能力,并具有较好的特征选择效果;在讨论该模型定义与原理的基础上,提出... 针对不平衡数据的泛化预测和特征选择问题,提出了一种引入MCP惩罚函数的AUC回归模型(MCP-AUCR)。该模型采用考虑所有阈值信息的优化目标函数,具有处理不平衡数据的能力,并具有较好的特征选择效果;在讨论该模型定义与原理的基础上,提出相应的循环坐标下降训练算法,并通过数值模拟研究验证其优良性质;针对中国股票市场机械、设备、仪表板块中的上市公司,构建了基于MCP-AUCR的财务预警模型。研究结果显示:该财务预警模型可以选择出可解释的重要财务指标并进行有效预测,显著优于传统模型。 展开更多
关键词 auc回归 MCP惩罚 特征选择 财务预警
在线阅读 下载PDF
半监督AUC优化的Boosting算法及理论 被引量:8
18
作者 杨智勇 许倩倩 +2 位作者 何源 操晓春 黄庆明 《计算机学报》 EI CAS CSCD 北大核心 2022年第8期1598-1617,共20页
ROC曲线下面积(Area Under the ROC Curve,AUC)是类不均衡/二分排序等问题中的标准评价指标之一.本文主要聚焦于半监督AUC优化方法.现有大多数方法局限于通过单一模型进行半监督AUC优化,对如何通过模型集成技术融合多个模型则鲜有涉及.... ROC曲线下面积(Area Under the ROC Curve,AUC)是类不均衡/二分排序等问题中的标准评价指标之一.本文主要聚焦于半监督AUC优化方法.现有大多数方法局限于通过单一模型进行半监督AUC优化,对如何通过模型集成技术融合多个模型则鲜有涉及.考虑上述局限性,本文主要研究基于模型集成的半监督AUC优化方法.具体而言,本文提出一种基于Boosting算法的半监督AUC优化算法,并提出基于权重解耦的加速策略以降低算法时间/空间复杂度.进一步地,在优化层面,本文通过理论分析证明了所提出的算法相对于弱分类器的增加具有指数收敛速率;在模型泛化能力层面,本文构造了所提出算法的泛化误差上界,并证明增加弱分类器个数在提升训练集性能的同时并不会带来明显的过拟合风险.最后,本文在16个基准数据集上对所提出算法的性能进行了验证,实验结果表明所提出算法在多数情况下以0.05显著水平优于其他对比方法,并可在平均意义上产生0.9%~11.28%的性能提升. 展开更多
关键词 auc优化 集成学习 半监督学习 提升法 Rademacher复杂度
在线阅读 下载PDF
集成学习的泛化误差和AUC分解理论及其在权重优化中的应用 被引量:17
19
作者 姜正申 刘宏志 +1 位作者 付彬 吴中海 《计算机学报》 EI CSCD 北大核心 2019年第1期1-15,共15页
集成学习是机器学习领域的一个重要分支,其通过整合多个学习器以获得比单个学习器更好的学习效果.多样性和间隔被认为是影响集成学习效果的两个关键因素.现有研究大多是对这两个因素的影响单独进行分析.该文的研究集中于泛化误差、AUC... 集成学习是机器学习领域的一个重要分支,其通过整合多个学习器以获得比单个学习器更好的学习效果.多样性和间隔被认为是影响集成学习效果的两个关键因素.现有研究大多是对这两个因素的影响单独进行分析.该文的研究集中于泛化误差、AUC、多样性和间隔之间关系及其在基分类器的权重优化中的应用.该文首先在泛化误差分解理论的基础上,给出了AUC的分解定理.进一步地,该文讨论了泛化误差、AUC、多样性与间隔之间的关系,并指出常用的最大化间隔方法在降低经验误差的同时,也会降低基分类器之间的多样性,进而导致过拟合问题.基于这些理论结果,该文提出了两种新的基分类器的权重优化算法,通过求解一个二次优化问题,实现在准确性和多样性之间的最佳平衡.在35个公开数据集上的实验结果表明,该文所提出的算法在绝大多数情况下都优于现有常用的集成方法. 展开更多
关键词 集成学习 泛化误差分解 auc 多样性 间隔 权重优化
在线阅读 下载PDF
AUCRF算法在信用风险评价中的特征选择研究 被引量:3
20
作者 刘忻梅 唐俊 段翀 《计算机应用与软件》 北大核心 2018年第4期293-295,309,共4页
目前基于随机森林算法的特征选择方法多以优化总体分类精度为目标。然而,信用风险评价过程中错分代价不对等的不平衡数据广泛存在。此时,用精度作分类性能评价指标不合适。采用ROC曲线下面积AUC值作二分类算法的分类性能指标,构造一个... 目前基于随机森林算法的特征选择方法多以优化总体分类精度为目标。然而,信用风险评价过程中错分代价不对等的不平衡数据广泛存在。此时,用精度作分类性能评价指标不合适。采用ROC曲线下面积AUC值作二分类算法的分类性能指标,构造一个基于随机森林算法的特征选择算法AUCRF,并对UCI机器学习库中的澳大利亚信用数据进行实证分析。结果表明,基于AUCRF算法的模型能以较小的特征子集获得较高的分类性能,AUC=0.934 6。因此,AUCRF算法可用于错分代价不对等的信用风险特征选择。 展开更多
关键词 auc 特征选择 随机森林 信用风险评价
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部