期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
类别条件噪声下的半监督AUC优化理论与算法
1
作者 姜阳邦彦 许倩倩 +3 位作者 杨智勇 郝前秀 操晓春 黄庆明 《计算机学报》 北大核心 2025年第1期136-155,共20页
现有半监督AUC优化方法通常假设数据标注是准确的。然而在许多实际应用中,研究者往往会同时面临标注量不足和不准确的问题。为此,该文首次尝试在不完整和不准确的数据标注情况下优化AUC指标。具体而言,通过分析,对称替代损失在某些情况... 现有半监督AUC优化方法通常假设数据标注是准确的。然而在许多实际应用中,研究者往往会同时面临标注量不足和不准确的问题。为此,该文首次尝试在不完整和不准确的数据标注情况下优化AUC指标。具体而言,通过分析,对称替代损失在某些情况下可以在半监督问题中具有噪声鲁棒性。在此基础上,该文构建了一个鲁棒半监督AUC优化框架,其导出的经验风险无需估计噪声率。此外,通过紧致泛化上界的分析表明,当模型基于足够大的训练数据集进行学习时,其在未见数据上能够很好地泛化。随后,使用Barrier hinge损失对该框架进行实例化。为加快训练过程,进一步开发了一种加速算法,将损失和梯度估计的复杂度从O(n^(2))降低至O(nlogn),在实验中可获得高达200倍的加速。最后,通过在15个基准数据集上进行实验验证,证明了所提方法的有效性。 展开更多
关键词 半监督学习 AUC优化 标签噪声 二分类问题 不平衡数据学习
在线阅读 下载PDF
结合全局和局部正则化的半监督二分类算法 被引量:1
2
作者 吕佳 《计算机应用》 CSCD 北大核心 2012年第3期643-645,648,共4页
针对在半监督分类问题中单独使用全局学习容易出现的在整个输入空间中较难获得一个优良的决策函数的问题,以及单独使用局部学习可在特定的局部区域内习得较好的决策函数的特点,提出了一种结合全局和局部正则化的半监督二分类算法。该算... 针对在半监督分类问题中单独使用全局学习容易出现的在整个输入空间中较难获得一个优良的决策函数的问题,以及单独使用局部学习可在特定的局部区域内习得较好的决策函数的特点,提出了一种结合全局和局部正则化的半监督二分类算法。该算法综合全局正则项和局部正则项的优点,基于先验知识构建的全局正则项能平滑样本的类标号以避免局部正则项学习不充分的问题,通过基于局部邻域内样本信息构建的局部正则项使得每个样本的类标号具有理想的特性,从而构造出半监督二分类问题的目标函数。通过在标准二类数据集上的实验,结果表明所提出的算法其平均分类正确率和标准误差均优于基于拉普拉斯正则项方法、基于正则化拉普拉斯正则项方法和基于局部学习正则项方法。 展开更多
关键词 半监督学习 二分类问题 全局正则化 局部正则化 平滑
在线阅读 下载PDF
基于特征选择和聚类的动态选择性集成模型
3
作者 徐雨芯 曹建军 +2 位作者 王保卫 翁年凤 顾楚梅 《广西科学》 北大核心 2024年第5期1002-1010,共9页
为提高辐射源个体识别的准确率,降低动态选择性集成的计算复杂度,本文提出基于特征选择和聚类的动态选择性集成模型(FSC-DES)。利用归一化皮尔森相关系数法度量不同基分类器间混淆矩阵的差异性,以各基分类器准确率最高及基分类器间差异... 为提高辐射源个体识别的准确率,降低动态选择性集成的计算复杂度,本文提出基于特征选择和聚类的动态选择性集成模型(FSC-DES)。利用归一化皮尔森相关系数法度量不同基分类器间混淆矩阵的差异性,以各基分类器准确率最高及基分类器间差异性最大为目标,得到基分类器集合和对应特征子集集合。利用聚类方法将验证集划分为若干类,以验证集分类准确率最高为目标,为每簇验证集选择最优的基分类器子集和对应的特征子集。在测试阶段,对测试集进行聚类,仅比较每簇测试样本和每簇验证样本数据分布的最大均值差异值,减少运算时间。每簇测试样本在相似度最高的验证集所对应的特征子集集合和基分类器子集下进行预测,并根据不同权重基分类器预测结果的加权和进行最终决策。为验证方法的必要性和优越性,将本文方法与传统集成学习方法进行对比,结果表明,本文方法在信噪比分别为10、5 dB的条件下,分类准确率均提升约5%,具有更好的分类效果和泛化性能。 展开更多
关键词 特征选择 动态选择性集成 支持向量机 蚁群优化算法 辐射源个体识别 二分类问题
在线阅读 下载PDF
一种基于正则化最小二乘的多标记分类算法 被引量:3
4
作者 吕静 何志芬 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第1期139-147,共9页
在传统的监督学习中,每个对象由单个实例表示且只属于一个类别标记.然而,在多标记学习中,每个对象由一个实例表示但可能同时属于多个类别标记,其任务是预测未知样本的类别标记集合.本文提出了基于正则化最小二乘的多标记分类算法,即将... 在传统的监督学习中,每个对象由单个实例表示且只属于一个类别标记.然而,在多标记学习中,每个对象由一个实例表示但可能同时属于多个类别标记,其任务是预测未知样本的类别标记集合.本文提出了基于正则化最小二乘的多标记分类算法,即将传统的正则化最小二乘分类推广到多标记学习中.首先,将多标记学习问题转化为多个独立的二分类问题(每个对应一个类别标记);其次,为了充分利用类别标记之间的相关信息,构建了基于类别标记的邻接图,其中每个节点代表一个类别标记,每条边的权重反映了相应类别标记对之间的相似性.最后,构建了建立在核函数基础上的多标记正则化最小二乘模型,并可以转化为求解一个Sylvester方程.在8个基准数据集上用5种不同的评价准则进行度量的实验结果表明了本文算法优于其他6种常用的多标记分类算法. 展开更多
关键词 多标记学习 正则化最小二乘分 二分类问题 核函数 SYLVESTER方程
在线阅读 下载PDF
基于蚁群特征选择并行分类集成学习的孪生辐射源个体识别 被引量:2
5
作者 徐雨芯 顾楚梅 +2 位作者 曹建军 许金勇 魏志虎 《兵工学报》 EI CAS CSCD 北大核心 2022年第12期3132-3141,共10页
为提高辐射源个体识别的准确率和可靠性,定义并研究孪生辐射源个体识别问题,提出基于蚁群特征选择并行分类集成学习的孪生辐射源个体识别方法。用皮尔森相关系数法确定不同分类器输出结果的分布矩阵的差异性,以基于蚁群特征选择的并行... 为提高辐射源个体识别的准确率和可靠性,定义并研究孪生辐射源个体识别问题,提出基于蚁群特征选择并行分类集成学习的孪生辐射源个体识别方法。用皮尔森相关系数法确定不同分类器输出结果的分布矩阵的差异性,以基于蚁群特征选择的并行分类器中各子分类器分类准确率最高、差异性最大并使输入特征子集规模最小为目标建立设计模型,结合模型特点设计求解模型的蚁群算法。各子分类器根据其与所有子分类器的差异度和可靠度确定权重,差异度和可靠度越大,所占权重越大,根据不同权重子分类器预测结果的加权和进行最终决策。为验证方法的优越性,在原始电台采集信号、添加10 dB噪声、添加5 dB噪声3组数据下,将新方法和单一分类器、Adaboost算法及随机森林算法进行实验对比。研究结果表明,所提并行分类器设计模型分类准确率分别为88.70%、76.70%、64.80%,提高了特征的利用率和分类的准确性,优于其余3种方法。 展开更多
关键词 特征选择 支持向量机 集成学习 蚁群算法 二分类问题
在线阅读 下载PDF
基于大数据分析的死缓限制减刑司法适用研究 被引量:1
6
作者 陈敏 李书琪 广文革 《统计与信息论坛》 CSSCI 北大核心 2019年第11期116-121,共6页
《刑法修正案(八)》创制了死缓限制减刑制度,中国死刑执行方式转变为三种:死刑立即执行、死缓限制减刑、死刑缓期两年执行,起到量刑台阶的作用。本文以实证研究方法为基础,采用多学科交叉视角对随机选取的1 300个案例样本进行研究,发现... 《刑法修正案(八)》创制了死缓限制减刑制度,中国死刑执行方式转变为三种:死刑立即执行、死缓限制减刑、死刑缓期两年执行,起到量刑台阶的作用。本文以实证研究方法为基础,采用多学科交叉视角对随机选取的1 300个案例样本进行研究,发现此制度存在立法不明、量刑情节适用混乱等弊端,从而导致司法实践中的量刑偏差。通过Logistic回归模型构建了两阶段的量刑概率测算模型,探讨不同量刑情节对死缓限制减刑司法适用的影响。研究发现,此模型可作为量刑较为理想的测算工具,从而做到判处死刑不同执行方式的量化与界分,实现量刑规范化、科学化。 展开更多
关键词 LOGISTIC 死缓限制减刑 量刑 二分类问题
在线阅读 下载PDF
基于级联过滤的多模型融合的推荐方法 被引量:2
7
作者 黄斌 彭志平 《小型微型计算机系统》 CSCD 北大核心 2016年第1期33-37,共5页
针对当前主流推荐算法无法甄别离群样本和弱贡献率样本,且单模型算法泛化能力较弱等问题,提出一种基于级联过滤的多模型融合的推荐方法.该方法先采用级联回归模型过滤掉离群样本和弱贡献率样本;然后,把推荐问题抽象成二分类问题和回归问... 针对当前主流推荐算法无法甄别离群样本和弱贡献率样本,且单模型算法泛化能力较弱等问题,提出一种基于级联过滤的多模型融合的推荐方法.该方法先采用级联回归模型过滤掉离群样本和弱贡献率样本;然后,把推荐问题抽象成二分类问题和回归问题,分别采用基于Bagging的随机森林和基于Boosting的梯度提升回归树两种树型算法、线性的逻辑回归算法来拟合用户兴趣;最后,将这三种算法分别训练若干模型进行线性融合,取Top-N推荐.实验表明,该方法不仅有效提高了推荐精度,还增强了模型的泛化能力,具有较强的实用价值. 展开更多
关键词 级联过滤 多模型融合 二分类问题 回归问题 泛化能力
在线阅读 下载PDF
Least squares weighted twin support vector machines with local information 被引量:1
8
作者 花小朋 徐森 李先锋 《Journal of Central South University》 SCIE EI CAS CSCD 2015年第7期2638-2645,共8页
A least squares version of the recently proposed weighted twin support vector machine with local information(WLTSVM) for binary classification is formulated. This formulation leads to an extremely simple and fast algo... A least squares version of the recently proposed weighted twin support vector machine with local information(WLTSVM) for binary classification is formulated. This formulation leads to an extremely simple and fast algorithm, called least squares weighted twin support vector machine with local information(LSWLTSVM), for generating binary classifiers based on two non-parallel hyperplanes. Two modified primal problems of WLTSVM are attempted to solve, instead of two dual problems usually solved. The solution of the two modified problems reduces to solving just two systems of linear equations as opposed to solving two quadratic programming problems along with two systems of linear equations in WLTSVM. Moreover, two extra modifications were proposed in LSWLTSVM to improve the generalization capability. One is that a hot kernel function, not the simple-minded definition in WLTSVM, is used to define the weight matrix of adjacency graph, which ensures that the underlying similarity information between any pair of data points in the same class can be fully reflected. The other is that the weight for each point in the contrary class is considered in constructing equality constraints, which makes LSWLTSVM less sensitive to noise points than WLTSVM. Experimental results indicate that LSWLTSVM has comparable classification accuracy to that of WLTSVM but with remarkably less computational time. 展开更多
关键词 least squares similarity information hot kernel function noise points
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部