期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
半监督学习在不平衡样本集分类中的应用研究 被引量:8
1
作者 于重重 商利利 +2 位作者 谭励 涂序彦 杨扬 《计算机应用研究》 CSCD 北大核心 2013年第4期1085-1089,共5页
在对不平衡样本集进行分类时容易产生少数类样误差大的问题,而目前半监督学习中的算法多数是针对未有明显此类特征的数据集。针对一种半监督协同分类算法在该问题上的有效性进行了研究。由于进一步增强了分类器差异性,该算法在理论上对... 在对不平衡样本集进行分类时容易产生少数类样误差大的问题,而目前半监督学习中的算法多数是针对未有明显此类特征的数据集。针对一种半监督协同分类算法在该问题上的有效性进行了研究。由于进一步增强了分类器差异性,该算法在理论上对不平衡样本集具有良好的分类性能。根据该算法建立分类模型,利用其对桥梁结构健康数据进行分类实验,与Tri-Training算法的结果比较表明,该算法对不平衡样本集具有良好的适用性,从而验证了上述算法的有效性。 展开更多
关键词 不平衡样本集 半监督协同分类方法 分类器差异性 分类模型 桥梁结构健康数据
在线阅读 下载PDF
处理不平衡样本集的欠采样算法 被引量:7
2
作者 丁福利 孙立民 《计算机工程与设计》 CSCD 北大核心 2013年第12期4345-4350,共6页
支持向量机(SVM)在处理不平衡样本集时,对少类样本的分类效果很不理想。为提高支持向量机在处理不平衡问题上的分类效果,提出了一种核函数选取与欠采样相结合的算法,在提高少类样本准确率的前提下,将多类样本的分类准确率的损失降到最... 支持向量机(SVM)在处理不平衡样本集时,对少类样本的分类效果很不理想。为提高支持向量机在处理不平衡问题上的分类效果,提出了一种核函数选取与欠采样相结合的算法,在提高少类样本准确率的前提下,将多类样本的分类准确率的损失降到最低。该方法首先基于特征空间的可分性选择最佳核函数,然后根据特征距离进行欠采样。基于UCI标准样本集的仿真实验结果表明了该算法是合理有效的。 展开更多
关键词 分类 支持向量机 不平衡样本集 欠采样算法 核函数
在线阅读 下载PDF
不平衡样本集随机森林岩性预测方法 被引量:21
3
作者 王光宇 宋建国 +3 位作者 徐飞 张文 刘炯 陈飞旭 《石油地球物理勘探》 EI CSCD 北大核心 2021年第4期679-687,I0007,共10页
使用基于有监督机器学习分类器的岩性预测方法时,如果样本集中目标岩性样本过少,而非目标岩性样本过多,在这种不平衡样本集上训练分类器会使预测结果向非目标岩性偏倚,导致目标岩性的预测准确率较低。为了解决这一问题,提出一种针对不... 使用基于有监督机器学习分类器的岩性预测方法时,如果样本集中目标岩性样本过少,而非目标岩性样本过多,在这种不平衡样本集上训练分类器会使预测结果向非目标岩性偏倚,导致目标岩性的预测准确率较低。为了解决这一问题,提出一种针对不平衡样本集的随机森林岩性预测方法。首先,以录井岩性数据作为岩性样本标签,以井旁道地震属性和岩石弹性参数作为岩性样本特征构建岩性样本集;其次,将近邻清除算法(NM)与合成少数类过采样算法(SMOTE)相结合形成NM-SMOTE算法,对岩性样本集进行平衡化;然后,用平衡化的岩性样本集训练随机森林分类器,建立多种地震属性、弹性参数与岩性之间的非线性关系;最后,将目标探区的地震属性和弹性参数输入随机森林分类器,随机森林分类器将依据训练时得到的地震属性、弹性参数与岩性的非线性关系预测岩性。实际数据测试结果表明:训练样本集中过多的非目标岩性样本会对随机森林分类器的预测效果带来负面影响,岩性预测准确率仅为38%;使用NM-SMOTE算法对训练样本集进行平衡化后,岩性预测准确率提高至83%,获得的岩性数据体与地震资料吻合程度更高。 展开更多
关键词 岩性预测 机器学习 随机森林分类 不平衡样本集 类别平衡化技术
在线阅读 下载PDF
基于深度学习与不平衡样本集的输电线路故障分类 被引量:29
4
作者 黄景林 彭显刚 +1 位作者 简胜超 袁浩亮 《智慧电力》 北大核心 2021年第2期114-119,共6页
针对输电线路各类型故障样本间的数量不平衡会造成人工智能算法对故障中的少数类样本识别精度不足的问题,提出了一种基于Borderline-SMOTE(BSMOTE)算法与卷积神经网络(CNN)相结合的输电线路故障分类方法。该方法首先利用BSMOTE算法对位... 针对输电线路各类型故障样本间的数量不平衡会造成人工智能算法对故障中的少数类样本识别精度不足的问题,提出了一种基于Borderline-SMOTE(BSMOTE)算法与卷积神经网络(CNN)相结合的输电线路故障分类方法。该方法首先利用BSMOTE算法对位于分类边界上的少数类样本进行过采样合成处理,改善样本间的不平衡度,然后将所提取的一维故障电流信号样本重构成二维灰度图像数据形式,并在Pytorch深度学习框架下搭建了CNN网络模型,利用模型的自主学习能力对灰度图像进行特征自提取与辨识,减少传统人工设计特征提取的工序,完成对输电线路故障类型的分类。实验结果表明该模型能够提高对少数类故障样本的识别能力,准确地判断故障类型,并对噪音具有较强的抗干扰能力。 展开更多
关键词 输电线路 故障分类 不平衡样本集 Borderline-SMOTE 深度学习 卷积神经网络
在线阅读 下载PDF
基于支持向量机的不平衡样本分类研究 被引量:7
5
作者 丁福利 孙立民 《科学技术与工程》 北大核心 2014年第3期81-85,92,共6页
分类问题是机器学习领域的重要研究方向之一。支持向量机是一种基于结构风险最小化的学习机器,在解决分类问题上有着出色的效果。但基于支持向量机的分类器在处理不平衡样本时,对少类样本分类准确率偏低。诸多研究在对此问题做分析时往... 分类问题是机器学习领域的重要研究方向之一。支持向量机是一种基于结构风险最小化的学习机器,在解决分类问题上有着出色的效果。但基于支持向量机的分类器在处理不平衡样本时,对少类样本分类准确率偏低。诸多研究在对此问题做分析时往往把主要原因归结为各类样本间数量上的不平衡,而没有充分考虑样本点在特征空间上的分布情况。针对此问题做出原因分析,并给出结论:样本的不平衡性主要是由特征空间下各类样本的分布所决定的,而和数量上的不平衡关系较小。通过实验验证结论的科学有效性。 展开更多
关键词 支持向量机 不平衡样本集 特征空间 样本分布
在线阅读 下载PDF
基于CS-SVM的氧化铝蒸发过程故障检测 被引量:2
6
作者 唐明珠 阳春华 桂卫华 《控制工程》 CSCD 北大核心 2011年第4期645-649,共5页
针对氧化铝蒸发过程样本集中的类不平衡和故障难以实时检测问题,提出线性权重递减粒子群-代价敏感支持向量机故障检测方法。深入分析氧化铝蒸发过程机理,选择合适输入条件、操作参数、状态参数作为代价敏感支持向量机的输入向量,工况样... 针对氧化铝蒸发过程样本集中的类不平衡和故障难以实时检测问题,提出线性权重递减粒子群-代价敏感支持向量机故障检测方法。深入分析氧化铝蒸发过程机理,选择合适输入条件、操作参数、状态参数作为代价敏感支持向量机的输入向量,工况样本类别作为其输出。代价敏感支持向量机以最小化误分类代价为目标,利用线性权重递减粒子群优化代价敏感支持向量机核参数和误分类代价参数。实验结果表明所提出的方法能有效地提高故障识别率和减少平均误分类代价。 展开更多
关键词 不平衡样本集 代价敏感支持向量机 粒子群 氧化铝蒸发过程
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部