-
题名半监督学习在不平衡样本集分类中的应用研究
被引量:8
- 1
-
-
作者
于重重
商利利
谭励
涂序彦
杨扬
-
机构
北京工商大学计算机与信息工程学院
北京科技大学计算机与通信工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2013年第4期1085-1089,共5页
-
基金
国家自然科学基金资助项目(61070182)
北京市组织部优秀人才资助项目(2010D005003000008)
+1 种基金
北京市学科建设项目(PXM2012_014213_0000_74
PXM2012_014213_0000_23)
-
文摘
在对不平衡样本集进行分类时容易产生少数类样误差大的问题,而目前半监督学习中的算法多数是针对未有明显此类特征的数据集。针对一种半监督协同分类算法在该问题上的有效性进行了研究。由于进一步增强了分类器差异性,该算法在理论上对不平衡样本集具有良好的分类性能。根据该算法建立分类模型,利用其对桥梁结构健康数据进行分类实验,与Tri-Training算法的结果比较表明,该算法对不平衡样本集具有良好的适用性,从而验证了上述算法的有效性。
-
关键词
不平衡样本集
半监督协同分类方法
分类器差异性
分类模型
桥梁结构健康数据
-
Keywords
imbalanced sample set
semi-supervised collaboration classification method
classifier difference
classification model
bridge structural health data
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名处理不平衡样本集的欠采样算法
被引量:7
- 2
-
-
作者
丁福利
孙立民
-
机构
烟台大学计算机学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2013年第12期4345-4350,共6页
-
基金
山东省自然科学基金项目(2009ZRB019CE)
-
文摘
支持向量机(SVM)在处理不平衡样本集时,对少类样本的分类效果很不理想。为提高支持向量机在处理不平衡问题上的分类效果,提出了一种核函数选取与欠采样相结合的算法,在提高少类样本准确率的前提下,将多类样本的分类准确率的损失降到最低。该方法首先基于特征空间的可分性选择最佳核函数,然后根据特征距离进行欠采样。基于UCI标准样本集的仿真实验结果表明了该算法是合理有效的。
-
关键词
分类
支持向量机
不平衡样本集
欠采样算法
核函数
-
Keywords
classification
support vector machine
imbalanced dataset
under-sampling algorithm
kernel function
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名不平衡样本集随机森林岩性预测方法
被引量:21
- 3
-
-
作者
王光宇
宋建国
徐飞
张文
刘炯
陈飞旭
-
机构
中国石油大学(华东)地球科学与技术学院
中国科学技术大学地球和空间科学学院
中国石化石油勘探开发研究院
中石油塔里木油田分公司勘探开发研究院
-
出处
《石油地球物理勘探》
EI
CSCD
北大核心
2021年第4期679-687,I0007,共10页
-
基金
国家科技重大专项“陆相页岩油甜点地球物理识别与预测方法”(2017ZX05049-002)
国家自然科学基金面上项目“叠前数据挖掘与储层参数非线性预测”(41674125)
中石油重大科技项目“塔里木盆地深层复杂高陡构造与碳酸盐岩储层地震速度建模及成像关键技术研究”(ZD2019-181-003)联合资助。
-
文摘
使用基于有监督机器学习分类器的岩性预测方法时,如果样本集中目标岩性样本过少,而非目标岩性样本过多,在这种不平衡样本集上训练分类器会使预测结果向非目标岩性偏倚,导致目标岩性的预测准确率较低。为了解决这一问题,提出一种针对不平衡样本集的随机森林岩性预测方法。首先,以录井岩性数据作为岩性样本标签,以井旁道地震属性和岩石弹性参数作为岩性样本特征构建岩性样本集;其次,将近邻清除算法(NM)与合成少数类过采样算法(SMOTE)相结合形成NM-SMOTE算法,对岩性样本集进行平衡化;然后,用平衡化的岩性样本集训练随机森林分类器,建立多种地震属性、弹性参数与岩性之间的非线性关系;最后,将目标探区的地震属性和弹性参数输入随机森林分类器,随机森林分类器将依据训练时得到的地震属性、弹性参数与岩性的非线性关系预测岩性。实际数据测试结果表明:训练样本集中过多的非目标岩性样本会对随机森林分类器的预测效果带来负面影响,岩性预测准确率仅为38%;使用NM-SMOTE算法对训练样本集进行平衡化后,岩性预测准确率提高至83%,获得的岩性数据体与地震资料吻合程度更高。
-
关键词
岩性预测
机器学习
随机森林分类
不平衡样本集
类别平衡化技术
-
Keywords
lithology prediction
machine learning
Random Forests classification
imbalanced data sets
class balancing techniques
-
分类号
P631
[天文地球—地质矿产勘探]
-
-
题名基于深度学习与不平衡样本集的输电线路故障分类
被引量:29
- 4
-
-
作者
黄景林
彭显刚
简胜超
袁浩亮
-
机构
广东工业大学自动化学院
-
出处
《智慧电力》
北大核心
2021年第2期114-119,共6页
-
基金
国家自然科学基金资助项目(61903091)。
-
文摘
针对输电线路各类型故障样本间的数量不平衡会造成人工智能算法对故障中的少数类样本识别精度不足的问题,提出了一种基于Borderline-SMOTE(BSMOTE)算法与卷积神经网络(CNN)相结合的输电线路故障分类方法。该方法首先利用BSMOTE算法对位于分类边界上的少数类样本进行过采样合成处理,改善样本间的不平衡度,然后将所提取的一维故障电流信号样本重构成二维灰度图像数据形式,并在Pytorch深度学习框架下搭建了CNN网络模型,利用模型的自主学习能力对灰度图像进行特征自提取与辨识,减少传统人工设计特征提取的工序,完成对输电线路故障类型的分类。实验结果表明该模型能够提高对少数类故障样本的识别能力,准确地判断故障类型,并对噪音具有较强的抗干扰能力。
-
关键词
输电线路
故障分类
不平衡样本集
Borderline-SMOTE
深度学习
卷积神经网络
-
Keywords
transmission line
fault classification
imbalanced sample set
Borderline-SMOTE
deep learning
convolutional neural network
-
分类号
TM726
[电气工程—电力系统及自动化]
-
-
题名基于支持向量机的不平衡样本分类研究
被引量:7
- 5
-
-
作者
丁福利
孙立民
-
机构
烟台大学计算机学院
-
出处
《科学技术与工程》
北大核心
2014年第3期81-85,92,共6页
-
基金
山东省自然科学基金(2009ZRB019CE)资助
-
文摘
分类问题是机器学习领域的重要研究方向之一。支持向量机是一种基于结构风险最小化的学习机器,在解决分类问题上有着出色的效果。但基于支持向量机的分类器在处理不平衡样本时,对少类样本分类准确率偏低。诸多研究在对此问题做分析时往往把主要原因归结为各类样本间数量上的不平衡,而没有充分考虑样本点在特征空间上的分布情况。针对此问题做出原因分析,并给出结论:样本的不平衡性主要是由特征空间下各类样本的分布所决定的,而和数量上的不平衡关系较小。通过实验验证结论的科学有效性。
-
关键词
支持向量机
不平衡样本集
特征空间
样本分布
-
Keywords
support vector machine unbalanced sample set feature space sample distribution
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-
-
题名基于CS-SVM的氧化铝蒸发过程故障检测
被引量:2
- 6
-
-
作者
唐明珠
阳春华
桂卫华
-
机构
中南大学信息科学与工程学院
-
出处
《控制工程》
CSCD
北大核心
2011年第4期645-649,共5页
-
基金
国家杰出青年科学基金资助项目(61025015)
国家自然科学基金资助项目(60874069)
+1 种基金
国家863计划基金资助项目(2009AA04Z137)
中南大学优秀博士学位论文扶植项目
-
文摘
针对氧化铝蒸发过程样本集中的类不平衡和故障难以实时检测问题,提出线性权重递减粒子群-代价敏感支持向量机故障检测方法。深入分析氧化铝蒸发过程机理,选择合适输入条件、操作参数、状态参数作为代价敏感支持向量机的输入向量,工况样本类别作为其输出。代价敏感支持向量机以最小化误分类代价为目标,利用线性权重递减粒子群优化代价敏感支持向量机核参数和误分类代价参数。实验结果表明所提出的方法能有效地提高故障识别率和减少平均误分类代价。
-
关键词
类不平衡样本集
代价敏感支持向量机
粒子群
氧化铝蒸发过程
-
Keywords
class-imbalanced dataset
cost-sensitive support vector machine
particle swarm optimization
alumina evaporation process
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-