期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
结合未标签样本和CNN的高光谱遥感图像分类 被引量:4
1
作者 韩彦岭 高仪 +2 位作者 王静 张云 洪中华 《遥感信息》 CSCD 北大核心 2020年第5期19-30,共12页
针对卷积神经网络(convolutional neural networks,CNNs)需求的训练样本量多,而高光谱图像中存在大量的未标签样本未得到充分利用的问题,文章充分挖掘标签样本及其近邻的未标签样本的空谱信息,提出了一种基于灰度共生矩阵(gray-level co... 针对卷积神经网络(convolutional neural networks,CNNs)需求的训练样本量多,而高光谱图像中存在大量的未标签样本未得到充分利用的问题,文章充分挖掘标签样本及其近邻的未标签样本的空谱信息,提出了一种基于灰度共生矩阵(gray-level co-occurrence matrix,GLCM)和三维卷积神经网络的空谱特征联合训练的高光谱图像分类方法。首先,通过灰度共生矩阵提取高光谱图像的纹理特征;然后,利用相关性分析剔除近邻未标签样本中的冗余信息,将标签样本与未标签样本的信息融合;最后,利用三维卷积神经网络提取深空谱特征进行分类。该方法不但充分挖掘了高光谱图像的深度空谱联合特征,而且利用近邻未标签样本的信息实现对样本信息的增强,降低了对训练样本数量的要求,具有较好的分类性能。在3个公共数据集上的实验结果表明,相比其他方法,该方法可以利用较少的训练样本获得较高的分类精度。 展开更多
关键词 高光谱图像分类 空谱特征 灰度共生矩阵 三维卷积神经网络 标签样本
在线阅读 下载PDF
多标签零样本学习知识迁移集成分类方法
2
作者 王广晨 王宵 +1 位作者 马忠臣 詹永照 《小型微型计算机系统》 北大核心 2025年第5期1097-1104,共8页
在多标签零样本学习中,防止模型对可见类别过拟合,提升对不可见类的泛化识别能力是一个显著的挑战.受集成学习具有良好泛化性的启发,本文提出了一种知识迁移集成分类头方法.该方法将单次训练过程分为多个周期,使识别特定类别的共享知识... 在多标签零样本学习中,防止模型对可见类别过拟合,提升对不可见类的泛化识别能力是一个显著的挑战.受集成学习具有良好泛化性的启发,本文提出了一种知识迁移集成分类头方法.该方法将单次训练过程分为多个周期,使识别特定类别的共享知识从标准图像分类头的特征空间中解耦并分配至多个分类头中,而标准图像分类头的特征空间中识别可见类的基础知识得以保留,进而实现有效识别可见类别的同时,增强对不可见类别的泛化识别能力.该集成分类头可方便地移植到几乎所有的多标签零样本学习模型中,因而其与现有的多标签零样本学习模型的分类头正交,显示出高度的灵活性与鲁棒性.通过分析分类头对识别类别的置信度,揭示了对可见类过拟合的潜在原因,即现有多标签零样本学习方法的分类头受可见类的基础知识的影响,限制了共享知识的有效学习.本方法在两个大规模多标签零样本基准上进行了广泛性实验,证明了本方法的有效性. 展开更多
关键词 标签样本学习 知识迁移 集成学习 过拟合
在线阅读 下载PDF
训练样本标签误差对高光谱影像分类影响
3
作者 余腾 朱益民 +2 位作者 王月华 向健斌 张丹丹 《遥感信息》 CSCD 北大核心 2024年第4期68-79,共12页
在影像尤其是高光谱影像分类中,用于学习训练的标签质量对分类成效影响并未得到充分重视。为此,文章基于PyTorch框架,利用Indian Pines高光谱数据集,探讨了在RF、BP、CNN和SSConvNeXt模型下,光谱特征相似度较高的地物在不同比例人为误... 在影像尤其是高光谱影像分类中,用于学习训练的标签质量对分类成效影响并未得到充分重视。为此,文章基于PyTorch框架,利用Indian Pines高光谱数据集,探讨了在RF、BP、CNN和SSConvNeXt模型下,光谱特征相似度较高的地物在不同比例人为误标注情况时对分类结果的影响。分析结果认为:同样错误标注情况下,SSConvNeXt和CNN相较RF、BP模型体现出20%以上的分类精度优势;在无人为错误标注、10个错误噪声标签、错误标签占比15%和25%时,SSConvNeXt和CNN模型的分类精度都在96%以上,体现了模型的容错性和稳定性;在相对传统的RF和BP模型中,错误标签对分类影响较大且离散。最后重点分析了SSConvNeXt模型在分类方面的机制优势。该研究可从训练样本角度为遥感影像分类精度问题给予一定的方法选择和定量分析依据。 展开更多
关键词 高光谱遥感 样本标签质量 深度学习 分类精度 分类机制
在线阅读 下载PDF
标签与样本双语义增强的跨模态检索 被引量:3
4
作者 滕少华 黄文彪 +1 位作者 张巍 滕璐瑶 《江西师范大学学报(自然科学版)》 CAS 北大核心 2023年第3期296-306,共11页
针对目前大多数跨模态哈希检索方法无法捕获多标签信息和特征语义更深层的语义关系信息问题,该文提出了一种标签与样本双语义增强的跨模态检索框架.首先,该框架将不同模态的高维数据映射到低维共享特征语义空间中,进行样本语义学习;其次... 针对目前大多数跨模态哈希检索方法无法捕获多标签信息和特征语义更深层的语义关系信息问题,该文提出了一种标签与样本双语义增强的跨模态检索框架.首先,该框架将不同模态的高维数据映射到低维共享特征语义空间中,进行样本语义学习;其次,引入松弛变量到标签语义制约的哈希码学习函数中,通过最小化标签成对距离强化样本语义相似性哈希码学习,这样既保持了跨模态对应样本语义的关系,强化了哈希码的标签语义学习,又解决了实对称矩阵的求解及算法的收敛性问题;再次,进一步应用样本特征语义和标签语义增强哈希码的语义学习;最后,在3个常用的数据集上的实验结果表明该方法优于目前的方法. 展开更多
关键词 标签样本双语义增强 跨模态检索 标签语义
在线阅读 下载PDF
基于改进CRITIC-GAHP的通信干扰效果在线评估方法
5
作者 侯文君 彭闯 +1 位作者 金虎 雷迎科 《系统工程与电子技术》 北大核心 2025年第7期2389-2398,共10页
针对通信干扰效果在线评估的无标签样本分类问题,提出一种基于主客观权重的通信干扰效果在线评估方法。从发送方抗干扰的角度选取多种通信行为参数作为干扰效果评估指标,分别使用改进的准则重要性相关法(criteria importance through in... 针对通信干扰效果在线评估的无标签样本分类问题,提出一种基于主客观权重的通信干扰效果在线评估方法。从发送方抗干扰的角度选取多种通信行为参数作为干扰效果评估指标,分别使用改进的准则重要性相关法(criteria importance through inter-criteria correlation,CRITIC)和群层次分析法(group analytic hierarchy process,GAHP)确定客观和主观权重。通过最小信息熵原理确定组合权重后,根据各指标参数的变化程度判断干扰效果,划分干扰效果等级,实现无标签样本分类。同时,提出动态更新各指标归一化参数的方法,使其应对变化的环境。实验结果表明,提出的方法在指标参数范围变化和小样本情况下仍具有较稳定的性能。 展开更多
关键词 通信干扰效果 在线评估 标签样本分类 主客观权重
在线阅读 下载PDF
一种使用未标记样本聚类信息的自训练方法 被引量:1
6
作者 刘伟涛 许信顺 《计算机应用研究》 CSCD 北大核心 2010年第9期3341-3344,共4页
为了有效地利用结构信息,提出了一种新的自学习算法,算法中利用聚类方法从自标记样本中选择可信度高的样本,同时用一个数据编辑方法从这些可信度高的样本中剔除被错标的可能性较高的样本。算法在UCI数据上进行了验证,效果和收敛速度比... 为了有效地利用结构信息,提出了一种新的自学习算法,算法中利用聚类方法从自标记样本中选择可信度高的样本,同时用一个数据编辑方法从这些可信度高的样本中剔除被错标的可能性较高的样本。算法在UCI数据上进行了验证,效果和收敛速度比对比算法要好,说明引入聚类选择候选样本是有效的。 展开更多
关键词 自训练 标签样本 聚类 半监督学习
在线阅读 下载PDF
改进掩码自编码器的滚动轴承半监督故障诊断 被引量:4
7
作者 陈仁祥 张晓 +2 位作者 张旭 赵玲 夏亮 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第1期26-33,共8页
针对滚动轴承在不同转速条件下数据分布不同以及实际工程应用中标签样本不足导致故障诊断精度低的问题,将领域适配模块融入掩码自编码器(MAE)中,提出了改进掩码自编码器(IMAE)的滚动轴承半监督故障诊断方法。首先,对滚动轴承振动信号进... 针对滚动轴承在不同转速条件下数据分布不同以及实际工程应用中标签样本不足导致故障诊断精度低的问题,将领域适配模块融入掩码自编码器(MAE)中,提出了改进掩码自编码器(IMAE)的滚动轴承半监督故障诊断方法。首先,对滚动轴承振动信号进行连续小波变换(CWT)得到反应信号时频特征的二维时频图,然后对时频图随机掩码,利用无标签样本进行掩码自编码器预训练,获得数据中复杂的内在特征,减少对有标签样本的依赖;其次将领域适配模块引入到预训练后的编码器中,使用少量有标签源域数据对IMAE进行微调,在希尔伯特空间中利用最小化最大均值差异减小因转速不同造成的源域与目标域间数据分布差异;最后在Softmax分类层下实现滚动轴承半监督故障诊断。通过滚动轴承数据集实验验证,所提方法检测精度均达到94%以上,证明了该方法的可行性与有效性。 展开更多
关键词 掩码自编码器 滚动轴承 不同转速 标签样本 半监督故障诊断
在线阅读 下载PDF
基于GMM-KNN-LSTM的烧结矿化学指标预测 被引量:1
8
作者 閤光磊 吴朝霞 +1 位作者 刘梦园 姜玉山 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第3期314-322,共9页
针对烧结矿化学指标检测频率低导致无标签样本无法被机器学习利用的问题,提出了一种充分利用样本中有用信息的烧结矿化学指标预测模型.首先,结合高斯混合模型(GMM)和K-近邻(KNN)算法,将无标签样本转化为有标签样本,然后与长短期记忆(LS... 针对烧结矿化学指标检测频率低导致无标签样本无法被机器学习利用的问题,提出了一种充分利用样本中有用信息的烧结矿化学指标预测模型.首先,结合高斯混合模型(GMM)和K-近邻(KNN)算法,将无标签样本转化为有标签样本,然后与长短期记忆(LSTM)单元相结合,用于预测烧结矿的总铁质量分数、FeO质量分数和碱度3个化学指标.通过与反向传播神经网络(BPNN)、循环神经网络(RNN)和LSTM三种模型对比,结果表明所建模型具有较低的预测误差.总铁质量分数和FeO质量分数的预测命中率在允许误差±0.5%内时分别达到98.73%和95.33%,碱度的预测命中率在允许误差±0.05内为98.13%,展现了较高的预测精度. 展开更多
关键词 烧结矿化学指标 预测模型 标签样本处理算法 LSTM 数据预处理
在线阅读 下载PDF
基于深度信念网络的电力变压器故障分类建模 被引量:83
9
作者 石鑫 朱永利 +2 位作者 萨初日拉 王刘旺 孙岗 《电力系统保护与控制》 EI CSCD 北大核心 2016年第1期71-76,共6页
基于深度信念网络,构建了深度信念网络分类器模型,分析并用典型数据集对其分类性能进行测试。在此基础上结合电力变压器油中溶解气体分析数据,提出了基于深度信念网络分类器的变压器故障分类新方法,它使用油中溶解气体分析结果作为故障... 基于深度信念网络,构建了深度信念网络分类器模型,分析并用典型数据集对其分类性能进行测试。在此基础上结合电力变压器油中溶解气体分析数据,提出了基于深度信念网络分类器的变压器故障分类新方法,它使用油中溶解气体分析结果作为故障分类属性。对所提出的方法进行了测试,测试结果表明该方法适用于变压器故障分类,具有较强的从样本中提取特征的能力和容错特性,性能优于BP神经网络和支持向量机的方法。 展开更多
关键词 电力变压器 故障诊断 深度信念网络 标签样本 油中溶解气体分析
在线阅读 下载PDF
一种新的半监督直推式支持向量机分类算法 被引量:22
10
作者 王安娜 李云路 +1 位作者 赵锋云 史成龙 《仪器仪表学报》 EI CAS CSCD 北大核心 2011年第7期1546-1550,共5页
传统的支持向量机(SVM)是一种有监督学习方法,需要大量有标记样本,然而有标记样本的数量十分有限且获得困难。因此,当存在海量的无标记样本时,如何有效地利用这些数据成为了机器学习面临的重要任务。研究提出了一种新的半监督直推式支... 传统的支持向量机(SVM)是一种有监督学习方法,需要大量有标记样本,然而有标记样本的数量十分有限且获得困难。因此,当存在海量的无标记样本时,如何有效地利用这些数据成为了机器学习面临的重要任务。研究提出了一种新的半监督直推式支持向量机分类算法,将半监督算法与支持向量机结合,在迭代算法中将无标签样本与有标签样本结合,逐渐得到更可信的分类超平面。理论分析和计算机仿真结果都表明,研究提出的样本能够有效地利用大量的无标签样本,并且无标签样本的加入能够有效地提高分类准确率。 展开更多
关键词 支持向量机 半监督学习 标签样本
在线阅读 下载PDF
半监督的改进K-均值聚类算法 被引量:13
11
作者 汪军 王传玉 周鸣争 《计算机工程与应用》 CSCD 北大核心 2009年第28期137-139,共3页
K-均值聚类算法必须事先获取聚类数目,并且随机地选取聚类初始中心会造成聚类结果不稳定,容易在获得一个局部最优值时终止。提出了一种基于半监督学习理论的改进K-均值聚类算法,利用少量标签数据建立图的最小生成树并迭代分裂获取K-均... K-均值聚类算法必须事先获取聚类数目,并且随机地选取聚类初始中心会造成聚类结果不稳定,容易在获得一个局部最优值时终止。提出了一种基于半监督学习理论的改进K-均值聚类算法,利用少量标签数据建立图的最小生成树并迭代分裂获取K-均值聚类算法所需要的聚类数和初始聚类中心。在IRIS数据集上的实验表明,尽管随机样本构造的生成树不同,聚类中心也不同,但聚类是一致且稳定的,迭代的次数较少,验证了该文算法的有效性。 展开更多
关键词 半监督学习 K-均值聚类 标签样本 最小生成树
在线阅读 下载PDF
基于k均值聚类的直推式支持向量机学习算法 被引量:12
12
作者 王立梅 李金凤 岳琪 《计算机工程与应用》 CSCD 2013年第14期144-146,共3页
针对直推式支持向量机(TSVM)学习模型求解难度大的问题,提出了一种基于k均值聚类的直推式支持向量机学习算法——TSVMKMC。该算法利用k均值聚类算法,将无标签样本分为若干簇,对每一簇样本赋予相同的类别标签,将无标签样本和有标签样本... 针对直推式支持向量机(TSVM)学习模型求解难度大的问题,提出了一种基于k均值聚类的直推式支持向量机学习算法——TSVMKMC。该算法利用k均值聚类算法,将无标签样本分为若干簇,对每一簇样本赋予相同的类别标签,将无标签样本和有标签样本合并进行直推式学习。由于TSVMKMC算法有效地降低了状态空间的规模,因此运行速度较传统算法有了很大的提高。实验结果表明,TSVMSC算法能够以较快的速度达到较高的分类准确率。 展开更多
关键词 直推式学习 支持向量机 K均值聚类 标签样本
在线阅读 下载PDF
半监督分类中的噪声控制及相关算法 被引量:3
13
作者 姜震 詹永照 《江苏大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第4期435-438,共4页
为了更好地控制利用伪标签样本学习的这类半监督分类算法中的噪声,针对以往研究中分布噪声难以量化并被忽视的问题,提出一种基于高斯混合模型和伪验证集的噪声量化和分析的新方法.根据噪声下的泛化误差分析,提出一种可回溯的分类器迭代... 为了更好地控制利用伪标签样本学习的这类半监督分类算法中的噪声,针对以往研究中分布噪声难以量化并被忽视的问题,提出一种基于高斯混合模型和伪验证集的噪声量化和分析的新方法.根据噪声下的泛化误差分析,提出一种可回溯的分类器迭代训练策略,可以有效降低伪标签样本带来的噪声影响.通过将该训练策略与集成学习相结合,提出一种ensemble self-learning(ESL)算法,能够进一步提高分类算法的泛化性能.在6个公开数据集上与同类先进算法进行了试验比较.结果表明,所提出的算法取得了最高的平均准确率,并且在75%的试验数据集上都取得了最好的准确率. 展开更多
关键词 标签样本 分类 噪声 集成学习 半监督学习
在线阅读 下载PDF
集成最近邻规则的半监督顺序回归算法 被引量:1
14
作者 何海江 何文德 刘华富 《计算机应用》 CSCD 北大核心 2010年第4期1022-1025,共4页
监督型顺序回归算法需要足够多的有标签样本,而在实践中,标注样本的序数耗时耗力,甚至难以完成。为此,提出一种集成最近邻规则的半监督顺序回归算法。基于最近邻,针对每个有标签样本,在无标签数据集选择与其最近似的若干样本赋以相同序... 监督型顺序回归算法需要足够多的有标签样本,而在实践中,标注样本的序数耗时耗力,甚至难以完成。为此,提出一种集成最近邻规则的半监督顺序回归算法。基于最近邻,针对每个有标签样本,在无标签数据集选择与其最近似的若干样本赋以相同序数;再由监督型顺序回归算法训练有标签样本和新标注样本。多个数据集的实验结果显示,该方法能显著改善顺序回归性能。另外,引入折扣因子λ评估新标注样本的可信度,并讨论了λ和有标签数据集大小对方法的影响。 展开更多
关键词 半监督顺序回归 最近邻 标签样本 折扣因子
在线阅读 下载PDF
近邻渐进直推式支持向量机算法
15
作者 李云飞 《计算机工程》 CAS CSCD 北大核心 2008年第17期191-192,195,共3页
针对渐进直推式支持向量机算法训练速度慢和学习性能不稳定的问题,提出一种近邻渐进直推式支持向量机算法。该算法利用支持向量机中支持向量信息,选择支持向量附近的无标签样本点进行标注,采用支持向量预选取的方法减少训练集的规模,提... 针对渐进直推式支持向量机算法训练速度慢和学习性能不稳定的问题,提出一种近邻渐进直推式支持向量机算法。该算法利用支持向量机中支持向量信息,选择支持向量附近的无标签样本点进行标注,采用支持向量预选取的方法减少训练集的规模,提高算法的速度。实验结果表明了该算法的有效性。 展开更多
关键词 渐进直推式支持向量机 标签样本 近邻
在线阅读 下载PDF
基于DCAE-KSSELM的变压器故障诊断方法 被引量:12
16
作者 郝玲玲 朱永利 王永正 《中国电力》 CSCD 北大核心 2022年第2期125-130,共6页
为了充分利用变压器发生故障时产生的大量无标签样本,提高故障诊断精度,提出基于深度收缩自编码器(DCAE)与核半监督极限学习机(KSSELM)相结合的故障诊断方法。首先使用无标签样本对DCAE网络逐层训练,初始化网络参数,然后用有标签样本数... 为了充分利用变压器发生故障时产生的大量无标签样本,提高故障诊断精度,提出基于深度收缩自编码器(DCAE)与核半监督极限学习机(KSSELM)相结合的故障诊断方法。首先使用无标签样本对DCAE网络逐层训练,初始化网络参数,然后用有标签样本数据对网络参数进行微调,最后将有标签样本与无标签样本一起作为深度收缩自编码器与核半监督极限学习机(DCAE-KSSELM)混合网络的输入并完成故障诊断。实验结果表明,所提模型稳定性好,故障诊断精度高,鲁棒性强。 展开更多
关键词 变压器 故障诊断 标签样本 收缩自编码器
在线阅读 下载PDF
基于改进的半监督聚类的不平衡分类算法 被引量:4
17
作者 陆宇 赵凌云 +1 位作者 白斌雯 姜震 《计算机应用》 CSCD 北大核心 2022年第12期3750-3755,共6页
不平衡分类的相关算法是机器学习领域的研究热点之一,其中的过采样通过重复抽取或者人工合成来增加少数类样本,以实现数据集的再平衡。然而当前的过采样方法大部分是基于原有的样本分布进行的,难以揭示更多的数据集分布特征。为了解决... 不平衡分类的相关算法是机器学习领域的研究热点之一,其中的过采样通过重复抽取或者人工合成来增加少数类样本,以实现数据集的再平衡。然而当前的过采样方法大部分是基于原有的样本分布进行的,难以揭示更多的数据集分布特征。为了解决以上问题,首先,提出一种改进的半监督聚类算法来挖掘数据的分布特征;其次,基于半监督聚类的结果,在属于少数类的簇中选择置信度高的无标签数据(伪标签样本)加入原始训练集,这样做除了实现数据集的再平衡外,还可以利用半监督聚类获得的分布特征来辅助不平衡分类;最后,融合半监督聚类和分类的结果来预测最终的类别标签,从而进一步提高算法的不平衡分类性能。选择G-mean和曲线下面积(AUC)作为评价指标,将所提算法与TU、CDSMOTE等7个基于过采样或欠采样的不平衡分类算法在10个公开数据集上进行了对比分析。实验结果表明,与TU、CDSMOTE相比,所提算法在AUC指标上分别平均提高了6.7%和3.9%,在G-mean指标上分别平均提高了7.6%和2.1%,且在两个评价指标上相较于所有对比算法都取得了最高的平均结果。可见所提算法能够有效地提高不平衡分类性能。 展开更多
关键词 不平衡分类 半监督聚类 标签样本 过采样 融合
在线阅读 下载PDF
一种双优选的半监督回归算法 被引量:3
18
作者 程康明 熊伟丽 《智能系统学报》 CSCD 北大核心 2019年第4期689-696,共8页
针对一些工业过程中存在的有标签样本少,而传统的半监督学习无法保证对无标签样本准确预测的问题,提出一种双优选的半监督回归算法。首先,确定有标签样本密集区中心,并计算无标签样本与该中心的相似度,实现对无标签样本的优选,同时根据... 针对一些工业过程中存在的有标签样本少,而传统的半监督学习无法保证对无标签样本准确预测的问题,提出一种双优选的半监督回归算法。首先,确定有标签样本密集区中心,并计算无标签样本与该中心的相似度,实现对无标签样本的优选,同时根据有标签样本间相似度优选有标签样本;然后,利用高斯过程回归方法对选出的有标签样本建立辅学习器,以对优选出的无标签样本预测标签;最后,利用这些伪标签样本提升主学习器的预测效果。通过数值例子以及实际脱丁烷塔过程数据进行建模仿真,证明了所提方法在有标签样本较少的情况下有良好的预测性能。 展开更多
关键词 标签样本 优选 半监督回归 样本密集区中心 相似度 高斯过程回归 辅学习器 主学习器 脱丁烷塔过程 预测性能
在线阅读 下载PDF
半监督学习方法 被引量:137
19
作者 刘建伟 刘媛 罗雄麟 《计算机学报》 EI CSCD 北大核心 2015年第8期1592-1617,共26页
半监督学习研究如何同时利用有类标签的样本和无类标签的样例改进学习性能,成为近年来机器学习领域的研究热点.鉴于半监督学习的理论意义和实际应用价值,系统综述了半监督学习方法.首先概述了半监督学习的相关概念,包括半监督学习的定... 半监督学习研究如何同时利用有类标签的样本和无类标签的样例改进学习性能,成为近年来机器学习领域的研究热点.鉴于半监督学习的理论意义和实际应用价值,系统综述了半监督学习方法.首先概述了半监督学习的相关概念,包括半监督学习的定义、半监督学习研究的发展历程、半监督学习方法依赖的假设以及半监督学习的分类,然后分别从分类、回归、聚类和降维这4个方面详述了半监督学习方法,接着从理论上对半监督学习进行了分析并给出半监督学习的误差界和样本复杂度,最后探讨了半监督学习领域未来的研究方向. 展开更多
关键词 半监督学习 有类标签样本 无类标签的样例 标签 成对约束
在线阅读 下载PDF
一种自训练框架下的三优选半监督回归算法 被引量:4
20
作者 程康明 熊伟丽 《智能系统学报》 CSCD 北大核心 2020年第3期568-577,共10页
工业生产过程数据由于主导变量分析代价等因素可能出现有标签样本少而无标签样本多的情况,为提升对无标签样本利用的准确性与充分性,提出一种自训练框架下的三优选半监督回归算法。对无标签样本与有标签样本进行优选,保证两类数据的相似... 工业生产过程数据由于主导变量分析代价等因素可能出现有标签样本少而无标签样本多的情况,为提升对无标签样本利用的准确性与充分性,提出一种自训练框架下的三优选半监督回归算法。对无标签样本与有标签样本进行优选,保证两类数据的相似性,以提高无标签样本预测的准确性;利用高斯过程回归方法对所选有标签样本集建模,预测所选无标签样本集,得到伪标签样本集;通过对伪标签样本集置信度进行判断,优选出置信度高的样本用于更新初始样本集;为了进一步提高无标签样本利用的充分性,在自训练框架下,进行多次循环筛选提高无标签样本的利用率。通过对脱丁烷塔过程实际数据的建模仿真,验证了所提方法在较少有标签样本情况下的良好预测性能。 展开更多
关键词 工业生产 标签样本 优选 半监督回归 相似性 高斯过程回归 置信度判断 自训练 预测
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部