期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于小样本标记实例的数据流集成入侵检测模型 被引量:2
1
作者 俞研 黄皓 《电子学报》 EI CAS CSCD 北大核心 2007年第2期234-239,共6页
基于监督学习的异常入侵检测算法通常面临着训练样本不足的问题,同时,对整个历史数据集进行等同学习,没有充分考虑到网络数据模式随时间变化的特点.本文提出了一种基于小样本标记实例的数据流集成入侵检测模型,对小样本的标记数据集进... 基于监督学习的异常入侵检测算法通常面临着训练样本不足的问题,同时,对整个历史数据集进行等同学习,没有充分考虑到网络数据模式随时间变化的特点.本文提出了一种基于小样本标记实例的数据流集成入侵检测模型,对小样本的标记数据集进行扩展,解决了训练样本不足的问题,并能够充分适应网络数据模式随时间变化的特点.实验结果表明,在小样本标记实例情况下,算法的检测性能明显优于基于所有历史数据进行入侵检测的结果. 展开更多
关键词 入侵检测 数据流处理 样本标记实例 集成入侵检测模型
在线阅读 下载PDF
限制性显示技术作为一种高密度长链寡核苷酸芯片样本标记方法的初步研究(英文)
2
作者 莫小阳 马文丽 +5 位作者 李凌 石嵘 张宝 徐秋林 张海燕 郑文岭 《第一军医大学学报》 CSCD 北大核心 2005年第9期1081-1085,1094,共6页
目的初步研究限制性显示技术(RD-PCR)作为一种高密度长链寡核苷酸芯片样本标记方法对芯片杂交信号的影响。方法收集3个健康人外周血单核细胞,提取RNA后分为两组,采用RD-PCR进行样本双色(Cy3/Cy5)荧光标记,与3张Agilent60mer高密度(22K)... 目的初步研究限制性显示技术(RD-PCR)作为一种高密度长链寡核苷酸芯片样本标记方法对芯片杂交信号的影响。方法收集3个健康人外周血单核细胞,提取RNA后分为两组,采用RD-PCR进行样本双色(Cy3/Cy5)荧光标记,与3张Agilent60mer高密度(22K)人1B寡核苷酸芯片进行杂交。排除阴性和阳性对照信号值、Cy3和(或)Cy5的前景与背景间无统计显著性差异点的信号值,进一步排除两种荧光标记间存在统计显著性差异点的信号值,将3张芯片的共同信号值用于分析。SPSS软件进行常规统计分析和作图,R语言环境下的VSN统计包排除芯片间和两种不同荧光标记间的系统误差。结果3张芯片的8744个共同点用于本研究。芯片间及两种荧光标记间存在明显的可校正的系统误差。芯片间杂交信号值相关显著。RD-PCR样本标记方法对较低表达基因信号值较为敏感。结论初步的统计分析结果表明,RD-PCR是一种潜在的有用的高密度长链寡核苷酸芯片样本标记方法。 展开更多
关键词 限制性显示技术 高密度长链寡核苷酸芯片 样本标记
在线阅读 下载PDF
有限标记样本下基于GSSL-GraphSage的半监督故障诊断方法
3
作者 曹洁 王庭义 王进花 《控制理论与应用》 北大核心 2025年第5期892-902,共11页
鉴于在实际工程中采集的齿轮箱标注监测数据是有限的,且基于图神经网络的齿轮箱故障诊断方法研究仍存在标签信息挖掘不充分的问题,本文提出一种有限标记样本下基于图的半监督学习(GSSL)与图采样聚合算法(GraphSage)的齿轮箱半监督故障... 鉴于在实际工程中采集的齿轮箱标注监测数据是有限的,且基于图神经网络的齿轮箱故障诊断方法研究仍存在标签信息挖掘不充分的问题,本文提出一种有限标记样本下基于图的半监督学习(GSSL)与图采样聚合算法(GraphSage)的齿轮箱半监督故障诊断方法.基于K最近邻算法和基于图的标签传播策略,将标签信息沿边传播给分布相似的邻域样本,从而充分利用有限样本的标签信息,提高模型性能.将每个振动频谱样本视为一个节点构建基于图的半监督学习框架,最后将半监督学习框架输入到节点级GraphSage网络中进行故障分类,避免新加入节点重新训练的情况,可有效防止训练过拟合,增强泛化能力.将所提方法用于分析齿轮箱故障实验数据,结果表明所提方法能够在6%的低标签情况下准确诊断齿轮箱的不同故障模式,验证了对齿轮箱故障诊断的可行性和有效性. 展开更多
关键词 故障诊断 GraphSage网络 有限标记样本 半监督学习 标签传播策略
在线阅读 下载PDF
基于时频自监督学习的弱标记滚动轴承故障诊断研究 被引量:1
4
作者 邢海波 李杰 《现代制造工程》 北大核心 2025年第1期148-155,共8页
针对数据样本弱标记下的滚动轴承故障诊断问题,提出了一种基于时频自监督学习的新方法,在无故障标记样本中提取潜藏故障特征。该方法首先通过构建时域编码器和频域编码器来分别提取时域和频域的特征表示;然后设计了一种时频自监督学习... 针对数据样本弱标记下的滚动轴承故障诊断问题,提出了一种基于时频自监督学习的新方法,在无故障标记样本中提取潜藏故障特征。该方法首先通过构建时域编码器和频域编码器来分别提取时域和频域的特征表示;然后设计了一种时频自监督学习模型来增强时域与频域特征之间的相互预测能力;最后为了优化该模型的学习过程,设计了一种新型交叉相关矩阵损失函数,有效提升了模型对复杂故障模式的捕捉能力。采用凯斯西储大学轴承故障公开数据集和帕德博恩大学轴承公开数据集进行方法验证,实验结果表明,该方法在少数故障标签(5%故障标记)的数据下取得了优异的诊断效果。 展开更多
关键词 滚动轴承 故障诊断 时频域特征 自监督学习 标记样本
在线阅读 下载PDF
基于PTM潜在Dirichlet分配的少量标记样本文本分类 被引量:2
5
作者 赵丽 齐兴斌 +1 位作者 李雪梅 田涛 《计算机应用研究》 CSCD 北大核心 2015年第5期1428-1432,1444,共6页
针对现实文本分类环境下通常仅有少量标记样本而影响分类精度的问题,提出了一种基于概率主题模型潜在Dirichlet分配的分类算法。借助标准词频逆文档频率函数将每个文档表示成术语权重向量;利用概率主题模型预处理以简化文档,并从文档中... 针对现实文本分类环境下通常仅有少量标记样本而影响分类精度的问题,提出了一种基于概率主题模型潜在Dirichlet分配的分类算法。借助标准词频逆文档频率函数将每个文档表示成术语权重向量;利用概率主题模型预处理以简化文档,并从文档中提取术语;再利用潜在Dirichlet分配模型进行关系学习,构建基于图的分类器完成分类。在公开的Reuters-21578资源库上的分类实验评估了该方法的有效性,相比分类效果较好的支持向量机,该方法在大部分情况下能够取得更高的分类精度。 展开更多
关键词 文本分类 术语提取 图构建 概率主题模型 少量标记样本 潜在Dirichlet分配
在线阅读 下载PDF
微阵列癌症数据误标记样本和异常样本识别的广义CL-stability算法
6
作者 周柚 张琛 +2 位作者 吴春国 时小虎 梁艳春 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2008年第3期509-511,共3页
针对微阵列癌症数据的特点,提出一种能识别数据集中误标记样本和异常样本的广义CL-stability算法.该算法以CL-stability为基本算子,通过样本的全局稳定性识别误标记样本或异常样本.实验结果表明,广义CL-stability算法对于识别微阵列癌... 针对微阵列癌症数据的特点,提出一种能识别数据集中误标记样本和异常样本的广义CL-stability算法.该算法以CL-stability为基本算子,通过样本的全局稳定性识别误标记样本或异常样本.实验结果表明,广义CL-stability算法对于识别微阵列癌症数据中的误标记样本优于已有算法,并能给出区分误标记样本和异常样本的信息. 展开更多
关键词 标记样本识别 异常样本识别 微阵列 广义CL—stability算法
在线阅读 下载PDF
基于集成GMM聚类的少标记样本图像分类 被引量:6
7
作者 张鹏飞 董敏周 端军红 《西北工业大学学报》 EI CAS CSCD 北大核心 2019年第3期465-470,共6页
为了提高卷积神经网络训练的分类器分类准确率,往往需要大量的已标记数据,但有时已标记数据并不容易获得。针对少标记样本图像分类问题,提出基于集成GMM聚类与标签传递思想的解决方案,通过一定的规则给未标记数据赋予标签,将未标记数据... 为了提高卷积神经网络训练的分类器分类准确率,往往需要大量的已标记数据,但有时已标记数据并不容易获得。针对少标记样本图像分类问题,提出基于集成GMM聚类与标签传递思想的解决方案,通过一定的规则给未标记数据赋予标签,将未标记数据转换成已标记数据用于模型的训练。在手写数字识别数据集上进行实验,结果表明新算法在少标记样本的情况下,结合集成 GMM 聚类的方法比只采用有标记样本训练得到的模型分类准确率有着较大提高,验证了该算法的有效性。 展开更多
关键词 集成GMM聚类 标记样本 投票规则
在线阅读 下载PDF
利用主动学习改进遥感图像单类分类:以正类和未标记样本学习方法为例 被引量:5
8
作者 孙熠 李培军 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第1期155-163,共9页
针对单类分类方法中只用正类训练样本导致训练样本数量和质量的选择直接影响分类结果精度的问题,以正类和未标记样本学习(PUL)为例,研究如何利用主动学习选择训练样本,以求改善单类分类的精度。首先用随机选取的训练样本进行PUL分类,直... 针对单类分类方法中只用正类训练样本导致训练样本数量和质量的选择直接影响分类结果精度的问题,以正类和未标记样本学习(PUL)为例,研究如何利用主动学习选择训练样本,以求改善单类分类的精度。首先用随机选取的训练样本进行PUL分类,直到获得稳定的分类精度,然后利用主动学习选择和增加最有用(informative)的正类或负类样本,用于PUL分类。结果表明,当利用足够多的随机选取的正类样本得到稳定的分类精度后,利用主动学习选择和增加正类样本可以提高分类精度;利用主动学习的同时加入正类和负类样本,可以得到比只加入正类样本更高的分类精度;将利用主动学习得到的正类样本经相似性筛选后得到的正类样本,分类精度与直接利用主动学习选择的样本相似,但达到同样精度时需要更少的样本。因此,利用主动学习选择和增加样本可以有效地改善单类分类的精度。 展开更多
关键词 单类分类 主动学习 正类和未标记样本学习(PUL)
在线阅读 下载PDF
针对不确定正例和未标记学习的最近邻算法(英文) 被引量:2
9
作者 潘世瑞 张阳 +1 位作者 李雪 王勇 《计算机科学与探索》 CSCD 2010年第9期769-779,共11页
研究了在正例和未标记样本场景下不确定样本的分类问题,提出了一种新的算法NNPU(nearest neighbor algorithm for positive and unlabeled learning)。NNPU具有两种实现方式:NNPUa和NNPUu。在UCI标准数据集上的实验结果表明,充分考虑数... 研究了在正例和未标记样本场景下不确定样本的分类问题,提出了一种新的算法NNPU(nearest neighbor algorithm for positive and unlabeled learning)。NNPU具有两种实现方式:NNPUa和NNPUu。在UCI标准数据集上的实验结果表明,充分考虑数据不确定信息的NNPUu算法要比仅仅考虑样本中不确定信息均值的NNPUa算法具有更好的分类能力;同时,NNPU算法在对精确数据进行分类时,比NN-d、OCC以及aPUNB算法性能更优。 展开更多
关键词 不确定数据 正例和未标记样本学习 最近邻算法
在线阅读 下载PDF
基于动态阈值和差异性检验的自训练算法
10
作者 吕佳 邱鸿波 肖锋 《智能系统学报》 CSCD 北大核心 2024年第4期839-852,共14页
针对自训练算法在迭代训练分类器的过程中存在难以有效选取高置信度样本以及误标记样本错误累积的问题,本文提出了基于动态阈值和差异性检验的自训练算法。引入样本的局部离群因子,据此剔除有标签样本中的离群点以及分类标注无标签样本... 针对自训练算法在迭代训练分类器的过程中存在难以有效选取高置信度样本以及误标记样本错误累积的问题,本文提出了基于动态阈值和差异性检验的自训练算法。引入样本的局部离群因子,据此剔除有标签样本中的离群点以及分类标注无标签样本,依据标注分批次处理无标签样本,以使模型更易选取到高置信度的无标签样本;根据新增伪标签样本的数量和对比隶属度的变化,设计一种动态隶属度阈值函数,提升高置信度样本的质量;定义密集距离度量样本间的差异性,分别计算伪标签样本与同类和不同类样本之间的密集距离之和,从而找出不确定度高的伪标签样本,并将此类样本并入下轮训练的无标签样本集中,缓解误标记样本错误累积的问题。实验结果表明,该算法在12个UCI基准数据集上均取得理想效果。 展开更多
关键词 自训练算法 标记样本 高置信度样本 动态阈值 差异性检验 局部离群因子 对比隶属度 密集距离
在线阅读 下载PDF
基于交叉熵的安全Tri-training算法 被引量:9
11
作者 张永 陈蓉蓉 张晶 《计算机研究与发展》 EI CSCD 北大核心 2021年第1期60-69,共10页
半监督学习方法通过少量标记数据和大量未标记数据来提升学习性能.Tri-training是一种经典的基于分歧的半监督学习方法,但在学习过程中可能产生标记噪声问题.为了减少Tri-training中的标记噪声对未标记数据的预测偏差,学习到更好的半监... 半监督学习方法通过少量标记数据和大量未标记数据来提升学习性能.Tri-training是一种经典的基于分歧的半监督学习方法,但在学习过程中可能产生标记噪声问题.为了减少Tri-training中的标记噪声对未标记数据的预测偏差,学习到更好的半监督分类模型,用交叉熵代替错误率以更好地反映模型预估结果和真实分布之间的差距,并结合凸优化方法来达到降低标记噪声的目的,保证模型效果.在此基础上,分别提出了一种基于交叉熵的Tri-training算法、一个安全的Tri-training算法,以及一种基于交叉熵的安全Tri-training算法.在UCI(University of California Irvine)机器学习库等基准数据集上验证了所提方法的有效性,并利用显著性检验从统计学的角度进一步验证了方法的性能.实验结果表明,提出的半监督学习方法在分类性能方面优于传统的Tri-training算法,其中基于交叉熵的安全Tri-training算法拥有更高的分类性能和泛化能力. 展开更多
关键词 半监督学习 Tri-training算法 交叉熵 凸优化 样本标记
在线阅读 下载PDF
一种快速SVR增量学习算法 被引量:2
12
作者 丰文安 王建东 陈海燕 《小型微型计算机系统》 CSCD 北大核心 2015年第1期162-166,共5页
为了缓解存储压力,保证预测精度,提高学习效率,提出一种新的基于样本相似性度量的SVR增量学习算法.算法根据新增样本的特点判断是否调整当前的预测模型,通过引入样本相似性度量来保证训练样本的质量,并结合样本标记的方法和误差驱动的... 为了缓解存储压力,保证预测精度,提高学习效率,提出一种新的基于样本相似性度量的SVR增量学习算法.算法根据新增样本的特点判断是否调整当前的预测模型,通过引入样本相似性度量来保证训练样本的质量,并结合样本标记的方法和误差驱动的原则实现对历史样本的删减.在标准数据集上的测试验证了算法的良好性能;在某机场噪声数据上的对比实验也表明,该算法的性能明显优于非增量和一般增量学习算法. 展开更多
关键词 相似性度量 SVR增量学习 样本标记 误差驱动 机场噪声
在线阅读 下载PDF
多层极限学习机在入侵检测中的应用 被引量:18
13
作者 康松林 刘乐 +1 位作者 刘楚楚 廖锓 《计算机应用》 CSCD 北大核心 2015年第9期2513-2518,共6页
针对神经网络在入侵检测应用存在的维度高、数据大、获取标记样本难、特征构造难、训练难等问题,提出了一种基于深度多层极限学习机(ML-ELM)的入侵检测方法。首先,采用多层网络结构和深度学习方法抽取检测样本最高层次的抽象特征,用奇... 针对神经网络在入侵检测应用存在的维度高、数据大、获取标记样本难、特征构造难、训练难等问题,提出了一种基于深度多层极限学习机(ML-ELM)的入侵检测方法。首先,采用多层网络结构和深度学习方法抽取检测样本最高层次的抽象特征,用奇异值对入侵检测数据进行特征表达;然后,利用极限学习机(ELM)建立入侵检测数据的分类模型;其次,利用逐层的无监督学习方法解决入侵检测获取标记样本难的问题;最后采用KDD99数据集对该方法的性能进行了验证。实验结果表明:多层极限学习机的方法提高了检测正确率,检测漏报率也低至0.48%,检测速度比其他深度模型的检测方法提高了6倍以上。同时在极少标记样本的情况下仍有85%以上的正确率。通过多层网络结构的构建提高了对U2L、R2L这两类攻击的检测率。该方法集成深度学习和无监督学习的优点,能对高维度,大数据的网络记录用较少的参数得到更好的表达,在入侵检测的检测速度以及特征表达两个方面都具有优势。 展开更多
关键词 入侵检测 高维度 大数据 标记样本 特征构造 训练 多层极限学习机
在线阅读 下载PDF
开放集识别研究综述 被引量:12
14
作者 高菲 杨柳 李晖 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第1期115-134,共20页
传统机器学习方法和深度神经网络在训练模型的过程中都需要大量标记样本作为支撑,然而标记大量样本是一个耗费巨大的过程,并且真实场景变化莫测,获得所有类别的标记样本是不现实的.因此,研究者开始突破标记样本的限制,提出一种更符合现... 传统机器学习方法和深度神经网络在训练模型的过程中都需要大量标记样本作为支撑,然而标记大量样本是一个耗费巨大的过程,并且真实场景变化莫测,获得所有类别的标记样本是不现实的.因此,研究者开始突破标记样本的限制,提出一种更符合现实的场景——开放集识别(Open Set Recognition,OSR).OSR要求建立的模型不仅能分类训练过程中出现的类别,还可以有效地处理未见过的类别.近年来,OSR迅速发展成为热点领域,大量的工作围绕OSR展开.对现有的OSR工作进行总结:首先,从定义上将OSR与其他相关工作进行区分;其次,按照模型建立、度量选择、增量特点对OSR算法进行总结,并介绍了OSR的两种理论;最后展望了OSR未来的发展方向. 展开更多
关键词 机器学习 深度神经网络 标记样本 开放集识别 度量选择 增量
在线阅读 下载PDF
结合半监督学习和LDA模型的文本分类方法 被引量:8
15
作者 韩栋 王春华 肖敏 《计算机工程与设计》 北大核心 2018年第10期3265-3271,共7页
针对样本集中具有较少标记样本情况下的文本分类问题,提出一种结合半监督学习(SSL)和隐含狄利克雷分配(LDA)主题模型的标记样本扩展方法(SSL-LDA),并整合朴素贝叶斯(NB)分类器构建一种文本分类方法。使用LDA主题模型生成主题分布,以表... 针对样本集中具有较少标记样本情况下的文本分类问题,提出一种结合半监督学习(SSL)和隐含狄利克雷分配(LDA)主题模型的标记样本扩展方法(SSL-LDA),并整合朴素贝叶斯(NB)分类器构建一种文本分类方法。使用LDA主题模型生成主题分布,以表示所有样本;根据训练集中已标记样本,通过一种简化粒子群优化(SPSO)算法获得SSL-LDA自训练模型的最优参数;基于SSL-LDA自训练模型对训练集中一些未标记样本进行标记,扩展训练集;基于扩展后的训练集,训练NB文本分类器。在3个数据集上的实验结果表明,该方法能够很好地应对标记样本较少的情况,获得了较高的分类精确度。 展开更多
关键词 文本分类 半监督学习 LDA主题模型 简化粒子群优化 标记样本扩展
在线阅读 下载PDF
基于相似度融合的主动支持向量机算法 被引量:2
16
作者 成鹏 汪西莉 《计算机工程》 CAS CSCD 北大核心 2011年第12期166-169,共4页
提出一种基于相似度融合的主动支持向量机算法,利用未标记样本和标记样本,结合支持向量机的方法实现主动学习。实验结果表明,该算法与普通主动学习的支持向量机相比,在保证分类器性能的情况下,可以减少标记样本的数目,抑制孤立样本对分... 提出一种基于相似度融合的主动支持向量机算法,利用未标记样本和标记样本,结合支持向量机的方法实现主动学习。实验结果表明,该算法与普通主动学习的支持向量机相比,在保证分类器性能的情况下,可以减少标记样本的数目,抑制孤立样本对分类器的影响;在相同标记样本数目的情况下,该算法具有较高的分类精度。 展开更多
关键词 主动学习 支持向量机 相似度融合 标记样本
在线阅读 下载PDF
基于S^3VM模型的高光谱遥感影像分类 被引量:1
17
作者 魏立飞 俸秀强 +1 位作者 李丹丹 牟紫薇 《测绘通报》 CSCD 北大核心 2017年第12期43-47,共5页
针对传统的高光谱遥感影像分类受限于训练样本的个数,难以取得较好分类结果的不足,提出了一种基于聚类核的半监督支持向量机(S3VM)模型的高光谱遥感影像分类方法。该算法在半监督支持向量机的体系上加入未标记样本来辅助构建核矩阵,从... 针对传统的高光谱遥感影像分类受限于训练样本的个数,难以取得较好分类结果的不足,提出了一种基于聚类核的半监督支持向量机(S3VM)模型的高光谱遥感影像分类方法。该算法在半监督支持向量机的体系上加入未标记样本来辅助构建核矩阵,从而获得更优异的分类器,在小样本的基础上提高分类精度。试验结果表明,本文方法的分类精度好于传统方法,并且稳定性良好。 展开更多
关键词 高光谱遥感影像 S3VM模型 标记样本 半监督分类
在线阅读 下载PDF
基于半监督学习的视频检索相关反馈算法
18
作者 邓丽 金立左 费敏锐 《计算机工程》 CAS CSCD 北大核心 2011年第22期281-283,共3页
小样本问题会制约贝叶斯相关反馈算法的学习能力。为此,提出一种基于半监督学习的视频检索贝叶斯相关反馈算法,其中一个分类器用于估计视频库中每一个镜头属于目标镜头的概率,另一个半监督学习分类器用于判断用户未标记镜头是否与目标相... 小样本问题会制约贝叶斯相关反馈算法的学习能力。为此,提出一种基于半监督学习的视频检索贝叶斯相关反馈算法,其中一个分类器用于估计视频库中每一个镜头属于目标镜头的概率,另一个半监督学习分类器用于判断用户未标记镜头是否与目标相关,由此扩大贝叶斯学习器的训练数据集,提高其分类能力。实验结果表明,该算法提高了贝叶斯算法的检索性能。 展开更多
关键词 视频检索 相关反馈 半监督学习 贝叶斯学习器 标记样本
在线阅读 下载PDF
基于SSk-means聚类指导的邮件SVM分类学习算法
19
作者 张曼 李弼程 +1 位作者 林琛 郭志刚 《计算机工程与设计》 CSCD 北大核心 2009年第2期385-387,391,共4页
邮件分类学习算法需要大量标注样本,人工标记工作费时费力。此外邮件内容因其表达方式上的特殊性,其特征空间一般是稀疏的,这种稀疏性会影响分类处理的效果。为了节省标记训练集的时间和精力,同时更好地处理稀疏的邮件数据,引入自适应... 邮件分类学习算法需要大量标注样本,人工标记工作费时费力。此外邮件内容因其表达方式上的特殊性,其特征空间一般是稀疏的,这种稀疏性会影响分类处理的效果。为了节省标记训练集的时间和精力,同时更好地处理稀疏的邮件数据,引入自适应选择最佳密度半径球形k-means聚类(SSk-means)算法,作为支持向量机(SVM)的前端处理,将训练集扩展后再送入SVM分类器。实验结果与性能比较表明,在训练集只有极少量标记邮件和一定量未标记邮件的情况下,该分类算法的性能较一般SVM有很大的提高。 展开更多
关键词 邮件分类算法 球形k-means算法 标记样本 自适应选择最佳密度半径 支持向量机
在线阅读 下载PDF
基于Bagging半监督深度森林回归的二噁英排放浓度软测量 被引量:6
20
作者 徐雯 汤健 +1 位作者 夏恒 乔俊飞 《仪器仪表学报》 EI CAS CSCD 北大核心 2022年第6期251-259,共9页
城市固废焚烧(MSWI)过程产生的副产品之一是被称为“世纪之毒”的二噁英(DXN),受限于其排放浓度检测技术难度以及时间与经济成本等因素,难以获得足量的有标记样本用于构建DXN排放浓度软测量模型。为有效利用现场控制系统采集的大量无标... 城市固废焚烧(MSWI)过程产生的副产品之一是被称为“世纪之毒”的二噁英(DXN),受限于其排放浓度检测技术难度以及时间与经济成本等因素,难以获得足量的有标记样本用于构建DXN排放浓度软测量模型。为有效利用现场控制系统采集的大量无标记样本,同时解决传统浅层学习模型泛化性能较差的问题,提出了基于Bagging半监督深度森林回归(DFR)的DXN排放浓度软测量方法。首先,基于Bagging机制以重采样原始标记数据集的方式获得多个训练子集,并构建具有差异性的多个随机森林(RF)模型;接着,将RF模型迭代更新、近邻集合选择和性能评估策略相结合用于获得高置信度伪标记样本;最后,基于伪标记和原始标记样本集构建DFR模型。采用北京某MSWI电厂的实际DXN检测数据验证了所提方法的有效性,结果表明,该方法的预测稳定性较好,其训练、验证和测试集的均方根误差分别为0.015 50、0.020 23和0.019 73。 展开更多
关键词 城市固废焚烧 二噁英软测量 Bagging半监督 标记样本 随机森林 深度森林回归
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部