期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于多目标PSO混合优化的虚拟样本生成 被引量:4
1
作者 王丹丹 汤健 +1 位作者 夏恒 乔俊飞 《自动化学报》 EI CAS CSCD 北大核心 2024年第4期790-811,共22页
受限于检测技术难度、高时间与经济成本等原因,难测参数的软测量模型建模样本存在数量少、分布稀疏与不平衡等问题,严重制约了数据驱动模型的泛化性能.针对以上问题,提出一种基于多目标粒子群优化(Multi-objective particle swarm optim... 受限于检测技术难度、高时间与经济成本等原因,难测参数的软测量模型建模样本存在数量少、分布稀疏与不平衡等问题,严重制约了数据驱动模型的泛化性能.针对以上问题,提出一种基于多目标粒子群优化(Multi-objective particle swarm optimization, MOPSO)混合优化的虚拟样本生成(Virtual sample generation, VSG)方法.首先,设计综合学习粒子群优化算法的种群表征机制,使其能够同时编码用于连续变量和离散变量;然后,定义具有多阶段多目标特性的综合学习粒子群优化算法适应度函数,使其能够在确保模型泛化性能的同时最小化虚拟样本数量;最后,提出面向虚拟样本生成的多目标混合优化任务以改进综合学习粒子群优化算法,使其能够适应虚拟样本优选过程的变维特性并提高收敛速度.同时,首次借鉴度量学习提出用于评价虚拟样本质量的综合评价指标和分布相似指标.利用基准数据集和真实工业数据集验证了所提方法的有效性和优越性. 展开更多
关键词 样本建模 虚拟样本生成 混合优化 多目标粒子群优化 分布相似度
在线阅读 下载PDF
面向复杂工业过程的虚拟样本生成综述 被引量:6
2
作者 汤健 崔璨麟 +1 位作者 夏恒 乔俊飞 《自动化学报》 EI CAS CSCD 北大核心 2024年第4期688-718,共31页
用于复杂工业过程难测运行指标和异常故障建模的样本具有量少稀缺、分布不平衡以及内涵机理知识匮乏等特性.虚拟样本生成(Virtual sample generation,VSG)作为扩充建模样本数量及其涵盖空间的技术,已成为解决上述问题的主要手段之一,但... 用于复杂工业过程难测运行指标和异常故障建模的样本具有量少稀缺、分布不平衡以及内涵机理知识匮乏等特性.虚拟样本生成(Virtual sample generation,VSG)作为扩充建模样本数量及其涵盖空间的技术,已成为解决上述问题的主要手段之一,但已有研究还存在缺乏理论支撑、分类准则与应用边界模糊等问题.本文在描述复杂工业过程难测运行指标和异常故障建模所存在问题的基础上,梳理虚拟样本定义及其内涵,给出面向工业过程回归与分类问题的VSG实现流程;接着,从样本覆盖区域、实现流程与推广应用等方向进行综述;然后,分析讨论VSG的下一步研究方向;最后,对全文进行总结并给出未来挑战. 展开更多
关键词 复杂工业过程 虚拟样本生成 数据驱动建模 样本覆盖区域
在线阅读 下载PDF
结合虚拟样本生成的油菜花期集成学习预测模型 被引量:3
3
作者 谢乾伟 薛丰昌 陈剑飞 《农业工程学报》 EI CAS CSCD 北大核心 2024年第19期159-167,共9页
针对统计和线性回归模型难以完全揭示花期影响因子与花期之间的复杂非线性关系及油菜花期样本稀少的问题,提出了一种结合虚拟样本生成的集成学习算法来实现油菜花期的预测。该研究利用浙江省衢州市龙游县1999—2023年油菜盛花期与1998—... 针对统计和线性回归模型难以完全揭示花期影响因子与花期之间的复杂非线性关系及油菜花期样本稀少的问题,提出了一种结合虚拟样本生成的集成学习算法来实现油菜花期的预测。该研究利用浙江省衢州市龙游县1999—2023年油菜盛花期与1998—2023年气象数据,通过基于高斯混合模型的虚拟样本生成(GMM-based virtual sample generation,GMM-VSG)算法与三次样条插值法(cubic spline interpolation)分别对原始样本进行扩充,采用8种机器学习算法建模并基于贝叶斯优化器进行超参数优化,最后通过Stacking集成学习方法,对8种算法进行不同的组合,建立了油菜花期预测模型。研究结果表明:相较于原始数据集,通过三次样条插值法与高斯混合模型生成的两个扩展数据集在各种机器学习算法中的性能显著提升,其中通过三次样条插值法生成的数据集表现最为优异。通过Stacking思想能提升模型的精度,其中以核岭回归(kernel ridge regression,KRR)、支持向量回归(support vector regression,SVR)、极端梯度提升树(extreme gradient boosting,XGBoost)这3种算法作为基模型,线性回归作为元模型的SRX_L模型表现最优,其平均绝对误差、均方根误差和决定系数,分别为0.1056 d、0.1227 d和0.9997。该研究结果可为油菜花期的准确预测提供有效方法。 展开更多
关键词 集成学习 虚拟样本生成 花期预测 油菜 STACKING
在线阅读 下载PDF
基于约简特征概率密度分布的虚拟样本生成
4
作者 汤健 崔璨麟 +1 位作者 王丹丹 乔俊飞 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第11期2165-2173,共9页
复杂工业过程的产品质量和环保指标等难测参数的建模数据具有样本小、分布稀疏等特性.对此,本文提出了基于约简特征概率密度分布(PDF)的虚拟样本生成(VSG)方法进行建模数据扩充.首先,采用主成分分析(PCA)对小样本数据进行特征约简,并对... 复杂工业过程的产品质量和环保指标等难测参数的建模数据具有样本小、分布稀疏等特性.对此,本文提出了基于约简特征概率密度分布(PDF)的虚拟样本生成(VSG)方法进行建模数据扩充.首先,采用主成分分析(PCA)对小样本数据进行特征约简,并对所得独立主成分进行核密度估计(KDE)以生成候选虚拟主成分,再正交采样后通过重构获得虚拟样本输入.接着,为均衡映射模型的精度与随机性,采用随机森林(RF)与随机权神经网络(RWNN)构建集成映射模型获得虚拟样本输出.最后,对影响虚拟样本“优劣”的主成分贡献率、KDE平滑指数、候选虚拟主成分、虚拟样本数量、映射模型学习参数及集成权重等参数,采用综合学习粒子群优化(CLPSO)算法进行优化以获得最优虚拟样本.通过基准数据集和城市固废焚烧过程二噁英(DXN)数据集验证了所提VSG方法的合理性及有效性. 展开更多
关键词 虚拟样本生成 主成分分析 概率密度分布 核密度估计 综合学习粒子群 混合建模样本
在线阅读 下载PDF
基于分位数回归CGAN的虚拟样本生成方法及其过程建模应用 被引量:4
5
作者 陈忠圣 朱梅玉 +2 位作者 贺彦林 徐圆 朱群雄 《化工学报》 EI CAS CSCD 北大核心 2021年第3期1529-1538,共10页
针对复杂工业过程因难以检测变量或因时间上和经济上成本因素导致的建模样本稀缺问题,提出了一种将分位数回归(quantile regression)嵌入到条件生成式对抗网络(conditional generative adversarial network,CGAN)的虚拟样本生成方法QRC... 针对复杂工业过程因难以检测变量或因时间上和经济上成本因素导致的建模样本稀缺问题,提出了一种将分位数回归(quantile regression)嵌入到条件生成式对抗网络(conditional generative adversarial network,CGAN)的虚拟样本生成方法QRCGAN。首先,在标准CGAN“生成器-判别器”两元对弈结构中嵌入回归器,使模型不仅具备标签样本生成能力,同时也具备处理回归预测问题的能力。其次,以分位数回归神经网络实现回归器,连同判别器和生成器进行同步对抗训练。当模型到达Nash平衡时,在分位数回归神经网络回归器的作用下,生成器能够产生落在一定置信区间的新样本。然后,利用Kullback-Leibler(KL)散度评估生成样本的质量。最后,通过标准函数数据和实际化工过程数据验证所提方法的有效性。 展开更多
关键词 虚拟样本生成 CGAN 分位数回归 数据稀缺 软测量 深度学习
在线阅读 下载PDF
基于虚拟样本生成技术与概率神经网络的接地网故障诊断 被引量:16
6
作者 王劭菁 马文嘉 +2 位作者 王丰华 崔律 周行星 《高压电器》 CAS CSCD 北大核心 2020年第6期309-316,共8页
接地网故障的有效诊断大都需要测量大量的现场数据,工作量大且测量结果易受现场干扰的影响。为在减少现场测试工作量的同时提高接地网故障诊断的准确性,文中提出了基于虚拟样本生成(virtual sample generation,VSG)技术与概率神经网络(p... 接地网故障的有效诊断大都需要测量大量的现场数据,工作量大且测量结果易受现场干扰的影响。为在减少现场测试工作量的同时提高接地网故障诊断的准确性,文中提出了基于虚拟样本生成(virtual sample generation,VSG)技术与概率神经网络(probabilistic neural network,PNN)的接地网故障诊断方法。首先针对接地网正常与典型故障下的磁场分布测量结果,采用组发现技术和超球特征方程相结合的非线性VSG构造了大量的接地网磁场分布结果,据此对PNN进行了训练及分类,实现了变电站接地网典型故障的有效诊断。对某35 kV变电站接地网的磁场分布测量结果与典型故障的诊断结果表明:所提出的非线性VSG技术更为完整地保留了接地网的磁场分布特征,具有较好的适应性与合理性,并有效提高了基于PNN的接地网故障识别率。研究结果可为接地网的故障诊断提供重要依据。 展开更多
关键词 接地网 磁场分布 概率神经网络 虚拟样本生成 故障诊断
在线阅读 下载PDF
基于虚拟样本生成技术的多组分机械信号建模 被引量:27
7
作者 汤健 乔俊飞 +2 位作者 柴天佑 刘卓 吴志伟 《自动化学报》 EI CSCD 北大核心 2018年第9期1569-1589,共21页
采用具有多组分、非平稳、非线性等特性的机械振动/振声信号构建数据驱动软测量模型,是目前工业界测量高能耗旋转机械设备内部难以检测过程参数的常用手段.针对机械信号产生机理的复杂性导致模型解释性弱,以及工业过程连续不间断运行和... 采用具有多组分、非平稳、非线性等特性的机械振动/振声信号构建数据驱动软测量模型,是目前工业界测量高能耗旋转机械设备内部难以检测过程参数的常用手段.针对机械信号产生机理的复杂性导致模型解释性弱,以及工业过程连续不间断运行和机械设备旋转封闭的特殊性导致获取完备训练样本的经济性差和周期性长等问题,本文提出一种基于虚拟样本生成(Virtual sample generation,VSG)技术的多组分机械信号建模方法.首先,将机械信号自适应分解为具有不同时间尺度的平稳子信号并变换为多尺度谱数据;接着,采用适合于小样本高维数据建模的改进选择性集成核偏最小二乘(Selective ensemble kernel partial least squares,SENKPLS)算法构建面向真实训练样本的基于可行性的规划(Feasibilitybased programming,FBP)模型,提出一种综合先验知识和FBP模型等手段面向高维谱数据的VSG技术,用以弥补真实训练样本的短缺问题;然后,基于互信息(Mutual information,MI)对由真实和虚拟训练样本组成的混合建模数据进行自适应特征选择;最后,基于约简的混合训练样本采用SENKPLS构建软测量模型.以近红外谱数据和磨矿过程实验球磨机的筒体振动/振声信号验证所提VSG技术和面向多组分机械信号建模方法的合理性和有效性. 展开更多
关键词 多组分机械信号 高维谱数据 难以检测过程参数 数据驱动建模 虚拟样本生成
在线阅读 下载PDF
基于改进大趋势扩散和隐含层插值的虚拟样本生成方法及应用 被引量:6
8
作者 乔俊飞 郭子豪 汤健 《化工学报》 EI CAS CSCD 北大核心 2020年第12期5681-5695,共15页
针对获取复杂工业过程的难以检测质量或环境污染指标数据的时间和经济成本高导致有标记建模样本稀缺的问题,提出了基于改进大趋势扩散和隐含层插值的虚拟样本生成(VSG)方法,并将其应用于城市固废焚烧过程的二英(DXN)排放预测。首先,采... 针对获取复杂工业过程的难以检测质量或环境污染指标数据的时间和经济成本高导致有标记建模样本稀缺的问题,提出了基于改进大趋势扩散和隐含层插值的虚拟样本生成(VSG)方法,并将其应用于城市固废焚烧过程的二英(DXN)排放预测。首先,采用基于子区域欧氏距离改进大趋势扩散(MTD)方法对真实样本输入/输出空间进行扩展;接着,采用等间隔插值方式生成虚拟样本输入,再结合映射模型和删减机制获得虚拟样本输出;然后,采用基于正则化改进的随机权神经网络隐含层插值依次得到虚拟样本输出和输入,再结合扩展空间对虚拟样本进行删减;最后,将上述具有互补性的虚拟样本与原始真实样本进行混合,实现建模数据容量扩充。通过基准数据集和工业过程DXN数据验证了所提方法的有效性和合理性。 展开更多
关键词 大趋势扩散 神经网络隐含层插值 虚拟样本生成 二英排放预测 废物处理 算法 模型
在线阅读 下载PDF
基于虚拟样本生成的铈镨/钕组分含量预测 被引量:1
9
作者 陆荣秀 赖路璐 +1 位作者 杨辉 朱建勇 《传感器与微系统》 CSCD 北大核心 2022年第7期152-156,160,共6页
针对稀土萃取生产现场采集到的有效建模样本数据少,易导致模型预测精度不高等小样本问题,提出采用随机配置网络(SCN)生成虚拟样本进行组分含量预测的方法。以真实样本确定的SCN模型为依据,根据隐含层与输出层、输入层与隐含层的之间的... 针对稀土萃取生产现场采集到的有效建模样本数据少,易导致模型预测精度不高等小样本问题,提出采用随机配置网络(SCN)生成虚拟样本进行组分含量预测的方法。以真实样本确定的SCN模型为依据,根据隐含层与输出层、输入层与隐含层的之间的映射关系,采用中点插值方法生成虚拟样本;然后混合原始真实样本与虚拟样本,建立基于SCN的铈镨/钕(CePr/Nd)组分含量预测模型。通过稀土萃取现场数据验证,结果表明:本文方法可以实现稀土萃取过程现场组分含量的快速、准确检测。 展开更多
关键词 随机配置网络 稀土萃取 组分含量 插值 虚拟样本生成
在线阅读 下载PDF
先验知识指导生成虚拟样本在指针式仪表识别上的应用 被引量:12
10
作者 马波 蔡伟东 郑凡帆 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2019年第9期1549-1557,共9页
为解决现有指针式仪表识别方法依赖于预处理的有效性且泛化能力不足的问题,提出一种基于深度卷积神经网络与虚拟样本结合的识别方法.该方法利用深度卷积神经网络自适应地提取仪表图像关键特征,避免无关信息的干扰;采用先验知识构建指针... 为解决现有指针式仪表识别方法依赖于预处理的有效性且泛化能力不足的问题,提出一种基于深度卷积神经网络与虚拟样本结合的识别方法.该方法利用深度卷积神经网络自适应地提取仪表图像关键特征,避免无关信息的干扰;采用先验知识构建指针式仪表虚拟样本生成模型,解决深度卷积神经网络面临的小样本难题.仿真数据、实验数据和现场实际应用结果表明,文中方法是可行有效的,且比传统的指针定位方法识别效果更好,尤其在更换仪表、局部信息缺失等复杂情况下具有很好的鲁棒性. 展开更多
关键词 指针式仪表 虚拟样本生成 样本 先验知识 卷积神经网络
在线阅读 下载PDF
基于虚拟样本优化选择的城市固废焚烧过程二噁英排放浓度预测 被引量:12
11
作者 汤健 王丹丹 +1 位作者 郭子豪 乔俊飞 《北京工业大学学报》 CAS CSCD 北大核心 2021年第5期431-443,共13页
城市固废焚烧(municipal solid waste incineration, MSWI)过程排放被称为"世纪之毒"的二噁英(dioxins, DXN)类化合物.工业现场多采用长周期、高成本的离线方式检测DXN排放浓度,这导致用于构建其预测模型的样本数量极为稀缺.... 城市固废焚烧(municipal solid waste incineration, MSWI)过程排放被称为"世纪之毒"的二噁英(dioxins, DXN)类化合物.工业现场多采用长周期、高成本的离线方式检测DXN排放浓度,这导致用于构建其预测模型的样本数量极为稀缺.针对上述问题,提出基于虚拟样本优化选择的MSWI过程DXN排放浓度预测建模策略和相应建模方法.首先,在对原始小样本数据进行离群点剔除、输入输出匹配等预处理的基础上,结合过程特性和机理知识进行特征选择以获得约简小样本.其次,基于领域专家知识和整体趋势扩散技术对约简小样本的输入/输出域进行扩展.然后,基于机理知识和插值算法生成虚拟样本输入,再基于约简小样本构建的映射模型获得虚拟样本输出,并结合扩展的输入/输出域对其进行删减以获得候选虚拟样本.接着,基于粒子群优化(particle swarm optimization, PSO)算法对候选虚拟样本进行优选.最后,采用优选虚拟样本与约简训练样本组成的混合样本构建预测模型.结合某焚烧厂的DXN数据验证了所提方法的有效性. 展开更多
关键词 城市固废焚烧(MSWI) 二噁英(DXN) 样本 虚拟样本生成 虚拟样本选择 粒子群优化(PSO)
在线阅读 下载PDF
融合多模态生成和情景训练的环境无关手势识别
12
作者 程宇 周瑞 +3 位作者 张子若 罗悦 张宏旺 王佳昊 《小型微型计算机系统》 CSCD 北大核心 2024年第2期265-270,共6页
无线通信和感知技术的发展促进了WiFi感知的产生与发展.依据人体及其行为对WiFi信号传播的影响,通过模式匹配可以实现基于WiFi的手势识别、活动识别、定位等感知任务.但是WiFi信号对环境具有较大依赖性,目标人员或周围环境的变化会导致... 无线通信和感知技术的发展促进了WiFi感知的产生与发展.依据人体及其行为对WiFi信号传播的影响,通过模式匹配可以实现基于WiFi的手势识别、活动识别、定位等感知任务.但是WiFi信号对环境具有较大依赖性,目标人员或周围环境的变化会导致已经建立的感知模型失效.为了解决这个问题,现有方案通常采用半监督或无监督域适应方法.但在实际应用中,无法预先获得新环境中的数据.因此,需要一种无需新环境数据,即可自动泛化到新环境的方法.为了实现这个目标,本文提出一种基于多模态样本生成和情景训练的环境无关手势识别方法.该方法采用若干源域的数据建立手势识别模型,能够在目标域没有任何数据的情况下,泛化到目标域中.实验结果表明,该方法在目标域无数据的情况下,对新用户和新环境的手势识别正确率均超过80%,高于业界现有水平. 展开更多
关键词 WiFi感知 手势识别 环境无关 虚拟样本生成 情景训练
在线阅读 下载PDF
基于VSG-CNN的往复式压缩机故障诊断方法
13
作者 李远 胡明辉 马波 《现代制造工程》 北大核心 2025年第10期138-147,共10页
针对现有往复式压缩机故障诊断方法在缺乏故障样本时难以构建高精度诊断模型的问题,提出一种结合故障机理驱动的虚拟样本生成(Virtual Sample Generation,VSG)和卷积神经网络(Convolutional Neural Networks,CNN)的往复式压缩机故障诊... 针对现有往复式压缩机故障诊断方法在缺乏故障样本时难以构建高精度诊断模型的问题,提出一种结合故障机理驱动的虚拟样本生成(Virtual Sample Generation,VSG)和卷积神经网络(Convolutional Neural Networks,CNN)的往复式压缩机故障诊断方法。首先依据往复式压缩机故障机理与源域数据集对故障共性特征参数进行建模;然后通过共性特征参数和目标域正常角域数据计算得到故障特征,在此基础上将故障特征与目标域正常角域数据结合,生成个性化故障虚拟样本;最后根据目标域正常样本和故障虚拟样本,构建无需目标域往复式压缩机真实故障样本的故障诊断模型。通过往复式压缩机故障模拟实验台数据和某石化企业生产现场数据验证提出方法。研究结果显示,提出方法平均准确率达到88.92%,相较于对比方法TCA-BPNN、LMD-SDAE、WKCL、RSTRN分别提升49.19%、22.09%、18.99%、14.59%,证明提出方法在性能上有明显的提升。 展开更多
关键词 往复式压缩机 故障诊断 虚拟样本生成 故障机理 卷积神经网络 角域分析
在线阅读 下载PDF
IsomapVSG-LIME:一种新的模型无关解释方法 被引量:2
14
作者 向许 于洪 +1 位作者 张晓霞 王国胤 《智能系统学报》 CSCD 北大核心 2023年第4期841-848,共8页
为了解决局部可解释模型无关的解释(local interpretable model-agnostic explanations,LIME)随机扰动采样方法导致产生的解释缺乏局部忠实性和稳定性的问题,本文提出了一种新的模型无关解释方法IsomapVSG-LIME。该方法使用基于流形学... 为了解决局部可解释模型无关的解释(local interpretable model-agnostic explanations,LIME)随机扰动采样方法导致产生的解释缺乏局部忠实性和稳定性的问题,本文提出了一种新的模型无关解释方法IsomapVSG-LIME。该方法使用基于流形学习的等距映射虚拟样本生成(isometric mapping virtual sample generation,IsomapVSG)方法代替LIME的随机扰动采样方法来生成样本,并使用凝聚层次聚类方法从虚拟样本中选择具有代表性的样本用以训练解释模型;本文还提出了一种新的解释稳定性评价指标—特征序列稳定性指数(features sequence stability index,FSSI),解决了以往评价指标忽略特征的序关系和解释翻转的问题。实验结果表明,本文提出的方法在稳定性和局部忠实性上均优于现有的最新模型。 展开更多
关键词 局部可解释模型无关的解释 机器学习 等距映射虚拟样本生成 凝聚层次聚类 稳定性 局部忠实性 随机扰动采样 特征序列稳定性指数
在线阅读 下载PDF
基于主动学习机制GAN的MSWI过程二噁英排放风险预警模型 被引量:1
15
作者 汤健 崔璨麟 +2 位作者 夏恒 王丹丹 乔俊飞 《北京工业大学学报》 CAS CSCD 北大核心 2023年第5期507-522,共16页
针对构建城市固废焚烧(municipal solid waste incineration,MSWI)过程剧毒污染物二噁英(dioxin,DXN)排放风险预警模型的样本极为稀少的问题,提出一种基于主动学习机制生成对抗网络(generative adversarial network,GAN)的DXN排放风险... 针对构建城市固废焚烧(municipal solid waste incineration,MSWI)过程剧毒污染物二噁英(dioxin,DXN)排放风险预警模型的样本极为稀少的问题,提出一种基于主动学习机制生成对抗网络(generative adversarial network,GAN)的DXN排放风险预警建模方法.首先,以DXN风险等级作为条件信息使得GAN生成候选虚拟样本;然后,利用基于最大均值差异和多视角可视化分布信息的主动学习机制进行虚拟样本的初筛和评估,以获得期望虚拟样本;最后,基于混合样本构建DXN排放风险预警模型.通过基准数据集和MSWI过程数据集验证了所提方法的有效性.基于主动学习机制GAN的DXN排放风险预警建模方法可以有效解决样本稀少的问题,提高模型精度. 展开更多
关键词 城市固废焚烧(municipal solid waste incineration MSWI) 二噁英(dioxin DXN)排放风险预警 生成对抗网络(generative adversarial network GAN) 虚拟样本生成(virtual sample generation VSG) 最大均值差异 主动学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部