碳排放连续在线监测法作为一种高效、可溯源的方法,在我国碳计量领域中逐渐应用。然而,由于烟囱管道的大直径、复杂烟气流场,以及流量计检修维护、粉尘堵塞导致的监测数据中断与异常,烟气流量的准确监测成为一大挑战。为此,提出一种融...碳排放连续在线监测法作为一种高效、可溯源的方法,在我国碳计量领域中逐渐应用。然而,由于烟囱管道的大直径、复杂烟气流场,以及流量计检修维护、粉尘堵塞导致的监测数据中断与异常,烟气流量的准确监测成为一大挑战。为此,提出一种融合变量投影重要性分析(variable importance in projection,VIP)、最大信息系数(maximal information coefficient,MIC)及后向搜索(sequential backward selection,SBS)算法的联合筛选方法,结合支持向量机(support vector machine,SVM)构建烟气流量软测量模型。基于某F级燃气-蒸汽联合循环发电机组,通过VIP值评估辅助变量显著性,并结合MIC和SBS算法,进行变量冗余消除与优化选择,从而提升模型的预测精度和泛化能力。实验结果显示:SVM的表现优于长短时间记忆网络模型,与反向传播神经网络相比具有较好的泛化能力;当辅助变量数量为12时,模型性能最佳,测试集的均方根误差和平均绝对百分比误差均较低,验证了变量筛选方法的有效性;在稳态和非稳态工况下,模型预测值的平均绝对百分比误差小于0.7%,并有一定的滤波作用。展开更多
针对生物发酵过程中生化变量难以在线检测的问题,提出一种基于变量投影重要性(Variable importance in the project,VIP)方法优化的神经网络逆系统软测量模型。根据逆系统理论建立发酵过程生化变量的软测量模型,由于发酵系统的复杂性,...针对生物发酵过程中生化变量难以在线检测的问题,提出一种基于变量投影重要性(Variable importance in the project,VIP)方法优化的神经网络逆系统软测量模型。根据逆系统理论建立发酵过程生化变量的软测量模型,由于发酵系统的复杂性,逆系统软测量模型具有不惟一性,且难以得到精确的表达式。文中提出采用VIP方法对逆系统软测量模型的辅助变量进行优选,以对主变量贡献率较高的变量作为软测量模型的辅助变量,离线采集发酵过程各变量值,训练神经网络近似逆系统软测量模型,得到优化的神经网络逆系统软测量模型,实现发酵过程中菌体浓度和基质浓度的在线估计。利用Pensim平台采集数据,对所提方法做了仿真实验,结果表明:经过优化辅助变量的神经网络逆系统软测量方法具有更高的估计精度和泛化能力。展开更多
为了实现利用较少的工程信息,快速准确的估计出工程项目的造价,提出了一种基于Adaboost-VIP的工程造价估计方法。首先采用变量投影重要性指标(variable importance in projection,VIP)法对影响工程造价的多个因素进行特征提取,然后利用...为了实现利用较少的工程信息,快速准确的估计出工程项目的造价,提出了一种基于Adaboost-VIP的工程造价估计方法。首先采用变量投影重要性指标(variable importance in projection,VIP)法对影响工程造价的多个因素进行特征提取,然后利用最小二乘支持向量机作为非线性逼近器,建立工程造价的估计模型。为了进一步提高模型的估计精度,将自适应提升算法(Adaboost)与VIP相结合,利用Adaboost将多个弱造价估计模型进行集成,得到强造价估计模型。同时将该方法应用到建筑案例中,结果表明:VIP方法能有效地对影响因素进行筛选,简化模型结构;Adaboost-VIP模型与单一的工程造价估计模型相比,具有更高的估计性能。展开更多
自变量筛选是定量光谱分析领域的研究热点,简便且高效的自变量筛选方法不但可以降低分析计算量,提高分析精度,同时还可以减轻对仪器光谱分辨能力的依赖,降低分析成本。波长筛选也是光谱法无创血液成分检测研究的重要环节。动态光谱理论...自变量筛选是定量光谱分析领域的研究热点,简便且高效的自变量筛选方法不但可以降低分析计算量,提高分析精度,同时还可以减轻对仪器光谱分辨能力的依赖,降低分析成本。波长筛选也是光谱法无创血液成分检测研究的重要环节。动态光谱理论为血液无创检测提供了极佳的思路,但长期局限于使用宽带光源和高分辨率的光谱仪器,分析中需要大量波长限制了动态光谱法的进一步发展。为了去除冗余信息,使检测走向低成本化和集成化,提出了基于变量投影重要性(variable importance in projection,VIP)分析的波长筛选方法。通过分析PLS模型中各维自变量对因变量的解释能力,从而剔除重要性较低的变量保留解释能力强的波长。以232例受试者的临床实验数据为基础,以血红蛋白含量为分析对象,经投影重要性分析后将波长数由586降至64,波长筛选后血红蛋白预测模型的测试集平均相对误差(MREP)为1.82%,使用了极少的波长便可得到满意的结果;结合Bootstrap方法对模型进行显著性检验后验证了波长变量的解释能力。首次指出了使用动态光谱法检测血红蛋白的敏感波长带。基于投影重要性分析的波长筛选迈出了动态光谱走向实用的重要一步,为实现低成本在线分析打下了基础,同时也为其他领域的光谱分析提供了重要的参考和新的思路。展开更多
为了快速、准确地测定冬小麦植株氮含量,利用2014?2015年的冬小麦冠层反射光谱数据构建了16种氮素或叶绿素敏感光谱指数,基于变量投影重要性(variable importance projection,VIP)-偏最小二乘(partial least squares,PLS)-赤池信息准则(...为了快速、准确地测定冬小麦植株氮含量,利用2014?2015年的冬小麦冠层反射光谱数据构建了16种氮素或叶绿素敏感光谱指数,基于变量投影重要性(variable importance projection,VIP)-偏最小二乘(partial least squares,PLS)-赤池信息准则(Akaike’s information criterion,AIC)整合模型构建了不同生育期植株氮含量最佳回归模型,并用2012?2013年挑旗期数据对模型进行了验证。结果表明:在AIC下,拔节期以4个植被指数为自变量的模型最优;挑旗期以5个植被指数为自变量的模型最优;开花期以4个植被指数为自变量的模型最优;灌浆期以6个植被指数为自变量的模型最优。4个生育期建模的决定系数(R2)和均方根误差(RMSE)分别为0.71、0.86、0.75、0.46和0.23%、0.13%、0.12%、0.15%,以挑旗期决定系数为最大。挑旗期验证集的R2和RMSE分别为0.81和0.41%,预测模型和验证模型均具有较高的估算精度和可靠性,研究结果为选择小麦合适的生育期估算小麦植株氮营养状况提供参考。展开更多
极限学习机理论(extreme learning machine,ELM)作为一种新的化学计量学方法,在近红外光谱定量分析中的应用研究,已引起学术界的高度重视。然而,由于光谱数据维数较高,建立ELM模型时需要大量的隐节点,导致隐含层输出矩阵维数高且存在高...极限学习机理论(extreme learning machine,ELM)作为一种新的化学计量学方法,在近红外光谱定量分析中的应用研究,已引起学术界的高度重视。然而,由于光谱数据维数较高,建立ELM模型时需要大量的隐节点,导致隐含层输出矩阵维数高且存在高度共线性,用现有的Moore-Penrose广义逆算法求取隐含层输出矩阵与待测性质间的回归模型往往会存在病态问题。基于ELM建立光谱波长变量与性质之间的回归模型,提出以ELM模型隐含层输出矩阵作为新的变量,采用作者最新提出的基于变量投影重要性的改进叠加PLS算法(stacked partial least squares regression algorithm based on variable importance in the projection,VIP-SPLS),建立新变量与待测性质间的回归模型。VIP-SPLS算法充分利用了每个隐节点的输出信息,能有效解决高维共线性问题,同时具有模型集成的优点,从而改进了ELM模型的性能。将提出的改进ELM算法(improved ELM,iELM)应用于标准近红外光谱数据集,结果表明iELM模型的精度相对于现有的PLS模型和ELM模型分别显著提升了29.06%和27.47%。展开更多
为了科学预测试验装备修理成本,提高维修经费决策质量,引入偏最小二乘回归分析(Partial Least Squares Regression,PLSR)对试验装备修理成本进行预测。针对试验装备修理成本小样本、贫数据、特征量相关性强的不利条件,构建预测模型;基...为了科学预测试验装备修理成本,提高维修经费决策质量,引入偏最小二乘回归分析(Partial Least Squares Regression,PLSR)对试验装备修理成本进行预测。针对试验装备修理成本小样本、贫数据、特征量相关性强的不利条件,构建预测模型;基于以往数次大修相关数据,预测试验专用装备使用期的某次大修成本。同时,为保持模型的稳健性,提高模型解释能力和预测精确度,尝试利用变量投影重要性分析对模型进行优化,取得了较好的效果。实例证明,该方法不仅能在多变量间存在严重多重相关性情况下建立模型,而且能够有效筛选与因变量关系不大的自变量,简化输入样本集。展开更多
文摘碳排放连续在线监测法作为一种高效、可溯源的方法,在我国碳计量领域中逐渐应用。然而,由于烟囱管道的大直径、复杂烟气流场,以及流量计检修维护、粉尘堵塞导致的监测数据中断与异常,烟气流量的准确监测成为一大挑战。为此,提出一种融合变量投影重要性分析(variable importance in projection,VIP)、最大信息系数(maximal information coefficient,MIC)及后向搜索(sequential backward selection,SBS)算法的联合筛选方法,结合支持向量机(support vector machine,SVM)构建烟气流量软测量模型。基于某F级燃气-蒸汽联合循环发电机组,通过VIP值评估辅助变量显著性,并结合MIC和SBS算法,进行变量冗余消除与优化选择,从而提升模型的预测精度和泛化能力。实验结果显示:SVM的表现优于长短时间记忆网络模型,与反向传播神经网络相比具有较好的泛化能力;当辅助变量数量为12时,模型性能最佳,测试集的均方根误差和平均绝对百分比误差均较低,验证了变量筛选方法的有效性;在稳态和非稳态工况下,模型预测值的平均绝对百分比误差小于0.7%,并有一定的滤波作用。
文摘针对生物发酵过程中生化变量难以在线检测的问题,提出一种基于变量投影重要性(Variable importance in the project,VIP)方法优化的神经网络逆系统软测量模型。根据逆系统理论建立发酵过程生化变量的软测量模型,由于发酵系统的复杂性,逆系统软测量模型具有不惟一性,且难以得到精确的表达式。文中提出采用VIP方法对逆系统软测量模型的辅助变量进行优选,以对主变量贡献率较高的变量作为软测量模型的辅助变量,离线采集发酵过程各变量值,训练神经网络近似逆系统软测量模型,得到优化的神经网络逆系统软测量模型,实现发酵过程中菌体浓度和基质浓度的在线估计。利用Pensim平台采集数据,对所提方法做了仿真实验,结果表明:经过优化辅助变量的神经网络逆系统软测量方法具有更高的估计精度和泛化能力。
文摘为了实现利用较少的工程信息,快速准确的估计出工程项目的造价,提出了一种基于Adaboost-VIP的工程造价估计方法。首先采用变量投影重要性指标(variable importance in projection,VIP)法对影响工程造价的多个因素进行特征提取,然后利用最小二乘支持向量机作为非线性逼近器,建立工程造价的估计模型。为了进一步提高模型的估计精度,将自适应提升算法(Adaboost)与VIP相结合,利用Adaboost将多个弱造价估计模型进行集成,得到强造价估计模型。同时将该方法应用到建筑案例中,结果表明:VIP方法能有效地对影响因素进行筛选,简化模型结构;Adaboost-VIP模型与单一的工程造价估计模型相比,具有更高的估计性能。
文摘自变量筛选是定量光谱分析领域的研究热点,简便且高效的自变量筛选方法不但可以降低分析计算量,提高分析精度,同时还可以减轻对仪器光谱分辨能力的依赖,降低分析成本。波长筛选也是光谱法无创血液成分检测研究的重要环节。动态光谱理论为血液无创检测提供了极佳的思路,但长期局限于使用宽带光源和高分辨率的光谱仪器,分析中需要大量波长限制了动态光谱法的进一步发展。为了去除冗余信息,使检测走向低成本化和集成化,提出了基于变量投影重要性(variable importance in projection,VIP)分析的波长筛选方法。通过分析PLS模型中各维自变量对因变量的解释能力,从而剔除重要性较低的变量保留解释能力强的波长。以232例受试者的临床实验数据为基础,以血红蛋白含量为分析对象,经投影重要性分析后将波长数由586降至64,波长筛选后血红蛋白预测模型的测试集平均相对误差(MREP)为1.82%,使用了极少的波长便可得到满意的结果;结合Bootstrap方法对模型进行显著性检验后验证了波长变量的解释能力。首次指出了使用动态光谱法检测血红蛋白的敏感波长带。基于投影重要性分析的波长筛选迈出了动态光谱走向实用的重要一步,为实现低成本在线分析打下了基础,同时也为其他领域的光谱分析提供了重要的参考和新的思路。
文摘为了快速、准确地测定冬小麦植株氮含量,利用2014?2015年的冬小麦冠层反射光谱数据构建了16种氮素或叶绿素敏感光谱指数,基于变量投影重要性(variable importance projection,VIP)-偏最小二乘(partial least squares,PLS)-赤池信息准则(Akaike’s information criterion,AIC)整合模型构建了不同生育期植株氮含量最佳回归模型,并用2012?2013年挑旗期数据对模型进行了验证。结果表明:在AIC下,拔节期以4个植被指数为自变量的模型最优;挑旗期以5个植被指数为自变量的模型最优;开花期以4个植被指数为自变量的模型最优;灌浆期以6个植被指数为自变量的模型最优。4个生育期建模的决定系数(R2)和均方根误差(RMSE)分别为0.71、0.86、0.75、0.46和0.23%、0.13%、0.12%、0.15%,以挑旗期决定系数为最大。挑旗期验证集的R2和RMSE分别为0.81和0.41%,预测模型和验证模型均具有较高的估算精度和可靠性,研究结果为选择小麦合适的生育期估算小麦植株氮营养状况提供参考。
文摘极限学习机理论(extreme learning machine,ELM)作为一种新的化学计量学方法,在近红外光谱定量分析中的应用研究,已引起学术界的高度重视。然而,由于光谱数据维数较高,建立ELM模型时需要大量的隐节点,导致隐含层输出矩阵维数高且存在高度共线性,用现有的Moore-Penrose广义逆算法求取隐含层输出矩阵与待测性质间的回归模型往往会存在病态问题。基于ELM建立光谱波长变量与性质之间的回归模型,提出以ELM模型隐含层输出矩阵作为新的变量,采用作者最新提出的基于变量投影重要性的改进叠加PLS算法(stacked partial least squares regression algorithm based on variable importance in the projection,VIP-SPLS),建立新变量与待测性质间的回归模型。VIP-SPLS算法充分利用了每个隐节点的输出信息,能有效解决高维共线性问题,同时具有模型集成的优点,从而改进了ELM模型的性能。将提出的改进ELM算法(improved ELM,iELM)应用于标准近红外光谱数据集,结果表明iELM模型的精度相对于现有的PLS模型和ELM模型分别显著提升了29.06%和27.47%。
文摘为了科学预测试验装备修理成本,提高维修经费决策质量,引入偏最小二乘回归分析(Partial Least Squares Regression,PLSR)对试验装备修理成本进行预测。针对试验装备修理成本小样本、贫数据、特征量相关性强的不利条件,构建预测模型;基于以往数次大修相关数据,预测试验专用装备使用期的某次大修成本。同时,为保持模型的稳健性,提高模型解释能力和预测精确度,尝试利用变量投影重要性分析对模型进行优化,取得了较好的效果。实例证明,该方法不仅能在多变量间存在严重多重相关性情况下建立模型,而且能够有效筛选与因变量关系不大的自变量,简化输入样本集。