A novel OSC-KPCA based pattern analysis method was proposed to improve the clustering and predictive performance of the metabolomics.The strong nonlinear pattern recognition power and the predominance in dealing with ...A novel OSC-KPCA based pattern analysis method was proposed to improve the clustering and predictive performance of the metabolomics.The strong nonlinear pattern recognition power and the predominance in dealing with small high-dimensional data of the Kernel Principal Component Analysis(KPCA)were used here to analyze four genotypes of the important model plant—Arabidopsis thaliana.In order to improve the performance of PR(Pattern Recognition),the Orthogonal Signal Correction(OSC)method was used to filter the original data firstly to eliminate the interference of noise.The PR results showed that the OSC-KPCA based PR method could reveal the underlying relationship between genotypes and metabolites successfully.The paternal genotypes(Co10 and C24)and the two F1 progeny C24×Co10 and Co10×C24 could be 100% correctly discriminated.More importantly the predictability was also as high as 100%.展开更多
介绍正交信号修正法的基本思想并详细推导该算法的实现步骤,将一种改进后的正交信号修正法(orthogonal signal correction,OSC)与偏最小二乘法(partial least square method,PLS)相结合,对原始数据通过OSC消除正交分量,利用PLS建立中长...介绍正交信号修正法的基本思想并详细推导该算法的实现步骤,将一种改进后的正交信号修正法(orthogonal signal correction,OSC)与偏最小二乘法(partial least square method,PLS)相结合,对原始数据通过OSC消除正交分量,利用PLS建立中长期负荷预测模型。该方法能有效地去除自变量系统中与因变量无关的正交数据信息,增强自变量、因变量之间的相关性,在有限的成分中提高成分解释能力。通过算例将PLS与OSC-PLS进行比较分析,结果表明,运用OSC-PLS进行中长期负荷预测,尽管预测模型提取的成分个数变少了,但模型成分的解释性却大幅度增强,预测精度明显提高,具有较强的实用性。展开更多
生鲜牛肉的含水率对其牛肉的加工、储藏、贸易与食用质量有重要影响,为了提高牛肉的经济价值和食用品质,需要研究牛肉含水率的无损检测技术。以取自不同超市的内蒙小黄牛和鲁西黄牛背最长肌为研究对象,有效样本86个,其中,75%的样本作为...生鲜牛肉的含水率对其牛肉的加工、储藏、贸易与食用质量有重要影响,为了提高牛肉的经济价值和食用品质,需要研究牛肉含水率的无损检测技术。以取自不同超市的内蒙小黄牛和鲁西黄牛背最长肌为研究对象,有效样本86个,其中,75%的样本作为校正集,25%的样本作为验证集。采集牛肉新鲜切口处400~1170nm波长范围内的漫反射光谱,用国标方法测定牛肉含水率。经过多元散射校正(multiplicative scatter correction,MSC)、变量标准化(standard normalized variate,SNV)和直接正交信号校正(direct orthogonal signal correction,DOSC)等方法预处理,在400~1170nm范围内分别建立多元线性回归(multiple linear regression,MLR)模型、主成分回归(principal component Regression,PCR)模型和偏最小二乘回归(partial least squares regression,PLSR)模型。结果表明使用MSC预处理方法建立的模型预测效果最佳,其中用PLSR建模结果最好,校正集的相关系数和校正标准差分别是0.92和0.0069,验证集的相关系数和验证标准差分别是0.92和0.0047,外部验证的相关系数和验证标准差分别是0.85和0.0054。结果表明,可见/近红外光谱结合MSC预处理方法建立的PLSR模型,可以对牛肉含水率进行准确的快速无损评价,为生鲜牛肉含水率快速无损检测技术的应用提供理论参考。展开更多
基于模型传递的原理,建立了一种可对存在背景干扰,谱峰严重混叠的遥感傅里叶变换红外(re-motesensing Fouriertrans for minfrared:RS-FTIR)谱图进行解析的方法。分别用4组分气体混合物的EPA红外标准谱图和RS-FTIR谱图,建立校正和预测模...基于模型传递的原理,建立了一种可对存在背景干扰,谱峰严重混叠的遥感傅里叶变换红外(re-motesensing Fouriertrans for minfrared:RS-FTIR)谱图进行解析的方法。分别用4组分气体混合物的EPA红外标准谱图和RS-FTIR谱图,建立校正和预测模型,经过正交信号校正(OSC)处理后,用EPA红外谱图数据所建立的校正模型,对RS-FTIR谱图数据进行预测,得到的丙酮、甲醇、苯和三氯甲烷的均方根预测误差(RMSEP)分别为:0.0085,0.0180,0.0640,0.0028。未经OSC处理时的RMSEP依次是0.0856,0.0479,1.0653,0.0142。经优化,支集选择的方法为Kennard-Stone法,OSC在实现过程中循环次数为3时得到的预测结果最好。研究结果表明,该方法能够克服背景和校正模型给RS-FTIR监测大气污染物带来的制约。展开更多
文摘A novel OSC-KPCA based pattern analysis method was proposed to improve the clustering and predictive performance of the metabolomics.The strong nonlinear pattern recognition power and the predominance in dealing with small high-dimensional data of the Kernel Principal Component Analysis(KPCA)were used here to analyze four genotypes of the important model plant—Arabidopsis thaliana.In order to improve the performance of PR(Pattern Recognition),the Orthogonal Signal Correction(OSC)method was used to filter the original data firstly to eliminate the interference of noise.The PR results showed that the OSC-KPCA based PR method could reveal the underlying relationship between genotypes and metabolites successfully.The paternal genotypes(Co10 and C24)and the two F1 progeny C24×Co10 and Co10×C24 could be 100% correctly discriminated.More importantly the predictability was also as high as 100%.
文摘针对选择性催化还原(selective catalytic reduction,SCR)脱硝系统反应过程复杂,在工况变化时存在非线性、大惯性和强干扰性的特点,难以建立准确的出口NO_x排放浓度模型。利用核偏最小二乘法具有解决变量众多且存在严重相关的非线性工业过程建模的优点,首先引入正交信号校正(orthogonal signal correction,OSC)对相空间重构后的样本进行预处理,剔除与建模无关的信息;然后利用组合核偏最小二乘法(combination kernel partial least squares,CKPLS)具有较好的学习能力和泛化能力的特点,提出OSC-CKPLS方法提高模型性能;最后采用滑动窗口更新,并反馈补偿修正模型。对2个标准数据集进行仿真,分别验证CKPLS、OSC和OSC-CKPLS能够提高模型性能;并对SCR脱硝系统现场数据验证了本文方法的有效性。
文摘介绍正交信号修正法的基本思想并详细推导该算法的实现步骤,将一种改进后的正交信号修正法(orthogonal signal correction,OSC)与偏最小二乘法(partial least square method,PLS)相结合,对原始数据通过OSC消除正交分量,利用PLS建立中长期负荷预测模型。该方法能有效地去除自变量系统中与因变量无关的正交数据信息,增强自变量、因变量之间的相关性,在有限的成分中提高成分解释能力。通过算例将PLS与OSC-PLS进行比较分析,结果表明,运用OSC-PLS进行中长期负荷预测,尽管预测模型提取的成分个数变少了,但模型成分的解释性却大幅度增强,预测精度明显提高,具有较强的实用性。
文摘生鲜牛肉的含水率对其牛肉的加工、储藏、贸易与食用质量有重要影响,为了提高牛肉的经济价值和食用品质,需要研究牛肉含水率的无损检测技术。以取自不同超市的内蒙小黄牛和鲁西黄牛背最长肌为研究对象,有效样本86个,其中,75%的样本作为校正集,25%的样本作为验证集。采集牛肉新鲜切口处400~1170nm波长范围内的漫反射光谱,用国标方法测定牛肉含水率。经过多元散射校正(multiplicative scatter correction,MSC)、变量标准化(standard normalized variate,SNV)和直接正交信号校正(direct orthogonal signal correction,DOSC)等方法预处理,在400~1170nm范围内分别建立多元线性回归(multiple linear regression,MLR)模型、主成分回归(principal component Regression,PCR)模型和偏最小二乘回归(partial least squares regression,PLSR)模型。结果表明使用MSC预处理方法建立的模型预测效果最佳,其中用PLSR建模结果最好,校正集的相关系数和校正标准差分别是0.92和0.0069,验证集的相关系数和验证标准差分别是0.92和0.0047,外部验证的相关系数和验证标准差分别是0.85和0.0054。结果表明,可见/近红外光谱结合MSC预处理方法建立的PLSR模型,可以对牛肉含水率进行准确的快速无损评价,为生鲜牛肉含水率快速无损检测技术的应用提供理论参考。
文摘基于模型传递的原理,建立了一种可对存在背景干扰,谱峰严重混叠的遥感傅里叶变换红外(re-motesensing Fouriertrans for minfrared:RS-FTIR)谱图进行解析的方法。分别用4组分气体混合物的EPA红外标准谱图和RS-FTIR谱图,建立校正和预测模型,经过正交信号校正(OSC)处理后,用EPA红外谱图数据所建立的校正模型,对RS-FTIR谱图数据进行预测,得到的丙酮、甲醇、苯和三氯甲烷的均方根预测误差(RMSEP)分别为:0.0085,0.0180,0.0640,0.0028。未经OSC处理时的RMSEP依次是0.0856,0.0479,1.0653,0.0142。经优化,支集选择的方法为Kennard-Stone法,OSC在实现过程中循环次数为3时得到的预测结果最好。研究结果表明,该方法能够克服背景和校正模型给RS-FTIR监测大气污染物带来的制约。