为增强近红外光谱模型通用性,解决直接正交信号校正算法在光谱处理过程中可能出现过拟合、模型不稳定的现象,提出一种将随机森林与直接正交信号校正算法相结合的模型传递方法(Random Forest-Direct Orthogonal Signal Correction,RF-DO...为增强近红外光谱模型通用性,解决直接正交信号校正算法在光谱处理过程中可能出现过拟合、模型不稳定的现象,提出一种将随机森林与直接正交信号校正算法相结合的模型传递方法(Random Forest-Direct Orthogonal Signal Correction,RF-DOSC)。该方法首先利用随机森林算法进行近红外光谱波长点筛选,然后采用直接正交信号校正方法进行光谱处理并建立回归方程,由PLS计算回归系数求得模型传递矩阵。实验使用三台光谱仪(S,S1,S2)测得的玉米近红外光谱数据集建立传递模型,数据集1(D1)水分、油分、蛋白质、淀粉成分预测标准偏差(SEP)分别为0.1267、0.0982、0.1569和0.4051,数据集2(D2)四种成分的SEP分别为0.1548、0.0819、0.1366和0.3836,均小于传统方法。实验结果表明本文所提模型传递方法能有效消除光谱噪声,减小主仪器和从仪器光谱之间的差异,提高模型的稳定性和准确性,实现不同仪器之间模型的共享。展开更多
文摘为增强近红外光谱模型通用性,解决直接正交信号校正算法在光谱处理过程中可能出现过拟合、模型不稳定的现象,提出一种将随机森林与直接正交信号校正算法相结合的模型传递方法(Random Forest-Direct Orthogonal Signal Correction,RF-DOSC)。该方法首先利用随机森林算法进行近红外光谱波长点筛选,然后采用直接正交信号校正方法进行光谱处理并建立回归方程,由PLS计算回归系数求得模型传递矩阵。实验使用三台光谱仪(S,S1,S2)测得的玉米近红外光谱数据集建立传递模型,数据集1(D1)水分、油分、蛋白质、淀粉成分预测标准偏差(SEP)分别为0.1267、0.0982、0.1569和0.4051,数据集2(D2)四种成分的SEP分别为0.1548、0.0819、0.1366和0.3836,均小于传统方法。实验结果表明本文所提模型传递方法能有效消除光谱噪声,减小主仪器和从仪器光谱之间的差异,提高模型的稳定性和准确性,实现不同仪器之间模型的共享。