为提高白酒固态发酵的副产物黄水中淀粉含量预测模型精度和建模效率。采用傅里叶变换近红外光谱仪采集黄水光谱信息,利用一阶导数对光谱进行预处理,并结合偏最小二乘回归(partial least squares regression,PLSR)建立黄水淀粉定量预测...为提高白酒固态发酵的副产物黄水中淀粉含量预测模型精度和建模效率。采用傅里叶变换近红外光谱仪采集黄水光谱信息,利用一阶导数对光谱进行预处理,并结合偏最小二乘回归(partial least squares regression,PLSR)建立黄水淀粉定量预测模型。使用决定系数(R^(2))和预测均方误差(root mean square error of prediction,RMSEP)评价模型性能。光谱中含有大量冗余信息,为有效提升黄水淀粉含量检测精度和优化模型效率,将不同特征提取方法的优点结合,发现使用竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)结合连续投影算法(successive projections algorithm,SPA)提取的光谱特征所建立的PLSR模型,相较于未使用特征提取或仅使用单一特征提取所建立的模型均有明显提升。在单一使用CARS时,模型的R^(2)为0.9654,RMSEP为0.2012%,而结合SPA后,R2为0.9738,RMSEP为0.1748%。此外,光谱维度从2203个减少到了126个,不仅提高了预测精度,也提升了建模效率。本研究提出的方法可作为黄水近红外定量模型优化的有效途径。展开更多
该文利用竞争性自适应加权算法(CARS)筛选重要的人血浆荧光光谱变量,并结合偏最小二乘法判别分析(PLS-LDA)建立了结直肠癌患者与非癌患者的分类模型,同时与全波长模型和基于平行因子分析(PARAFAC)建立的模型进行比较。从模型评价指标看,...该文利用竞争性自适应加权算法(CARS)筛选重要的人血浆荧光光谱变量,并结合偏最小二乘法判别分析(PLS-LDA)建立了结直肠癌患者与非癌患者的分类模型,同时与全波长模型和基于平行因子分析(PARAFAC)建立的模型进行比较。从模型评价指标看,CARS-PLS-LDA的性能显著优于全波长模型和基于PARAFAC的模型。高波未稀释组和低波稀释组的荧光光谱结合CARS-PLS-LDA分类模型的AUC(Area under curve)值均高于0.9,可有效地识别结直肠癌患者。结果表明,CARS变量筛选能够明显改善结直肠癌分类模型的性能,有助于后续癌症临床诊断工具的开发与研究。展开更多
选取典型芦苇湿地基于芦苇叶片实测高光谱数据和叶面积指数(Leaf Area Index,LAI),在原始光谱的基础上进行了平滑(R)、一阶微分(FD)、倒数(RT)、对数(LT)、倒数一阶微分(RTFD)、对数一阶微分(LTFD)等六种光谱变换,利用竞争性自适应重加...选取典型芦苇湿地基于芦苇叶片实测高光谱数据和叶面积指数(Leaf Area Index,LAI),在原始光谱的基础上进行了平滑(R)、一阶微分(FD)、倒数(RT)、对数(LT)、倒数一阶微分(RTFD)、对数一阶微分(LTFD)等六种光谱变换,利用竞争性自适应重加权算法(CARS)对不同变换下芦苇LAI特征光谱波段予以筛选,进而用筛选的特征波段采用逐波段组合法(BCI)构建芦苇LAI敏感光谱指数,利用随机森林(RF)、极端梯度提升(XGBoost)以及支持向量机(SVM)回归算法,构建芦苇LAI的高光谱估算模型。结果表明,采用CARS算法筛选不同变换光谱的特征波段构建模型,发现经过FD变换(R^(2)=0.417,RMSE=0.905)的模型效果最优。在CARS基础上使用筛选过后的特征波段构建植被指数进行建模比较,模型效果最好的是XGBoost(R^(2)=0.620,RMSE=0.826)。展开更多
文摘为提高白酒固态发酵的副产物黄水中淀粉含量预测模型精度和建模效率。采用傅里叶变换近红外光谱仪采集黄水光谱信息,利用一阶导数对光谱进行预处理,并结合偏最小二乘回归(partial least squares regression,PLSR)建立黄水淀粉定量预测模型。使用决定系数(R^(2))和预测均方误差(root mean square error of prediction,RMSEP)评价模型性能。光谱中含有大量冗余信息,为有效提升黄水淀粉含量检测精度和优化模型效率,将不同特征提取方法的优点结合,发现使用竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)结合连续投影算法(successive projections algorithm,SPA)提取的光谱特征所建立的PLSR模型,相较于未使用特征提取或仅使用单一特征提取所建立的模型均有明显提升。在单一使用CARS时,模型的R^(2)为0.9654,RMSEP为0.2012%,而结合SPA后,R2为0.9738,RMSEP为0.1748%。此外,光谱维度从2203个减少到了126个,不仅提高了预测精度,也提升了建模效率。本研究提出的方法可作为黄水近红外定量模型优化的有效途径。
文摘该文利用竞争性自适应加权算法(CARS)筛选重要的人血浆荧光光谱变量,并结合偏最小二乘法判别分析(PLS-LDA)建立了结直肠癌患者与非癌患者的分类模型,同时与全波长模型和基于平行因子分析(PARAFAC)建立的模型进行比较。从模型评价指标看,CARS-PLS-LDA的性能显著优于全波长模型和基于PARAFAC的模型。高波未稀释组和低波稀释组的荧光光谱结合CARS-PLS-LDA分类模型的AUC(Area under curve)值均高于0.9,可有效地识别结直肠癌患者。结果表明,CARS变量筛选能够明显改善结直肠癌分类模型的性能,有助于后续癌症临床诊断工具的开发与研究。
文摘选取典型芦苇湿地基于芦苇叶片实测高光谱数据和叶面积指数(Leaf Area Index,LAI),在原始光谱的基础上进行了平滑(R)、一阶微分(FD)、倒数(RT)、对数(LT)、倒数一阶微分(RTFD)、对数一阶微分(LTFD)等六种光谱变换,利用竞争性自适应重加权算法(CARS)对不同变换下芦苇LAI特征光谱波段予以筛选,进而用筛选的特征波段采用逐波段组合法(BCI)构建芦苇LAI敏感光谱指数,利用随机森林(RF)、极端梯度提升(XGBoost)以及支持向量机(SVM)回归算法,构建芦苇LAI的高光谱估算模型。结果表明,采用CARS算法筛选不同变换光谱的特征波段构建模型,发现经过FD变换(R^(2)=0.417,RMSE=0.905)的模型效果最优。在CARS基础上使用筛选过后的特征波段构建植被指数进行建模比较,模型效果最好的是XGBoost(R^(2)=0.620,RMSE=0.826)。