降维对于数据的可视化和预处理具有重要意义,主成分分析作为最常用的无监督降维算法之一,在实际应用中面临着对噪声和离群点敏感的问题。为了解决这个问题,研究者们提出了多种鲁棒主成分分析算法,通过减小整体样本的重构误差来减小离群...降维对于数据的可视化和预处理具有重要意义,主成分分析作为最常用的无监督降维算法之一,在实际应用中面临着对噪声和离群点敏感的问题。为了解决这个问题,研究者们提出了多种鲁棒主成分分析算法,通过减小整体样本的重构误差来减小离群点的影响。然而,这些算法忽略了数据的固有局部结构,导致数据的本质结构信息丢失,从而影响了对噪声和离群点的准确辨识和移除,进而影响了后续算法的性能。因此,该文提出了基于Soft均值滤波的鲁棒主成分分析(Robust Principal Component Analysis Based on Soft Mean Filtering,RPCA-SMF)算法。RPCA-SMF采用Soft均值滤波的思想,通过两步走的形式,不仅在模型学习前对噪声处理,同时在模型学习后也引入了噪声处理机制。具体而言,RPCA-SMF算法首先引入了均值滤波的相关思想,通过对比样本与其局部近邻这两者和局部均值的偏差对样本进行Soft加权,从而对噪声进行判定。随后,通过第一步获取的关于噪声的“判别知识”处理噪声信息。由于均值滤波能有效保留数据的整体轮廓信息,因此对于被识别为噪声的样本,RPCA-SMF算法强调保留其低频整体轮廓信息,而非高频的噪声信息。这样能够有效地保留数据中的有用信息,提高对数据整体结构特征的保留能力,使得算法具有较强的鲁棒性和较好的泛化性。展开更多
为明确陈酿时间对白兰地香气的影响,该研究采用顶空固相微萃取结合全二维气相色谱质谱联用(headspace solid-phase microextraction with comprehensive two-dimensional gas chromatography/time-of-flight mass spectrometry,HS-SPME-...为明确陈酿时间对白兰地香气的影响,该研究采用顶空固相微萃取结合全二维气相色谱质谱联用(headspace solid-phase microextraction with comprehensive two-dimensional gas chromatography/time-of-flight mass spectrometry,HS-SPME-GC×GC-TOFMS)技术对9种不同陈酿时间白兰地原酒的挥发性成分进行测定分析。结果显示,在所有样品中共定性得到495种挥发性化合物,陈酿0年样品中种类最少(275种),陈酿18年最多(318种),挥发性化合物种类表现出随着陈酿时间延长而增多的趋势。不同类别香气化合物总含量随陈酿时间的延长不尽相同,其中醇类、醛类、萜烯类、含硫化合物含量随陈酿时间的延长逐渐下降,酸类化合物含量逐渐上升。主成分分析结果表明,不同年份酒样随酒龄呈现趋势性变化,而陈酿初期(0~1年)香气变化较大。基于单因素方差分析,共筛出268个差异代谢物,其中呈现果香、香料、烘培等香气特征的化合物在陈年酒中更为突出,而呈现花香、植物香气特征的化合物含量普遍随贮存时间延长而不断降低。该研究较为系统的分析了陈酿时间对白兰地中香气物质组分的影响,研究不仅可以丰富白兰地风味化学的理论体系,同时也为白兰地生产中风味调控提供数据基础与理论依据。展开更多
为提高瓦斯涌出量预测精度,降低煤矿回采工作面瓦斯涌出超限事故的风险,针对瓦斯涌影响因素众多、难以预测等问题,采用灰狼优化算法(Grey Wolf Optimization,GWO)双向长短期记忆神经网络(Bi-directional Long Short-Term Memory,BiLSTM...为提高瓦斯涌出量预测精度,降低煤矿回采工作面瓦斯涌出超限事故的风险,针对瓦斯涌影响因素众多、难以预测等问题,采用灰狼优化算法(Grey Wolf Optimization,GWO)双向长短期记忆神经网络(Bi-directional Long Short-Term Memory,BiLSTM)的组合模型预测瓦斯涌出量。首先,运用主成分分析法(Principal Components Analysis,PCA)处理瓦斯涌出影响因素,降低数据维度,以减少模型计算时的负担;其次,利用GWO优化BiLSTM模型的学习率(best_lr)、隐藏层层数(best_hd)以及正则化系数(best_l2),可有效避免局部最优解问题,并采用决定系数(R-Square,R^(2))、均方根误差(Root Mean Square Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)对所建模型预测的结果进行综合评价分析;最后,将该模型应用于内蒙古自治区某矿回采工作面预测瓦斯涌出量。结果显示:PCA GWO BiLSTM组合模型相比于长短期记忆神经网络(Long Short-Term Memory,LSTM)和双向长短期记忆神经网络对应的单一模型,其MAE分别降低20.81%、30.17%,RMSE分别降低0.063、0.142,R^(2)则分别提高了0.023、0.075,表明该模型在复杂因素条件下具有更高的精准度、泛化性和鲁棒性。展开更多
文摘降维对于数据的可视化和预处理具有重要意义,主成分分析作为最常用的无监督降维算法之一,在实际应用中面临着对噪声和离群点敏感的问题。为了解决这个问题,研究者们提出了多种鲁棒主成分分析算法,通过减小整体样本的重构误差来减小离群点的影响。然而,这些算法忽略了数据的固有局部结构,导致数据的本质结构信息丢失,从而影响了对噪声和离群点的准确辨识和移除,进而影响了后续算法的性能。因此,该文提出了基于Soft均值滤波的鲁棒主成分分析(Robust Principal Component Analysis Based on Soft Mean Filtering,RPCA-SMF)算法。RPCA-SMF采用Soft均值滤波的思想,通过两步走的形式,不仅在模型学习前对噪声处理,同时在模型学习后也引入了噪声处理机制。具体而言,RPCA-SMF算法首先引入了均值滤波的相关思想,通过对比样本与其局部近邻这两者和局部均值的偏差对样本进行Soft加权,从而对噪声进行判定。随后,通过第一步获取的关于噪声的“判别知识”处理噪声信息。由于均值滤波能有效保留数据的整体轮廓信息,因此对于被识别为噪声的样本,RPCA-SMF算法强调保留其低频整体轮廓信息,而非高频的噪声信息。这样能够有效地保留数据中的有用信息,提高对数据整体结构特征的保留能力,使得算法具有较强的鲁棒性和较好的泛化性。
文摘为明确陈酿时间对白兰地香气的影响,该研究采用顶空固相微萃取结合全二维气相色谱质谱联用(headspace solid-phase microextraction with comprehensive two-dimensional gas chromatography/time-of-flight mass spectrometry,HS-SPME-GC×GC-TOFMS)技术对9种不同陈酿时间白兰地原酒的挥发性成分进行测定分析。结果显示,在所有样品中共定性得到495种挥发性化合物,陈酿0年样品中种类最少(275种),陈酿18年最多(318种),挥发性化合物种类表现出随着陈酿时间延长而增多的趋势。不同类别香气化合物总含量随陈酿时间的延长不尽相同,其中醇类、醛类、萜烯类、含硫化合物含量随陈酿时间的延长逐渐下降,酸类化合物含量逐渐上升。主成分分析结果表明,不同年份酒样随酒龄呈现趋势性变化,而陈酿初期(0~1年)香气变化较大。基于单因素方差分析,共筛出268个差异代谢物,其中呈现果香、香料、烘培等香气特征的化合物在陈年酒中更为突出,而呈现花香、植物香气特征的化合物含量普遍随贮存时间延长而不断降低。该研究较为系统的分析了陈酿时间对白兰地中香气物质组分的影响,研究不仅可以丰富白兰地风味化学的理论体系,同时也为白兰地生产中风味调控提供数据基础与理论依据。