【目的】设计一种基于FIML和DAE的填充缺失值的方法,即聚类全信息选择性过滤编码器数据填补算法(clustering-based comprehensive information selective filtering encoder data imputation algorithm,CFSM-DAE),为水稻种质资源缺失数...【目的】设计一种基于FIML和DAE的填充缺失值的方法,即聚类全信息选择性过滤编码器数据填补算法(clustering-based comprehensive information selective filtering encoder data imputation algorithm,CFSM-DAE),为水稻种质资源缺失数据进行填充。【方法】利用聚类辅助避免数据异常值对算法的影响,采用选择性过滤层用于识别高质量估算、减少低质量估算的影响。传统的DAE框架通常没有选择性过滤层,所有的估算值都被视为同等重要,无法区分高质量和低质量的估算值。为了进一步提高估算精度,研究采用集成框架将全信息最大似然性(FIML)与多对抗性自编码器(DAE)结合的方法(CFSM-DAE),在选择性过滤层基础上,自适应填充,即当估算值不符合设定阈值时,采用FIML填充策略以确保填充结果的稳定性和精确度,从而进一步来提高整体估算精度。在3种缺失数据机制(随机缺失(MAR)、完全随机缺失(MCAR)和非随机缺失(MNAR))下对模拟数据和实际水稻种质资源数据集进行研究,将CFSM-DAE方法与多种常用填充算法比较(全信息最大似然性(FIML)、对抗自编码器(DAE)、K近邻填充(KNN)、随机森林(RF)、链式方程多重插补(MICE))。【结果】CFSM-DAE在模拟数据上的表现为S_(RME)=0.0676,E_(MA)=0.0093,R^(2)=0.9958;在水稻种质资源数据上的表现为S_(RME)=0.0395,E_(MA)=0.0078,R^(2)=0.8913。相比之下,其他算法如DAE在这两类数据下的SRME表现分别为0.8896和0.7707;KNN算法的EMA表现分别为0.1183和0.1305;FIML算法的R2表现为0.3382和0.7321。因此,CFSM-DAE在多个评价指标上相较于其他算法都表现出了一定的提升,CFSM-DAE在模拟数据和水稻种质资源数据的表现优于其他算法。【结论】CFSM-DAE方法通过结合聚类、选择性过滤和全信息最大似然性等策略,显著提高了水稻种质资源数据中缺失值的填补精度,展示了其在处理复杂缺失值问题上的有效性和潜力。展开更多
剩余寿命(Remaining Useful Life, RUL)预测对于维护工业设备的可靠性和安全性至关重要,但现有的RUL预测方法在处理高维传感器数据以及捕捉时间退化模式方面仍然面临诸多挑战。为了解决上述问题,提出一种退化趋势平滑约束下基于双向长...剩余寿命(Remaining Useful Life, RUL)预测对于维护工业设备的可靠性和安全性至关重要,但现有的RUL预测方法在处理高维传感器数据以及捕捉时间退化模式方面仍然面临诸多挑战。为了解决上述问题,提出一种退化趋势平滑约束下基于双向长短时记忆网络-变分自编码器(Bidirectional Long Short Term-Memory-Variational Auto Encoder, BLSTM-VAE)的RUL预测方法。该方法首先进行数据预处理,包括数据降噪、滑动窗口分段和标签修正等步骤。然后设计基于BLSTM的VAE型特征提取器,以有效提取时间序列数据中的非线性关系和长距离依赖关系。最后提出一种基于流形学习的退化趋势平滑约束模块,通过局部不变性假设来增强模型的稳健性和泛化能力。通过航空发动机数据集数据集进行验证,结果表明所提出的RUL预测方法在数据集上的表现优于现有的多种RUL预测方法,具有更低的预测误差和更高的稳定性。展开更多
文摘【目的】设计一种基于FIML和DAE的填充缺失值的方法,即聚类全信息选择性过滤编码器数据填补算法(clustering-based comprehensive information selective filtering encoder data imputation algorithm,CFSM-DAE),为水稻种质资源缺失数据进行填充。【方法】利用聚类辅助避免数据异常值对算法的影响,采用选择性过滤层用于识别高质量估算、减少低质量估算的影响。传统的DAE框架通常没有选择性过滤层,所有的估算值都被视为同等重要,无法区分高质量和低质量的估算值。为了进一步提高估算精度,研究采用集成框架将全信息最大似然性(FIML)与多对抗性自编码器(DAE)结合的方法(CFSM-DAE),在选择性过滤层基础上,自适应填充,即当估算值不符合设定阈值时,采用FIML填充策略以确保填充结果的稳定性和精确度,从而进一步来提高整体估算精度。在3种缺失数据机制(随机缺失(MAR)、完全随机缺失(MCAR)和非随机缺失(MNAR))下对模拟数据和实际水稻种质资源数据集进行研究,将CFSM-DAE方法与多种常用填充算法比较(全信息最大似然性(FIML)、对抗自编码器(DAE)、K近邻填充(KNN)、随机森林(RF)、链式方程多重插补(MICE))。【结果】CFSM-DAE在模拟数据上的表现为S_(RME)=0.0676,E_(MA)=0.0093,R^(2)=0.9958;在水稻种质资源数据上的表现为S_(RME)=0.0395,E_(MA)=0.0078,R^(2)=0.8913。相比之下,其他算法如DAE在这两类数据下的SRME表现分别为0.8896和0.7707;KNN算法的EMA表现分别为0.1183和0.1305;FIML算法的R2表现为0.3382和0.7321。因此,CFSM-DAE在多个评价指标上相较于其他算法都表现出了一定的提升,CFSM-DAE在模拟数据和水稻种质资源数据的表现优于其他算法。【结论】CFSM-DAE方法通过结合聚类、选择性过滤和全信息最大似然性等策略,显著提高了水稻种质资源数据中缺失值的填补精度,展示了其在处理复杂缺失值问题上的有效性和潜力。
文摘剩余寿命(Remaining Useful Life, RUL)预测对于维护工业设备的可靠性和安全性至关重要,但现有的RUL预测方法在处理高维传感器数据以及捕捉时间退化模式方面仍然面临诸多挑战。为了解决上述问题,提出一种退化趋势平滑约束下基于双向长短时记忆网络-变分自编码器(Bidirectional Long Short Term-Memory-Variational Auto Encoder, BLSTM-VAE)的RUL预测方法。该方法首先进行数据预处理,包括数据降噪、滑动窗口分段和标签修正等步骤。然后设计基于BLSTM的VAE型特征提取器,以有效提取时间序列数据中的非线性关系和长距离依赖关系。最后提出一种基于流形学习的退化趋势平滑约束模块,通过局部不变性假设来增强模型的稳健性和泛化能力。通过航空发动机数据集数据集进行验证,结果表明所提出的RUL预测方法在数据集上的表现优于现有的多种RUL预测方法,具有更低的预测误差和更高的稳定性。