基于动态Spike and Slab先验,结合删失时间序列的似然函数,构建了适用于删失时间序列数据的贝叶斯动态变量选择回归模型.为处理计算问题,采用了EM算法进行求解,从而能够快速获得模型参数估计与变量选择结果.通过模拟研究验证了该方法的...基于动态Spike and Slab先验,结合删失时间序列的似然函数,构建了适用于删失时间序列数据的贝叶斯动态变量选择回归模型.为处理计算问题,采用了EM算法进行求解,从而能够快速获得模型参数估计与变量选择结果.通过模拟研究验证了该方法的有效性,并将其应用于实际磷浓度数据分析中.展开更多
针对滚动轴承全寿命周期监测数据不足导致剩余寿命预测精度不高的问题,提出一种基于时间序列数据扩增和双向长短时记忆(bidirectional long-short term memory, BLSTM)网络的剩余寿命预测方法。首先,采集训练用滚动轴承全寿命周期振动...针对滚动轴承全寿命周期监测数据不足导致剩余寿命预测精度不高的问题,提出一种基于时间序列数据扩增和双向长短时记忆(bidirectional long-short term memory, BLSTM)网络的剩余寿命预测方法。首先,采集训练用滚动轴承全寿命周期振动加速度和测试轴承振动加速度数据。其次,对采集得到的原始数据预处理后提取健康因子,将训练用数据和测试数据分别构成参考数据集和目标数据集。然后,以参考数据集为基础,利用动态时间规整算法扩增目标数据集数据。最后,使用数据扩增后的测试数据训练BLSTM网络,利用训练好的BLSTM网络预测滚动轴承性能退化趋势和剩余寿命。实验结果表明,基于动态时间规整算法的数据扩增模型能够根据已有全寿命周期数据,扩增性能退化过程相似的滚动轴承运行数据,利用扩增数据训练BLSTM网络,能够有效提高性能退化趋势预测能力,进而提高剩余寿命预测精度。展开更多
由于人类DNA序列上单核苷酸具有多态性,DNA序列异常挖掘是后基因组时代的一个重要研究课题。文章在分析现有DNA序列数据挖掘方法的基础上,利用流形学习中不同低维嵌入向量之间向量距离不同的特点,提出了基于流形学习的DNA序列数据挖掘方...由于人类DNA序列上单核苷酸具有多态性,DNA序列异常挖掘是后基因组时代的一个重要研究课题。文章在分析现有DNA序列数据挖掘方法的基础上,利用流形学习中不同低维嵌入向量之间向量距离不同的特点,提出了基于流形学习的DNA序列数据挖掘方法(5Dlocally linear embedding,简称5DLLE)。实验结果表明,与隐马尔可夫模型(HMM)和支持向量机(SVM)相比,文中所提出的5DLLE方法在DNA序列数据挖掘方面具有一定优势,不但平均识别率高,而且计算时间相对较少。展开更多
基金国家自然科学基金项目(60573093)国家"八六三"高技术研究发展计划基金项目(2006AA02Z329)+1 种基金supported by the National Basic Research Program(973 Program)of China under grant No.2005CB321905the Plan Program of Science and Technology Commission of Shanghai Municipality under grant No.08511500203
文摘针对滚动轴承全寿命周期监测数据不足导致剩余寿命预测精度不高的问题,提出一种基于时间序列数据扩增和双向长短时记忆(bidirectional long-short term memory, BLSTM)网络的剩余寿命预测方法。首先,采集训练用滚动轴承全寿命周期振动加速度和测试轴承振动加速度数据。其次,对采集得到的原始数据预处理后提取健康因子,将训练用数据和测试数据分别构成参考数据集和目标数据集。然后,以参考数据集为基础,利用动态时间规整算法扩增目标数据集数据。最后,使用数据扩增后的测试数据训练BLSTM网络,利用训练好的BLSTM网络预测滚动轴承性能退化趋势和剩余寿命。实验结果表明,基于动态时间规整算法的数据扩增模型能够根据已有全寿命周期数据,扩增性能退化过程相似的滚动轴承运行数据,利用扩增数据训练BLSTM网络,能够有效提高性能退化趋势预测能力,进而提高剩余寿命预测精度。
文摘由于人类DNA序列上单核苷酸具有多态性,DNA序列异常挖掘是后基因组时代的一个重要研究课题。文章在分析现有DNA序列数据挖掘方法的基础上,利用流形学习中不同低维嵌入向量之间向量距离不同的特点,提出了基于流形学习的DNA序列数据挖掘方法(5Dlocally linear embedding,简称5DLLE)。实验结果表明,与隐马尔可夫模型(HMM)和支持向量机(SVM)相比,文中所提出的5DLLE方法在DNA序列数据挖掘方面具有一定优势,不但平均识别率高,而且计算时间相对较少。