对于间歇过程变量深层特征提取困难,以及变量的时序性、非线性、动态特性所导致质量预测精度不高的问题,提出了一种基于卷积-时空注意力的双层长短期神经网络(convolutional neural networks spatial and temporal attention with doubl...对于间歇过程变量深层特征提取困难,以及变量的时序性、非线性、动态特性所导致质量预测精度不高的问题,提出了一种基于卷积-时空注意力的双层长短期神经网络(convolutional neural networks spatial and temporal attention with double long short term memory networks,CNN-STA-DLSTM)的间歇过程质量预测模型。首先,对间歇过程数据沿着变量的方向展开成二维矩阵,对二维数据采用Max-Min法归一化,接着,使用PLS对原始数据降维,保留与质量变量相关性较强的变量,使用CNN挖掘过程数据的潜在特征,提高质量相关特征信息的关注;其次,引入时间注意力机制和空间注意力机制构建双层LSTM的编码器-解码器结构网络,利用注意力机制自适应地学习时间步长的相关历史信息,以提高模型的长期记忆能力,并加强过程变量与质量变量之间的时空相关性;然后,采用随机-网格搜索法寻找预测模型合适的超参数,并构建了预测模型;最后,使用青霉素发酵仿真平台和带钢热连轧生产过程数据进行实验验证,结果表明所提模型具有更精准的预测效果。展开更多
文摘对于间歇过程变量深层特征提取困难,以及变量的时序性、非线性、动态特性所导致质量预测精度不高的问题,提出了一种基于卷积-时空注意力的双层长短期神经网络(convolutional neural networks spatial and temporal attention with double long short term memory networks,CNN-STA-DLSTM)的间歇过程质量预测模型。首先,对间歇过程数据沿着变量的方向展开成二维矩阵,对二维数据采用Max-Min法归一化,接着,使用PLS对原始数据降维,保留与质量变量相关性较强的变量,使用CNN挖掘过程数据的潜在特征,提高质量相关特征信息的关注;其次,引入时间注意力机制和空间注意力机制构建双层LSTM的编码器-解码器结构网络,利用注意力机制自适应地学习时间步长的相关历史信息,以提高模型的长期记忆能力,并加强过程变量与质量变量之间的时空相关性;然后,采用随机-网格搜索法寻找预测模型合适的超参数,并构建了预测模型;最后,使用青霉素发酵仿真平台和带钢热连轧生产过程数据进行实验验证,结果表明所提模型具有更精准的预测效果。