为解决现有基于循环神经网络的空气质量预测模型在数据质量、表达数据复杂依赖性和处理突变特征方面存在的问题,研究提出一种融入双向长短期记忆网络和多头注意力机制的空气质量预测模型。该模型首先采用多种混合方法对空气质量数据进...为解决现有基于循环神经网络的空气质量预测模型在数据质量、表达数据复杂依赖性和处理突变特征方面存在的问题,研究提出一种融入双向长短期记忆网络和多头注意力机制的空气质量预测模型。该模型首先采用多种混合方法对空气质量数据进行处理,以提高数据模型预测能力的上限。其次,模型利用双向长短期记忆网络捕获空气质量数据中的复杂依赖性,解决了传统模型在时间序列数据中捕获信息较少的问题。再次,采用多头注意力机制捕获突变空气数据特征,合理赋值其权重占比,从而提高模型预测的精准度。最后,加入dropout机制和Adam梯度下降对模型进行优化。为验证模型的有效性,将2022年上海市空气质量监测站的污染物浓度数据以及气象站监测数据作为数据集设计试验,并与现有模型进行对比。试验结果显示,双向长短期记忆网络-多头注意力机制(Bidirectional Long Short Term Memory Network-Multi-Head Attention Mechanism,Bi-LSTM-MA)模型与未经优化的长短期记忆网络(Long Short Term Memory Network,LSTM)模型在预测各类空气质量指标上相比,均方误差、均方根误差、渐进均方误差和R^(2)分别最高提升了38.96%、21.88%、23.52%和4.02%,表明该模型具有更好的预测效果。展开更多
文摘为解决现有基于循环神经网络的空气质量预测模型在数据质量、表达数据复杂依赖性和处理突变特征方面存在的问题,研究提出一种融入双向长短期记忆网络和多头注意力机制的空气质量预测模型。该模型首先采用多种混合方法对空气质量数据进行处理,以提高数据模型预测能力的上限。其次,模型利用双向长短期记忆网络捕获空气质量数据中的复杂依赖性,解决了传统模型在时间序列数据中捕获信息较少的问题。再次,采用多头注意力机制捕获突变空气数据特征,合理赋值其权重占比,从而提高模型预测的精准度。最后,加入dropout机制和Adam梯度下降对模型进行优化。为验证模型的有效性,将2022年上海市空气质量监测站的污染物浓度数据以及气象站监测数据作为数据集设计试验,并与现有模型进行对比。试验结果显示,双向长短期记忆网络-多头注意力机制(Bidirectional Long Short Term Memory Network-Multi-Head Attention Mechanism,Bi-LSTM-MA)模型与未经优化的长短期记忆网络(Long Short Term Memory Network,LSTM)模型在预测各类空气质量指标上相比,均方误差、均方根误差、渐进均方误差和R^(2)分别最高提升了38.96%、21.88%、23.52%和4.02%,表明该模型具有更好的预测效果。