为解决现有基于循环神经网络的空气质量预测模型在数据质量、表达数据复杂依赖性和处理突变特征方面存在的问题,研究提出一种融入双向长短期记忆网络和多头注意力机制的空气质量预测模型。该模型首先采用多种混合方法对空气质量数据进...为解决现有基于循环神经网络的空气质量预测模型在数据质量、表达数据复杂依赖性和处理突变特征方面存在的问题,研究提出一种融入双向长短期记忆网络和多头注意力机制的空气质量预测模型。该模型首先采用多种混合方法对空气质量数据进行处理,以提高数据模型预测能力的上限。其次,模型利用双向长短期记忆网络捕获空气质量数据中的复杂依赖性,解决了传统模型在时间序列数据中捕获信息较少的问题。再次,采用多头注意力机制捕获突变空气数据特征,合理赋值其权重占比,从而提高模型预测的精准度。最后,加入dropout机制和Adam梯度下降对模型进行优化。为验证模型的有效性,将2022年上海市空气质量监测站的污染物浓度数据以及气象站监测数据作为数据集设计试验,并与现有模型进行对比。试验结果显示,双向长短期记忆网络-多头注意力机制(Bidirectional Long Short Term Memory Network-Multi-Head Attention Mechanism,Bi-LSTM-MA)模型与未经优化的长短期记忆网络(Long Short Term Memory Network,LSTM)模型在预测各类空气质量指标上相比,均方误差、均方根误差、渐进均方误差和R^(2)分别最高提升了38.96%、21.88%、23.52%和4.02%,表明该模型具有更好的预测效果。展开更多
文摘为解决现有基于循环神经网络的空气质量预测模型在数据质量、表达数据复杂依赖性和处理突变特征方面存在的问题,研究提出一种融入双向长短期记忆网络和多头注意力机制的空气质量预测模型。该模型首先采用多种混合方法对空气质量数据进行处理,以提高数据模型预测能力的上限。其次,模型利用双向长短期记忆网络捕获空气质量数据中的复杂依赖性,解决了传统模型在时间序列数据中捕获信息较少的问题。再次,采用多头注意力机制捕获突变空气数据特征,合理赋值其权重占比,从而提高模型预测的精准度。最后,加入dropout机制和Adam梯度下降对模型进行优化。为验证模型的有效性,将2022年上海市空气质量监测站的污染物浓度数据以及气象站监测数据作为数据集设计试验,并与现有模型进行对比。试验结果显示,双向长短期记忆网络-多头注意力机制(Bidirectional Long Short Term Memory Network-Multi-Head Attention Mechanism,Bi-LSTM-MA)模型与未经优化的长短期记忆网络(Long Short Term Memory Network,LSTM)模型在预测各类空气质量指标上相比,均方误差、均方根误差、渐进均方误差和R^(2)分别最高提升了38.96%、21.88%、23.52%和4.02%,表明该模型具有更好的预测效果。
文摘由传统机器学习方法组成的空气质量预测模型得到了普遍应用,但是此类模型对于数据有效性,特别是时空相关数据的选取仍旧存在不足。针对深度学习输入数据有效性问题进行研究,提出了一种基于时空相似LSTM的预测模型(spatial-temporal similarity LSTM model,STS-LSTM),以便在时间和空间层面选取更加有效的数据。STS-LSTM分为前序、中序和后序三个模块,前序模块为时空相似选择输入模块,提出了格兰杰因果权重动态时间折叠(Granger causal index weighted dynamic time warping,GCWDTW)算法,用于选取具有更高时空相似性的数据;中序模块使用LSTM作为深度学习网络进行训练;后序模块根据目标站点特征选择不同的输出组合进行集成。STS-LSTM整体模型在空气质量预测误差上较现有算法提升了8%左右,经过有效性选取的数据对于模型精度达到了最高21%的提升。实验结果表明,对于有效数据的选取该算法取得了显著效果,将数据输入输出方法作为应用型深度学习网络的一部分,可以有效提升深度学习网络的最终效果。