随着工业物联网(industrial Internet of things,IIoT)的不断发展,越来越多的设备和传感器开始连接到网络中,产生了大量的时间序列数据(简称“时序数据”),时序数据爆炸式的增长给数据库管理系统带来了新的挑战:持续高吞吐量数据摄取、...随着工业物联网(industrial Internet of things,IIoT)的不断发展,越来越多的设备和传感器开始连接到网络中,产生了大量的时间序列数据(简称“时序数据”),时序数据爆炸式的增长给数据库管理系统带来了新的挑战:持续高吞吐量数据摄取、低延迟多维度数据查询、高性能时间序列索引以及低成本数据存储.近年来时序数据库技术已经成为一个研究热点,一些学者对时序数据库技术进行了深入的研究,同时出现了一些专门用于管理时序数据的时序数据库,并且已经被应用在多个领域,成为工业物联网中不可缺少的关键组成.现有的时序数据库相关综述侧重于时序数据库的功能和性能比较,以及在特定领域中对时序数据库的选择建议,缺少对时序数据库持久化存储、查询、计算和索引等关键技术的研究,同时这些综述工作出现的时间较早,缺少对现代时序数据库关键技术的研究.对学术界时序数据存储研究和工业界时序数据库进行了全面的调查和研究,凝练了时序数据库的4类关键技术:1)时间序列索引优化技术;2)内存数据组织技术;3)高吞吐量数据摄取和低延迟数据查询技术;4)海量历史数据低成本存储技术.同时分析总结了时序数据库评测基准.最后,展望了时序数据库关键技术在未来的发展方向.展开更多
深度学习模型在多元时间序列预测、智能驾驶、图像识别等多个领域广泛应用,其中多元时间序列预测是学者们关注的重点之一,多元时间序列预测是典型的回归任务,旨在通过海量的历史数据构建模型以预测未来状态,被广泛运用于交通、电力、金...深度学习模型在多元时间序列预测、智能驾驶、图像识别等多个领域广泛应用,其中多元时间序列预测是学者们关注的重点之一,多元时间序列预测是典型的回归任务,旨在通过海量的历史数据构建模型以预测未来状态,被广泛运用于交通、电力、金融等领域.多元时间序列数据具有复杂的时空依赖性,现有模型大多仅能捕获序列数据中的时间特征,难以捕获空间特征,而图神经网络解决了这一问题.图神经网络能够自然地建模实体间的复杂关系,可以很好地处理拓扑数据,而多元时序数据大多可以构造为拓扑图,因此图神经网络可以很好地学习多元时序数据中的空间特征.基于图神经网络的多元时间序列预测模型受到广泛关注并取得了一定的成果,但现有基于图神经网络的模型仍存在诸多不足.首先,现有方法大多分别捕获和建模多元时间序列数据中的空间特性和时间特性,未充分考虑多元时间序列的时空统一性,导致模型的次优建模;其次,现有方法主要基于静态预定义图或动态自适应图,其中静态预定义图通常根据监测节点之间的空间相关性进行构造且不会随着时间而改变,基于预定义图的研究忽略了时间序列数据中的时间特征,即忽略了数据模式随时间发生的改变;而自适应图通常由模型自主学习并不包含监测节点间的固有属性,基于自适应图的研究忽略了大量有效的领域知识,如道路的连通性和道路间的属性.为了解决上述问题,提出基于动态自适应时空图的多元时序预测模型MTP-Graph(Multivariate Time series Prediction model based on dynamic adaptive spatio-temporal Graph),利用时空融合模块将时空信息进行统一处理,避免了分开捕获时间特性与空间特性而导致的次优建模问题,提出图结合模块将静态预定义图和动态自适应图进行动态融合,获取时空信息的同时充分考虑领域知识,使模型可以更好地学习多元时间序列中的时空特性.在PeMSD3、PeMSD7和PeMSD8数据集上的大量实验结果表明,MTP-Graph预测性能优于其他基准方法,验证了MTP-Graph的可用性和有效性.展开更多
文摘随着工业物联网(industrial Internet of things,IIoT)的不断发展,越来越多的设备和传感器开始连接到网络中,产生了大量的时间序列数据(简称“时序数据”),时序数据爆炸式的增长给数据库管理系统带来了新的挑战:持续高吞吐量数据摄取、低延迟多维度数据查询、高性能时间序列索引以及低成本数据存储.近年来时序数据库技术已经成为一个研究热点,一些学者对时序数据库技术进行了深入的研究,同时出现了一些专门用于管理时序数据的时序数据库,并且已经被应用在多个领域,成为工业物联网中不可缺少的关键组成.现有的时序数据库相关综述侧重于时序数据库的功能和性能比较,以及在特定领域中对时序数据库的选择建议,缺少对时序数据库持久化存储、查询、计算和索引等关键技术的研究,同时这些综述工作出现的时间较早,缺少对现代时序数据库关键技术的研究.对学术界时序数据存储研究和工业界时序数据库进行了全面的调查和研究,凝练了时序数据库的4类关键技术:1)时间序列索引优化技术;2)内存数据组织技术;3)高吞吐量数据摄取和低延迟数据查询技术;4)海量历史数据低成本存储技术.同时分析总结了时序数据库评测基准.最后,展望了时序数据库关键技术在未来的发展方向.
文摘深度学习模型在多元时间序列预测、智能驾驶、图像识别等多个领域广泛应用,其中多元时间序列预测是学者们关注的重点之一,多元时间序列预测是典型的回归任务,旨在通过海量的历史数据构建模型以预测未来状态,被广泛运用于交通、电力、金融等领域.多元时间序列数据具有复杂的时空依赖性,现有模型大多仅能捕获序列数据中的时间特征,难以捕获空间特征,而图神经网络解决了这一问题.图神经网络能够自然地建模实体间的复杂关系,可以很好地处理拓扑数据,而多元时序数据大多可以构造为拓扑图,因此图神经网络可以很好地学习多元时序数据中的空间特征.基于图神经网络的多元时间序列预测模型受到广泛关注并取得了一定的成果,但现有基于图神经网络的模型仍存在诸多不足.首先,现有方法大多分别捕获和建模多元时间序列数据中的空间特性和时间特性,未充分考虑多元时间序列的时空统一性,导致模型的次优建模;其次,现有方法主要基于静态预定义图或动态自适应图,其中静态预定义图通常根据监测节点之间的空间相关性进行构造且不会随着时间而改变,基于预定义图的研究忽略了时间序列数据中的时间特征,即忽略了数据模式随时间发生的改变;而自适应图通常由模型自主学习并不包含监测节点间的固有属性,基于自适应图的研究忽略了大量有效的领域知识,如道路的连通性和道路间的属性.为了解决上述问题,提出基于动态自适应时空图的多元时序预测模型MTP-Graph(Multivariate Time series Prediction model based on dynamic adaptive spatio-temporal Graph),利用时空融合模块将时空信息进行统一处理,避免了分开捕获时间特性与空间特性而导致的次优建模问题,提出图结合模块将静态预定义图和动态自适应图进行动态融合,获取时空信息的同时充分考虑领域知识,使模型可以更好地学习多元时间序列中的时空特性.在PeMSD3、PeMSD7和PeMSD8数据集上的大量实验结果表明,MTP-Graph预测性能优于其他基准方法,验证了MTP-Graph的可用性和有效性.