-
题名面向时序数据的两阶段日志结构合并树文件合并框架
被引量:2
- 1
-
-
作者
张凌哲
黄向东
乔嘉林
勾王敏浩
王建民
-
机构
清华大学软件学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第3期618-622,共5页
-
基金
国家重点研发计划项目(2019YFB1707001)
工业和信息化部高质量发展专项2020。
-
文摘
时序数据库中日志结构合并树(LSM-tree)在高写入负载或资源受限情况下的不及时的文件合并会导致LSM的C_0层数据大量堆积,从而造成近期写入数据的即席查询延迟增加。针对上述问题,提出了一种在保持面向大块数据的高效查询的基础上实现对最新写入的时序数据的低延迟查询的两阶段LSM合并框架。首先将文件的合并过程分为少量乱序文件快速合并与大量小文件合并这两个阶段,然后在每个阶段内提供多种文件合并策略,最后根据系统的查询负载进行两阶段合并的资源分配。通过在时序数据库Apache IoTDB上分别实现传统的LSM合并策略以及两阶段LSM合并框架和测试,结果表明与传统的LSM相比,两阶段的文件合并模块在提升策略灵活性的情况下使即席查询读盘次数大大降低,并且使历史数据分析查询性能提升了约20%。实验结果表明,两阶段的LSM合并框架能够提高近期写入数据的即席查询效率,提高历史数据分析查询性能,而且提升合并策略的灵活性。
-
关键词
物联网
时序数据库
时间序列数据
文件合并
日志结构合并树
即席查询
-
Keywords
Internet of Things(IoT)
time series database
time series data
file compaction
log-structured mergetree(lsm)
ad hoc query
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-