期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于LSM-Tree的分布式数据库异步融合机制研究与实现 被引量:1
1
作者 杜轶德 刘文洁 《西北工业大学学报》 EI CAS CSCD 北大核心 2024年第2期303-309,共7页
信息技术的不断发展,使得分布式数据库成为研究热点。由于NoSQL架构的分布式数据库对SQL支持有限且在事务处理及一致性方面存在缺陷,基于LSM-Tree的NewSQL数据库逐渐成为应用的主流,例如TiDB、OceanBase等。分布式LSM-Tree的存储架构将... 信息技术的不断发展,使得分布式数据库成为研究热点。由于NoSQL架构的分布式数据库对SQL支持有限且在事务处理及一致性方面存在缺陷,基于LSM-Tree的NewSQL数据库逐渐成为应用的主流,例如TiDB、OceanBase等。分布式LSM-Tree的存储架构将数据分为基线数据与增量数据,通过合并操作将不同分区的增量数据与基线数据不断融合,并存储在磁盘,从而减少内存压力。但合并会占用大量系统资源,严重影响系统可用性。因此提出了一种基于LSM-Tree架构的异步融合机制,通过细分合并流程,将数据融合异步化,有效地缩短了单次数据合并的时间。实验表明,提出的异步融合机制可显著缩短数据合并时间,提高系统在高频写入场景下的鲁棒性和可用性。 展开更多
关键词 分布式数据库 lsm-tree 数据合并 异步融合 数据分区
在线阅读 下载PDF
基于非易失性内存的LSM-tree存储系统优化 被引量:3
2
作者 余阳 胡卉芪 周煊 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第5期37-47,共11页
随着大数据时代的到来,金融行业产生的数据越来越多,对数据库的压力也越来越大. LevelDB是谷歌开发的一款基于LSM-tree架构的键值对数据库,有写入快和占用空间小的优点,被金融行业广泛应用.针对LSM-tree架构的写停顿、写放大、对读不友... 随着大数据时代的到来,金融行业产生的数据越来越多,对数据库的压力也越来越大. LevelDB是谷歌开发的一款基于LSM-tree架构的键值对数据库,有写入快和占用空间小的优点,被金融行业广泛应用.针对LSM-tree架构的写停顿、写放大、对读不友好等缺点,提出了一种基于非易失性内存和机器学习的L0层的设计方法,能够减缓甚至解决上述问题.实验结果表明,该设计能够实现较好的读写性能. 展开更多
关键词 非易失性内存 机器学习 lsm-tree架构
在线阅读 下载PDF
LazyStore:基于混合存储架构的写优化键值存储系统 被引量:1
3
作者 杜云箫 陈珂 +3 位作者 寿黎但 江大伟 骆歆远 陈刚 《软件学报》 北大核心 2025年第2期805-829,共25页
基于日志合并树(LSM-tree)的键值(key-value)存储由于其出色的读写性能而被广泛用于许多应用中.大多数现有的日志合并树采用多层结构来存储数据.尽管多层数据结构可以很好地服务于适度的写密集型应用,但这种结构并不十分适合高写密集型... 基于日志合并树(LSM-tree)的键值(key-value)存储由于其出色的读写性能而被广泛用于许多应用中.大多数现有的日志合并树采用多层结构来存储数据.尽管多层数据结构可以很好地服务于适度的写密集型应用,但这种结构并不十分适合高写密集型应用.这是因为以多层方式保存数据会引入写放大问题,即新的数据插入会引发很大一部分已经存储在多层中的数据被重组的问题.这种巨大的(有时是频繁的)数据重组是昂贵的,并且在许多高写密集型的应用中降低了写入性能.此外,多层结构不能为热数据持续提供出色的读取性能.这是因为多级结构不能通过及时合并重叠的范围来优化热数据的读取操作.为了解决上述两个问题,提出LazyStore,一种基于混合存储架构的新型单层日志合并树.LazyStore通过将数据存储在单一逻辑层而不是多个逻辑层来解决写放大的问题.因此,昂贵的多级数据重组在很大程度上被消除.为了进一步提高写入性能,LazyStore根据每个存储设备的容量和读/写性能,将逻辑层中的数据分布到多个存储设备中,如内存、非易失性内存和闪存.此外,LazyStore引入实时合并操作,以提高热数据范围的读取性能.实验表明,与其他多级日志合并树相比,LazyStore最多将写入性能提高3倍,并将写入放大率降低至1/4.而对于热门范围的读取,LazyStore的实时数据合并优化可以将范围查询处理的延迟降低一半. 展开更多
关键词 键值存储 日志合并树 非易失性内存
在线阅读 下载PDF
基于细粒度缓存与学习型索引的LSM树键值存储系统性能优化
4
作者 许睿达 李永坤 许胤龙 《计算机科学》 北大核心 2025年第2期33-41,共9页
在数据量飞速增长的大数据时代背景下,基于日志结构合并树的(Log-Structured Merge-Tree-based,LSM-Tree-based)键值存储系统因其优秀的灵活性与扩展性被广泛应用于NoSQL系统。但是,传统的LSM-Tree结构键值存储系统在查询数据时,因搜索... 在数据量飞速增长的大数据时代背景下,基于日志结构合并树的(Log-Structured Merge-Tree-based,LSM-Tree-based)键值存储系统因其优秀的灵活性与扩展性被广泛应用于NoSQL系统。但是,传统的LSM-Tree结构键值存储系统在查询数据时,因搜索多个SSTable引起的读放大问题会产生额外的I/O开销,影响系统性能。针对这一问题,提出了一种新型键值存储系统优化设计方案——FCLI-LSM。FCLI-LSM结合了细粒度键值对缓存和学习型索引的优化方法,旨在提升基于LSM-Tree结构的键值存储系统的查询性能。通过对数据访问热点的分析,FCLI-LSM对数据进行热、温、冷数据的三级分级。FCLI-LSM为热数据设计了基于键值分离的细粒度缓存机制,有效减少了读放大问题带来的额外I/O开销;此外,还设计了一种针对学习型索引的缓存亲和优化,进一步提高了存储系统对温数据的查询效率。实验结果表明,与现有的查询优化方案相比,FCLI-LSM能带来超过40%的平均查询时延下降以及超过1.7倍的系统吞吐率提升。 展开更多
关键词 大数据 键值存储系统 日志结构合并树 学习型索引 缓存
在线阅读 下载PDF
Truster:面向高效查询的自动驾驶轨迹数据聚类存储方案
5
作者 王征权 彭智勇 《计算机科学》 北大核心 2025年第11期62-70,共9页
自动驾驶轨迹数据具有重要的研究与应用价值,其存储与查询技术得到了广泛的研究与关注。然而,现有轨迹数据管理方案主要针对一般轨迹数据设计,无法支持高频采样的自动驾驶轨迹数据的高效写入,且动态环境下高昂的索引维护开销使其难以满... 自动驾驶轨迹数据具有重要的研究与应用价值,其存储与查询技术得到了广泛的研究与关注。然而,现有轨迹数据管理方案主要针对一般轨迹数据设计,无法支持高频采样的自动驾驶轨迹数据的高效写入,且动态环境下高昂的索引维护开销使其难以满足动态更新与实时查询的需求。针对自动驾驶场景下高采样频率、高实时性的轨迹数据如何实现高频写入、动态更新、实时查询的问题,提出一种面向高效查询的自动驾驶轨迹数据聚类存储方案Truster。该方法设计了编码器和嵌入器,为原始轨迹生成空间感知键并提取特征向量;设计了基于日志结构合并树的存储结构CLSM树,以实现相似轨迹的集中存储;设计了LCC合并策略,在有序字符串表进行合并的同时,利用基于局部敏感哈希的分桶方法进行快速聚类;设计了轨迹查询算法,利用多粒度缓存和分桶映射快速筛选搜索空间。Truster不仅支持高频写入,还能适应动态工作负载的索引维护,且查询效率更高。在真实自动驾驶轨迹数据集Argoverse上进行的对比实验表明,与现有方法相比,Truster在写入操作上取得了20%~200%的加速,在查询操作上取得了20%~100%的加速。 展开更多
关键词 轨迹数据 轨迹存储 轨迹查询 日志结构合并树 局部敏感哈希
在线阅读 下载PDF
OceanBase分布式关系数据库架构与技术 被引量:4
6
作者 阳振坤 杨传辉 +3 位作者 韩富晟 王国平 杨志丰 成肖君 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期540-554,共15页
关系数据库是当今社会的关键信息基础设施,互联网和数字化带来了高并发和海量数据,传统关系数据库均为集中式架构,处理能力和存储容量都捉襟见肘.OceanBase分布式关系数据库基于通用PC服务器,不仅实现了在线水平伸缩,还实现了机房故障... 关系数据库是当今社会的关键信息基础设施,互联网和数字化带来了高并发和海量数据,传统关系数据库均为集中式架构,处理能力和存储容量都捉襟见肘.OceanBase分布式关系数据库基于通用PC服务器,不仅实现了在线水平伸缩,还实现了机房故障自动无损容灾以及高倍率数据压缩等,已经应用于金融、政务、通信和互联网等行业.介绍了OceanBase分布式关系数据库的系统架构和关键技术,包括分布式事务处理、基于LSM-tree的存储系统以及分布式SQL优化器.详细阐述了OceanBase数据库的高可用和数据一致性,包括RPO为0和RTO小于8 s.也介绍了OceanBase数据库多租户机制,即采用了集群内原生多租户设计,在集群内实现多个互相独立的数据库服务.基于Sysbench和TPC-H评测基准,对比实验结果表明:1)在单机模式下,OceanBase的性能是MySQL的1.27倍至2倍多;2)在单主模式下,OceanBase的性能是MySQL的1.25倍至近2倍;3)在多主模式下,OceanBase的性能是MySQL的1.09倍至3.1倍,对于OLAP的复杂查询,OceanBase的性能是MySQL的6倍到327倍. 展开更多
关键词 关系数据库 分布式事务 基于lsm-tree存储 分布式SQL优化器 多租户
在线阅读 下载PDF
MUSE:一种面向云存储系统的高性能元数据存储引擎 被引量:5
7
作者 段翰聪 向小可 吕鹏程 《电子科技大学学报》 EI CAS CSCD 北大核心 2016年第2期221-226,共6页
该文设计了一种高性能的面向云存储系统的元数据存储引擎(MUSE)。首先,其底层物理存储模块采用LSM-tree模型的高速key-value存储引擎Level DB方案,通过设计多缓存表和多线程紧凑机制对该方案进行优化,使其可以充分利用内存和多核CPU并... 该文设计了一种高性能的面向云存储系统的元数据存储引擎(MUSE)。首先,其底层物理存储模块采用LSM-tree模型的高速key-value存储引擎Level DB方案,通过设计多缓存表和多线程紧凑机制对该方案进行优化,使其可以充分利用内存和多核CPU并行能力;其次,提出了基于多I/O通道的元数据存取调度机制。通道之间读写操作隔离,聚合多个通道为上层提供高并发随机I/O读写能力;此外,针对上层目录命名空间管理,提出路径分割映射和全路径映射策略两种策略,可基于不同的应用场景在性能与可用性间进行折中选择。系统测试结果表明,MUSE能够很好地适应海量小文件存储场景,相对于其他元数据存储系统在性能上有显著的提升。 展开更多
关键词 I/O lsm-tree 海量 元数据 性能 小文件 存储引擎
在线阅读 下载PDF
一种基于LSM树的键值存储系统性能优化方法 被引量:6
8
作者 王海涛 李战怀 +1 位作者 张晓 赵晓南 《计算机研究与发展》 EI CSCD 北大核心 2019年第8期1792-1802,共11页
目前,键值(key-value, KV)存储系统在众多数据密集型的应用系统中发挥着关键作用,例如页面索引、电子商务以及云存储系统等.在各种键值存储系统中,基于日志结构合并(log-structured merge, LSM)树的KV存储系统获得了广泛的应用.主要原... 目前,键值(key-value, KV)存储系统在众多数据密集型的应用系统中发挥着关键作用,例如页面索引、电子商务以及云存储系统等.在各种键值存储系统中,基于日志结构合并(log-structured merge, LSM)树的KV存储系统获得了广泛的应用.主要原因是基于LSM树的KV存储系统能够将随机写操作转化为顺序写操作,从而提升数据写性能.然而,这些存储系统也存在一些严重的性能问题.一方面,KV存储系统利用预写日志机制来保证写入数据的原子性和安全性,以便在系统发生故障时进行恢复,造成了数据的写放大.同时,日志的频繁更新也引入了严重的元数据负载,导致了额外的性能开销.另一方面,KV存储系统通常利用通用文件系统存储数据,而通用文件系统中许多KV存储系统不需要的功能和属性也会造成一定的性能开销.为了减小这些开销、提升KV存储系统写入性能,提出了RocksFS,一个针对基于LSM树的KV存储系统优化的文件系统.针对KV存储系统的负载模式简化文件系统结构,去除通用文件系统引入的负载,同时优化预写日志的存储结构和更新流程以减小其更新负载,提升写入性能.最后在普通硬盘和固态硬盘上,基于流行的KV存储系统RocksDB验证了该方法的有效性,结果显示相对于通用文件系统,RocksFS能够将小块KV数据写入和更新性能提高约8倍. 展开更多
关键词 LSM树 键值存储 文件系统 预写日志 写性能
在线阅读 下载PDF
高效Key-Value持久化缓存系统的实现 被引量:6
9
作者 罗军 陈席林 李文生 《计算机工程》 CAS CSCD 2014年第3期33-38,共6页
传统的缓存系统为了追求更高的性能大多是基于内存存储的,数据的持久化功能并不完善,因而系统会受到内存容量的限制,并且在系统宕机时会导致数据全部丢失,无法恢复。为此,在分析传统缓存系统的基础上,针对数据的持久化运用LSM-Tree理论... 传统的缓存系统为了追求更高的性能大多是基于内存存储的,数据的持久化功能并不完善,因而系统会受到内存容量的限制,并且在系统宕机时会导致数据全部丢失,无法恢复。为此,在分析传统缓存系统的基础上,针对数据的持久化运用LSM-Tree理论以及Merge-Dump存储引擎进行改进,并参考Google的单机持久化存储系统LevelDB,实现一个分布式的Key-Value持久化缓存系统SSDB,结合传统缓存系统的优点并利用一致性哈希、布隆过滤器等思想对SSDB进行一系列优化。对SSDB性能测试的结果表明,优化后的持久化缓存系统SSDB是纯内存存储的,能有效降低数据的存储成本,且在读写性能上只比Redis下降约600 QPS。 展开更多
关键词 LSM Tree理论 Merge—Dump存储引擎 缓存系统 持久化存储 一致性哈希 布隆过滤器
在线阅读 下载PDF
基于日志结构合并树的轻量级分布式索引实现方法 被引量:2
10
作者 崔双双 王宏志 《计算机应用》 CSCD 北大核心 2021年第3期630-635,共6页
针对现有基于日志结构合并树(LSM-Tree)实现的分布式数据库仅支持高效的主键查询,无法让用户快速地应用在自己的集群中的问题,提出了基于LSM-Tree的轻量级分布式索引实现方法 SIBL。首先,通过对主键属性列建立索引来提高非主键属性的查... 针对现有基于日志结构合并树(LSM-Tree)实现的分布式数据库仅支持高效的主键查询,无法让用户快速地应用在自己的集群中的问题,提出了基于LSM-Tree的轻量级分布式索引实现方法 SIBL。首先,通过对主键属性列建立索引来提高非主键属性的查询效率;然后,提出了分布式索引构建算法以及基于等距取样的索引区间划分算法,从而保证了索引在系统中的均匀分布,并且优化了传统索引的查询算法,将索引文件看作特殊的数据文件分布式地存储在系统中,从而保证了系统的负载均衡和可扩展性;最后,将该方法与华为二级索引方案HIndex在HBase数据库上进行实验来比较二者的索引构建的时间和空间开销、索引的查询性能和系统的负载均衡等性能,验证得出所提出的方法使查询性能提升了50~200倍。 展开更多
关键词 日志结构合并树 分布式索引 HBASE 查询优化
在线阅读 下载PDF
近数据计算下键值存储中Compaction并行优化方法 被引量:1
11
作者 孙辉 娄本冬 +2 位作者 黄建忠 赵雨虹 符松 《计算机研究与发展》 EI CSCD 北大核心 2022年第3期597-616,共20页
大规模非结构化数据的爆炸式增长给传统关系型数据库带来了极大的挑战.基于日志结构合并树(log-structured merge tree,LSM-tree)的键值存储系统已被广泛应用,并起到重要的作用,原因在于基于LSM-tree的键值存储能够将随机写转化为顺序写... 大规模非结构化数据的爆炸式增长给传统关系型数据库带来了极大的挑战.基于日志结构合并树(log-structured merge tree,LSM-tree)的键值存储系统已被广泛应用,并起到重要的作用,原因在于基于LSM-tree的键值存储能够将随机写转化为顺序写,从而提升性能.然而,LSM-tree键值存储也存在一些性能问题.一方面,键值存储利用compaction操作更新数据,保持系统平衡,但造成严重的写放大问题.另一方面,以传统计算为中心的架构下,compaction操作带来大量的数据传输,影响了系统性能.以数据为中心的近数据计算模型(near-data processing,NDP)为基础,利用该模型下主机端与近数据计算使能设备端的并行资源,提出基于系统并行与流水线并行的compaction优化方法(collaborative parallel compaction optimization for LSM-tree key-value stores,CoPro).当处理compaction操作时,CoPro主机端与NDP设备端协同执行compaction卸载任务.此外,进一步提出基于决策组件的CoPro+,根据系统资源变化以及负载键值对中值大小的变化来动态调整并行度,使NDP架构中计算资源的使用更加高效.在搭建的硬件平台上验证了CoPro的有效性. 展开更多
关键词 日志归并树 键值存储 近数据计算 任务卸载 数据-流水线并行
在线阅读 下载PDF
基于LSM Tree的分布式索引实现 被引量:3
12
作者 隆飞 翁海星 +1 位作者 高明 张召 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第5期36-44,66,共10页
近年来Log-Structured-Merge(LSM)Tree在NoSQL系统中得到了广泛地应用.主要是因为LSM Tree架构提出了延迟更新和批量写入的算法,将随机写转换为批量写,减少了磁盘臂的移动开销,从而大大地提升了数据库的写入性能.然而,读性能却也因此受... 近年来Log-Structured-Merge(LSM)Tree在NoSQL系统中得到了广泛地应用.主要是因为LSM Tree架构提出了延迟更新和批量写入的算法,将随机写转换为批量写,减少了磁盘臂的移动开销,从而大大地提升了数据库的写入性能.然而,读性能却也因此受到影响.LSM Tree和B Tree之间的本质区别使得NoSQL系统不适宜直接引用B Tree作为辅助索引结构.本文实现了LSM Tree下的一种分布式辅助索引结构,提出针对这种读写分离架构的索引批量加载策略,并对LSM Tree的查询计划树进行了缓冲优化,避免了重复的查询解析,使得索引读的性能得到了相应的提升. 展开更多
关键词 辅助索引 日志结构合并树 NOSQL
在线阅读 下载PDF
基于SSD-SMR混合存储的LSM树键值存储系统的性能优化 被引量:5
13
作者 王洋洋 韦皓诚 柴云鹏 《计算机科学》 CSCD 北大核心 2018年第7期61-65,89,共6页
大数据对存储系统的可扩展性、性能和成本等方面提出了更高的要求。瓦记录(Shingled Magnetic Recording,SMR)硬盘由于存储密度高、价格便宜,正逐步被广泛应用于大数据存储系统。但是,SMR硬盘的随机写性能较差,与快速的基于闪存的固态硬... 大数据对存储系统的可扩展性、性能和成本等方面提出了更高的要求。瓦记录(Shingled Magnetic Recording,SMR)硬盘由于存储密度高、价格便宜,正逐步被广泛应用于大数据存储系统。但是,SMR硬盘的随机写性能较差,与快速的基于闪存的固态硬盘(Solid State Drive,SSD)一起构成混合存储时可以显著提升性能。同时,基于写优化的日志结构合并(Log-Structured Merge,LSM)树的键值存储已被广泛应用于许多NoSQL系统,如BigTable,Cassandra和HBase等。因此,如何基于新型的SSD-SMR混合存储构建出高性能的LSM树键值存储系统是一个具有很大研究价值的问题。首先建立基于SSD-SMR混合存储的LSM树键值系统的性能模型,然后针对SSD和SMR的硬件特征以及LSM树键值存储的软件特点,设计了一套面向SSD-SMR混合存储进行性能优化的LSM树键值存储系统,并基于LevelDB实现了该系统。在仅仅使用0.4%~2%空间的SSD的情况下,所提方法可以使SSD-SMR混合存储方案比普通磁盘方案的随机写性能提高20%,随机读性能提高5倍。 展开更多
关键词 大数据 日志合并树 瓦记录磁盘 闪存 混合存储
在线阅读 下载PDF
用于联盟链的布隆过滤器优化 被引量:3
14
作者 吴亦涵 黄建华 +1 位作者 邵兴辉 王诚 《应用科学学报》 CAS CSCD 北大核心 2022年第4期611-622,共12页
布隆过滤器常用于联盟链Hyperledger Fabric状态数据库LevelDB的读性能优化,但布隆过滤器本身存在误报现象,且LevelDB只能对布隆过滤器进行统一配置而无法自适应调整。为此,提出一种单元化的部分计数式布隆过滤器(partial counting Bloo... 布隆过滤器常用于联盟链Hyperledger Fabric状态数据库LevelDB的读性能优化,但布隆过滤器本身存在误报现象,且LevelDB只能对布隆过滤器进行统一配置而无法自适应调整。为此,提出一种单元化的部分计数式布隆过滤器(partial counting Bloom filter,PCBF)构造方案,设计可并行计算的元素插入与查询机制并结合双重哈希及非加密哈希来实现快速插入与查询;基于开启过滤器单元与访问次数构建排序字符串表优先级,使用时间片轮询算法对过滤器单元进行自适应调整,实现了资源的合理分配。实验结果表明:PCBF具有较高的插入效率,并能减少20%左右的误报数量,适用于联盟链的高并发场景。 展开更多
关键词 区块链 Hyperledger Fabric LevelDB 布隆过滤器 日志结构合并树
在线阅读 下载PDF
基于LSM树的键值存储系统技术研究综述 被引量:2
15
作者 吕萌 华文镝 谢平 《计算机科学》 CSCD 北大核心 2023年第8期1-15,共15页
键值存储是数据库最简单的组织形式。在数据密集型的应用场景中,键值存储系统发挥着关键的作用。随着对及时数据分析需求的增加,良好的系统性能变得越来越重要。目前大多数键值存储系统的存储引擎都是日志结构合并树(Log-Structured Mer... 键值存储是数据库最简单的组织形式。在数据密集型的应用场景中,键值存储系统发挥着关键的作用。随着对及时数据分析需求的增加,良好的系统性能变得越来越重要。目前大多数键值存储系统的存储引擎都是日志结构合并树(Log-Structured Merge Tree, LSM树)。因具有卓越的写性能,LSM树被广泛应用于写密集型的场景和现代NoSQL系统的存储层。与传统的B树相比,LSM树采用顺序写入的访问模式,并使用内存缓冲区来批处理新的写入线程,因此LSM树具有更大的写优势。然而,数据的重复读写和不必要的压缩操作导致了LSM树的读写放大问题,从而严重影响了系统的性能,尤其在数据密集型的应用场景。如今,研究人员做了大量工作来缓解这些问题,文中研究了影响LSM树性能的各个因素,搜集了大量提升基于LSM树的键值系统性能的文献,并对其加以整理和分类,讨论它们的优势和权衡,使读者可以了解基于LSM树的存储技术及其优化策略,最后调查了几个具有代表性的基于LSM树的键值存储技术并讨论了潜在的未来研究方向。 展开更多
关键词 LSM树 NOSQL 存储管理 键值系统 数据检索
在线阅读 下载PDF
基于增量学习的RocksDB键值系统主动缓存机制 被引量:1
16
作者 骆克云 叶保留 +2 位作者 唐斌 梅峰 卢文达 《计算机应用》 CSCD 北大核心 2020年第2期321-327,共7页
由于分层结构的约束,基于日志结构合并(LSM)树的RocksDB键值存储系统面临着读取性能低下的问题。一种有效的解决方法是对热点数据进行主动缓存,但其面临两个挑战:一是如何在数据分布持续动态变化时对热点数据进行预测,二是如何将主动缓... 由于分层结构的约束,基于日志结构合并(LSM)树的RocksDB键值存储系统面临着读取性能低下的问题。一种有效的解决方法是对热点数据进行主动缓存,但其面临两个挑战:一是如何在数据分布持续动态变化时对热点数据进行预测,二是如何将主动缓存机制与RocksDB存储结构衔接起来。针对这些挑战,基于预测分析技术,构建了由数据采集、系统交互、系统测试等部分组成的面向RocksDB键值系统的主动缓存框架,能够将热点数据缓存在LSM树的较低层级中;并对数据访问模式进行建模,设计并实现了基于增量学习的热点数据预测分析方法,能够有效减少存储介质的I/O访问次数。实验结果表明该机制能有效提升RocksDB在不同动态工作负载下的数据读取性能。 展开更多
关键词 RocksDB 主动缓存 增量学习 日志结构合并树
在线阅读 下载PDF
面向键值存储的日志结构合并树优化技术 被引量:4
17
作者 吴尚宇 谢婧雯 王毅 《计算机研究与发展》 EI CSCD 北大核心 2020年第11期2432-2441,共10页
日志结构合并树(log-structured merge tree, LSM-Tree)是一种针对写优化的数据结构,广泛应用于当代主流键值存储系统之中,用于处理当今世界海量多样化的数据.LSM-Tree通过批量处理的方式将随机写请求转换为顺序写请求,以保持极高的写效... 日志结构合并树(log-structured merge tree, LSM-Tree)是一种针对写优化的数据结构,广泛应用于当代主流键值存储系统之中,用于处理当今世界海量多样化的数据.LSM-Tree通过批量处理的方式将随机写请求转换为顺序写请求,以保持极高的写效率.但LSM-Tree仍存在2个不足:一是数据的流动方向是单向的且固定不变.存储在LSM-Tree底部的数据将被一直保留底部,直到它们成为旧数据被压缩操作删除.访问这些数据将使读放大问题变得更加严重.二是LSM-Tree中的数据分布并未考虑访问频率的影响,这将导致访问延迟不平衡的问题.访问高频的低层数据将产生更高的访问延迟.提出了一种基于访问频率分布的上浮式键值存储结构(floating key-value, FloatKV).FloatKV首先在内存中提出了一种新的数据存储结构(LRU and FIFO, LRFO),其次在外存中设计了一种基于访问频率分布的上浮式键值存储策略.FloatKV记录外存中数据的访问频率,并根据访问频率来调整数据的存储位置,以减少访问延迟.为了验证FloatKV的可行性以及性能,使用标准数据库性能测试工具YSCB(yahoo! cloud serving benchmark)来进行评估,并将FloatKV与当前主流的技术进行比较.实验结果表明,FloatKV能够显著地提高读效率,并有效地减少了读放大问题. 展开更多
关键词 计算机体系结构 键值存储 日志结构合并树 访问频率 数据上浮
在线阅读 下载PDF
基于SCM与SSD的混合高效键值存储系统研究 被引量:1
18
作者 詹玲 张艺文 《计算机工程与应用》 CSCD 北大核心 2021年第19期97-103,共7页
具有高性能以及非易失特性的SCM(Storage Class Memory,存储级内存)技术逐渐成熟并开始运用到存储系统设计中,而传统的SSD仍然在存储容量上具有优势,为键值存储系统提供大容量存储的支持。现有键值存储系统不能充分发挥SCM与SSD混合存... 具有高性能以及非易失特性的SCM(Storage Class Memory,存储级内存)技术逐渐成熟并开始运用到存储系统设计中,而传统的SSD仍然在存储容量上具有优势,为键值存储系统提供大容量存储的支持。现有键值存储系统不能充分发挥SCM与SSD混合存储架构的优势,需要对数据布局以及系统结构进行重新设计。针对SCM和SSD的特点,设计了基于SCM与SSD的混合式高效键值存储系统(SCM and SSD Hybrid Key-Valuestore,SSHKV)。SSHKV通过将键值存储中元数据信息存储到SCM中,将数据部分以日志方式存储到SSD中,实现性能与容量的兼顾。在SSD空间管理上,SSHKV采用逻辑空间放大策略,通过重映射TRIM指令释放的无效空间,减小了垃圾回收带来的数据迁移开销。SSHKV基于半异步半同步式IO模型实现,经过对比测试,SSHKV的随机写入性能相较于传统基于LSM-Tree的LevelDB提升了约20倍。 展开更多
关键词 键值存储 存储级内存 固态存储 日志结构合并树
在线阅读 下载PDF
面向内存表的可动态配置预写日志框架
19
作者 朱海铭 黄向东 +1 位作者 乔嘉林 王建民 《计算机科学与探索》 CSCD 北大核心 2023年第11期2777-2783,共7页
通常情况下,NoSQL数据库管理系统启动后,其多个数据库或数据分区的预写日志(WAL)会固定地写入一个或多个日志文件,因而形成强耦合的对应关系。由于数据库逻辑模型与分区配置是由应用业务和计算环境所决定的,在预写日志被强耦合的情况下... 通常情况下,NoSQL数据库管理系统启动后,其多个数据库或数据分区的预写日志(WAL)会固定地写入一个或多个日志文件,因而形成强耦合的对应关系。由于数据库逻辑模型与分区配置是由应用业务和计算环境所决定的,在预写日志被强耦合的情况下,数据库管理系统无法对预写日志的个数、大小等进行配置以实现性能调优。针对该问题,提出了一种面向内存表的可动态配置预写日志框架,该框架记录了重写日志,内存表可以动态地被分配给不同的预写日志队列,支持可变的对应关系,实现了预写日志与具体应用之间的解耦。在物联网时序数据库Apache IoTDB上实现了该框架,并进行了相关实验,结果表明使用可动态配置预写日志框架后可以找到比强耦合的预写日志更优的配置方案,写入性能可提高8%~19%,说明该框架能针对不同计算环境和应用负载实现动态性能调优。 展开更多
关键词 预写日志(WAL) 重写日志 日志结构合并树(LSM) 时序数据库
在线阅读 下载PDF
日志结构合并树的查询优化技术
20
作者 孙家博 蔡鹏 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第5期94-103,共10页
针对基于日志结构合并树(Log Structured Merge Tree, LSM-tree)的数据库查询性能较差的问题,目前的研究工作主要集中在利用索引和缓存技术提升LSM-tree的查询性能.本文主要从以下几个方面对LSM-tree的查询优化技术进行了综述.第一,介绍... 针对基于日志结构合并树(Log Structured Merge Tree, LSM-tree)的数据库查询性能较差的问题,目前的研究工作主要集中在利用索引和缓存技术提升LSM-tree的查询性能.本文主要从以下几个方面对LSM-tree的查询优化技术进行了综述.第一,介绍了LSM-tree的基础架构,分析了影响查询的因素.第二,分析了当前的LSM-tree查询优化技术,包括索引优化技术和缓存优化技术.第三,分析了索引和缓存技术是如何提升基于LSM-tree的数据库查询性能的,并总结了一些现有的研究工作.最后,总结并给出了未来可能的研究方法. 展开更多
关键词 日志结构合并树 索引 缓存
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部