期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
PDM-Shuffle:基于被动分离式内存的数据混洗系统设计
1
作者 程丽云 吴婧雅 +2 位作者 卢文岩 钟浪辉 鄢贵海 《高技术通讯》 北大核心 2025年第4期370-384,共15页
利用存算分离架构,可以将数据混洗的计算和存储过程解耦,从而提高分布式数据处理应用的可扩展性。然而,将混洗数据传输到远端存储节点的过程增加了额外网络开销,存储节点将成为新的通信瓶颈。为应对引入存算分离架构后数据混洗过程面临... 利用存算分离架构,可以将数据混洗的计算和存储过程解耦,从而提高分布式数据处理应用的可扩展性。然而,将混洗数据传输到远端存储节点的过程增加了额外网络开销,存储节点将成为新的通信瓶颈。为应对引入存算分离架构后数据混洗过程面临的新挑战,本文提出一种基于被动分离式内存的数据混洗(passive disaggregated memoryshuffle,PDM-Shuffle)系统,利用新型一致性总线互连协议计算快速链接(compute express link,CXL)直连共享内存设备存储并交换混洗中间数据,避免了数据的硬盘存储及传输控制协议/网际协议(transmission control protocol/Internet protocol,TCP/IP)的传输过程。鉴于内存设备仅支持被动数据写入,本文采用了内存预分区和元数据控制节点分配内存地址等方法来保证同分区数据的预聚合和共享内存的一致性访问管理。实验结果表明,在处理大规模数据集时,与传统的集中式架构相比,PDM-Shuffle系统可将排序和图计算的综合类应用程序Terasort和PageRank的单个作业完成时间分别减少49%和65%,相对于存算分离架构下已有的优化方案Zeus,分别提升了36%和18%。 展开更多
关键词 数据混洗 存算分离 分离式内存系统 计算快速链接 内存一致性 预聚合
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部