期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于直接内存访问和动态共享缓冲区的超长向量归约操作硬件卸载结构与方法
1
作者 徐金波 戴艺 翦杰 《计算机工程与科学》 北大核心 2025年第4期571-581,共11页
MPI聚合通信通过将多个计算结点的多个进程组织起来协同完成一系列通信操作,以提高系统性能。其中,超长操作数向量的归约操作在高性能计算和AI计算中应用广泛。提出了一种基于DMA和动态共享缓冲区的超长向量归约操作的硬件卸载结构与方... MPI聚合通信通过将多个计算结点的多个进程组织起来协同完成一系列通信操作,以提高系统性能。其中,超长操作数向量的归约操作在高性能计算和AI计算中应用广泛。提出了一种基于DMA和动态共享缓冲区的超长向量归约操作的硬件卸载结构与方法。通过专用硬件通信序列触发机制,实现聚合通信硬件卸载流程的控制;通过DMA传输协议提升归约操作数的软硬件传输效率;提出片上动态共享缓冲区存储结构,以实现大量操作数的灵活高效缓存;通过部署片上ALU阵列,直接在网络芯片中完成计算。实验结果表明,相对于MPI非卸载方式和“天河”原有卸载方式均有明显的加速效果,尤其是当归约向量长度较大时,加速效果显著提升。 展开更多
关键词 聚合通信 归约 直接内存访问 动态共享缓冲区 硬件卸载
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部