-
题名面向异构加速卡的MF-DMA设计与实现
被引量:1
- 1
-
-
作者
朱兴洪
张振荣
陈奕君
-
机构
广西大学计算机与电子信息学院
-
出处
《计算机工程与设计》
北大核心
2024年第11期3486-3491,共6页
-
基金
广西自然科学重点基金项目(2021GXNFDA076001)。
-
文摘
为解决加速卡在异构系统中数据传输带宽低、数据交互方式不灵活的问题,提出一种多功能直接内存访问(multiple functions direct memory access,MF-DMA)架构。采用寄存器配置、存储表和描述符环3种DMA触发方式,适应不同应用数据传输需求;为支持数据流传输和数据块缓存,DMA架构支持AXIS和AXI4两种标准协议接口;设计在Xilinx芯片xczu7ev进行验证,AXIS和AXI4接口最高速率分别为5075 MB/s和4800 MB/s,PCIe总线带宽利用率为79.2%,FPGA资源占用率12.9%。实验结果表明,该设计降低了硬件资源占用率,有效提高了数据传输性能。
-
关键词
可编程逻辑门阵列
异构加速系统
直接内存访问
加速卡
高级扩展接口
高速串行总线
描述符环
-
Keywords
FPGA
heterogeneous accelerator systems
DMA
accelerators
AXI
PCIe
descriptor ring
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名PPTM:一种面向异构系统的主动式任务映射方法
- 2
-
-
作者
龚施俊
鄢贵海
李晓维
-
机构
中国科学院计算技术研究所计算机体系结构国家重点实验室
中国科学院大学
-
出处
《高技术通讯》
CAS
2022年第2期161-172,共12页
-
基金
国家自然科学基金(61872336,61572470,61532017,61432017,61521092,61376043)
中国科学院青年创新促进会(404441000)资助项目。
-
文摘
在数据高速增长的背景下,异构计算作为满足新兴应用不断提高的算力需求的有效途径,涌现了许多异构加速系统。在这些异构加速系统中,高效的任务映射是充分发挥加速器潜能提升应用程序性能的关键之一。先前工作提出了许多基于有向无环图如何最小化应用程序整体执行时间和最小化异构多处理器之间通信开销等高效的任务映射方法,这些工作通常采用将任务映射到加速器上来提高整个应用的性能。但某些应用程序如果将所有子任务全部映射到加速器上执行,会带来额外的通信开销,进而可能达不到提升性能的预期,甚至造成整个应用程序的性能下降。因此,本文提出了一种基于预测的主动式任务映射算法(PPTM)来应对这样的场景,实现高效的任务映射。实验表明,本文算法能够更准确感知计算任务的运行时状态,大幅提高应用程序的整体性能。
-
关键词
异构计算
异构加速系统
任务映射
主动式
预测算法
加速器
-
Keywords
heterogeneous computing
heterogeneous accelerating system
task mapping
proactive
prediction algorithm
accelerator
-
分类号
TP332
[自动化与计算机技术—计算机系统结构]
-