-
题名面向国产高性能众核处理器的编程模型
- 1
-
-
作者
陈虎
周鹏灵
-
机构
华南理工大学软件学院
广东省高性能计算重点实验室
-
出处
《计算机应用》
CSCD
北大核心
2023年第11期3517-3526,共10页
-
基金
国家自然科学基金重点项目(U1836207)
广东省高性能计算重点实验室开放课题。
-
文摘
在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一方面基于消息队列机制开发国产高性能众核处理器的线程级并行机制;另一方面基于单指令多数据流(SIMD)编程模型开发从核上的数据级并行性。首先,对国产高性能众核处理器体系结构进行抽象;其次,设计模型的消息队列机制,并为程序员提供一套异构并行编程接口,如系统参数接口、从核线程控制接口、消息队列接口、SIMD抽象接口;最后,在上述基础上形成全新的高性能计算软件开发模型和方法,方便用户开发基于国产高性能众核处理器的并行计算软件。性能传输测试结果表明,在国产众核处理器上,当启动核数较少时,所提模型的传输带宽普遍达到了峰值直接内存访问(DMA)带宽的90%;当启动的核数较多时,消息队列模型的传输带宽普遍达到了峰值DMA带宽的70%。在矩阵乘法实验中,与系统原语传输矩阵并计算的性能相比,所提模型的性能达到前者的90%;在口令猜测系统中,所提模型的代码性能与直接使用最底层的接口开发的代码性能基本持平。所提通用编程模型和支撑框架使高性能计算(HPC)软件开发更简易,并且具有更好的可移植性,可为促进国产自主HPC软件研发提供帮助。
-
关键词
国产众核处理器
单指令多数据流
并行编程模型
SW26010
消息队列模型
-
Keywords
domestic many-core processor
Single Instruction Multiple Data(SIMD)
parallel programming model
SW26010
message queue model
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-