-
题名开放式计算语言加速的分段前缀和并行算法
- 1
-
-
作者
肖汉
李彩林
郭宝云
周清雷
-
机构
郑州师范学院信息科学与技术学院
山东理工大学建筑工程学院
郑州大学信息工程学院
-
出处
《科学技术与工程》
北大核心
2019年第31期215-221,共7页
-
基金
国家自然科学基金(61572444、41601496、41701525)
山东省自然科学基金(ZR2017LD002)
山东省重点研发计划项目(2018GGX106002)资助
-
文摘
针对数值计算中前缀和运算数据量大、耗时巨大这一难题,提出了一种基于开放式计算语言(open computing language,OpenCL)的分段式前缀和并行算法。首先进行了分段式前缀和算法的并行性分析,对任务进行了层次化分解与组合,设计了两级并行的分段式前缀和算法;然后通过OpenCL编程将前缀和并行算法映射到CPU+GPU系统平台上,实现了层次化并行前缀和处理;最后,根据计算单元(compute unit,CU)的资源条件,增加CU中本地存储器的分配,通过改进工作节点的访问模式来降低bank冲突,提高访存速度。实验结果表明,与基于AMD Opteron 2439 SE CPU的串行算法、基于OpenMP(open multi-processing)并行算法和基于统一计算设备架构并行算法性能相比,前缀和并行算法在OpenCL架构下NVIDIA Tesla C2075计算平台上分别获得了33.51倍、6.26倍和2.41倍的加速比。验证了提出的并行优化方法的有效性和性能可移植性。
-
关键词
分段式前缀和
图形处理器
开放式计算语言
并行算法
性能优化
-
Keywords
segmented prefix sum
graphic processing unit
open computing language
parallel algorithm
performance optimization
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-