-
题名基于神威·太湖之光的非结构网格计算加速算法
被引量:1
- 1
-
-
作者
许乐
安虹
陈俊仕
张鹏飞
武铮
-
机构
中国科学技术大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第12期45-53,共9页
-
基金
国家自然科学基金“面向E级计算系统的光滑粒子流体动力学高可扩展并行计算框架”(62102389)。
-
文摘
在国产异构众核平台神威·太湖之光上的非结构网格计算具有稀疏存储、离散访存、数据依赖等特点,严重制约了众核处理器的性能发挥。为解决稀疏存储和离散访存问题,提出一种N阶对角染色算法,以有效平衡主从核计算并利用从核将全局访存转化为LDM访问。针对数据依赖造成的计算竞争问题,采用自适应和无依赖的任务划分方法,避免并行计算时的数据冲突。为对处理器架构和非结构网格计算进行优化,采用主核与从核异步并行的方式,差异化使用主从核以充分利用硬件资源,同时,取消处理器提供的寄存器通信机制,降低从核阵列的同步开销同时便于扩展到新一代神威平台。此外,使用计算访存异步重叠技术来充分隐藏访存延迟。利用SpMV、Integration、calcLudsFcc算子进行实验,结果表明,相比主核实现,组合加速算法在不同算例规模下平均取得了10倍的加速效果,加速比最高可达24倍,N阶对角染色算法相比非染色分块算法取得了超过5.8倍的性能加速,有效提升了数据局部性和计算并行度。该算法对有依赖关系的计算冲突算子同样具有良好的加速性能,验证了自适应和无依赖任务划分方法的有效性。
-
关键词
神威·太湖之光
非结构网格
众核加速
离散访存
无依赖任务划分
-
Keywords
Sunway TaihuLight
unstructured grid
many-core acceleration
discrete memory access
independent task partition
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于神威·太湖之光的非结构网格众核优化技术
被引量:6
- 2
-
-
作者
倪鸿
刘鑫
-
机构
国家并行计算机工程技术研究中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第6期45-51,共7页
-
基金
国家重点研发计划“大规模多模式多过程地球系统模式耦合平台开发”(2016YFA0602200)
-
文摘
为解决高性能计算中的非结构网格离散访存问题,以神威·太湖之光国产超级计算机为平台,根据异构众核处理器SW26010的体系结构特点,提出一种基于排序思想的通用众核优化算法,以减少非结构网格计算中的随机访存。基于网格划分原理,在O(n)时间内对生成的稀疏矩阵非零元素进行并行重排序。采用一种内部映射方式对计算向量实现扩展或变换,将细粒度访存转化为无写冲突的粗粒度访存。对多个实际应用算例的通量计算进行众核优化,结果表明,相比主核上的串行算法,该算法能够获得平均10倍以上的加速效果。
-
关键词
离散访存
非结构网格
通量计算
异构众核优化
并行排序
-
Keywords
discrete memory access
unstructured grid
flux calculation
heterogeneous multi-core optimization
parallel sorting
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-