-
题名MIMD众核架构ILU分解并行算法优化研究
- 1
-
-
作者
石永振
莫淏天
胡星宇
刘杰
王庆林
-
机构
国防科技大学高端装备数字化软件湖南省重点实验室
国防科技大学并行与分布计算全国重点实验室
-
出处
《计算机工程与科学》
北大核心
2025年第9期1544-1554,共11页
-
基金
国家重点研发计划(2023YFA1011704,2021YFBO300101)。
-
文摘
ILU分解被广泛应用于求解大规模稀疏线性系统,能够有效减少迭代次数、提高求解效率,但限于线性系统的数据依赖性和分解过程中计算访存的不规则,较难进行高效的并行优化。多指令多数据(MIMD)众核架构中众多并行计算线程可以执行不同的指令,对于控制流不规则的算法具有天然的适应性。基于MIMD众核架构PEZY-SC3s处理器开展ILU分解并行算法优化研究,提出了一种面向MIMD架构的ILU并行算法,并采用基于图着色的并行性优化、基于向量单元的访存优化、基于线程分组的负载平衡优化以及基于片上局部存储的数据局部性优化等措施来优化算法性能。实验结果表明,所提ILU并行分解算法与Intel^(R)Xeon^(R)4314 CPU上MKL实现和NVIDIA^(R)A30 GPU上cuSPARSE实现相比,分别获得了16.70与1.39的平均加速比。
-
关键词
ILU分解
mimd众核架构
并行计算
-
Keywords
incomplete LU factorization
mimd many-core architecture
parallel computing
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-