-
题名基于FPGA和行折叠的稀疏矩阵向量乘优化
- 1
-
-
作者
周智
高建花
计卫星
-
机构
北京理工大学计算机学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2024年第8期1340-1348,共9页
-
文摘
稀疏矩阵向量乘(SpMV)是科学与工程计算中的一个关键内核。由于稀疏矩阵中不规则的数据分布和SpMV计算中不规则的访存操作,SpMV在多核CPU和GPU等设备上的性能与这些设备的理论峰值还具有较大差距。现有的CPU和GPU由于在架构上受到限制,导致它们无法很好地利用稀疏矩阵的特殊结构来加速SpMV计算,而现场可编程门阵列(FPGA)可以通过自定义电路实现高效的并行运算,能够更好地处理稀疏矩阵的计算和存储问题。基于FPGA提出了一种SpMV优化方法,该优化方法基于高级综合的流式处理引擎,采用了一种自适应多行折叠的SpMV优化策略。该方法通过行折叠减少了处理引擎中零元的无效存储和计算,从而提升了基于FPGA的SpMV计算性能。实验结果表明,相比于现有的FPGA实现方案,设计的基于行折叠优化的数据流引擎实现了最高1.78倍和平均1.15倍的加速。
-
关键词
稀疏矩阵向量乘
现场可编程门阵列
高级综合
行折叠
-
Keywords
sparse matrix-vector multiplication
field-programmable gate array
high-level synthesis
row folding
-
分类号
TP492
[自动化与计算机技术]
O246
[理学—计算数学]
-