-
题名基于高预测性的稀疏矩阵向量乘法并行计算优化
被引量:2
- 1
-
-
作者
夏天
付格林
曲劭儒
罗中沛
任鹏举
-
机构
人机混合增强智能全国重点实验室(西安交通大学)
视觉信息与应用国家工程研究中心(西安交通大学)
西安交通大学人工智能与机器人研究所
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2023年第9期1973-1987,共15页
-
基金
国家重点研发计划项目(2022YFB4500500)
陕西省重点研发计划项目(2022ZDLGY01-08)。
-
文摘
稀疏矩阵向量乘法(sparse matrix-vector multiplication,SpMV)是广泛应用于科学计算、工业仿真和智能计算等领域的重要算法,是核心的计算行为之一.在一些应用场景中,需要进行多次的SpMV迭代,以完成精确的数值模拟、线性代数求解和图分析收敛等计算要求.受限于SpMV本身的高度随机性和稀疏性所导致的数据局部性极差、缓存效率极低、计算模式非常不规则等问题,导致其计算负载成为当前高性能处理器的优化难点和研究热点.基于现代高性能超标量乱序处理器的架构特征,深入研究SpMV的各类性能瓶颈,并且提出从提升可预测性和降低程序复杂度的角度进行全面的性能优化.其核心思想是:通过构建串行访问的数据结构,提升数据访问的规律性和局部性,大幅度优化数据预取效率和缓存利用效率;通过构建规则的分支跳转条件,提升程序的分支预测准确率,有效提升程序执行效率;通过灵活运用SIMD指令集,有效提升计算资源利用率.通过对以上特性的优化,该方法可以显著缓解性能瓶颈,大幅度提升处理器资源、缓存资源和访存带宽的利用率,并且获得与主流商用计算库MKL相比平均2.6倍的加速比,相比于现有最先进算法获得平均1.3倍的加速比.
-
关键词
矩阵向量乘法
稀疏矩阵计算
矩阵格式
分支预测
数据预取
-
Keywords
matrix-vector multiplication
sparse matrix computation
matrix format
branch prediction
data prefetching
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-