期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
小规模非规则TRSM实现与优化
1
作者 郭容园 贾海鹏 +4 位作者 张云泉 韦存阳 邓明森 陈婧蕊 周振亚 《计算机研究与发展》 北大核心 2025年第2期517-531,共15页
TRSM(triangular matrix equation solver)是线性方程组求解的常用算法,是各种科学计算库和数学软件的核心算法,广泛应用于科学计算、工程计算、机器学习等领域.小规模非规则TRSM算法限定解决问题范围,是高效处理较小规模、非规则数据... TRSM(triangular matrix equation solver)是线性方程组求解的常用算法,是各种科学计算库和数学软件的核心算法,广泛应用于科学计算、工程计算、机器学习等领域.小规模非规则TRSM算法限定解决问题范围,是高效处理较小规模、非规则数据输入的算法.随着高性能计算领域个性化、精细化发展,科学界、工业界对小规模非规则TRSM计算的需求愈加明显.传统算法更偏重于大规模、规则TRSM的计算,在小规模非规则TRSM计算上效率不佳.结合硬件体系结构、应用场景特征提出小规模非规则TRSM优化方案,从寄存器分块、边界处理、向量化计算角度设计高性能内核,在此基础上构建覆盖双精度实数、双精度复数的小规模非规则算法库SI_TRSM(small-scale irregular TRSM),大幅度提升该算法性能.实验结果表明,构建的双精度小规模非规则TRSM算法库,较MKL(Intel math kernel library)同类算法,在双精度小规模非规则实数上平均性能提高29.4倍,在双精度小规模非规则复数上平均性能提高24.6倍. 展开更多
关键词 TRSM算法 BLAS 小规模非规则 SIMD 汇编优化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部