期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
GOTOBLAS一般矩阵乘法高效实现机制的研究 被引量:8
1
作者 蒋孟奇 张云泉 +1 位作者 宋刚 李玉成 《计算机工程》 CAS CSCD 北大核心 2008年第7期84-86,103,共4页
对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析。结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度。对比实验表明,GOTO库的性能远远高于没... 对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析。结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度。对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库。证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性。 展开更多
关键词 GOTOBLAS库 一般矩阵乘法 存储层次 分块算法 计算模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部