期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于龙芯3B处理器的Linpack优化实现 被引量:3
1
作者 刘刚 张恒 +1 位作者 张滇 毛睿 《深圳大学学报(理工版)》 EI CAS 北大核心 2014年第3期286-292,共7页
HPL是高性能计算广泛采用的Linpack测试软件包.针对龙芯3B处理器体系结构的特点,为Linpack中的核心部分——矩阵乘法设计矩阵分块策略,利用龙芯3B的cache锁机制将频繁调用的数据分块锁在cache中,从而显著降低cache缺失率.同时为龙芯3B... HPL是高性能计算广泛采用的Linpack测试软件包.针对龙芯3B处理器体系结构的特点,为Linpack中的核心部分——矩阵乘法设计矩阵分块策略,利用龙芯3B的cache锁机制将频繁调用的数据分块锁在cache中,从而显著降低cache缺失率.同时为龙芯3B处理器中的访存加速部件设计了高效的预取算法,以实现计算时间掩盖访存时间.另外,分别对Linpack所调用的dtrsm和行交换等热点函数进行优化,并通过参数训练来优化Linpack参数.实验结果表明,在龙芯3B处理器上,单节点4核以及双节点8核的Linpack实测性能均达到理论峰值的60%左右,优化后的Linpack性能较优化前提升了10倍左右. 展开更多
关键词 计算机系统结构 龙芯3b处理器 线性系统软件包 矩阵乘法 数据预取
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部