期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于混合精度算法的改进HPL软件包 被引量:2
1
作者 王磊 张云泉 +1 位作者 刘芳芳 张先轶 《计算机工程》 CAS CSCD 北大核心 2010年第19期47-49,共3页
利用求解线性方程组的混合精度算法,对HPL软件包进行改进。从性能与加速比、迭代时间与迭代次数以及误差分析3个方面,在四路AMD Opteron870双核处理器平台上,对原HPL与改进的HPL软件包进行对比测试。实验结果表明,改进的HPL软件包在保... 利用求解线性方程组的混合精度算法,对HPL软件包进行改进。从性能与加速比、迭代时间与迭代次数以及误差分析3个方面,在四路AMD Opteron870双核处理器平台上,对原HPL与改进的HPL软件包进行对比测试。实验结果表明,改进的HPL软件包在保证双精度浮点精度要求的前提下,计算性能大约提高1倍,并具有良好的可扩展性。 展开更多
关键词 混合精度算法 HPL软件包 加速比
在线阅读 下载PDF
PLASMA自适应调优与性能优化的设计与实现
2
作者 吕渐春 张云泉 +1 位作者 王婷 肖玄基 《计算机科学》 CSCD 北大核心 2012年第4期282-286,共5页
PLASMA是一个高效的线性代数软件包,其数据分布结合分堆、细粒度并行以及乱序执行机制等大大提高了程序的性能。但PLASMA仍然存在一些问题,比如分块大小对程序性能的影响非常大,以及产生了大量的数据拷贝等。通过对比传统的LAPACK和PLA... PLASMA是一个高效的线性代数软件包,其数据分布结合分堆、细粒度并行以及乱序执行机制等大大提高了程序的性能。但PLASMA仍然存在一些问题,比如分块大小对程序性能的影响非常大,以及产生了大量的数据拷贝等。通过对比传统的LAPACK和PLASMA的实现机制,分析了PLASMA中存在的优势和不足,介绍了两种弥补PLASMA自身不足的方法。针对PLASMA的架构,经过大量的测试与分析,提出了边缘矩阵的概念并分析了其对性能的影响,据此提出了一种自适应调优的方法。并通过数据拷贝与计算并行的运行方式,进一步提高了PLASMA性能,最后通过大量的测试验证了该优化方法的效果。 展开更多
关键词 LAPACK PLASMA 自适应调优 优化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部