-
题名基于混合精度算法的改进HPL软件包
被引量:2
- 1
-
-
作者
王磊
张云泉
刘芳芳
张先轶
-
机构
中国科学院软件所并行计算实验室
中国科学院计算机科学国家重点实验室
中国科学院研究生院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第19期47-49,共3页
-
基金
国家自然科学基金资助项目(60303020)
国家自然科学基金资助重点项目(60533020)
+1 种基金
国家"863"计划基金资助项目(2006AA01A102
2006AA01A125)
-
文摘
利用求解线性方程组的混合精度算法,对HPL软件包进行改进。从性能与加速比、迭代时间与迭代次数以及误差分析3个方面,在四路AMD Opteron870双核处理器平台上,对原HPL与改进的HPL软件包进行对比测试。实验结果表明,改进的HPL软件包在保证双精度浮点精度要求的前提下,计算性能大约提高1倍,并具有良好的可扩展性。
-
关键词
混合精度算法
HPL软件包
加速比
-
Keywords
mixed precision algorithm
High Performance Linpack(HPL) software package
speedup ratio
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名PLASMA自适应调优与性能优化的设计与实现
- 2
-
-
作者
吕渐春
张云泉
王婷
肖玄基
-
机构
中国科学院软件所并行计算实验室
中国科学院研究生院
-
出处
《计算机科学》
CSCD
北大核心
2012年第4期282-286,共5页
-
基金
国家"863"曙光6000千万亿次高效能计算机系统研制项目(2009AA01A129)
国家"863"高效能计算机及网格服务重大项目(2009AA01A134)
+5 种基金
国家重大专项核高基项目(2009ZX01036-001-002)
中国科学院知识创新工程重大项目课题(KGCX1-YW-13)
国家重大科研装备研制项目(ZDYZ2008-2)
国家自然科学基金项目(61100073
61133005
61100066)资助
-
文摘
PLASMA是一个高效的线性代数软件包,其数据分布结合分堆、细粒度并行以及乱序执行机制等大大提高了程序的性能。但PLASMA仍然存在一些问题,比如分块大小对程序性能的影响非常大,以及产生了大量的数据拷贝等。通过对比传统的LAPACK和PLASMA的实现机制,分析了PLASMA中存在的优势和不足,介绍了两种弥补PLASMA自身不足的方法。针对PLASMA的架构,经过大量的测试与分析,提出了边缘矩阵的概念并分析了其对性能的影响,据此提出了一种自适应调优的方法。并通过数据拷贝与计算并行的运行方式,进一步提高了PLASMA性能,最后通过大量的测试验证了该优化方法的效果。
-
关键词
LAPACK
PLASMA
自适应调优
优化
-
Keywords
LAPACK
PLASMA
Auto-tuning
Optimization
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-