期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
LINPACK与机群系统的LINPACK测试 被引量:15
1
作者 都志辉 吴博 +3 位作者 刘鹏 陈渝 王小鸽 李三立 《计算机科学》 CSCD 北大核心 2002年第5期8-10,59,共4页
一、引言 LINPACK[1,2,7]是一个用Fortran语言编写的线性代数软件包,主要用于求解线性方程和线性最小平方问题.该软件包提供了各种线性系统中的求解方法,比如各种各样的矩阵运算,可以从文[2]得到完整的LINPACK软件包.LINPACK的初衷并不... 一、引言 LINPACK[1,2,7]是一个用Fortran语言编写的线性代数软件包,主要用于求解线性方程和线性最小平方问题.该软件包提供了各种线性系统中的求解方法,比如各种各样的矩阵运算,可以从文[2]得到完整的LINPACK软件包.LINPACK的初衷并不是制订一个测试计算机性能的统一标准,而只是提供一些常用的计算方法的实现,但是由于该软件包的广泛使用,这样就为通过LINPACK例程来比较不同计算机的性能提供了可能. 展开更多
关键词 线性代数软件包 linpack 机群系统 测试 并行计算机
在线阅读 下载PDF
Linpack并行性能模型及其预测 被引量:6
2
作者 王申 漆锋滨 +1 位作者 谷洪峰 潘治 《计算机工程》 CAS CSCD 2012年第16期81-84,共4页
通过分析大规模Linpack的主要时间开销,建立关于矩阵规模、网络带宽、下三角方程求解效率以及矩阵乘法效率的Linpack并行性能模型。在神威蓝光和神威4000A上分别对该模型进行可信性验证,结果证明,该模型能较好地估计主要因素的改变对Lin... 通过分析大规模Linpack的主要时间开销,建立关于矩阵规模、网络带宽、下三角方程求解效率以及矩阵乘法效率的Linpack并行性能模型。在神威蓝光和神威4000A上分别对该模型进行可信性验证,结果证明,该模型能较好地估计主要因素的改变对Linpack并行性能的影响,尤其在大规模矩阵情况下预测误差不到1%。 展开更多
关键词 linpack测试 并行性能模型 预测 矩阵规模 网络带宽
在线阅读 下载PDF
一个实用高性能PC集群的Linpack测试与分析 被引量:8
3
作者 肖明旺 许坚 +1 位作者 车永刚 王正华 《计算机应用研究》 CSCD 北大核心 2004年第9期183-184,187,共3页
HPL是LinpackBenchmark的并行版本,是高性能并行计算机系统性能评测的标准测试程序,对公正、全面、系统地评价机器的浮点性能具有重要意义。基于一个8节点的PC集群,测试了该集群的Linpack性能。根据实验数据,得出了集群性能与集群节点... HPL是LinpackBenchmark的并行版本,是高性能并行计算机系统性能评测的标准测试程序,对公正、全面、系统地评价机器的浮点性能具有重要意义。基于一个8节点的PC集群,测试了该集群的Linpack性能。根据实验数据,得出了集群性能与集群节点数之间近似线性关系的结论,并给出了处理器维数、问题规模与系统性能之间的关系。 展开更多
关键词 PC集群 性能评价 基准测试 HPL
在线阅读 下载PDF
异构高性能计算系统Linpack效率受限因素分析 被引量:1
4
作者 贾迅 邬贵明 谢向辉 《计算机工程与科学》 CSCD 北大核心 2018年第2期224-230,共7页
能耗是目前高性能计算系统性能提升的一大挑战。主处理器连接加速器的异构计算技术可以有效提升系统能效,因而被广泛应用于当前高性能计算系统的设计。同等系统规模下,异构计算系统的Linpack效率普遍低于同构系统。针对这一问题,从结构... 能耗是目前高性能计算系统性能提升的一大挑战。主处理器连接加速器的异构计算技术可以有效提升系统能效,因而被广泛应用于当前高性能计算系统的设计。同等系统规模下,异构计算系统的Linpack效率普遍低于同构系统。针对这一问题,从结构设计的角度,基于真实计算系统的设计参数和性能数据,分析了大规模异构高性能计算系统Linpack效率受限的主要因素及其对结构设计的需求,并构建了针对异构计算系统的Linpack性能模型对分析结论进行了验证。研究成果对异构计算系统Linpack的性能优化以及未来高效异构架构的设计具有一定的指导意义。 展开更多
关键词 异构 高性能 linpack 效率
在线阅读 下载PDF
面向龙芯3A体系结构的BLAS库优化 被引量:9
5
作者 何颂颂 顾乃杰 +1 位作者 朱海涛 刘燕君 《小型微型计算机系统》 CSCD 北大核心 2012年第3期571-575,共5页
双精度普通矩阵乘法DGEMM是BLAS库中最核心的函数之一,大部分三级BLAS库函数的核心计算都是通过调用DGEM M来实现的.该文针对龙芯3A具有128位访存指令的特点,通过理论分析,找到了最佳的循环展开方式;针对龙芯3A的Cache替换策略(随机替... 双精度普通矩阵乘法DGEMM是BLAS库中最核心的函数之一,大部分三级BLAS库函数的核心计算都是通过调用DGEM M来实现的.该文针对龙芯3A具有128位访存指令的特点,通过理论分析,找到了最佳的循环展开方式;针对龙芯3A的Cache替换策略(随机替换),通过使用地址交错技术,减少了Cache的冲突失效;针对龙芯3A访存带宽有限的问题,通过使用共享数据的任务划分方式,减少了数据访存量.优化后的DGEMM单核和多核运算速度均是性能最高的开源BLAS库(Goto-BLAS)的2倍多. 展开更多
关键词 矩阵乘法 BLAS 任务划分 linpack
在线阅读 下载PDF
HPL测试性能仿真与预测 被引量:13
6
作者 张文力 陈明宇 樊建平 《计算机研究与发展》 EI CSCD 北大核心 2006年第3期557-562,共6页
HPL是大规模并行系统广泛采用的Linpack测试软件包.在HPL程序算法分析和实践测试的基础上,发掘了理论确定矩阵分块大小NB的规律,突破了长期以来对尝试性实验的依赖.进而将算法复杂性的估算提升到测试程序执行时间的精度,并建立HPL测试... HPL是大规模并行系统广泛采用的Linpack测试软件包.在HPL程序算法分析和实践测试的基础上,发掘了理论确定矩阵分块大小NB的规律,突破了长期以来对尝试性实验的依赖.进而将算法复杂性的估算提升到测试程序执行时间的精度,并建立HPL测试仿真模型,对执行时间进行更细致的评估.同时,在大量真实测试验证的基础上,利用该模型对各种系统性能提高因素将带给Linpack测试的益处进行预见,期望为体系的改进方向提供参考. 展开更多
关键词 高性能linpack测试软件包(HPL) 线性代数方程组 LU分解 MPI
在线阅读 下载PDF
面向异构计算机平台的HPL方案
7
作者 孙乔 孙家昶 +1 位作者 马文静 赵玉文 《软件学报》 EI CSCD 北大核心 2021年第8期2329-2340,共12页
HPL(high performance Linpack)是一套被广泛用于测评计算机性能的测试程序,几十年来学术界及产业界十分关注对HPL测试程序的定制化优化工作,以充分反应同时代新兴计算机平台的性能.面向当今主流多设备异构计算平台,尝试为HPL的优化工... HPL(high performance Linpack)是一套被广泛用于测评计算机性能的测试程序,几十年来学术界及产业界十分关注对HPL测试程序的定制化优化工作,以充分反应同时代新兴计算机平台的性能.面向当今主流多设备异构计算平台,尝试为HPL的优化工作提供一种解决方案:Hetero-HPL.在Hetero-HPL中,进程与协处理器的对应关系可被改变,因此HPL算法在单节点独立运行情况下可以完全避免进程间数据传输开销.算法各个重要步骤有能力完全利用物理节点的所有资源,如内存容量、CPU核心、协处理器、PCI-e总线等.Hetero-HPL并不引入冗余计算量及通信量,并在任意设备数量下妥善应对锁页内存分配限制,确保多设备负载均衡和设备内高效的大规模同质运算.在实验平台上,Hetero-HPL效率可以达到平台峰值性能的76.5%(其中,dgemm函数效率为84%).进一步的实验结果表明,Hetero-HPL在多节点联机运行情况下也是一种可行的方案. 展开更多
关键词 HPL(high performance linpack) 多设备异构平台 并行计算
在线阅读 下载PDF
南京大学高性能计算中心建设的探索与实践 被引量:16
8
作者 盛乐标 游伟倩 周庆林 《实验技术与管理》 CAS 北大核心 2013年第11期144-146,共3页
随着对高性能计算资源需求的日益增长,部分高校开始采购大型的高性能计算集群。南京大学在这方面起步得比较早,并在国内率先成立了高性能计算中心。该文针对高性能计算中心的建设进行了介绍并展开探讨。
关键词 高性能计算 中心建设 科学计算 集群管理 linpack测试
在线阅读 下载PDF
基于混合精度算法的改进HPL软件包 被引量:2
9
作者 王磊 张云泉 +1 位作者 刘芳芳 张先轶 《计算机工程》 CAS CSCD 北大核心 2010年第19期47-49,共3页
利用求解线性方程组的混合精度算法,对HPL软件包进行改进。从性能与加速比、迭代时间与迭代次数以及误差分析3个方面,在四路AMD Opteron870双核处理器平台上,对原HPL与改进的HPL软件包进行对比测试。实验结果表明,改进的HPL软件包在保... 利用求解线性方程组的混合精度算法,对HPL软件包进行改进。从性能与加速比、迭代时间与迭代次数以及误差分析3个方面,在四路AMD Opteron870双核处理器平台上,对原HPL与改进的HPL软件包进行对比测试。实验结果表明,改进的HPL软件包在保证双精度浮点精度要求的前提下,计算性能大约提高1倍,并具有良好的可扩展性。 展开更多
关键词 混合精度算法 HPL软件包 加速比
在线阅读 下载PDF
基于龙芯3A2000处理器的高性能Goto BLAS库的实现 被引量:1
10
作者 张华亮 黄启印 吴少校 《高技术通讯》 CAS CSCD 北大核心 2016年第10期825-832,共8页
用Linpack测试集测试了计算机系统浮点性能,测试用函数运算库为Goto BLAS库。该库对Linpach的测试结果有很大影响。为了提高Goto BLAS性能,观察了Goto BLAS库在龙芯3A2000处理器平台的性能表现,分析了测试软件的执行流程、数据的处理方... 用Linpack测试集测试了计算机系统浮点性能,测试用函数运算库为Goto BLAS库。该库对Linpach的测试结果有很大影响。为了提高Goto BLAS性能,观察了Goto BLAS库在龙芯3A2000处理器平台的性能表现,分析了测试软件的执行流程、数据的处理方法,根据处理器的结构特点,合理配置矩阵分块参数,优化核心循环的实现方案,同时采用软硬件数据预取技术及优化的内核TLB配置策略。在这些优化方法的共同作用下,仿真平台上核心函数的浮点部件效率超过90%。优化方案在本实验中取得了显著的效果。 展开更多
关键词 Goto BLAS 性能优化 linpack 矩阵运算 数据预取
在线阅读 下载PDF
高性能水利科学计算平台测试分析 被引量:2
11
作者 邓超 朱星明 《中国水利水电科学研究院学报》 2009年第1期51-56,共6页
高性能计算是解决大规模复杂水利水电系统分析计算的有效途径。高性能计算机是高性能计算的平台和基础,对高性能计算机的计算能力进行测试分析是了解设备性能,提高运算效率,指导专业应用的基础性工作。本文结合中国水科院高性能科学计... 高性能计算是解决大规模复杂水利水电系统分析计算的有效途径。高性能计算机是高性能计算的平台和基础,对高性能计算机的计算能力进行测试分析是了解设备性能,提高运算效率,指导专业应用的基础性工作。本文结合中国水科院高性能科学计算平台的升级,利用国际惯用的基准测试算法(LinPACK测试、LLCBench测试和NPB测试)对平台的串行和并行计算能力、并行计算效率等计算指标进行测试分析。分析结果显示了该平台高效的并行计算性能,以及对专业程序可移植性具有良好的支持。 展开更多
关键词 水利科学计算 高性能计算 linpack HPL LLCBench NPB
在线阅读 下载PDF
日本“京”跨越1亿亿次
12
《计算机研究与发展》 EI CSCD 北大核心 2011年第12期2410-2410,共1页
日本RIKEN高级计算科学研究院(AICS)、富士通宣布,世界上最快的超级计算机"京"(K Computer)已经成功提速,Linpack测试的最大计算性能达到了10.51PFlops,也就是每秒钟1.051亿亿次浮点计算,
关键词 日本 linpack 超级计算机 科学研究院 计算性能 浮点计算 富士通
在线阅读 下载PDF
中国首台超百万亿次超级计算机曙光5000A下线
13
《计算机研究与发展》 EI CSCD 北大核心 2008年第11期1994-1994,共1页
日前,中国首台超百万亿次超级计算机曙光5000A在曙光天津产业基地正式下线.这标志着中国成为继美国后世界上第2个自主设计并制造百万亿次高性能计算机的国家.据曙光天津产业基地有关负责人介绍,5000A是曙光5000系列产品之一,其系... 日前,中国首台超百万亿次超级计算机曙光5000A在曙光天津产业基地正式下线.这标志着中国成为继美国后世界上第2个自主设计并制造百万亿次高性能计算机的国家.据曙光天津产业基地有关负责人介绍,5000A是曙光5000系列产品之一,其系统峰值运算速度可达到每秒230万亿次浮点运算,LINPACK运算速度超过每秒160万亿次浮点运算,是目前中国速度最快的商用高性能计算机.曙光5000A将落户上海超级计算中心. 展开更多
关键词 超级计算机 中国 下线 上海超级计算中心 高性能计算机 linpack 运算速度 产业基地
在线阅读 下载PDF
我国百万亿次超高性能计算机落户上海
14
作者 靳力 瞭望 《航天器工程》 2008年第4期117-117,共1页
关键词 高性能计算机 上海 中国科学院计算所 linpack 万亿次计算机 使用能力 计算机中心 曙光公司
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部