期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
14
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
LINPACK与机群系统的LINPACK测试
被引量:
15
1
作者
都志辉
吴博
+3 位作者
刘鹏
陈渝
王小鸽
李三立
《计算机科学》
CSCD
北大核心
2002年第5期8-10,59,共4页
一、引言 LINPACK[1,2,7]是一个用Fortran语言编写的线性代数软件包,主要用于求解线性方程和线性最小平方问题.该软件包提供了各种线性系统中的求解方法,比如各种各样的矩阵运算,可以从文[2]得到完整的LINPACK软件包.LINPACK的初衷并不...
一、引言 LINPACK[1,2,7]是一个用Fortran语言编写的线性代数软件包,主要用于求解线性方程和线性最小平方问题.该软件包提供了各种线性系统中的求解方法,比如各种各样的矩阵运算,可以从文[2]得到完整的LINPACK软件包.LINPACK的初衷并不是制订一个测试计算机性能的统一标准,而只是提供一些常用的计算方法的实现,但是由于该软件包的广泛使用,这样就为通过LINPACK例程来比较不同计算机的性能提供了可能.
展开更多
关键词
线性代数软件包
linpack
机群系统
测试
并行计算机
在线阅读
下载PDF
职称材料
Linpack并行性能模型及其预测
被引量:
6
2
作者
王申
漆锋滨
+1 位作者
谷洪峰
潘治
《计算机工程》
CAS
CSCD
2012年第16期81-84,共4页
通过分析大规模Linpack的主要时间开销,建立关于矩阵规模、网络带宽、下三角方程求解效率以及矩阵乘法效率的Linpack并行性能模型。在神威蓝光和神威4000A上分别对该模型进行可信性验证,结果证明,该模型能较好地估计主要因素的改变对Lin...
通过分析大规模Linpack的主要时间开销,建立关于矩阵规模、网络带宽、下三角方程求解效率以及矩阵乘法效率的Linpack并行性能模型。在神威蓝光和神威4000A上分别对该模型进行可信性验证,结果证明,该模型能较好地估计主要因素的改变对Linpack并行性能的影响,尤其在大规模矩阵情况下预测误差不到1%。
展开更多
关键词
linpack
测试
并行性能模型
预测
矩阵规模
网络带宽
在线阅读
下载PDF
职称材料
一个实用高性能PC集群的Linpack测试与分析
被引量:
8
3
作者
肖明旺
许坚
+1 位作者
车永刚
王正华
《计算机应用研究》
CSCD
北大核心
2004年第9期183-184,187,共3页
HPL是LinpackBenchmark的并行版本,是高性能并行计算机系统性能评测的标准测试程序,对公正、全面、系统地评价机器的浮点性能具有重要意义。基于一个8节点的PC集群,测试了该集群的Linpack性能。根据实验数据,得出了集群性能与集群节点...
HPL是LinpackBenchmark的并行版本,是高性能并行计算机系统性能评测的标准测试程序,对公正、全面、系统地评价机器的浮点性能具有重要意义。基于一个8节点的PC集群,测试了该集群的Linpack性能。根据实验数据,得出了集群性能与集群节点数之间近似线性关系的结论,并给出了处理器维数、问题规模与系统性能之间的关系。
展开更多
关键词
PC集群
性能评价
基准测试
HPL
在线阅读
下载PDF
职称材料
异构高性能计算系统Linpack效率受限因素分析
被引量:
1
4
作者
贾迅
邬贵明
谢向辉
《计算机工程与科学》
CSCD
北大核心
2018年第2期224-230,共7页
能耗是目前高性能计算系统性能提升的一大挑战。主处理器连接加速器的异构计算技术可以有效提升系统能效,因而被广泛应用于当前高性能计算系统的设计。同等系统规模下,异构计算系统的Linpack效率普遍低于同构系统。针对这一问题,从结构...
能耗是目前高性能计算系统性能提升的一大挑战。主处理器连接加速器的异构计算技术可以有效提升系统能效,因而被广泛应用于当前高性能计算系统的设计。同等系统规模下,异构计算系统的Linpack效率普遍低于同构系统。针对这一问题,从结构设计的角度,基于真实计算系统的设计参数和性能数据,分析了大规模异构高性能计算系统Linpack效率受限的主要因素及其对结构设计的需求,并构建了针对异构计算系统的Linpack性能模型对分析结论进行了验证。研究成果对异构计算系统Linpack的性能优化以及未来高效异构架构的设计具有一定的指导意义。
展开更多
关键词
异构
高性能
linpack
效率
在线阅读
下载PDF
职称材料
面向龙芯3A体系结构的BLAS库优化
被引量:
9
5
作者
何颂颂
顾乃杰
+1 位作者
朱海涛
刘燕君
《小型微型计算机系统》
CSCD
北大核心
2012年第3期571-575,共5页
双精度普通矩阵乘法DGEMM是BLAS库中最核心的函数之一,大部分三级BLAS库函数的核心计算都是通过调用DGEM M来实现的.该文针对龙芯3A具有128位访存指令的特点,通过理论分析,找到了最佳的循环展开方式;针对龙芯3A的Cache替换策略(随机替...
双精度普通矩阵乘法DGEMM是BLAS库中最核心的函数之一,大部分三级BLAS库函数的核心计算都是通过调用DGEM M来实现的.该文针对龙芯3A具有128位访存指令的特点,通过理论分析,找到了最佳的循环展开方式;针对龙芯3A的Cache替换策略(随机替换),通过使用地址交错技术,减少了Cache的冲突失效;针对龙芯3A访存带宽有限的问题,通过使用共享数据的任务划分方式,减少了数据访存量.优化后的DGEMM单核和多核运算速度均是性能最高的开源BLAS库(Goto-BLAS)的2倍多.
展开更多
关键词
矩阵乘法
BLAS
任务划分
linpack
在线阅读
下载PDF
职称材料
HPL测试性能仿真与预测
被引量:
13
6
作者
张文力
陈明宇
樊建平
《计算机研究与发展》
EI
CSCD
北大核心
2006年第3期557-562,共6页
HPL是大规模并行系统广泛采用的Linpack测试软件包.在HPL程序算法分析和实践测试的基础上,发掘了理论确定矩阵分块大小NB的规律,突破了长期以来对尝试性实验的依赖.进而将算法复杂性的估算提升到测试程序执行时间的精度,并建立HPL测试...
HPL是大规模并行系统广泛采用的Linpack测试软件包.在HPL程序算法分析和实践测试的基础上,发掘了理论确定矩阵分块大小NB的规律,突破了长期以来对尝试性实验的依赖.进而将算法复杂性的估算提升到测试程序执行时间的精度,并建立HPL测试仿真模型,对执行时间进行更细致的评估.同时,在大量真实测试验证的基础上,利用该模型对各种系统性能提高因素将带给Linpack测试的益处进行预见,期望为体系的改进方向提供参考.
展开更多
关键词
高性能
linpack
测试软件包(HPL)
线性代数方程组
LU分解
MPI
在线阅读
下载PDF
职称材料
面向异构计算机平台的HPL方案
7
作者
孙乔
孙家昶
+1 位作者
马文静
赵玉文
《软件学报》
EI
CSCD
北大核心
2021年第8期2329-2340,共12页
HPL(high performance Linpack)是一套被广泛用于测评计算机性能的测试程序,几十年来学术界及产业界十分关注对HPL测试程序的定制化优化工作,以充分反应同时代新兴计算机平台的性能.面向当今主流多设备异构计算平台,尝试为HPL的优化工...
HPL(high performance Linpack)是一套被广泛用于测评计算机性能的测试程序,几十年来学术界及产业界十分关注对HPL测试程序的定制化优化工作,以充分反应同时代新兴计算机平台的性能.面向当今主流多设备异构计算平台,尝试为HPL的优化工作提供一种解决方案:Hetero-HPL.在Hetero-HPL中,进程与协处理器的对应关系可被改变,因此HPL算法在单节点独立运行情况下可以完全避免进程间数据传输开销.算法各个重要步骤有能力完全利用物理节点的所有资源,如内存容量、CPU核心、协处理器、PCI-e总线等.Hetero-HPL并不引入冗余计算量及通信量,并在任意设备数量下妥善应对锁页内存分配限制,确保多设备负载均衡和设备内高效的大规模同质运算.在实验平台上,Hetero-HPL效率可以达到平台峰值性能的76.5%(其中,dgemm函数效率为84%).进一步的实验结果表明,Hetero-HPL在多节点联机运行情况下也是一种可行的方案.
展开更多
关键词
HPL(high
performance
linpack
)
多设备异构平台
并行计算
在线阅读
下载PDF
职称材料
南京大学高性能计算中心建设的探索与实践
被引量:
16
8
作者
盛乐标
游伟倩
周庆林
《实验技术与管理》
CAS
北大核心
2013年第11期144-146,共3页
随着对高性能计算资源需求的日益增长,部分高校开始采购大型的高性能计算集群。南京大学在这方面起步得比较早,并在国内率先成立了高性能计算中心。该文针对高性能计算中心的建设进行了介绍并展开探讨。
关键词
高性能计算
中心建设
科学计算
集群管理
linpack
测试
在线阅读
下载PDF
职称材料
基于混合精度算法的改进HPL软件包
被引量:
2
9
作者
王磊
张云泉
+1 位作者
刘芳芳
张先轶
《计算机工程》
CAS
CSCD
北大核心
2010年第19期47-49,共3页
利用求解线性方程组的混合精度算法,对HPL软件包进行改进。从性能与加速比、迭代时间与迭代次数以及误差分析3个方面,在四路AMD Opteron870双核处理器平台上,对原HPL与改进的HPL软件包进行对比测试。实验结果表明,改进的HPL软件包在保...
利用求解线性方程组的混合精度算法,对HPL软件包进行改进。从性能与加速比、迭代时间与迭代次数以及误差分析3个方面,在四路AMD Opteron870双核处理器平台上,对原HPL与改进的HPL软件包进行对比测试。实验结果表明,改进的HPL软件包在保证双精度浮点精度要求的前提下,计算性能大约提高1倍,并具有良好的可扩展性。
展开更多
关键词
混合精度算法
HPL软件包
加速比
在线阅读
下载PDF
职称材料
基于龙芯3A2000处理器的高性能Goto BLAS库的实现
被引量:
1
10
作者
张华亮
黄启印
吴少校
《高技术通讯》
CAS
CSCD
北大核心
2016年第10期825-832,共8页
用Linpack测试集测试了计算机系统浮点性能,测试用函数运算库为Goto BLAS库。该库对Linpach的测试结果有很大影响。为了提高Goto BLAS性能,观察了Goto BLAS库在龙芯3A2000处理器平台的性能表现,分析了测试软件的执行流程、数据的处理方...
用Linpack测试集测试了计算机系统浮点性能,测试用函数运算库为Goto BLAS库。该库对Linpach的测试结果有很大影响。为了提高Goto BLAS性能,观察了Goto BLAS库在龙芯3A2000处理器平台的性能表现,分析了测试软件的执行流程、数据的处理方法,根据处理器的结构特点,合理配置矩阵分块参数,优化核心循环的实现方案,同时采用软硬件数据预取技术及优化的内核TLB配置策略。在这些优化方法的共同作用下,仿真平台上核心函数的浮点部件效率超过90%。优化方案在本实验中取得了显著的效果。
展开更多
关键词
Goto
BLAS
性能优化
linpack
矩阵运算
数据预取
在线阅读
下载PDF
职称材料
高性能水利科学计算平台测试分析
被引量:
2
11
作者
邓超
朱星明
《中国水利水电科学研究院学报》
2009年第1期51-56,共6页
高性能计算是解决大规模复杂水利水电系统分析计算的有效途径。高性能计算机是高性能计算的平台和基础,对高性能计算机的计算能力进行测试分析是了解设备性能,提高运算效率,指导专业应用的基础性工作。本文结合中国水科院高性能科学计...
高性能计算是解决大规模复杂水利水电系统分析计算的有效途径。高性能计算机是高性能计算的平台和基础,对高性能计算机的计算能力进行测试分析是了解设备性能,提高运算效率,指导专业应用的基础性工作。本文结合中国水科院高性能科学计算平台的升级,利用国际惯用的基准测试算法(LinPACK测试、LLCBench测试和NPB测试)对平台的串行和并行计算能力、并行计算效率等计算指标进行测试分析。分析结果显示了该平台高效的并行计算性能,以及对专业程序可移植性具有良好的支持。
展开更多
关键词
水利科学计算
高性能计算
linpack
HPL
LLCBench
NPB
在线阅读
下载PDF
职称材料
日本“京”跨越1亿亿次
12
《计算机研究与发展》
EI
CSCD
北大核心
2011年第12期2410-2410,共1页
日本RIKEN高级计算科学研究院(AICS)、富士通宣布,世界上最快的超级计算机"京"(K Computer)已经成功提速,Linpack测试的最大计算性能达到了10.51PFlops,也就是每秒钟1.051亿亿次浮点计算,
关键词
日本
linpack
超级计算机
科学研究院
计算性能
浮点计算
富士通
在线阅读
下载PDF
职称材料
中国首台超百万亿次超级计算机曙光5000A下线
13
《计算机研究与发展》
EI
CSCD
北大核心
2008年第11期1994-1994,共1页
日前,中国首台超百万亿次超级计算机曙光5000A在曙光天津产业基地正式下线.这标志着中国成为继美国后世界上第2个自主设计并制造百万亿次高性能计算机的国家.据曙光天津产业基地有关负责人介绍,5000A是曙光5000系列产品之一,其系...
日前,中国首台超百万亿次超级计算机曙光5000A在曙光天津产业基地正式下线.这标志着中国成为继美国后世界上第2个自主设计并制造百万亿次高性能计算机的国家.据曙光天津产业基地有关负责人介绍,5000A是曙光5000系列产品之一,其系统峰值运算速度可达到每秒230万亿次浮点运算,LINPACK运算速度超过每秒160万亿次浮点运算,是目前中国速度最快的商用高性能计算机.曙光5000A将落户上海超级计算中心.
展开更多
关键词
超级计算机
中国
下线
上海超级计算中心
高性能计算机
linpack
运算速度
产业基地
在线阅读
下载PDF
职称材料
我国百万亿次超高性能计算机落户上海
14
作者
靳力
瞭望
《航天器工程》
2008年第4期117-117,共1页
关键词
高性能计算机
上海
中国科学院计算所
linpack
万亿次计算机
使用能力
计算机中心
曙光公司
在线阅读
下载PDF
职称材料
题名
LINPACK与机群系统的LINPACK测试
被引量:
15
1
作者
都志辉
吴博
刘鹏
陈渝
王小鸽
李三立
机构
清华大学计算机系
出处
《计算机科学》
CSCD
北大核心
2002年第5期8-10,59,共4页
文摘
一、引言 LINPACK[1,2,7]是一个用Fortran语言编写的线性代数软件包,主要用于求解线性方程和线性最小平方问题.该软件包提供了各种线性系统中的求解方法,比如各种各样的矩阵运算,可以从文[2]得到完整的LINPACK软件包.LINPACK的初衷并不是制订一个测试计算机性能的统一标准,而只是提供一些常用的计算方法的实现,但是由于该软件包的广泛使用,这样就为通过LINPACK例程来比较不同计算机的性能提供了可能.
关键词
线性代数软件包
linpack
机群系统
测试
并行计算机
Keywords
linpack
,
linpack
Benchmark, Cluster System
分类号
O245 [理学—计算数学]
TP338.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
Linpack并行性能模型及其预测
被引量:
6
2
作者
王申
漆锋滨
谷洪峰
潘治
机构
江南计算技术研究所
出处
《计算机工程》
CAS
CSCD
2012年第16期81-84,共4页
文摘
通过分析大规模Linpack的主要时间开销,建立关于矩阵规模、网络带宽、下三角方程求解效率以及矩阵乘法效率的Linpack并行性能模型。在神威蓝光和神威4000A上分别对该模型进行可信性验证,结果证明,该模型能较好地估计主要因素的改变对Linpack并行性能的影响,尤其在大规模矩阵情况下预测误差不到1%。
关键词
linpack
测试
并行性能模型
预测
矩阵规模
网络带宽
Keywords
linpack
test
parallel performance model
prediction
matrix scale
network bandwith
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一个实用高性能PC集群的Linpack测试与分析
被引量:
8
3
作者
肖明旺
许坚
车永刚
王正华
机构
国防科学技术大学计算机学院
出处
《计算机应用研究》
CSCD
北大核心
2004年第9期183-184,187,共3页
基金
国家自然科学基金重点资助项目(69933030)
文摘
HPL是LinpackBenchmark的并行版本,是高性能并行计算机系统性能评测的标准测试程序,对公正、全面、系统地评价机器的浮点性能具有重要意义。基于一个8节点的PC集群,测试了该集群的Linpack性能。根据实验数据,得出了集群性能与集群节点数之间近似线性关系的结论,并给出了处理器维数、问题规模与系统性能之间的关系。
关键词
PC集群
性能评价
基准测试
HPL
Keywords
PC Cluster
Performance Evaluation
Benchmark
HPL(High Performance
linpack
)
分类号
TP311.11 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
异构高性能计算系统Linpack效率受限因素分析
被引量:
1
4
作者
贾迅
邬贵明
谢向辉
机构
数学工程与先进计算国家重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2018年第2期224-230,共7页
基金
国家自然科学基金(91430214)
文摘
能耗是目前高性能计算系统性能提升的一大挑战。主处理器连接加速器的异构计算技术可以有效提升系统能效,因而被广泛应用于当前高性能计算系统的设计。同等系统规模下,异构计算系统的Linpack效率普遍低于同构系统。针对这一问题,从结构设计的角度,基于真实计算系统的设计参数和性能数据,分析了大规模异构高性能计算系统Linpack效率受限的主要因素及其对结构设计的需求,并构建了针对异构计算系统的Linpack性能模型对分析结论进行了验证。研究成果对异构计算系统Linpack的性能优化以及未来高效异构架构的设计具有一定的指导意义。
关键词
异构
高性能
linpack
效率
Keywords
heterogeneous
high performance
linpack
efficiency
分类号
TP303 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
面向龙芯3A体系结构的BLAS库优化
被引量:
9
5
作者
何颂颂
顾乃杰
朱海涛
刘燕君
机构
中国科学技术大学计算机科学与技术学院
安徽省计算与通讯软件重点实验室
中国科学院计算技术研究所
安徽大学计算机科学与技术学院
出处
《小型微型计算机系统》
CSCD
北大核心
2012年第3期571-575,共5页
基金
国家"八六三"高技术研究发展计划项目(2008AA010902)资助
国家自然科学基金项目(60833004)资助
文摘
双精度普通矩阵乘法DGEMM是BLAS库中最核心的函数之一,大部分三级BLAS库函数的核心计算都是通过调用DGEM M来实现的.该文针对龙芯3A具有128位访存指令的特点,通过理论分析,找到了最佳的循环展开方式;针对龙芯3A的Cache替换策略(随机替换),通过使用地址交错技术,减少了Cache的冲突失效;针对龙芯3A访存带宽有限的问题,通过使用共享数据的任务划分方式,减少了数据访存量.优化后的DGEMM单核和多核运算速度均是性能最高的开源BLAS库(Goto-BLAS)的2倍多.
关键词
矩阵乘法
BLAS
任务划分
linpack
Keywords
matrix multiplication
BLAS
division of tasks
linpack
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
HPL测试性能仿真与预测
被引量:
13
6
作者
张文力
陈明宇
樊建平
机构
中国科学院计算技术研究所
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第3期557-562,共6页
基金
国家"八六三"高技术研究发展计划基金项目(2003AA1Z2070)
中国科学院知识创新工程基金项目~~
文摘
HPL是大规模并行系统广泛采用的Linpack测试软件包.在HPL程序算法分析和实践测试的基础上,发掘了理论确定矩阵分块大小NB的规律,突破了长期以来对尝试性实验的依赖.进而将算法复杂性的估算提升到测试程序执行时间的精度,并建立HPL测试仿真模型,对执行时间进行更细致的评估.同时,在大量真实测试验证的基础上,利用该模型对各种系统性能提高因素将带给Linpack测试的益处进行预见,期望为体系的改进方向提供参考.
关键词
高性能
linpack
测试软件包(HPL)
线性代数方程组
LU分解
MPI
Keywords
high performance
linpack
(HPL)
linear algebra equations
LU factorization
MPI
分类号
TP303 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
面向异构计算机平台的HPL方案
7
作者
孙乔
孙家昶
马文静
赵玉文
机构
中国科学院软件研究所并行软件与计算科学实验室
计算机科学国家重点实验室(中国科学院软件研究所)
中国科学院大学
出处
《软件学报》
EI
CSCD
北大核心
2021年第8期2329-2340,共12页
基金
国家重点研发计划(2018YFB0204404)
中国科学院战略性先导科技专项(C类)(XDC01030200)。
文摘
HPL(high performance Linpack)是一套被广泛用于测评计算机性能的测试程序,几十年来学术界及产业界十分关注对HPL测试程序的定制化优化工作,以充分反应同时代新兴计算机平台的性能.面向当今主流多设备异构计算平台,尝试为HPL的优化工作提供一种解决方案:Hetero-HPL.在Hetero-HPL中,进程与协处理器的对应关系可被改变,因此HPL算法在单节点独立运行情况下可以完全避免进程间数据传输开销.算法各个重要步骤有能力完全利用物理节点的所有资源,如内存容量、CPU核心、协处理器、PCI-e总线等.Hetero-HPL并不引入冗余计算量及通信量,并在任意设备数量下妥善应对锁页内存分配限制,确保多设备负载均衡和设备内高效的大规模同质运算.在实验平台上,Hetero-HPL效率可以达到平台峰值性能的76.5%(其中,dgemm函数效率为84%).进一步的实验结果表明,Hetero-HPL在多节点联机运行情况下也是一种可行的方案.
关键词
HPL(high
performance
linpack
)
多设备异构平台
并行计算
Keywords
HPL(high performance
linpack
)
multi-device heterogeneous platform
parallel computing
分类号
TP303 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
南京大学高性能计算中心建设的探索与实践
被引量:
16
8
作者
盛乐标
游伟倩
周庆林
机构
南京大学高性能计算中心
出处
《实验技术与管理》
CAS
北大核心
2013年第11期144-146,共3页
文摘
随着对高性能计算资源需求的日益增长,部分高校开始采购大型的高性能计算集群。南京大学在这方面起步得比较早,并在国内率先成立了高性能计算中心。该文针对高性能计算中心的建设进行了介绍并展开探讨。
关键词
高性能计算
中心建设
科学计算
集群管理
linpack
测试
Keywords
high performance computation
construction of center
scientific computation
clustermanagement
linpack
test
分类号
G642.0 [文化科学—高等教育学]
TP302 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于混合精度算法的改进HPL软件包
被引量:
2
9
作者
王磊
张云泉
刘芳芳
张先轶
机构
中国科学院软件所并行计算实验室
中国科学院计算机科学国家重点实验室
中国科学院研究生院
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第19期47-49,共3页
基金
国家自然科学基金资助项目(60303020)
国家自然科学基金资助重点项目(60533020)
+1 种基金
国家"863"计划基金资助项目(2006AA01A102
2006AA01A125)
文摘
利用求解线性方程组的混合精度算法,对HPL软件包进行改进。从性能与加速比、迭代时间与迭代次数以及误差分析3个方面,在四路AMD Opteron870双核处理器平台上,对原HPL与改进的HPL软件包进行对比测试。实验结果表明,改进的HPL软件包在保证双精度浮点精度要求的前提下,计算性能大约提高1倍,并具有良好的可扩展性。
关键词
混合精度算法
HPL软件包
加速比
Keywords
mixed precision algorithm
High Performance
linpack
(HPL) software package
speedup ratio
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于龙芯3A2000处理器的高性能Goto BLAS库的实现
被引量:
1
10
作者
张华亮
黄启印
吴少校
机构
中国科学院计算技术研究所计算机体系结构国家重点实验室
中国科学院大学
龙芯中科技术有限公司
出处
《高技术通讯》
CAS
CSCD
北大核心
2016年第10期825-832,共8页
基金
"核高基"科技重大专项课题(2014ZX01020201)
863计划(2012AA012202
2013AA014301)资助项目
文摘
用Linpack测试集测试了计算机系统浮点性能,测试用函数运算库为Goto BLAS库。该库对Linpach的测试结果有很大影响。为了提高Goto BLAS性能,观察了Goto BLAS库在龙芯3A2000处理器平台的性能表现,分析了测试软件的执行流程、数据的处理方法,根据处理器的结构特点,合理配置矩阵分块参数,优化核心循环的实现方案,同时采用软硬件数据预取技术及优化的内核TLB配置策略。在这些优化方法的共同作用下,仿真平台上核心函数的浮点部件效率超过90%。优化方案在本实验中取得了显著的效果。
关键词
Goto
BLAS
性能优化
linpack
矩阵运算
数据预取
Keywords
Goto BLAS
performance optimization
linpack
matrix operations
data prefetching
分类号
TP332 [自动化与计算机技术—计算机系统结构]
TP306 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
高性能水利科学计算平台测试分析
被引量:
2
11
作者
邓超
朱星明
机构
中国水利水电科学研究院信息网络中心
中国水利水电科学研究院科研管理和规划计划处
出处
《中国水利水电科学研究院学报》
2009年第1期51-56,共6页
基金
水利部"948"项目(200703)
文摘
高性能计算是解决大规模复杂水利水电系统分析计算的有效途径。高性能计算机是高性能计算的平台和基础,对高性能计算机的计算能力进行测试分析是了解设备性能,提高运算效率,指导专业应用的基础性工作。本文结合中国水科院高性能科学计算平台的升级,利用国际惯用的基准测试算法(LinPACK测试、LLCBench测试和NPB测试)对平台的串行和并行计算能力、并行计算效率等计算指标进行测试分析。分析结果显示了该平台高效的并行计算性能,以及对专业程序可移植性具有良好的支持。
关键词
水利科学计算
高性能计算
linpack
HPL
LLCBench
NPB
Keywords
water resources and hydropower scientific computation
high performance computation
linpack
LLCBench
NPB
分类号
TV214 [水利工程—水文学及水资源]
在线阅读
下载PDF
职称材料
题名
日本“京”跨越1亿亿次
12
出处
《计算机研究与发展》
EI
CSCD
北大核心
2011年第12期2410-2410,共1页
文摘
日本RIKEN高级计算科学研究院(AICS)、富士通宣布,世界上最快的超级计算机"京"(K Computer)已经成功提速,Linpack测试的最大计算性能达到了10.51PFlops,也就是每秒钟1.051亿亿次浮点计算,
关键词
日本
linpack
超级计算机
科学研究院
计算性能
浮点计算
富士通
分类号
TP338.4 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
中国首台超百万亿次超级计算机曙光5000A下线
13
出处
《计算机研究与发展》
EI
CSCD
北大核心
2008年第11期1994-1994,共1页
文摘
日前,中国首台超百万亿次超级计算机曙光5000A在曙光天津产业基地正式下线.这标志着中国成为继美国后世界上第2个自主设计并制造百万亿次高性能计算机的国家.据曙光天津产业基地有关负责人介绍,5000A是曙光5000系列产品之一,其系统峰值运算速度可达到每秒230万亿次浮点运算,LINPACK运算速度超过每秒160万亿次浮点运算,是目前中国速度最快的商用高性能计算机.曙光5000A将落户上海超级计算中心.
关键词
超级计算机
中国
下线
上海超级计算中心
高性能计算机
linpack
运算速度
产业基地
分类号
TP338.4 [自动化与计算机技术—计算机系统结构]
U469.11 [机械工程—车辆工程]
在线阅读
下载PDF
职称材料
题名
我国百万亿次超高性能计算机落户上海
14
作者
靳力
瞭望
出处
《航天器工程》
2008年第4期117-117,共1页
关键词
高性能计算机
上海
中国科学院计算所
linpack
万亿次计算机
使用能力
计算机中心
曙光公司
分类号
F426.6 [经济管理—产业经济]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
LINPACK与机群系统的LINPACK测试
都志辉
吴博
刘鹏
陈渝
王小鸽
李三立
《计算机科学》
CSCD
北大核心
2002
15
在线阅读
下载PDF
职称材料
2
Linpack并行性能模型及其预测
王申
漆锋滨
谷洪峰
潘治
《计算机工程》
CAS
CSCD
2012
6
在线阅读
下载PDF
职称材料
3
一个实用高性能PC集群的Linpack测试与分析
肖明旺
许坚
车永刚
王正华
《计算机应用研究》
CSCD
北大核心
2004
8
在线阅读
下载PDF
职称材料
4
异构高性能计算系统Linpack效率受限因素分析
贾迅
邬贵明
谢向辉
《计算机工程与科学》
CSCD
北大核心
2018
1
在线阅读
下载PDF
职称材料
5
面向龙芯3A体系结构的BLAS库优化
何颂颂
顾乃杰
朱海涛
刘燕君
《小型微型计算机系统》
CSCD
北大核心
2012
9
在线阅读
下载PDF
职称材料
6
HPL测试性能仿真与预测
张文力
陈明宇
樊建平
《计算机研究与发展》
EI
CSCD
北大核心
2006
13
在线阅读
下载PDF
职称材料
7
面向异构计算机平台的HPL方案
孙乔
孙家昶
马文静
赵玉文
《软件学报》
EI
CSCD
北大核心
2021
0
在线阅读
下载PDF
职称材料
8
南京大学高性能计算中心建设的探索与实践
盛乐标
游伟倩
周庆林
《实验技术与管理》
CAS
北大核心
2013
16
在线阅读
下载PDF
职称材料
9
基于混合精度算法的改进HPL软件包
王磊
张云泉
刘芳芳
张先轶
《计算机工程》
CAS
CSCD
北大核心
2010
2
在线阅读
下载PDF
职称材料
10
基于龙芯3A2000处理器的高性能Goto BLAS库的实现
张华亮
黄启印
吴少校
《高技术通讯》
CAS
CSCD
北大核心
2016
1
在线阅读
下载PDF
职称材料
11
高性能水利科学计算平台测试分析
邓超
朱星明
《中国水利水电科学研究院学报》
2009
2
在线阅读
下载PDF
职称材料
12
日本“京”跨越1亿亿次
《计算机研究与发展》
EI
CSCD
北大核心
2011
0
在线阅读
下载PDF
职称材料
13
中国首台超百万亿次超级计算机曙光5000A下线
《计算机研究与发展》
EI
CSCD
北大核心
2008
0
在线阅读
下载PDF
职称材料
14
我国百万亿次超高性能计算机落户上海
靳力
瞭望
《航天器工程》
2008
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部