期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
太湖之光上利用OpenACC移植和优化GTC-P
被引量:
9
1
作者
王一超
林新华
+5 位作者
蔡林金
Tang William
Ethier Stephane
王蓓
施忠伟
松岗聪
《计算机研究与发展》
EI
CSCD
北大核心
2018年第4期875-884,共10页
神威"太湖之光"是最新一期Top500榜单上排名第一的超级计算机,实测峰值性能约93PFLOPS.该系统提供了基于指导语句的并行编程工具OpenACC,兼容OpenACC 2.0编程标准,并添加了部分定制化功能.GTC-P是一个具有重要物理意义的科学...
神威"太湖之光"是最新一期Top500榜单上排名第一的超级计算机,实测峰值性能约93PFLOPS.该系统提供了基于指导语句的并行编程工具OpenACC,兼容OpenACC 2.0编程标准,并添加了部分定制化功能.GTC-P是一个具有重要物理意义的科学应用,算法基于高性能计算领域中被广泛使用的PIC(particle-in-cell)方法.利用神威OpenACC并行编程模型在"太湖之光"上成功移植了GTC-P应用.在移植过程中,鉴于OpenACC编译器尚无法解决的性能瓶颈,提出了3种基于中间代码二次开发的优化方法:1)消除原子操作;2)避免低效的全局访存操作;3)手动添加SIMD intrinsics指令.实验结果表明,在64个从核上相比1个主核,优化后的函数charge和push分别实现了1.6倍和8.6倍的加速比,同时GTC-P代码整体取得了2.5倍的加速比.优化结果证明了基于中间代码的手动优化对利用神威OpenACC移植的PIC算法在"太湖之光"上的性能提升非常重要.
展开更多
关键词
太湖之光
GTC-P
PIC算法
神威
OpenACC
在线阅读
下载PDF
职称材料
使用GTC-P应用评估曙光E级原型机的性能
被引量:
1
2
作者
王一超
胡航
+2 位作者
William Tang
王蓓
林新华
《计算机工程与科学》
CSCD
北大核心
2020年第1期1-7,共7页
曙光E级原型机是我国“十三五”计划中3台原型系统之一,该系统采用异构计算架构,CPU和加速器选用AMD授权的国产海光处理器架构。除了采用基准测试程序对芯片进行测试外,为探究真实应用在该原型机上的性能,移植了激光等离子体应用GTC-P,...
曙光E级原型机是我国“十三五”计划中3台原型系统之一,该系统采用异构计算架构,CPU和加速器选用AMD授权的国产海光处理器架构。除了采用基准测试程序对芯片进行测试外,为探究真实应用在该原型机上的性能,移植了激光等离子体应用GTC-P,对比了GTC-P在海光CPU和DCU与Intel 6148 CPU和NVIDIA V100 GPU上的性能,并在原型机的多结点上进行了扩展性分析。性能评估工作反映了高性能计算应用在曙光E级原型机上的实际运行性能。
展开更多
关键词
曙光E级原型机
性能评测
质点网格法
ROCm
HIP模型
在线阅读
下载PDF
职称材料
题名
太湖之光上利用OpenACC移植和优化GTC-P
被引量:
9
1
作者
王一超
林新华
蔡林金
Tang William
Ethier Stephane
王蓓
施忠伟
松岗聪
机构
上海交通
大学
高性能计算中心
东京工业
大学
普林斯顿大学等离子体物理实验室
英伟达公司
出处
《计算机研究与发展》
EI
CSCD
北大核心
2018年第4期875-884,共10页
基金
国家重点研发计划项目(2016YFB0201400
2016YFB0201800)
+2 种基金
美国自然科学基金跨学科合作项目(ACI-1440733)
NVIDIA GPU全球卓越中心
日本学术振兴会RONPAKU项目(113209)~~
文摘
神威"太湖之光"是最新一期Top500榜单上排名第一的超级计算机,实测峰值性能约93PFLOPS.该系统提供了基于指导语句的并行编程工具OpenACC,兼容OpenACC 2.0编程标准,并添加了部分定制化功能.GTC-P是一个具有重要物理意义的科学应用,算法基于高性能计算领域中被广泛使用的PIC(particle-in-cell)方法.利用神威OpenACC并行编程模型在"太湖之光"上成功移植了GTC-P应用.在移植过程中,鉴于OpenACC编译器尚无法解决的性能瓶颈,提出了3种基于中间代码二次开发的优化方法:1)消除原子操作;2)避免低效的全局访存操作;3)手动添加SIMD intrinsics指令.实验结果表明,在64个从核上相比1个主核,优化后的函数charge和push分别实现了1.6倍和8.6倍的加速比,同时GTC-P代码整体取得了2.5倍的加速比.优化结果证明了基于中间代码的手动优化对利用神威OpenACC移植的PIC算法在"太湖之光"上的性能提升非常重要.
关键词
太湖之光
GTC-P
PIC算法
神威
OpenACC
Keywords
TaihuLight
GTC-P
particle-in-cell(PIC)
Sunway
OpenACC
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
使用GTC-P应用评估曙光E级原型机的性能
被引量:
1
2
作者
王一超
胡航
William Tang
王蓓
林新华
机构
上海交通
大学
高性能计算中心
普林斯顿大学等离子体物理实验室
出处
《计算机工程与科学》
CSCD
北大核心
2020年第1期1-7,共7页
基金
国家重点研发计划(2016YFB0201800)
文摘
曙光E级原型机是我国“十三五”计划中3台原型系统之一,该系统采用异构计算架构,CPU和加速器选用AMD授权的国产海光处理器架构。除了采用基准测试程序对芯片进行测试外,为探究真实应用在该原型机上的性能,移植了激光等离子体应用GTC-P,对比了GTC-P在海光CPU和DCU与Intel 6148 CPU和NVIDIA V100 GPU上的性能,并在原型机的多结点上进行了扩展性分析。性能评估工作反映了高性能计算应用在曙光E级原型机上的实际运行性能。
关键词
曙光E级原型机
性能评测
质点网格法
ROCm
HIP模型
Keywords
Sugon exascale prototype
performance evaluation
particle-in-cell
ROCm HIP model
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
太湖之光上利用OpenACC移植和优化GTC-P
王一超
林新华
蔡林金
Tang William
Ethier Stephane
王蓓
施忠伟
松岗聪
《计算机研究与发展》
EI
CSCD
北大核心
2018
9
在线阅读
下载PDF
职称材料
2
使用GTC-P应用评估曙光E级原型机的性能
王一超
胡航
William Tang
王蓓
林新华
《计算机工程与科学》
CSCD
北大核心
2020
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部