期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
地球科学大规模并行应用的重叠存储优化
被引量:
5
1
作者
陈璟锟
杜云飞
《计算机研究与发展》
EI
CSCD
北大核心
2019年第4期790-797,共8页
存储是地球科学类软件的重要组成部分,周期性输出中间态和检查点会带来大量的访存操作,不恰当的访存设计会严重影响软件在大规模计算时的性能表现.针对地球科学类软件的存储问题,从软件层面提出一个重叠存储优化方法,通过设置额外的I/O...
存储是地球科学类软件的重要组成部分,周期性输出中间态和检查点会带来大量的访存操作,不恰当的访存设计会严重影响软件在大规模计算时的性能表现.针对地球科学类软件的存储问题,从软件层面提出一个重叠存储优化方法,通过设置额外的I/O进程隐藏输出过程.该重叠存储优化主要有3个优势:1)将输出和计算操作重叠在一起,实现了输出的重叠化和隐藏化;2)抑制了收集通信的开销,突破了收集操作的通信带宽瓶颈和内存限制;3)能容易地使用各种高级并行输出库函数.利用重叠存储优化了天河二号上的WRF,ROMS_AGRIF,GRAPES,并完成了性能测试.结果表明:经过存储优化后,程序的峰值性能都获得了显著的提升.还讨论了在固定总进程数下,计算进程和I/O进程数的最佳比例是多少.优化后的程序与原版相比,模式专家只需要在配置文件额外设置2个新变量即可使用,十分易于学习.
展开更多
关键词
重叠存储
多I/O进程
进程分布
地球科学模拟
大规模并行应用
在线阅读
下载PDF
职称材料
基于“天河二号”聚合通信卸载特性的MPI_Barrier优化
2
作者
朱琦
戴艺
+5 位作者
彭晋韬
谢旻
梁崇山
刘鹏
杨博
刘杰
《计算机工程与科学》
北大核心
2025年第3期400-411,共12页
Barrier作为消息传递接口MPI程序的基本操作,是确保程序正确执行的重要机制之一。目前已有的Barrier实现方案主要存在2个缺陷:首先,节点间同步存在大量冗余的数据路径传输开销;其次,节点内同步存在大量缓存失效的情况。为解决这些性能限...
Barrier作为消息传递接口MPI程序的基本操作,是确保程序正确执行的重要机制之一。目前已有的Barrier实现方案主要存在2个缺陷:首先,节点间同步存在大量冗余的数据路径传输开销;其次,节点内同步存在大量缓存失效的情况。为解决这些性能限制,针对“天河二号”定制网络TH-Express聚合通信卸载特性,提出了基于GLEX NIC的Barrier加速和共享内存标志位重排列2种优化技术,有效减少了节点间同步开销,提高了节点内基于共享内存的同步效率。基于上述优化方法,重新设计了MPI_Barrier算法,并将其集成到MPI通信库中,并在国家超级计算长沙中心通过运行微基准测试程序和实际应用程序对所提优化方法进行性能测试,规模达到7168个节点。实验结果表明,优化后的MPI_Barrier集合操作获得了1.3~14.5倍的加速,并在应用级真实负载评测中,性能提升高达54%。
展开更多
关键词
MPI
BARRIER
大规模并行应用
NIC聚合通信卸载
在线阅读
下载PDF
职称材料
题名
地球科学大规模并行应用的重叠存储优化
被引量:
5
1
作者
陈璟锟
杜云飞
机构
国家超级计算广州中心(中山大学)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2019年第4期790-797,共8页
基金
国家重点研发计划项目(2016YFB0201401)~~
文摘
存储是地球科学类软件的重要组成部分,周期性输出中间态和检查点会带来大量的访存操作,不恰当的访存设计会严重影响软件在大规模计算时的性能表现.针对地球科学类软件的存储问题,从软件层面提出一个重叠存储优化方法,通过设置额外的I/O进程隐藏输出过程.该重叠存储优化主要有3个优势:1)将输出和计算操作重叠在一起,实现了输出的重叠化和隐藏化;2)抑制了收集通信的开销,突破了收集操作的通信带宽瓶颈和内存限制;3)能容易地使用各种高级并行输出库函数.利用重叠存储优化了天河二号上的WRF,ROMS_AGRIF,GRAPES,并完成了性能测试.结果表明:经过存储优化后,程序的峰值性能都获得了显著的提升.还讨论了在固定总进程数下,计算进程和I/O进程数的最佳比例是多少.优化后的程序与原版相比,模式专家只需要在配置文件额外设置2个新变量即可使用,十分易于学习.
关键词
重叠存储
多I/O进程
进程分布
地球科学模拟
大规模并行应用
Keywords
overlap store
multiply I/O processes
processes distribution
earth science simulation
large-scale parallel application
分类号
TP302.7 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于“天河二号”聚合通信卸载特性的MPI_Barrier优化
2
作者
朱琦
戴艺
彭晋韬
谢旻
梁崇山
刘鹏
杨博
刘杰
机构
国防科技大学计算机学院
国防科技大学高端装备数字化软件湖南省重点实验室
国防科技大学并行与分布计算全国重点实验室
出处
《计算机工程与科学》
北大核心
2025年第3期400-411,共12页
基金
国家自然科学基金(62272476)
国家重点研发计划(2021YFBO300101)
+1 种基金
国家自然科学基金重点项目(U22B2005)
并行与分布处理国家重点实验室基金(2021-KJWPDL-08)。
文摘
Barrier作为消息传递接口MPI程序的基本操作,是确保程序正确执行的重要机制之一。目前已有的Barrier实现方案主要存在2个缺陷:首先,节点间同步存在大量冗余的数据路径传输开销;其次,节点内同步存在大量缓存失效的情况。为解决这些性能限制,针对“天河二号”定制网络TH-Express聚合通信卸载特性,提出了基于GLEX NIC的Barrier加速和共享内存标志位重排列2种优化技术,有效减少了节点间同步开销,提高了节点内基于共享内存的同步效率。基于上述优化方法,重新设计了MPI_Barrier算法,并将其集成到MPI通信库中,并在国家超级计算长沙中心通过运行微基准测试程序和实际应用程序对所提优化方法进行性能测试,规模达到7168个节点。实验结果表明,优化后的MPI_Barrier集合操作获得了1.3~14.5倍的加速,并在应用级真实负载评测中,性能提升高达54%。
关键词
MPI
BARRIER
大规模并行应用
NIC聚合通信卸载
Keywords
massage passing interface(MPI)
Barrier
massively parallel applications
NIC collective communication offloading
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
地球科学大规模并行应用的重叠存储优化
陈璟锟
杜云飞
《计算机研究与发展》
EI
CSCD
北大核心
2019
5
在线阅读
下载PDF
职称材料
2
基于“天河二号”聚合通信卸载特性的MPI_Barrier优化
朱琦
戴艺
彭晋韬
谢旻
梁崇山
刘鹏
杨博
刘杰
《计算机工程与科学》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部