期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向国产异构DCU平台的大规模并行矩量法研究
1
作者
贾瑞鹏
林中朝
+2 位作者
左胜
张玉
杨美红
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
2024年第2期76-83,共8页
面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配...
面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配的问题,实现了矩量法异构并行计算过程的负载均衡。采用细粒度任务划分策略与异步通信技术,对深度计算处理器计算过程进行了流水线优化设计,实现了计算与通信重叠,提升了矩量法异构协同计算的效率。通过与有限元法的仿真结果对比,验证了CPU+DCU异构并行矩量法的准确性。基于国产深度计算处理器异构平台的可扩展性分析结果表明,与单纯CPU计算相比,所实现的CPU+DCU异构协同计算方法能够获得5.5~7.0倍的加速效果,且在国家超级计算西安中心能够实现全系统运行,并行规模从360节点扩展到3 600节点(共1 036 800个处理器核心),并行效率可以达到约73.5%。
展开更多
关键词
高阶矩量法
国产
异构
并行
系统
深度
计算
处理器
异构协同并行计算
在线阅读
下载PDF
职称材料
题名
面向国产异构DCU平台的大规模并行矩量法研究
1
作者
贾瑞鹏
林中朝
左胜
张玉
杨美红
机构
西安电子科技大学电子工程学院
齐鲁工业大学计算机科学与技术学院
出处
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
2024年第2期76-83,共8页
基金
陕西省重点研发计划(2023-ZDLGY-09,2022ZDLGY02-01,2021GXLH-02)
中央高校基本科研业务费专项资金(QTZX23018)。
文摘
面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配的问题,实现了矩量法异构并行计算过程的负载均衡。采用细粒度任务划分策略与异步通信技术,对深度计算处理器计算过程进行了流水线优化设计,实现了计算与通信重叠,提升了矩量法异构协同计算的效率。通过与有限元法的仿真结果对比,验证了CPU+DCU异构并行矩量法的准确性。基于国产深度计算处理器异构平台的可扩展性分析结果表明,与单纯CPU计算相比,所实现的CPU+DCU异构协同计算方法能够获得5.5~7.0倍的加速效果,且在国家超级计算西安中心能够实现全系统运行,并行规模从360节点扩展到3 600节点(共1 036 800个处理器核心),并行效率可以达到约73.5%。
关键词
高阶矩量法
国产
异构
并行
系统
深度
计算
处理器
异构协同并行计算
Keywords
method of moments
domestic heterogeneous platforms
deep computing unit(DCU)
parallel algorithm
分类号
TN820 [电子电信—信息与通信工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向国产异构DCU平台的大规模并行矩量法研究
贾瑞鹏
林中朝
左胜
张玉
杨美红
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部