期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
天河超级计算机上超大规模高精度计算流体力学并行计算研究进展 被引量:9
1
作者 徐传福 车永刚 +2 位作者 李大力 王勇献 王正华 《计算机工程与科学》 CSCD 北大核心 2020年第10期1815-1826,共12页
高性能计算(HPC)技术的迅猛发展为大规模复杂计算流体力学(CFD)应用提供了重要支撑。近年来,“通用处理器+众核加速器”的异构体系结构已成为研制超大规模高性能计算机的重要技术途径之一。异构高性能计算机不仅包含海量的异构处理器核... 高性能计算(HPC)技术的迅猛发展为大规模复杂计算流体力学(CFD)应用提供了重要支撑。近年来,“通用处理器+众核加速器”的异构体系结构已成为研制超大规模高性能计算机的重要技术途径之一。异构高性能计算机不仅包含海量的异构处理器核,同时具有异构存储层次、通信方式和编程环境,极大增加了CFD等并行应用开发、优化的难度。国防科技大学是我国高性能计算机系统研制与应用开发的基地,长期以来,学校CFD应用软件团队依托天河/银河系列超级计算机开展了超大规模复杂CFD并行计算和性能优化研究,突破了异构协同并行计算等一系列关键技术,初步实现了HPC与CFD的深度融合,有力支撑了我国几套重要的In-house CFD软件在天河/银河系列超级计算机上的高效超大规模并行应用。归纳总结了天河超级计算机上超大规模高精度CFD并行计算研究进展,并对未来E级超级计算机上CFD并行应用开发进行了分析展望。 展开更多
关键词 计算流体力学 并行计算 天河超级计算机
在线阅读 下载PDF
MTTorch:面向MT-3000芯片和Transformer模型的PyTorch算子库实现与优化
2
作者 王昊天 孙羽菲 +4 位作者 隋轶丞 王嘉豪 石昌青 方建滨 张玉志 《软件学报》 北大核心 2025年第8期3896-3916,共21页
随着Transformer类大模型的飞速发展,算力逐渐成为制约领域发展的瓶颈,如何根据加速器硬件的结构特性加速和优化大语言模型的训练性能已成为研究热点.面向天河新一代超算系统的加速芯片MT-3000,提出并实现了适用于CPU+DSP异构架构的PyTo... 随着Transformer类大模型的飞速发展,算力逐渐成为制约领域发展的瓶颈,如何根据加速器硬件的结构特性加速和优化大语言模型的训练性能已成为研究热点.面向天河新一代超算系统的加速芯片MT-3000,提出并实现了适用于CPU+DSP异构架构的PyTorch扩展库——MTTorch,其核心是一个多核并行的算子库,对Transformer类模型训练过程中的核心算子进行向量化实现和优化.同时,针对MT-3000架构特性,提出了面向多核DSP的高性能规约算法及乒乓算法,显著提升了算子的运算性能.MTTorch还具有很好的通用性,对于不同版本的PyTorch都可以动态链接库的形式进行加载,不改变PyTorch的原生实现.大量实验证明,实现的核心算子在MT-3000芯片上有着很好的性能,在单DSP簇上可以达到8倍的加速效果.利用MTTorch在多节点执行训练任务时有着接近线性的加速比,极大地提升了Transformer类模型在MT-3000芯片上的训练效率. 展开更多
关键词 PyTorch 高性能计算 Transformer模型 天河超级计算机 CPU+DSP异构计算 软件生态
在线阅读 下载PDF
“天河一号”工业设计仿真云平台中间件研究 被引量:4
3
作者 邓子云 章兢 +1 位作者 刘杨兵 肖久如 《中国机械工程》 EI CAS CSCD 北大核心 2015年第6期766-772,798,共8页
在"天河一号"超级计算机上搭建了工业设计仿真云平台,研发了该平台的核心部件——工业设计仿真云平台中间件,该中间件软件集成了多款大型CAE软件、SLURM作业调度软件、License管理软件、计算资源管理功能软件。提出了工业设... 在"天河一号"超级计算机上搭建了工业设计仿真云平台,研发了该平台的核心部件——工业设计仿真云平台中间件,该中间件软件集成了多款大型CAE软件、SLURM作业调度软件、License管理软件、计算资源管理功能软件。提出了工业设计仿真云平台的总体架构,以及工业设计仿真云平台中间件的设计思想、体系架构,解决了作业状态转换、作业提交等关键技术问题。使用工业设计仿真云平台对火星着陆气囊的碰撞分析进行了仿真实验,结果表明利用工业设计仿真云平台中间件软件可以简便地使用"天河一号"超级计算机的计算资源。 展开更多
关键词 天河一号”超级计算机 工业设计仿真云中间件 体系架构 设计思想 关键技术 仿真实验
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部