期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于新一代神威超算的计算流体力学Palabos软件的并行优化
被引量:
6
1
作者
柳安军
殷洪辉
+5 位作者
王利
刘智翔
孔博
郭猛
陈成敏
杨美红
《计算机科学》
CSCD
北大核心
2022年第10期66-73,共8页
Palabos软件是一款基于格子玻尔兹曼算法(Lattice Boltzmann Method, LBM)的计算流体力学软件,因其优异的计算能力被广泛用于多孔介质、自由界面、颗粒运动、血液流动等计算流体力学领域。Palabos软件广泛的用户需求使其迫切需要在神威...
Palabos软件是一款基于格子玻尔兹曼算法(Lattice Boltzmann Method, LBM)的计算流体力学软件,因其优异的计算能力被广泛用于多孔介质、自由界面、颗粒运动、血液流动等计算流体力学领域。Palabos软件广泛的用户需求使其迫切需要在神威超算上进行移植优化和并行加速,服务于能源、化工行业。文中在新一代神威超算(SW26010pro)上对Palabos软件进行异构并行设计,针对Palabos的数据结构和模块化编程不利于神威众核编程的问题,通过直接取址,设置字段标记处理多态导致的分支、数据切片处理等优化思路;并结合新一代神威超算的特性,使用共享内存和寄存器通信的优化技术,实现众核加速2~6倍。同时实现Palabos软件在新一代神威超算上的复杂化工过程多尺度计算方向上两相流算法的百万核心规模的并行计算,以6.4万核心的并行计算规模为基准,百万核心的并行效率大于40%。
展开更多
关键词
众
核
化
模块化编程
Palabos
新
一代
神威
超算
多相流
在线阅读
下载PDF
职称材料
第一性原理极化率计算中的众核优化方法研究
被引量:
1
2
作者
罗海文
吴扬俊
商红慧
《计算机科学》
CSCD
北大核心
2023年第6期1-9,共9页
基于量子力学的密度泛函微扰理论(DFPT)可以用来计算分子和材料的多种物理化学性质,目前被广泛应用于新材料等领域的研究中;同时,异构众核处理器架构逐渐成为超算的主流。因此,针对异构众核处理器重新设计和优化DFPT程序以提升其计算效...
基于量子力学的密度泛函微扰理论(DFPT)可以用来计算分子和材料的多种物理化学性质,目前被广泛应用于新材料等领域的研究中;同时,异构众核处理器架构逐渐成为超算的主流。因此,针对异构众核处理器重新设计和优化DFPT程序以提升其计算效率,对物理化学性质的计算及其科学应用具有重要意义。文中对DFPT中一阶响应密度和一阶响应哈密顿矩阵的计算针对众核处理器体系结构进行了优化,并在新一代神威处理器上进行了验证。优化技术包括循环分块、离散访存处理和协同规约。其中,循环分块对任务进行划分从而由众核并行地执行;离散访存处理将离散访存转换为更高效的连续访存;协同规约解决了写冲突问题。实验结果表明,在一个核组上,优化后的程序性能较优化前提高了8.2~74.4倍,并且具有良好的强可扩展性和弱可扩展性。
展开更多
关键词
密度函数微扰理论
第一性原理计算
高性能计算
新一代神威异构众核处理器
在线阅读
下载PDF
职称材料
基于神威太湖之光的AMBER软件移植与优化
被引量:
5
3
作者
彭龙
陈俊仕
安虹
《计算机工程》
CAS
CSCD
北大核心
2020年第12期12-20,共9页
AMBER是一款主流的分子动力学模拟软件,用于研究分子体系内的微观运动状态。为利用神威太湖之光的海量计算资源加速AMBER软件模拟分子体系的运动过程,将AMBER软件移植到SW26010处理器的主核上建立主从加速模型,实现AMBER软件的从核并行...
AMBER是一款主流的分子动力学模拟软件,用于研究分子体系内的微观运动状态。为利用神威太湖之光的海量计算资源加速AMBER软件模拟分子体系的运动过程,将AMBER软件移植到SW26010处理器的主核上建立主从加速模型,实现AMBER软件的从核并行化设计。在从核并行化的基础上提出主从异步流水化方案,利用SW26010处理器从核的局部数据缓存和直接内存存取通道技术,解决从核访存速度过低及并行访存带宽受限的问题,并通过SIMD指令将部分从核代码向量化,进一步提升AMBER软件在神威太湖之光平台上的计算性能。测试结果表明,AMBER热点函数的计算性能较优化前约提升15倍,单核组的整体性能较Intel Xeon Platinum 8163约提升4.6倍。
展开更多
关键词
分子动力学模拟
神威
太湖之光
异构
众
核
处理器
并行优化
异步流水化
在线阅读
下载PDF
职称材料
PME算法在神威太湖之光上的移植和优化
被引量:
2
4
作者
林增
武铮
+1 位作者
安虹
陈俊仕
《小型微型计算机系统》
CSCD
北大核心
2021年第1期9-14,共6页
分子动力学模拟(MD)是一套通过计算机模拟生物体系内分子、原子运动的多体模拟方法.GROMACS是著名的MD应用,能够快速模拟生物及非生物体系运动过程,广泛应用于各高性能平台.作为世界排名第3的超级计算机,神威太湖之光拥有40960块SW2601...
分子动力学模拟(MD)是一套通过计算机模拟生物体系内分子、原子运动的多体模拟方法.GROMACS是著名的MD应用,能够快速模拟生物及非生物体系运动过程,广泛应用于各高性能平台.作为世界排名第3的超级计算机,神威太湖之光拥有40960块SW26010异构众核处理器,峰值性能达到125.4PFlops.目前太湖之光上已有对GROM ACS短程力优化的相关研究,但对于PM E(Particle Mesh Ewald)算法未有探索性工作.本文基于申威平台对PME算法展开研究,针对随机访存模式、网格点写写冲突等挑战,提出了基于局部网格序的分块策略、数据重组策略、非线性函数近似等方法进行优化.最终优化后的结果相较于初始版本性能提升了8.85倍,相较于Intel CPU版本提升了1.2倍.本文采用的优化技术也可以为神威太湖之光上其他分子动力学模拟软件和涉及散乱数据插值程序的优化提供借鉴.
展开更多
关键词
PME
GROMACS
神威
太湖之光
异构
众
核
处理器
在线阅读
下载PDF
职称材料
题名
基于新一代神威超算的计算流体力学Palabos软件的并行优化
被引量:
6
1
作者
柳安军
殷洪辉
王利
刘智翔
孔博
郭猛
陈成敏
杨美红
机构
齐鲁工业大学(山东省科学院)山东省计算中心(国家超级计算济南中心)
济南超级计算技术研究院济南市高性能工业软件重点实验室
上海海洋大学信息学院
广东以色列理工学院
出处
《计算机科学》
CSCD
北大核心
2022年第10期66-73,共8页
基金
国家重点研发计划(2018YFB0704002)
鳌山科技创新计划重大项目(2018ASKJ01)
+3 种基金
山东省重大科技创新工程项目(2019JZZY010302)
山东省重点研发计划(国际科技合作)(2019GHZ018)
山东省博士后人才创新支持计划(SDBX2020018)
光合基金B(202107021062)。
文摘
Palabos软件是一款基于格子玻尔兹曼算法(Lattice Boltzmann Method, LBM)的计算流体力学软件,因其优异的计算能力被广泛用于多孔介质、自由界面、颗粒运动、血液流动等计算流体力学领域。Palabos软件广泛的用户需求使其迫切需要在神威超算上进行移植优化和并行加速,服务于能源、化工行业。文中在新一代神威超算(SW26010pro)上对Palabos软件进行异构并行设计,针对Palabos的数据结构和模块化编程不利于神威众核编程的问题,通过直接取址,设置字段标记处理多态导致的分支、数据切片处理等优化思路;并结合新一代神威超算的特性,使用共享内存和寄存器通信的优化技术,实现众核加速2~6倍。同时实现Palabos软件在新一代神威超算上的复杂化工过程多尺度计算方向上两相流算法的百万核心规模的并行计算,以6.4万核心的并行计算规模为基准,百万核心的并行效率大于40%。
关键词
众
核
化
模块化编程
Palabos
新
一代
神威
超算
多相流
Keywords
Many core
Modulation programming
Palabos
SW26010pro
Multiphase flow
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
第一性原理极化率计算中的众核优化方法研究
被引量:
1
2
作者
罗海文
吴扬俊
商红慧
机构
中国科学院计算技术研究所处理器芯片全国重点实验室
出处
《计算机科学》
CSCD
北大核心
2023年第6期1-9,共9页
基金
国家重点研发计划(2020YFB1709500)
国家自然科学基金(22003073)。
文摘
基于量子力学的密度泛函微扰理论(DFPT)可以用来计算分子和材料的多种物理化学性质,目前被广泛应用于新材料等领域的研究中;同时,异构众核处理器架构逐渐成为超算的主流。因此,针对异构众核处理器重新设计和优化DFPT程序以提升其计算效率,对物理化学性质的计算及其科学应用具有重要意义。文中对DFPT中一阶响应密度和一阶响应哈密顿矩阵的计算针对众核处理器体系结构进行了优化,并在新一代神威处理器上进行了验证。优化技术包括循环分块、离散访存处理和协同规约。其中,循环分块对任务进行划分从而由众核并行地执行;离散访存处理将离散访存转换为更高效的连续访存;协同规约解决了写冲突问题。实验结果表明,在一个核组上,优化后的程序性能较优化前提高了8.2~74.4倍,并且具有良好的强可扩展性和弱可扩展性。
关键词
密度函数微扰理论
第一性原理计算
高性能计算
新一代神威异构众核处理器
Keywords
Density-functional perturbation theory
First-principle calculation
High-performance computing
New generation Sunway heterogeneous many-core processor
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于神威太湖之光的AMBER软件移植与优化
被引量:
5
3
作者
彭龙
陈俊仕
安虹
机构
中国科学技术大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第12期12-20,共9页
基金
国家重点研发计划(2018YFB0204102)。
文摘
AMBER是一款主流的分子动力学模拟软件,用于研究分子体系内的微观运动状态。为利用神威太湖之光的海量计算资源加速AMBER软件模拟分子体系的运动过程,将AMBER软件移植到SW26010处理器的主核上建立主从加速模型,实现AMBER软件的从核并行化设计。在从核并行化的基础上提出主从异步流水化方案,利用SW26010处理器从核的局部数据缓存和直接内存存取通道技术,解决从核访存速度过低及并行访存带宽受限的问题,并通过SIMD指令将部分从核代码向量化,进一步提升AMBER软件在神威太湖之光平台上的计算性能。测试结果表明,AMBER热点函数的计算性能较优化前约提升15倍,单核组的整体性能较Intel Xeon Platinum 8163约提升4.6倍。
关键词
分子动力学模拟
神威
太湖之光
异构
众
核
处理器
并行优化
异步流水化
Keywords
Molecular Dynamics(MD)simulation
Sunway TaihuLight
heterogeneous many-core processor
parallel optimization
asynchronous pipelining
分类号
TP338.4 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
PME算法在神威太湖之光上的移植和优化
被引量:
2
4
作者
林增
武铮
安虹
陈俊仕
机构
中国科学技术大学计算机科学与技术学院
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第1期9-14,共6页
基金
科技部国家重点研发计划项目(2018YFB0204102)资助。
文摘
分子动力学模拟(MD)是一套通过计算机模拟生物体系内分子、原子运动的多体模拟方法.GROMACS是著名的MD应用,能够快速模拟生物及非生物体系运动过程,广泛应用于各高性能平台.作为世界排名第3的超级计算机,神威太湖之光拥有40960块SW26010异构众核处理器,峰值性能达到125.4PFlops.目前太湖之光上已有对GROM ACS短程力优化的相关研究,但对于PM E(Particle Mesh Ewald)算法未有探索性工作.本文基于申威平台对PME算法展开研究,针对随机访存模式、网格点写写冲突等挑战,提出了基于局部网格序的分块策略、数据重组策略、非线性函数近似等方法进行优化.最终优化后的结果相较于初始版本性能提升了8.85倍,相较于Intel CPU版本提升了1.2倍.本文采用的优化技术也可以为神威太湖之光上其他分子动力学模拟软件和涉及散乱数据插值程序的优化提供借鉴.
关键词
PME
GROMACS
神威
太湖之光
异构
众
核
处理器
Keywords
PME
GROM ACS
Sunway TaihuLight
heterogeneous many-core processors
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于新一代神威超算的计算流体力学Palabos软件的并行优化
柳安军
殷洪辉
王利
刘智翔
孔博
郭猛
陈成敏
杨美红
《计算机科学》
CSCD
北大核心
2022
6
在线阅读
下载PDF
职称材料
2
第一性原理极化率计算中的众核优化方法研究
罗海文
吴扬俊
商红慧
《计算机科学》
CSCD
北大核心
2023
1
在线阅读
下载PDF
职称材料
3
基于神威太湖之光的AMBER软件移植与优化
彭龙
陈俊仕
安虹
《计算机工程》
CAS
CSCD
北大核心
2020
5
在线阅读
下载PDF
职称材料
4
PME算法在神威太湖之光上的移植和优化
林增
武铮
安虹
陈俊仕
《小型微型计算机系统》
CSCD
北大核心
2021
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部