期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
国产神威环境下Athread代码生成工具的设计与开发
被引量:
2
1
作者
刘加伟
郭强
+3 位作者
庄园
张海红
王利
曾云辉
《计算机工程与设计》
北大核心
2024年第2期633-640,F0003,共9页
针对国产神威环境下众核代码编写工作量大的问题,设计实现一个可以将核心段的串行代码自动转换为Athread代码的工具。采用Rust语言进行词法和语法分析,面向不同数组维度的Fortran和C语言程序,基于主程序调用master程序再由master程序调...
针对国产神威环境下众核代码编写工作量大的问题,设计实现一个可以将核心段的串行代码自动转换为Athread代码的工具。采用Rust语言进行词法和语法分析,面向不同数组维度的Fortran和C语言程序,基于主程序调用master程序再由master程序调用slave程序的三层模板程序架构,集成常用众核优化方法的代码框架。经过实验分析,采用该自动转换工具生成的Athread代码相较于人工编写的OpenACC*加速的程序有更高的加速比,特别是对多个核心段进行众核化加速时的加速比相差15%,验证该转换工具具有很好的实用性。
展开更多
关键词
加速线程库
代码生成
模板引擎
语法分析
众核处理器
神威·太湖之光
高性能计算
在线阅读
下载PDF
职称材料
面向神威高性能多核处理器的并行编译优化方法
被引量:
2
2
作者
周雍浩
徐金龙
+2 位作者
李斌
钱宏
聂凯
《计算机工程》
CAS
CSCD
北大核心
2022年第9期130-138,共9页
在神威高性能多核服务器上,自动并行化编译系统为识别和申明程序中的并行性,产生的OpenMP程序没有经过充分的优化,其采用简单的fork-join模型,存在大量的并行循环嵌套,导致运行效率低。为提升自动并行化编译系统产生的OpenMP程序的运行...
在神威高性能多核服务器上,自动并行化编译系统为识别和申明程序中的并行性,产生的OpenMP程序没有经过充分的优化,其采用简单的fork-join模型,存在大量的并行循环嵌套,导致运行效率低。为提升自动并行化编译系统产生的OpenMP程序的运行效率,提出一种并行域重构优化技术。并行域重构技术通过合并程序中的并行域和扩展嵌套循环中的并行域范围,减少OpenMP程序的并行域数目,降低线程组频繁创建和合并等控制开销,将简单fork-join模型的OpenMP程序转换为性能更为高效的单程序多数据模型的OpenMP程序。实验结果表明,在新一代神威高性能多核服务器SW1621平台上,并行域重构技术在NPB3.3-OMP测试集和SPEC OMP2012测试集上的运行效率分别提高了10.77%和7.94%的,可有效提升自动并行化编译系统OpenMP程序的执行效率。
展开更多
关键词
神威高性能多核处理器
OpenMP编程
并行域重构
fork-join模型
单程序多数据模型
在线阅读
下载PDF
职称材料
面向申威众核处理器的并行SaNSDE算法
被引量:
1
3
作者
康上
钱雪忠
甘霖
《计算机科学与探索》
CSCD
北大核心
2021年第10期2015-2024,共10页
演化算法作为解决大规模优化问题的重要方法,被广泛应用于机器学习、过程控制、工程优化、管理科学和社会科学等领域。然而在求解高维度、高计算密度问题时,程序性能很难得到保证。在高性能计算机上实现并行化是问题的一个热门解决方案...
演化算法作为解决大规模优化问题的重要方法,被广泛应用于机器学习、过程控制、工程优化、管理科学和社会科学等领域。然而在求解高维度、高计算密度问题时,程序性能很难得到保证。在高性能计算机上实现并行化是问题的一个热门解决方案。针对申威众核处理器的硬件特征,提出了采用二级并行策略的自适应邻域搜索的差分进化算法(SaNSDE)。第一级为进程并行,实现了合作协同进化模型和池模型,将大规模问题划分为多个低维子问题并分布在不同进程上;第二级为线程并行,使用从核加速了适应度的计算过程。实验结果表明,采用合作协同进化模型和池模型的算法与传统的并行算法相比,经过多核扩展之后收敛效果提升更加明显。相较于串行版本算法,二级并行的SaNSDE算法在四个测试函数上分别获得了134.29、186.05、239.01和189.80的最大加速比。
展开更多
关键词
高性能计算
申威异构众核处理器
演化算法
合作协同进化模型(CC)
池模型
在线阅读
下载PDF
职称材料
第一性原理极化率计算中的众核优化方法研究
被引量:
1
4
作者
罗海文
吴扬俊
商红慧
《计算机科学》
CSCD
北大核心
2023年第6期1-9,共9页
基于量子力学的密度泛函微扰理论(DFPT)可以用来计算分子和材料的多种物理化学性质,目前被广泛应用于新材料等领域的研究中;同时,异构众核处理器架构逐渐成为超算的主流。因此,针对异构众核处理器重新设计和优化DFPT程序以提升其计算效...
基于量子力学的密度泛函微扰理论(DFPT)可以用来计算分子和材料的多种物理化学性质,目前被广泛应用于新材料等领域的研究中;同时,异构众核处理器架构逐渐成为超算的主流。因此,针对异构众核处理器重新设计和优化DFPT程序以提升其计算效率,对物理化学性质的计算及其科学应用具有重要意义。文中对DFPT中一阶响应密度和一阶响应哈密顿矩阵的计算针对众核处理器体系结构进行了优化,并在新一代神威处理器上进行了验证。优化技术包括循环分块、离散访存处理和协同规约。其中,循环分块对任务进行划分从而由众核并行地执行;离散访存处理将离散访存转换为更高效的连续访存;协同规约解决了写冲突问题。实验结果表明,在一个核组上,优化后的程序性能较优化前提高了8.2~74.4倍,并且具有良好的强可扩展性和弱可扩展性。
展开更多
关键词
密度函数微扰理论
第一性原理计算
高性能计算
新一代神威异构众核处理器
在线阅读
下载PDF
职称材料
题名
国产神威环境下Athread代码生成工具的设计与开发
被引量:
2
1
作者
刘加伟
郭强
庄园
张海红
王利
曾云辉
机构
齐鲁工业大学(山东省科学院)计算机科学与技术学部
齐鲁工业大学(山东省科学院)山东省计算中心(国家超级计算济南中心)
出处
《计算机工程与设计》
北大核心
2024年第2期633-640,F0003,共9页
基金
科教产融合试点工程重大创新专项基金项目(2022JBZ01-01)。
文摘
针对国产神威环境下众核代码编写工作量大的问题,设计实现一个可以将核心段的串行代码自动转换为Athread代码的工具。采用Rust语言进行词法和语法分析,面向不同数组维度的Fortran和C语言程序,基于主程序调用master程序再由master程序调用slave程序的三层模板程序架构,集成常用众核优化方法的代码框架。经过实验分析,采用该自动转换工具生成的Athread代码相较于人工编写的OpenACC*加速的程序有更高的加速比,特别是对多个核心段进行众核化加速时的加速比相差15%,验证该转换工具具有很好的实用性。
关键词
加速线程库
代码生成
模板引擎
语法分析
众核处理器
神威·太湖之光
高性能计算
Keywords
Athread library
code generation
template engine
syntactic analysis
many-core
processor
sunway
Taihulight
high
performance
computing
分类号
TP311.52 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
面向神威高性能多核处理器的并行编译优化方法
被引量:
2
2
作者
周雍浩
徐金龙
李斌
钱宏
聂凯
机构
郑州大学信息工程学院
数学工程与先进计算国家重点实验室
江南计算技术研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第9期130-138,共9页
基金
国家重点研发计划“高性能计算”重点专项(2016YFB0200503)。
文摘
在神威高性能多核服务器上,自动并行化编译系统为识别和申明程序中的并行性,产生的OpenMP程序没有经过充分的优化,其采用简单的fork-join模型,存在大量的并行循环嵌套,导致运行效率低。为提升自动并行化编译系统产生的OpenMP程序的运行效率,提出一种并行域重构优化技术。并行域重构技术通过合并程序中的并行域和扩展嵌套循环中的并行域范围,减少OpenMP程序的并行域数目,降低线程组频繁创建和合并等控制开销,将简单fork-join模型的OpenMP程序转换为性能更为高效的单程序多数据模型的OpenMP程序。实验结果表明,在新一代神威高性能多核服务器SW1621平台上,并行域重构技术在NPB3.3-OMP测试集和SPEC OMP2012测试集上的运行效率分别提高了10.77%和7.94%的,可有效提升自动并行化编译系统OpenMP程序的执行效率。
关键词
神威高性能多核处理器
OpenMP编程
并行域重构
fork-join模型
单程序多数据模型
Keywords
sunway high performance multi-core processors
OpenMP programming
parallel region reconstruction
fork-join model
Single Program Multi-Data(SPMD)model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
面向申威众核处理器的并行SaNSDE算法
被引量:
1
3
作者
康上
钱雪忠
甘霖
机构
江南大学人工智能与计算机学院物联网技术应用教育部工程研究中心
国家超级计算无锡中心
清华大学计算机科学与技术系
出处
《计算机科学与探索》
CSCD
北大核心
2021年第10期2015-2024,共10页
基金
国家自然科学基金(61673193)
中央高校基本科研业务费专项资金(JUSRP51635B,JUSRP51510)。
文摘
演化算法作为解决大规模优化问题的重要方法,被广泛应用于机器学习、过程控制、工程优化、管理科学和社会科学等领域。然而在求解高维度、高计算密度问题时,程序性能很难得到保证。在高性能计算机上实现并行化是问题的一个热门解决方案。针对申威众核处理器的硬件特征,提出了采用二级并行策略的自适应邻域搜索的差分进化算法(SaNSDE)。第一级为进程并行,实现了合作协同进化模型和池模型,将大规模问题划分为多个低维子问题并分布在不同进程上;第二级为线程并行,使用从核加速了适应度的计算过程。实验结果表明,采用合作协同进化模型和池模型的算法与传统的并行算法相比,经过多核扩展之后收敛效果提升更加明显。相较于串行版本算法,二级并行的SaNSDE算法在四个测试函数上分别获得了134.29、186.05、239.01和189.80的最大加速比。
关键词
高性能计算
申威异构众核处理器
演化算法
合作协同进化模型(CC)
池模型
Keywords
high
-
performance
computing
sunway
heterogeneous
multi-core
processor
evolutionary algorithm
cooperative co-evolution(CC)
pool model
分类号
TP338.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
第一性原理极化率计算中的众核优化方法研究
被引量:
1
4
作者
罗海文
吴扬俊
商红慧
机构
中国科学院计算技术研究所处理器芯片全国重点实验室
出处
《计算机科学》
CSCD
北大核心
2023年第6期1-9,共9页
基金
国家重点研发计划(2020YFB1709500)
国家自然科学基金(22003073)。
文摘
基于量子力学的密度泛函微扰理论(DFPT)可以用来计算分子和材料的多种物理化学性质,目前被广泛应用于新材料等领域的研究中;同时,异构众核处理器架构逐渐成为超算的主流。因此,针对异构众核处理器重新设计和优化DFPT程序以提升其计算效率,对物理化学性质的计算及其科学应用具有重要意义。文中对DFPT中一阶响应密度和一阶响应哈密顿矩阵的计算针对众核处理器体系结构进行了优化,并在新一代神威处理器上进行了验证。优化技术包括循环分块、离散访存处理和协同规约。其中,循环分块对任务进行划分从而由众核并行地执行;离散访存处理将离散访存转换为更高效的连续访存;协同规约解决了写冲突问题。实验结果表明,在一个核组上,优化后的程序性能较优化前提高了8.2~74.4倍,并且具有良好的强可扩展性和弱可扩展性。
关键词
密度函数微扰理论
第一性原理计算
高性能计算
新一代神威异构众核处理器
Keywords
Density-functional perturbation theory
First-principle calculation
high
-
performance
computing
New generation
sunway
heterogeneous many-core
processor
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
国产神威环境下Athread代码生成工具的设计与开发
刘加伟
郭强
庄园
张海红
王利
曾云辉
《计算机工程与设计》
北大核心
2024
2
在线阅读
下载PDF
职称材料
2
面向神威高性能多核处理器的并行编译优化方法
周雍浩
徐金龙
李斌
钱宏
聂凯
《计算机工程》
CAS
CSCD
北大核心
2022
2
在线阅读
下载PDF
职称材料
3
面向申威众核处理器的并行SaNSDE算法
康上
钱雪忠
甘霖
《计算机科学与探索》
CSCD
北大核心
2021
1
在线阅读
下载PDF
职称材料
4
第一性原理极化率计算中的众核优化方法研究
罗海文
吴扬俊
商红慧
《计算机科学》
CSCD
北大核心
2023
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部