期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于并行可扩展科学计算工具集求解GRAPES全球非静力模式亥姆霍兹问题
被引量:
1
1
作者
张理论
宋君强
+1 位作者
赵文涛
胡江林
《气象学报》
CAS
CSCD
北大核心
2011年第3期432-439,共8页
亥姆霍兹方程是非静力平衡大气模式动力内核的主要计算瓶颈之一,其离散矩阵性态差,采用常见预条件Krylov迭代往往收敛很慢。随着全球非静力平衡大气模式时空分辨率的不断提高,亥姆霍兹方程求解面临求解精度和计算时间的双重困难。在高...
亥姆霍兹方程是非静力平衡大气模式动力内核的主要计算瓶颈之一,其离散矩阵性态差,采用常见预条件Krylov迭代往往收敛很慢。随着全球非静力平衡大气模式时空分辨率的不断提高,亥姆霍兹方程求解面临求解精度和计算时间的双重困难。在高分辨率情况下,迭代计算步数和计算量剧增,而且很多传统的预条件迭代求解方法不收敛,迫切需要研究收敛性和并行可扩展性兼备的预条件迭代方法。为此,在安腾机群上建立了基于并行可扩展科学计算工具集(PETSc)的GRAPES全球非静力平衡模式亥姆霍兹问题并行解法器对比研究平台,结合高性能预条件库(hypre),完成了对GRAPES在用解法器、代数多重网格、并行不完全LU分解(EUCLID)及加性Schwarz区域分解等一系列克雷洛夫预条件迭代的分析对比。结果显示PETSc结合高性能预条件库的并行方案是解决GRAPES模式三维亥姆霍兹方程高效并行计算的一个有效途径,其中以代数多重网格预条件迭代的性能最突出;并行加速比分析显示,代数多重网格预条件迭代的并行可扩展性明显优于GRAPES现有解法器,更适用于更高精度和较大规模并行计算。
展开更多
关键词
GRAPES
亥姆霍兹方程
并行可扩展
科学计算工具集
高性能预条件库
预条件
在线阅读
下载PDF
职称材料
提高可扩展并行机群并行I/O效率的一个方法
被引量:
11
2
作者
龙翔
李忠泽
+1 位作者
高小鹏
李未
《计算机研究与发展》
EI
CSCD
北大核心
2000年第6期650-656,共7页
随着CPU性能的高速提升,系统I/O能力的不足越来越明显地成为提高NOW系统整体性能的瓶颈.在分析现有基于NOW系统的并行I/O算法的基础上,通过理论推导,给出了一种寻求计算进程与计算结点之间最佳映射的方法.该方法可以在数据重分...
随着CPU性能的高速提升,系统I/O能力的不足越来越明显地成为提高NOW系统整体性能的瓶颈.在分析现有基于NOW系统的并行I/O算法的基础上,通过理论推导,给出了一种寻求计算进程与计算结点之间最佳映射的方法.该方法可以在数据重分配时,使各计算结点间的通信量最小,从而达到提高系统并行I/O效率的目的.
展开更多
关键词
可扩展
并行
机群
并行
I/O效率
算法
在线阅读
下载PDF
职称材料
岩土工程亿级单元有限元模型可扩展并行计算
被引量:
8
3
作者
张友良
谭飞
+1 位作者
张礼仁
施明明
《岩土力学》
EI
CAS
CSCD
北大核心
2016年第11期3309-3316,共8页
讨论了亿万单元有限元模型的可扩展并行计算方法。从软件和硬件两个方面提出了前处理、并行计算方法、程序算法、后处理实现等核心问题的解决方案。采用网格加密方法生成一亿单元的有限元模型,利用对偶原始有限元撕裂内联法(FETI-DP)求...
讨论了亿万单元有限元模型的可扩展并行计算方法。从软件和硬件两个方面提出了前处理、并行计算方法、程序算法、后处理实现等核心问题的解决方案。采用网格加密方法生成一亿单元的有限元模型,利用对偶原始有限元撕裂内联法(FETI-DP)求解系统方程。基于图论理论建立了子区域间的通讯拓扑关系,实现了子区域间点对点通讯,避免速度慢、通信量大的全局通讯。在自主开发程序基础上,增加相应模块,采用面向对象编程技术和MPI消息传递库开发程序。对一个一亿多单元的工程实例运用5000核并行计算,得到了超线性加速比。计算结果在专用图形工作站上进行后处理,显示和交互操作速度良好。研究在两方面实现了突破:一是将模型规模提高到了一亿多单元;二是同时调用了5000个计算核来并行运算,并得到了很高效率。高分辨率有限元并行模拟研究成果可为岩土工程中结构特别复杂、计算区域特别大、地质情况复杂等模拟提供很好的技术方法和实现手段。
展开更多
关键词
并行
有限元
可扩展
并行
计算
岩土工程
对偶原始有限元撕裂内联法(FETI-DP)
在线阅读
下载PDF
职称材料
半隐式半Lagrangian时间积分及其可扩展并行算法设计
4
作者
张卫民
朱小谦
曹小林
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2003年第5期68-72,共5页
目前谱模式仍然是全球数值天气预报业务模式的主流。针对全球数值天气预报谱模式,研究两个时间层的半隐式半Lagrangian时间积分格式以及用于计算起始点的准三次空间插值方法,提出了按需通讯的可扩展并行算法设计,在由4个双CPUSMP结点组...
目前谱模式仍然是全球数值天气预报业务模式的主流。针对全球数值天气预报谱模式,研究两个时间层的半隐式半Lagrangian时间积分格式以及用于计算起始点的准三次空间插值方法,提出了按需通讯的可扩展并行算法设计,在由4个双CPUSMP结点组成的Linux机群环境下,该算法的8任务相对于4任务的加速比达到了1.65,取得了良好的并行效果。
展开更多
关键词
半Lagrangian
谱模式
可扩展
并行
算法
Linux机群系统
在线阅读
下载PDF
职称材料
迭代方法中基于渐近规模的通信与计算比分析
被引量:
6
5
作者
徐小文
莫则尧
武林平
《计算机学报》
EI
CSCD
北大核心
2013年第4期782-789,共8页
迭代方法是科学计算中求解大规模稀疏线性代数方程组最常用的方法.大量实际应用表明,迭代方法通常具有较高的通信与计算比,只有在粗粒度并行下才能取得较好的并行可扩展性能.而实际应用大规模计算的需求和当前多核/众核体系结构的发展...
迭代方法是科学计算中求解大规模稀疏线性代数方程组最常用的方法.大量实际应用表明,迭代方法通常具有较高的通信与计算比,只有在粗粒度并行下才能取得较好的并行可扩展性能.而实际应用大规模计算的需求和当前多核/众核体系结构的发展趋势要求迭代方法具备细粒度并行可扩展能力.文中引入渐近规模,即满足加速条件的计算规模下界,来反映并行迭代方法适应细粒度并行的能力,并由此刻画通信与计算比.基于矩阵的稀疏模式及其通信模式、机器的通信参数和迭代方法的基本运算,给出了渐近规模的理论预测公式.在一台包含128个双路4核计算节点的并行机上,分别基于纯进程并行(MPI)和进程/线程混合并行(MPI/OpenMP),以实际应用中3种常用迭代方法Jacobi、CG、BiCGSTAB为例,分析其渐近规模.并行可扩展性测试表明了渐近规模用于刻画迭代方法通信与计算比的准确性.对于纯进程情形,给出了渐近规模的理论预测与实际测试的对比,表明了理论预测结果的正确性.最后,基于这些结果,从迭代方法的算法设计和并行实现等方面讨论了面向未来更大规模的计算系统,降低通信与计算比的途径.
展开更多
关键词
迭代方法
通信与计算比
并行可扩展
渐近规模
多核
众核体系结构
在线阅读
下载PDF
职称材料
题名
基于并行可扩展科学计算工具集求解GRAPES全球非静力模式亥姆霍兹问题
被引量:
1
1
作者
张理论
宋君强
赵文涛
胡江林
机构
国防科学技术大学计算机学院软件研究所
中国气象局数值预报中心
出处
《气象学报》
CAS
CSCD
北大核心
2011年第3期432-439,共8页
基金
国家自然科学基金项目(40505023)
文摘
亥姆霍兹方程是非静力平衡大气模式动力内核的主要计算瓶颈之一,其离散矩阵性态差,采用常见预条件Krylov迭代往往收敛很慢。随着全球非静力平衡大气模式时空分辨率的不断提高,亥姆霍兹方程求解面临求解精度和计算时间的双重困难。在高分辨率情况下,迭代计算步数和计算量剧增,而且很多传统的预条件迭代求解方法不收敛,迫切需要研究收敛性和并行可扩展性兼备的预条件迭代方法。为此,在安腾机群上建立了基于并行可扩展科学计算工具集(PETSc)的GRAPES全球非静力平衡模式亥姆霍兹问题并行解法器对比研究平台,结合高性能预条件库(hypre),完成了对GRAPES在用解法器、代数多重网格、并行不完全LU分解(EUCLID)及加性Schwarz区域分解等一系列克雷洛夫预条件迭代的分析对比。结果显示PETSc结合高性能预条件库的并行方案是解决GRAPES模式三维亥姆霍兹方程高效并行计算的一个有效途径,其中以代数多重网格预条件迭代的性能最突出;并行加速比分析显示,代数多重网格预条件迭代的并行可扩展性明显优于GRAPES现有解法器,更适用于更高精度和较大规模并行计算。
关键词
GRAPES
亥姆霍兹方程
并行可扩展
科学计算工具集
高性能预条件库
预条件
Keywords
GRAPES, Helmholtz equation, PETSc, Hypre, Preconditioner
分类号
P456.7 [天文地球—大气科学及气象学]
在线阅读
下载PDF
职称材料
题名
提高可扩展并行机群并行I/O效率的一个方法
被引量:
11
2
作者
龙翔
李忠泽
高小鹏
李未
机构
北京航空航天大学软件开发环境国家重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2000年第6期650-656,共7页
基金
国家"八六三"高技术研究发展计划基金!863-306-ZD-03
文摘
随着CPU性能的高速提升,系统I/O能力的不足越来越明显地成为提高NOW系统整体性能的瓶颈.在分析现有基于NOW系统的并行I/O算法的基础上,通过理论推导,给出了一种寻求计算进程与计算结点之间最佳映射的方法.该方法可以在数据重分配时,使各计算结点间的通信量最小,从而达到提高系统并行I/O效率的目的.
关键词
可扩展
并行
机群
并行
I/O效率
算法
Keywords
NOW, parallel I/O, fixed data set, optimum mapping
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
岩土工程亿级单元有限元模型可扩展并行计算
被引量:
8
3
作者
张友良
谭飞
张礼仁
施明明
机构
中国科学院武汉岩土力学研究所岩土力学与工程国家重点实验室
出处
《岩土力学》
EI
CAS
CSCD
北大核心
2016年第11期3309-3316,共8页
基金
国家重点基础研究发展计划(973计划)(No.2014CB047100)
国家自然科学基金(No.11272330)
中科院"十二五"信息化专项(No.XXH12503-02-02-11)~~
文摘
讨论了亿万单元有限元模型的可扩展并行计算方法。从软件和硬件两个方面提出了前处理、并行计算方法、程序算法、后处理实现等核心问题的解决方案。采用网格加密方法生成一亿单元的有限元模型,利用对偶原始有限元撕裂内联法(FETI-DP)求解系统方程。基于图论理论建立了子区域间的通讯拓扑关系,实现了子区域间点对点通讯,避免速度慢、通信量大的全局通讯。在自主开发程序基础上,增加相应模块,采用面向对象编程技术和MPI消息传递库开发程序。对一个一亿多单元的工程实例运用5000核并行计算,得到了超线性加速比。计算结果在专用图形工作站上进行后处理,显示和交互操作速度良好。研究在两方面实现了突破:一是将模型规模提高到了一亿多单元;二是同时调用了5000个计算核来并行运算,并得到了很高效率。高分辨率有限元并行模拟研究成果可为岩土工程中结构特别复杂、计算区域特别大、地质情况复杂等模拟提供很好的技术方法和实现手段。
关键词
并行
有限元
可扩展
并行
计算
岩土工程
对偶原始有限元撕裂内联法(FETI-DP)
Keywords
parallel finite elements
scalable parallel computation
geotechnical engineering
dual-primal finite element tearing and interconnecting method(FETI-DP)
分类号
O242.21 [理学—计算数学]
在线阅读
下载PDF
职称材料
题名
半隐式半Lagrangian时间积分及其可扩展并行算法设计
4
作者
张卫民
朱小谦
曹小林
机构
国防科技大学计算机学院
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2003年第5期68-72,共5页
基金
国家自然科学基金资助项目(40245023)
文摘
目前谱模式仍然是全球数值天气预报业务模式的主流。针对全球数值天气预报谱模式,研究两个时间层的半隐式半Lagrangian时间积分格式以及用于计算起始点的准三次空间插值方法,提出了按需通讯的可扩展并行算法设计,在由4个双CPUSMP结点组成的Linux机群环境下,该算法的8任务相对于4任务的加速比达到了1.65,取得了良好的并行效果。
关键词
半Lagrangian
谱模式
可扩展
并行
算法
Linux机群系统
Keywords
semi-Lagrangian
spectral model
scalable parallel algorithm
Linux cluster
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
迭代方法中基于渐近规模的通信与计算比分析
被引量:
6
5
作者
徐小文
莫则尧
武林平
机构
北京应用物理与计算数学研究所
出处
《计算机学报》
EI
CSCD
北大核心
2013年第4期782-789,共8页
基金
国家"九七三"重点基础研究发展规划项目基金(2011CB309702)
国家"八六三"高技术研究发展计划项目基金(2012AA01A309)资助~~
文摘
迭代方法是科学计算中求解大规模稀疏线性代数方程组最常用的方法.大量实际应用表明,迭代方法通常具有较高的通信与计算比,只有在粗粒度并行下才能取得较好的并行可扩展性能.而实际应用大规模计算的需求和当前多核/众核体系结构的发展趋势要求迭代方法具备细粒度并行可扩展能力.文中引入渐近规模,即满足加速条件的计算规模下界,来反映并行迭代方法适应细粒度并行的能力,并由此刻画通信与计算比.基于矩阵的稀疏模式及其通信模式、机器的通信参数和迭代方法的基本运算,给出了渐近规模的理论预测公式.在一台包含128个双路4核计算节点的并行机上,分别基于纯进程并行(MPI)和进程/线程混合并行(MPI/OpenMP),以实际应用中3种常用迭代方法Jacobi、CG、BiCGSTAB为例,分析其渐近规模.并行可扩展性测试表明了渐近规模用于刻画迭代方法通信与计算比的准确性.对于纯进程情形,给出了渐近规模的理论预测与实际测试的对比,表明了理论预测结果的正确性.最后,基于这些结果,从迭代方法的算法设计和并行实现等方面讨论了面向未来更大规模的计算系统,降低通信与计算比的途径.
关键词
迭代方法
通信与计算比
并行可扩展
渐近规模
多核
众核体系结构
Keywords
iterative method
communication-to-computation parallel scalability asymptoticsize
multi/many-cores
分类号
TP302 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于并行可扩展科学计算工具集求解GRAPES全球非静力模式亥姆霍兹问题
张理论
宋君强
赵文涛
胡江林
《气象学报》
CAS
CSCD
北大核心
2011
1
在线阅读
下载PDF
职称材料
2
提高可扩展并行机群并行I/O效率的一个方法
龙翔
李忠泽
高小鹏
李未
《计算机研究与发展》
EI
CSCD
北大核心
2000
11
在线阅读
下载PDF
职称材料
3
岩土工程亿级单元有限元模型可扩展并行计算
张友良
谭飞
张礼仁
施明明
《岩土力学》
EI
CAS
CSCD
北大核心
2016
8
在线阅读
下载PDF
职称材料
4
半隐式半Lagrangian时间积分及其可扩展并行算法设计
张卫民
朱小谦
曹小林
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2003
0
在线阅读
下载PDF
职称材料
5
迭代方法中基于渐近规模的通信与计算比分析
徐小文
莫则尧
武林平
《计算机学报》
EI
CSCD
北大核心
2013
6
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部