期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于并行可扩展科学计算工具集求解GRAPES全球非静力模式亥姆霍兹问题 被引量:1
1
作者 张理论 宋君强 +1 位作者 赵文涛 胡江林 《气象学报》 CAS CSCD 北大核心 2011年第3期432-439,共8页
亥姆霍兹方程是非静力平衡大气模式动力内核的主要计算瓶颈之一,其离散矩阵性态差,采用常见预条件Krylov迭代往往收敛很慢。随着全球非静力平衡大气模式时空分辨率的不断提高,亥姆霍兹方程求解面临求解精度和计算时间的双重困难。在高... 亥姆霍兹方程是非静力平衡大气模式动力内核的主要计算瓶颈之一,其离散矩阵性态差,采用常见预条件Krylov迭代往往收敛很慢。随着全球非静力平衡大气模式时空分辨率的不断提高,亥姆霍兹方程求解面临求解精度和计算时间的双重困难。在高分辨率情况下,迭代计算步数和计算量剧增,而且很多传统的预条件迭代求解方法不收敛,迫切需要研究收敛性和并行可扩展性兼备的预条件迭代方法。为此,在安腾机群上建立了基于并行可扩展科学计算工具集(PETSc)的GRAPES全球非静力平衡模式亥姆霍兹问题并行解法器对比研究平台,结合高性能预条件库(hypre),完成了对GRAPES在用解法器、代数多重网格、并行不完全LU分解(EUCLID)及加性Schwarz区域分解等一系列克雷洛夫预条件迭代的分析对比。结果显示PETSc结合高性能预条件库的并行方案是解决GRAPES模式三维亥姆霍兹方程高效并行计算的一个有效途径,其中以代数多重网格预条件迭代的性能最突出;并行加速比分析显示,代数多重网格预条件迭代的并行可扩展性明显优于GRAPES现有解法器,更适用于更高精度和较大规模并行计算。 展开更多
关键词 GRAPES 亥姆霍兹方程 并行可扩展科学计算工具集 高性能预条件库 预条件
在线阅读 下载PDF
提高可扩展并行机群并行I/O效率的一个方法 被引量:11
2
作者 龙翔 李忠泽 +1 位作者 高小鹏 李未 《计算机研究与发展》 EI CSCD 北大核心 2000年第6期650-656,共7页
随着CPU性能的高速提升,系统I/O能力的不足越来越明显地成为提高NOW系统整体性能的瓶颈.在分析现有基于NOW系统的并行I/O算法的基础上,通过理论推导,给出了一种寻求计算进程与计算结点之间最佳映射的方法.该方法可以在数据重分... 随着CPU性能的高速提升,系统I/O能力的不足越来越明显地成为提高NOW系统整体性能的瓶颈.在分析现有基于NOW系统的并行I/O算法的基础上,通过理论推导,给出了一种寻求计算进程与计算结点之间最佳映射的方法.该方法可以在数据重分配时,使各计算结点间的通信量最小,从而达到提高系统并行I/O效率的目的. 展开更多
关键词 可扩展并行机群 并行I/O效率 算法
在线阅读 下载PDF
岩土工程亿级单元有限元模型可扩展并行计算 被引量:8
3
作者 张友良 谭飞 +1 位作者 张礼仁 施明明 《岩土力学》 EI CAS CSCD 北大核心 2016年第11期3309-3316,共8页
讨论了亿万单元有限元模型的可扩展并行计算方法。从软件和硬件两个方面提出了前处理、并行计算方法、程序算法、后处理实现等核心问题的解决方案。采用网格加密方法生成一亿单元的有限元模型,利用对偶原始有限元撕裂内联法(FETI-DP)求... 讨论了亿万单元有限元模型的可扩展并行计算方法。从软件和硬件两个方面提出了前处理、并行计算方法、程序算法、后处理实现等核心问题的解决方案。采用网格加密方法生成一亿单元的有限元模型,利用对偶原始有限元撕裂内联法(FETI-DP)求解系统方程。基于图论理论建立了子区域间的通讯拓扑关系,实现了子区域间点对点通讯,避免速度慢、通信量大的全局通讯。在自主开发程序基础上,增加相应模块,采用面向对象编程技术和MPI消息传递库开发程序。对一个一亿多单元的工程实例运用5000核并行计算,得到了超线性加速比。计算结果在专用图形工作站上进行后处理,显示和交互操作速度良好。研究在两方面实现了突破:一是将模型规模提高到了一亿多单元;二是同时调用了5000个计算核来并行运算,并得到了很高效率。高分辨率有限元并行模拟研究成果可为岩土工程中结构特别复杂、计算区域特别大、地质情况复杂等模拟提供很好的技术方法和实现手段。 展开更多
关键词 并行有限元 可扩展并行计算 岩土工程 对偶原始有限元撕裂内联法(FETI-DP)
在线阅读 下载PDF
半隐式半Lagrangian时间积分及其可扩展并行算法设计
4
作者 张卫民 朱小谦 曹小林 《国防科技大学学报》 EI CAS CSCD 北大核心 2003年第5期68-72,共5页
目前谱模式仍然是全球数值天气预报业务模式的主流。针对全球数值天气预报谱模式,研究两个时间层的半隐式半Lagrangian时间积分格式以及用于计算起始点的准三次空间插值方法,提出了按需通讯的可扩展并行算法设计,在由4个双CPUSMP结点组... 目前谱模式仍然是全球数值天气预报业务模式的主流。针对全球数值天气预报谱模式,研究两个时间层的半隐式半Lagrangian时间积分格式以及用于计算起始点的准三次空间插值方法,提出了按需通讯的可扩展并行算法设计,在由4个双CPUSMP结点组成的Linux机群环境下,该算法的8任务相对于4任务的加速比达到了1.65,取得了良好的并行效果。 展开更多
关键词 半Lagrangian 谱模式 可扩展并行算法 Linux机群系统
在线阅读 下载PDF
迭代方法中基于渐近规模的通信与计算比分析 被引量:6
5
作者 徐小文 莫则尧 武林平 《计算机学报》 EI CSCD 北大核心 2013年第4期782-789,共8页
迭代方法是科学计算中求解大规模稀疏线性代数方程组最常用的方法.大量实际应用表明,迭代方法通常具有较高的通信与计算比,只有在粗粒度并行下才能取得较好的并行可扩展性能.而实际应用大规模计算的需求和当前多核/众核体系结构的发展... 迭代方法是科学计算中求解大规模稀疏线性代数方程组最常用的方法.大量实际应用表明,迭代方法通常具有较高的通信与计算比,只有在粗粒度并行下才能取得较好的并行可扩展性能.而实际应用大规模计算的需求和当前多核/众核体系结构的发展趋势要求迭代方法具备细粒度并行可扩展能力.文中引入渐近规模,即满足加速条件的计算规模下界,来反映并行迭代方法适应细粒度并行的能力,并由此刻画通信与计算比.基于矩阵的稀疏模式及其通信模式、机器的通信参数和迭代方法的基本运算,给出了渐近规模的理论预测公式.在一台包含128个双路4核计算节点的并行机上,分别基于纯进程并行(MPI)和进程/线程混合并行(MPI/OpenMP),以实际应用中3种常用迭代方法Jacobi、CG、BiCGSTAB为例,分析其渐近规模.并行可扩展性测试表明了渐近规模用于刻画迭代方法通信与计算比的准确性.对于纯进程情形,给出了渐近规模的理论预测与实际测试的对比,表明了理论预测结果的正确性.最后,基于这些结果,从迭代方法的算法设计和并行实现等方面讨论了面向未来更大规模的计算系统,降低通信与计算比的途径. 展开更多
关键词 迭代方法 通信与计算比 并行可扩展 渐近规模 多核 众核体系结构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部