期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
GRAPES模式中Helmhothz方程两种求解方法的对比研究
被引量:
3
1
作者
宋君强
伍湘君
+4 位作者
张理论
陈德辉
金之雁
胡江林
李兴良
《计算机工程与科学》
CSCD
北大核心
2011年第11期65-70,共6页
GRAPES是中国气象局自主研发的一个全球/区域分析预报系统。其模式计算方程组经过离散化之后,积分求解过程最终归结为对一个椭圆方程或Helmholtz(赫姆霍兹)方程的求解,这个求解是整个动力框架计算的核心。在目前GRAPES全球模式的准业务...
GRAPES是中国气象局自主研发的一个全球/区域分析预报系统。其模式计算方程组经过离散化之后,积分求解过程最终归结为对一个椭圆方程或Helmholtz(赫姆霍兹)方程的求解,这个求解是整个动力框架计算的核心。在目前GRAPES全球模式的准业务计算中,对于分辨率为0.5o的系统,Helmholtz方程的求解时间占到了整个模式计算时间的三分之一强。而且随着未来高分辨率模式的进一步加细,以及模式计算精度的提高,方程求解计算总量更是呈指数式增长。为此,本文分析了GRAPES模式中求解Helmholtz方程所采用的广义共轭余差法(GCR),并对比给出了利用PETSC函数库中提供的GMRES方法求解Helmholtz方程的一些初步测试结果。结果表明,采用高精度的GMRES方法可以减少模式预报偏差,改善模式预报准确度,在大规模并行计算时具有更好的可扩展性能。
展开更多
关键词
GRAPES
HELMHOLTZ方程
广义共轭余差法(
gcr
)
广义最小残差法(GMRES)
在线阅读
下载PDF
职称材料
广义共轭余差法的通信避免算法
被引量:
1
2
作者
金之雁
杨磊
+1 位作者
林隽民
王哲
《计算机工程与应用》
CSCD
北大核心
2020年第3期74-79,共6页
广义共轭余差法是一种用于求解非对称线性方程组的有效算法。为减少算法中的全局通信,首创性地提出了“通信避免的广义共轭余差法”,避免了迭代过程中的全局通信,使算法中的全局通信总次数降低了一个数量级,同时减少了约50%的计算量(计...
广义共轭余差法是一种用于求解非对称线性方程组的有效算法。为减少算法中的全局通信,首创性地提出了“通信避免的广义共轭余差法”,避免了迭代过程中的全局通信,使算法中的全局通信总次数降低了一个数量级,同时减少了约50%的计算量(计算量的具体减少比例与计算规模相关)。大规模测试中(最大16384进程),新算法最高达到了原算法3倍的运算速率。进一步分析表明,新算法在各种并行规模下的运算速率和可扩展性都优于原算法。在较小并行规模下,新算法的优势主要来源于计算量的减少。在较大并行规模下,新算法的优势主要来源于全局通信量的减少。
展开更多
关键词
通信避免算法
广义共轭余差法
并行计算
全球区域一体化数值预报模式
曙光-派计算集群
在线阅读
下载PDF
职称材料
改进的并行广义共轭残差算法
被引量:
1
3
作者
赵利斌
田有先
《计算机工程》
CAS
CSCD
北大核心
2009年第4期80-82,共3页
针对大型非对称稀疏线性方程组的求解,通过利用广义共轭残差(GCR)算法的固有性质,消除GCR算法的内积计算数据相关性,给出一种改进的广义共轭残差(IGCR)算法。IGCR算法与GCR算法有相同的收敛性,在基于MPI的分布式存储并行机群上进行并行...
针对大型非对称稀疏线性方程组的求解,通过利用广义共轭残差(GCR)算法的固有性质,消除GCR算法的内积计算数据相关性,给出一种改进的广义共轭残差(IGCR)算法。IGCR算法与GCR算法有相同的收敛性,在基于MPI的分布式存储并行机群上进行并行计算时,同步开销次数减少为GCR算法的一半。数值计算结果与理论分析表明,IGCR算法的性能优于GCR算法。
展开更多
关键词
gcr
算法
并行计算
同步开销
在线阅读
下载PDF
职称材料
GRAPES动力框架中大规模稀疏线性系统并行求解及优化
被引量:
2
4
作者
张琨
贾金芳
+2 位作者
严文昕
黄建强
王晓英
《计算机工程》
CAS
CSCD
北大核心
2022年第1期149-154,162,共7页
赫姆霍兹方程求解是GRAPES数值天气预报系统动力框架中的核心部分,可转换为大规模稀疏线性系统的求解问题,但受限于硬件资源和数据规模,其求解效率成为限制系统计算性能提升的瓶颈。分别通过MPI、MPI+OpenMP、CUDA三种并行方式实现求解...
赫姆霍兹方程求解是GRAPES数值天气预报系统动力框架中的核心部分,可转换为大规模稀疏线性系统的求解问题,但受限于硬件资源和数据规模,其求解效率成为限制系统计算性能提升的瓶颈。分别通过MPI、MPI+OpenMP、CUDA三种并行方式实现求解大规模稀疏线性方程组的广义共轭余差法,并利用不完全分解LU预处理子(ILU)优化系数矩阵的条件数,加快迭代法收敛。在CPU并行方案中,MPI负责进程间粗粒度并行和通信,OpenMP结合共享内存实现进程内部的细粒度并行,而在GPU并行方案中,CUDA模型采用数据传输、访存合并及共享存储器方面的优化措施。实验结果表明,通过预处理优化减少迭代次数对计算性能提升明显,MPI+OpenMP混合并行优化较MPI并行优化性能提高约35%,CUDA并行优化较MPI+OpenMP混合并行优化性能提高约50%,优化性能最佳。
展开更多
关键词
稀疏线性系统
广义共轭余差法
信息传递接口
OpenMP编程
统一计算架构
在线阅读
下载PDF
职称材料
题名
GRAPES模式中Helmhothz方程两种求解方法的对比研究
被引量:
3
1
作者
宋君强
伍湘君
张理论
陈德辉
金之雁
胡江林
李兴良
机构
国防科学技术大学计算机学院
中国气象局数值预报中心
国家气象中心
出处
《计算机工程与科学》
CSCD
北大核心
2011年第11期65-70,共6页
基金
国家863计划资助项目(2009AA01A138)
国家自然科学基金资助项目(40505023)
公益性行业(气象)科研专项资助项目(GYHY201006013)
文摘
GRAPES是中国气象局自主研发的一个全球/区域分析预报系统。其模式计算方程组经过离散化之后,积分求解过程最终归结为对一个椭圆方程或Helmholtz(赫姆霍兹)方程的求解,这个求解是整个动力框架计算的核心。在目前GRAPES全球模式的准业务计算中,对于分辨率为0.5o的系统,Helmholtz方程的求解时间占到了整个模式计算时间的三分之一强。而且随着未来高分辨率模式的进一步加细,以及模式计算精度的提高,方程求解计算总量更是呈指数式增长。为此,本文分析了GRAPES模式中求解Helmholtz方程所采用的广义共轭余差法(GCR),并对比给出了利用PETSC函数库中提供的GMRES方法求解Helmholtz方程的一些初步测试结果。结果表明,采用高精度的GMRES方法可以减少模式预报偏差,改善模式预报准确度,在大规模并行计算时具有更好的可扩展性能。
关键词
GRAPES
HELMHOLTZ方程
广义共轭余差法(
gcr
)
广义最小残差法(GMRES)
Keywords
GRAPES
Helmholtz equation
gcr
(
generalized
conjugate
residual
method)
GMRES (
generalized
Minimal
residual
method)
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
广义共轭余差法的通信避免算法
被引量:
1
2
作者
金之雁
杨磊
林隽民
王哲
机构
中国气象科学研究院
英特尔中国有限公司
出处
《计算机工程与应用》
CSCD
北大核心
2020年第3期74-79,共6页
文摘
广义共轭余差法是一种用于求解非对称线性方程组的有效算法。为减少算法中的全局通信,首创性地提出了“通信避免的广义共轭余差法”,避免了迭代过程中的全局通信,使算法中的全局通信总次数降低了一个数量级,同时减少了约50%的计算量(计算量的具体减少比例与计算规模相关)。大规模测试中(最大16384进程),新算法最高达到了原算法3倍的运算速率。进一步分析表明,新算法在各种并行规模下的运算速率和可扩展性都优于原算法。在较小并行规模下,新算法的优势主要来源于计算量的减少。在较大并行规模下,新算法的优势主要来源于全局通信量的减少。
关键词
通信避免算法
广义共轭余差法
并行计算
全球区域一体化数值预报模式
曙光-派计算集群
Keywords
communication avoiding
algorithm
generalized
conjugate
residual
method
parallel computing
global/regional assimilation and prediction system
Sugon_πcluster
分类号
O246 [理学—计算数学]
在线阅读
下载PDF
职称材料
题名
改进的并行广义共轭残差算法
被引量:
1
3
作者
赵利斌
田有先
机构
重庆邮电大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第4期80-82,共3页
基金
重庆市科委基金资助项目(CST2005BB0061)
文摘
针对大型非对称稀疏线性方程组的求解,通过利用广义共轭残差(GCR)算法的固有性质,消除GCR算法的内积计算数据相关性,给出一种改进的广义共轭残差(IGCR)算法。IGCR算法与GCR算法有相同的收敛性,在基于MPI的分布式存储并行机群上进行并行计算时,同步开销次数减少为GCR算法的一半。数值计算结果与理论分析表明,IGCR算法的性能优于GCR算法。
关键词
gcr
算法
并行计算
同步开销
Keywords
generalized conjugate residual(gcr) algorithm
parallel computation
synchronization overhead
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
GRAPES动力框架中大规模稀疏线性系统并行求解及优化
被引量:
2
4
作者
张琨
贾金芳
严文昕
黄建强
王晓英
机构
青海大学计算机技术与应用系
清华大学计算机科学与技术系
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第1期149-154,162,共7页
基金
国家自然科学基金(61762074,62062059)
青海省科技计划(2019-ZJ-7034)
教育部“春晖计划”科研基金(QDCH2018001)。
文摘
赫姆霍兹方程求解是GRAPES数值天气预报系统动力框架中的核心部分,可转换为大规模稀疏线性系统的求解问题,但受限于硬件资源和数据规模,其求解效率成为限制系统计算性能提升的瓶颈。分别通过MPI、MPI+OpenMP、CUDA三种并行方式实现求解大规模稀疏线性方程组的广义共轭余差法,并利用不完全分解LU预处理子(ILU)优化系数矩阵的条件数,加快迭代法收敛。在CPU并行方案中,MPI负责进程间粗粒度并行和通信,OpenMP结合共享内存实现进程内部的细粒度并行,而在GPU并行方案中,CUDA模型采用数据传输、访存合并及共享存储器方面的优化措施。实验结果表明,通过预处理优化减少迭代次数对计算性能提升明显,MPI+OpenMP混合并行优化较MPI并行优化性能提高约35%,CUDA并行优化较MPI+OpenMP混合并行优化性能提高约50%,优化性能最佳。
关键词
稀疏线性系统
广义共轭余差法
信息传递接口
OpenMP编程
统一计算架构
Keywords
sparse linear system
generalized
conjugate
residual
(
gcr
)method
Message Passing Interface(MPI)
OpenMP programming
Compute Unified Device Architecture(CUDA)
分类号
TP311.1 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
GRAPES模式中Helmhothz方程两种求解方法的对比研究
宋君强
伍湘君
张理论
陈德辉
金之雁
胡江林
李兴良
《计算机工程与科学》
CSCD
北大核心
2011
3
在线阅读
下载PDF
职称材料
2
广义共轭余差法的通信避免算法
金之雁
杨磊
林隽民
王哲
《计算机工程与应用》
CSCD
北大核心
2020
1
在线阅读
下载PDF
职称材料
3
改进的并行广义共轭残差算法
赵利斌
田有先
《计算机工程》
CAS
CSCD
北大核心
2009
1
在线阅读
下载PDF
职称材料
4
GRAPES动力框架中大规模稀疏线性系统并行求解及优化
张琨
贾金芳
严文昕
黄建强
王晓英
《计算机工程》
CAS
CSCD
北大核心
2022
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部