期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
MiniBranRAP:极小化分支判断数的AMG粗网格矩阵计算并行算法
1
作者
杜皓
毛润彰
+2 位作者
邓蕴桐
黄思路
徐小文
《计算机工程与科学》
CSCD
北大核心
2024年第7期1158-1166,共9页
代数多重网格(AMG)是科学工程计算与工业仿真领域求解大规模稀疏线性代数方程组最常用的算法之一。在启动(Setup)阶段的每个网格层,AMG需要基于限制算子R、当前细网格层矩阵A和插值算子P的稀疏矩阵乘积来计算粗网格矩阵A c=RAP,该过程是...
代数多重网格(AMG)是科学工程计算与工业仿真领域求解大规模稀疏线性代数方程组最常用的算法之一。在启动(Setup)阶段的每个网格层,AMG需要基于限制算子R、当前细网格层矩阵A和插值算子P的稀疏矩阵乘积来计算粗网格矩阵A c=RAP,该过程是AMG并行性能的主要瓶颈。首先发现了主流AMG解法器中RAP并行算法由于分支判断的平方复杂度导致的性能瓶颈,并结合稀疏矩阵CSR的行主序特点,提出了具有线性复杂度分支判断数的RAP并行算法MiniBranRAP。该算法集成到JXPAMG解法器中,并通过实际应用算例验证了算法的有效性。测试结果表明,对于6个来自实际应用的典型算例,相对于Hypre最新版本的BoomerAMG解法器,基于MiniBranRAP的JXPAMG解法器在28个进程上将Setup阶段的计算效率平均加速3.3倍、最高加速9.3倍。
展开更多
关键词
代数多重网格(AMG)
粗网格矩阵计算
分支判断
Hypre
JXPAMG
在线阅读
下载PDF
职称材料
题名
MiniBranRAP:极小化分支判断数的AMG粗网格矩阵计算并行算法
1
作者
杜皓
毛润彰
邓蕴桐
黄思路
徐小文
机构
中国工程物理研究院研究生院
北京应用物理与计算数学研究所
出处
《计算机工程与科学》
CSCD
北大核心
2024年第7期1158-1166,共9页
基金
国家自然科学基金(62032023)。
文摘
代数多重网格(AMG)是科学工程计算与工业仿真领域求解大规模稀疏线性代数方程组最常用的算法之一。在启动(Setup)阶段的每个网格层,AMG需要基于限制算子R、当前细网格层矩阵A和插值算子P的稀疏矩阵乘积来计算粗网格矩阵A c=RAP,该过程是AMG并行性能的主要瓶颈。首先发现了主流AMG解法器中RAP并行算法由于分支判断的平方复杂度导致的性能瓶颈,并结合稀疏矩阵CSR的行主序特点,提出了具有线性复杂度分支判断数的RAP并行算法MiniBranRAP。该算法集成到JXPAMG解法器中,并通过实际应用算例验证了算法的有效性。测试结果表明,对于6个来自实际应用的典型算例,相对于Hypre最新版本的BoomerAMG解法器,基于MiniBranRAP的JXPAMG解法器在28个进程上将Setup阶段的计算效率平均加速3.3倍、最高加速9.3倍。
关键词
代数多重网格(AMG)
粗网格矩阵计算
分支判断
Hypre
JXPAMG
Keywords
algebraic multi-grid(AMG)
coarse grid matrix computation
branch
Hypre
JXPAMG
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
MiniBranRAP:极小化分支判断数的AMG粗网格矩阵计算并行算法
杜皓
毛润彰
邓蕴桐
黄思路
徐小文
《计算机工程与科学》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部