期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
大规模带状线性方程组的分层混合并行求解算法 被引量:1
1
作者 徐磊 郑汉垣 +2 位作者 刘智翔 宋安平 张武 《计算机应用与软件》 CSCD 北大核心 2013年第12期124-126,共3页
并行计算过程中,全局通信往往会成为影响算法可扩展性的关键因素。因此,针对大规模带状线性方程组,提出基于MPI/OpenMP多粒度混合编程模型的分层并行算法,将全局通信转化为多次局部通信,解决了全局通信所带来的瓶颈问题,提高了大规模带... 并行计算过程中,全局通信往往会成为影响算法可扩展性的关键因素。因此,针对大规模带状线性方程组,提出基于MPI/OpenMP多粒度混合编程模型的分层并行算法,将全局通信转化为多次局部通信,解决了全局通信所带来的瓶颈问题,提高了大规模带状线性方程组并行求解算法的可扩展性。 展开更多
关键词 大规模带状线性方程组 分层算法 MPI OpenMP局部通信
在线阅读 下载PDF
CUDA架构下大规模稠密线性方程组的并行求解 被引量:7
2
作者 杨梅 李志民 曹大勇 《计算机工程与应用》 CSCD 北大核心 2011年第32期27-30,共4页
在Gauss-Jordan消去法的基础上,给出了一种适应于CUDA架构的改进Gauss-Jordan消去并行算法。通过分析该方法的处理过程以及CUDA架构的相应限制,在CUDA的grid-block-thread三层组织结构的基础上,从算法构造的角度提出了grid-strip-group-... 在Gauss-Jordan消去法的基础上,给出了一种适应于CUDA架构的改进Gauss-Jordan消去并行算法。通过分析该方法的处理过程以及CUDA架构的相应限制,在CUDA的grid-block-thread三层组织结构的基础上,从算法构造的角度提出了grid-strip-group-block-thread五层结构,给出了基础行以及全局基础行等概念,并构建了适应于CUDA架构的Gauss-Jordan消去法的并行版本,在最高维数为4000维的大规模稠密线性方程组的算例求解上与串行Gauss-Jordan消去法进行了比较,实验结果表明,该算法能够充分利用GPU的硬件特性,有效地降低了大规模稠密线性方程组的求解时间。 展开更多
关键词 计算统一设备架构(CUDA) 并行算法 改进Gauss-Jordan消去法 大规模稠密线性方程组
在线阅读 下载PDF
解大规模线性方程组的Mann迭代并行算法 被引量:1
3
作者 胡晓力 田有先 《计算机应用与软件》 CSCD 北大核心 2008年第8期62-64,共3页
利用实函数不动点的Mann迭代算法,提出了一种求解大规模线性方程组新的并行算法,分析了算法的并行加速比,讨论了算法在基于消息传递机制的MPI并行环境下的实现流程,给出了并行环境上的实验。该算法适用范围广,数值计算结果表明理论分析... 利用实函数不动点的Mann迭代算法,提出了一种求解大规模线性方程组新的并行算法,分析了算法的并行加速比,讨论了算法在基于消息传递机制的MPI并行环境下的实现流程,给出了并行环境上的实验。该算法适用范围广,数值计算结果表明理论分析与实际计算相符合,算法在并行环境下具有较好的并行度,可适合大规模科学与工程的高性能计算。 展开更多
关键词 MANN迭代 大规模线性方程组 并行算法
在线阅读 下载PDF
求解带状线性方程组的一种并行算法 被引量:8
4
作者 段治健 杨永 +1 位作者 马欣荣 刘三阳 《计算机科学》 CSCD 北大核心 2010年第3期242-244,270,共4页
提出了一种在MIMD分布式存储环境下求解带状线性方程组的交替方向迭代并行算法。利用系数矩阵的结构特点分裂矩阵,使整个计算过程只在相邻处理机间通信两次。给出了系数矩阵分别为Hermite正定矩阵和M-矩阵时算法收敛的充分条件。最后,在... 提出了一种在MIMD分布式存储环境下求解带状线性方程组的交替方向迭代并行算法。利用系数矩阵的结构特点分裂矩阵,使整个计算过程只在相邻处理机间通信两次。给出了系数矩阵分别为Hermite正定矩阵和M-矩阵时算法收敛的充分条件。最后,在HP rx2600集群系统上进行的数值计算表明,该算法与多分裂方法相比具有较高的加速比和并行效率。 展开更多
关键词 带状线性方程组 交替方向迭代 HP rx2600集群 并行性
在线阅读 下载PDF
带状线性方程组的一种有效分布式并行算法 被引量:8
5
作者 盛跃宾 宋晓秋 刘德贵 《系统工程与电子技术》 EI CSCD 北大核心 2004年第7期967-969,共3页
根据分而治之思想提出了一种带状线性方程组的分布式并行算法 (DistributedParallelAlgorithmofBandedLinearEquations,简称为DPAB算法 )。当带状线性方程组的系数矩阵满足对角占优时 ,该算法在运行过程中不会中断。分析了算法的复杂性 ... 根据分而治之思想提出了一种带状线性方程组的分布式并行算法 (DistributedParallelAlgorithmofBandedLinearEquations,简称为DPAB算法 )。当带状线性方程组的系数矩阵满足对角占优时 ,该算法在运行过程中不会中断。分析了算法的复杂性 ,给出了基于局域网的MPI异构环境下数值实验结果。其实验结果表明 ,该算法是高效的。 展开更多
关键词 带状线性方程组 分布式并行算法 加速比
在线阅读 下载PDF
求解大规模矩阵问题的Krylov子空间方法 被引量:19
6
作者 戴华 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2001年第2期139-145,共7页
求解大规模矩阵问题包括线性方程组和特征值问题等是计算数学和科学工程计算中的重大课题。最近几年 ,其研究工作取得了许多重大进展。文中给出大型线性方程组和特征值问题 Krylov子空间方法若干进展的一个概述 ,其中包括作者对这些问... 求解大规模矩阵问题包括线性方程组和特征值问题等是计算数学和科学工程计算中的重大课题。最近几年 ,其研究工作取得了许多重大进展。文中给出大型线性方程组和特征值问题 Krylov子空间方法若干进展的一个概述 ,其中包括作者对这些问题的研究成果。涉及的专题包括求解大型线性方程组的共轭梯度法、SYMMLQ算法、MINRES算法、GMRES算法、Lanczos双正交化算法、QMR算法以及这些算法的块格式 ;求解大型对称特征值问题的 Lanczos算法和块 Lanczos算法 ;求解大型非对称特征值问题的 Lanczos算法、Arnoldi算法以及这些算法的块推广。讨论求解大规模矩阵问题的加速技术和预处理技术。 展开更多
关键词 线性方程组 特征值 KRYLOV子空间方法 大规模矩阵
在线阅读 下载PDF
一种基于敏捷集群计算系统的并行GMRES方法
7
作者 何康馨 席国江 陈颖 《无线电通信技术》 北大核心 2024年第1期162-167,共6页
随着通信系统和人工智能的飞速发展,以智慧城市、智慧工厂和智能制造等为代表的多种新型应用场景不断涌现,使得通信、感知和计算等系统的一体化成为技术发展的新趋势。人工智能新型应用场景对大规模高效敏捷计算提出了新的要求,基于敏... 随着通信系统和人工智能的飞速发展,以智慧城市、智慧工厂和智能制造等为代表的多种新型应用场景不断涌现,使得通信、感知和计算等系统的一体化成为技术发展的新趋势。人工智能新型应用场景对大规模高效敏捷计算提出了新的要求,基于敏捷集群计算系统,提出了一种并行广义最小残差(Generalized Minimal Residual, GMRES)方法,主要通过并行矩阵向量乘法和并行高瘦矩阵QR(Tall and Skinny QR,TSQR)分解实现Krylov子空间的高效并行构造,充分利用集群计算系统的计算和通信性能,实现大规模线性方程组Ax=b的快速求解,其中A为一个n×n的矩阵,在工程实践中,n可达数十万甚至百万规模。通过求解二维泊松方程的有限元离散得到的刚度方程,验证了算法的有效性。 展开更多
关键词 敏捷集群计算 并行广义最小残差方法 KRYLOV子空间 大规模线性方程组
在线阅读 下载PDF
拉拉铁氧化物-铜-金矿床(IOCG)的流体过程——不同矿化阶段黄铁矿微量元素约束 被引量:7
8
作者 周家云 毛景文 +3 位作者 朱志敏 陈家彪 沈冰 罗丽萍 《矿物学报》 CAS CSCD 北大核心 2009年第S1期272-273,共2页
关键词 黄铁矿 金矿床 铁氧化物 流体过程 矿化阶段 拉拉铜矿 带状矿石 微量元素分析 脉状矿 大规模成矿
在线阅读 下载PDF
基于不完全LU分解预处理迭代法的电力系统潮流算法 被引量:19
9
作者 唐坤杰 董树锋 宋永华 《中国电机工程学报》 EI CSCD 北大核心 2017年第S1期55-62,共8页
随着电力系统规模日益增大,对潮流计算速度与实时性的要求相应提高。为了适应大规模电力系统潮流计算需求,根据Krylov子空间思想,提出了一种基于迭代法求解线性方程组的潮流算法,该算法利用不完全LU分解作为预处理,并采用CPU-GPU异构运... 随着电力系统规模日益增大,对潮流计算速度与实时性的要求相应提高。为了适应大规模电力系统潮流计算需求,根据Krylov子空间思想,提出了一种基于迭代法求解线性方程组的潮流算法,该算法利用不完全LU分解作为预处理,并采用CPU-GPU异构运算架构,根据CPU和GPU的不同特点,将潮流算法分为CPU处理部分和GPU处理部分,其中GPU用于并行处理计算量最为密集的线性方程组求解步骤,CPU用于处理潮流算法的其他步骤,实现快速求解。算例表明,所提算法收敛性能稳定、收敛速度快、算法效率高,在系统规模较大时,与传统基于LU分解的潮流算法相比具有明显优势,能够满足大规模电网在线潮流计算的需求,具有工程应用价值。 展开更多
关键词 KRYLOV子空间 不完全LU分解 大规模稀疏线性方程组 潮流计算 CPU-GPU异构运算架构
在线阅读 下载PDF
基于MIC集群平台的GMRES算法并行加速 被引量:2
10
作者 王明清 李明 +2 位作者 张清 张广勇 吴韶华 《计算机科学》 CSCD 北大核心 2017年第4期197-201,240,共6页
广义极小残量法(GMRES)是最常用的求解非对称大规模稀疏线性方程组的方法之一,其收敛速度快且稳定性良好。Intel Xeon Phi众核协处理器(MIC)具有计算能力强、易编程、易移植等特点。采用MPI+OpenMP+offload混合编程模型将GMRES算法移植... 广义极小残量法(GMRES)是最常用的求解非对称大规模稀疏线性方程组的方法之一,其收敛速度快且稳定性良好。Intel Xeon Phi众核协处理器(MIC)具有计算能力强、易编程、易移植等特点。采用MPI+OpenMP+offload混合编程模型将GMRES算法移植到MIC集群平台上。采用进程间集合通信异步隐藏、数据传输优化、向量化以及线程亲和性优化等多种手段,大幅提升了GMRES算法的求解效率。最后将并行算法应用到"局部径向基函数求解高维偏微分方程"问题的求解中。测试表明,CPU节点集群上开启32个进程,并行效率高达71.74%,4块MIC卡的最高加速性能可达单颗CPU的7倍。 展开更多
关键词 广义极小残量法 MIC MPI 大规模线性方程组
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部