期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
大规模有限元系统的GPU加速计算研究 被引量:11
1
作者 刘小虎 胡耀国 符伟 《计算力学学报》 EI CAS CSCD 北大核心 2012年第1期146-152,共7页
研究了GPU(Graphics Processing Units)计算应用于有限元方法中的总刚计算和组装、稀疏矩阵与向量乘积运算、线性方程组求解问题,并基于CUDA(Compute Unified Device Architecture)平台利用GTX295GPU进行程序实现和测试。系统总刚采用CS... 研究了GPU(Graphics Processing Units)计算应用于有限元方法中的总刚计算和组装、稀疏矩阵与向量乘积运算、线性方程组求解问题,并基于CUDA(Compute Unified Device Architecture)平台利用GTX295GPU进行程序实现和测试。系统总刚采用CSR(Compressed Sparse Row)压缩格式存放于GPU显存中,用单元染色方法实现总刚并行计算组装,用共轭梯度迭代法求解大规模线性方程组。对300万自由度以内的空间桁架和平面问题算例,GPU有限元计算分别获得最高9.5倍和6.5倍的计算加速比,并且加速比随系统自由度的增加而近似线性增加,GFLOP/s峰值也有近10倍的增加。 展开更多
关键词 GPU计算 有限元 共轭梯度法 并行计算 CUDA
在线阅读 下载PDF
多先验信息约束的三维电阻率反演方法 被引量:5
2
作者 郭来功 戴广龙 +2 位作者 杨本才 薛俊华 陈本良 《石油地球物理勘探》 EI CSCD 北大核心 2018年第6期1333-1340,1350,I0009,I0010,共11页
先验约束信息可以有效提高直流电阻率三维反演精度,多数约束信息的施加是通过修改目标函数实现的,具有约束信息单一、施加约束信息繁琐的不足。为了改进上述问题,修改迭代重加权最小二乘法反演方程,将数据加权矩阵中的重加权函数修改为... 先验约束信息可以有效提高直流电阻率三维反演精度,多数约束信息的施加是通过修改目标函数实现的,具有约束信息单一、施加约束信息繁琐的不足。为了改进上述问题,修改迭代重加权最小二乘法反演方程,将数据加权矩阵中的重加权函数修改为误差函数和互补误差函数的形式,增加结构度量、权重均值和标准偏差等参数,通过修改地下空间不同区域的重加权函数参数,达到施加不同先验约束信息目的;反演方程计算采用并行共轭梯度最小二乘法,以提高反演速度。在合成数据算例中,分别施加了平滑约束、块状约束和多信息混合约束,反演结果表明多信息约束的成像精度远大于单一信息约束。工程项目中可根据地质结构状况合理选择权函数参数,达到提高三维电阻率反演精度和计算速度的目的。 展开更多
关键词 三维反演 电阻率 迭代重加权最小二乘法 结构度量 并行共轭梯度最小二乘法
在线阅读 下载PDF
结构分析的并行预处理共轭梯度法 被引量:2
3
作者 张朝阳 孙炳楠 唐锦春 《浙江大学学报(自然科学版)》 EI CSCD 1997年第3期380-386,共7页
共轭梯度法(CG法)和预处理共轭梯度法(PCG法)由于其固有的并行性,在有限元并行计算中得到很大的重视.本文对CG法和PCG法求解线性静力问题的并行算法给出了严密、清晰的数学推导过程,给出了适合于工程应用的简单有效的... 共轭梯度法(CG法)和预处理共轭梯度法(PCG法)由于其固有的并行性,在有限元并行计算中得到很大的重视.本文对CG法和PCG法求解线性静力问题的并行算法给出了严密、清晰的数学推导过程,给出了适合于工程应用的简单有效的预处理矩阵,并提出了单元预处理矩阵的概念,有利于发展不同预处理矩阵的研究.作者在局部内存式并行机Transputer上实现了该算法. 展开更多
关键词 有限元 并行算法 共轭梯度法 结构分析 PCG法
在线阅读 下载PDF
自适应交叉近似压缩的高阶矩量法的并行实现 被引量:2
4
作者 袁浩波 何力 +1 位作者 党晓杰 王志军 《电波科学学报》 EI CSCD 北大核心 2016年第1期138-142,共5页
高阶矩量法在计算电磁学中的应用越来越广泛,为了进一步提高其计算规模,引入并行的自适应交叉近似压缩算法(Adaptive Cross Approximation algorithm,ACA).该算法首先采用非均匀有理B样条建模(Non-Uniform Rational B-Splines,NURBS)的... 高阶矩量法在计算电磁学中的应用越来越广泛,为了进一步提高其计算规模,引入并行的自适应交叉近似压缩算法(Adaptive Cross Approximation algorithm,ACA).该算法首先采用非均匀有理B样条建模(Non-Uniform Rational B-Splines,NURBS)的方法进行面片分组;然后利用矩量法中远区阻抗矩阵的低秩特性进行ACA压缩;最后采用稀疏近似逆预条件(Sparse Pattern Approximate Inverse preconditioning,SPAI)的共轭梯度法(Conjugate Gradient method,CG)快速求解矩阵方程.该算法中的ACA压缩过程和迭代求解过程都特别适合并行计算.数值实验表明,对于电大尺寸问题,ACA压缩后的矩阵占用的内存远远低于原矩阵,而预条件的共轭梯度法可以很快收敛.此外该算法在大规模并行时的效率较高. 展开更多
关键词 高阶矩量法 ACA压缩算法 共轭梯度法 并行计算
在线阅读 下载PDF
基于MPI的地下水数值模拟并行算法研究 被引量:3
5
作者 黄林显 邵景力 +2 位作者 崔亚莉 李玲 程汤培 《安徽农业科学》 CAS 2012年第12期7356-7358,共3页
地下水数值模拟是研究分析各种地下水问题的重要手段。针对传统地下水数值模拟串行算法在处理海量数据模型时计算时间长、运行效率低的特点,在分布式存储系统上利用消息传递标准MPI,设计了一种采用Cholesky预条件子,粗粒度、低通信开销... 地下水数值模拟是研究分析各种地下水问题的重要手段。针对传统地下水数值模拟串行算法在处理海量数据模型时计算时间长、运行效率低的特点,在分布式存储系统上利用消息传递标准MPI,设计了一种采用Cholesky预条件子,粗粒度、低通信开销的PCG并行算法。通过在具有4个处理核心的Linux集群环境中的测试可知,该程序运行所获得的加速比会随着处理核心数的增加而不断增大,并在4个处理核心数的时候获得最大加速比2.21,说明所设计的PCG并行算法具有较好的加速效果和可扩展性。 展开更多
关键词 地下水数值模拟 并行算法 消息传递标准MPI 预处理共轭梯度法
在线阅读 下载PDF
等效裂隙岩体THM耦合并行有限元程序开发 被引量:3
6
作者 张强林 王媛 曹国利 《长江科学院院报》 CSCD 北大核心 2009年第10期58-61,共4页
为了解决计算精度与计算时间之间的矛盾,针对三场耦合问题,根据区域分解策略,采用预处理共轭梯度法进行方程组的并行求解,利用mpi+f77编制主从式并行有限元计算程序,并在河海大学高性能计算机群上进行调试及计算,通过算例计算,显示并行... 为了解决计算精度与计算时间之间的矛盾,针对三场耦合问题,根据区域分解策略,采用预处理共轭梯度法进行方程组的并行求解,利用mpi+f77编制主从式并行有限元计算程序,并在河海大学高性能计算机群上进行调试及计算,通过算例计算,显示并行计算可大幅节省计算时间,未来必会得到更广泛的应用。 展开更多
关键词 并行有限元 THM耦合 区域分解 预条件共扼梯度法
在线阅读 下载PDF
大型波导缝隙阵辐射特性的快速分析 被引量:2
7
作者 张玉 梁昌洪 《电子学报》 EI CAS CSCD 北大核心 2005年第9期1623-1625,共3页
针对矩量法分析大型波导缝隙阵时矩阵填充和方程求解速度慢的问题,本文首先给出了负载均衡的并行计算方案,解决了阻抗矩阵填充非常慢这一困难,接着提出了一种新的—“缝隙邻居”预条件方法,因其具有从物理上将基函数之间的近场作用充分... 针对矩量法分析大型波导缝隙阵时矩阵填充和方程求解速度慢的问题,本文首先给出了负载均衡的并行计算方案,解决了阻抗矩阵填充非常慢这一困难,接着提出了一种新的—“缝隙邻居”预条件方法,因其具有从物理上将基函数之间的近场作用充分考虑到预条件矩阵中的优点,故可将典型共轭梯度法求解矩量法分析缝隙阵所得矩阵方程的收敛速度提高了约一个数量级,从而实现了大型缝隙阵列的快速仿真.数值实例表明本文方法的高效性和准确性. 展开更多
关键词 波导缝隙阵 矩量法 并行计算 预条件共轭梯度法 缝隙阵 快速分析 辐射特性 波导 矩量法分析 预条件矩阵 方程求解 阻抗矩阵 收敛速度
在线阅读 下载PDF
大规模MIMO系统中的并行共轭梯度软输出信号检测算法 被引量:2
8
作者 周围 张维 +1 位作者 唐俊 王强 《南京邮电大学学报(自然科学版)》 北大核心 2019年第5期1-6,共6页
在大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)系统中,当接收天线数远远大于发送天线数时,通信信道渐近正交,传统的最小均方误差(Minimum Mean Square Error,MMSE)检测算法能够获得线性近似最优性能,但随着收发天线数增加... 在大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)系统中,当接收天线数远远大于发送天线数时,通信信道渐近正交,传统的最小均方误差(Minimum Mean Square Error,MMSE)检测算法能够获得线性近似最优性能,但随着收发天线数增加,MMSE检测算法涉及到高维的矩阵求逆运算,难以应用在实际生活中。因此,文中提出了一种低复杂度的并行共轭梯度软输出检测算法,该算法对传统的共轭梯度(Conjugate Gradient,CG)法进行改进,并行求解共轭方向和优化步长,在提高算法检测性能的同时还加快了算法的收敛速度;然后利用信道编译码中的比特对数似然比近似算法求解出软信息,进一步提升检测算法的性能。通过理论定量地分析了算法的复杂度,并通过仿真实验对不同检测算法在不同判决方式下的误码率性能和收敛速度进行了研究,结果表明:所提出的并行CG软输出检测算法在复杂度降低的情况下,仅需要少量次数的迭代,便能以较快的收敛速度达到近似最佳的MMSE线性检测性能。 展开更多
关键词 大规模多输入多输出 信号检测 并行共轭梯度 比特对数似然比
在线阅读 下载PDF
基于粗细网格的有限元并行分析方法 被引量:2
9
作者 付朝江 张武 《岩土力学》 EI CAS CSCD 北大核心 2006年第5期807-810,共4页
并行计算己成为求解大规模岩土工程问题的一种强大趋势。探讨了粗细网格与预处理共轭梯度法结合的并行有限元算法。从多重网格刚度矩阵推得有效的预处理子。该算法在工作站机群上实现。用地基处理时土体强夯的数值模拟分析进行了数值测... 并行计算己成为求解大规模岩土工程问题的一种强大趋势。探讨了粗细网格与预处理共轭梯度法结合的并行有限元算法。从多重网格刚度矩阵推得有效的预处理子。该算法在工作站机群上实现。用地基处理时土体强夯的数值模拟分析进行了数值测试,对其并行性能进行了详细分析。计算结果表明:该算法具有良好的并行加速比和效率,是一种有效的并行算法。 展开更多
关键词 有限元 并行计算 共轭梯度 多重网格 岩土工程
在线阅读 下载PDF
一个结构优化设计的并行算法 被引量:2
10
作者 王希诚 唐纪晔 《大连理工大学学报》 CAS CSCD 北大核心 1995年第5期606-611,共6页
将结构分析中的最小总势能原理加以推广,建立了结构优化中的最小总势能模型,使结构的分析与优化相结合,不再需要在每次迭代中进行完整的重分析。这种方法充分利用了结构优化的并行性;算例表明,其具有较高的加速比和计算效率。
关键词 共轭梯度法 并行算法 优化设计 结构设计
在线阅读 下载PDF
并行磁共振图像的非二次正则化保边性重建 被引量:1
11
作者 刘晓芳 叶修梓 +1 位作者 张三元 张引 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第11期2044-2051,共8页
针对并行磁共振在欠采样率较高情况下重建图像存在的混迭伪影和噪声问题,提出一种非二次正则化的保边性图像重建算法.基于SENSE技术,该算法以保边平滑性的非二次凸函数为正则化项,构建一个非二次代价函数,并运用非线性共轭梯度算法求解... 针对并行磁共振在欠采样率较高情况下重建图像存在的混迭伪影和噪声问题,提出一种非二次正则化的保边性图像重建算法.基于SENSE技术,该算法以保边平滑性的非二次凸函数为正则化项,构建一个非二次代价函数,并运用非线性共轭梯度算法求解该最小化问题,实现并行磁共振图像的保边性重建.为了评价算法的有效性和鲁棒性,以归一化均方误差作为评价准则,分析并行磁共振欠采样率最大时真实数据和仿真数据的图像重建.结果表明,该算法显著减少欠采样率较高时并行磁共振图像的混迭伪影,并能够有效抑制噪声和保留边缘信息.相比于其他图像重建算法,该算法能够快速收敛. 展开更多
关键词 并行磁共振成像 敏感性编码 非线性共轭梯度 保边性重建 非二次凸函数
在线阅读 下载PDF
一类偏微分方程的多分裂迭代并行解法 被引量:2
12
作者 任铭 程瑶 张永胜 《现代电子技术》 2011年第12期55-56,60,共3页
许多工程和物理应用问题的求解通常都归结为求微分方程数值解。基于偏微分方程的许多传统算法仅适应于串行机求解,及单机性能无法满足大规模科学与工程问题计算需求的考虑,本文针对一类偏微分方程,给出了相应的并行差分格式,并实现了多... 许多工程和物理应用问题的求解通常都归结为求微分方程数值解。基于偏微分方程的许多传统算法仅适应于串行机求解,及单机性能无法满足大规模科学与工程问题计算需求的考虑,本文针对一类偏微分方程,给出了相应的并行差分格式,并实现了多分裂迭代法并行求解,通过程序设计将其与红黑排序,共轭梯度法等并行算法比较,验证了多分裂迭代法在求解偏微分方程中更有利于实现并行,具有更好的扩展性。 展开更多
关键词 并行差分格式 多分裂迭代法 红-黑排序 共轭梯度法
在线阅读 下载PDF
共轭梯度法在GPU及Xeon Phi下的并行优化及比较 被引量:1
13
作者 黄敏 丁萍 罗海飚 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第11期35-46,53,共13页
为了充分利用多核处理器的强大计算能力并满足具有高并行度应用的需求,提出一种基于大规模稀疏矩阵特征问题求解的并行共轭梯度算法.对图形处理器(GPU)上的计算,有效利用GPU多层次的存储器体系,采用线程与矩阵映射、数据合并访问、数据... 为了充分利用多核处理器的强大计算能力并满足具有高并行度应用的需求,提出一种基于大规模稀疏矩阵特征问题求解的并行共轭梯度算法.对图形处理器(GPU)上的计算,有效利用GPU多层次的存储器体系,采用线程与矩阵映射、数据合并访问、数据复用等优化手段,并通过高效的线程调度来隐藏全局存储器的高延迟访问;对Xeon Phi处理器上的计算,有效利用Xeon Phi的高并行度计算对数据通信/传递、减少数据依赖、向量化、异步计算等进行优化,并通过高效的线程调度来隐藏全局存储器的高延迟访问.文中还通过实验验证了算法的可行性和正确性,并对比了不同方式下的运行效率,发现共轭梯度法在GPU下比在Xeon Phi下的加速效果更好. 展开更多
关键词 共轭梯度法 图形处理器 XEON PHI 并行优化 稀疏矩阵向量乘
在线阅读 下载PDF
6-TPS并联平台型数控铣床结构参数的标定方法 被引量:2
14
作者 王瑞 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2009年第6期720-726,共7页
介绍了6-TPS并联平台型数控铣床的一种结构参数标定方法。借助于工作台上的辅助工艺孔及标准量块,采用加权分类隔离的标定方法,将结构参数分为若干类进行标定,在并联工作台的结构参数标定过程中,采用了改进后的共轭梯度法,提高了标定效... 介绍了6-TPS并联平台型数控铣床的一种结构参数标定方法。借助于工作台上的辅助工艺孔及标准量块,采用加权分类隔离的标定方法,将结构参数分为若干类进行标定,在并联工作台的结构参数标定过程中,采用了改进后的共轭梯度法,提高了标定效率。主要分析了刀具位姿参数及并联机构结构参数的标定方法,通过标定实例验证了标定方法的有效性。 展开更多
关键词 参数标定 共轭梯度法 并联机床
在线阅读 下载PDF
随机有限元分析的二级区域分解并行求解算法 被引量:1
15
作者 付朝江 《应用力学学报》 CAS CSCD 北大核心 2012年第4期475-480,490,共6页
采用蒙特卡罗模拟(MCS)和加权积分法对二维问题进行随机有限元分析。尽管MCS方法对任何有确定解的问题都具有求解精度高的优点,但由于求解所需的计算量巨大使其应用受到限制。利用并行求解技术可有效地处理这种密集型计算问题。基于有... 采用蒙特卡罗模拟(MCS)和加权积分法对二维问题进行随机有限元分析。尽管MCS方法对任何有确定解的问题都具有求解精度高的优点,但由于求解所需的计算量巨大使其应用受到限制。利用并行求解技术可有效地处理这种密集型计算问题。基于有限元分裂对接法(FETI)的并行特性并利用预处理共轭梯度法(PCG)的求解高效性,结合整体子区域实现(GSI-PCG)和FETI法,提出二级求解算法,并在工作站机群上实现了数值算例。算例计算结果表明本文GSI(PCG)-FETI算法具有较高的并行加速比和并行效率,具有良好的性能,可有效地进行二维问题的随机有限元分析。 展开更多
关键词 蒙特卡罗模拟 随机有限元 共轭梯度法 并行计算 有限元分裂对接法
在线阅读 下载PDF
一种求解大型Lyapunov矩阵方程的预处理并行算法 被引量:3
16
作者 侯俊霞 吕全义 +1 位作者 曹方颖 谢公南 《应用数学和力学》 CSCD 北大核心 2013年第5期454-461,共8页
研究了一种求解大型Lyapunov矩阵方程的并行预处理变形共轭梯度法.首先将处理小型矩阵方程的Smith预处理方法引入该问题的求解,将原矩阵方程转变为Stein方程,然后采用变形共轭梯度法并行求解预处理后的矩阵方程.其中遇到的难点是需要确... 研究了一种求解大型Lyapunov矩阵方程的并行预处理变形共轭梯度法.首先将处理小型矩阵方程的Smith预处理方法引入该问题的求解,将原矩阵方程转变为Stein方程,然后采用变形共轭梯度法并行求解预处理后的矩阵方程.其中遇到的难点是需要确定参数μ及求矩阵(A+μI)的逆.基于估计特征值的Gerschgorin圆定理给出了参数μ的估值,再采用变形共轭梯度法并行求得矩阵(A+μI)的逆,从而形成预处理后的矩阵方程.通过数值试验,该算法与未预处理的变形共轭梯度法相比较,预处理算法明显优于未预处理的算法,而且其并行效率高达0.85. 展开更多
关键词 LYAPUNOV矩阵方程 并行计算 变形共轭梯度法 预处理方法
在线阅读 下载PDF
一类特殊矩阵方程的并行预处理变形共轭梯度算法 被引量:2
17
作者 曹方颖 吕全义 谢公南 《应用数学和力学》 CSCD 北大核心 2013年第3期240-251,共12页
研究了求解一类矩阵方程AXB=C,提出了一种并行预处理变形共轭梯度法.该方法给出一种迭代法的预处理模式.首先给出的预处理矩阵是严格对角占优矩阵,构造并行迭代求解预处理矩阵方程的迭代格式,进而使用变形共轭梯度法并行求解.通过数值试... 研究了求解一类矩阵方程AXB=C,提出了一种并行预处理变形共轭梯度法.该方法给出一种迭代法的预处理模式.首先给出的预处理矩阵是严格对角占优矩阵,构造并行迭代求解预处理矩阵方程的迭代格式,进而使用变形共轭梯度法并行求解.通过数值试验,预处理变形共轭梯度法与直接使用变形共轭梯度法相比较,该算法不仅有效提高了收敛速度,而且具有很高的并行性. 展开更多
关键词 矩阵方程 变形共轭梯度法 预处理矩阵 并行性
在线阅读 下载PDF
一种求解鞍点问题的预处理并行算法 被引量:2
18
作者 姜晓林 吕全义 谢公南 《应用数学和力学》 CSCD 北大核心 2014年第9期1011-1019,共9页
研究了一种求解鞍点问题的并行预处理变形共轭梯度算法.通过应用迭代法进行预处理后,再采用变形共轭梯度求解的模式.首先构造系数矩阵近似逆的多项式表达式,以此作为预处理矩阵的逆矩阵,对方程组进行预处理;然后采用变形共轭梯度法并行... 研究了一种求解鞍点问题的并行预处理变形共轭梯度算法.通过应用迭代法进行预处理后,再采用变形共轭梯度求解的模式.首先构造系数矩阵近似逆的多项式表达式,以此作为预处理矩阵的逆矩阵,对方程组进行预处理;然后采用变形共轭梯度法并行求解预处理后的线性方程组.为减少运算量,采用迭代方式并行计算多项式与向量的乘法运算.通过调整迭代次数,即调整多项式次数,检验各种次数的多项式进行预处理后的求解方程的效果.数值试验结果表明,该算法明显优于未预处理的变形共轭梯度法,且当预处理迭代次数取4时效果最好. 展开更多
关键词 鞍点问题 并行算法 变形共轭梯度法 预处理方法
在线阅读 下载PDF
预处理变形共轭梯度法并行求解矩阵的Moore-Penrose逆 被引量:2
19
作者 曹方颖 吕全义 《纺织高校基础科学学报》 CAS 2013年第1期137-142,共6页
提出了一种求解Moore-Penrose逆的并行预处理变形共轭梯度法,将求解Moore-Penrose逆转化求解矩阵方程极小范数解或极小范数最小二乘解的问题.给出了两种预处理方法.一种方法是给出预处理矩阵是可逆对角矩阵,然后并行求解预处理矩阵方程... 提出了一种求解Moore-Penrose逆的并行预处理变形共轭梯度法,将求解Moore-Penrose逆转化求解矩阵方程极小范数解或极小范数最小二乘解的问题.给出了两种预处理方法.一种方法是给出预处理矩阵是可逆对角矩阵,然后并行求解预处理矩阵方程;另一种方法是给出预处理矩阵是严格对角占优矩阵,该方法提出了迭代法的预处理模式,构造并行迭代求解预处理矩阵方程的迭代格式,进而使用变形共轭梯度法并行求解.通过数值试验,这两种预处理方法与直接使用变形共轭梯度法相比较,第二种方法有效提高了收敛速度,而且具有很好的并行性. 展开更多
关键词 并行算法 预处理变形共轭梯度法 预处理矩阵方程 MOORE-PENROSE逆
在线阅读 下载PDF
稀疏线性方程组的一种预处理并行算法 被引量:1
20
作者 刘秀敏 吕全义 杜艳君 《纺织高校基础科学学报》 CAS 2012年第2期180-183,共4页
给出了一种求解系数矩阵为稀疏对称正定矩阵的线性方程组的预处理共轭梯度法的并行算法.该方法提出了迭代法的预处理模式.基于此思想,首先给出预条件子M,然后构造并行迭代求解预处理方程组的迭代格式,进而使用共轭梯度法并行求解.通过... 给出了一种求解系数矩阵为稀疏对称正定矩阵的线性方程组的预处理共轭梯度法的并行算法.该方法提出了迭代法的预处理模式.基于此思想,首先给出预条件子M,然后构造并行迭代求解预处理方程组的迭代格式,进而使用共轭梯度法并行求解.通过数值试验,与直接使用共轭梯度法及传统的预处理共轭梯度方法(迭代1次)相比,该方法提高了收敛速度,同时具有很好的并行性. 展开更多
关键词 并行算法 预处理共轭梯度法 预处理方程组 稀疏线性方程组
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部