期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
并行稀疏近似逆结合多步谱预条件技术分析电磁散射
1
作者 刘兴民 丁大志 +1 位作者 刘路 李兆龙 《南京理工大学学报》 EI CAS CSCD 北大核心 2015年第6期727-732,共6页
为了解决基于多层快速多极子方法的近场稀疏近似逆预条件对于某些开放结构电磁散射问题难以收敛的问题,将稀疏近似逆预条件结合谱预条件形成多步谱预条件技术。通过对复杂模型结构电磁散射特性进行分析,多步谱预条件技术相比于稀疏近似... 为了解决基于多层快速多极子方法的近场稀疏近似逆预条件对于某些开放结构电磁散射问题难以收敛的问题,将稀疏近似逆预条件结合谱预条件形成多步谱预条件技术。通过对复杂模型结构电磁散射特性进行分析,多步谱预条件技术相比于稀疏近似逆预条件技术,计算时间缩短,验证了该预条件技术的有效性。 展开更多
关键词 多层快速多极子方法 并行稀疏近似逆预条件 多步谱条件 电磁散射
在线阅读 下载PDF
稀疏近似逆预条件子及其并行计算 被引量:2
2
作者 迟利华 刘杰 李晓梅 《计算机学报》 EI CSCD 北大核心 2000年第3期255-260,共6页
文中使用范数极小技术 ,提出一种构造稀疏矩阵并行近似逆预条件子的方法 ,所构造的稀疏矩阵近似逆的稀疏结构和系数矩阵的转置矩阵相同 ,计算量和存储量小 ,其求解过程易于并行 ,且并行计算不影响其收敛效果 .通过试算表明 ,该方法对很... 文中使用范数极小技术 ,提出一种构造稀疏矩阵并行近似逆预条件子的方法 ,所构造的稀疏矩阵近似逆的稀疏结构和系数矩阵的转置矩阵相同 ,计算量和存储量小 ,其求解过程易于并行 ,且并行计算不影响其收敛效果 .通过试算表明 ,该方法对很多应用问题的求解具有明显的加速效果 .文中给出了该方法的并行算法 ,并提出了一种自适应分配算法来解决负载平衡问题 . 展开更多
关键词 线性方程组 稀疏近似 条件 并行计算
在线阅读 下载PDF
GPU集群加速近似逆预条件CG并行求解器 被引量:1
3
作者 赵莲 赵永华 +1 位作者 陈尧 赵慰 《计算机科学与探索》 CSCD 北大核心 2015年第9期1084-1092,共9页
针对GPU集群系统,研究了分解近似逆(approximate inverse,AINV)和对称逐次超松弛-近似逆(symmetric successive over relaxation approximate inverse,SSOR-AI)两类近似逆预条件的并行算法。采用多级k-路图划分方法,通过子图的内点和边... 针对GPU集群系统,研究了分解近似逆(approximate inverse,AINV)和对称逐次超松弛-近似逆(symmetric successive over relaxation approximate inverse,SSOR-AI)两类近似逆预条件的并行算法。采用多级k-路图划分方法,通过子图的内点和边界点识别方法以及稀疏矩阵的置换技术,提出了将稀疏矩阵转换为分块箭形矩阵的并行方法。基于所形成的分块箭形矩阵,结合块内稀疏矩阵近似逆串行、块间并行的策略给出了近似逆预条件的并行方法,实现了AINV和SSOR-AI并行算法,解决了AINV预条件难以并行的问题。基于CPU与GPU协同计算、主机端页锁定内存和设备端计算与通信重叠的优化技术,实现了并行近似逆预条件与共轭梯度(conjugate gradient,CG)算法相结合的线性方程组混合并行求解器。数值实验表明,所提方法对AINV和SSOR-AI两类近似逆预条件,在多GPU上获得了很好的可扩展性和加速效果。 展开更多
关键词 近似 条件 迭代法 异构并行计算 GPU集群
在线阅读 下载PDF
基于GPU的SSOR稀疏近似逆预条件研究 被引量:2
4
作者 高家全 王志超 《浙江工业大学学报》 CAS 北大核心 2016年第2期140-145,共6页
由于SSOR预条件共轭梯度算法中预条件方程求解需要前推和回代,导致算法迁移到GPU平台上并行效率不高.为此,基于诺依曼多项式分解技术,提出了一种GPU加速的SSOR稀疏近似逆预条件子(GSSORSAI).它不仅保持了原线性系统系数矩阵的稀疏和对... 由于SSOR预条件共轭梯度算法中预条件方程求解需要前推和回代,导致算法迁移到GPU平台上并行效率不高.为此,基于诺依曼多项式分解技术,提出了一种GPU加速的SSOR稀疏近似逆预条件子(GSSORSAI).它不仅保持了原线性系统系数矩阵的稀疏和对称正定特性,而且预条件方程求解仅需一次稀疏矩阵矢量乘运算,避免了前推和回代过程.实验结果表明:在NVIDIA Tesla C2050GPU上,对比使用Python在单个CPU上SSOR稀疏近似逆预条件子实现方法,GSSORSAI平均快将近100倍;应用到并行的PCG算法中,相比无预条件的CG算法,平均提高了算法的3倍的收敛速度. 展开更多
关键词 SSOR条件 条件共轭梯度算法 稀疏近似 GPU
在线阅读 下载PDF
一般稀疏线性方程组的因子组合型并行预条件研究 被引量:9
5
作者 吴建平 赵军 +3 位作者 马怀发 宋君强 张卫民 李晓梅 《计算机应用与软件》 CSCD 北大核心 2012年第5期6-9,108,共5页
基于因子组合给出一般稀疏线性方程组的一种新并行预条件。在该方案中,应用基于邻接图的重叠区域分解,形成一串相互重叠的子区域。对每个子区域,可以采用任何不完全LU分解。之后,利用全局三角因子与全局下三角因子的乘积作为全局的并行... 基于因子组合给出一般稀疏线性方程组的一种新并行预条件。在该方案中,应用基于邻接图的重叠区域分解,形成一串相互重叠的子区域。对每个子区域,可以采用任何不完全LU分解。之后,利用全局三角因子与全局下三角因子的乘积作为全局的并行预条件,其中全局三角因子利用限制加性Schwarz思想对每个局部上三角因子的逆进行组合得到。分析表明,提出的预条件优于经典加性Schwarz和限制加性Schwarz,且能保持对称正定性。对混凝土细观数值模拟中线性方程组的实验再次表明,新方案优于经典加性Schwarz。 展开更多
关键词 并行计算 稀疏线性方程组 条件 不完全分解 混凝土模拟 有限元
在线阅读 下载PDF
联合积分方程中的对称稀疏近似逆预处理器 被引量:3
6
作者 潘小敏 盛新庆 +3 位作者 张崎 宋东安 黄松高 侯冬云 《北京理工大学学报》 EI CAS CSCD 北大核心 2010年第5期578-580,593,共4页
提出一种针对联合积分方程(CFIE)的对称稀疏近似逆(S-SAI)预处理技术.将联合积分方程中的非对称矩阵改造成对称矩阵,使用Cholesky分解构造出联合积分方程的对称SAI(S-SAI)预处理器.数值实验结果表明,S-SAI预处理器的收敛性能与非对称SAI... 提出一种针对联合积分方程(CFIE)的对称稀疏近似逆(S-SAI)预处理技术.将联合积分方程中的非对称矩阵改造成对称矩阵,使用Cholesky分解构造出联合积分方程的对称SAI(S-SAI)预处理器.数值实验结果表明,S-SAI预处理器的收敛性能与非对称SAI(A-SAI)相似,但是其构造时间比A-SAI的快32倍. 展开更多
关键词 对称 稀疏近似 处理器 联合积分方程
在线阅读 下载PDF
基于修正的对称分解的稀疏近似逆预处理器
7
作者 刘飞航 潘小敏 盛新庆 《电波科学学报》 EI CSCD 北大核心 2011年第6期1065-1069,共5页
提出一种基于修正的对称分解(Cholesky)的稀疏近似逆(SAI)预处理技术。对传统的Cholesky分解进行修正,使之能应用于离散电场积分方程所得的复数对称矩阵,然后,用此修正的Cholesky分解为多层快速多极子算法构造SAI预处理器。数值实验表明... 提出一种基于修正的对称分解(Cholesky)的稀疏近似逆(SAI)预处理技术。对传统的Cholesky分解进行修正,使之能应用于离散电场积分方程所得的复数对称矩阵,然后,用此修正的Cholesky分解为多层快速多极子算法构造SAI预处理器。数值实验表明:基于修正的Cholesky分解的SAI预处理器比基于QR分解的SAI预处理器更高效。 展开更多
关键词 复数对称矩阵 CHOLESKY分解 稀疏近似 处理器
在线阅读 下载PDF
区域分解型并行预条件的一种粗网格校正算法
8
作者 吴建平 马怀发 +2 位作者 赵军 宋君强 张卫民 《计算机应用与软件》 CSCD 北大核心 2013年第9期10-11,118,共3页
区域分解是并行计算的基本手段之一,在稀疏线性方程组迭代求解时,对不完全分解等串行计算时很有效的预条件,经常采用区域分解的思想进行并行化。但区域分解的本质是利用局部解来近似全局解,从而必然存在较大误差,为此,提出一种粗网格校... 区域分解是并行计算的基本手段之一,在稀疏线性方程组迭代求解时,对不完全分解等串行计算时很有效的预条件,经常采用区域分解的思想进行并行化。但区域分解的本质是利用局部解来近似全局解,从而必然存在较大误差,为此,提出一种粗网格校正算法,通过非重叠子区域浓缩,每个非重叠子区域浓缩为一个超结点,形成一个含全局信息且阶数等于子区域个数的小线性方程组,之后用其对原并行预条件进行校正。对块Jacobi型、经典加性Schwarz、以及因子组合型并行不完全分解预条件的实验表明,粗网格校正能有效改善收敛性并提高求解效率。 展开更多
关键词 区域分解 并行计算 稀疏线性方程组 条件 粗网格校正
在线阅读 下载PDF
混凝土细观力学分析程序中的快速算法与并行算法设计 被引量:6
9
作者 吴建平 王正华 +2 位作者 朱星明 马怀发 李晓梅 《计算力学学报》 EI CAS CSCD 北大核心 2008年第3期352-358,共7页
针对一套混凝土细观力学分析程序,在分析其计算方法与计算效率的不足之后,提出了采用稀疏矩阵与稀疏向量技术来高效实现有限元刚度矩阵装配过程的算法,并采用双门槛不完全Cholesky分解预条件技术与CG法相结合来高效地求解稀疏线性方程... 针对一套混凝土细观力学分析程序,在分析其计算方法与计算效率的不足之后,提出了采用稀疏矩阵与稀疏向量技术来高效实现有限元刚度矩阵装配过程的算法,并采用双门槛不完全Cholesky分解预条件技术与CG法相结合来高效地求解稀疏线性方程组。之后,从整体上提出了一个将有限单元分布与未知量分布有机结合的并行算法设计方案,并分别针对刚度矩阵装配、双门槛不完全Cholesky分解、稀疏矩阵与稠密向量相乘、稀疏向量相加等核心算法,进行了相应的并行算法设计。最后,在由每节点2 CPU的8个Intel Xeon节点采用千兆以太网连成的机群上,针对两个混凝土数值试样进行了数值实验,第一个试样含44117个网格点与53200个有限单元,第二个试样含71013个网格点与78800个有限单元;对第一个试样,原串行程序进行全程567次加载计算需要984.83小时约41天,采用文中串行算法后,模拟时间减少到22531秒约6.26小时,采用并行算法在16个CPU上的模拟时间进一步降为3860秒约1.07小时。对第二个试样,原串行程序进行全程94次加载计算需要467.19小时约19.5天,采用文中串行算法后,模拟时间减少到11453秒约3.18小时,采用并行算法在16个CPU上的模拟时间进一步降为1704秒约28.4分钟。串行算法的改进与并行算法的设计大大缩短了计算时间,对加快混凝土力学性能的分析研究具有重要意义。 展开更多
关键词 混凝土细观力学 有限元 稀疏线性方程组 条件 并行算法
在线阅读 下载PDF
排序对重叠区域分解型并行ILU的影响分析
10
作者 吴建平 张理论 +2 位作者 马怀发 宋君强 张卫民 《计算机工程与应用》 CSCD 2012年第33期49-55,共7页
对Krylov子空间迭代法,高效预条件的构造是核心问题之一,而重叠区域分解是一种很有效的并行化技术。通过模型偏微分方程离散求解以及混凝土细观数值模拟中的线性方程组求解,对商图,就自然排序、RCM排序、Sloan排序、GPS排序、谱排序和... 对Krylov子空间迭代法,高效预条件的构造是核心问题之一,而重叠区域分解是一种很有效的并行化技术。通过模型偏微分方程离散求解以及混凝土细观数值模拟中的线性方程组求解,对商图,就自然排序、RCM排序、Sloan排序、GPS排序、谱排序和随机排序等多种重排算法进行了比较。对子区域内顶点的重排方案,进行了自然排序、RCM排序、谱排序、随机排序和一种新排序算法间的比较。结果表明,预条件效果对商图排序不敏感。局部排序对预条件质量具有明显影响,局部采用随机排序时效果一般较差,而带宽缩减算法对加性Schwarz影响很小,对块Jacobi并行化预条件影响较大,对因子组合型并行预条件采用自然排序和新排序时效果较好。 展开更多
关键词 并行计算 稀疏线性方程组 条件 不完全LU分解 混凝土细观数值模拟
在线阅读 下载PDF
基于GPU计算平台的大规模电力系统暂态稳定计算 被引量:12
11
作者 江涵 江全元 《电力系统保护与控制》 EI CSCD 北大核心 2013年第4期13-20,共8页
为满足对大规模互联电网进行快速暂态稳定仿真的需求,提出了一种基于图形处理器(Graphics Processing Unit,GPU)计算平台的暂态稳定并行算法。算法依据暂态稳定联立矩阵的双层对角加边结构,将整体计算分解为三部分:1)动态元件相关计算;2... 为满足对大规模互联电网进行快速暂态稳定仿真的需求,提出了一种基于图形处理器(Graphics Processing Unit,GPU)计算平台的暂态稳定并行算法。算法依据暂态稳定联立矩阵的双层对角加边结构,将整体计算分解为三部分:1)动态元件相关计算;2)分区系统计算;3)边界系统计算。第1)、2)部分被分配到计算平台中的多核CPU上进行处理。第3)部分则采用可完全并行化的稳定双共轭梯度法在GPU上计算,并且为了减少迭代次数使用了稀疏近似逆预处理技术。针对一个含12823节点、1431台发电机组的算例进行了仿真测试,验证了所提算法的有效性和实用性。结果显示,算法并行加速比可达到7.01倍,仿真速度快于实际暂态过程,为暂态稳定并行计算提供了新的解决思路。 展开更多
关键词 暂态稳定 并行计算 图形处理器 双层对角加边结构 稳定双共轭梯度 稀疏近似处理
在线阅读 下载PDF
计算Fiedler向量的一种高效准确方法 被引量:1
12
作者 吴建平 宋君强 +1 位作者 张卫民 赵军 《计算机学报》 EI CSCD 北大核心 2013年第11期2266-2273,共8页
图的Fielder向量在许多应用领域扮演着重要角色,包括矩阵重排、图的分割、蛋白质分析、数据挖掘、机器学习与网络搜索等.但一般认为,计算Fiedler向量是很耗时的,因为其牵涉到特征值问题.文中提出了计算Fiedler向量的一种新方法,该方法... 图的Fielder向量在许多应用领域扮演着重要角色,包括矩阵重排、图的分割、蛋白质分析、数据挖掘、机器学习与网络搜索等.但一般认为,计算Fiedler向量是很耗时的,因为其牵涉到特征值问题.文中提出了计算Fiedler向量的一种新方法,该方法基于收缩技术与反幂法,将Fiedler向量的计算转化为缩减矩阵最小特征值对应特征向量的计算.其次,引入了一种预条件方案来进一步减少计算量,在该方案中,可以采用任何一种针对线性方程组求解的预条件技术.对从UF稀疏矩阵集下载下来的几个稀疏矩阵对应的图,对新方法进行了实验,并与已知的最新方法进行了比较.实验中,采用了对角预条件,且对算法利用MPI和OpenMP混合编程来实现并行计算.实验结果表明,新方法相对于已有方法,在计算效率与计算精度上都具有优势.对图二分的应用实验也表明,在大多数情况下,文中算法给出的结果更好. 展开更多
关键词 Fiedler向量 特征值问题 并行计算 稀疏线性方程组 共轭斜量法 条件
在线阅读 下载PDF
Aztec在混凝土细观数值模拟中的应用研究
13
作者 吴建平 赵军 +2 位作者 宋君强 张卫民 马怀发 《计算机工程与应用》 CSCD 2014年第13期234-238,共5页
细观数值模拟是混凝土性能研究的一种重要手段,但稀疏线性方程组求解在总体模拟时间中所占比重很大。由于属于三维问题,且规模很大,所以采用预条件Krylov子空间迭代是必由之路。Aztec是国际上专门设计用于求解稀疏线性方程组的软件包之... 细观数值模拟是混凝土性能研究的一种重要手段,但稀疏线性方程组求解在总体模拟时间中所占比重很大。由于属于三维问题,且规模很大,所以采用预条件Krylov子空间迭代是必由之路。Aztec是国际上专门设计用于求解稀疏线性方程组的软件包之一,由于目前混凝土细观数值模拟中的稀疏线性方程组对称正定,所以利用Aztec中提供的CG迭代法进行求解,并对多种能保持对称性的预条件选项进行了实验比较。结果表明,在基于区域分解的并行不完全Cholesky分解、无重叠对称化GS迭代、最小二乘等预条件技术中,第一种的效率最高,且在重叠度为0,填充层次为0时,效果最好;实验结果还表明,在本应用问题中,用RCM排序一般导致求解时间更长,从而没有必要采用。 展开更多
关键词 混凝土细观数值模拟 稀疏线性方程组 并行计算 区域分解 条件
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部