期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于聚合型代数多重网格法的三维直流电法自适应有限元正演
1
作者 潘克家 王鹏德 +3 位作者 胡双贵 王晋轩 邱乐稳 汤井田 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第11期1794-1802,1812,共10页
在各向异性、起伏地形、真实地质模型电法模拟中,经自适应有限元离散后形成的大型稀疏线性系统存在内存消耗高、求解效率低等缺陷。为此,提出了聚合型代数多重网格(AGMG)法与自适应有限元法的联合算法,在提高正演精度的同时提升计算效率... 在各向异性、起伏地形、真实地质模型电法模拟中,经自适应有限元离散后形成的大型稀疏线性系统存在内存消耗高、求解效率低等缺陷。为此,提出了聚合型代数多重网格(AGMG)法与自适应有限元法的联合算法,在提高正演精度的同时提升计算效率,实现复杂模型三维直流电法大规模正演模拟。对于三维直流电法满足的二阶椭圆边值问题,采用非结构化四面体网格的有限元法离散,并通过自适应策略进行局部加密,再利用AGMG法求解离散形成的大规模稀疏线性方程组。最后,通过复杂地电模型和实际地质模型验证了联合算法的有效性。在千万级自由度的求解中,联合算法比传统迭代法快了20多倍,比代数多重网格法快了近10倍,随着模型复杂度的提高,联合算法的效率优势更加明显。 展开更多
关键词 代数多重网格 自适应有限元 各向异性 直流电阻率 起伏地形
在线阅读 下载PDF
直流电阻率三维正演的代数多重网格方法(英文) 被引量:28
2
作者 鲁晶津 吴小平 Klaus Spitzer 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2010年第3期700-707,共8页
多重网格方法在求解由偏微分方程的边值问题离散所得线性系统时,具有非常高的计算效率.但常用的几何多重网格法在处理带跃变系数的偏微分方程时存在一定缺陷,限制了其应用.本文应用代数多重网格(AMG)方法求解三维直流电阻率法正演模拟... 多重网格方法在求解由偏微分方程的边值问题离散所得线性系统时,具有非常高的计算效率.但常用的几何多重网格法在处理带跃变系数的偏微分方程时存在一定缺陷,限制了其应用.本文应用代数多重网格(AMG)方法求解三维直流电阻率法正演模拟形成的有限差分线性方程组,通过求解二次场的方法消除了总场中由点电源导致的奇异性,从而获得快速、精确的三维电阻率数值模拟.对两个存在大的电性差异的模型进行了模拟计算,以验证代数多重网格法的收敛效率.计算结果表明,与不完全Cholesky共轭梯度(ICCG)方法相比,代数多重网格方法具有更高的计算效率及稳定性.而且,随着三维网格节点数的增加,代数多重网格方法计算的高效性更加明显. 展开更多
关键词 代数多重网格 三维电阻率数值模拟 电性差异
在线阅读 下载PDF
使用代数多重网格进行多聚焦图像融合 被引量:5
3
作者 黄颖 解梅 +1 位作者 李伟生 高靖淞 《电子科技大学学报》 EI CAS CSCD 北大核心 2015年第2期272-277,共6页
针对将代数多重网格对图像结构信息的提取能力应用到图像的融合方面进行了研究,提出了一种基于代数多重网格的自适应多聚焦图像融合算法。首先提取图像的粗网格数据,然后进行分块重建,根据分块重建结果与原始图像的均方差选择合适的源... 针对将代数多重网格对图像结构信息的提取能力应用到图像的融合方面进行了研究,提出了一种基于代数多重网格的自适应多聚焦图像融合算法。首先提取图像的粗网格数据,然后进行分块重建,根据分块重建结果与原始图像的均方差选择合适的源图像分块进入融合图像。为了避免分块之间的不连续性,采用了自适应的策略。实验结果表明,自适应图像融合的结果没有丢失有效信息,能够最大程度地将清晰物体保留在融合图像之中。 展开更多
关键词 自适应算法 代数多重网格 图像融合 图像重构 多聚焦图像
在线阅读 下载PDF
代数多重网格方法在紊流数值预测中的应用 被引量:2
4
作者 蒋光彪 何永森 +1 位作者 肖映雄 舒适 《计算力学学报》 EI CAS CSCD 北大核心 2010年第6期1016-1021,共6页
机械和矿山工程中广泛使用锥形渐扩管。将DLR型k-ε紊流模型中非线性偏微分方程基于全隐式高精度迎风差分格式离散,得到差分方程的系数矩阵为五对角块十三对角带状稀疏矩阵,基于一种"三元组"方式进行压缩存储,节约内存。提出... 机械和矿山工程中广泛使用锥形渐扩管。将DLR型k-ε紊流模型中非线性偏微分方程基于全隐式高精度迎风差分格式离散,得到差分方程的系数矩阵为五对角块十三对角带状稀疏矩阵,基于一种"三元组"方式进行压缩存储,节约内存。提出了一种基于DLR型k-ε紊流模型与代数多重网格方法结合的新算法,阐述了代数多重网格方法的实施过程。对具有逆压梯度流动的锥形渐扩管内紊流进行了数值预测。数值实验表明,代数多重网格方法对求解紊流模型离散方程组非常有效,同此前该紊流数值模拟中使用的Point-SOR方法相比,计算效率有了显著提高,计算结果与实验结果吻合较好。 展开更多
关键词 代数多重网格方法 锥形渐扩管 紊流 DLR型k-ε紊流模型 稀疏矩阵
在线阅读 下载PDF
用于图像重构的代数多重网格算法 被引量:1
5
作者 钱鹰 王矿生 黄颖 《计算机工程与设计》 CSCD 北大核心 2013年第8期2801-2805,共5页
通过分析代数多重网格(algebraic multi-grid,AMG)算法中粗网格提取过程,提出了一种基于代数多重网格算法的图像重构算法。在代数多重网格算法的粗网格序列中,下一层粗网格保留上一层网格的强连接部分。将这种机制运用到图像,提取的粗... 通过分析代数多重网格(algebraic multi-grid,AMG)算法中粗网格提取过程,提出了一种基于代数多重网格算法的图像重构算法。在代数多重网格算法的粗网格序列中,下一层粗网格保留上一层网格的强连接部分。将这种机制运用到图像,提取的粗网格可以较好的保留图像的有效信息部分,在图像变化剧烈的细节区域网格点分布不均匀,平滑模糊部分网格点分布均匀一致。以粗网格像素点进行插值,可以得到较好的重建结果。以均方误差为评价参数,与小波算法进行了比较,比较结果表明该算法在一定程度上优于传统的小波算法,且有一个图像融合应用实例,优于小波融合方法。 展开更多
关键词 代数多重网格 网格 图像重构 均方误差 小波
在线阅读 下载PDF
求解一类网格结构模型的代数多重网格法 被引量:1
6
作者 肖映雄 张平 尹久仁 《计算力学学报》 CAS CSCD 北大核心 2005年第2期176-182,共7页
针对网格结构离散模型的特点,设计了一类适用于求解大规模二维网格结构数值计算的代数多重网格方法,详细描述了代数多重网格方法中粗化策略与插值算子的构造,并在此基础上得到了一类以该代数多重网格为预条件子的预处理方法。数值试验表... 针对网格结构离散模型的特点,设计了一类适用于求解大规模二维网格结构数值计算的代数多重网格方法,详细描述了代数多重网格方法中粗化策略与插值算子的构造,并在此基础上得到了一类以该代数多重网格为预条件子的预处理方法。数值试验表明,本文建立的代数多重网格方法及相应的预处理方法是健壮的,具有较好的数值效率,非常适合于大规模网格结构材料的数值计算。近似连续模型的建立为代数多重网格方法的可靠性和计算的准确性提供了有效的理论基础。 展开更多
关键词 网格结构 离散模型 代数多重网格 预处理 近似连续模型
在线阅读 下载PDF
基于聚集混合粗化的代数多重网格并行算法 被引量:1
7
作者 赵莲 赵永华 迟学斌 《计算机工程与设计》 北大核心 2017年第1期81-85,共5页
为提高代数多重网格(algebraic multigrid,AMG)并行算法的可扩展性能,提出一种基于聚集粗化和最大独立集算法的混合并行粗化算法。在每个进程内部独立实现聚集粗化,在此基础上,进程间采用PMIS(parallel maximum independent set)算法对... 为提高代数多重网格(algebraic multigrid,AMG)并行算法的可扩展性能,提出一种基于聚集粗化和最大独立集算法的混合并行粗化算法。在每个进程内部独立实现聚集粗化,在此基础上,进程间采用PMIS(parallel maximum independent set)算法对边界点进行修正。针对现代多核处理器,结合细粒度的并行编程模型,实现MPI+OpenMP混合编程并行算法。数值实验结果验证了该算法的有效性,对于求解二维五点Laplace方程在集群"元"上并行规模达到256核,相对于AGMG软件包求解总时间提高了74%,测试结果优于hypre软件包,可扩展到128核心。 展开更多
关键词 代数多重网格 数据存储格式 PMIS粗化 聚集粗化 混合编程
在线阅读 下载PDF
代数多重网格与多波前技术综合并行有限元分析方法 被引量:1
8
作者 王希诚 刘信力 吴宏宇 《大连理工大学学报》 CAS CSCD 北大核心 2002年第2期148-152,共5页
提出一种新的有限元并行计算格式 ,将代数多重网格、块迭代与多波前技术综合用于有限元分析 ,具有不限制节点编号顺序、编程简单、存储量小和计算时间少的优点 .并行程序是在国家高性能计算中心 (北京 )的曙光 1 0 0 0 A上借助 PVM(Para... 提出一种新的有限元并行计算格式 ,将代数多重网格、块迭代与多波前技术综合用于有限元分析 ,具有不限制节点编号顺序、编程简单、存储量小和计算时间少的优点 .并行程序是在国家高性能计算中心 (北京 )的曙光 1 0 0 0 A上借助 PVM(Parallel Virtual Machine)软件系统实现的 ,PVM系统用于处理各计算节点间的通信 . 展开更多
关键词 并行处理 有限元法 区域分裂 代数多重网格 多波前技术 块迭代 有限元并行分析
在线阅读 下载PDF
代数多重网格方法在固体火箭发动机三维流场计算中的应用 被引量:1
9
作者 李峥 向红军 《固体火箭技术》 EI CAS CSCD 北大核心 2014年第2期172-177,共6页
采用代数多重网格方法,求解可压缩形式SIMPLE算法中的压力修正方程,在同位网格基础上应用有限体积法离散Navier-Stokes方程组,数值模拟双燃速星型药柱固体火箭发动机燃烧室喷管三维流场;通过在不同规模网格下与直接求解法和不完全LU分解... 采用代数多重网格方法,求解可压缩形式SIMPLE算法中的压力修正方程,在同位网格基础上应用有限体积法离散Navier-Stokes方程组,数值模拟双燃速星型药柱固体火箭发动机燃烧室喷管三维流场;通过在不同规模网格下与直接求解法和不完全LU分解BiCGStab方法对比,研究了代数多重网格方法在求解此类问题中的计算效率。计算结果对比表明,代数多重网格方法增加了固体火箭发动机三维流场的求解效率。随后,将该算法构建的求解器用于求解双燃速固体火箭发动机三维两相流场,能成功获取固体火箭发动机三维内流场的整体结构。 展开更多
关键词 固体火箭发动机 代数多重网格方法 三维两相流场 数值模拟
在线阅读 下载PDF
基于代数多重网格的图像传感器物体识别技术
10
作者 黄颖 王文斌 郑弘晖 《电子科技大学学报》 EI CAS CSCD 北大核心 2015年第5期743-748,共6页
物联网中的物体识别可以减少人为的参与,提高物物相连的效率。该文针对物联网环境中的物体识别进行了初步研究,提出了一种结合代数多重网格的物体识别的方法,降低了物理存储和网络传输的代价。首先运用代数多重网格方法对不同模糊程度... 物联网中的物体识别可以减少人为的参与,提高物物相连的效率。该文针对物联网环境中的物体识别进行了初步研究,提出了一种结合代数多重网格的物体识别的方法,降低了物理存储和网络传输的代价。首先运用代数多重网格方法对不同模糊程度的图像进行重建,在此基础上进行特征检测;然后运用"词袋"模型对使用了代数多重网格方法与未使用该方法的物体识别进行了对比试验。实验结果表明,运用一定程度的模糊图像识别物体能得到较高的稳定性,并且提升了与非同一场景的物体识别的区分度;运用代数多重网格方法的"词袋"模型提高了物体识别的准确率。 展开更多
关键词 代数多重网格 特征提取 图像重建 物体识别 物联网
在线阅读 下载PDF
基于坐标分割的聚集型代数多重网格预条件研究
11
作者 吴建平 银福康 +1 位作者 彭军 杨锦辉 《计算机应用与软件》 北大核心 2018年第7期273-278,共6页
针对基于坐标分割的聚集型代数多重网格预条件,给出了三种进行坐标分割的方法,即正方分割、最小界面分割与逐步单向分割,并对其进行了高效实现。正方分割以每个子图接近于正方体或正方形的方式进行分割。最小界面分割遍历所有可能的分割... 针对基于坐标分割的聚集型代数多重网格预条件,给出了三种进行坐标分割的方法,即正方分割、最小界面分割与逐步单向分割,并对其进行了高效实现。正方分割以每个子图接近于正方体或正方形的方式进行分割。最小界面分割遍历所有可能的分割,并以每个子图表面积或周长之和最短的方式进行实际分割。逐步单向分割以分割数的素因子分解为基础,并按素因子从大到小的顺序,每次沿不同坐标数最大的方向进行分割,直到所有素因子遍历完为止。之后对从模型偏微分方程离散得到的稀疏线性方程组,通过V型、W型与K型等多种循环,从多重网格预条件共轭斜量法的效率上,对这三种分割算法进行了实验对比分析。结果表明,逐步单向分割更适合于Jacobi光滑、K-循环与强各向异性等情形。最小界面分割算法更适合于Gauss-Seidel光滑、系数矩阵具有较多非零元素等情形。 展开更多
关键词 稀疏线性方程组 聚集型代数多重网格 预条件 共轭斜量法 坐标分割
在线阅读 下载PDF
结合代数多重网格的钻石编码隐写算法
12
作者 杨明 黄颖 《计算机应用》 CSCD 北大核心 2017年第6期1609-1615,共7页
针对隐写算法安全性的问题,提出一种结合代数多重网格(AMG)的钻石编码(DE)隐写算法。首先,通过AMG方法将图像的像素点分成粗细网格两个部分。然后,结合DE把机密信息分别嵌入到粗细网格两个像素序列中。其中,粗网格部分像素的改变对整幅... 针对隐写算法安全性的问题,提出一种结合代数多重网格(AMG)的钻石编码(DE)隐写算法。首先,通过AMG方法将图像的像素点分成粗细网格两个部分。然后,结合DE把机密信息分别嵌入到粗细网格两个像素序列中。其中,粗网格部分像素的改变对整幅图像的质量影响较小,而细网格部分像素的改变对整幅图像的质量影响较大。又因为DE的k值跟信息隐藏容量密切相关,随着k值的增加像素改变量变大,所以用DE嵌入的过程中,粗网格部分选择的k值不小于细网格。最后,选择DE的k值等于1与2,提出了三种隐写方案。与最低有效位(LSB)置换、随机LSB匹配、DE算法和自适应边缘检测算法进行比较,实验结果表明,三种隐写方案的一阶Markov安全指标皆优于其他对比隐写算法。 展开更多
关键词 数字隐写 钻石编码 代数多重网格 图像结构相似性 Markov安全测度
在线阅读 下载PDF
自顶向下聚集型代数多重网格预条件的边权选择
13
作者 吴建平 银福康 +1 位作者 彭军 杨锦辉 《计算机工程与科学》 CSCD 北大核心 2019年第2期191-196,共6页
针对基于图划分的自顶向下聚集型代数多重网格预条件,考察了利用METIS软件包进行多重网格构建的方法,并就该软件包只能处理整型权重,不能处理实型权重的问题,提出了一种将实型边权转化为整型边权的有效方法。之后将这种转化方法应用到ME... 针对基于图划分的自顶向下聚集型代数多重网格预条件,考察了利用METIS软件包进行多重网格构建的方法,并就该软件包只能处理整型权重,不能处理实型权重的问题,提出了一种将实型边权转化为整型边权的有效方法。之后将这种转化方法应用到METIS图划分软件中的边权选择,并用其给出了对自顶向下聚集型代数多重网格预条件的一种改进算法。通过对二维与三维模型偏微分方程离散所得稀疏线性方程组的数值实验表明,带边权的改进型算法大大提高了多重网格预条件共轭斜量法的迭代效率,特别是对各向异性问题,改进效果更加显著。 展开更多
关键词 稀疏线性方程组 聚集型代数多重网格 预条件 共轭斜量法 图划分
在线阅读 下载PDF
自顶向下聚集型代数多重网格预条件的健壮性与参数敏感性研究
14
作者 吴建平 《计算机应用研究》 CSCD 北大核心 2018年第9期2617-2620,共4页
针对自顶向下聚集型代数多重网格预条件,首先对问题规模敏感性进行了研究,并与基于强连接的经典聚集型算法进行了系统比较,发现大部分情况下,该算法具有明显优势,特别是在采用Jacobi光滑时优势更显著;之后,对最粗网格层的分割数与每次... 针对自顶向下聚集型代数多重网格预条件,首先对问题规模敏感性进行了研究,并与基于强连接的经典聚集型算法进行了系统比较,发现大部分情况下,该算法具有明显优势,特别是在采用Jacobi光滑时优势更显著;之后,对最粗网格层的分割数与每次每个子图进行分割时的分割数这两个参数进行了敏感性分析。综合分析表明,自顶向下聚集型代数多重网格预条件具有较好的健壮性,特别是在采用Gauss-Seidel光滑,或采用九点差分离散时,健壮性表现更加充分。 展开更多
关键词 稀疏线性代数方程组 聚集型代数多重网格 预条件 克里洛夫子空间方法 图分割
在线阅读 下载PDF
一类椭圆型变分不等式的修正代数多重网格解法及并行计算
15
作者 李蔚 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2010年第6期633-639,共7页
提出了一种修正的代数多重网格解法,来求解具有对称二阶椭圆算子的变分不等式的有限元离散问题.该方法基于离散椭圆型变分不等方程的线性互补性,运用积极集策略,对Gauss-Sidel光滑迭代后的近似解进行一个后处理,以满足不等式约束,从而... 提出了一种修正的代数多重网格解法,来求解具有对称二阶椭圆算子的变分不等式的有限元离散问题.该方法基于离散椭圆型变分不等方程的线性互补性,运用积极集策略,对Gauss-Sidel光滑迭代后的近似解进行一个后处理,以满足不等式约束,从而解决了标准代数多重网格法在求解自适应网格上的变分不等式时不收敛的问题.数值实验表明了该算法在一致网格和h-自适应网格上的计算有效性和健壮性.为了减少计算时间,根据该修正算法内在的并行度,提出了一个并行计算格式,数值结果给出了该并行的加速比和效率. 展开更多
关键词 椭圆型变分不等式 修正代数多重网格 并行计算
在线阅读 下载PDF
代数多重网格方法的一个新的收敛性结果
16
作者 史培林 《太原理工大学学报》 CAS 北大核心 2006年第6期718-720,共3页
插值算子是代数多重网格方法(AMG)的重要构成组元之一,为此提出了构造AMG方法插值算子新的、更具有一般性的方法。通过对矩阵范数的估计证明了其收敛性。该方法给出了经典AMG方法插值公式的统一描述,推广了AMG方法的应用范围。最后指出... 插值算子是代数多重网格方法(AMG)的重要构成组元之一,为此提出了构造AMG方法插值算子新的、更具有一般性的方法。通过对矩阵范数的估计证明了其收敛性。该方法给出了经典AMG方法插值公式的统一描述,推广了AMG方法的应用范围。最后指出该结果在某些情形下可以应用于多水平不完全LU分解法(ILUM),为进一步证明一般ILUM方法的收敛性提供了思路。 展开更多
关键词 代数多重网格方法 多水平不完全LU分解法 插值算子 收敛性
在线阅读 下载PDF
MiniBranRAP:极小化分支判断数的AMG粗网格矩阵计算并行算法
17
作者 杜皓 毛润彰 +2 位作者 邓蕴桐 黄思路 徐小文 《计算机工程与科学》 CSCD 北大核心 2024年第7期1158-1166,共9页
代数多重网格(AMG)是科学工程计算与工业仿真领域求解大规模稀疏线性代数方程组最常用的算法之一。在启动(Setup)阶段的每个网格层,AMG需要基于限制算子R、当前细网格层矩阵A和插值算子P的稀疏矩阵乘积来计算粗网格矩阵A c=RAP,该过程是... 代数多重网格(AMG)是科学工程计算与工业仿真领域求解大规模稀疏线性代数方程组最常用的算法之一。在启动(Setup)阶段的每个网格层,AMG需要基于限制算子R、当前细网格层矩阵A和插值算子P的稀疏矩阵乘积来计算粗网格矩阵A c=RAP,该过程是AMG并行性能的主要瓶颈。首先发现了主流AMG解法器中RAP并行算法由于分支判断的平方复杂度导致的性能瓶颈,并结合稀疏矩阵CSR的行主序特点,提出了具有线性复杂度分支判断数的RAP并行算法MiniBranRAP。该算法集成到JXPAMG解法器中,并通过实际应用算例验证了算法的有效性。测试结果表明,对于6个来自实际应用的典型算例,相对于Hypre最新版本的BoomerAMG解法器,基于MiniBranRAP的JXPAMG解法器在28个进程上将Setup阶段的计算效率平均加速3.3倍、最高加速9.3倍。 展开更多
关键词 代数多重网格(amg) 网格矩阵计算 分支判断 Hypre JXPamg
在线阅读 下载PDF
基于代数多重网格的天波超视距雷达跨尺度地海杂波识别方法 被引量:3
18
作者 李灿 张钰 +2 位作者 王增福 卢琨 潘泉 《电子学报》 EI CAS CSCD 北大核心 2022年第12期3021-3029,共9页
天波超视距雷达(天波雷达)在远程预警领域发挥着关键作用.基于天波雷达地海杂波识别的坐标配准利用地海杂波识别结果形成地/海分界线或地形轮廓,将其与先验地理信息匹配为目标定位提供坐标配准参数,可提升天波雷达目标定位精度.为满足... 天波超视距雷达(天波雷达)在远程预警领域发挥着关键作用.基于天波雷达地海杂波识别的坐标配准利用地海杂波识别结果形成地/海分界线或地形轮廓,将其与先验地理信息匹配为目标定位提供坐标配准参数,可提升天波雷达目标定位精度.为满足不同类型目标检测、波束驻留与扫描等要求,天波雷达通常采用不同信号时宽、相干积累点数,使地海杂波谱数据具有多分辨率多尺度特性.针对不同分辨率/尺度地海杂波谱数据分别设计分类器存在训练数据不均衡、维护成本高等问题.本文基于代数多重网格与插值相关图像下采样思想,建立不同尺度地海杂波谱数据之间的代数关系,提出了一种跨尺度深度卷积神经网络地海杂波分类器.其允许使用经过训练的低分辨率地海杂波分类器对高分辨率数据进行分类,分类正确率不低于88.26%;也允许使用经过训练的高分辨率地海杂波分类器对低分辨率数据进行分类,分类正确率不低于92.53%,而无需针对不同分辨率/尺度数据分别设计分类器. 展开更多
关键词 天波超视距雷达 杂波识别 坐标配准 代数多重网格 插值相关图像下采样 跨尺度
在线阅读 下载PDF
基于多核异构的代数多重网格的并行算法实现 被引量:1
19
作者 刘荣 陈华 +2 位作者 李庆贺 张艺丹 贾昌辉 《科学技术与工程》 北大核心 2014年第14期120-124,共5页
近年来,受GPU其高浮点峰值性能的提高和应用领域中大规模科学计算问题的驱动,高性能领域中利用代数多重网格(AMG)求解稀疏线性方程组成为研究热点。针对经典的AMG算法,探究建立阶段(网格粗化)和求解阶段的并行计算结构,提出基... 近年来,受GPU其高浮点峰值性能的提高和应用领域中大规模科学计算问题的驱动,高性能领域中利用代数多重网格(AMG)求解稀疏线性方程组成为研究热点。针对经典的AMG算法,探究建立阶段(网格粗化)和求解阶段的并行计算结构,提出基于多核异构的AMG并行计算模式。数值实验表明,并行计算模式计算效率相对于串行提高了3~4倍,加速效果明显。 展开更多
关键词 代数多重网格 并行计算 多核异构 GPU
在线阅读 下载PDF
面向NUMA集群的代数多重网格算法优化 被引量:1
20
作者 顾坚 刘伟 《计算机科学》 CSCD 北大核心 2014年第6期113-118,共6页
代数多重网格(AMG)是众多数值模拟应用的核心算法,在基于多核的NUMA架构的机群系统上,AMG的并行扩展性暴露了新的问题。通过设计感知NUMA架构的内存分配器,将划分给多个线程的数据分割并绑定到运行对应线程的CPU所属的NUMA存储节点上,... 代数多重网格(AMG)是众多数值模拟应用的核心算法,在基于多核的NUMA架构的机群系统上,AMG的并行扩展性暴露了新的问题。通过设计感知NUMA架构的内存分配器,将划分给多个线程的数据分割并绑定到运行对应线程的CPU所属的NUMA存储节点上,从而改善了OpenMP多线程并行的数据局部性,使BoomerAMG程序在大规模多核计算平台上具有更好的并行扩展性。在单节点和小规模机群的测试中,使用NAAlloc分配器分别获得了最高16%和60%的性能提升。 展开更多
关键词 代数多重网格 NUMA 多核 局部性
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部