期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
非结构网格下稀疏下三角方程求解器众核优化技术研究 被引量:3
1
作者 倪鸿 刘鑫 《计算机科学》 CSCD 北大核心 2019年第B06期518-522,共5页
稀疏下三角方程求解器(SpTRSV)作为基础线性代数库中一个重要的算法,在大规模科学计算中有着广泛应用。在非结构网格中,由于非结构网格具有数据存储无序性、数据强相关性以及频繁地离散访存等特点,该算法在众核架构上难以实现有效的并... 稀疏下三角方程求解器(SpTRSV)作为基础线性代数库中一个重要的算法,在大规模科学计算中有着广泛应用。在非结构网格中,由于非结构网格具有数据存储无序性、数据强相关性以及频繁地离散访存等特点,该算法在众核架构上难以实现有效的并行。文中基于国产异构众核处理器SW26010体系结构的特点,针对非结构网格计算,提出了一种基于流水线串行-局部并行思想的通用众核优化方法。该方法能够有效减少非结构网格计算中的随机访存,提高计算效率,并且具有很好的扩展性。基于该算法对多个实际应用算例进行众核优化,实验结果表明:该方法能够实现单核组3倍以上的加速,显著降低了运行时间。 展开更多
关键词 稀疏下三角方程求解器 非结构网格 SW26010 异构众核优化 并行算法
在线阅读 下载PDF
基于GPU的高性能稀疏矩阵向量乘及CG求解器优化 被引量:7
2
作者 王迎瑞 任江勇 田荣 《计算机科学》 CSCD 北大核心 2013年第3期46-49,共4页
以有限元/有限差分等为代表的一类数值方法,其总体矩阵常常具有"带状"、稀疏的特点。针对"带状"稀疏矩阵,提出和实现了一种高效的矩阵向量乘存储格式和算法"bDIA"。基于nVidia的GTX280系列GPU对其进行了... 以有限元/有限差分等为代表的一类数值方法,其总体矩阵常常具有"带状"、稀疏的特点。针对"带状"稀疏矩阵,提出和实现了一种高效的矩阵向量乘存储格式和算法"bDIA"。基于nVidia的GTX280系列GPU对其进行了测试,结果显示:与CUSP支持的5种常见稀疏矩阵存储格式和算法相比较,所提出的bDIA格式以及相应的spMV算法的单双精度浮点效率均可以提高1倍以上,并突破了该系列GPU在spMV计算时4%的单精度浮点效率上限和22.2%的双精度浮点效率上限;应用于共轭梯度(CG)与稳定双共轭梯度(BiCGStab)求解器,相对于DIA格式均有1.5倍左右的加速。 展开更多
关键词 带状稀疏矩阵向量乘 bDIA 广义有限元 GPU CG求解优化
在线阅读 下载PDF
KLU稀疏直接求解器在状态估计中的应用 被引量:5
3
作者 罗玉春 王毅 +1 位作者 闪鑫 邹德虎 《中国电力》 CSCD 北大核心 2019年第2期111-118,共8页
稀疏矩阵及稀疏线性方程组求解已成为大规模电网状态估计计算效率的瓶颈,阐释了基于BTF和Gilbert-Peierls算法的稀疏矩阵直接求解器KLU(Clark Kent LU),并将其嵌入到智能调度技术支持系统中生产运行的状态估计程序功能。首先在计算得到... 稀疏矩阵及稀疏线性方程组求解已成为大规模电网状态估计计算效率的瓶颈,阐释了基于BTF和Gilbert-Peierls算法的稀疏矩阵直接求解器KLU(Clark Kent LU),并将其嵌入到智能调度技术支持系统中生产运行的状态估计程序功能。首先在计算得到雅可比矩阵的基础上基于OpenMP并行化技术快速求解信息矩阵;然后使用KLU求解器进行信息矩阵的因子表符号分析和数值分解;最后在状态估计计算过程中使用KLU求解器求解线性方程组,从而提高大规模电网状态估计的计算效率。通过省中心、分中心、模型数据中心D5000的状态估计实际应用,证明了该方法的有效性和实用性。 展开更多
关键词 电力系统 状态估计 稀疏矩阵 向左看LU分解 多线程 KLU求解
在线阅读 下载PDF
有限元分析快速直接求解技术进展 被引量:5
4
作者 周洪伟 吴舒 陈璞 《力学进展》 EI CSCD 北大核心 2007年第2期175-188,共14页
现代的有限元分析往往产生大规模的线性方程组,它的求解效率是有限元分析中最关键的一环.自20世纪90年代中期,有限元的求解技术发生了巨大的变化,传统的变带宽解法与波前法被稀疏解法所替代.这一替代为有限元分析带来了求解速度的突破... 现代的有限元分析往往产生大规模的线性方程组,它的求解效率是有限元分析中最关键的一环.自20世纪90年代中期,有限元的求解技术发生了巨大的变化,传统的变带宽解法与波前法被稀疏解法所替代.这一替代为有限元分析带来了求解速度的突破,它使得1万到10万个节点的实用三维有限元分析在微机上即时求解成为现实.本文回顾非并行有限元快速直接求解技术在过去20年的发展,着重讨论了填充元优化与浮点加速运算方法,期望能引起同行的注意. 展开更多
关键词 有限元分析 直接求解 稀疏矩阵 高效能计算
在线阅读 下载PDF
基于稀疏存储的有限元结构分析高效缩聚并行计算方法 被引量:1
5
作者 苗新强 金先龙 丁峻宏 《农业机械学报》 EI CAS CSCD 北大核心 2015年第4期338-343,共6页
基于稀疏存储技术和直接稀疏求解器提出了一种有限元结构分析高效缩聚并行计算方法。该方法将缩聚过程转换为一系列线性方程组的求解过程,并通过直接稀疏求解器进行求解。它能够避免传统变带宽格式缩聚并行计算方法对带宽内大量零元素... 基于稀疏存储技术和直接稀疏求解器提出了一种有限元结构分析高效缩聚并行计算方法。该方法将缩聚过程转换为一系列线性方程组的求解过程,并通过直接稀疏求解器进行求解。它能够避免传统变带宽格式缩聚并行计算方法对带宽内大量零元素的存储和运算,从而大幅度节省内存空间和有效减少计算量。最后通过发动机曲轴的有限元数值仿真实验对算法的有效性进行了验证。结果表明:相对传统变带宽格式缩聚并行计算方法,稀疏存储格式缩聚并行计算方法能够大幅度节省内存空间和有效提高计算效率;各子区域规模越大,该方法对内存空间的节省和计算效率的提高效果就越明显。 展开更多
关键词 高性能计算 有限元分析 稀疏存储技术 直接稀疏求解 缩聚
在线阅读 下载PDF
基于局部加密等级网格的2.5D直流电法有限元模拟 被引量:3
6
作者 胡宏伶 肖晓 +2 位作者 潘克家 汤井田 谢维 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第7期2259-2267,共9页
合理截取半圆形计算区域,采取局部加密的?-等级网格,结合对称行索引存贮格式(CSR)及并行稀疏直接求解器PARDISO,提出一种高效、高精度的2.5D直流电阻率法有限元正演方案,并编制相应的Fortran程序,对具有解析解的3个典型地电模型进行计... 合理截取半圆形计算区域,采取局部加密的?-等级网格,结合对称行索引存贮格式(CSR)及并行稀疏直接求解器PARDISO,提出一种高效、高精度的2.5D直流电阻率法有限元正演方案,并编制相应的Fortran程序,对具有解析解的3个典型地电模型进行计算与分析。研究结果表明:圆形截断边界不仅便于在径向方向上采取?-等级网格剖分,而且能大大简化有限元模拟中单元刚度矩阵的计算;结构化的等级网格避开了通常非结构化网格有限元计算时繁琐的网格剖分及总体刚度阵的集成过程,且能在不增大问题规模的前提下,显著提高2.5D直流电法正演源点附近的模拟精度;Intel MKL的PARDISO求解器能在普通PC机上5 s内求解电法正演有限元离散得到的100万阶稀疏线性方程组,可广泛用于各种地球物理正演问题。 展开更多
关键词 直流电阻率 等级网格 有限元 局部加密 并行稀疏直接求解 行索引存贮格式
在线阅读 下载PDF
三维自由面流动模拟中GPU并行计算技术 被引量:2
7
作者 李海州 唐振远 万德成 《海洋工程》 CSCD 北大核心 2016年第5期20-29,39,共11页
MPS(Moving Particle Semi-implicit)法能够有效地处理溃坝、晃荡等自由面大变形流动问题。在三维MPS方法中,粒子数量的急剧增加会导致其计算效率的降低并限制其在大规模流动问题中的应用。基于自主开发的MPS求解器MLParticleSJTU,本文... MPS(Moving Particle Semi-implicit)法能够有效地处理溃坝、晃荡等自由面大变形流动问题。在三维MPS方法中,粒子数量的急剧增加会导致其计算效率的降低并限制其在大规模流动问题中的应用。基于自主开发的MPS求解器MLParticleSJTU,本文对求解过程中耗时最多的邻居粒子搜寻和泊松方程求解两个模块采用了GPU并行加速,详细探讨了CPU+GPU策略。以三维晃荡和三维溃坝这两种典型的自由面大变形流动为例,比较了CPU+GPU相对于MLParticle-SJTU串行求解时的加速情况,结果表明CPU+GPU在邻居粒子和泊松方程这两个模块中的加速比最高能达到十倍左右。此外,采用CPU+GPU并行能够较准确地模拟溃坝、晃荡等自由面大变形问题。 展开更多
关键词 MLParticle-SJTU求解 邻居粒子搜索 GPU并行技术 稀疏矩阵求解 溃坝 晃荡
在线阅读 下载PDF
基于双正交样条小波的输油管道焊接缺陷漏磁信号识别技术 被引量:2
8
作者 苗俊田 刘冬冬 +2 位作者 李卓军 赵博 鹿德台 《现代电子技术》 2023年第21期55-58,共4页
针对输油管道焊接缺陷漏磁信号量大,无法精准检测漏磁信号磁场强度,影响识别效果的问题,提出基于双正交样条小波的输油管道焊接缺陷漏磁信号识别技术。应用双正交样条小波技术分解信号,采用稀疏矩阵求解器分解磁感应强度。计算连续小波... 针对输油管道焊接缺陷漏磁信号量大,无法精准检测漏磁信号磁场强度,影响识别效果的问题,提出基于双正交样条小波的输油管道焊接缺陷漏磁信号识别技术。应用双正交样条小波技术分解信号,采用稀疏矩阵求解器分解磁感应强度。计算连续小波变换系数和缺陷内漏磁场场磁导率,明确不同介质磁感应强度和场磁导率关系,识别凹、凸缺陷漏磁信号。实验结果表明,该技术凹形缺陷磁场强度检测结果只在峰值处出现了与实际数据最大为50 A/m的偏差,凸形缺陷磁场强度检测结果与实验数据一致。 展开更多
关键词 双正交样条小波 输油管道 焊接缺陷 漏磁信号识别 磁感应强度 稀疏矩阵求解 连续小波变换 磁导率
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部