期刊文献+
共找到138篇文章
< 1 2 7 >
每页显示 20 50 100
基于混合精度的分布式GMRES算法优化 被引量:1
1
作者 郭帅哲 高建花 计卫星 《计算机科学》 CSCD 北大核心 2024年第9期15-22,共8页
广义最小残差法(Generalized Minimum Residual,GMRES)是一种求解稀疏线性系统的迭代方法,被广泛应用于科学与工程计算等领域。数据量的爆炸式增长,使得GMRES算法求解的问题规模快速膨胀。为了支持大规模问题的求解,研究人员提出了面向... 广义最小残差法(Generalized Minimum Residual,GMRES)是一种求解稀疏线性系统的迭代方法,被广泛应用于科学与工程计算等领域。数据量的爆炸式增长,使得GMRES算法求解的问题规模快速膨胀。为了支持大规模问题的求解,研究人员提出了面向集群的分布式GMRES算法。然而在现有的大多数集群中,节点间的网络性能仍与节点内的GPU高速互联网络存在较大差距,限制了分布式GMRES算法的性能。针对GPU集群上的分布式GMRES算法,提出了一种基于混合精度的加速求解方法,使用低精度浮点表示,显著降低了通信过程的时间开销。此外,提出了一种数据传输的精度调控算法,动态自适应调整传输数据的精度,以保证迭代算法最佳的求解效果。实验结果表明,所提基于混合精度的优化方法可实现平均2.4倍的加速比,结合其他优化方法后可实现平均7.6倍的加速比。 展开更多
关键词 广义最小残差法 混合精度 GPU集群 分布式系统
在线阅读 下载PDF
基于FPGA和行折叠的稀疏矩阵向量乘优化
2
作者 周智 高建花 计卫星 《计算机工程与科学》 CSCD 北大核心 2024年第8期1340-1348,共9页
稀疏矩阵向量乘(SpMV)是科学与工程计算中的一个关键内核。由于稀疏矩阵中不规则的数据分布和SpMV计算中不规则的访存操作,SpMV在多核CPU和GPU等设备上的性能与这些设备的理论峰值还具有较大差距。现有的CPU和GPU由于在架构上受到限制,... 稀疏矩阵向量乘(SpMV)是科学与工程计算中的一个关键内核。由于稀疏矩阵中不规则的数据分布和SpMV计算中不规则的访存操作,SpMV在多核CPU和GPU等设备上的性能与这些设备的理论峰值还具有较大差距。现有的CPU和GPU由于在架构上受到限制,导致它们无法很好地利用稀疏矩阵的特殊结构来加速SpMV计算,而现场可编程门阵列(FPGA)可以通过自定义电路实现高效的并行运算,能够更好地处理稀疏矩阵的计算和存储问题。基于FPGA提出了一种SpMV优化方法,该优化方法基于高级综合的流式处理引擎,采用了一种自适应多行折叠的SpMV优化策略。该方法通过行折叠减少了处理引擎中零元的无效存储和计算,从而提升了基于FPGA的SpMV计算性能。实验结果表明,相比于现有的FPGA实现方案,设计的基于行折叠优化的数据流引擎实现了最高1.78倍和平均1.15倍的加速。 展开更多
关键词 稀疏矩阵向量乘 现场可编程门阵列 高级综合 行折叠
在线阅读 下载PDF
Delaunay四面体网格并行生成算法研究进展 被引量:17
3
作者 王磊 聂玉峰 李义强 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2011年第6期923-932,共10页
纵观近20年国内外Delaunay四面体网格并行生成算法的发展,依据其并行框架分为区域分解模式和基于节点模式,其中区域分解模式根据通信复杂程度进一步分为耦合的和非耦合的;对典型算法中网格质量传承性、串行代码嵌入率、扩展性、负载平... 纵观近20年国内外Delaunay四面体网格并行生成算法的发展,依据其并行框架分为区域分解模式和基于节点模式,其中区域分解模式根据通信复杂程度进一步分为耦合的和非耦合的;对典型算法中网格质量传承性、串行代码嵌入率、扩展性、负载平衡和容错性等性能进行分析,结合数值测试结果总结了各类模式算法的优缺点.最后,针对各类模式算法的特点探讨了Delaunay四面体网格并行生成技术的发展趋势. 展开更多
关键词 并行算法 Delaunay四面体网格 区域分解模式 基于节点模式
在线阅读 下载PDF
无单元伽辽金法的并行计算 被引量:8
4
作者 曾亿山 卢德唐 曾清红 《计算力学学报》 EI CAS CSCD 北大核心 2008年第3期385-391,共7页
对无单元伽辽金法的并行计算进行了详细研究,并将其应用于弹性动力学问题。使用并行桶搜索算法进行节点搜索,使用并行几何搜索算法进行样点搜索,讨论了移动最小二乘MLS(Moving Least Squares)形函数及其导数的并行计算和方程组的并行求... 对无单元伽辽金法的并行计算进行了详细研究,并将其应用于弹性动力学问题。使用并行桶搜索算法进行节点搜索,使用并行几何搜索算法进行样点搜索,讨论了移动最小二乘MLS(Moving Least Squares)形函数及其导数的并行计算和方程组的并行求解,并利用多层图形划分实现负载平衡。最后给出了并行无单元伽辽金法应用于弹性动力学的计算流程和实例。计算结果表明无单元伽辽金法具有很高的并行性和很好的并行效率,对其进行并行计算具有非常重要的意义。 展开更多
关键词 无单元伽辽金方法 无网格方法 弹性动力学 并行计算 负载平衡
在线阅读 下载PDF
三维爆炸与冲击问题的大规模高性能计算研究 被引量:13
5
作者 费广磊 马天宝 郝莉 《应用数学和力学》 CSCD 北大核心 2011年第3期357-364,共8页
爆炸与冲击问题常常涉及到材料的大变形、多种物质交界面处理及各种强间断的处理,对此类问题采用Euler方法具有显著的优势.对于Euler方法的并行计算,由于在扰动未到达之前某些网格的物理量是不发生变化的,采用固定分区方法并行策略容易... 爆炸与冲击问题常常涉及到材料的大变形、多种物质交界面处理及各种强间断的处理,对此类问题采用Euler方法具有显著的优势.对于Euler方法的并行计算,由于在扰动未到达之前某些网格的物理量是不发生变化的,采用固定分区方法并行策略容易出现负载不均衡,且计算效率不高.为解决这一问题,采用动态并行策略,即计算域随着扰动传播而扩充,并采用国际上通用的MPI并行模式设计出相应的动态并行程序.从程序测试结果来看,动态并行程序结果与原有并行程序结果一致,且与实际情况也是一致的. 展开更多
关键词 爆炸与冲击 动态并行 MPI 空中爆炸
在线阅读 下载PDF
列车与结构动态耦合分析的并行计算方法 被引量:8
6
作者 王建炜 金先龙 曹源 《计算力学学报》 EI CAS CSCD 北大核心 2012年第3期352-356,362,共6页
在分析结构动态响应时考虑列车与结构的动态耦合作用,采用详细三维有限元模型会带来计算量太大的问题。本文采用并行计算方法,根据列车与结构动态耦合模型的计算特点,设计实现了列车结构耦合均衡的分区算法,并以两个工程应用为例,利用... 在分析结构动态响应时考虑列车与结构的动态耦合作用,采用详细三维有限元模型会带来计算量太大的问题。本文采用并行计算方法,根据列车与结构动态耦合模型的计算特点,设计实现了列车结构耦合均衡的分区算法,并以两个工程应用为例,利用该方法对列车结构三维数值模型进行分区计算,结果表明该分区方法比递归坐标二分法有更好的并行效率。 展开更多
关键词 动态分析 三维模型 并行计算 区域分解方法
在线阅读 下载PDF
多重网格格子Boltzmann方法的并行算法 被引量:3
7
作者 刘智翔 宋安平 +2 位作者 徐磊 郑汉垣 张武 《计算机应用》 CSCD 北大核心 2014年第11期3065-3068,3072,共5页
针对复杂流动数值模拟中的格子Boltzmann方法存在计算网格量大、收敛速度慢的缺点,提出了基于三维几何边界的多重笛卡儿网格并行生成算法,并基于该网格生成方法提出了多重网格并行格子Boltzmann方法(LBM)。该方法结合不同尺度网格间的... 针对复杂流动数值模拟中的格子Boltzmann方法存在计算网格量大、收敛速度慢的缺点,提出了基于三维几何边界的多重笛卡儿网格并行生成算法,并基于该网格生成方法提出了多重网格并行格子Boltzmann方法(LBM)。该方法结合不同尺度网格间的耦合计算,有效减少了计算网格量,提高了收敛速度;而且测试结果也表明该并行算法具有良好的可扩展性。 展开更多
关键词 格子BOLTZMANN方法 多重网格 并行算法 可扩展性 OPENMP
在线阅读 下载PDF
模糊多目标可靠性优化设计的遗传算法 被引量:7
8
作者 马成业 黎锁平 杨胜良 《兰州理工大学学报》 CAS 北大核心 2009年第1期156-158,共3页
给出模糊多目标可靠性优化设计的一个遗传算法.该方法利用模糊集隶属函数的特性将各子目标函数模糊化处理为能够反映各子目标相对重要程度,具有加权指数的协调满意度函数形式;通过加权函数将各子目标的协调满意度函数综合成统一的单目... 给出模糊多目标可靠性优化设计的一个遗传算法.该方法利用模糊集隶属函数的特性将各子目标函数模糊化处理为能够反映各子目标相对重要程度,具有加权指数的协调满意度函数形式;通过加权函数将各子目标的协调满意度函数综合成统一的单目标优化模型,用遗传算法求解模型.通过实例验证该方法的有效性. 展开更多
关键词 模糊目标 可靠性设计 遗传算法
在线阅读 下载PDF
数值天气预报与并行计算 被引量:5
9
作者 解以扬 庞璐 孟冬梅 《天津师范大学学报(自然科学版)》 CAS 2001年第4期65-69,共5页
从社会需求出发 ,论述了开展中尺度数值预报的重要性 ,及数值预报对高性能计算机的要求 ;介绍了中尺度气象模式 MM5的结构特征 ;给出中尺度模式的差分近似算法 ;
关键词 数值天气预报 中尺度模式 差分近似 并行计算 MMS 结构特征
在线阅读 下载PDF
基于多尺度边缘特征的深度学习电阻率反演方法 被引量:3
10
作者 刘征宇 庞永昊 +4 位作者 张凤凯 万勇 刘磊 蔡玉梅 刘嘉雯 《岩土力学》 EI CAS CSCD 北大核心 2023年第11期3299-3306,共8页
直流电阻率法是一种经济、高效的工程地球物理探测手段,对含水构造敏感。线性电阻率反演是实际探测中的主流方法,但其反演结果容易陷入局部最优,产生错误的地质解译。与之相比,无监督反演方法能够采用物理规律和数据挖掘双驱动训练网络... 直流电阻率法是一种经济、高效的工程地球物理探测手段,对含水构造敏感。线性电阻率反演是实际探测中的主流方法,但其反演结果容易陷入局部最优,产生错误的地质解译。与之相比,无监督反演方法能够采用物理规律和数据挖掘双驱动训练网络,摆脱对真实模型的依赖,具备在实际数据中全局搜索的可行性。在无监督反演方法的基础上,创新了基于多尺度边缘特征的深度学习边界刻画方法。针对反演成像边界模糊的问题,借鉴地震、电磁勘探中多尺度反演的经验,提出了一种电阻率多尺度反演方法,以多尺度反演目标函数作为损失函数修正网络梯度,有效提高了无监督学习反演的边界刻画能力。在上海市域铁路机场联络线1号风井工程开展现场试验,以5号基坑地连墙渗漏点探测为例,探明了15处低阻异常,指导基坑补强作业,验证了方法的可行性和有效性。 展开更多
关键词 直流电阻率反演 无监督深度学习 多尺度反演 工程验证
在线阅读 下载PDF
无网格数值模拟的并行算法研究 被引量:3
11
作者 卢德唐 曾清红 林春阳 《中国科学技术大学学报》 CAS CSCD 北大核心 2006年第12期1299-1307,共9页
对无网格数值模拟的并行算法进行了详细研究.包括使用并行桶搜索算法进行节点搜索,使用并行几何搜索算法进行样点搜索,并行计算无网格形函数及其导数,边界条件的并行处理,使用并行预处理共轭梯度法求解方程组以及负载平衡等.最后给出了... 对无网格数值模拟的并行算法进行了详细研究.包括使用并行桶搜索算法进行节点搜索,使用并行几何搜索算法进行样点搜索,并行计算无网格形函数及其导数,边界条件的并行处理,使用并行预处理共轭梯度法求解方程组以及负载平衡等.最后给出了无网格数值模拟并行计算的实施流程和计算实例.计算结果表明,无网格数值模拟具有很高的并行性和很好的并行效率,计算规模越大,并行效率越高. 展开更多
关键词 无网格方法 数值模拟 并行算法 并行桶搜索 并行几何搜索 并行预处理共轭梯度法 负载平衡
在线阅读 下载PDF
LINUX系统下PC机局域网并行计算环境的实现与测试 被引量:5
12
作者 张鸿雁 陈晓春 王元 《西安建筑科技大学学报(自然科学版)》 CSCD 北大核心 2007年第2期267-271,共5页
为了解决CFD技术在实际使用中碰到的计算资源紧张问题,提出了PC机局域网并行计算的思路.对LINUX操作系统、局域网的组建和网络并行环境MPI的实现进行了研究.搭建了并行计算平台,并利用商用CFD软件对该平台的基本工作性能进行了测试.结... 为了解决CFD技术在实际使用中碰到的计算资源紧张问题,提出了PC机局域网并行计算的思路.对LINUX操作系统、局域网的组建和网络并行环境MPI的实现进行了研究.搭建了并行计算平台,并利用商用CFD软件对该平台的基本工作性能进行了测试.结果表明:当网格数量超过50万时,两台计算机并行效率超过67.9%;四台计算机并行效率超过52.8%,随着网格数量增加,并行效率逐步得以提高,当网格数量接近200万时,并行效率分别达到168.58%和145.62%,出现了超线性现象. 展开更多
关键词 CFD 并行计算 MPI LINUX操作系统
在线阅读 下载PDF
复杂结构沿面闪络产生发展阶段模拟研究 被引量:3
13
作者 王川 邹俭 +1 位作者 张天爵 曾乃工 《强激光与粒子束》 EI CAS CSCD 北大核心 2016年第9期130-133,共4页
以天光Ⅱ-A装置X-pinch负载腔为例,采用包含场致发射、二次电子倍增模型的三维模拟软件OPAL,对复杂结构中真空绝缘体沿面闪络的产生与发展阶段进行了模拟研究。模拟结果表明,阳极产生的二次电子在平行于绝缘体表面的电场分量的作用下从... 以天光Ⅱ-A装置X-pinch负载腔为例,采用包含场致发射、二次电子倍增模型的三维模拟软件OPAL,对复杂结构中真空绝缘体沿面闪络的产生与发展阶段进行了模拟研究。模拟结果表明,阳极产生的二次电子在平行于绝缘体表面的电场分量的作用下从阴极座向大半径的运动,是导致沿面闪络的主要原因。并提出了阻断沿面闪络的方法及其原理。采用阻断沿面闪络的措施后,后续多次X-pinch负载腔放电实验证明,正常的回流电流增加了近20%,真空绝缘体上的沿面闪络得到了抑制。 展开更多
关键词 真空沿面闪络 场致发射 二次电子倍增 三维模拟研究
在线阅读 下载PDF
基于计算统一设备架物Fortran的直接模拟蒙特卡洛方法并行优化 被引量:2
14
作者 严立 戴欣怡 +2 位作者 陈佳洛 王平阳 欧阳华 《上海交通大学学报》 EI CAS CSCD 北大核心 2013年第8期1198-1204,共7页
利用基于图形处理器(GPU)的计算统一设备架构(CUDA)Fortran编程平台,对直接模拟蒙特卡洛(DSMC)方法进行并行优化,并以高超声速气动热计算为例,考察了串行与并行计算速度以及不同仿真分子数对并行效率的影响.结果表明,在保证计算精度不... 利用基于图形处理器(GPU)的计算统一设备架构(CUDA)Fortran编程平台,对直接模拟蒙特卡洛(DSMC)方法进行并行优化,并以高超声速气动热计算为例,考察了串行与并行计算速度以及不同仿真分子数对并行效率的影响.结果表明,在保证计算精度不变的情况下,程序取得了4~10倍的加速比,并且加速性能高低与计算规模大小成正比. 展开更多
关键词 直接模拟蒙特卡洛 FORTRAN 图形处理器 计算统一设备架构 气动热
在线阅读 下载PDF
适合于求解边界元方程组的GMRES算法的实用化和并行化研究 被引量:7
15
作者 张健飞 姜弘道 《计算力学学报》 EI CAS CSCD 北大核心 2004年第5期620-624,共5页
为了将GMRES算法应用于大型边界元方程组的求解,采用预条件技术和重正交技术相结合的方法实现了该算法的实用化,然后在实用化的基础上针对迭代算法具有良好并行性的特点,研究了该算法在网络机群环境下的并行化技术。数值试验和分析表明... 为了将GMRES算法应用于大型边界元方程组的求解,采用预条件技术和重正交技术相结合的方法实现了该算法的实用化,然后在实用化的基础上针对迭代算法具有良好并行性的特点,研究了该算法在网络机群环境下的并行化技术。数值试验和分析表明所用的这些技术是行之有效的,对于提高求解速度和增大求解问题的规模是有意义的。 展开更多
关键词 边界元 GMRES 预条件 重正交化 并行计算
在线阅读 下载PDF
场致发射与二次电子倍增效应的程序开发 被引量:4
16
作者 王川 Andreas Adelmann +1 位作者 张天爵 姜兴东 《强激光与粒子束》 EI CAS CSCD 北大核心 2012年第5期1244-1246,共3页
与瑞士保罗希尔研究所合作,在双方合作开发的通用加速器模拟程序库OPAL中添加了3维复杂几何处理模块及场致发射与二次电子发射模块,使得OPAL具备了进行3维复杂结构中场致发射与二次电子倍增效应模拟的能力,可用于优化复杂高频/微波器件... 与瑞士保罗希尔研究所合作,在双方合作开发的通用加速器模拟程序库OPAL中添加了3维复杂几何处理模块及场致发射与二次电子发射模块,使得OPAL具备了进行3维复杂结构中场致发射与二次电子倍增效应模拟的能力,可用于优化复杂高频/微波器件的结构设计从而抑制暗电流发射或二次电子倍增效应。 展开更多
关键词 场致发射 二次电子倍增 程序开发 高频谐振腔
在线阅读 下载PDF
求多项式全部零点的异步并行算法 被引量:4
17
作者 崔向照 杨大地 陈均明 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第7期56-58,共3页
基于用圆盘算术求多项式全部零点的并行Halley迭代法虽然避免了颇为费事的圆盘开方运算 ,能同时求得多项式全部零点的带误差估计的近似值 ,并且具有很高的收敛速度 ,但它是同步并行算法。这里用圆盘算术构造了一种求多项式全部零点的异... 基于用圆盘算术求多项式全部零点的并行Halley迭代法虽然避免了颇为费事的圆盘开方运算 ,能同时求得多项式全部零点的带误差估计的近似值 ,并且具有很高的收敛速度 ,但它是同步并行算法。这里用圆盘算术构造了一种求多项式全部零点的异步并行算法 ,并在与Halley迭代法类似的条件下建立了它的收敛性定理。该算法不仅保持了Halley迭代法的优点 。 展开更多
关键词 多项式 全部零点 异步 并行算法
在线阅读 下载PDF
一种针对大波数Helmholtz方程的高性能并行预条件迭代求解算法 被引量:2
18
作者 程东升 刘志勇 +1 位作者 薛国伟 高月芳 《计算机科学》 CSCD 北大核心 2018年第7期299-306,共8页
针对传统串行迭代法求解大波数Helmholtz方程存在效率低下且受限于单机内存的问题,提出了一种基于消息传递接口(Message Passing Interface,MPI)的并行预条件迭代法。该算法利用复移位拉普拉斯算子对Helmholtz方程进行预条件处理,联合... 针对传统串行迭代法求解大波数Helmholtz方程存在效率低下且受限于单机内存的问题,提出了一种基于消息传递接口(Message Passing Interface,MPI)的并行预条件迭代法。该算法利用复移位拉普拉斯算子对Helmholtz方程进行预条件处理,联合稳定双共轭梯度法和基于矩阵的多重网格法来求解预条件方程离散后的大规模线性系统,在Linux集群系统上基于MPI环境实现了求解算法的并行计算,重点解决了多重网格的并行划分、信息传递和多重网格组件的构建问题。数值实验表明,对于大波数问题,提出的算法具有良好的并行加速比,相较于串行算法极大地提高了计算效率。 展开更多
关键词 HELMHOLTZ方程 并行 预条件子 稳定双共轭梯度法 多重网格
在线阅读 下载PDF
大型边界元方程组的并行直接分块求解算法 被引量:6
19
作者 张健飞 姜弘道 《应用力学学报》 CAS CSCD 北大核心 2003年第4期129-132,共4页
针对大型边界元方程组和网络微机机群环境提出了一种并行直接分块求解算法 ,算法基于分块高斯—若当消去法的原理 ,采用内外存交互技术 ,并行分块消去方法 ,节点超行的卷帘存储方案和并行环状循环逐次修正策略 ,增大了解题规模 ,提高了... 针对大型边界元方程组和网络微机机群环境提出了一种并行直接分块求解算法 ,算法基于分块高斯—若当消去法的原理 ,采用内外存交互技术 ,并行分块消去方法 ,节点超行的卷帘存储方案和并行环状循环逐次修正策略 ,增大了解题规模 ,提高了计算速度。算例计算结果表明该算法具有较高的并行加速比和并行效率 。 展开更多
关键词 边界单元法 并行计算 分块算法 网络机群 加权残量法 方程组存储
在线阅读 下载PDF
基于GPU的流动影响枝晶生长相场方法 被引量:2
20
作者 朱昶胜 贾金芳 +2 位作者 冯力 肖荣振 王永贤 《兰州理工大学学报》 CAS 北大核心 2015年第3期19-25,共7页
将自适应压力迭代法修正的Sola算法与相场模型相结合,建立过冷熔体在强迫流动状态下枝晶生长的Sola-相场模型.针对传统方法求解多场耦合相场模型时存在的计算量大,计算时间长,计算效率低等问题,提出基于CUDA+GPU软硬件体系结构的高性能... 将自适应压力迭代法修正的Sola算法与相场模型相结合,建立过冷熔体在强迫流动状态下枝晶生长的Sola-相场模型.针对传统方法求解多场耦合相场模型时存在的计算量大,计算时间长,计算效率低等问题,提出基于CUDA+GPU软硬件体系结构的高性能计算方法.以高纯丁二腈(SCN)过冷熔体为例,在CPU+GPU异构平台上实现了存在流动时凝固微观组织演化过程的并行求解,并对基于CPU+GPU平台与CPU平台的计算结果及计算效率进行比较.结果表明,当计算规模达到百万量级时,与CPU平台上的串行算法相比,在CPU+GPU异构平台上达到了24.39倍的加速比,大大提高计算效率,并得到与串行计算相一致的结果. 展开更多
关键词 相场方法 枝晶生长 流动 GPU
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部