期刊文献+
共找到51篇文章
< 1 2 3 >
每页显示 20 50 100
基于OpenMP的分子动力学并行算法的性能分析与优化 被引量:10
1
作者 白明泽 程丽 +1 位作者 豆育升 孙世新 《计算机应用》 CSCD 北大核心 2012年第1期163-166,共4页
为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三... 为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三角形方法。所提方法中每个线程所计算的粒子数固定,且粒子数目呈阶梯状上升,使得各线程能够错时到达临界区。从而使程序在临界区的闲置时间比Critical方法减半,加速比明显提高。 展开更多
关键词 分子动力学 并行计算 多核中央处理器 openmp 临界区
在线阅读 下载PDF
平面二维非均匀泥沙OpenMP并行计算模型 被引量:2
2
作者 于守兵 《水利水电科技进展》 CSCD 北大核心 2012年第2期11-14,共4页
为实现平面二维非均匀泥沙模型并行计算,采用OpenMP指令对串行源程序进行改造。基于三角形-四边形混合网格的平面二维非均匀泥沙有限体积模型具有显式求解时网格单元相互独立性这种特性,Fortran串行源程序无需进行较大的修改,只要在循... 为实现平面二维非均匀泥沙模型并行计算,采用OpenMP指令对串行源程序进行改造。基于三角形-四边形混合网格的平面二维非均匀泥沙有限体积模型具有显式求解时网格单元相互独立性这种特性,Fortran串行源程序无需进行较大的修改,只要在循环计算和数组整体操作部分嵌入OpenMP循环并行指令和数组并行指令,即可实现并行计算。案例分析结果表明,在并行线程数目等于计算机固有线程数目时,并行加速比达到最大值1.55;OpenMP技术使用线程间共享内存的方式协调并行计算,很适合在多核计算机上运行,且编程简单灵活,将随着计算机硬件性能的提高得到更广泛的应用。 展开更多
关键词 openmp 并行计算 非均匀泥沙模型 有限体积法
在线阅读 下载PDF
基于OpenMP的流化床颗粒堆积过程三维并行数值模拟
3
作者 李斌 姚路 +1 位作者 焦明月 周遵凯 《热力发电》 CAS 北大核心 2016年第1期42-48,共7页
结合离散单元法(DEM)和计算流体力学(CFD)的CFD-DEM被广泛应用于流化床的数值模拟中,但受DEM计算工作量大的限制,难以达到实际流化床的模拟要求,因此开展对DEM并行算法的研究具有重要意义。针对流化床内颗粒运动的特点,基于DEM建立了气... 结合离散单元法(DEM)和计算流体力学(CFD)的CFD-DEM被广泛应用于流化床的数值模拟中,但受DEM计算工作量大的限制,难以达到实际流化床的模拟要求,因此开展对DEM并行算法的研究具有重要意义。针对流化床内颗粒运动的特点,基于DEM建立了气固两相流动中颗粒相的并行化计算模型,在OpenMP并行技术的基础上,实现了颗粒受力计算、颗粒速度和位置更新的并行化。采用Fortran语言开发了DEM并行数值模拟程序,模拟了三维流化床内颗粒堆积的过程,并与串行程序的模拟结果进行了对比。结果表明:基于OpenMP技术并行程序可正确模拟流化床内的颗粒堆积过程,而且具有良好的加速比,能够显著地提高计算效率、缩短计算时间;当计算线程数增加时,加速比随之增加,但增幅相对减少。 展开更多
关键词 流化床 颗粒堆积 离散单元法 计算流体力学 气固两相流 并行计算 openmp 加速比
在线阅读 下载PDF
基于OpenMP的非连续变形分析并行计算方法 被引量:9
4
作者 付晓东 盛谦 张勇慧 《岩土力学》 EI CAS CSCD 北大核心 2014年第8期2401-2407,共7页
非连续变形分析(DDA)方法严格满足平衡要求和能量守恒,具有完全的运动学及数值可靠性,但对大规模岩土工程问题的数值模拟耗时太长,尤其是线性方程组求解,并行计算可以很好地解决该问题。首先基于DDA方法的基本理论,阐述了适用于DDA方法... 非连续变形分析(DDA)方法严格满足平衡要求和能量守恒,具有完全的运动学及数值可靠性,但对大规模岩土工程问题的数值模拟耗时太长,尤其是线性方程组求解,并行计算可以很好地解决该问题。首先基于DDA方法的基本理论,阐述了适用于DDA方法中的基于块的行压缩法和基于"试验-误差"迭代格式的非零位置记录;其次,引入块雅可比迭代法并行求解DDA方法的线性方程组,并改进了相应的非零存储方法;最后,基于OpenMP实现了DDA线性方程组求解并行计算,并将其应用于地下洞室群的破坏过程分析,以加速比为并行效率的指标评价,结果表明,该并行计算策略可以极大提高DDA的计算效率,而且适合各种规模的问题。 展开更多
关键词 岩土工程 非连续变形分析 并行计算 块雅可比迭代法 非零存储
在线阅读 下载PDF
基于OpenMP并行简约空间内点法的暂态稳定紧急控制 被引量:2
5
作者 王云 江全元 《电力自动化设备》 EI CSCD 北大核心 2014年第12期83-88,共6页
电力系统暂态稳定紧急控制问题是一类复杂的非线性动态优化问题,计算效率是其实用化瓶颈所在。利用差分化后紧急控制问题自由度很低的特点,应用简约空间内点算法进行求解。算法在C++环境下编程实现,对关键耗时部分多线程并行计算。算例... 电力系统暂态稳定紧急控制问题是一类复杂的非线性动态优化问题,计算效率是其实用化瓶颈所在。利用差分化后紧急控制问题自由度很低的特点,应用简约空间内点算法进行求解。算法在C++环境下编程实现,对关键耗时部分多线程并行计算。算例测试结果表明,所提并行算法是有效的,且与传统内点算法相比,该算法消耗的计算时间和内存更少,能够求解大规模的电力系统紧急控制问题。 展开更多
关键词 电力系统 暂态 稳定性 控制 简约空间内点法 并行计算 OPEN MP
在线阅读 下载PDF
基于OpenMP的中子输运方程特征线法并行计算研究
6
作者 于锐 赵强 《原子能科学技术》 EI CAS CSCD 北大核心 2015年第10期1833-1838,共6页
特征线法是目前求解反应堆中子输运方程的主要计算方法之一。本文开发了基于OpenMP的中子输运方程特征线法并行计算程序,以提高特征线法的计算效率。OpenMP是共享存储体系结构上的一个并行编程模型,采用Fork-Join并行执行方式,适合于SM... 特征线法是目前求解反应堆中子输运方程的主要计算方法之一。本文开发了基于OpenMP的中子输运方程特征线法并行计算程序,以提高特征线法的计算效率。OpenMP是共享存储体系结构上的一个并行编程模型,采用Fork-Join并行执行方式,适合于SMP共享内存多处理系统和多核处理器体系结构。通过相关基准题测试验证,表明所开发的程序在有效增殖因数以及相对中子通量(归一化栅元功率)分布等参数上都能取得良好的精度,且使用OpenMP能取得良好的加速效果,使计算时间显著减少。 展开更多
关键词 中子输运方程 特征线法 openmp 并行计算
在线阅读 下载PDF
基于图形处理器的水下目标传递函数多频点处理方法
7
作者 钱浩然 王斌 《舰船科学技术》 北大核心 2024年第14期153-157,共5页
为了提高水下目标宽带回波的计算速度,本文提出一种基于图形处理器GPU的散射传递函数多频点快速计算解决方案。相较于传统算法中逐个频率点计算的方式,CUDA快速算法充分利用各频点处目标强度的相对独立性,基于GPU的硬件特点,同时计算宽... 为了提高水下目标宽带回波的计算速度,本文提出一种基于图形处理器GPU的散射传递函数多频点快速计算解决方案。相较于传统算法中逐个频率点计算的方式,CUDA快速算法充分利用各频点处目标强度的相对独立性,基于GPU的硬件特点,同时计算宽带内的散射声场,从而显著提高了计算效率。本文以潜航器模型为算例,对不同网格数量下模型的目标散射传递函数计算速度进行对比分析。仿真结果表明,相较于传统的CPU串行计算,采用CUDA快速算法能够实现超过80的加速比,有效提高了计算速度。 展开更多
关键词 板块元方法 图像处理器 计算统一设备架构 并行计算
在线阅读 下载PDF
基于GPU的LBM迁移模块算法优化 被引量:3
8
作者 黄斌 柳安军 +3 位作者 潘景山 田敏 张煜 朱光慧 《计算机工程》 CAS CSCD 北大核心 2024年第2期232-238,共7页
格子玻尔兹曼方法(LBM)是一种基于介观模拟尺度的计算流体力学方法,其在计算时设置大量的离散格点,具有适合并行的特性。图形处理器(GPU)中有大量的算术逻辑单元,适合大规模的并行计算。基于GPU设计LBM的并行算法,能够提高计算效率。但... 格子玻尔兹曼方法(LBM)是一种基于介观模拟尺度的计算流体力学方法,其在计算时设置大量的离散格点,具有适合并行的特性。图形处理器(GPU)中有大量的算术逻辑单元,适合大规模的并行计算。基于GPU设计LBM的并行算法,能够提高计算效率。但是LBM算法迁移模块中每个格点的计算都需要与其他格点进行通信,存在较强的数据依赖。提出一种基于GPU的LBM迁移模块算法优化策略。首先分析迁移部分的实现逻辑,通过模型降维,将三维模型按照速度分量离散为多个二维模型,降低模型的复杂度;然后分析迁移模块计算前后格点中的数据差异,通过数据定位找到迁移模块的通信规律,并对格点之间的数据交换方式进行分类;最后使用分类的交换方式对离散的二维模型进行区域划分,设计新的数据通信方式,由此消除数据依赖的影响,将迁移模块完全并行化。对并行算法进行测试,结果显示:该算法在1.3×10^(8)规模网格下能达到1.92的加速比,表明算法具有良好的并行效果;同时对比未将迁移模块并行化的算法,所提优化策略能提升算法30%的并行计算效率。 展开更多
关键词 高性能计算 格子玻尔兹曼方法 图形处理器 并行优化 数据重排
在线阅读 下载PDF
基于高斯方法及Sherman-Morrison公式的暂态稳定性并行计算方法 被引量:9
9
作者 廖小兵 汪芳宗 杨萌 《电力系统保护与控制》 EI CSCD 北大核心 2017年第4期1-8,共8页
并行计算是实现大规模电力系统暂态稳定性实时分析计算的有效途径。将s级2s阶的高斯方法和扩展的Sherman-Morrison矩阵求逆公式相结合,提出了一类新的暂态稳定性并行计算方法。该方法首先利用s级2s阶的高斯方法对微分-代数方程组进行多... 并行计算是实现大规模电力系统暂态稳定性实时分析计算的有效途径。将s级2s阶的高斯方法和扩展的Sherman-Morrison矩阵求逆公式相结合,提出了一类新的暂态稳定性并行计算方法。该方法首先利用s级2s阶的高斯方法对微分-代数方程组进行多级离散,并利用严格的牛顿法对离散后的非线性方程组进行整体求解。在此基础上,按s个时间点将整体雅可比矩阵分裂成为一个分块对角矩阵和一个分块常系数矩阵。然后,以分裂后的分块对角矩阵为基础,利用扩展的Sherman-Morrison矩阵求逆公式将s个时间点上的计算任务进行"解耦"。所提方法在保持严格牛顿法的收敛性的同时具有很好的并行性。利用Open MP并行计算技术在多核计算机上对2个不同的系统算例进行了测试,结果表明,所提出的并行方法可以获得较好的加速比以及并行效率。 展开更多
关键词 暂态稳定性 并行计算 高斯方法 Sherman-Morrison公式 openmp
在线阅读 下载PDF
分布式水文模型区域分解并行计算方法及其应用 被引量:4
10
作者 秦泽宁 黎曙 +4 位作者 周祖昊 刘明堂 牟舵 刘佳嘉 向东 《水电能源科学》 北大核心 2020年第10期1-4,12,共5页
针对区域分解并行计算方法中存在任务分配负载不均衡、通信时间长的问题,采用OpenMP编程模型,以WEP-L分布式水文模型汇流过程为例,设计了区域分解并行方法,首先通过子流域拓扑关系表确定子流域属于干流或支流,然后将每一条支流划分为一... 针对区域分解并行计算方法中存在任务分配负载不均衡、通信时间长的问题,采用OpenMP编程模型,以WEP-L分布式水文模型汇流过程为例,设计了区域分解并行方法,首先通过子流域拓扑关系表确定子流域属于干流或支流,然后将每一条支流划分为一个水文区域,并保证水文区域中子流域按上游到下游的顺序排序,同时,为了实现分配的负载均衡,设计了基于贪心算法的优化调度,最后将支流任务分配给不同的线程计算,干流子流域采用串行计算。对黄河流域在不同线程条件下并行效果的测试结果表明,基于贪心调度的区域分解并行计算方法能有效提高汇流过程运算效率。 展开更多
关键词 分布式水文模型 汇流过程 区域分解 并行计算 WEP-L openmp
在线阅读 下载PDF
大规模GNSS基准站网快速同步处理方法研究 被引量:15
11
作者 李志才 张鹏 +1 位作者 孙占义 王凡 《测绘通报》 CSCD 北大核心 2017年第2期65-69,共5页
目前我国GNSS连续运行基准站网已基本建设完毕,全国范围内建设完成约2000个GNSS连续运行基准站。随着站点规模的加大,数据计算的效率也迫切需要提高,采用传统的高精度数据处理软件已适应不了大规模GNSS网的数据解算要求。本文基于BERNES... 目前我国GNSS连续运行基准站网已基本建设完毕,全国范围内建设完成约2000个GNSS连续运行基准站。随着站点规模的加大,数据计算的效率也迫切需要提高,采用传统的高精度数据处理软件已适应不了大规模GNSS网的数据解算要求。本文基于BERNESE5.2软件研究了我国"陆态网络工程"260个基准站的大规模GNSS网同步数据处理方法,通过修改源程序及利用并行计算技术,成功实现了陆态网络基准站快速、高效、高精度的数据计算能力。实例验证表明,陆态网络单天260个站的数据在无需分区的情况下,可在1 h内获得全球框架下的约束解,解算的框架点坐标精度在毫米量级,大大提高了国家数据中心的大规模GNSS网数据处理能力。 展开更多
关键词 参考框架 大规模GNSS网 并行计算 处理方法
在线阅读 下载PDF
LDPC码量化和积译码的高效实现 被引量:13
12
作者 童胜 王鹏 +1 位作者 王单 王新梅 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2004年第5期709-713,735,共6页
提出了一种改进的高效量化和积算法(sum productalgorithm,简称SPA).该算法只涉及加减法、比较和查表运算,并且每轮迭代译码的运算次数少于前/后向算法,从而大大降低了计算复杂度和硬件实现难度.同时,文中还基于这种改进的量化SPA,对采... 提出了一种改进的高效量化和积算法(sum productalgorithm,简称SPA).该算法只涉及加减法、比较和查表运算,并且每轮迭代译码的运算次数少于前/后向算法,从而大大降低了计算复杂度和硬件实现难度.同时,文中还基于这种改进的量化SPA,对采用不同量化方案时LDPC码在AWGN信道下的译码性能进行了仿真.仿真结果表明采用低阶均匀量化时译码性能已经非常接近连续译码. 展开更多
关键词 和积译码算法 迭代译码 前/后向算法 并行实现 低密度校验码
在线阅读 下载PDF
有限元软件结构分析模块的并行开发及应用 被引量:5
13
作者 李丽君 金先龙 +1 位作者 李渊印 李根国 《上海交通大学学报》 EI CAS CSCD 北大核心 2004年第8期1354-1357,共4页
通过有限元分析软件结构分析模块在"神威 "超级计算机上的并行化二次开发,把商用有限元软件强大的前后处理能力与超级计算机的高性能计算能力结合起来,扩大了分析规模,提高了分析速度.算例分析验证了该研究的正确性和高效性,... 通过有限元分析软件结构分析模块在"神威 "超级计算机上的并行化二次开发,把商用有限元软件强大的前后处理能力与超级计算机的高性能计算能力结合起来,扩大了分析规模,提高了分析速度.算例分析验证了该研究的正确性和高效性,为大型工程计算提供了强有力的工具. 展开更多
关键词 有限元 软件 结构分析 并行计算
在线阅读 下载PDF
词汇间语义相关关系量化计算方法 被引量:21
14
作者 钟茂生 刘慧 刘磊 《中文信息学报》 CSCD 北大核心 2009年第2期115-122,共8页
词汇间语义关系的定量化研究是自然语言处理任务中一个重要的基础性工作。词汇间语义关系总体上分为等同关系、上下位关系、相关关系,现有的语义关系定量化工作主要集中于词汇间语义的等同关系(相似性)量化研究。该文研究和提出了量化... 词汇间语义关系的定量化研究是自然语言处理任务中一个重要的基础性工作。词汇间语义关系总体上分为等同关系、上下位关系、相关关系,现有的语义关系定量化工作主要集中于词汇间语义的等同关系(相似性)量化研究。该文研究和提出了量化词汇间语义相关关系的基本思路和新方法,即构造词汇相关关系二分图来求解和量化词汇间间接相关关系,该方法能够解决在统计语料中没有出现的词汇对的相关关系量化求解问题。实验结果表明,该文提出的方法比单纯用互信息来计算和量化词汇间语义相关关系更为可行。同时,对于一个特定词汇而言,该文的方法能够得到一个相关关系量化的相对合理的趋势性结果。 展开更多
关键词 计算机应用 中文信息处理 词汇间语义关系 相关关系 互信息 二分图 量化方法
在线阅读 下载PDF
基于Web数据的特定领域双语词典抽取 被引量:11
15
作者 张永臣 孙乐 +4 位作者 李飞 李文波 西野文人 于浩 方高林 《中文信息学报》 CSCD 北大核心 2006年第2期16-23,共8页
双语词典是跨语言检索以及机器翻译等自然语言处理应用的基础资源。本文提出了一种从非平行语料中抽取特定领域双语词典的算法。首先给出了算法的基本假设并回顾了相关的研究方法,然后详细给出了利用词间关系矩阵法从特定领域非平行语... 双语词典是跨语言检索以及机器翻译等自然语言处理应用的基础资源。本文提出了一种从非平行语料中抽取特定领域双语词典的算法。首先给出了算法的基本假设并回顾了相关的研究方法,然后详细给出了利用词间关系矩阵法从特定领域非平行语料中抽取双语词典的过程,最后通过大量实验分析了种子词选择对词典抽取结果的影响,实验结果表明种子词的数量和频率对词典抽取结果有积极作用。 展开更多
关键词 计算机应用 中文信息处理 双语词典 词间关系矩阵 非平行语料 种子词
在线阅读 下载PDF
基于CUDA的地震数据相干体并行算法 被引量:10
16
作者 吴连贵 易瑜 李肯立 《计算机应用》 CSCD 北大核心 2009年第3期912-914,共3页
在地震探测解释方面,运用相干体技术可以清楚地识别断层和地层特征。由于相干体是通过三维地震数据体计算得到,传统方法难以满足计算需求。基于CUDA平台,提出了一种并行相干体算法,该算法可加速相干体算法中的矩阵相乘计算。理论分析和... 在地震探测解释方面,运用相干体技术可以清楚地识别断层和地层特征。由于相干体是通过三维地震数据体计算得到,传统方法难以满足计算需求。基于CUDA平台,提出了一种并行相干体算法,该算法可加速相干体算法中的矩阵相乘计算。理论分析和配有Intel Core2 Due CPU和NVIDIA GeForce 8800 GT显卡的实验结果表明:基于GPU的并行相干体算法可取得理想的线性加速比,提高系统的计算效率。 展开更多
关键词 统一计算设备架构 图形处理器 相干体技术 地震数据处理 并行处理
在线阅读 下载PDF
CT快速二维反投影算法 被引量:4
17
作者 孙丰荣 刘积仁 +1 位作者 王长宇 刘炜 《中国生物医学工程学报》 EI CAS CSCD 北大核心 2005年第2期179-185,共7页
CT图像重建过程中 ,标准的二维反投影运算计算量为O(N^3)。本研究提出一种快速二维反投影算法 ,其计算量仅为O(N^2 log_2~N )。该快速算法可以并行实现 ,处理器阵列规模为O(N^2 )时 ,计算量为O(log_2~N )。本研究还分析得到快速算法的... CT图像重建过程中 ,标准的二维反投影运算计算量为O(N^3)。本研究提出一种快速二维反投影算法 ,其计算量仅为O(N^2 log_2~N )。该快速算法可以并行实现 ,处理器阵列规模为O(N^2 )时 ,计算量为O(log_2~N )。本研究还分析得到快速算法的误差上界 ,并提出一种改进的快速二维反投影算法以获得更高的计算精度。最后 ,对算法进行了仿真实验。理论分析及仿真实验结果都表明 ,本研究的二维反投影算法在CT图像重建过程中有着更高的计算效率 ,并且具有良好的计算精度。 展开更多
关键词 反投影 二维 CT 图像重建 快速算法 计算精度 仿真实验 处理器 分析及
在线阅读 下载PDF
有限元结构分析并行计算的若干研究进展 被引量:9
18
作者 周树荃 邓绍忠 《南京航空航天大学学报》 CAS CSCD 1995年第1期27-32,共6页
有限元结构分析并行处理在大规模科学与工程计算中占有重要地位,本文简要介绍作者在这一领域内的研究工作及其成果。涉及单元刚度矩阵的并行计算、有限元方程组的并行直接解法、有限元方程组的并行迭代解法、结构动力分析并行直接积分... 有限元结构分析并行处理在大规模科学与工程计算中占有重要地位,本文简要介绍作者在这一领域内的研究工作及其成果。涉及单元刚度矩阵的并行计算、有限元方程组的并行直接解法、有限元方程组的并行迭代解法、结构动力分析并行直接积分法、广义特征值问题的并行算法以及EBE(Element-By-Element)技术在有限元结构分析并行处理中的应用等研究领域。特别提出了“伪单元向量”与“单元分组技术”等新概念与新方法;首先考虑了矩阵向量积的多自由度问题;系统、深入而又全面地研究了EBE策略在结构分析并行处理中的应用;填补了国内空白并突破了国际现有成果。 展开更多
关键词 计算数学 计算力学 并行处理 结构分析
在线阅读 下载PDF
基于辛Gauss方法及预处理GMRES方法的暂态稳定性并行计算 被引量:3
19
作者 温柏坚 胡佳怡 +2 位作者 郭文鑫 汪芳宗 李钦 《电力系统保护与控制》 EI CSCD 北大核心 2012年第22期19-24,共6页
将s级2s阶的辛Gauss方法用于电力系统暂态稳定性计算,提出了一种新的并行计算方法。该算法首先将微分—代数方程组经多级差分后转化为大规模非线性方程组,并利用牛顿法对其进行求解。在此基础上,利用矩阵分解方法将整体计算任务分解为... 将s级2s阶的辛Gauss方法用于电力系统暂态稳定性计算,提出了一种新的并行计算方法。该算法首先将微分—代数方程组经多级差分后转化为大规模非线性方程组,并利用牛顿法对其进行求解。在此基础上,利用矩阵分解方法将整体计算任务分解为两部分:一部分计算任务可按相应的级数或在不同的时间点上进行'解耦',因而具有完全的时间并行性;对剩下的一部分计算任务,采用预处理GMRES方法对其进行空间并行求解,并为此提出了一种新的预处理方法。利用三个不同规模的算例系统,对所提算法的收敛性进行了测试,并在GPU上对算法进行了实际测试。测试结果表明,该算法可以获得很高的加速比,可以用于大规模电网暂态稳定性的实时分析计算。 展开更多
关键词 暂态稳定性 辛Gauss算法 并行计算 GMRES方法 W-变换 预处理 GPU
在线阅读 下载PDF
GPU在SPH方法模拟溃坝问题的应用研究 被引量:4
20
作者 杨志国 黄兴 +1 位作者 郑兴 段文洋 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2014年第6期661-666,共6页
SPH方法是一种无网格的粒子方法,对于求解强非线性水动力学问题具有重要意义。随着粒子数增加,该方法的计算效率成为限制其大规模工程应用的重大瓶颈。可将大规模并行计算引入SPH方法中,以得到良好的计算加速效果。采用将GPU运用于SPH... SPH方法是一种无网格的粒子方法,对于求解强非线性水动力学问题具有重要意义。随着粒子数增加,该方法的计算效率成为限制其大规模工程应用的重大瓶颈。可将大规模并行计算引入SPH方法中,以得到良好的计算加速效果。采用将GPU运用于SPH方法并行计算的技术,借助CUDA硬件计算架构,研究SPH方法的并行计算通用性问题。以二维溃坝问题作为数值算例,对GPU计算结果的稳定性和收敛性进行验证,比较CPU与GPU的计算效率。通过计算,验证了GPU在SPH方法并行计算应用中的可靠性、可行性以及高效性,为提高SPH方法的计算效率提供一种重要的参考途径。 展开更多
关键词 GPU 并行计算 CUDA SPH方法 溃坝 水动力学 数值计算
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部