期刊文献+
共找到48篇文章
< 1 2 3 >
每页显示 20 50 100
Compute Unified Device Architecture Implementation of Euler/Navier-Stokes Solver on Graphics Processing Unit Desktop Platform for 2-D Compressible Flows
1
作者 Zhang Jiale Chen Hongquan 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI CSCD 2016年第5期536-545,共10页
Personal desktop platform with teraflops peak performance of thousands of cores is realized at the price of conventional workstations using the programmable graphics processing units(GPUs).A GPU-based parallel Euler/N... Personal desktop platform with teraflops peak performance of thousands of cores is realized at the price of conventional workstations using the programmable graphics processing units(GPUs).A GPU-based parallel Euler/Navier-Stokes solver is developed for 2-D compressible flows by using NVIDIA′s Compute Unified Device Architecture(CUDA)programming model in CUDA Fortran programming language.The techniques of implementation of CUDA kernels,double-layered thread hierarchy and variety memory hierarchy are presented to form the GPU-based algorithm of Euler/Navier-Stokes equations.The resulting parallel solver is validated by a set of typical test flow cases.The numerical results show that dozens of times speedup relative to a serial CPU implementation can be achieved using a single GPU desktop platform,which demonstrates that a GPU desktop can serve as a costeffective parallel computing platform to accelerate computational fluid dynamics(CFD)simulations substantially. 展开更多
关键词 graphics processing unit(GPU) GPU parallel computing compute unified device architecture(cuda)Fortran finite volume method(FVM) acceleration
在线阅读 下载PDF
基于CUDA加速动态规划优化全景拼接的刮板输送机直线状态监测
2
作者 李博 侍守伊 +4 位作者 张建军 夏蕊 王学文 崔卫秀 倪强 《工矿自动化》 北大核心 2025年第1期45-51,60,共8页
为提高井下复杂恶劣环境下刮板输送机直线状态监测精度和实时性,提出了一种基于统一计算设备架构(CUDA)加速动态规划优化全景拼接的刮板输送机直线状态监测方法。首先,同步2路摄像头获取的刮板输送机图像的帧数、分辨率参数,对输入的视... 为提高井下复杂恶劣环境下刮板输送机直线状态监测精度和实时性,提出了一种基于统一计算设备架构(CUDA)加速动态规划优化全景拼接的刮板输送机直线状态监测方法。首先,同步2路摄像头获取的刮板输送机图像的帧数、分辨率参数,对输入的视频流进行暗通道清晰化处理,以消除井下煤尘、水雾等的干扰。其次,使用ORB算法检测和计算2路视频帧的特征点和描述子,通过K最近邻(KNN)匹配计算特征点间的匹配对,利用设置阈值比例的方法过滤错误的匹配点,使用随机抽样一致(RANSAC)算法计算出用于图像透视变换的单应性矩阵。然后,基于CUDA将读取Sobel算子、计算梯度、计算总能量差异、循环初始化权重与路径、寻找最佳接缝线分配到不同的线程中,并定义计算能量图和寻找最佳接缝线的核函数,完成2路图像沿接缝线融合的全景拼接。最后,使用霍夫变换方法对全景拼接的刮板输送机图像中部槽挡煤板进行直线拟合,并将拟合的直线绘制在全景拼接图像上,以反映刮板输送机的直线状态。实验及测试结果表明,CUDA加速动态规划优化全景拼接痕迹不明显,且处理速度快;通过霍夫变换对中部槽挡煤板拟合的直线与刮板输送机直线具有较好的一致性,可用于刮板输送机直线状态监测。 展开更多
关键词 刮板输送机直线状态监测 cuda加速 动态规划 全景拼接 霍夫变换 统一计算设备架构
在线阅读 下载PDF
基于CUDA的超声二维声场EFIT仿真 被引量:2
3
作者 宋波 李威 廉国选 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2019年第7期1322-1328,共7页
随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场... 随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场仿真的基础上,基于GPU实现了仿真模型的并行计算,介绍了GPU程序的设计流程和参数优化方法,包括纹理内存使用、吸收边界优化和数据传输优化。对比了相同条件下CPU和GPU仿真计算的耗时和平均计算效率,定量分析了GPU对于EFIT模型效率的提升。比对结果表明,EFIT具有良好的并行计算条件,采用并行计算方法能够有效提升模型计算速度,对于复杂声场仿真应用具有广阔的应用前景。 展开更多
关键词 并行计算 弹性动力学有限积分算法(EfiT) 二维声场 图形处理器(GPU) 计算设备统一构架(cuda)
在线阅读 下载PDF
基于NVIDIA GPU的机载SAR实时成像处理算法CUDA设计与实现 被引量:17
4
作者 孟大地 胡玉新 +2 位作者 石涛 孙蕊 李晓波 《雷达学报(中英文)》 CSCD 2013年第4期481-491,共11页
合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit,CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SA... 合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit,CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SAR成像处理算法实现方案。该方案解决了GPU显存不足以容纳一景SAR数据时数据处理环节与内存/显存间数据传输环节的并行化问题,并能够支持多GPU设备的并行处理,充分利用了GPU设备的计算资源。在NVIDIA K20C和INTEL E5645上的测试表明,与传统基于GPU的SAR成像处理算法相比,该方案能够达到数十倍的速度提升,显著降低了处理设备的功耗,提高了处理设备的便携性,能够达到每秒约36兆采样点的实时处理速度。 展开更多
关键词 SAR 实时成像 图形处理器(GPU) 通用并行计算架构(cuda)
在线阅读 下载PDF
基于MPI+CUDA的异构并行可压缩流求解器 被引量:7
5
作者 刘枫 李桦 +1 位作者 田正雨 潘沙 《国防科技大学学报》 EI CAS CSCD 北大核心 2014年第1期6-10,共5页
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数... 在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求解器鲁棒性好,计算效率较CPU同构并行计算提高10倍以上。 展开更多
关键词 消息传递接口 统一计算设备架构 异构计算 可压缩流
在线阅读 下载PDF
一种利用CUDA技术实现雷达余辉效果的方法 被引量:3
6
作者 王金波 察豪 刘峰 《海军工程大学学报》 CAS 北大核心 2012年第3期103-106,共4页
雷达PPI显示器余辉效果的好坏直接影响雷达模拟器的逼真程度,从而影响受训人员的训练效果。为实现高度逼真的雷达余辉效果,克服余辉模拟中坐标变换及余辉计算对运算速度需求较高的问题,利用新近出现的CUDA并行处理技术将在CPU上处理耗... 雷达PPI显示器余辉效果的好坏直接影响雷达模拟器的逼真程度,从而影响受训人员的训练效果。为实现高度逼真的雷达余辉效果,克服余辉模拟中坐标变换及余辉计算对运算速度需求较高的问题,利用新近出现的CUDA并行处理技术将在CPU上处理耗时较多的坐标变换及余辉计算搬移到GPU上来实现,克服了传统雷达余辉模拟方法中存在的不足。同时,传统余辉模拟方法中无法实现的高转速扫描余辉模拟,以及由于目标数据致使天线转速不稳等问题也得以解决,使用该方法可以实现导航等多型雷达的高转速扫描线余辉模拟。利用该方法研制的雷达训练模拟器已装备到某训练基地,用于雷达兵实际的教学、训练和考核,取得了良好的效果。 展开更多
关键词 雷达 统一计算设备架构 GPU
在线阅读 下载PDF
CUDA加速的地图代数并行算法 被引量:1
7
作者 张剑波 周斯波 张帅 《桂林理工大学学报》 CAS 北大核心 2011年第1期139-143,共5页
针对传统地图代数实现方法应用于海量栅格数据计算时效率低下的问题,在一种全新的GPU并行编程模型CUDA上,利用地图代数算子体现出来的基于栅格点集、处理流程相对固定、数据处理具有内在的并行性等特点,将传统的串行算法映射到GPU并行... 针对传统地图代数实现方法应用于海量栅格数据计算时效率低下的问题,在一种全新的GPU并行编程模型CUDA上,利用地图代数算子体现出来的基于栅格点集、处理流程相对固定、数据处理具有内在的并行性等特点,将传统的串行算法映射到GPU并行处理架构上,旨在从串行算法的并行化映射、计算机图形处理器资源的自适应参数调整等多角度来研究地图代数空间并行算法的实现机制,为空间分析算法的优化研究提供一种新的解决思路。 展开更多
关键词 地图代数 统一计算设备架构(cuda) 并行计算
在线阅读 下载PDF
基于CUDA的导航雷达视频多样化显示 被引量:1
8
作者 钱国栋 嵇亮亮 《舰船电子工程》 2017年第9期78-80,99,共4页
鉴于导航雷达视频显示需求不断提高,论文提出了一种基于CUDA的软件化雷达视频显示方式,通过此方式,可实现船舶在不同航向、不同运动方式下的雷达视频显示;并且,由于此方式的灵活性,可方便实现单部导航雷达视频的双P显同屏显示、导航雷... 鉴于导航雷达视频显示需求不断提高,论文提出了一种基于CUDA的软件化雷达视频显示方式,通过此方式,可实现船舶在不同航向、不同运动方式下的雷达视频显示;并且,由于此方式的灵活性,可方便实现单部导航雷达视频的双P显同屏显示、导航雷达视频与电子海图叠加显示、单部导航雷达视频远近量程同屏显示、不同范围的雷达视频同屏显示等应用,文章最后给出了应用效果。 展开更多
关键词 导航雷达 电子海图 P显显示 统一计算设备架构 并行处理
在线阅读 下载PDF
基于CUDA的运动估计算法研究
9
作者 赵海国 《湖南理工学院学报(自然科学版)》 CAS 2012年第2期34-36,共3页
运动估计是H.264视频编码器中复杂度最高、耗时最长的模块.本文介绍了运动估计的基本原理以及全搜索算法FS(Full Search)和钻石搜索法DS(Diamond Search)等经典的运动估计算法,并引入了基于CUDA的运动估计算法:全域消除GEA算法和基于CUD... 运动估计是H.264视频编码器中复杂度最高、耗时最长的模块.本文介绍了运动估计的基本原理以及全搜索算法FS(Full Search)和钻石搜索法DS(Diamond Search)等经典的运动估计算法,并引入了基于CUDA的运动估计算法:全域消除GEA算法和基于CUDA的并行FS算法,有效地提高了H.264视频编解码速度. 展开更多
关键词 运动估计 统一计算设备架构 全搜索算法 钻石搜索法 全域消除算法
在线阅读 下载PDF
基于CUDA平台的时域有限差分算法研究 被引量:5
10
作者 沈琛 王璐 +1 位作者 胡玉娟 吴先良 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第5期644-647,共4页
文章针对传统时域有限差分(FDTD)算法的不足,以图形加速卡为核心,通过理论分析和数值模拟,研究并实现了基于CUDA平台的FDTD并行算法。CUDA是最新的可编程多线程的通用计算GPU模型,由于FDTD算法在空间上具有天然的并行性,因此非常适合在... 文章针对传统时域有限差分(FDTD)算法的不足,以图形加速卡为核心,通过理论分析和数值模拟,研究并实现了基于CUDA平台的FDTD并行算法。CUDA是最新的可编程多线程的通用计算GPU模型,由于FDTD算法在空间上具有天然的并行性,因此非常适合在GPU上实现并行算。文章描述了在CUDA编程模型上的FDTD算法的设计以及优化过程,并通过数值仿真实验结果证明了基于GPU的并行FDTD算法可以大大减少计算时间,基于GPU加速已成为电磁场数值计算的研究热点之一。 展开更多
关键词 计算机图形处理器(GPU) 统一计算架构(cuda) 时域有限差分(FDTD)算法
在线阅读 下载PDF
引导滤波算法的CUDA加速实现 被引量:4
11
作者 王新磊 何凯 王晓文 《吉林大学学报(信息科学版)》 CAS 2016年第1期104-110,共7页
针对引导滤波算法运算速度慢、无法实时处理的问题,提出基于统一计算设备架构(CUDA:Compute Unified Device Architecture)实现引导滤波算法的加速。利用CUDA并行编程实现图像邻域窗口像素值求和,进而获得图像邻域均值;通过利用寄存器... 针对引导滤波算法运算速度慢、无法实时处理的问题,提出基于统一计算设备架构(CUDA:Compute Unified Device Architecture)实现引导滤波算法的加速。利用CUDA并行编程实现图像邻域窗口像素值求和,进而获得图像邻域均值;通过利用寄存器和纹理存储器,同时优化算法步骤,获得引导滤波关键参数,进而实现对算法的整体优化。实验结果表明,与基于CPU实现引导滤波算法相比,基于CUDA并行处理可在很大程度上提高运算速度,基本达到了实时处理的要求。 展开更多
关键词 引导滤波 统一计算设备架构 并行计算 优化技术
在线阅读 下载PDF
基于CUDA和卡尔曼预测的实时电子稳像方法 被引量:4
12
作者 朱振伍 何凯 王新磊 《吉林大学学报(信息科学版)》 CAS 2015年第1期45-51,共7页
针对传统电子稳像方法无法实现视频的实时处理的问题,提出以SURF(Speed-Up Robust Features)配准算法为基础,基于CUDA(Compute Unified Device Architecture)编程实现算法的加速,并利用卡尔曼预测器进行实时预测。算法利用CUDA并行编程... 针对传统电子稳像方法无法实现视频的实时处理的问题,提出以SURF(Speed-Up Robust Features)配准算法为基础,基于CUDA(Compute Unified Device Architecture)编程实现算法的加速,并利用卡尔曼预测器进行实时预测。算法利用CUDA并行编程实现帧间特征点的提取和配准,获得帧间运动矢量;利用卡尔曼预测器获得稳定后的运动矢量,实现对当前帧的运动矢量的补偿,以达到实时稳像的目的。仿真实验结果表明,该方法可有效去除视频帧间的抖动,稳像效果良好,实现了视频的实时处理。 展开更多
关键词 电子稳像 cuda编程 SURF图像配准 卡尔曼预测
在线阅读 下载PDF
基于CUDA的多角度平面波复合算法研究 被引量:1
13
作者 伍吉兵 焦阳 +3 位作者 张德龙 徐杰 杨晨 崔崤峣 《中国医疗器械杂志》 2018年第5期317-320,共4页
多角度平面波复合算法是超快速超声成像技术的基础,有利于提高传统聚焦超声的成像帧频及分辨率。但是现有的多角度平面波复合技术由于其计算量较大,导致CPU计算耗时不能满足实时成像要求。该文提出了基于CUDA架构的多角度平面波复合算法... 多角度平面波复合算法是超快速超声成像技术的基础,有利于提高传统聚焦超声的成像帧频及分辨率。但是现有的多角度平面波复合技术由于其计算量较大,导致CPU计算耗时不能满足实时成像要求。该文提出了基于CUDA架构的多角度平面波复合算法,并进行了仿真工作以及对比实验。实验结果表明,基于GPU的多角度平面波复合计算耗时远低于CPU计算方法,可以大幅度提高计算速度以满足超声设备实时成像要求。 展开更多
关键词 超声成像 超声平面波 cuda 并行计算
在线阅读 下载PDF
一种基于CUDA的局部敏感哈希算法 被引量:1
14
作者 张一凡 余小清 +1 位作者 安炫东 万旺根 《应用科学学报》 CAS CSCD 北大核心 2015年第5期550-558,共9页
传统的局部敏感哈希算法建立哈希表时往往需要较大的内存空间以及较长的建立时间.在查询阶段,查询样本K个最近邻数据项的所需时间超过整个运行时间的95%.针对这些问题,运用计算设备架构将局部敏感哈希算法移植至图形处理器,并用多线程... 传统的局部敏感哈希算法建立哈希表时往往需要较大的内存空间以及较长的建立时间.在查询阶段,查询样本K个最近邻数据项的所需时间超过整个运行时间的95%.针对这些问题,运用计算设备架构将局部敏感哈希算法移植至图形处理器,并用多线程并行计算数据项的哈希值来建立哈希表.查询阶段在全局内存中引入基于工作队列的多样本查询,以提高算法的运行效率.实验结果表明,所提出的算法与传统的局部敏感哈希算法相比,能在不降低运算精度的情况下将运算速度提高近12倍. 展开更多
关键词 计算设备架构 图形处理器 局部敏感哈希 K最近邻
在线阅读 下载PDF
利用CUDA快速实现IMM目标跟踪 被引量:2
15
作者 辛召强 沈晓峰 《雷达科学与技术》 2012年第6期656-659,共4页
根据二维空间内目标作匀速直线运动和匀速圆周运动的特点,在建立目标运动模型和观测模型的基础上采用基于交互多模算法(IMM)的卡尔曼滤波器对机动目标进行跟踪。但由于IMM算法存在大量的递归与矩阵运算,所以实时性降低,这也是工程上难... 根据二维空间内目标作匀速直线运动和匀速圆周运动的特点,在建立目标运动模型和观测模型的基础上采用基于交互多模算法(IMM)的卡尔曼滤波器对机动目标进行跟踪。但由于IMM算法存在大量的递归与矩阵运算,所以实时性降低,这也是工程上难以实现的原因。通过CUDA对算法进行加速实现,在不影响算法性能的基础上实时性大大提高。仿真结果表明,利用该架构实现的IMM算法不仅能够对匀速直线运动和匀速圆周运动的目标进行实时跟踪,而且在运动模型发生变化时,实时性也得到很大提升,滤波误差也比较小。 展开更多
关键词 目标跟踪 统一计算设备架构 交互多模 机动 图形处理器
在线阅读 下载PDF
基于CUDA架构的混合测向算法研究 被引量:1
16
作者 金莉 宋万杰 施治国 《雷达科学与技术》 北大核心 2018年第2期133-138,共6页
采用数字波束形成算法与合成导向矢量算法相结合的测高算法,提高了测角精度和测角速率。另外,为了进一步满足系统实时性要求,提出采用基于计算统一设备架构为平台完成雷达测角的方案,该方案利用并行计算平台和异构编程模型,首先在通用... 采用数字波束形成算法与合成导向矢量算法相结合的测高算法,提高了测角精度和测角速率。另外,为了进一步满足系统实时性要求,提出采用基于计算统一设备架构为平台完成雷达测角的方案,该方案利用并行计算平台和异构编程模型,首先在通用处理计算机上用CPU完成预处理,并控制信号处理的任务调度和负载分配,图形处理器实现数字波束形成算法和合成导向矢量算法,并与CPU进行比较。实验结果表明,利用计算统一设备架构技术实现的测高算法取得了比CPU算法更高的运算效率。 展开更多
关键词 数字波束形成算法 合成导向矢量算法 并行 异构编程模型 计算统一设备架构
在线阅读 下载PDF
基于CUDA的导航雷达P显多要素显示技术 被引量:2
17
作者 徐勇 嵇亮亮 《舰船电子工程》 2017年第10期91-94,共4页
鉴于导航雷达视频P显显示需求不断提高,论文提出了一种基于CUDA的P显多要素显示方式,通过此方式,可以将雷达视频、电子海图以及ARPA信息进行叠加显示,并具有较强的显示灵活性;此外,论文采用了"分层绘制"和"整体更新"... 鉴于导航雷达视频P显显示需求不断提高,论文提出了一种基于CUDA的P显多要素显示方式,通过此方式,可以将雷达视频、电子海图以及ARPA信息进行叠加显示,并具有较强的显示灵活性;此外,论文采用了"分层绘制"和"整体更新"的机制,按需更新P显显示内容,降低了其更新频率,提高了P显绘制的效率,文章最后给出了应用效果。 展开更多
关键词 导航雷达 电子海图 P显显示 ARPA 并行处理 软件化显示
在线阅读 下载PDF
基于CUDA架构下的直方图均衡并行算法
18
作者 肖汉 肖诗洋 +1 位作者 孙陆鹏 郭宝云 《桂林理工大学学报》 CAS 北大核心 2021年第3期654-663,共10页
为了提高图像对比度,解决传统的直方图均衡算法处理速度慢的问题,提出了基于统一计算设备架构(CUDA)的直方图均衡图像实时处理加速方案。利用图形处理器(GPU)强大的计算能力和CUDA优化的存储器结构,以加速直方图均衡中的图像灰度级投票... 为了提高图像对比度,解决传统的直方图均衡算法处理速度慢的问题,提出了基于统一计算设备架构(CUDA)的直方图均衡图像实时处理加速方案。利用图形处理器(GPU)强大的计算能力和CUDA优化的存储器结构,以加速直方图均衡中的图像灰度级投票、分布概率累加并映射以及图像新的灰度值填充等功能进行运算。在CUDA条件下,对直方图均衡算法进行串-并行分析,分别从粗粒度与细粒度角度进行并行设计,通过实验测定进行了设计参数寻优,获得了线程块设计参数的最优尺寸。结果表明,基于CUDA的图像直方图均衡并行算法的性能相比基于CPU的串行算法和基于开放多处理(OpenMP)并行算法分别获得了61.58和32.00倍的加速比,能够为大规模实时性图像处理系统设计提供参考。 展开更多
关键词 直方图均衡 图像增强 图形处理器 统一计算设备架构 并行算法
在线阅读 下载PDF
基于GPU通用计算CUDA架构的人体检测技术
19
作者 周晓阳 《信息化研究》 2012年第2期41-43,共3页
随着计算机硬件技术的高速发展,图形处理器(Graphic processing unit,GPU)通用计算已经发展到颇为成熟阶段,其并行运算速度已远远超过多核CPU。文章简介CUDA架构并验证其在图形处理中的加速能力,对比线性代数运算在CPU与GPU架构下的效率... 随着计算机硬件技术的高速发展,图形处理器(Graphic processing unit,GPU)通用计算已经发展到颇为成熟阶段,其并行运算速度已远远超过多核CPU。文章简介CUDA架构并验证其在图形处理中的加速能力,对比线性代数运算在CPU与GPU架构下的效率,将CUDA技术应用于智能视频监控人体检测系统中,实验验证其高效性及可行性。最后对CUDA的发展方向进行了展望。 展开更多
关键词 图形处理器 并行计算架构 人体检测 视频监控
在线阅读 下载PDF
GPU在SPH方法模拟溃坝问题的应用研究 被引量:4
20
作者 杨志国 黄兴 +1 位作者 郑兴 段文洋 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2014年第6期661-666,共6页
SPH方法是一种无网格的粒子方法,对于求解强非线性水动力学问题具有重要意义。随着粒子数增加,该方法的计算效率成为限制其大规模工程应用的重大瓶颈。可将大规模并行计算引入SPH方法中,以得到良好的计算加速效果。采用将GPU运用于SPH... SPH方法是一种无网格的粒子方法,对于求解强非线性水动力学问题具有重要意义。随着粒子数增加,该方法的计算效率成为限制其大规模工程应用的重大瓶颈。可将大规模并行计算引入SPH方法中,以得到良好的计算加速效果。采用将GPU运用于SPH方法并行计算的技术,借助CUDA硬件计算架构,研究SPH方法的并行计算通用性问题。以二维溃坝问题作为数值算例,对GPU计算结果的稳定性和收敛性进行验证,比较CPU与GPU的计算效率。通过计算,验证了GPU在SPH方法并行计算应用中的可靠性、可行性以及高效性,为提高SPH方法的计算效率提供一种重要的参考途径。 展开更多
关键词 GPU 并行计算 cuda SPH方法 溃坝 水动力学 数值计算
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部