期刊文献+
共找到283篇文章
< 1 2 15 >
每页显示 20 50 100
基于GPU并行计算的拓扑优化全流程加速设计方法
1
作者 张长东 吴奕凡 +3 位作者 周铉华 李旭东 肖息 张自来 《航空制造技术》 北大核心 2025年第12期34-41,67,共9页
随着大尺寸航空航天装备的发展需求,高效高精度的大规模拓扑优化设计成为该领域关注的焦点。针对现有大规模拓扑优化设计存在的计算量巨大、计算效率低下等问题,基于GPU并行计算开展了拓扑优化全流程加速设计方法的研究。对网格划分、... 随着大尺寸航空航天装备的发展需求,高效高精度的大规模拓扑优化设计成为该领域关注的焦点。针对现有大规模拓扑优化设计存在的计算量巨大、计算效率低下等问题,基于GPU并行计算开展了拓扑优化全流程加速设计方法的研究。对网格划分、刚度矩阵计算与组装、有限元求解等过程进行了并行加速,实现了高效高精度的体素网格划分及有限元过程的高效求解。此外,该方法针对拓扑优化设计过程的加速需求,对灵敏度过滤过程进行了并行加速处理。以300万体素单元的姿态推力器模型为设计对象,发现相比于Abaqus 2022软件的拓扑优化并行加速计算,本文所提方法的加速比提高了1259%,且两种方法的相似度极高,验证了所提方法的有效性与实用性。 展开更多
关键词 拓扑优化 并行计算 gpu加速 符号距离场 稀疏矩阵 网格划分
在线阅读 下载PDF
基于CPU-GPU协同的迭代物理光学并行算法研究
2
作者 曹倩 周远国 +1 位作者 任强 王焱 《电波科学学报》 北大核心 2025年第3期427-438,共12页
随着雷达技术与无人驾驶的结合,电磁仿真在无人驾驶领域得到了广泛应用。当利用迭代物理光学(iterative physical optics,IPO)法求解电大散射体雷达散射截面(radar cross section,RCS)时,未知量数目比较大,导致占用内存和计算耗时非常... 随着雷达技术与无人驾驶的结合,电磁仿真在无人驾驶领域得到了广泛应用。当利用迭代物理光学(iterative physical optics,IPO)法求解电大散射体雷达散射截面(radar cross section,RCS)时,未知量数目比较大,导致占用内存和计算耗时非常大。为解决该问题,本文引入参数空间技术优化IPO算法,提高了电大尺寸RCS的计算效率,并引入计算统一设备架构(compute unified device architecture,CUDA)技术,在中央处理器(central processing unit,CPU)与图形处理器(graphics processing unit,GPU)协同平台上实现了电大尺寸目标RCS的并行计算。与商业软件FEKO比对,在NVIDIA GeForce RTX 3050显卡上获得了224.35的加速比。实例结果展示了基于CPU-GPU协同的IPO算法并行计算的可行性与高效性,可以用来解决目前只能在高性能计算机或计算机集群上解决的电大尺寸目标散射问题。 展开更多
关键词 迭代物理光学法(IPO) 参数空间技术 cpu-gpu协同 并行加速 雷达散射截面(RCS)
在线阅读 下载PDF
CPU/GPU协同并行计算研究综述 被引量:97
3
作者 卢风顺 宋君强 +1 位作者 银福康 张理论 《计算机科学》 CSCD 北大核心 2011年第3期5-9,46,共6页
CPU/GPU异构混合并行系统以其强劲计算能力、高性价比和低能耗等特点成为新型高性能计算平台,但其复杂体系结构为并行计算研究提出了巨大挑战。CPU/GPU协同并行计算属于新兴研究领域,是一个开放的课题。根据所用计算资源的规模将CPU/GP... CPU/GPU异构混合并行系统以其强劲计算能力、高性价比和低能耗等特点成为新型高性能计算平台,但其复杂体系结构为并行计算研究提出了巨大挑战。CPU/GPU协同并行计算属于新兴研究领域,是一个开放的课题。根据所用计算资源的规模将CPU/GPU协同并行计算研究划分为三类,尔后从立项依据、研究内容和研究方法等方面重点介绍了几个混合计算项目,并指出了可进一步研究的方向,以期为领域科学家进行协同并行计算研究提供一定参考。 展开更多
关键词 异构混合 协同并行计算 gpu计算 性能优化 可扩展
在线阅读 下载PDF
GPU/CPU协同粗粒度并行计算及在城市区域震害模拟中的应用 被引量:4
4
作者 韩博 熊琛 +1 位作者 陆新征 叶列平 《地震工程学报》 CSCD 北大核心 2013年第3期582-589,共8页
采用精细结构模型和动力时程分析以提高城市区域建筑震害预测精度已经成为一重要研究方向,而传统的CPU计算平台成本过高,难以推广。本文提出采用基于GPU/CPU协同粗粒度并行计算的方法来实现城市区域建筑震害的高效精细化动力时程计算,... 采用精细结构模型和动力时程分析以提高城市区域建筑震害预测精度已经成为一重要研究方向,而传统的CPU计算平台成本过高,难以推广。本文提出采用基于GPU/CPU协同粗粒度并行计算的方法来实现城市区域建筑震害的高效精细化动力时程计算,可以显著提高效率并降低成本。简述了所采用的程序架构、计算模型、参数选取,对并行计算的效率进行了详细的讨论,并通过一个中等大小城市的案例展示了该方法的优势。 展开更多
关键词 区域震害预测 gpu 集中质量剪切模型 粗粒度并行计算 协同计算
在线阅读 下载PDF
基于CPU-GPU异构的电力系统静态电压稳定域边界并行计算方法 被引量:10
5
作者 李雪 张琳玮 +2 位作者 姜涛 陈厚合 李国庆 《电工技术学报》 EI CSCD 北大核心 2021年第19期4070-4084,共15页
为提升区域互联电力系统静态电压稳定域边界(SVSRB)的构建效率,该文以直接法为基础,提出一种基于CPU-GPU异构的静态电压稳定域边界并行计算方法。该方法首先依据SVSRB拓扑特性,基于边界追踪算法实现直接法求解鞍结分岔(SNB)点时初值的... 为提升区域互联电力系统静态电压稳定域边界(SVSRB)的构建效率,该文以直接法为基础,提出一种基于CPU-GPU异构的静态电压稳定域边界并行计算方法。该方法首先依据SVSRB拓扑特性,基于边界追踪算法实现直接法求解鞍结分岔(SNB)点时初值的高效选取,克服直接法对初值敏感这一瓶颈;然后结合CPU-GPU异构平台,将直接法求解SNB点计算量较大、计算耗时占比高的修正量求解部分由GPU完成,其他逻辑性强但计算量较低的部分由CPU完成,以实现SNB点的并行求解,降低直接法计算量大、计算复杂度高的不足,从而提升SVSRB的搜索效率;最后以WECC3机9节点测试系统,波兰电网2737节点和3120节点测试系统,欧洲电网7092节点、9241节点、11624节点和13659节点测试系统算例对该文所提方法进行了分析与验证,结果表明所提并行计算方法可实现电力系统静态电压稳定域边界的快速、准确搜索。 展开更多
关键词 静态电压稳定域边界 边界追踪法 直接法 鞍结分岔点 cpu-gpu 异构平台
在线阅读 下载PDF
基于Seed-PCG法的列车-轨道-地基土三维随机振动GPU并行计算方法
6
作者 朱志辉 冯杨 +2 位作者 杨啸 李昊 邹有 《Journal of Central South University》 SCIE EI CAS CSCD 2024年第1期302-316,共15页
为了解决列车-轨道-地基土三维有限元模型随机多样本计算效率低的问题,本文提出了一种基于Seed-PCG法的高效并行计算方法。基于有限元法和虚拟激励法建立轨道不平顺激励下的三维列车-轨道-地基土耦合随机振动分析模型;针对车致地基土随... 为了解决列车-轨道-地基土三维有限元模型随机多样本计算效率低的问题,本文提出了一种基于Seed-PCG法的高效并行计算方法。基于有限元法和虚拟激励法建立轨道不平顺激励下的三维列车-轨道-地基土耦合随机振动分析模型;针对车致地基土随机振动分析产生的多右端项线性方程组求解问题,采用Seed-PCG方法进行求解。通过PCG方法求解种子系统得到的Krylov子空间进行投影,以改进其余线性方程组的初始解和对应的初始残量,有效提高了PCG法的收敛速度,最后,在MATLABCUDA混合平台上开发了并行计算程序。数值算例表明:相同计算平台下的该方法相比多点同步算法获得了104.2倍的加速;相比PCG法逐个求解方案减少了18%的迭代次数,获得了1.21倍的加速。 展开更多
关键词 Seed-PCG法 多右端项线性方程组 随机振动 gpu并行计算 列车-轨道-地基土耦合模型
在线阅读 下载PDF
电力系统全纯嵌入潮流的并行计算 被引量:1
7
作者 李雪 高翔 +2 位作者 姜涛 王长江 李国庆 《电工技术学报》 EI CSCD 北大核心 2024年第18期5839-5854,共16页
潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的... 潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的逼近计算量大、耗时久,是制约HELM计算效率提升的关键。为此,该文提出一种基于稳定双正交共轭梯度(BICGSTAB)和Aitken差分的电力系统全纯嵌入潮流并行计算方法,该方法首先采用近似逆预处理的BICGSTAB法并行迭代求解HELM的高维幂级数系数线性方程组,以快速计算节点电压的各阶幂级数系数;其次,借助Aitken差分法实现所有节点电压幂级数有理逼近值的并行计算;然后,基于CPU-GPU异构平台设计所提算法的并行流程,以实现大规模电力系统潮流的快速求解;最后,通过节点在1 354~13 802的不同规模测试系统对所提方法进行分析、验证。结果表明,所提电力系统潮流全纯嵌入并行计算方法可实现电力系统潮流的准确、快速求解。 展开更多
关键词 全纯嵌入法 潮流计算 Aitken差分法 cpu-gpu异构运算平台 预处理器
在线阅读 下载PDF
任意起伏地形下重力异常三维正演及并行计算 被引量:1
8
作者 戴世坤 朱德祥 +4 位作者 张莹 李昆 陈轻蕊 凌嘉宣 田红军 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2024年第2期768-780,共13页
为了进一步提高空间-波数域三维重力异常正演算法的适用范围和计算效率,本文采用任意傅里叶变换算法实现了空间-波数域三维重力异常正演,且在NVIDIA CUDA平台上进行CPU-GPU并行加速.任意傅里叶变换算法的基本思想是将二维傅里叶变换转... 为了进一步提高空间-波数域三维重力异常正演算法的适用范围和计算效率,本文采用任意傅里叶变换算法实现了空间-波数域三维重力异常正演,且在NVIDIA CUDA平台上进行CPU-GPU并行加速.任意傅里叶变换算法的基本思想是将二维傅里叶变换转化为两个一维傅里叶变换,一维傅里叶变换积分离散为多个单元积分累加和,离散单元中原函数采用二次插值形函数拟合,求出单元积分的解析表达式.相比现有的傅里叶变换算法,新方法具有采样灵活、积分精度高、计算速度快和傅里叶变换的截断效应小等优势.利用空间-波数域算法的高度并行性,采用CPU并行求解常微分方程,GPU并行计算任意傅里叶变换,实现了CPU-GPU并行加速方案,进一步提升了本文算法效率.利用常密度模型,对比数值解和解析解,结果表明本文算法正确;利用变密度模型对比了任意傅里叶变换算法与高斯快速傅里叶变换算法的计算效率与精度,在相近的数值精度下,本文算法波数选取少,效率高;测试CPU-GPU并行效果,结果表明相比CPU串行算法,CPU-GPU并行算法的计算效率大大提升,千万数量级节点数模型正演仅耗时数秒.最后利用实际地形数据进行三维重力异常场数值模拟,证明了新方法的高效性与实用性,对实现大规模复杂条件下重力异常精细化反演成像与综合解释有重要意义. 展开更多
关键词 空间-波数域 任意傅里叶变换 三维重力异常正演 cpu-gpu并行
在线阅读 下载PDF
基于计算着色器的并行Delaunay三角剖分算法
9
作者 陈国军 李震烁 陈昊祯 《图学学报》 北大核心 2025年第1期159-169,共11页
Delaunay三角剖分是一种经典的计算几何算法,在众多领域中有着广泛地使用,随着实际需求的不断提高,现有的Delaunay三角剖分算法已不能满足大规模数据的需求,为此,提出了一种基于计算着色器的并行Delaunay三角剖分方法,该方法通过纹理缓... Delaunay三角剖分是一种经典的计算几何算法,在众多领域中有着广泛地使用,随着实际需求的不断提高,现有的Delaunay三角剖分算法已不能满足大规模数据的需求,为此,提出了一种基于计算着色器的并行Delaunay三角剖分方法,该方法通过纹理缓存将点集数据输入到计算着色器中,并利用计算着色器加速Delaunay三角剖分,同时在现有方法的基础上提出动态插入法解决点集在离散空间中的重映射问题。此外,为了能够让显存有限的GPU构建出远超其显存限制的Delaunay三角网,提出基于计算着色器的分区双向扫描算法,并将点集划分为多个子区域,然后通过扫描各个子区域的方式进行构网。实验结果表明:在相同运行环境下,基于计算着色器的方法与现有的方法相比缩短了构网时间。同时分区双向扫描算法很好地解决了GPU的显存瓶颈问题,能让显存有限的GPU构建出远超其显存容量的Delaunay三角网。 展开更多
关键词 DELAUNAY三角剖分 计算着色器 gpu 并行计算 VORONOI图
在线阅读 下载PDF
海量地震数据叠前逆时偏移的多GPU联合并行计算策略 被引量:9
10
作者 孔祥宁 张慧宇 +1 位作者 刘守伟 李晶晶 《石油物探》 EI CSCD 北大核心 2013年第3期288-293,共6页
叠前逆时深度偏移(Pre-stack Reverse-time Depth Migration,RTM)是一种全波场成像方法。由于其实现过程存在着存储量、计算量庞大以及成像噪声等问题,难以适应实际生产的需求,使得该方法一直没有在工业界得到广泛的应用。采用震源波场... 叠前逆时深度偏移(Pre-stack Reverse-time Depth Migration,RTM)是一种全波场成像方法。由于其实现过程存在着存储量、计算量庞大以及成像噪声等问题,难以适应实际生产的需求,使得该方法一直没有在工业界得到广泛的应用。采用震源波场重构的策略降低了存储需求;针对其计算量巨大的问题,利用了图形处理器(Graphic Processing Unit,GPU)进行并行计算,并与中央处理器(Central Processing Unit,CPU)结合实现协同并行处理;同时采用GPU多卡联合策略解决GPU显存不足的瓶颈。实际资料试验处理结果表明,上述技术措施能够在保证RTM高精度成像优势的基础上极大地提高计算效率,为应用RTM处理海量地震数据提供了良好的技术支持。 展开更多
关键词 叠前逆时深度偏移 计算效率 gpu cpu 并行计算 实用性
在线阅读 下载PDF
CPU/GPU异构混合并行的栅格数据空间分析研究——以地形因子计算为例 被引量:9
11
作者 卢敏 王金茵 +2 位作者 卢刚 陶伟东 王结臣 《计算机工程与应用》 CSCD 北大核心 2017年第1期172-177,共6页
海量数据背景下传统GIS栅格数据空间分析计算效率已经不能满足快速计算的需求,为此以地形因子计算为例,分析并测试了基于共享内存模型的CPU多核并行模式与基于流处理器模型的GPU众核并行模式的计算性能,在此基础上详细实现了负载均衡的... 海量数据背景下传统GIS栅格数据空间分析计算效率已经不能满足快速计算的需求,为此以地形因子计算为例,分析并测试了基于共享内存模型的CPU多核并行模式与基于流处理器模型的GPU众核并行模式的计算性能,在此基础上详细实现了负载均衡的设备间任务划分,进行CPU与GPU异构混合的并行技术改良研究。实验结果表明,基于相同的单机硬件环境,与多核共享内存模型或众核流处理器的单一计算平台并行方案相比,CPU/GPU异构混合并行计算方法对于栅格数据分析具有更好的加速效果。 展开更多
关键词 GIS栅格数据分析 共享内存模型 流处理器模型 cpu/gpu异构混合并行
在线阅读 下载PDF
基于GPU并行计算的浅水波运动数值模拟 被引量:15
12
作者 许栋 徐彬 +2 位作者 David PAyet 白玉川 及春宁 《计算力学学报》 CAS CSCD 北大核心 2016年第1期113-120,共8页
利用有限体积法求解描述水流运动的二维浅水方程组,模拟洪水波运动传播过程,并通过GPU并行计算技术对程序进行加速,建立了浅水运动高效模拟方法。数值模拟结果表明,基于本文提出的GPU并行策略以及通用并行计算架构(CUDA)支持,能够实现相... 利用有限体积法求解描述水流运动的二维浅水方程组,模拟洪水波运动传播过程,并通过GPU并行计算技术对程序进行加速,建立了浅水运动高效模拟方法。数值模拟结果表明,基于本文提出的GPU并行策略以及通用并行计算架构(CUDA)支持,能够实现相比CPU单核心最高112倍的加速比,为利用单机实现快速洪水预测以及防灾减灾决策提供有效支撑。此外,对基于GPU并行计算的浅水模拟计算精度进行了论证,并对并行性能优化进行了分析。利用所建模型模拟了溃坝洪水在三维障碍物间的传播过程。 展开更多
关键词 洪水波 二维浅水方程组 gpu并行计算 CUDA
在线阅读 下载PDF
GPU并行计算加速的实时可视外壳三维重建及其虚实交互 被引量:13
13
作者 邵绪强 聂霄 王保义 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2017年第1期52-61,共10页
针对现有的基于图像的三维重建方法难以实现真实物体的快速三维重建,无法满足虚实交互等应用需求的问题,提出一种基于GPU并行计算的实时三维重建及其虚实交互方法.首先把物体所在空间剖分成具有数据独立性的体素集合,结合可视外壳重建... 针对现有的基于图像的三维重建方法难以实现真实物体的快速三维重建,无法满足虚实交互等应用需求的问题,提出一种基于GPU并行计算的实时三维重建及其虚实交互方法.首先把物体所在空间剖分成具有数据独立性的体素集合,结合可视外壳重建算法和精确行进立方体算法并行遍历每个体素得到体素状态序列;然后并行压缩体素状态序列得到非空体素集合,对非空体素进行并行三角形网格化,并利用图形硬件的多重纹理映射和可编程功能进行基于像素的纹理映射;最后假定虚拟物体的粒子为运动受限的拉格朗日流体粒子,重建物体网格顶点为流体边界,通过流体动力学方程的并行光滑粒子动力学方法求解来计算虚实交互.实验结果表明,该方法在GPU上进行完全并行求解,在32×32×32的空间剖分精度下,实现了实时三维重建和20帧/s左右的虚实交互计算,适用于计算机图形学和虚拟现实等领域中的虚实交互应用. 展开更多
关键词 可视外壳 三维重建 gpu并行计算 虚实交互 实时模拟
在线阅读 下载PDF
一种基于GPU并行计算的无人机影像快速镶嵌方法 被引量:2
14
作者 李朋龙 丁忆 +3 位作者 胡艳 罗鼎 段松江 舒文强 《国土资源遥感》 CSCD 北大核心 2017年第4期57-63,共7页
提出了一种从匀光后无人机影像出发,以Voronoi图为镶嵌线网络,基于GPU并行计算的无人机影像快速镶嵌方法。首先,通过Wallis滤波处理影像间色彩不一致问题;然后,以测区影像位置自动生成Voronoi图镶嵌线网络;最后,基于GPU并行计算将无人... 提出了一种从匀光后无人机影像出发,以Voronoi图为镶嵌线网络,基于GPU并行计算的无人机影像快速镶嵌方法。首先,通过Wallis滤波处理影像间色彩不一致问题;然后,以测区影像位置自动生成Voronoi图镶嵌线网络;最后,基于GPU并行计算将无人机影像快速正射纠正并镶嵌。通过对230张空间分辨率为0.1 m的无人机影像进行快速纠正镶嵌,实验结果表明,该方法较传统方法效率有很大提升。 展开更多
关键词 影像匀光 无人机影像 正射纠正 影像镶嵌 gpu并行计算
在线阅读 下载PDF
CPU-GPU异构计算环境下的并行T近邻谱聚类算法 被引量:3
15
作者 张帅 李涛 +2 位作者 焦晓帆 王艺峰 杨愚鲁 《计算机研究与发展》 EI CSCD 北大核心 2015年第11期2555-2567,共13页
谱聚类是数据挖掘领域最常用的聚类算法之一,但对于如何利用多核CPU与资源有限的众核加速器设计并实现一个在异构单节点上能够处理大规模数据集的高效谱聚类算法,目前尚无理想的解决方案.PSCH(parallel spectral clustering for hybrid... 谱聚类是数据挖掘领域最常用的聚类算法之一,但对于如何利用多核CPU与资源有限的众核加速器设计并实现一个在异构单节点上能够处理大规模数据集的高效谱聚类算法,目前尚无理想的解决方案.PSCH(parallel spectral clustering for hybrids)算法是专为CPU-GPU异构计算环境设计的并行T近邻(T-nearest-neighbors,TNN)谱聚类算法,通过分块计算相似性矩阵打破了GPU设备内存的限制,所能处理的数据集规模仅受限于CPU主存的容量.PSCH算法中使用CUDA设计实现双缓冲轮转4段流水机制,通过重叠计算与传输在打破存储瓶颈的同时保证了高计算性能.PSCH算法采用隐式重启动Lanczos方法(implicitly restarted Lanczos method,IRIM)在异构硬件上计算稀疏特征矩阵的特征分解,减轻了特征分解步骤的计算瓶颈.PSCH算法在配有一块GTX 480GPU的单节点上能够对百万以上规模的数据集进行聚类,并对实验中的4个数据集取得了相对于使用16进程的MPI并行谱聚类PSC算法2.0~4.5倍的性能. 展开更多
关键词 谱聚类 T近邻 cpu-gpu异构计算 计算统一设备架构 OpenMP
在线阅读 下载PDF
一种基于GPU的地形顶点法向量并行计算方法 被引量:2
16
作者 何望君 刘纪平 张福浩 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2017年第7期734-738,共5页
为实现三维地形场景实时光照和阴影,采用顶点周围四点高程和GPU(显卡)寄存器绑定方法,借助顶点缓冲区和顶点着色器实时计算顶点法向量,对比主流地形着色算法,实验验证了GPU法向量实时计算效率和显卡兼容性.研究结果表明:地形场景为百万... 为实现三维地形场景实时光照和阴影,采用顶点周围四点高程和GPU(显卡)寄存器绑定方法,借助顶点缓冲区和顶点着色器实时计算顶点法向量,对比主流地形着色算法,实验验证了GPU法向量实时计算效率和显卡兼容性.研究结果表明:地形场景为百万级(1 048 576)三角形时,GPU顶点法向量计算方法具备较高渲染帧率(66帧/s)和较好显卡兼容性.研究结论初步突破了真实感地形需要Normal Map的限制,有利于网络条件下快速高效渲染大规模真实感地形. 展开更多
关键词 地形渲染 gpu编程 法向图 实时光照 并行计算
在线阅读 下载PDF
无网格Galerkin法GPU加速并行计算及其应用 被引量:1
17
作者 龚曙光 刘奇良 +2 位作者 卢海山 周志勇 张佳 《计算力学学报》 CAS CSCD 北大核心 2015年第6期745-751,共7页
针对无网格Galerkin法计算耗时的问题,采用逐节点对法来组装刚度矩阵、共轭梯度法求解基于CSR格式存储的稀疏线性方程组,提出了一种利用罚函数法施加本质边界条件的EFG法GPU加速并行算法,给出了刚度矩阵和惩罚刚度矩阵的统一格式,以及GP... 针对无网格Galerkin法计算耗时的问题,采用逐节点对法来组装刚度矩阵、共轭梯度法求解基于CSR格式存储的稀疏线性方程组,提出了一种利用罚函数法施加本质边界条件的EFG法GPU加速并行算法,给出了刚度矩阵和惩罚刚度矩阵的统一格式,以及GPU加速并行算法的流程图。编写了基于CUDA构架平台的GPU程序,且在NVIDIA GeForce GTX 660显卡上通过数值算例对所提算法进行了性能测试与分析比较,探讨了影响加速比的因素。算例结果验证了所提算法的可行性,并在满足计算精度的前提下,其加速比最大可达17倍;同时线性方程组的求解对加速比起决定性影响。 展开更多
关键词 无网格GALERKIN法 gpu加速 并行计算 CUDA
在线阅读 下载PDF
基于SPH方法与GPU并行计算的复杂阶梯流数值模拟 被引量:3
18
作者 吴建松 李娜 +1 位作者 刘文雨 周世禄 《安全与环境学报》 CAS CSCD 北大核心 2019年第3期774-779,共6页
为了更有效地模拟和分析地铁站内复杂楼梯上洪水流动的动力学特征,采用光滑粒子流体动力学方法(SPH)并借助GPU并行计算技术对复杂形态(带1、2、3个休息平台的直行、直角转弯L型)阶梯上洪水流动特征和漫延过程进行数值建模和计算分析。基... 为了更有效地模拟和分析地铁站内复杂楼梯上洪水流动的动力学特征,采用光滑粒子流体动力学方法(SPH)并借助GPU并行计算技术对复杂形态(带1、2、3个休息平台的直行、直角转弯L型)阶梯上洪水流动特征和漫延过程进行数值建模和计算分析。基于SPH方法和GPU并行加速的复杂阶梯流模型的数值模拟结果表明:该模型不但可以计算获得更好的阶梯流流态,而且具有较高的计算效率;不同休息平台数、不同形态阶梯上洪水水流呈现差别较大的水流特征;该模型借助GPU并行加速,适合研究大尺度复杂楼梯上洪水漫延问题,可为分析和评估洪水水流对地铁站楼梯上被困人员疏散过程的影响提供有力的工具。 展开更多
关键词 安全工程 地铁站 洪水 阶梯流 光滑粒子流体动力学 gpu并行计算
在线阅读 下载PDF
CPU-GPU协同计算的遥感仿真图像MTF退化并行算法 被引量:1
19
作者 赵瑞斌 赵生慧 胡新礼 《计算机工程与科学》 CSCD 北大核心 2015年第7期1258-1264,共7页
在遥感图像仿真中,为了定量模拟并分析平台抖动、探测器电子特性、大气衰减等因素对遥感成像质量的影响,需要有效计算遥感系统的调制传递函数MTF,并将其快速作用到仿真图像上。然而,由于遥感仿真图像的大数据量特性以及MTF退化包含多个... 在遥感图像仿真中,为了定量模拟并分析平台抖动、探测器电子特性、大气衰减等因素对遥感成像质量的影响,需要有效计算遥感系统的调制传递函数MTF,并将其快速作用到仿真图像上。然而,由于遥感仿真图像的大数据量特性以及MTF退化包含多个计算密集型算法,使得计算效率成为一个瓶颈问题。为此,根据已有研究提出的MTF计算模型,分析了遥感仿真图像MTF退化的一般流程及主要环节的算法复杂度。在此基础上,提出了一种CPU-GPU协同计算的遥感仿真图像MTF退化并行算法。实验结果表明,该并行算法有效地发挥了GPU并行计算能力,并明显提高了MTF退化处理效率。 展开更多
关键词 遥感仿真图像 MTF退化 并行计算 gpu CUDA
在线阅读 下载PDF
GPU并行计算在LSSVM股票预测上的研究与应用 被引量:1
20
作者 郑晓薇 侯立斐 于梦玲 《计算机应用与软件》 CSCD 北大核心 2013年第1期34-36,共3页
金融市场股票的价格预测是投资者们关心的热门问题,随着股票数据规模以及样本维数的日益庞大,人们对于股票预测算法在保证准确之外的预测速度也提出了更高的要求。在最小二乘支持向量机(LSSVM)股票预测算法的基础上,提出一种适宜支持向... 金融市场股票的价格预测是投资者们关心的热门问题,随着股票数据规模以及样本维数的日益庞大,人们对于股票预测算法在保证准确之外的预测速度也提出了更高的要求。在最小二乘支持向量机(LSSVM)股票预测算法的基础上,提出一种适宜支持向量机的GPU并行计算模型。实验证明,新方法不仅可以保证预测的精度,而且可以大大缩短预测时间。该方法可以广泛运用到金融领域的大规模数据处理以及预测中,具有较高的应用价值。 展开更多
关键词 gpu 并行计算 最小二乘支持向量机 股票预测
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部