期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
CUDA并行计算的应用研究 被引量:43
1
作者 董荦 葛万成 陈康力 《信息技术》 2010年第4期11-15,共5页
统一设备架构(CUDA)是NVIDIA公司提出的一个基于GPU通用计算的开发环境,它针对GPU多处理单元的特性,通过并行计算提高大规模运算的速度。根据CUDA技术的特点,提出了基于CUDA的并行图像锐化、中值滤波和字符搜索算法,并论述其关键技术和... 统一设备架构(CUDA)是NVIDIA公司提出的一个基于GPU通用计算的开发环境,它针对GPU多处理单元的特性,通过并行计算提高大规模运算的速度。根据CUDA技术的特点,提出了基于CUDA的并行图像锐化、中值滤波和字符搜索算法,并论述其关键技术和基本执行流程。试验结果表明,提出的方法相对于CPU方法在运算速度上有不同程度的提高和下降。这同时体现了CUDA的优势和局限性,为其更复杂的应用提供了参考和依据。 展开更多
关键词 图形处理器 统一计算设备构架 图像锐化 中值滤波 并行计算
在线阅读 下载PDF
GPU加速MOC输运计算性能分析研究 被引量:4
2
作者 宋佩涛 张志俭 +2 位作者 梁亮 张乾 赵强 《原子能科学技术》 EI CAS CSCD 北大核心 2020年第1期103-111,共9页
特征线方法(MOC)在求解堆芯规模中子输运方程时面临计算时间长的问题,加速和并行算法是目前研究的热点。基于MOC在特征线和能群层面的并行特性,采用统一计算设备构架(CUDA)编程规范,实现了基于图形处理器(GPU)的并行二维MOC算法。测试... 特征线方法(MOC)在求解堆芯规模中子输运方程时面临计算时间长的问题,加速和并行算法是目前研究的热点。基于MOC在特征线和能群层面的并行特性,采用统一计算设备构架(CUDA)编程规范,实现了基于图形处理器(GPU)的并行二维MOC算法。测试了菱形差分和步特征线法分别在双精度、混合精度及单精度浮点运算下的计算精度、效率及GPU加速效果。采用性能分析工具对GPU程序性能进行了分析,识别了程序性能瓶颈。结果表明:菱形差分和步特征线法在不同浮点运算精度下均表现出良好的计算精度;相比于CPU单线程计算,GPU加速效果在双精度和单精度情况下分别达到35倍和100倍以上。 展开更多
关键词 GPU加速 特征线方法 中子输运计算 统一计算设备构架 性能分析
在线阅读 下载PDF
GPU加速下脉冲压缩雷达的点迹凝聚 被引量:4
3
作者 夏栋 夏奎 +1 位作者 张伟 孙剑英 《火力与指挥控制》 CSCD 北大核心 2013年第3期81-85,共5页
GPU具有很高的显存带宽和大量计算单元,随着其可编程性的不断提高,GPU越来越多地用于图像渲染以外的其他通用计算。研究了利用GPU丰富的运算资源并行加速实现脉冲压缩雷达的点迹凝聚问题。首先研究了每个目标的点迹采用一个CUDA线程的... GPU具有很高的显存带宽和大量计算单元,随着其可编程性的不断提高,GPU越来越多地用于图像渲染以外的其他通用计算。研究了利用GPU丰富的运算资源并行加速实现脉冲压缩雷达的点迹凝聚问题。首先研究了每个目标的点迹采用一个CUDA线程的粗粒度并行方式,结果发现处理时间反而有所增加,分析了处理时间加长的原因。然后增加了并行的尺度,对单个目标的凝聚过程进行并行分解。结果表明大尺度细粒度的并行方式可以有效利用GPU强大的运算能力,加快脉冲压缩雷达的点迹凝聚速度。 展开更多
关键词 GPU的通用运算 并行计算 点迹凝聚 计算统一设备构架
在线阅读 下载PDF
改进的电大目标电磁散射弹跳射线算法 被引量:1
4
作者 刘兴霞 张利军 赵玉祥 《探测与控制学报》 CSCD 北大核心 2015年第3期91-95,共5页
针对传统弹跳射线方法(SBR)在处理电大尺寸目标电磁散射问题时存在效率不高的问题,提出了改进的电大目标电磁散射弹跳射线算法。该算法在采用层次包围的二叉树加速数据结构的基础上,提出了在图形处理器(GPU)端实现射线管的分裂和追踪更... 针对传统弹跳射线方法(SBR)在处理电大尺寸目标电磁散射问题时存在效率不高的问题,提出了改进的电大目标电磁散射弹跳射线算法。该算法在采用层次包围的二叉树加速数据结构的基础上,提出了在图形处理器(GPU)端实现射线管的分裂和追踪更新的计算统一设备构架(CUDA)并行计算SBR算法。通过实验算例验证表明,该方法可有效提高SBR方法处理电大尺寸目标电磁散射问题的的计算效率。 展开更多
关键词 弹跳射线法 目标电磁散射 层次包围 计算统一设备构架
在线阅读 下载PDF
基于CUDA的超声二维声场EFIT仿真 被引量:2
5
作者 宋波 李威 廉国选 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2019年第7期1322-1328,共7页
随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场... 随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场仿真的基础上,基于GPU实现了仿真模型的并行计算,介绍了GPU程序的设计流程和参数优化方法,包括纹理内存使用、吸收边界优化和数据传输优化。对比了相同条件下CPU和GPU仿真计算的耗时和平均计算效率,定量分析了GPU对于EFIT模型效率的提升。比对结果表明,EFIT具有良好的并行计算条件,采用并行计算方法能够有效提升模型计算速度,对于复杂声场仿真应用具有广阔的应用前景。 展开更多
关键词 并行计算 弹性动力学有限积分算法(EFIT) 二维声场 图形处理器(GPU) 计算设备统一构架(CUDA)
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部