期刊文献+
共找到812篇文章
< 1 2 41 >
每页显示 20 50 100
基于GPU并行计算的拓扑优化全流程加速设计方法
1
作者 张长东 吴奕凡 +3 位作者 周铉华 李旭东 肖息 张自来 《航空制造技术》 北大核心 2025年第12期34-41,67,共9页
随着大尺寸航空航天装备的发展需求,高效高精度的大规模拓扑优化设计成为该领域关注的焦点。针对现有大规模拓扑优化设计存在的计算量巨大、计算效率低下等问题,基于GPU并行计算开展了拓扑优化全流程加速设计方法的研究。对网格划分、... 随着大尺寸航空航天装备的发展需求,高效高精度的大规模拓扑优化设计成为该领域关注的焦点。针对现有大规模拓扑优化设计存在的计算量巨大、计算效率低下等问题,基于GPU并行计算开展了拓扑优化全流程加速设计方法的研究。对网格划分、刚度矩阵计算与组装、有限元求解等过程进行了并行加速,实现了高效高精度的体素网格划分及有限元过程的高效求解。此外,该方法针对拓扑优化设计过程的加速需求,对灵敏度过滤过程进行了并行加速处理。以300万体素单元的姿态推力器模型为设计对象,发现相比于Abaqus 2022软件的拓扑优化并行加速计算,本文所提方法的加速比提高了1259%,且两种方法的相似度极高,验证了所提方法的有效性与实用性。 展开更多
关键词 拓扑优化 并行计算 gpu加速 符号距离场 稀疏矩阵 网格划分
在线阅读 下载PDF
基于GPU加速的分布式水文模型并行计算性能 被引量:1
2
作者 庞超 周祖昊 +4 位作者 刘佳嘉 石天宇 杜崇 王坤 于新哲 《南水北调与水利科技(中英文)》 CAS CSCD 北大核心 2024年第1期33-38,共6页
针对具有物理机制的分布式水文模型对大流域、长序列模拟计算时间长、模拟速度慢的问题,引入基于GPU的并行计算技术,实现分布式水文模型WEP-L(water and energy transfer processes in large river basins)产流过程的并行化。选择鄱阳... 针对具有物理机制的分布式水文模型对大流域、长序列模拟计算时间长、模拟速度慢的问题,引入基于GPU的并行计算技术,实现分布式水文模型WEP-L(water and energy transfer processes in large river basins)产流过程的并行化。选择鄱阳湖流域为实验区,采用计算能力为8.6的NVIDIA RTX A4000对算法性能进行测试。研究表明:提出的基于GPU的分布式水文模型并行算法具有良好的加速效果,当线程总数越接近划分的子流域个数(计算任务量)时,并行性能越好,在实验流域WEP-L模型子流域单元为8712个时,加速比最大达到2.5左右;随着计算任务量的增加,加速比逐渐增大,当实验流域WEP-L模型子流域单元增加到24897个时,加速比能达到3.5,表明GPU并行算法在大尺度流域分布式水文模型计算中具有良好的发展潜力。 展开更多
关键词 基于gpu的并行算法 物理机制 分布式水文模型 WEP-L模型 计算性能
在线阅读 下载PDF
联合K-D树和GPU并行运算的CUBE快速滤波方法
3
作者 李枭凯 王力 +2 位作者 李广云 高欣圆 靳海峰 《海洋测绘》 北大核心 2025年第2期14-18,共5页
针对多波束测深数据滤波算法的效率问题,提出了一种联合K-D树和GPU并行运算的CUBE(com-bined uncertainty bathymetry estimator,CUBE)快速滤波算法。该算法首先利用K-D树对点云数据进行高效索引,然后将滤波任务分配至GPU的流式多处理... 针对多波束测深数据滤波算法的效率问题,提出了一种联合K-D树和GPU并行运算的CUBE(com-bined uncertainty bathymetry estimator,CUBE)快速滤波算法。该算法首先利用K-D树对点云数据进行高效索引,然后将滤波任务分配至GPU的流式多处理器进行并行处理,从而显著提升了执行速度。实验部分通过比较K-D树与八叉树的索引效率,验证了K-D树在处理大规模点云数据时的优势。将本算法与串行CUBE算法及CARIS HIPS软件的CUBE模块进行对比,结果显示在亿级数据量处理中,滤波速度提高了约13.8倍。此外,本算法在保持数据真实性和去噪效果的前提下,展现了与商业软件相当的处理效率,为多波束测深数据的高效处理提供了有价值的参考。 展开更多
关键词 多波束测深 数据处理 CUBE算法 K-D树 gpu加速
在线阅读 下载PDF
GPU上基于环展开的RTL模拟加速技术研究
4
作者 田茜 李暾 +2 位作者 程悦 皮彦 邹鸿基 《计算机工程与科学》 北大核心 2025年第2期191-199,共9页
随着开源和敏捷硬件设计方法学的发展,为其提供高效的RTL模拟支持变得日益重要。GPU的并行能力使得利用RTL模拟的结构级和激励级并行性加速RTL模拟成为可能。然而,由于时序设计中存在反馈环,如何实现单个Testbench内的数据级并行仍然是... 随着开源和敏捷硬件设计方法学的发展,为其提供高效的RTL模拟支持变得日益重要。GPU的并行能力使得利用RTL模拟的结构级和激励级并行性加速RTL模拟成为可能。然而,由于时序设计中存在反馈环,如何实现单个Testbench内的数据级并行仍然是一个很大的挑战。提出了一种新的利用GPU加速RTL模拟的方法,该方法的核心技术是RTL设计中反馈环的识别与展开,以及基于此的RTL电路划分技术。电路划分和环展开从单个Testbench内的结构并行和数据并行2个方面,发挥了基于GPU的并行能力来加速RTL模拟。实验结果表明,所提出的GPU加速RTL模拟方法,相比传统的基于GPU的RTL模拟方法得到了1.2~107.1倍的加速,相比目前最快的RTL模拟器ESSENT得到了2.2~14倍的加速。 展开更多
关键词 RTL模拟 gpu加速 PyRTL 硬件构造语言 环展开
在线阅读 下载PDF
复杂地质条件的间断有限元地震波数值模拟及GPU加速
5
作者 韩德超 刘卫华 +2 位作者 张春丽 袁媛 白鹏 《石油物探》 北大核心 2025年第4期639-652,共14页
间断Galerkin有限元方法(DGFEM)是一种具有较高模拟精度的有限元方法,但其算法编程难度大,其针对各类复杂介质的波动方程的算法目前未见统一的计算格式。为此,基于三角形非结构化网格以及局部Lax-Friedrichs数值流,构建了针对复杂介质... 间断Galerkin有限元方法(DGFEM)是一种具有较高模拟精度的有限元方法,但其算法编程难度大,其针对各类复杂介质的波动方程的算法目前未见统一的计算格式。为此,基于三角形非结构化网格以及局部Lax-Friedrichs数值流,构建了针对复杂介质波动方程模拟的DGFEM编程计算矩阵,并进一步得出了适用于各类复杂介质模拟的单一波场分量的通用计算格式。该通用计算格式能够有效提升DGFEM算法编程的可拓展性。基于该格式给出了DGFEM的通用CUDA核函数的构建方法,并形成CPU+GPU的二维DGFEM并行计算程序框架。通用CUDA核函数可以将DGFEM算法进一步延伸到更加复杂的介质以及三维情况。理论模型和复杂山地模型的数值实验结果表明,构建的通用计算格式和CUDA核函数可以准确模拟声波、弹性波、粘弹性波、孔隙弹性波方程描述的纵波、横波以及慢纵波等波现象。相比单核CPU模拟,二维DGFEM弹性波GPU计算加速比平均在100倍左右。同时,弹性波、粘弹性波、孔隙弹性波模拟耗时约为声波模拟的1.7,2.3,3.0倍。此结果可以指导复杂介质耦合条件模拟时多进程的负载平衡。 展开更多
关键词 间断Galerkin有限元方法 弹性波 粘弹性波 孔隙弹性波 数值模拟 gpu并行计算.
在线阅读 下载PDF
超燃冲压发动机一维模型的GPU并行加速研究
6
作者 温思歆 苏承毅 +3 位作者 王东杰 孟万植 聂聆聪 孙希明 《推进技术》 EI CAS CSCD 北大核心 2024年第10期247-256,共10页
发动机模型是控制计划优化、基于模型的控制和观测器设计等技术的基础,对控制系统的性能具有重要影响。然而,超燃冲压发动机一维模型由于依赖计算流体力学的网格计算,其计算量巨大,难以在机载控制器内实时运行。为解决这一问题,本文深... 发动机模型是控制计划优化、基于模型的控制和观测器设计等技术的基础,对控制系统的性能具有重要影响。然而,超燃冲压发动机一维模型由于依赖计算流体力学的网格计算,其计算量巨大,难以在机载控制器内实时运行。为解决这一问题,本文深入研究基于图形处理器(Graphics Processing Unit,GPU)的并行计算技术,探索了网格解耦与划分、串/并异构设计、内存优化、代码优化、编译指令优化、硬件模式优化等方法,综合设计了一个高效的中央处理器(Central Processing Unit,CPU)+GPU异构模型,并在基于虚拟路径交叉连接(Virtual Path Cross-Connect,VPX)总线的嵌入式控制器上进行验证。为充分验证所设计异构模型的有效性、高效性与实时性,本文依次开展基线测试、软硬件优化加速测试、并行计算测试,在测试中对比一维模型在CPU,单核GPU,多核GPU上的计算耗时与数据误差。最后根据数据、曲线、监控工具等方式,展示了所设计的异构模型在不损失模型精度的前提下,加速超过了6.7倍,运行时间均不超过25 ms,符合工程预期的实时性要求,具有良好的应用前景。 展开更多
关键词 超燃冲压发动机 并行计算 一维模型 嵌入式控制器 优化加速
在线阅读 下载PDF
一种改进GPU加速策略的物质点分析方法及其在滑坡模拟中的应用
7
作者 王斌 陈鹏林 +3 位作者 王頔 徐顺心 许子凯 吴进东 《工程科学与技术》 北大核心 2025年第4期1-11,共11页
近年来物质点法发展成为岩土工程领域一种重要的大变形数值模拟方法,被广泛应用于滑坡、溃坝、隧道突水突泥等问题的研究。伴随着应用场景的规模化与复杂化,对于方法本身的精度要求和效率需求继而持续增加,导致其计算成本逐步上升,制约... 近年来物质点法发展成为岩土工程领域一种重要的大变形数值模拟方法,被广泛应用于滑坡、溃坝、隧道突水突泥等问题的研究。伴随着应用场景的规模化与复杂化,对于方法本身的精度要求和效率需求继而持续增加,导致其计算成本逐步上升,制约了物质点法进一步在大规模岩土工程问题中的应用。鉴于此,本文提出一种改进图形处理器(GPU)加速策略的物质点法,引入模块化编程思想,采用简洁的多组1维数组的方式进行数据存储结构和基于硬件层级的内存操作管理处理数据竞争,以提高物质点法的模拟效率,解决面向过程的GPU加速策略存在的扩展性问题,并形成高效且灵活的模拟构架。通过模拟铝棒坍塌试验和理想边坡失效过程,结果显示,基于改进GPU加速策略的物质点方法具有较好的并行性,较已有Taichi-GPU物质点法在性能上提升10%左右。最后,应用本文提出的物质点方法模拟再现新磨村滑坡的全过程,得出当物质点数目扩大2.5倍左右时,计算效率提升20倍左右。 展开更多
关键词 gpu加速 物质点法 滑坡 大变形数值模拟
在线阅读 下载PDF
基于Vulkan的电大复杂目标电磁散射SBR计算方法与GPU加速技术
8
作者 王思凡 吴扬 +5 位作者 贾浩文 胡志明 申子昂 徐若锋 梁达 赵雷 《电波科学学报》 北大核心 2025年第3期457-463,共7页
提出了一种基于Vulkan架构的弹跳射线(shooting and bouncing ray,SBR)加速计算方法,用于电大复杂目标雷达散射截面的快速计算。设计了高效的Vulkan计算着色器,充分利用GPU硬件光追,显著提升了SBR法中光线求交的计算速度;引入了双命令... 提出了一种基于Vulkan架构的弹跳射线(shooting and bouncing ray,SBR)加速计算方法,用于电大复杂目标雷达散射截面的快速计算。设计了高效的Vulkan计算着色器,充分利用GPU硬件光追,显著提升了SBR法中光线求交的计算速度;引入了双命令缓冲机制,使得CPU与GPU能够高效协同工作,从而加速多角度扫描任务的执行;在虚拟孔径面上划分互不干扰的子任务,进一步提升了多GPU并行的利用效率。实验结果表明:所提出方法在计算电大复杂目标雷达散射截面时相较于FEKO RL-GO方法实现了40倍以上的加速;双命令缓冲机制提升了约42%的多角度扫描速度;双GPU计算并行效率超过90%。 展开更多
关键词 雷达散射截面(RCS) 弹跳射线(SBR)法 光线追踪 gpu加速计算 电大复杂目标
在线阅读 下载PDF
基于通用图形处理器的神经网络并行推理加速
9
作者 王重熙 章隆兵 《高技术通讯》 北大核心 2025年第3期250-261,共12页
通用图形处理器(general purpose graphics processing unit,GPGPU)是目前加速人工智能(artificial intelligence,AI)负载最主要的算力来源,其内存带宽和峰值算力随着AI模型的发展而迅速提高。然而,在神经网络的推理过程中,单样本或小... 通用图形处理器(general purpose graphics processing unit,GPGPU)是目前加速人工智能(artificial intelligence,AI)负载最主要的算力来源,其内存带宽和峰值算力随着AI模型的发展而迅速提高。然而,在神经网络的推理过程中,单样本或小批量的推理难以同时充分利用通用图形处理器中不同的计算、存储和访存资源,造成部分资源闲置。对此,本文提出了基于通用图形处理器的神经网络并行推理加速方法,在通用图形处理器上同时推理多个神经网络,通过同时执行互补的神经网络层充分利用通用图形处理器中的各类资源。首先,使用PyTorch中的统一计算设备架构(compute unified device architecture,CUDA)流以及直接在CUDA流中调用CUDA基础线性代数子程序库(CUDA basic linear algebra subprograms,cuBLAS)和CUDA深度神经网络库(CUDA deep neural network library,cuDNN)2种方式,在它们并行加速效果不及预期的情况下,根据性能分析结果确定了NVIDIA通用图形处理器负载调度机制中对多负载并行的限制因素。随后,基于特定的调度机制,提出了更适合多负载并行核函数的设计方法,并实现了主要的神经网络算子,基于此方法在真实的通用图形处理器平台上实现了神经网络并行推理加速。在RTX3080通用图形处理器上的测试结果表明,该神经网络并行推理加速方法对主流神经网络的并行推理达到了平均1.94倍的加速效果,相较于直接调用cuBLAS和cuDNN库平均1.34倍的加速效果提高了45%,不仅验证了在通用图形处理器上实现神经网络并行推理加速的可行性,同时也为其他各类负载在通用图形处理器上的多负载并行加速提供了道路。 展开更多
关键词 多负载并行加速 神经网络推理 通用图形处理器
在线阅读 下载PDF
基于CPU-GPU协同的迭代物理光学并行算法研究
10
作者 曹倩 周远国 +1 位作者 任强 王焱 《电波科学学报》 北大核心 2025年第3期427-438,共12页
随着雷达技术与无人驾驶的结合,电磁仿真在无人驾驶领域得到了广泛应用。当利用迭代物理光学(iterative physical optics,IPO)法求解电大散射体雷达散射截面(radar cross section,RCS)时,未知量数目比较大,导致占用内存和计算耗时非常... 随着雷达技术与无人驾驶的结合,电磁仿真在无人驾驶领域得到了广泛应用。当利用迭代物理光学(iterative physical optics,IPO)法求解电大散射体雷达散射截面(radar cross section,RCS)时,未知量数目比较大,导致占用内存和计算耗时非常大。为解决该问题,本文引入参数空间技术优化IPO算法,提高了电大尺寸RCS的计算效率,并引入计算统一设备架构(compute unified device architecture,CUDA)技术,在中央处理器(central processing unit,CPU)与图形处理器(graphics processing unit,GPU)协同平台上实现了电大尺寸目标RCS的并行计算。与商业软件FEKO比对,在NVIDIA GeForce RTX 3050显卡上获得了224.35的加速比。实例结果展示了基于CPU-GPU协同的IPO算法并行计算的可行性与高效性,可以用来解决目前只能在高性能计算机或计算机集群上解决的电大尺寸目标散射问题。 展开更多
关键词 迭代物理光学法(IPO) 参数空间技术 CPU-gpu协同 并行加速 雷达散射截面(RCS)
在线阅读 下载PDF
启发式优化算法的GPU并行加速框架
11
作者 王东杰 温思歆 +1 位作者 孟万植 吴迪 《系统仿真学报》 CAS CSCD 北大核心 2024年第8期1929-1943,共15页
为解决启发式优化算法计算量大、耗时长的缺点,使用图形处理单元(GPU)以及统一计算架构(compute unified device architecture,CUDA)对启发式优化算法进行并行化。提出了一种针对启发式优化算法的GPU并行框架,设计了具有并行逻辑结构的... 为解决启发式优化算法计算量大、耗时长的缺点,使用图形处理单元(GPU)以及统一计算架构(compute unified device architecture,CUDA)对启发式优化算法进行并行化。提出了一种针对启发式优化算法的GPU并行框架,设计了具有并行逻辑结构的信息交互框架、算法并行优化策略,解决了信息交互的逻辑结构在串、并行中的相异性问题,该框架可并行化各类启发式优化算法,具有一般性与高效性。为验证该框架的有效性,利用并行框架对5种常见启发式优化算法进行并行化,给出了多个测试函数下GPU并行计算与CPU串行计算的对比结果,其中差分进化算法、哈里斯鹰优化算法、灰狼优化算法、鲸鱼优化算法在种群维度为5000时,分别加速高达179.1、178.6、74.3、358.2倍,同时保证了结果的准确性,表明所设计并行框架的高效性与实用性。 展开更多
关键词 启发式优化算法 gpu并行 CUDA模型 并行框架 信息交互
在线阅读 下载PDF
基于GPU并行加速的多特征融合的超图降维方法
12
作者 洪朝群 陈旭辉 +2 位作者 王晓栋 李士锦 吴克寿 《计算机科学》 CSCD 北大核心 2015年第11期90-93,117,共5页
基于图的学习方法目前广泛用于降低特征维度。然而,对于多特征数据而言,不同特征之间的不同关联性很难结合到单个图中。针对多特征数据提出了新的半监督降维方法。首先,以超图中的超边作为片,使超图应用到片对齐框架中。然后,通过统计... 基于图的学习方法目前广泛用于降低特征维度。然而,对于多特征数据而言,不同特征之间的不同关联性很难结合到单个图中。针对多特征数据提出了新的半监督降维方法。首先,以超图中的超边作为片,使超图应用到片对齐框架中。然后,通过统计片中相邻的特征对的距离计算超边的权重,使得不同特征下的片得到结合。其次,由于欧氏距离和矩阵乘法的计算在拉普拉斯矩阵的构造过程中占用了大部分的时间,因此使用GPU对其进行加速。实验结果表明了所提方法在分类性能和学习速度上的提升效果。 展开更多
关键词 降维 多特征融合 片对齐框架 超图学习 基于gpu的并行加速
在线阅读 下载PDF
一种基于GPU加速的细粒度并行粒子群算法 被引量:8
13
作者 李建明 万单领 +1 位作者 迟忠先 胡祥培 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2006年第12期2162-2166,共5页
提出了一种基于GPU加速的细粒度并行粒子群算法,将并行PSO求解过程转化为GPU纹理渲染过程,使PSO算法在GPU中加速执行,在取得了较好的优化效果的同时,增大了细粒度并行的粒子规模,提高了算法的运算速度,并为普通用户的并行PSO工作提供了... 提出了一种基于GPU加速的细粒度并行粒子群算法,将并行PSO求解过程转化为GPU纹理渲染过程,使PSO算法在GPU中加速执行,在取得了较好的优化效果的同时,增大了细粒度并行的粒子规模,提高了算法的运算速度,并为普通用户的并行PSO工作提供了一种可行的方法. 展开更多
关键词 粒子群优化算法 并行处理 gpu 细粒度
在线阅读 下载PDF
基于GPU并行加速的叠前逆时偏移方法 被引量:9
14
作者 石颖 陆加敏 +2 位作者 柯璇 田东升 王菲 《东北石油大学学报》 CAS 北大核心 2012年第4期111-115,11,共5页
为了提高复杂地下介质的成像精度和偏移算法的计算效率,提出可高效对地下复杂构造进行准确成像的GPU加速叠前逆时偏移方法.该方法采用双程声波方程进行波场延拓,突破倾角限制,借助于高阶有限差分方法实现叠前逆时偏移成像;利用GPU(Graph... 为了提高复杂地下介质的成像精度和偏移算法的计算效率,提出可高效对地下复杂构造进行准确成像的GPU加速叠前逆时偏移方法.该方法采用双程声波方程进行波场延拓,突破倾角限制,借助于高阶有限差分方法实现叠前逆时偏移成像;利用GPU(Graphic Processing Unit)并行加速技术对波场延拓和成像进行计算,相比于传统算法,其计算效率有较大提高,可以解决叠前逆时偏移算法计算量过大问题;在获取波场信息过程中,也采用随机边界条件,实施以计算换存储策略,解决逆时偏移计算中的海量存储问题.模型测试结果表明,该方法能够高效和高精度地对地下复杂地质体成像. 展开更多
关键词 逆时偏移 gpu 加速 高阶有限差分 随机边界条件 复杂构造
在线阅读 下载PDF
GPU加速的二值图连通域标记并行算法 被引量:9
15
作者 覃方涛 房斌 《计算机应用》 CSCD 北大核心 2010年第10期2774-2776,共3页
结合NVIDIA公司统一计算设备架构(CUDA)下的图形处理器(GPU)并行结构和硬件特点,提出了一种新的二值图像连通域标记并行算法,高速有效地标识出了二值图的连通域位置及大小,大幅缩减了标记时间耗费。该算法通过搜索邻域内最小标号值的像... 结合NVIDIA公司统一计算设备架构(CUDA)下的图形处理器(GPU)并行结构和硬件特点,提出了一种新的二值图像连通域标记并行算法,高速有效地标识出了二值图的连通域位置及大小,大幅缩减了标记时间耗费。该算法通过搜索邻域内最小标号值的像素点对连通域进行标记,各像素点处理顺序不分先后并且不相互依赖,因此可以并行执行。算法效率不受连通域形状及数量的影响,具有很好的鲁棒性。实验结果表明,该并行算法充分发挥了GPU并行处理能力,在处理高分辨率与多连通域图像时效率为一般CPU标记算法的300倍,比OpenCV的优化函数(CPU)效率高近17倍。 展开更多
关键词 gpu加速 连通域标记 并行 统一计算设备架构 8邻域
在线阅读 下载PDF
基于GPU加速的雷达信号处理并行技术 被引量:13
16
作者 秦华 周沫 +1 位作者 察豪 沈括 《舰船科学技术》 北大核心 2013年第7期77-82,共6页
软件雷达实现的瓶颈问题之一是信号的实时处理。为提高软件雷达信号处理的实时性,利用图形处理器(GPU)的并行运算能力进行雷达信号处理的硬件加速。设计雷达信号处理在CPU-GPU系统中的执行策略。针对GPU并行计算特点对雷达信号处理算法... 软件雷达实现的瓶颈问题之一是信号的实时处理。为提高软件雷达信号处理的实时性,利用图形处理器(GPU)的并行运算能力进行雷达信号处理的硬件加速。设计雷达信号处理在CPU-GPU系统中的执行策略。针对GPU并行计算特点对雷达信号处理算法进行优化。实验结果表明,通过与同期中央处理器(CPU)运算平台比较,GPU运算可实现20倍以上的加速比,并且可以实时完成雷达信号处理的整个流程,体现出良好的工程价值与应用前景。 展开更多
关键词 信号处理 gpu运算 并行计算
在线阅读 下载PDF
基于GPU并行加速的VSP数据逆时偏移 被引量:3
17
作者 郭雪豹 王建民 +3 位作者 王维红 王云专 柯璇 刘诗竹 《东北石油大学学报》 CAS 北大核心 2014年第2期58-62,8,共5页
基于VSP观测系统,利用VSP数据高分辨率、高信噪比的优势,采用叠前深度逆时偏移方法对VSP数据进行成像,并与地面地震叠前深度逆时偏移的成像效果比较,分析各自的成像优势及特点;在偏移处理过程中采用GPU并行加速,与传统CPU算法相对比.模... 基于VSP观测系统,利用VSP数据高分辨率、高信噪比的优势,采用叠前深度逆时偏移方法对VSP数据进行成像,并与地面地震叠前深度逆时偏移的成像效果比较,分析各自的成像优势及特点;在偏移处理过程中采用GPU并行加速,与传统CPU算法相对比.模型测试结果表明:VSP数据逆时偏移对地下深部地层及井旁微幅构造具有比地面地震逆时偏移更好的成像效果,而在浅层部分因接收不到浅层反射信息而不如地面地震成像清晰;在计算效率方面,GPU算法较原CPU算法提高70倍以上.该研究对深层复杂构造勘探具有一定的指导作用. 展开更多
关键词 VSP 逆时偏移 gpu 并行计算 复杂构造
在线阅读 下载PDF
Canny算法的GPU并行加速 被引量:12
18
作者 张帆 韩树奎 +1 位作者 张立国 王文胜 《中国光学》 EI CAS CSCD 2017年第6期737-743,共7页
Canny算法在PC机上的执行速度较慢,这极大地限制了其实用性。本文在前人的研究基础上对算法进行更深的优化和改进。首先在VS2012开发环境下利用数字图像处理技术对原算法进行原理上的改进,再利用GPU流处理器数量众多的优势以及强大的多... Canny算法在PC机上的执行速度较慢,这极大地限制了其实用性。本文在前人的研究基础上对算法进行更深的优化和改进。首先在VS2012开发环境下利用数字图像处理技术对原算法进行原理上的改进,再利用GPU流处理器数量众多的优势以及强大的多线程并发执行能力对Canny算法进行并行加速。在500 pixel×500 pixel的图片上,对本文算法和原Canny算法进行了实验验证。实验结果表明,在4 096 pixel×4 096 pixel大小的图片上采用本文的GPU移植算法处理后,执行速度从80 ms降到了6 ms以内。在不影响边缘检测效果的前提下极大地提高了算法的实用性。 展开更多
关键词 边缘检测 gpu 并行处理 连通域提取
在线阅读 下载PDF
GPU并行计算加速的实时可视外壳三维重建及其虚实交互 被引量:13
19
作者 邵绪强 聂霄 王保义 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2017年第1期52-61,共10页
针对现有的基于图像的三维重建方法难以实现真实物体的快速三维重建,无法满足虚实交互等应用需求的问题,提出一种基于GPU并行计算的实时三维重建及其虚实交互方法.首先把物体所在空间剖分成具有数据独立性的体素集合,结合可视外壳重建... 针对现有的基于图像的三维重建方法难以实现真实物体的快速三维重建,无法满足虚实交互等应用需求的问题,提出一种基于GPU并行计算的实时三维重建及其虚实交互方法.首先把物体所在空间剖分成具有数据独立性的体素集合,结合可视外壳重建算法和精确行进立方体算法并行遍历每个体素得到体素状态序列;然后并行压缩体素状态序列得到非空体素集合,对非空体素进行并行三角形网格化,并利用图形硬件的多重纹理映射和可编程功能进行基于像素的纹理映射;最后假定虚拟物体的粒子为运动受限的拉格朗日流体粒子,重建物体网格顶点为流体边界,通过流体动力学方程的并行光滑粒子动力学方法求解来计算虚实交互.实验结果表明,该方法在GPU上进行完全并行求解,在32×32×32的空间剖分精度下,实现了实时三维重建和20帧/s左右的虚实交互计算,适用于计算机图形学和虚拟现实等领域中的虚实交互应用. 展开更多
关键词 可视外壳 三维重建 gpu并行计算 虚实交互 实时模拟
在线阅读 下载PDF
基于GPU加速求解MINLP问题的SQP并行算法 被引量:5
20
作者 康丽霞 张燕蓉 +1 位作者 唐亚哲 刘永忠 《化工学报》 EI CAS CSCD 北大核心 2012年第11期3597-3601,共5页
针对确定性算法求解大型复杂混合整数非线性规划的时间不可接受问题,通过对序贯二次规划算法(SQP)和图形处理器(GPU)的架构特点分析,提出了基于GPU加速策略的并行化SQP算法。算法的主要思想是通过枚举法确定二元变量的取值,在保证取值... 针对确定性算法求解大型复杂混合整数非线性规划的时间不可接受问题,通过对序贯二次规划算法(SQP)和图形处理器(GPU)的架构特点分析,提出了基于GPU加速策略的并行化SQP算法。算法的主要思想是通过枚举法确定二元变量的取值,在保证取值完整的基础上,使用CPU+GPU的并行策略,同时运用大量线程进行非线性规划子问题的求解。算例的数值实验结果表明:本文所提出的算法较之传统串行计算具有较好的加速效果,特别适合求解二元变量较多,约束条件相对少的MINLP问题。 展开更多
关键词 混合整数非线性规划 gpu 序贯二次规划法 加速
在线阅读 下载PDF
上一页 1 2 41 下一页 到第
使用帮助 返回顶部