期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
图形处理器(GPU)加速时域有限元的二维辐射计算 被引量:5
1
作者 刘昆 王晓斌 廖成 《电波科学学报》 EI CSCD 北大核心 2008年第1期111-114,共4页
时域有限元方法是在电磁场与微波工程领域广泛应用的方法之一。然而,时域有限元在大型机上运行时都是相当缓慢的。对时域有限元计算的硬件加速的研究已经开始进行。与同一代技术的CPU比较,目前一般用户的图形加速卡(GPU)对时域有限元的... 时域有限元方法是在电磁场与微波工程领域广泛应用的方法之一。然而,时域有限元在大型机上运行时都是相当缓慢的。对时域有限元计算的硬件加速的研究已经开始进行。与同一代技术的CPU比较,目前一般用户的图形加速卡(GPU)对时域有限元的加速可以达到CPU的近4倍左右。以OpenGL作为应用编程接口(API),使用一个标准的商业图形卡编程解决二维时域有限元的辐射问题。 展开更多
关键词 图形加速卡(GPU) 时域有限元(TD-FEM) 通用计算图形处理单元 (GPGPU)
在线阅读 下载PDF
星载ScanSAR成像处理技术研究 被引量:1
2
作者 陈仁元 雍延梅 +1 位作者 孙晓晖 钟雪莲 《雷达科学与技术》 2013年第2期136-140,共5页
由于天线在不同的子带进行扫描,星载扫描模式不能像条带模式那样,获得连续的方位向相位历史,利用条带模式高精度处理算法(如距离-多普勒算法)处理ScanSAR数据,通过在脉冲扫描间隔中填零,把扫描数据看成中间填零的相干脉冲串序列,等效成... 由于天线在不同的子带进行扫描,星载扫描模式不能像条带模式那样,获得连续的方位向相位历史,利用条带模式高精度处理算法(如距离-多普勒算法)处理ScanSAR数据,通过在脉冲扫描间隔中填零,把扫描数据看成中间填零的相干脉冲串序列,等效成条带SAR数据,利用条带模式的处理算法进行成像。针对填零后的数据,数据量大,可以采用基于通用图形处理单元的并行处理技术,加快处理速度。对填零处理形成的栅瓣调制,通过滤波进行消除。这样处理的图像和条带模式的图像具有相同的辐射和几何分布特性,有效抑制扇贝效应带来的影响。对实测星载ScanSAR数据进行成像处理,试验结果表明该方法的有效性。 展开更多
关键词 扫描模式 处理算法 通用图形处理单元 栅瓣调制
在线阅读 下载PDF
GPU通用计算在LBM方法中的应用 被引量:1
3
作者 王凯 封卫兵 晁媛 《计算机工程与设计》 CSCD 北大核心 2009年第19期4513-4515,4535,共4页
提出了一种结合GPU通用计算与计算流体力学中的LBM算法来模拟二维流场的方法。根据GPU通用计算和LBM方法的基本原理,利用OpenGL的离屏渲染技术FBO和Cg语言,基于LBM方法中的D2Q9模型对二维方腔流进行数值模拟,并设计出基于OpenGL的GPU通... 提出了一种结合GPU通用计算与计算流体力学中的LBM算法来模拟二维流场的方法。根据GPU通用计算和LBM方法的基本原理,利用OpenGL的离屏渲染技术FBO和Cg语言,基于LBM方法中的D2Q9模型对二维方腔流进行数值模拟,并设计出基于OpenGL的GPU通用计算的二维流场数值计算框架。实验结果表明,利用GPU模拟与CPU模拟流场的数值结果相当吻合,特别地,利用GPU进行数值模拟实验的速度是利用CPU的4倍左右。 展开更多
关键词 图形处理单元 图形处理单元通用计算 格子波尔兹曼方法 OPENGL 帧缓冲对象
在线阅读 下载PDF
面向GPU的循环合并 被引量:1
4
作者 杨扬 崔慧敏 冯晓兵 《高技术通讯》 CAS CSCD 北大核心 2013年第3期257-262,共6页
针对现有的将C或Fortran程序映射到通用图形处理单元(GPU)的自动转换工具主要关注将单个循环生成一个独立的GPU内核,从而阻碍了对循环间数据重用的利用的问题,提出一种新的面向GPU的循环合并的代码变换方法,该方法通过循环分块(strip mi... 针对现有的将C或Fortran程序映射到通用图形处理单元(GPU)的自动转换工具主要关注将单个循环生成一个独立的GPU内核,从而阻碍了对循环间数据重用的利用的问题,提出一种新的面向GPU的循环合并的代码变换方法,该方法通过循环分块(strip mining)和冗余计算等手段达到消除迭代间数据依赖的目的,并可充分利用GPU片上的共享内存进行线程间数据交换,从而将此类程序高效地映射到GPU上。通过典型程序在GPU上的实验表明,该新方法由于能够减少对全局内存的访问,带来了最多高达1.96倍的加速比。 展开更多
关键词 通用图形处理单元(GPU) 循环合并 并行 CUDA 循环间数据重用
在线阅读 下载PDF
大规模稀疏矩阵的主特征向量计算优化方法 被引量:3
5
作者 王伟 陈建平 +2 位作者 曾国荪 俞莉花 谭一鸣 《计算机科学与探索》 CSCD 2012年第2期118-124,共7页
矩阵主特征向量(principal eigenvectors computing,PEC)的求解是科学与工程计算中的一个重要问题。随着图形处理单元通用计算(general-purpose computing on graphics pro cessing unit,GPGPU)的兴起,利用GPU来优化大规模稀疏矩阵的图... 矩阵主特征向量(principal eigenvectors computing,PEC)的求解是科学与工程计算中的一个重要问题。随着图形处理单元通用计算(general-purpose computing on graphics pro cessing unit,GPGPU)的兴起,利用GPU来优化大规模稀疏矩阵的图形处理单元求解得到了广泛关注。分别从应用特征和GPU体系结构特征两方面分析了PEC运算的性能瓶颈,提出了一种面向GPU的稀疏矩阵存储格式——GPU-ELL和一个针对GPU的线程优化映射策略,并设计了相应的PEC优化执行算法。在ATI HD Radeon5850上的实验结果表明,相对于传统CPU,该方案获得了最多200倍左右的加速,相对于已有GPU上的实现,也获得了2倍的加速。 展开更多
关键词 图形处理单元通用计算(GPGPU) 主特征向量计算 稀疏矩阵向量乘 线程优化
在线阅读 下载PDF
基于GPU加速的binLBT压缩解压算法 被引量:3
6
作者 于卓 梁晓辉 +1 位作者 马上 沈旭昆 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2010年第3期368-372,共5页
地形数据的压缩/解压是大规模地形实时绘制方法的关键步骤,与绘制效率密切相关.通过对压缩/解压方法核心重叠双正交变换的分析,采用重叠双正交变换的整数提升方法将变换中的浮点数操作转换为整数操作及移位操作.使用支持图形处理单元(GP... 地形数据的压缩/解压是大规模地形实时绘制方法的关键步骤,与绘制效率密切相关.通过对压缩/解压方法核心重叠双正交变换的分析,采用重叠双正交变换的整数提升方法将变换中的浮点数操作转换为整数操作及移位操作.使用支持图形处理单元(GPU,Graphic Processing Unit)通用计算的CUDA(Compute Unified Device Architecture)对变换过程及编码过程进行加速.针对数据超出显存容量的情况,采取数据分块的方法将数据分别载入显存进行变换与编码以完成对整体数据的处理.实验结果表明,基于GPU加速的重叠双正交变换整数提升方法的压缩算法有效提高了地形数据处理的效率,并加快了大规模地形绘制速度. 展开更多
关键词 重叠双正交变换整数提升 压缩/解压 大规模地形实时绘制 图形处理单元通用计算
在线阅读 下载PDF
GSim:支持GPU加速软件过程仿真框架
7
作者 张备 翟健 杨秋松 《计算机工程与设计》 CSCD 北大核心 2012年第2期754-759,820,共7页
为了提高软件过程仿真的效率,提出了一种基于图形处理单元(graphic processing unit,GPU)加速的仿真框架。该框架利用图形化语言和随机参数来描述一个过程模型,将模型转换为RansomSpec字节码从而可以在GPU平台上运行,以期借助GPU平台的... 为了提高软件过程仿真的效率,提出了一种基于图形处理单元(graphic processing unit,GPU)加速的仿真框架。该框架利用图形化语言和随机参数来描述一个过程模型,将模型转换为RansomSpec字节码从而可以在GPU平台上运行,以期借助GPU平台的高并行特性提高原有仿真算法的效率。实验结果表明,通过这种框架,基于GPU的随机软件过程仿真与传统基于CPU串行的仿真算法相比在效率上提高一个数量级。 展开更多
关键词 软件过程仿真 基于图形处理单元通用目的计算 计算统一的设备架构 中间语言
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部