期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于GPU的地下管线三维可视化建模研究 被引量:4
1
作者 刘浩 赵文吉 +2 位作者 段福洲 曹巍 潘李亮 《计算机工程与应用》 CSCD 2013年第18期145-148,共4页
地下管线的三维建模与可视化是构建"数字城市"的重要内容,总结现有地下管线实时建模算法的不足,提出一种利用GPU编程实现的地下管线实时三维可视化建模算法。利用现代GPU的可编程特性将管线建模的计算任务全部移植到GPU端完成... 地下管线的三维建模与可视化是构建"数字城市"的重要内容,总结现有地下管线实时建模算法的不足,提出一种利用GPU编程实现的地下管线实时三维可视化建模算法。利用现代GPU的可编程特性将管线建模的计算任务全部移植到GPU端完成,CPU端只需传入管径和管线节点坐标,利用GPU提供的几何着色器完成管线模型的顶点坐标计算、管线顶点数据自动生成及管线三角网构建等工作,并通过光照和纹理映射实现管线材质的真实感效果。实验结果表明,该算法克服了现有建模算法的缺陷,能够在保证管线拟合逼真度的基础上完成大规模管网系统三维实时可视化建模的任务。 展开更多
关键词 地下管线 三维建模 图形处理器(GPU) 几何着色器
在线阅读 下载PDF
CPU-GPU混合平台上动态场景光线跟踪的研究 被引量:5
2
作者 张健 焦良葆 陈瑞 《计算机工程与应用》 CSCD 2012年第21期151-154,159,共5页
提出了一种动态场景光线跟踪新方法,能有效地调度CPU和GPU的运行,提高渲染速度。根据加速结构kd-tree的特点,将其分成上层部分和下层部分,上层部分由于并行性较小,由CPU创建;而下层部分并行性较大,由GPU创建,提高动态场景加速结构的创... 提出了一种动态场景光线跟踪新方法,能有效地调度CPU和GPU的运行,提高渲染速度。根据加速结构kd-tree的特点,将其分成上层部分和下层部分,上层部分由于并行性较小,由CPU创建;而下层部分并行性较大,由GPU创建,提高动态场景加速结构的创建速度。同时充分利用CPU和GPU两个运算平台的特点,有效调度两者的运行,隐藏部分运算时间,进一步提高动态场景的渲染速度。实验结果表明,在安装了GeForce285GTX的PC机上,高真实感地交互渲染了包含11k三角面片的Kitchen动态场景。 展开更多
关键词 光线跟踪 KD-TREE 图形处理器(GPU) CPU
在线阅读 下载PDF
基于GPU的动态地形实时可视化 被引量:3
3
作者 王冬 张豫南 +1 位作者 李瀚飞 田鹏 《计算机工程与应用》 CSCD 北大核心 2010年第14期173-175,共3页
针对动态地形中车辙实时可视化的要求,利用OpenGL帧缓冲区对象(framebuffer object)和顶点纹理拾取(vertex texture fetch)功能,提出了一种基于GPU的动态地形可视化算法。首先利用高程图(heightmap)直接产生初始的地形深度纹理,然后通... 针对动态地形中车辙实时可视化的要求,利用OpenGL帧缓冲区对象(framebuffer object)和顶点纹理拾取(vertex texture fetch)功能,提出了一种基于GPU的动态地形可视化算法。首先利用高程图(heightmap)直接产生初始的地形深度纹理,然后通过配置渲染状态生成车辆深度纹理,接着生成表示地表顶点下陷位移的地形深度偏移纹理,最后利用顶点纹理拾取实现了连续更新的车辙效果。给出了完整的动态地形可视化算法,最后通过实验证明该方法是可行的、有效的。 展开更多
关键词 动态地形 图形处理器 顶点纹理拾取 帧缓冲区对象
在线阅读 下载PDF
GPU加速希尔加解密方法的研究 被引量:3
4
作者 刘丹 赵广辉 钟珞 《计算机工程与应用》 CSCD 北大核心 2010年第18期49-51,共3页
GPU有效地利用了数量巨大的晶体管制造大量的处理单元,适用于处理单任务多数据(SIMD)的计算任务。研究了GPU的体系结构及CUDA的编程模式,改进了基于CPU的希尔加解密方法,使用多个线程将计算中耗时的矩阵相乘部分改造成SIMD模式,并分析... GPU有效地利用了数量巨大的晶体管制造大量的处理单元,适用于处理单任务多数据(SIMD)的计算任务。研究了GPU的体系结构及CUDA的编程模式,改进了基于CPU的希尔加解密方法,使用多个线程将计算中耗时的矩阵相乘部分改造成SIMD模式,并分析了线程块内线程数对加速比的影响。实验结果表明,基于GPU的并行矩阵相乘的希尔加解密方法成功实现了硬件加速,相对于CPU上运行的希尔加解密方法,其执行效率明显提高,可获取12倍以上的加速,并易于扩展,对大规模数据加密和解密处理呈现出高效的处理能力。 展开更多
关键词 统一计算设备架构 图形处理单元 希尔加密 希尔解密
在线阅读 下载PDF
基于CUDA的2D-3D配准技术的研究 被引量:4
5
作者 徐建 秦安 +1 位作者 卜祥磊 冯前进 《计算机工程与应用》 CSCD 北大核心 2010年第11期56-59,共4页
Nvidia从GeForce8系列开始,在显卡上推出统一计算设备框架技术,使GPU的通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。在医学图像分析中... Nvidia从GeForce8系列开始,在显卡上推出统一计算设备框架技术,使GPU的通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。在医学图像分析中,图像配准通常是一个耗时的过程,不利于临床应用,为了加速医学图像的2D-3D配准过程,研究了CUDA的设计思想和编程方式,提出了一种基于CUDA并行编程模型的加速配准新技术,在构建的虚拟X线摄像系统下,采用并行计算的方式快速生成高质量DRR图像,以对应像素的灰度值残差作为相似性测度,使用Powell优化方法寻找最优变换。实验结果表明,该技术既很好地保持了配准精度,同时又大大提高了配准速度,加速比达到了十几甚至几十倍。 展开更多
关键词 医学图像 2D-3D图像配准 数字影像重建 图形处理器 统一计算设备架构 虚拟X线摄像系统
在线阅读 下载PDF
一种云场景的实时渲染方法 被引量:2
6
作者 葛亮 姜晓峰 倪小军 《计算机工程与应用》 CSCD 北大核心 2011年第11期167-170,共4页
探讨了真实感云场景的模拟技术,设计了一种云场景的实时渲染方法。基于Perlin噪声建模生成云浓度图,并采用考虑浓度的Phong光照模型与单向散射光照模型,分别计算反射光和透射光,改善了传统方法无法真实反映不同角度太阳光照的问题,实现... 探讨了真实感云场景的模拟技术,设计了一种云场景的实时渲染方法。基于Perlin噪声建模生成云浓度图,并采用考虑浓度的Phong光照模型与单向散射光照模型,分别计算反射光和透射光,改善了传统方法无法真实反映不同角度太阳光照的问题,实现了不同时段动态云场景的绘制。通过引入基于GPU的Bumping纹理算法与Render-to-Texture技术,极大提高了云场景的渲染速度。实验结果进一步表明该方法能够同时满足真实感与实时性两个方面的要求。 展开更多
关键词 云场景 PERLIN噪声 三线性插值 图形处理器(GPU) Bumping纹理 单向散射
在线阅读 下载PDF
gAC:基于GPU的高性能AC算法 被引量:2
7
作者 陈虎 彭江锋 施少怀 《计算机工程与应用》 CSCD 2012年第12期43-48,共6页
字符串匹配是计算科学中研究最广泛的问题之一,已成为信息检索和生物计算等领域的核心操作。然而受限于CPU的计算能力和存储器访问带宽,传统的串行字符串匹配算法难以进一步提升性能。GPU在计算能力和存储器访问带宽上有很大提升,已经... 字符串匹配是计算科学中研究最广泛的问题之一,已成为信息检索和生物计算等领域的核心操作。然而受限于CPU的计算能力和存储器访问带宽,传统的串行字符串匹配算法难以进一步提升性能。GPU在计算能力和存储器访问带宽上有很大提升,已经在很多应用上取得了卓越成效。gAC作为一种基于GPU的并行AC算法,针对GPU的SIMT(Single-Instruction Multiple-Thread)以及合并存储器访问的技术特点,采取了减少条件分支、合并访问全局存储器等优化方法,使得在C1060GPU上的字符串扫描速度达到51Gb/s,比基于CPU的串行算法提升了28倍。 展开更多
关键词 图形处理器(GPU) 计算统一设备框架(CUDA) 多字符串匹配 并行计算 AC算法
在线阅读 下载PDF
小型水域水面涟漪的模拟方法 被引量:1
8
作者 卢维亮 程甜甜 +1 位作者 何伟 李云飞 《计算机工程与应用》 CSCD 北大核心 2010年第19期193-195,199,共4页
以实际项目为研究背景,提出了一种小型水域水面涟漪模拟方法。将Johanson的投影网格法用于水面建模,采用二维波动方程描述水波运动,运用显式有限差分法和可编程GPU技术实现方程求解;并采用适当的渲染算法,比较真实地模拟了雨滴落入水面... 以实际项目为研究背景,提出了一种小型水域水面涟漪模拟方法。将Johanson的投影网格法用于水面建模,采用二维波动方程描述水波运动,运用显式有限差分法和可编程GPU技术实现方程求解;并采用适当的渲染算法,比较真实地模拟了雨滴落入水面后水面波动的现象,在网格为256×256,图像大小为1024×768的情况下,刷新频率达到了85帧以上,满足了实时性的要求。 展开更多
关键词 虚拟现实 Johanson投影网格 二维波动方程 图形处理器
在线阅读 下载PDF
基于GPU的并行协同差分进化算法研究 被引量:5
9
作者 刘剑英 《计算机工程与应用》 CSCD 2012年第7期48-50,123,共4页
针对大规模高维数复杂非线性函数优化的问题,提出一种新的基于GPU的协同差分进化算法。该方法将协同进化的思想引入启发式差分进化算法,随机分解大规模计算问题,利用GPU处理数据的并行性,同步计算分解后的子问题,加快算法的精度和收敛... 针对大规模高维数复杂非线性函数优化的问题,提出一种新的基于GPU的协同差分进化算法。该方法将协同进化的思想引入启发式差分进化算法,随机分解大规模计算问题,利用GPU处理数据的并行性,同步计算分解后的子问题,加快算法的精度和收敛速度。实验对比结果表明,所提出的基于GPU的协同差分进化算法对大规模非线性函数优化具有更高的精度和效率。 展开更多
关键词 并行计算 协同进化 差分进化 图形图像处理单元
在线阅读 下载PDF
GPU加速的光滑轮廓线绘制 被引量:1
10
作者 方建文 于金辉 《计算机工程与应用》 CSCD 北大核心 2011年第11期1-2,14,共3页
轮廓线的高效提取是非真实感绘制的一个关键问题。提出了一个完全利用GPU生成光滑轮廓线的高效算法。在几何处理阶段,先根据相邻三角形的法向量与视向量的关系检测出轮廓线,然后对轮廓线进行宽度扩充,同时对轮廓线顶点设置相应的渐变因... 轮廓线的高效提取是非真实感绘制的一个关键问题。提出了一个完全利用GPU生成光滑轮廓线的高效算法。在几何处理阶段,先根据相邻三角形的法向量与视向量的关系检测出轮廓线,然后对轮廓线进行宽度扩充,同时对轮廓线顶点设置相应的渐变因子;在像素处理阶段把渐变因子转化为相应的alpha值,通过光照生成卡通渲染,最后通过alpha混合得到光滑轮廓线。算法完全在GPU里实现,能满足实时的绘制要求。 展开更多
关键词 图形处理器 卡通风格 实时绘制
在线阅读 下载PDF
遥感图像渐进式传输的GPU并行加速研究
11
作者 杨靖宇 刘昭华 张永生 《计算机工程与应用》 CSCD 北大核心 2010年第15期185-187,共3页
遥感图像的渐进式传输大大提高了数据响应效率,但同时也增加了数据接收端的计算量。为进一步提高数据传输效率,研究了基于可编程图形硬件GPU的并行加速方法,通过小波逆变换的GPU并行化来加速图像重构,并通过纹理查找表来提高数据读取效... 遥感图像的渐进式传输大大提高了数据响应效率,但同时也增加了数据接收端的计算量。为进一步提高数据传输效率,研究了基于可编程图形硬件GPU的并行加速方法,通过小波逆变换的GPU并行化来加速图像重构,并通过纹理查找表来提高数据读取效率,利用离线渲染缓存Pbuffer来保存多层小波变换的中间计算结果,进一步提高了并行效率。最后,通过实验验证了该方法的有效性。 展开更多
关键词 渐进式传输 并行加速 离散小波变换 图形处理器
在线阅读 下载PDF
图形处理器通用计算的实现与验证 被引量:3
12
作者 齐记 杨孔庆 杨磊 《计算机工程与应用》 CSCD 北大核心 2009年第33期67-69,共3页
讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提... 讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提供了可能。 展开更多
关键词 图形处理器(GPU) 图形处理器通用计算技术(GPGPU) 中央处理器(CPU)
在线阅读 下载PDF
高质量的三维纹理硬件体绘制 被引量:2
13
作者 胡慧君 费耀平 李敏 《计算机工程与应用》 CSCD 北大核心 2010年第17期188-190,235,共4页
与光线投射法相比,传统的3D纹理体绘制算法通常难以产生高质量的图像。为了增强渲染图像的真实感与质量,在基于GPU(Graphics Processing Unit)的三维纹理体绘制过程中以交互的速率实现了体阴影效果,并考虑现实图像合成中的可视化感知,... 与光线投射法相比,传统的3D纹理体绘制算法通常难以产生高质量的图像。为了增强渲染图像的真实感与质量,在基于GPU(Graphics Processing Unit)的三维纹理体绘制过程中以交互的速率实现了体阴影效果,并考虑现实图像合成中的可视化感知,提出将基于GPU的高动态范围色调映射技术应用到体绘制得到的结果图片中。最后对一些体数据集进行绘制,实验表明这些技术较好地解决了传统纹理绘制方法的缺点,提高了图像的质量。 展开更多
关键词 三维纹理 图形处理器 体阴影 色调映射
在线阅读 下载PDF
NTRU加解密算法的GPU实现研究 被引量:1
14
作者 朱瑶 严承华 李强 《计算机工程与应用》 CSCD 北大核心 2011年第34期81-85,共5页
GPU拥有高度并行性和可编码的特点,在大规模数据并行计算方面得到广泛应用。NTRU算法是一种安全性高,易于并行化的公钥密码算法。研究了NTRU算法基于CUDA的并行化实现技术,将计算中最耗时的卷积运算分解到多个线程并行计算,引入大量的... GPU拥有高度并行性和可编码的特点,在大规模数据并行计算方面得到广泛应用。NTRU算法是一种安全性高,易于并行化的公钥密码算法。研究了NTRU算法基于CUDA的并行化实现技术,将计算中最耗时的卷积运算分解到多个线程并行计算,引入大量的独立并发的加解密线程块来完成整个加解密过程,并给出了具体的数据编码及存储结构、线程组织以及基于合并访问和共享内存的性能优化技术。实验结果表明,基于CUDA的NTRU加解密算法实现了硬件加速,相对于NTRU算法在CPU的实现,CUDA实现能够达到12.38MB/s的吞吐量,可获得最大为95倍的加速比。 展开更多
关键词 统一计算设备架构 图形处理单元 NTRU算法 并行
在线阅读 下载PDF
基于GPU的RFT算法并行化 被引量:5
15
作者 商哲然 谭贤四 +2 位作者 曲智国 王红 丰骁 《雷达科学与技术》 北大核心 2016年第5期505-509,516,共6页
RFT(Radon-Fourier Transform)是一种广义的MTD算法,可沿着目标径向运动轨迹进行相参积累。然而对距离-速度二维搜索产生的巨大计算量使得其难以快速实现和工程化。针对这个问题,根据雷达信号的回波数据结构和RFT算法思路,提出一种基于... RFT(Radon-Fourier Transform)是一种广义的MTD算法,可沿着目标径向运动轨迹进行相参积累。然而对距离-速度二维搜索产生的巨大计算量使得其难以快速实现和工程化。针对这个问题,根据雷达信号的回波数据结构和RFT算法思路,提出一种基于GPU的RFT并行化算法。通过实验,GPU平台实现的RFT算法与标准RFT和快速RFT相比,获得了巨大的加速比。另外,通过对比在CPU平台执行的MTD算法,得到在GPU平台上的RFT计算结果在不需要传回主机内存的条件下,计算速度快于在CPU平台上MTD算法。 展开更多
关键词 拉东傅里叶变换 并行化 图形处理器 通用并行计算架构
在线阅读 下载PDF
基于GPU的高速网络入侵检测系统设计 被引量:1
16
作者 卢永菁 王东 《计算机工程与应用》 CSCD 北大核心 2011年第33期78-81,共4页
随着网络带宽的不断增加,以及处理能力的限制,传统的网络入侵检测系统(Network Intrusion Detecting System,NIDS)面临挑战,如何提高NIDS的处理能力备受关注。通过专用设备提高检测速度,不但价格昂贵且无法大规模普及。通过对Linux网络... 随着网络带宽的不断增加,以及处理能力的限制,传统的网络入侵检测系统(Network Intrusion Detecting System,NIDS)面临挑战,如何提高NIDS的处理能力备受关注。通过专用设备提高检测速度,不但价格昂贵且无法大规模普及。通过对Linux网络协议栈的优化,以及常用入侵检测系统Snort的多线程化,结合了图形处理器(Graphic Processing Unit,GPU)的高性能并行计算能力,设计了一种高性能的软件入侵检测架构,突破现有NIDS使用普通CPU的计算瓶颈,以应对高速链路对入侵检测性能的要求。实验结果表明,高速网络中的数据包可以采用GPU来处理。 展开更多
关键词 网络入侵检测系统(NIDS) 图形处理器(GPU) SNORT 并行计算
在线阅读 下载PDF
基于GPU加速的锥束CT重建算法研究 被引量:3
17
作者 张宾 张正强 王洪凯 《计算机工程与应用》 CSCD 北大核心 2019年第4期208-213,共6页
锥束计算机断层扫描(Cone-Beam Computed Tomography,CBCT)具有采集速度快和空间分辨率高等特点,被生物医学等领域广泛关注。然而通过CPU串行处理CBCT重建中海量投影数据非常耗时,难以满足实时性的需求。GPU的发展为CBCT重建的并行加速... 锥束计算机断层扫描(Cone-Beam Computed Tomography,CBCT)具有采集速度快和空间分辨率高等特点,被生物医学等领域广泛关注。然而通过CPU串行处理CBCT重建中海量投影数据非常耗时,难以满足实时性的需求。GPU的发展为CBCT重建的并行加速提供了条件。根据三角函数周期性的特点对FDK算法进行了改进,并利用GPU实现了12幅投影数据同时并行计算。实验结果表明,相比于传统基于CPU的重建算法,基于GPU的CBCT重建算法在保证图像质量的前提下,将重建速度提高了超过310倍。 展开更多
关键词 锥束CT FDK算法 图形处理单元(GPU)
在线阅读 下载PDF
利用GPU加速基于稀疏网格的SSTA
18
作者 叶晓敏 周学功 +1 位作者 曹伟 王伶俐 《计算机工程与应用》 CSCD 北大核心 2011年第27期60-64,73,共6页
提出一种利用图形处理单元(Graphics Processing Unit,GPU)加速统计静态时序分析的方法,利用稀疏网格减少统计静态时序分析中时序图各节点的配置个数,在GPU上构建复杂的时序图数据结构后并行计算各节点的不同配置,达到加速统计静态时序... 提出一种利用图形处理单元(Graphics Processing Unit,GPU)加速统计静态时序分析的方法,利用稀疏网格减少统计静态时序分析中时序图各节点的配置个数,在GPU上构建复杂的时序图数据结构后并行计算各节点的不同配置,达到加速统计静态时序分析的目的。测试结果表明,提出的方法能够在不损失精度的前提下,将统计静态时序分析运行速度平均提高300倍以上。随着现代集成电路规模的持续增大和集成电路工艺的不断发展,这种新型快速的统计静态时序方法能够有效提高时序分析的速度和效率。 展开更多
关键词 图形处理单元 稀疏网格 统计静态时序分析
在线阅读 下载PDF
采用重要性面片采样的实时全局光照
19
作者 柴学梁 吴向阳 +1 位作者 王毅刚 戴大蒙 《计算机工程与应用》 CSCD 北大核心 2010年第2期174-176,217,共4页
提出了一种实时全局光照的计算方法。该方法支持任意视点下动态光源的一次间接光照计算,并且物体表面材质可实时编辑,该算法预计算了各面片上的形状因子来解决遮挡问题,并记录形状因子较大的重要性面片作为间接光源。渲染时先从光源方... 提出了一种实时全局光照的计算方法。该方法支持任意视点下动态光源的一次间接光照计算,并且物体表面材质可实时编辑,该算法预计算了各面片上的形状因子来解决遮挡问题,并记录形状因子较大的重要性面片作为间接光源。渲染时先从光源方向对场景记录了一个扩展的阴影图,包含了光源照射到的面片ID和其光通量,再根据采样好的间接光源来计算间接光照。使用CUDA,整个光照计算过程在GPU中完成,可以对静态场景进行实时渲染,并能达到逼真的渲染效果。 展开更多
关键词 重要性面片采样 全局光照 遮挡 图形处理器 统一计算架构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部