-
题名基于GPU的地下管线三维可视化建模研究
被引量:4
- 1
-
-
作者
刘浩
赵文吉
段福洲
曹巍
潘李亮
-
机构
首都师范大学资源环境与旅游学院
北京市城市环境过程与数字模拟重点实验室
三维信息获取与应用教育部重点实验室
中国科学院地理科学与资源研究所
北京合歌科技有限公司
-
出处
《计算机工程与应用》
CSCD
2013年第18期145-148,共4页
-
基金
国家自然科学基金(No.41001300)
国家高技术研究发展计划(863)(No.2008AA121301)
科技支撑计划(No.2008BAK49B00)
-
文摘
地下管线的三维建模与可视化是构建"数字城市"的重要内容,总结现有地下管线实时建模算法的不足,提出一种利用GPU编程实现的地下管线实时三维可视化建模算法。利用现代GPU的可编程特性将管线建模的计算任务全部移植到GPU端完成,CPU端只需传入管径和管线节点坐标,利用GPU提供的几何着色器完成管线模型的顶点坐标计算、管线顶点数据自动生成及管线三角网构建等工作,并通过光照和纹理映射实现管线材质的真实感效果。实验结果表明,该算法克服了现有建模算法的缺陷,能够在保证管线拟合逼真度的基础上完成大规模管网系统三维实时可视化建模的任务。
-
关键词
地下管线
三维建模
图形处理器(GPU)
几何着色器
-
Keywords
underground pipeline
3D modeling
graphic processing uni(tgpu)
Geometry Shader
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-
-
题名CPU-GPU混合平台上动态场景光线跟踪的研究
被引量:5
- 2
-
-
作者
张健
焦良葆
陈瑞
-
机构
南京工程学院通信工程学院
-
出处
《计算机工程与应用》
CSCD
2012年第21期151-154,159,共5页
-
基金
江苏省自然科学基金(No.BK2009351)
-
文摘
提出了一种动态场景光线跟踪新方法,能有效地调度CPU和GPU的运行,提高渲染速度。根据加速结构kd-tree的特点,将其分成上层部分和下层部分,上层部分由于并行性较小,由CPU创建;而下层部分并行性较大,由GPU创建,提高动态场景加速结构的创建速度。同时充分利用CPU和GPU两个运算平台的特点,有效调度两者的运行,隐藏部分运算时间,进一步提高动态场景的渲染速度。实验结果表明,在安装了GeForce285GTX的PC机上,高真实感地交互渲染了包含11k三角面片的Kitchen动态场景。
-
关键词
光线跟踪
KD-TREE
图形处理器(GPU)
CPU
-
Keywords
ray tracing
kd-tree
graphics processing uni(tgpu)
CPU
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于GPU的动态地形实时可视化
被引量:3
- 3
-
-
作者
王冬
张豫南
李瀚飞
田鹏
-
机构
装甲兵工程学院控制工程系
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第14期173-175,共3页
-
基金
国家部委预研基金资助项目~~
-
文摘
针对动态地形中车辙实时可视化的要求,利用OpenGL帧缓冲区对象(framebuffer object)和顶点纹理拾取(vertex texture fetch)功能,提出了一种基于GPU的动态地形可视化算法。首先利用高程图(heightmap)直接产生初始的地形深度纹理,然后通过配置渲染状态生成车辆深度纹理,接着生成表示地表顶点下陷位移的地形深度偏移纹理,最后利用顶点纹理拾取实现了连续更新的车辙效果。给出了完整的动态地形可视化算法,最后通过实验证明该方法是可行的、有效的。
-
关键词
动态地形
图形处理器
顶点纹理拾取
帧缓冲区对象
-
Keywords
dynamic terrain
graphic processing uni(tgpu)
vertex texture fetch
framebuffer object
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-
-
题名GPU加速希尔加解密方法的研究
被引量:3
- 4
-
-
作者
刘丹
赵广辉
钟珞
-
机构
武汉理工大学计算机科学技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第18期49-51,共3页
-
基金
教育部高校行动计划智能科学与技术No.2004XD-03~~
-
文摘
GPU有效地利用了数量巨大的晶体管制造大量的处理单元,适用于处理单任务多数据(SIMD)的计算任务。研究了GPU的体系结构及CUDA的编程模式,改进了基于CPU的希尔加解密方法,使用多个线程将计算中耗时的矩阵相乘部分改造成SIMD模式,并分析了线程块内线程数对加速比的影响。实验结果表明,基于GPU的并行矩阵相乘的希尔加解密方法成功实现了硬件加速,相对于CPU上运行的希尔加解密方法,其执行效率明显提高,可获取12倍以上的加速,并易于扩展,对大规模数据加密和解密处理呈现出高效的处理能力。
-
关键词
统一计算设备架构
图形处理单元
希尔加密
希尔解密
-
Keywords
Compute unified Device Architecture(CUDA)
graphic processing uni(tgpu)
Hill encryption
Hill decryption
-
分类号
TP309.7
[自动化与计算机技术—计算机系统结构]
-
-
题名基于CUDA的2D-3D配准技术的研究
被引量:4
- 5
-
-
作者
徐建
秦安
卜祥磊
冯前进
-
机构
南方医科大学生物医学工程学院
南方医院放疗科
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第11期56-59,共4页
-
基金
广东省产学研项目No.cgzhzd0717
Production and Research Projects in Guangdong Province under Grant No.cgzhzd0717
-
文摘
Nvidia从GeForce8系列开始,在显卡上推出统一计算设备框架技术,使GPU的通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。在医学图像分析中,图像配准通常是一个耗时的过程,不利于临床应用,为了加速医学图像的2D-3D配准过程,研究了CUDA的设计思想和编程方式,提出了一种基于CUDA并行编程模型的加速配准新技术,在构建的虚拟X线摄像系统下,采用并行计算的方式快速生成高质量DRR图像,以对应像素的灰度值残差作为相似性测度,使用Powell优化方法寻找最优变换。实验结果表明,该技术既很好地保持了配准精度,同时又大大提高了配准速度,加速比达到了十几甚至几十倍。
-
关键词
医学图像
2D-3D图像配准
数字影像重建
图形处理器
统一计算设备架构
虚拟X线摄像系统
-
Keywords
medical image
2D-3D image registration
Digitally Reconstructed Radiograph(DRR)
graphic processing uni(tgpu)
Compute unified Device Architecture(CUDA)
virtual X ray camera system
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种云场景的实时渲染方法
被引量:2
- 6
-
-
作者
葛亮
姜晓峰
倪小军
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第11期167-170,共4页
-
基金
国家自然科学基金No.60775045~~
-
文摘
探讨了真实感云场景的模拟技术,设计了一种云场景的实时渲染方法。基于Perlin噪声建模生成云浓度图,并采用考虑浓度的Phong光照模型与单向散射光照模型,分别计算反射光和透射光,改善了传统方法无法真实反映不同角度太阳光照的问题,实现了不同时段动态云场景的绘制。通过引入基于GPU的Bumping纹理算法与Render-to-Texture技术,极大提高了云场景的渲染速度。实验结果进一步表明该方法能够同时满足真实感与实时性两个方面的要求。
-
关键词
云场景
PERLIN噪声
三线性插值
图形处理器(GPU)
Bumping纹理
单向散射
-
Keywords
cloud sence
perlin noise
Tri-linear interpolation
graphic processing uni(tgpu)
Bumping texture
single scattering
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-
-
题名gAC:基于GPU的高性能AC算法
被引量:2
- 7
-
-
作者
陈虎
彭江锋
施少怀
-
机构
华南理工大学软件学院
华南理工大学计算机科学与工程学院
-
出处
《计算机工程与应用》
CSCD
2012年第12期43-48,共6页
-
基金
广东省科技计划项目(No.2006B80407001)
华南理工大学中央高校基本业务费项目(No.2009ZM0007)
-
文摘
字符串匹配是计算科学中研究最广泛的问题之一,已成为信息检索和生物计算等领域的核心操作。然而受限于CPU的计算能力和存储器访问带宽,传统的串行字符串匹配算法难以进一步提升性能。GPU在计算能力和存储器访问带宽上有很大提升,已经在很多应用上取得了卓越成效。gAC作为一种基于GPU的并行AC算法,针对GPU的SIMT(Single-Instruction Multiple-Thread)以及合并存储器访问的技术特点,采取了减少条件分支、合并访问全局存储器等优化方法,使得在C1060GPU上的字符串扫描速度达到51Gb/s,比基于CPU的串行算法提升了28倍。
-
关键词
图形处理器(GPU)
计算统一设备框架(CUDA)
多字符串匹配
并行计算
AC算法
-
Keywords
graphic processing uni(tgpu)
Compute unified Device Architecture(CUDA)
parallel multi-string matching
parallel computation
AC algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
TP319
[自动化与计算机技术—计算机软件与理论]
-
-
题名小型水域水面涟漪的模拟方法
被引量:1
- 8
-
-
作者
卢维亮
程甜甜
何伟
李云飞
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第19期193-195,199,共4页
-
基金
国家自然科学基金(No.60775045)~~
-
文摘
以实际项目为研究背景,提出了一种小型水域水面涟漪模拟方法。将Johanson的投影网格法用于水面建模,采用二维波动方程描述水波运动,运用显式有限差分法和可编程GPU技术实现方程求解;并采用适当的渲染算法,比较真实地模拟了雨滴落入水面后水面波动的现象,在网格为256×256,图像大小为1024×768的情况下,刷新频率达到了85帧以上,满足了实时性的要求。
-
关键词
虚拟现实
Johanson投影网格
二维波动方程
图形处理器
-
Keywords
virtual reality
Johanson's projected grid
2D fluctuation function
graphics processing uni(tgpu)
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于GPU的并行协同差分进化算法研究
被引量:5
- 9
-
-
作者
刘剑英
-
机构
大连职业技术学院信息技术系
-
出处
《计算机工程与应用》
CSCD
2012年第7期48-50,123,共4页
-
文摘
针对大规模高维数复杂非线性函数优化的问题,提出一种新的基于GPU的协同差分进化算法。该方法将协同进化的思想引入启发式差分进化算法,随机分解大规模计算问题,利用GPU处理数据的并行性,同步计算分解后的子问题,加快算法的精度和收敛速度。实验对比结果表明,所提出的基于GPU的协同差分进化算法对大规模非线性函数优化具有更高的精度和效率。
-
关键词
并行计算
协同进化
差分进化
图形图像处理单元
-
Keywords
parallel calculation
cooperation evolution
differential evolution
graphic processing uni(tgpu)
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-
-
题名GPU加速的光滑轮廓线绘制
被引量:1
- 10
-
-
作者
方建文
于金辉
-
机构
衢州学院信息与电子工程系
浙江大学CAD&CG国家重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第11期1-2,14,共3页
-
基金
国家自然科学基金重点项目No.60933007
国家科技支撑计划(No.2007BAH11B02)~~
-
文摘
轮廓线的高效提取是非真实感绘制的一个关键问题。提出了一个完全利用GPU生成光滑轮廓线的高效算法。在几何处理阶段,先根据相邻三角形的法向量与视向量的关系检测出轮廓线,然后对轮廓线进行宽度扩充,同时对轮廓线顶点设置相应的渐变因子;在像素处理阶段把渐变因子转化为相应的alpha值,通过光照生成卡通渲染,最后通过alpha混合得到光滑轮廓线。算法完全在GPU里实现,能满足实时的绘制要求。
-
关键词
图形处理器
卡通风格
实时绘制
-
Keywords
graphic processing uni(tgpu)
cartoon style
real-time rendering
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-
-
题名遥感图像渐进式传输的GPU并行加速研究
- 11
-
-
作者
杨靖宇
刘昭华
张永生
-
机构
信息工程大学测绘学院
江西省数字国土重点实验室
江西理工大学建筑与测绘工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第15期185-187,共3页
-
基金
国家自然科学基金No.40671163
江西省数字国土实验室开放基金资助项目(No.DLLJ200901)~~
-
文摘
遥感图像的渐进式传输大大提高了数据响应效率,但同时也增加了数据接收端的计算量。为进一步提高数据传输效率,研究了基于可编程图形硬件GPU的并行加速方法,通过小波逆变换的GPU并行化来加速图像重构,并通过纹理查找表来提高数据读取效率,利用离线渲染缓存Pbuffer来保存多层小波变换的中间计算结果,进一步提高了并行效率。最后,通过实验验证了该方法的有效性。
-
关键词
渐进式传输
并行加速
离散小波变换
图形处理器
-
Keywords
progressive transmission
parallel processing speedup
Discrete Wavelet Transform(DWT)
graphics processing uni(tgpu)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名图形处理器通用计算的实现与验证
被引量:3
- 12
-
-
作者
齐记
杨孔庆
杨磊
-
机构
集美大学理学院复杂系统研究中心
中国科学院近代物理研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第33期67-69,共3页
-
基金
国家自然科学基金No.10775157
国家高技术研究发展计划(863)No.2006A09A102-08
国家重点基础研究发展规划(973)No.2007CB209603~~
-
文摘
讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提供了可能。
-
关键词
图形处理器(GPU)
图形处理器通用计算技术(GPGPU)
中央处理器(CPU)
-
Keywords
graphics processing uni(tgpu)
General Purpose graphic process uni(tGPGPU)
Central processing uni(tCPU)
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-
-
题名高质量的三维纹理硬件体绘制
被引量:2
- 13
-
-
作者
胡慧君
费耀平
李敏
-
机构
中南大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第17期188-190,235,共4页
-
文摘
与光线投射法相比,传统的3D纹理体绘制算法通常难以产生高质量的图像。为了增强渲染图像的真实感与质量,在基于GPU(Graphics Processing Unit)的三维纹理体绘制过程中以交互的速率实现了体阴影效果,并考虑现实图像合成中的可视化感知,提出将基于GPU的高动态范围色调映射技术应用到体绘制得到的结果图片中。最后对一些体数据集进行绘制,实验表明这些技术较好地解决了传统纹理绘制方法的缺点,提高了图像的质量。
-
关键词
三维纹理
图形处理器
体阴影
色调映射
-
Keywords
3D texture
graphics processing uni(tgpu)
volume shadow
tone mapping
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名NTRU加解密算法的GPU实现研究
被引量:1
- 14
-
-
作者
朱瑶
严承华
李强
-
机构
海军工程大学电子工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第34期81-85,共5页
-
基金
全军军事学研究生课题(No.2010JY0698-403)
-
文摘
GPU拥有高度并行性和可编码的特点,在大规模数据并行计算方面得到广泛应用。NTRU算法是一种安全性高,易于并行化的公钥密码算法。研究了NTRU算法基于CUDA的并行化实现技术,将计算中最耗时的卷积运算分解到多个线程并行计算,引入大量的独立并发的加解密线程块来完成整个加解密过程,并给出了具体的数据编码及存储结构、线程组织以及基于合并访问和共享内存的性能优化技术。实验结果表明,基于CUDA的NTRU加解密算法实现了硬件加速,相对于NTRU算法在CPU的实现,CUDA实现能够达到12.38MB/s的吞吐量,可获得最大为95倍的加速比。
-
关键词
统一计算设备架构
图形处理单元
NTRU算法
并行
-
Keywords
Compute unified Device Architecture(CUDA)
graphic processing uni(tgpu)
NTRU algorithm
parallelization
-
分类号
TP309.7
[自动化与计算机技术—计算机系统结构]
-
-
题名基于GPU的RFT算法并行化
被引量:5
- 15
-
-
作者
商哲然
谭贤四
曲智国
王红
丰骁
-
机构
空军预警学院研究生管理大队
空军预警学院
-
出处
《雷达科学与技术》
北大核心
2016年第5期505-509,516,共6页
-
文摘
RFT(Radon-Fourier Transform)是一种广义的MTD算法,可沿着目标径向运动轨迹进行相参积累。然而对距离-速度二维搜索产生的巨大计算量使得其难以快速实现和工程化。针对这个问题,根据雷达信号的回波数据结构和RFT算法思路,提出一种基于GPU的RFT并行化算法。通过实验,GPU平台实现的RFT算法与标准RFT和快速RFT相比,获得了巨大的加速比。另外,通过对比在CPU平台执行的MTD算法,得到在GPU平台上的RFT计算结果在不需要传回主机内存的条件下,计算速度快于在CPU平台上MTD算法。
-
关键词
拉东傅里叶变换
并行化
图形处理器
通用并行计算架构
-
Keywords
radon Fourier transform(RFT)
parallelization
graphic process unit(GPU)
compute uni- fied device architecture(CUDA)
-
分类号
TN911.7
[电子电信—通信与信息系统]
TN957
[电子电信—信号与信息处理]
-
-
题名基于GPU的高速网络入侵检测系统设计
被引量:1
- 16
-
-
作者
卢永菁
王东
-
机构
湖南大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第33期78-81,共4页
-
文摘
随着网络带宽的不断增加,以及处理能力的限制,传统的网络入侵检测系统(Network Intrusion Detecting System,NIDS)面临挑战,如何提高NIDS的处理能力备受关注。通过专用设备提高检测速度,不但价格昂贵且无法大规模普及。通过对Linux网络协议栈的优化,以及常用入侵检测系统Snort的多线程化,结合了图形处理器(Graphic Processing Unit,GPU)的高性能并行计算能力,设计了一种高性能的软件入侵检测架构,突破现有NIDS使用普通CPU的计算瓶颈,以应对高速链路对入侵检测性能的要求。实验结果表明,高速网络中的数据包可以采用GPU来处理。
-
关键词
网络入侵检测系统(NIDS)
图形处理器(GPU)
SNORT
并行计算
-
Keywords
Network Intrusion Detection Systems(NIDS)
graphic processing uni(tgpu)
Snort
parallel computing
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于GPU加速的锥束CT重建算法研究
被引量:3
- 17
-
-
作者
张宾
张正强
王洪凯
-
机构
大连理工大学生物医学工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2019年第4期208-213,共6页
-
基金
国家自然科学基金面上项目(No.61571076)
国家自然科学基金青年项目(No.81401475)
+3 种基金
辽宁省自然科学基金(No.2015020040)
大连市青年科技之星项目(No.2016RQ019)
大连理工大学星海学者人才培育计划(星海优青)(No.DUT14RC(3)066)
中央高校基本科研业务费专项资金
-
文摘
锥束计算机断层扫描(Cone-Beam Computed Tomography,CBCT)具有采集速度快和空间分辨率高等特点,被生物医学等领域广泛关注。然而通过CPU串行处理CBCT重建中海量投影数据非常耗时,难以满足实时性的需求。GPU的发展为CBCT重建的并行加速提供了条件。根据三角函数周期性的特点对FDK算法进行了改进,并利用GPU实现了12幅投影数据同时并行计算。实验结果表明,相比于传统基于CPU的重建算法,基于GPU的CBCT重建算法在保证图像质量的前提下,将重建速度提高了超过310倍。
-
关键词
锥束CT
FDK算法
图形处理单元(GPU)
-
Keywords
cone-beam CT
FDK algorithm
graphics processing uni(t GPU)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名利用GPU加速基于稀疏网格的SSTA
- 18
-
-
作者
叶晓敏
周学功
曹伟
王伶俐
-
机构
复旦大学专用集成电路与系统国家重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第27期60-64,73,共6页
-
基金
专用集成电路与系统国家重点实验室重点课题(No.09XT004)
-
文摘
提出一种利用图形处理单元(Graphics Processing Unit,GPU)加速统计静态时序分析的方法,利用稀疏网格减少统计静态时序分析中时序图各节点的配置个数,在GPU上构建复杂的时序图数据结构后并行计算各节点的不同配置,达到加速统计静态时序分析的目的。测试结果表明,提出的方法能够在不损失精度的前提下,将统计静态时序分析运行速度平均提高300倍以上。随着现代集成电路规模的持续增大和集成电路工艺的不断发展,这种新型快速的统计静态时序方法能够有效提高时序分析的速度和效率。
-
关键词
图形处理单元
稀疏网格
统计静态时序分析
-
Keywords
graphics processing uni(tgpu)
sparse grid
Statistical Static Timing Analysis(SSTA)
-
分类号
TN47
[电子电信—微电子学与固体电子学]
-
-
题名采用重要性面片采样的实时全局光照
- 19
-
-
作者
柴学梁
吴向阳
王毅刚
戴大蒙
-
机构
杭州电子科技大学图形图像研究所
温州大学计算机科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第2期174-176,217,共4页
-
基金
浙江省自然科学基金(No.Y107720)
浙江省教育厅科技计划项目(No.Y200702081)
温州市科技计划项目(No.G2006003)~~
-
文摘
提出了一种实时全局光照的计算方法。该方法支持任意视点下动态光源的一次间接光照计算,并且物体表面材质可实时编辑,该算法预计算了各面片上的形状因子来解决遮挡问题,并记录形状因子较大的重要性面片作为间接光源。渲染时先从光源方向对场景记录了一个扩展的阴影图,包含了光源照射到的面片ID和其光通量,再根据采样好的间接光源来计算间接光照。使用CUDA,整个光照计算过程在GPU中完成,可以对静态场景进行实时渲染,并能达到逼真的渲染效果。
-
关键词
重要性面片采样
全局光照
遮挡
图形处理器
统一计算架构
-
Keywords
importance faces sampling
global illumination
occlusion
graphic processing uni(tgpu)
Compute unified Device Archi-tecture(CUDA)
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-