期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于梯度自适应光照模型的统一计算设备构架实时体绘制技术研究
1
作者 龚剑 贠照强 +1 位作者 秦安 冯前进 《南方医科大学学报》 CAS CSCD 北大核心 2010年第9期2156-2160,共5页
医学体绘制技术中,在组织轮廓清晰显示的前提下,同时显示组织内部和外部结构是非常困难的。因为增加透明度会造成结构之间的混淆,而剖切显示则会带来结构上下文信息的缺失。针对上述问题,提出了一种基于体素梯度的自适应光照模型,该模... 医学体绘制技术中,在组织轮廓清晰显示的前提下,同时显示组织内部和外部结构是非常困难的。因为增加透明度会造成结构之间的混淆,而剖切显示则会带来结构上下文信息的缺失。针对上述问题,提出了一种基于体素梯度的自适应光照模型,该模型中环境光等参数根据体素梯度自动调整;同时采用统一计算设备构架(Compute Unified Device Architecture)技术对算法进行加速。实验结果表明,该方法在保证实时交互的同时,能够达到保留组织上下文信息的效果。 展开更多
关键词 体绘制 统一计算设备构架 光照模型 GPU
在线阅读 下载PDF
基于CUDA的超声二维声场EFIT仿真 被引量:2
2
作者 宋波 李威 廉国选 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2019年第7期1322-1328,共7页
随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场... 随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场仿真的基础上,基于GPU实现了仿真模型的并行计算,介绍了GPU程序的设计流程和参数优化方法,包括纹理内存使用、吸收边界优化和数据传输优化。对比了相同条件下CPU和GPU仿真计算的耗时和平均计算效率,定量分析了GPU对于EFIT模型效率的提升。比对结果表明,EFIT具有良好的并行计算条件,采用并行计算方法能够有效提升模型计算速度,对于复杂声场仿真应用具有广阔的应用前景。 展开更多
关键词 并行计算 弹性动力学有限积分算法(EFIT) 二维声场 图形处理器(GPU) 计算设备统一构架(CUDA)
在线阅读 下载PDF
基于共享参数模型的非平稳信号分析系统研制
3
作者 程发斌 王莹 《计算机应用研究》 CSCD 北大核心 2009年第12期4610-4612,共3页
研究了共享参数模型的软件体系结构,设计了非平稳信号分析系统的总体框架,实现了系统模块的统一构架和仪器界面,采用面向对象的编程技术以及VC开发工具,成功开发了面向机械故障特征提取的非平稳信号分析系统,为故障特征提取提供了一个... 研究了共享参数模型的软件体系结构,设计了非平稳信号分析系统的总体框架,实现了系统模块的统一构架和仪器界面,采用面向对象的编程技术以及VC开发工具,成功开发了面向机械故障特征提取的非平稳信号分析系统,为故障特征提取提供了一个有效的分析工具,并通过实际应用验证了该系统的实用性。 展开更多
关键词 特征提取 统一构架 功能模块 非平稳信号分析系统
在线阅读 下载PDF
GPU上高效Jacobi迭代算法的研究与实现 被引量:3
4
作者 狄鹏 胡长军 李建江 《小型微型计算机系统》 CSCD 北大核心 2012年第9期1962-1967,共6页
Jacobi迭代算法是一种求解偏微分方程组的常用循环运算.由于该算法存在语句间的数据相关,阻碍了其在图像处理单元(Graphic Processing Unit,GPU)等并行计算平台的高效实现.通过数学证明与实验验证,比较不同的循环优化策略,消除语句间数... Jacobi迭代算法是一种求解偏微分方程组的常用循环运算.由于该算法存在语句间的数据相关,阻碍了其在图像处理单元(Graphic Processing Unit,GPU)等并行计算平台的高效实现.通过数学证明与实验验证,比较不同的循环优化策略,消除语句间数据相关,增强数据局部性,从而获得更高的执行性能.此外,利用块(Tile)大小选取模型,合理的划分计算数据,充分利用GPU的运算资源,进一步提高性能.实验结果表明,Jacobi奇偶复制算法比传统Jacobi并行算法在GPU上的性能提高4倍以上. 展开更多
关键词 图像处理单元 计算设备统一构架 Jacobi迭代算法 循环优化
在线阅读 下载PDF
一种高效直方图生成算法在GPU上的实现 被引量:2
5
作者 狄鹏 胡长军 李建江 《计算机科学》 CSCD 北大核心 2012年第3期304-307,共4页
直方图生成算法(Histogram Generation)是一种顺序的非规则数据依赖的循环运算,已在许多领域被广泛应用。但是,由于非规则的内存访问,使得多线程对共享内存访问会产生很多存储体冲突(Bank Conflict),从而阻碍并行效率。如何在并行处理... 直方图生成算法(Histogram Generation)是一种顺序的非规则数据依赖的循环运算,已在许多领域被广泛应用。但是,由于非规则的内存访问,使得多线程对共享内存访问会产生很多存储体冲突(Bank Conflict),从而阻碍并行效率。如何在并行处理器平台,特别是当前最先进的图像处理单元(Graphic Processing Unit,GPU)实现高效的直方图生成算法是很有研究价值的。为了减少直方图生成过程中的存储体冲突,通过内存填充技术,将多线程的共享内存访问均匀地分散到各个存储体,可以大幅减少直方图生成算法在GPU上的内存访问延时。同时,通过提出有效可靠的近似最优配置搜索模型,可以指导用户配置GPU执行参数,以获得更高的性能。经实验验证,在实际应用中,改良后的算法比原有算法性能提高了42%~88%。 展开更多
关键词 图像处理单元 计算设备统一构架 直方图生成 内存填充
在线阅读 下载PDF
基于GPU的变型SIFT算子实时图像配准 被引量:13
6
作者 袁修国 彭国华 王琳 《计算机科学》 CSCD 北大核心 2011年第3期300-303,共4页
针对SIFT变型算法描述向量维数过高实、时性差的问题,分别在建立高斯尺度金字塔、关键点的亚像素定位等方面进行改进与并行化。利用CUDA设备构架在GPU硬件上实现多线程,一方面避免了PCA方法造成的关键点信息流失,另一方面使得配准速度... 针对SIFT变型算法描述向量维数过高实、时性差的问题,分别在建立高斯尺度金字塔、关键点的亚像素定位等方面进行改进与并行化。利用CUDA设备构架在GPU硬件上实现多线程,一方面避免了PCA方法造成的关键点信息流失,另一方面使得配准速度达到了工程中的实时性要求。在VS2005平台上通过C语言实现混合CUDA编程,结果表明该方法使得配准速度和点对匹配正确率都有较大提升。 展开更多
关键词 旋转不变特征变换(SIFT) 梯度定位与方向直方图(GLOH) 图形处理器(GPU) 计算统一设备构架
在线阅读 下载PDF
云计算概念、模型和关键技术 被引量:40
7
作者 殷康 《中兴通讯技术》 2010年第4期18-23,共6页
云计算指IP技术架构下的网络计算,其本质是ICT业务的一种新的应用方式。绝大数企业和运营商的数据中心的改造将是云计算未来发展的主要任务:使云计算技术更为普遍和更为广泛地为绝大部分企业、机构、团体和运营商服务。云计算技术将不... 云计算指IP技术架构下的网络计算,其本质是ICT业务的一种新的应用方式。绝大数企业和运营商的数据中心的改造将是云计算未来发展的主要任务:使云计算技术更为普遍和更为广泛地为绝大部分企业、机构、团体和运营商服务。云计算技术将不仅提供传统意义的IT资源和应用服务,而且将支持包括IT、通信、电视、移动和物联等一切互联网技术融合后的资源使用和业务应用。云计算发展的关键技术主要有统一交换构架、统一虚拟化和统一计算系统,云计算发展的战略推手将是组建开放产业联盟和推动开放技术标准。 展开更多
关键词 云计算 统一交换构架 统一虚拟化 统一计算系统
在线阅读 下载PDF
GPU加速下脉冲压缩雷达的点迹凝聚 被引量:4
8
作者 夏栋 夏奎 +1 位作者 张伟 孙剑英 《火力与指挥控制》 CSCD 北大核心 2013年第3期81-85,共5页
GPU具有很高的显存带宽和大量计算单元,随着其可编程性的不断提高,GPU越来越多地用于图像渲染以外的其他通用计算。研究了利用GPU丰富的运算资源并行加速实现脉冲压缩雷达的点迹凝聚问题。首先研究了每个目标的点迹采用一个CUDA线程的... GPU具有很高的显存带宽和大量计算单元,随着其可编程性的不断提高,GPU越来越多地用于图像渲染以外的其他通用计算。研究了利用GPU丰富的运算资源并行加速实现脉冲压缩雷达的点迹凝聚问题。首先研究了每个目标的点迹采用一个CUDA线程的粗粒度并行方式,结果发现处理时间反而有所增加,分析了处理时间加长的原因。然后增加了并行的尺度,对单个目标的凝聚过程进行并行分解。结果表明大尺度细粒度的并行方式可以有效利用GPU强大的运算能力,加快脉冲压缩雷达的点迹凝聚速度。 展开更多
关键词 GPU的通用运算 并行计算 点迹凝聚 计算统一设备构架
在线阅读 下载PDF
改进的电大目标电磁散射弹跳射线算法 被引量:1
9
作者 刘兴霞 张利军 赵玉祥 《探测与控制学报》 CSCD 北大核心 2015年第3期91-95,共5页
针对传统弹跳射线方法(SBR)在处理电大尺寸目标电磁散射问题时存在效率不高的问题,提出了改进的电大目标电磁散射弹跳射线算法。该算法在采用层次包围的二叉树加速数据结构的基础上,提出了在图形处理器(GPU)端实现射线管的分裂和追踪更... 针对传统弹跳射线方法(SBR)在处理电大尺寸目标电磁散射问题时存在效率不高的问题,提出了改进的电大目标电磁散射弹跳射线算法。该算法在采用层次包围的二叉树加速数据结构的基础上,提出了在图形处理器(GPU)端实现射线管的分裂和追踪更新的计算统一设备构架(CUDA)并行计算SBR算法。通过实验算例验证表明,该方法可有效提高SBR方法处理电大尺寸目标电磁散射问题的的计算效率。 展开更多
关键词 弹跳射线法 目标电磁散射 层次包围 计算统一设备构架
在线阅读 下载PDF
改进的储层直接取样随机模拟方法及GPU实现
10
作者 谢青 彭威 +2 位作者 柳瑶阁 黄涛 卢德唐 《中国科学技术大学学报》 CAS CSCD 北大核心 2013年第8期626-630,共5页
讨论了储层随机模拟方法中的直接取样方法,并对其中地质模式分量的选取方式进行了改进,提出了结合空间相关关系模型结构化特性的方法.针对模式子空间中的求解问题,提出了基于统一计算设备构架(compute unified device architecture,CUDA... 讨论了储层随机模拟方法中的直接取样方法,并对其中地质模式分量的选取方式进行了改进,提出了结合空间相关关系模型结构化特性的方法.针对模式子空间中的求解问题,提出了基于统一计算设备构架(compute unified device architecture,CUDA)的并行策略.实验结果表明,模式分量选取方式的改进有效改善了两相河流沉积系统中河道的连续性,并且模式子空间中的求解的并行方法具有较小的时间复杂度.根据选取参数组的不同,并行方法的计算速度比串行方法最低提速10倍,最高提高了近100倍. 展开更多
关键词 随机模拟 直接采样 并行计算 统一计算设备构架(CUDA)
在线阅读 下载PDF
GPU加速MOC输运计算性能分析研究 被引量:4
11
作者 宋佩涛 张志俭 +2 位作者 梁亮 张乾 赵强 《原子能科学技术》 EI CAS CSCD 北大核心 2020年第1期103-111,共9页
特征线方法(MOC)在求解堆芯规模中子输运方程时面临计算时间长的问题,加速和并行算法是目前研究的热点。基于MOC在特征线和能群层面的并行特性,采用统一计算设备构架(CUDA)编程规范,实现了基于图形处理器(GPU)的并行二维MOC算法。测试... 特征线方法(MOC)在求解堆芯规模中子输运方程时面临计算时间长的问题,加速和并行算法是目前研究的热点。基于MOC在特征线和能群层面的并行特性,采用统一计算设备构架(CUDA)编程规范,实现了基于图形处理器(GPU)的并行二维MOC算法。测试了菱形差分和步特征线法分别在双精度、混合精度及单精度浮点运算下的计算精度、效率及GPU加速效果。采用性能分析工具对GPU程序性能进行了分析,识别了程序性能瓶颈。结果表明:菱形差分和步特征线法在不同浮点运算精度下均表现出良好的计算精度;相比于CPU单线程计算,GPU加速效果在双精度和单精度情况下分别达到35倍和100倍以上。 展开更多
关键词 GPU加速 特征线方法 中子输运计算 统一计算设备构架 性能分析
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部