期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
奇偶合并排序的数据级并行实现
1
作者 张珂良 李佳佳 +1 位作者 陈钢 吴百锋 《小型微型计算机系统》 CSCD 北大核心 2012年第6期1343-1349,共7页
针对奇偶合并排序中存在的巨大数据级并行性潜力,通过将其实现于提供了强大数据级并行性的GPU处理器之上而获取较高的加速比.同时,针对OpenCL不支持各工作组间的工作线程的同步问题,提出两种解决方法,一种是通过主机程序控制迭代过程,... 针对奇偶合并排序中存在的巨大数据级并行性潜力,通过将其实现于提供了强大数据级并行性的GPU处理器之上而获取较高的加速比.同时,针对OpenCL不支持各工作组间的工作线程的同步问题,提出两种解决方法,一种是通过主机程序控制迭代过程,从而完全避免所有工作线程对于同步操作的需求;另一种是通过桶划分预处理技术将对于同步操作的需求控制在单个工作组,然后利用单个工作组提供的各工作线程间的同步机制以正确的处理同步操作.实验结果表明,按照本文方法实现的程序性能相对于C++STL库中的sort实现有着明显的提高. 展开更多
关键词 奇偶合并排序 数据级并行 通用目的计算 图形处理器 OPENCL
在线阅读 下载PDF
GSim:支持GPU加速软件过程仿真框架
2
作者 张备 翟健 杨秋松 《计算机工程与设计》 CSCD 北大核心 2012年第2期754-759,820,共7页
为了提高软件过程仿真的效率,提出了一种基于图形处理单元(graphic processing unit,GPU)加速的仿真框架。该框架利用图形化语言和随机参数来描述一个过程模型,将模型转换为RansomSpec字节码从而可以在GPU平台上运行,以期借助GPU平台的... 为了提高软件过程仿真的效率,提出了一种基于图形处理单元(graphic processing unit,GPU)加速的仿真框架。该框架利用图形化语言和随机参数来描述一个过程模型,将模型转换为RansomSpec字节码从而可以在GPU平台上运行,以期借助GPU平台的高并行特性提高原有仿真算法的效率。实验结果表明,通过这种框架,基于GPU的随机软件过程仿真与传统基于CPU串行的仿真算法相比在效率上提高一个数量级。 展开更多
关键词 软件过程仿真 基于图形处理单元的通用目的计算 计算统一的设备架构 中间语言
在线阅读 下载PDF
基于锥形射线族投射的非直接光照算法
3
作者 吴福祥 董健康 周付根 《计算机工程》 CAS CSCD 2013年第12期294-297,共4页
在可交互应用中,基于射线投射的非直接光照采样数目常常受限。为此,考虑到空间关联,提出使用锥形射线族进行投射求交的算法,利用锥形边界预排除场景元素,并使用无堆栈算法在GPU中完成非直接光照计算,同时对算法使用的数据存储区域进行... 在可交互应用中,基于射线投射的非直接光照采样数目常常受限。为此,考虑到空间关联,提出使用锥形射线族进行投射求交的算法,利用锥形边界预排除场景元素,并使用无堆栈算法在GPU中完成非直接光照计算,同时对算法使用的数据存储区域进行优化以达到更好的访问带宽,通过OpenCL和OpenGL实现该算法,结果证明该算法可以有效地计算非直接光照,相对于射线投射算法平均有2倍左右的性能提升。 展开更多
关键词 非直接光照 射线投射 锥形射线族 无堆栈算法 重要性采样 渲染方程 通用目的GPU计算
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部