-
题名奇偶合并排序的数据级并行实现
- 1
-
-
作者
张珂良
李佳佳
陈钢
吴百锋
-
机构
复旦大学计算机科学技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2012年第6期1343-1349,共7页
-
基金
专用集成电路与系统国家重点实验室(复旦大学)和AMD大学合作计划基金项目资助
-
文摘
针对奇偶合并排序中存在的巨大数据级并行性潜力,通过将其实现于提供了强大数据级并行性的GPU处理器之上而获取较高的加速比.同时,针对OpenCL不支持各工作组间的工作线程的同步问题,提出两种解决方法,一种是通过主机程序控制迭代过程,从而完全避免所有工作线程对于同步操作的需求;另一种是通过桶划分预处理技术将对于同步操作的需求控制在单个工作组,然后利用单个工作组提供的各工作线程间的同步机制以正确的处理同步操作.实验结果表明,按照本文方法实现的程序性能相对于C++STL库中的sort实现有着明显的提高.
-
关键词
奇偶合并排序
数据级并行
通用目的计算
图形处理器
OPENCL
-
Keywords
odd-even merge sort
data level parallelism
GPGPU
GPU
OpenCL
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名GSim:支持GPU加速软件过程仿真框架
- 2
-
-
作者
张备
翟健
杨秋松
-
机构
中国科学院软件研究所
-
出处
《计算机工程与设计》
CSCD
北大核心
2012年第2期754-759,820,共7页
-
基金
国家自然科学基金项目(90718042
60903051
+4 种基金
61073044)
国家863高技术研究发展计划基金项目(2007AA010303
2007AA01Z186)
中国科学院与广东省全面战略合作重大基金项目(2009B091300131)
国家973重点基础研究发展计划基金项目(2007CB310802)
-
文摘
为了提高软件过程仿真的效率,提出了一种基于图形处理单元(graphic processing unit,GPU)加速的仿真框架。该框架利用图形化语言和随机参数来描述一个过程模型,将模型转换为RansomSpec字节码从而可以在GPU平台上运行,以期借助GPU平台的高并行特性提高原有仿真算法的效率。实验结果表明,通过这种框架,基于GPU的随机软件过程仿真与传统基于CPU串行的仿真算法相比在效率上提高一个数量级。
-
关键词
软件过程仿真
基于图形处理单元的通用目的计算
计算统一的设备架构
中间语言
-
Keywords
software process simulation
GPGPU
CUDA
intermediate language
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于锥形射线族投射的非直接光照算法
- 3
-
-
作者
吴福祥
董健康
周付根
-
机构
北京航空航天大学图像中心
中国民航大学航空自动化学院
-
出处
《计算机工程》
CAS
CSCD
2013年第12期294-297,共4页
-
文摘
在可交互应用中,基于射线投射的非直接光照采样数目常常受限。为此,考虑到空间关联,提出使用锥形射线族进行投射求交的算法,利用锥形边界预排除场景元素,并使用无堆栈算法在GPU中完成非直接光照计算,同时对算法使用的数据存储区域进行优化以达到更好的访问带宽,通过OpenCL和OpenGL实现该算法,结果证明该算法可以有效地计算非直接光照,相对于射线投射算法平均有2倍左右的性能提升。
-
关键词
非直接光照
射线投射
锥形射线族
无堆栈算法
重要性采样
渲染方程
通用目的GPU计算
-
Keywords
indirect illumination
ray-cast
cone-rays
stackless algorithm
importance sampling
render equation
general purpose GPUcomputing
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-