-
题名GPU平台上面向性能和功耗的分支优化
被引量:3
- 1
-
-
作者
于齐
王博千
沈立
王志英
陈微
-
机构
国防科学技术大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2016年第5期22-26,共5页
-
基金
国家自然科学基金项目(61472431
61202121)
教育部高等学校博士点新教师基金项目(20114307120013)资助
-
文摘
强大的计算能力使得GPGPU在通用计算领域得到了广泛的应用。然而,GPGPU的SIMT(Single Instruction Multiple Threads)工作方式,使其执行效率受到应用中不一致分支行为(Branch Divergence)的严重影响。虽然人们提出了线程交换方法来减小分支带来的性能损失,但这种方法往往会引入额外的访存操作,不仅在一定程度上减少了线程交换优化的性能收益,还增加了功耗。首先举例说明线程交换范围对程序性能和功耗的影响;然后提出了一种减少线程交换所引入的额外访存操作的方法。实验表明,对于Reduction程序,当交换范围为256时,在性能平均损失为4%的情况下功耗降低幅度最大为7%;而对于Bitonic程序,当交换范围为256和512时,在没有功耗开销的情况下,性能分别最大提升了6.4%和5.3%。
-
关键词
不一致分支行为
访存
线程交换
-
Keywords
Branch divergence
Memory access
Thread swapping
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-