-
题名基于GPU的并行计算性能分析模型
被引量:3
- 1
-
-
作者
王卓薇
程良伦
赵武清
-
机构
广东工业大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2014年第1期31-38,共8页
-
基金
广州市科技项目(2012Y2-0031)
博士后基金(2013M531825)
国家自然科学基金(U1201251)资助
-
文摘
针对GPU并行计算领域缺少精确的性能分析模型和有针对性的性能优化方法,提出一种基于GPU的并行计算性能定量分析模型,其通过对指令流水线、共享存储器访存、全局存储器访存的性能建模,来定量分析并行程序,帮助程序员找到程序运行瓶颈,进行有效的性能优化。实验部分通过3个具有代表性的实际应用(稠密矩阵乘法、三对角线性方程组求解、稀疏矩阵矢量乘法)的性能分析证明了该模型的实用性,并有效地实现了算法的优化。
-
关键词
GPU
性能定量分析模型
指令流水线
共享存储器访存
全局存储器访存
-
Keywords
GPU, Quantitative performance model, Instruction pipeline, Shared memory access time, Global memory ac- cess time
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名GPU矩阵乘法的性能定量分析模型
被引量:1
- 2
-
-
作者
尹孟嘉
许先斌
熊曾刚
张涛
-
机构
武汉大学计算机学院
湖北工程学院计算机与信息科学学院
-
出处
《计算机科学》
CSCD
北大核心
2015年第12期13-17,22,共6页
-
基金
国家自然科学基金(61370092)
湖北省自然科学基金(2013CFC005)
湖北省中青年创新团队(T201410)资助
-
文摘
性能评价和优化是设计高效率并行程序必不可少的重要工作,存储系统的性能高低直接影响到处理器的整体性能。利用GPGPU-Sim对GPU的存储层次结构进行了模拟,找出了SM数量与存储控制器数量之间最佳配置关系。矩阵乘法是科学计算领域中的基本组成部分,是一种具有计算和访存密集特点的典型应用,其性能是GPU高性能计算的一个重要指标。性能模型作为并行系统性能评价的新的技术解决方案,具有许多其它性能评价方法无法比拟的优势。建立了一个性能模型,模型通过对指令流水线、共享存储器访存、全局存储器访存进行定量分析,找到了程序运行瓶颈,提高了执行速度。实验证明,该模型具有实用性,并有效地实现了矩阵乘法的优化。
-
关键词
GPU
GPGPU-Sim
矩阵乘法
性能定量分析模型
指令流水线
共享存储器访存
全局存储器访存
-
Keywords
GPU, GPGPU-Sim, Matrix multiplication, Quantitative performance analysis model, Instruction pipeline,Shared memory access, Global memory access
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-