-
题名基于迭代序的流程序局部性分析和优化
- 1
-
-
作者
唐滔
杨学军
林一松
-
机构
并行与分布处理国家重点实验室(国防科学技术大学)
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2012年第6期1363-1375,共13页
-
基金
国家自然科学基金项目(60921062
61170049)
-
文摘
流编程模型是一种近年来被广泛研究的并行编程模型,它在基于软件管理的流式存储器,如流寄存器文件的流体系结构上得到了良好的应用.但同时也有研究指出流编程模型同样适合于基于硬件管理的一致性cache的体系结构.流编程模型目前最重要的应用背景GPGPU在发展中也逐渐引入通用的数据cache,因此发掘流程序的cache局部性就成为在这类体系结构上提高流程序性能的关键.由于流程序特殊的执行模型,其重用向局部性转化的过程与传统的串行程序不一致,无法直接使用传统的局部性分析方法直接对流程序进行分析.在深入分析了重用向局部性转化过程的基础上,提出了"迭代序"的概念用于描述流和串行程序重用向局部性转化时的不同,同时结合流程序的执行特点面向并行扩展了传统的局部性分析理论,给出了基于迭代序的局部性分析方法.此外,结合局部性分析模型还提出了两种流程序的cache局部性优化方法.在GPGPUSim模拟平台上进行的验证结果表明对流程序局部性的定量分析是有效的,并且提出的优化方法也可以有效改善流程序的cache局部性,提高流程序的性能.
-
关键词
流编程模型
重用
局部性
迭代序
优化
-
Keywords
stream programming model reuse locality iteration sequence
optimization
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-