-
题名一种面向数据密集型应用的并行程序执行模型
被引量:2
- 1
-
-
作者
何颂颂
顾乃杰
任开新
-
机构
中国科学技术大学计算机学院
安徽省计算与通信软件重点实验室
中国科学技术大学中科院沈阳计算所网络与通信联合实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2013年第7期1457-1461,共5页
-
基金
国家"核高基"重大专项项目(2009ZX01028-002-003-005)资助
国家自然科学基金项目(60833004)资助
-
文摘
随着各领域需要处理的数据量越来越大,数据密集型应用也变得越来越被重视.该文提出一种包含数据访存层次和访存冲突等信息的新并行程序执行模型PSRAM(h).针对数据密集型应用以访存为主的特点,PSRAM(h)模型将程序执行时间简化为访存时间,通过分析各程序子段的访存层次和数量来预测串行程序的执行时间,进而通过使用各线程执行时间的最大值来预测并行程序的执行时间.使用PSRAM(h)模型下对最典型的数据密集型应用矩阵向量乘进行分析,在龙芯3A处理器和Intel Xeon E5520处理器两个平台上的测试结果表明,PSRAM(h)模型分析结果与实测结果大部分情况下误差小于20%.由此可见,针对数据密集型应用,PSRAM(h)不但可以给出程序执行时间的下限,还可以有效的预测程序的执行时间.
-
关键词
数据密集型
共享内存
PSRAM(h)
程序执行模型
-
Keywords
date-intensive
shared memory
PSRAM(h)
program execution model
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名申威处理器上数据流运行时系统的设计与实现
被引量:1
- 2
-
-
作者
张鹏飞
陈俊仕
郑重
沈沛祺
安虹
许乐
-
机构
中国科学技术大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第12期46-54,共9页
-
基金
国家自然科学基金(62102389)。
-
文摘
我国自主研发的新一代神威异构众核计算平台主要采用athread异构编程方法,athread异构编程属于大同步并行模型,难以充分挖掘程序中的细粒度并行性,其采用的同步方式难以实现众核上的任务负载均衡。数据流并行编程模型因其天然并行性、点对点同步的特点能够很好地解决上述问题。基于Codelet程序执行模型和申威主从核架构特点,设计并实现面向申威处理器的数据流运行时系统swTasklet,通过对Codelet功能的进一步细化和对Codelet机器模型到主从核的映射,避免从核阵列上的同步操作,减少同步开销;由主核完成从核计算任务的调度分配,将计算和同步操作分离,保证运行时系统可以和从核计算库的共用。实验以NPB LU程序和向量-向量加作为测试用例,采用相同的优化方法分别对swTasklet和athread实现进行并行化。实验结果表明:在规模较大情况下,LU程序的swTasklet实现版本比athread版本快16%,向量-向量加swTasklet实现版本比athread版本快1倍;使用swTasklet实现的LU并行版本较主核本取得了平均8倍以上的加速,而向量-向量加swTasklet版本较主核版本取得30倍左右的加速。
-
关键词
申威异构处理器
数据流运行时系统
Codelet程序执行模型
并行编程模型
众核加速
-
Keywords
Shenwei heterogeneous processor
data-flow runtime system
Codelet program execution model
parallel programming model
many-core acceleration
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-