-
题名HXDSP异构计算框架的设计与优化
被引量:4
- 1
-
-
作者
宁成明
蔡恒雨
郑启龙
耿锐
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学高性能计算安徽省重点实验室
安徽芯纪元科技有限公司
-
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第1期179-185,共7页
-
基金
国家核高基重大专项项目(2012ZX01034-001-001)资助。
-
文摘
由于CPU在处理海量数据时所面临的性能瓶颈,使得基于异构系统的异构并行计算成为并行计算领域的研究热点之一.HXDSP是中国电子科技集团第三十八所自主研制的DSP芯片,能满足多种高性能计算领域的需求.为了充分发挥HXDSP的计算能力以及多HXDSP设备并行计算的能力,本文设计了基于OpenCL的HXDSP异构计算框架.本文根据计算任务的特性设计了不同的OpenCL设备映射方式,使得HXDSP异构计算框架能适应不同的应用场景,充分利用HXDSP的计算资源并节省能耗.本文在HXDSP异构计算框架设计完成的基础上针对HXDSP异构计算应用程序进行优化,包括数据传输优化和数据访问优化.最后本文通过实验分析了HXDSP异构计算框架的程序性能,验证了HXDSP异构计算框架的可行性以及有效性.
-
关键词
HXDSP
异构计算
OPENCL
程序性能优化
-
Keywords
HXDSP
heterogeneous computing
OpenCL
program performance optimization
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于深度学习的循环自动调度研究
被引量:2
- 2
-
-
作者
胡煜霄
郑启龙
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学高性能计算安徽省重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第7期1770-1777,共8页
-
基金
国家核高基重大专项项目(2012ZX01034-001-001)资助.
-
文摘
循环代码的自动调度问题是编译优化领域中的热门问题,然而当前大部分此类研究都基于不同领域的领域特定语言或编程框架,缺乏对通用编程语言的支持.本文提出了一个面向通用编程语言的循环自动调度框架.该自动调度框架使用蒙特卡洛树搜索算法对循环调度空间进行高效的搜索,在搜索样本评估阶段,本文利用深度学习技术为循环调度构建了基于Tree-LSTM的代价模型对搜索过程进行指导以加速搜索过程.经实验验证,本文提出的自动调度框架能够达到优于前沿的启发式循环优化编译器Polly的优化效果,同时本文构建的代价模型能够在10%以内的调度性能损失的前提下显著提升调度搜索过程的效率.
-
关键词
自动调度
编译优化
蒙特卡洛树搜索
深度学习
长短期记忆网络
-
Keywords
auto-schedule
compilation optimization
Monte Carlo tree search
deep learning
long-short term memory
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于整数线性规划的VLIW DSP指令分簇调度
被引量:3
- 3
-
-
作者
周鹏
刘纯纲
郑启龙
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学高性能计算安徽省重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2022年第10期3078-3083,共6页
-
基金
国家核高基重大专项资助项目(2012ZX01034-001-001)。
-
文摘
在分簇VLIW DSP上,指令分簇是一项对程序性能有重要影响的编译优化,但现有的指令分簇算法只能处理顺序的程序区域,且难以获得最佳的分簇方案。针对这些问题,提出一种基于整数线性规划的统一指令分簇与指令调度的方法。该方法使用0-1决策变量表示函数中指令的分簇、指令的局部调度以及簇间传输指令的全局调度,并将指令之间的依赖关系和对处理器资源的竞争关系构造为线性约束,最终得到一个以最小化函数的估计执行时间为目标的整数线性规划模型。实验结果表明,求解该模型得到的分簇调度方案对程序性能的优化显著强于现有算法,并且求解模型所耗费的时间是可接受的。
-
关键词
数字信号处理器
超长指令字
指令分簇
指令调度
整数线性规划
-
Keywords
digital signal processor(DSP)
very long instruction word(VLIW)
cluster assignment
instruction scheduling
integer linear programming
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于图神经网络的BWDSP指令选择方法优化研究
被引量:2
- 4
-
-
作者
侯璇
凤维杰
郑启龙
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学高性能计算安徽省重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第12期2672-2679,共8页
-
基金
国家核高基重大专项项目(2012ZX01034-001-001)资助。
-
文摘
现阶段,现代处理器选用不同的策略处理编译完成的代码指令,而选用的指令影响后端代码的性能优化.指令选择所采用的策略依然与传统的基于宏扩展和基于图覆盖的方法相似,且不支持部分复杂的指令,无法充分利用复杂指令带来的高效率,因此也亟需一种新型且有效、可拓展、可移植的指令选择策略.近些年图神经网络GNN在处理非欧氏数据上取得了很多的突破.本文将GNN应用于基于BWDSP平台编译器后端的指令选择的处理过程中,基于图节点的分类、边属性的预测和图分类提出一种低耦合性的指令选择模型,通过实验验证并对比这种方法与传统方法的有效性.并且证明了一个高效的指令选择策略能够充分利用BWDSP的资源,降低程序执行的代价.在提高BWDSP指令选择能力的同时,也期望能将该方法应用到不同平台的指令集,或者编译优化的其它子领域和不同的编译器中.
-
关键词
指令选择
图神经网络
BWDSP平台
编译优化
-
Keywords
instruction selection
graph neural network
BWDSP platform
compilation optimization
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-