-
题名基于功能单元最大利用率的调度算法
被引量:2
- 1
-
-
作者
李淳
刘明业
吴沧浦
-
机构
北京理工大学计算机系
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
1996年第2期7-10,共4页
-
基金
国家自然科学基金
-
文摘
高级综合中调度决定系统运行速度与造价的折衷,调度问题为NP问题,本文将调度问题看作为多目标优化问题,并提出一种基于功能单元最大利用率的调度算法,以较低的时间复杂度求得调度问题的最优或近似最优解。该算法不仅可求解时间约束下的调度问题,也可求解造价约束下的调度问题。
-
关键词
调度
多目标优化
功能单元利用率
最优化
-
Keywords
Scheduling,Multi criteria optimization,Utility ratio of the function units
-
分类号
O224
[理学—运筹学与控制论]
TP202.7
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于网络负载特征感知的数据流指令调度机制研究
被引量:2
- 2
-
-
作者
冯煜晶
欧焱
叶笑春
范东睿
谭旭
唐志敏
-
机构
中国科学院计算技术研究所计算机体系结构国家重点实验室
中国科学院大学计算机与控制学院
-
出处
《高技术通讯》
EI
CAS
北大核心
2018年第11期885-898,共14页
-
基金
国家重点研发计划(2017YFC0803401)
国家自然科学基金(61332009
+4 种基金
61732018)
计算机体系结构国家重点实验室创新课题(CARCH3303
CARCH3407
CARCH3502
CARCH3505)资助项目
-
文摘
研究了数据流架构的指令调度策略,基于当前普遍采用的数据流指令调度机制,提出了支持模式切换的动态指令调度机制。由于数据流架构执行模式具有并行化特点,同一时刻存在大量并行传递的数据和并行的计算,网络传输负载呈现出非均匀的分布模式。局部网络传输压力过大导致数据流节点中的处理单元内部出现流水线停顿,片上网络(NoC)的局部传输效率降低,从而影响数据流架构的网络传输延迟、计算部件的利用率和整体的执行效率,因此针对原有的指令调度策略提出改进方案。针对网络负载的动态变化实时调整指令调度策略,从而达到缓解网络局部拥塞,提高网络传输效率的目的。本研究使用数据流模拟器对提出的机制进行验证,实验结果表明,采用本文提出的指令调度机制,数据流网络的传输延迟平均降低了12. 8%,计算部件的利用率平均提高了14. 4%,数据流架构的整体性能平均提高了14. 7%。
-
关键词
数据流架构
动态指令调度
片上网络(NoC)
网络负载
单元利用率
-
Keywords
dataflow architecture
dynamic instruction scheduling
network-on-chip (NoC)
network loading
utilization of computational unit
-
分类号
TP393.06
[自动化与计算机技术—计算机应用技术]
-
-
题名基于平铺数据流的可配置神经网络加速器
被引量:3
- 3
-
-
作者
李艺煌
马胜
郭阳
陈桂林
徐睿
-
机构
国防科技大学计算机学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2019年第6期963-972,共10页
-
基金
国家自然科学基金(61672526)
校预研基金(ZK17-03-06)
-
文摘
卷积神经网络已经是公认最好的用于深度学习的算法,被广泛地应用于图像识别、自动翻译和广告推荐。由于神经网络结构规模的逐渐增大,使其具有大量的神经元和突触,所以,使用专用加速硬件挖掘神经网络的并行性已经成为了热门的选择。在硬件设计中,经典的平铺结构实现了很高的性能,但是平铺结构的单元利用率很低。目前,随着众多深度学习应用对硬件性能要求的逐渐提高,加速器对单元利用率也具有越来越严格的要求。为了在平铺数据流结构上获得更高的单元利用率,可以调换并行的顺序,采用并行输入特征图和输出通道的方式来提高计算的并行性。但是,随着神经网络运算对硬件性能要求的提高,运算单元阵列必然会越来越大。当阵列大小增加到一定程度,相对单一的并行方式会使利用率逐渐下降。这就需要硬件可以开发更多的神经网络并行度,从而抑制单元空转。同时,为了适应不同的网络结构,要求硬件阵列对神经网络的运算是可配置的。但是,可配置硬件会极大地增加硬件开销和数据的调度难度。提出了一种基于平铺结构加速器的并行度可配置的神经网络加速器。为了减少硬件复杂度,提出了部分配置的技术,既能满足大型单元阵列下单元利用率的提升,也能尽可能地减少硬件额外开销。在阵列大小超过512之后,硬件单元利用率平均可以维持在82%~90%。同时加速器性能与单元阵列数量基本成线性比例上升。
-
关键词
神经网络
平铺数据流
可配置
单元利用率
并行性
-
Keywords
CNN
tiling dataflow
configurable
parallelism
-
分类号
TP368.1
[自动化与计算机技术—计算机系统结构]
-