-
题名面向细粒度FPGA管理的CNN异构加速框架
被引量:2
- 1
-
-
作者
郭开诚
吴承刚
张伟丰
戚正伟
管海兵
-
机构
上海交通大学电子信息与电气工程学院
阿里巴巴集团
-
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2021年第12期2529-2541,共13页
-
基金
国家自然科学基金(61672344,61525204,61732010)
国家重点研发计划(2016YFB1000502)
阿里巴巴创新研究计划(AIR)资助。
-
文摘
近年来,现场可编程逻辑门阵列(FPGA)由于其灵活的可定制性和优秀的并行性,在硬件加速卷积神经网络(CNN)的研究和应用中吸引了广泛的关注.这些工作主要集中在两方面:对特定硬件加速模块的设计和优化以及对一类网络模型的通用加速硬件设计.前者一般是基于数据流的针对固定网络的设计,通过牺牲通用性来换取性能;后者一般是基于指令集能够加速一类模型的设计,通过牺牲性能来换取通用性.为了能够灵活地应对不同的需求,本文提出一种通过管理不同粒度算子来平衡性能与通用性的fGrain框架.该框架一方面利用底层基于数据流的算子设计来充分发挥硬件性能,另一方面通过虚拟化层来管理算子映射提供灵活性.实验表明,相比GPU推理延迟至多有25%的提升,而虚拟化性能损失仅在1.3%以下.
-
关键词
卷积神经网络
现场可编程逻辑门阵列
机器学习系统
用户态虚拟化
开放编程语言
-
Keywords
convolution neural network
filed-programmable gate arrays
machine learning system
user-mode virtualization
open computing language
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-