期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向细粒度FPGA管理的CNN异构加速框架 被引量:2
1
作者 郭开诚 吴承刚 +2 位作者 张伟丰 戚正伟 管海兵 《计算机学报》 EI CAS CSCD 北大核心 2021年第12期2529-2541,共13页
近年来,现场可编程逻辑门阵列(FPGA)由于其灵活的可定制性和优秀的并行性,在硬件加速卷积神经网络(CNN)的研究和应用中吸引了广泛的关注.这些工作主要集中在两方面:对特定硬件加速模块的设计和优化以及对一类网络模型的通用加速硬件设计... 近年来,现场可编程逻辑门阵列(FPGA)由于其灵活的可定制性和优秀的并行性,在硬件加速卷积神经网络(CNN)的研究和应用中吸引了广泛的关注.这些工作主要集中在两方面:对特定硬件加速模块的设计和优化以及对一类网络模型的通用加速硬件设计.前者一般是基于数据流的针对固定网络的设计,通过牺牲通用性来换取性能;后者一般是基于指令集能够加速一类模型的设计,通过牺牲性能来换取通用性.为了能够灵活地应对不同的需求,本文提出一种通过管理不同粒度算子来平衡性能与通用性的fGrain框架.该框架一方面利用底层基于数据流的算子设计来充分发挥硬件性能,另一方面通过虚拟化层来管理算子映射提供灵活性.实验表明,相比GPU推理延迟至多有25%的提升,而虚拟化性能损失仅在1.3%以下. 展开更多
关键词 卷积神经网络 现场可编程逻辑门阵列 机器学习系统 用户态虚拟化 开放编程语言
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部