期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
用于深度学习训练加速的自适应框架设计 被引量:2
1
作者 范涛 樊平 成元庆 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2021年第6期974-982,共9页
用FPGA加速深度学习算法的训练过程通常需要较长的开发周期和丰富的硬件设计经验.为了应对这一挑战,设计了一种基于自适应模板技术的深度学习算法训练加速框架,在应用规模、并行调度策略、资源使用和功能扩展上进行了深入的研究并提出... 用FPGA加速深度学习算法的训练过程通常需要较长的开发周期和丰富的硬件设计经验.为了应对这一挑战,设计了一种基于自适应模板技术的深度学习算法训练加速框架,在应用规模、并行调度策略、资源使用和功能扩展上进行了深入的研究并提出了相应的优化策略.采用CPU-FPGA异构加速模板技术,提出了自适应的上层模型编译框架实现与不同硬件加速资源的适配.这种基于定制模板的软硬件协同设计可以很好地适配不同的FPGA芯片并支持算法的快速迭代.用图神经网络算法数据进行加速对比实验,实现了与CPU相比7~41倍的速度提升. 展开更多
关键词 深度学习 图神经网络 异构加速器 现场可编程门阵列
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部