-
题名高能效CNN加速器设计
- 1
-
-
作者
喇超
李淼
张峰
张翠婷
-
机构
北京中科格励微科技有限公司
中国科学院自动化研究所国家专用集成电路设计工程技术研究中心
-
出处
《计算机科学与探索》
北大核心
2025年第9期2520-2531,共12页
-
文摘
当前,卷积神经网络(CNN)被广泛应用于图片分类、目标检测与识别以及自然语言理解等领域。随着卷积神经网络的复杂度和规模不断增加,对硬件部署带来了极大的挑战,尤其是面对嵌入式应用领域的低功耗、低时延需求,大多数现有平台存在高功耗、控制复杂的问题。为此,以优化加速器能效为目标,对决定系统能效的关键因素进行分析,以缩放计算精度和降低系统频率为主要出发点,研究极低比特下全网络统一量化方法,设计一种高能效CNN加速器MSNAP。该加速器以1比特权重和4比特激活值的轻量化计算单元为基础,构建了128×128空间并行加速阵列结构,由于空间并行度高,整个系统采用低运行频率。同时,采用权重固定、特征图广播的数据传播方式,有效减少权重、特征图的数据搬移次数,达到降低功耗、提高系统能效比的目的。通过22 nm工艺流片验证,结果表明,在20 MHz频率下,峰值算力达到10.54 TOPS,能效比达到64.317 TOPS/W,相较同类型加速器在采用CIFAR-10数据集的分类网络中,该加速器能效比有5倍的提升。部署的目标检测网络YOLO能够达到60 FPS的检测速率,完全满足嵌入式应用需求。
-
关键词
加速器
卷积神经网络(CNN)
轻量化神经元计算单元(NCU)
MSNAP
分支卷积量化(bcq)
-
Keywords
accelerator
convolutional neural network(CNN)
lightweight computation neuron(NCU)
modified simple neural acceleration processor(MSNAP)
branch convolution quantization(bcq)
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
TN492
[电子电信—微电子学与固体电子学]
-