-
题名一种基于数据标准差的卷积神经网络量化方法
被引量:4
- 1
-
-
作者
黄赟
张帆
郭威
陈立
羊光
-
机构
信息工程大学
国家数字交换系统工程技术研究中心
河南省广播电视监测中心
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2023年第3期639-647,共9页
-
基金
国家自然科学基金创新研究群体项目(No.61521003)。
-
文摘
当前卷积神经网络模型存在规模过大且运算复杂的问题,难以应用部署在资源受限的计算平台.针对此问题,本文基于数据标准差提出了一种适合部署在现场可编程门阵列(Field Programmable Gate Array, FPGA)上的对数量化方法 .首先,依据FPGA的特性提出对数量化方法,将32 bit浮点乘法运算转换为整数乘法及移位运算,提高了运算效率.然后通过研究数据分布特点,提出基于数据标准差的输入量化及权值混合bit量化方法,能够有效减少量化损失.通过对RepVGG、EfficientNet等网络进行效率与精度对比实验,8 bit量化使得大型神经网络精度仅下降1%左右;输入量化为8 bit,权重量化为10 bit场景下,模型精度损失小于0.2%,达到浮点模型几乎相同的准确率.实验表明,所提量化方法能够使得模型大小减少75%左右,在基本保持原有模型准确率的同时有效地降低功耗损失、提高运算效率.
-
关键词
卷积神经网络
现场可编程门阵列
对数量化
数据标准差
混合bit
-
Keywords
convolutional neural networks
field programmable gate array(FPGA)
logarithmic quantization
stan⁃dard deviation of the data
mixed bit number
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-