期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
结合半波高斯量化与交替更新的神经网络压缩方法 被引量:4
1
作者 张红梅 严海兵 张向利 《计算机工程》 CAS CSCD 北大核心 2021年第5期80-87,共8页
为使神经网络模型能在实时性要求较高且内存容量受限的边缘设备上部署使用,提出一种基于半波高斯量化与交替更新的混合压缩方法。对神经网络模型输入部分进行2 bit均匀半波高斯量化,将量化值输入带有缩放因子的二值网络通过训练得到初... 为使神经网络模型能在实时性要求较高且内存容量受限的边缘设备上部署使用,提出一种基于半波高斯量化与交替更新的混合压缩方法。对神经网络模型输入部分进行2 bit均匀半波高斯量化,将量化值输入带有缩放因子的二值网络通过训练得到初始二值模型,利用交替更新方法对已训练的二值模型进行逐层微调以提高模型测试精度。在CIFAR-10和ImageNet数据集上的实验结果表明,该方法能有效降低参数和结构冗余所导致的内存和时间开销,在神经网络模型压缩比接近30的前提下,测试精度相比HWGQ-Net方法提高0.8和2.0个百分点且实现了10倍的训练加速。 展开更多
关键词 卷积神经网络 量化 模型压缩 半波高斯量化 交替更新
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部