期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于FPGA的YOLOv4-tiny硬件优化与实现
1
作者
王凯
柏艳红
+1 位作者
李小松
李浩然
《组合机床与自动化加工技术》
北大核心
2025年第9期24-27,33,共5页
针对YOLOv4-tiny算法结构复杂、计算资源消耗大、参数众多,难以在FPGA上高效部署的问题,提出了一种软硬件结合的优化策略。将YOLOv4-tiny的骨干网络替换为Mobilenetv1网络,在加强特征提取网络中引入CBAM模块;对网络结构进行通道剪枝,对...
针对YOLOv4-tiny算法结构复杂、计算资源消耗大、参数众多,难以在FPGA上高效部署的问题,提出了一种软硬件结合的优化策略。将YOLOv4-tiny的骨干网络替换为Mobilenetv1网络,在加强特征提取网络中引入CBAM模块;对网络结构进行通道剪枝,对权重和偏置进行16位定点数量化。改进后的网络与原始YOLOv4-tiny相比参数量减少了40%,而识别准确率基本不变。使用高层次综合工具生成FPGA IP核,设计并行流水化的卷积结构并采用卷积层间分块操作,提高计算效率。将改进后算法在Zynq-7020FPGA芯片上实现,实验结果表明,改进后算法计算性能为43.4 GOP/s,是现有文献的1.6~4.1倍;能效比是现有的工作的4.8~10.7倍。所提策略能更高效地将算法部署在资源受限的FPGA平台上。
展开更多
关键词
YOLOv4-tiny
算法剪枝
算法量化
FPGA
并行流水结构
在线阅读
下载PDF
职称材料
题名
基于FPGA的YOLOv4-tiny硬件优化与实现
1
作者
王凯
柏艳红
李小松
李浩然
机构
太原
科技
大学
电子
信息工程
学院
山西电子科技学院智能制造工业学院
出处
《组合机床与自动化加工技术》
北大核心
2025年第9期24-27,33,共5页
基金
山西电子科技学院人才引进科研启动基金项目(2023RKJ018)
三维时空融合的电力工程现场安全风险辨识与作业管控关键技术研究项目(2024TYJB0133)。
文摘
针对YOLOv4-tiny算法结构复杂、计算资源消耗大、参数众多,难以在FPGA上高效部署的问题,提出了一种软硬件结合的优化策略。将YOLOv4-tiny的骨干网络替换为Mobilenetv1网络,在加强特征提取网络中引入CBAM模块;对网络结构进行通道剪枝,对权重和偏置进行16位定点数量化。改进后的网络与原始YOLOv4-tiny相比参数量减少了40%,而识别准确率基本不变。使用高层次综合工具生成FPGA IP核,设计并行流水化的卷积结构并采用卷积层间分块操作,提高计算效率。将改进后算法在Zynq-7020FPGA芯片上实现,实验结果表明,改进后算法计算性能为43.4 GOP/s,是现有文献的1.6~4.1倍;能效比是现有的工作的4.8~10.7倍。所提策略能更高效地将算法部署在资源受限的FPGA平台上。
关键词
YOLOv4-tiny
算法剪枝
算法量化
FPGA
并行流水结构
Keywords
YOLOv4-tiny
algorithm pruning
algorithm quantization
FPGA
parallel pipelined architecture
分类号
TH165 [机械工程—机械制造及自动化]
TG659 [金属学及工艺—金属切削加工及机床]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于FPGA的YOLOv4-tiny硬件优化与实现
王凯
柏艳红
李小松
李浩然
《组合机床与自动化加工技术》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部