期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于FPGA与RK3588图像分类处理系统设计与实现
1
作者 袁小平 涂齐阳 《实验技术与管理》 北大核心 2025年第9期91-102,共12页
为解决ViT模型在基于CPU侧平台运行效率低、延迟长的问题,该文设计了一款基于FPGA(field-programmable gate array,现场可编程门阵列)+NPU(neural network processing unit,神经网络处理器)的图像采集与处理系统(简称“FPGA系统”)。系... 为解决ViT模型在基于CPU侧平台运行效率低、延迟长的问题,该文设计了一款基于FPGA(field-programmable gate array,现场可编程门阵列)+NPU(neural network processing unit,神经网络处理器)的图像采集与处理系统(简称“FPGA系统”)。系统首先利用FPGA时序控制与计算的稳定性,适配图像传感器接口像素传输带宽,将patch-embeding层分解为向量式计算处理,并利用流水线设计对模型叠加项融合后的张量进行累计输出,得到patch-embeding的计算结果后,将输出叠加位置标志拼接为位置标识报文;随后利用UDP(user datagram protocol,用户数据报协议)的协议栈从FPGA输出patch-embeding神经网络结构的计算结果,同时实现并发的图像采集、视频呈现、UDP传输任务;最后,基于RK3588的NPU实现了多线程和线程池设计、UDP接收、线程池处理注意力计算任务。在划分设计流程、验证设计、优化调试后,每帧运行平均时间由最初0.6439 s提升至0.0995 s,FPGA系统Block RAM资源用量为56.42%,且未出现时序违例,对行人识别精度的平均值为0.85,对车辆识别平均精度为0.905。 展开更多
关键词 FPGA RK3588 向量式计算 叠加项融合 位置标识报文 多线程设计
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部