期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于FPGA与RK3588图像分类处理系统设计与实现
1
作者
袁小平
涂齐阳
《实验技术与管理》
北大核心
2025年第9期91-102,共12页
为解决ViT模型在基于CPU侧平台运行效率低、延迟长的问题,该文设计了一款基于FPGA(field-programmable gate array,现场可编程门阵列)+NPU(neural network processing unit,神经网络处理器)的图像采集与处理系统(简称“FPGA系统”)。系...
为解决ViT模型在基于CPU侧平台运行效率低、延迟长的问题,该文设计了一款基于FPGA(field-programmable gate array,现场可编程门阵列)+NPU(neural network processing unit,神经网络处理器)的图像采集与处理系统(简称“FPGA系统”)。系统首先利用FPGA时序控制与计算的稳定性,适配图像传感器接口像素传输带宽,将patch-embeding层分解为向量式计算处理,并利用流水线设计对模型叠加项融合后的张量进行累计输出,得到patch-embeding的计算结果后,将输出叠加位置标志拼接为位置标识报文;随后利用UDP(user datagram protocol,用户数据报协议)的协议栈从FPGA输出patch-embeding神经网络结构的计算结果,同时实现并发的图像采集、视频呈现、UDP传输任务;最后,基于RK3588的NPU实现了多线程和线程池设计、UDP接收、线程池处理注意力计算任务。在划分设计流程、验证设计、优化调试后,每帧运行平均时间由最初0.6439 s提升至0.0995 s,FPGA系统Block RAM资源用量为56.42%,且未出现时序违例,对行人识别精度的平均值为0.85,对车辆识别平均精度为0.905。
展开更多
关键词
FPGA
RK3588
向量式计算
叠加项融合
位置标识报文
多线程设计
在线阅读
下载PDF
职称材料
题名
基于FPGA与RK3588图像分类处理系统设计与实现
1
作者
袁小平
涂齐阳
机构
中国矿业大学信息与控制工程学院
出处
《实验技术与管理》
北大核心
2025年第9期91-102,共12页
基金
中国矿业大学2023年国家级大学生创新训练项目(202310290032Z)
中国矿业大学智慧课程建设(2024KC19)。
文摘
为解决ViT模型在基于CPU侧平台运行效率低、延迟长的问题,该文设计了一款基于FPGA(field-programmable gate array,现场可编程门阵列)+NPU(neural network processing unit,神经网络处理器)的图像采集与处理系统(简称“FPGA系统”)。系统首先利用FPGA时序控制与计算的稳定性,适配图像传感器接口像素传输带宽,将patch-embeding层分解为向量式计算处理,并利用流水线设计对模型叠加项融合后的张量进行累计输出,得到patch-embeding的计算结果后,将输出叠加位置标志拼接为位置标识报文;随后利用UDP(user datagram protocol,用户数据报协议)的协议栈从FPGA输出patch-embeding神经网络结构的计算结果,同时实现并发的图像采集、视频呈现、UDP传输任务;最后,基于RK3588的NPU实现了多线程和线程池设计、UDP接收、线程池处理注意力计算任务。在划分设计流程、验证设计、优化调试后,每帧运行平均时间由最初0.6439 s提升至0.0995 s,FPGA系统Block RAM资源用量为56.42%,且未出现时序违例,对行人识别精度的平均值为0.85,对车辆识别平均精度为0.905。
关键词
FPGA
RK3588
向量式计算
叠加项融合
位置标识报文
多线程设计
Keywords
FPGA
RK3588
vectorized computation
superposition fusion
location identification message
multi-threaded design
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于FPGA与RK3588图像分类处理系统设计与实现
袁小平
涂齐阳
《实验技术与管理》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部