多尺度特征融合的移动端单目深度估计研究

Mobile monocular depth estimation based on multi-scale feature fusion

在线阅读下载PDF

导出

摘要目前基于深度学习的深度估计模型参数量大,难以适应移动端设备。针对此问题,提出一种可以部署在移动端的多尺度特征融合轻量级深度估计方法。首先,以MobileNetV2为主干,提取出4个尺度的特征。然后,通过构建编码器到解码器的跳跃连接路径,将4个尺度的特征进行融合,充分利用融合低层的位置信息和高层的语义信息。最后,融合后的特征通过卷积层得出高精度的深度图像。在NYU Depth Dataset V2数据集上进行了训练和测试,结果表明,该模型的参数量在仅有1.6×106的情况下,评估指标δ1高达0.812,在移动端的麒麟980 CPU上推理一幅图像仅需要0.094 s,具有实际应用价值。 The current depth estimation model based on depth learning has a large number of parameters,which is difficult to adapt to mobile devices.To address this issue,a lightweight depth estimation method with multi-scale feature fusion that can be deployed on mobile devices is proposed.Firstly,MobileNetV2 is used as the backbone to extract features of four scales.Then,by constructing skip connection paths from the encoder to the decoder,the features of the four scales are fused,fully utilizing the combined positional information from lower layers and semantic information from higher layers.Finally,the fused features are processed through convolutional layers to produce high-precision depth images.After training and testing on NYU Depth Dataset V2,the experimental results show that the proposed model achieves advanced performance with an evaluation index ofδ1 up to 0.812 while only having 1.6×106 parameters numbers.Additionally,it only takes 0.094 seconds to infer a single image on the Kirin 980 CPU of a mobile device,demonstrating its practical application value.

作者陈磊梁正友孙宇蔡俊民 CHEN Lei;LIANG Zheng-you;SUN Yu;CAI Jun-min(School of Computer and Electronics Information,Guangxi University,Nanning 530004;Guangxi Key Laboratory of Multimedia Communications and Network Technology,Nanning 530004,China)

机构地区广西大学计算机与电子信息学院广西多媒体通信与网络技术重点实验室

出处《计算机工程与科学》 CSCD 北大核心 2024年第9期1616-1624,共9页 Computer Engineering & Science

基金国家自然科学基金(62171145)。

关键词深度学习深度估计多尺度特征轻量级网络移动端模型 deep learning depth estimation multi-scale feature lightweight network mobile terminal model

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

作者简介陈磊(1996),男,广东湛江人,硕士,研究方向为图像处理和人工智能。E-mail:leibnizchne@foxmail.com,通信地址:530004,广西南宁市广西大学计算机与电子信息学院;梁正友(1968),男,广西崇左人,博士,教授,CCF会员(16803M),研究方向为计算机视觉、点云处理和三维重建。E-mail:zhyliang@gxu.edu.cn;孙宇(1981),女,广西南宁人,博士,讲师,研究方向为智能计算、数据挖掘和深度学习。E-mail:sunyu@gxu.edu.cn;蔡俊民(1998),男,广西玉林人,硕士,研究方向为图像处理、点云处理和点云识别。E-mail:cjm982538@163.com。

引文网络
相关文献

1义凯.基于深度学习的钢材表面缺陷检测算法研究[J].机械工程与自动化,2024(5):52-55. 被引量：1
2马赛,葛海波,何文昊,程梦洋,安玉.轻量高效的自底向上人体姿态估计算法研究[J].计算机工程与应用,2024,60(18):217-229. 被引量：1
3孙俐,高尚.基于改进MobileNet的指静脉识别算法[J].计算机与数字工程,2024,52(7):1966-1968.
4刘芳,姜生伟,张峻豪,何姗.基于NanoDet-SimAM小尺寸松材线虫病受害木检测[J].沈阳工业大学学报,2024,46(4):428-433. 被引量：3
5周方.基于优化改进的YOLOv4算法在骑行头盔佩戴检测上的研究[J].西安交通工程学院学术研究,2024,9(2):34-40.
6张帅,程志友,田甜,徐正林,杨猛.基于马尔可夫转移场和轻量级网络的非侵入式负荷识别[J].电力系统保护与控制,2024,52(17):51-61. 被引量：1
7闻亮,王江,梁国标,李贞妮.基于YOLOv5轻量化网络的人脸口罩识别方法研究[J].医疗卫生装备,2024,45(9):7-13. 被引量：1
8戈若男,李飞.轻量化SSD的人脸检测[J].现代计算机,2024,30(13):27-31. 被引量：2
9苏航,陈旭昊,寿德荣,张朝阳,许彪,孙丙宇.基于注意力机制轻量化模型的植物病害识别方法[J].江苏农业学报,2024,40(8):1389-1399. 被引量：1
10蔡俊民,梁正友,孙宇,陈子奥.基于可变形三维图卷积的轻量级点云分类研究[J].计算机工程,2024,50(9):255-265.

计算机工程与科学

2024年第9期

浏览历史

内容加载中请稍等...

多尺度特征融合的移动端单目深度估计研究

相关作者

相关机构

相关主题

浏览历史