期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于单目相机的复杂场景深度估计网络
1
作者 陈占国 陈振军 +4 位作者 薛晨霞 王国亮 李金峄 李玉廷 于保才 《辽宁工程技术大学学报(自然科学版)》 北大核心 2025年第4期505-512,共8页
为提升复杂多变场景下深度估计的精度,提出一种基于U型编码器-解码器的单目深度估计网络。采用Swin Transformer架构作为编码器核心,实现对输入数据多层级、多尺度的精细化特征提取。采用逐层扩张卷积提取多尺度局部特征,通过特征交互... 为提升复杂多变场景下深度估计的精度,提出一种基于U型编码器-解码器的单目深度估计网络。采用Swin Transformer架构作为编码器核心,实现对输入数据多层级、多尺度的精细化特征提取。采用逐层扩张卷积提取多尺度局部特征,通过特征交互模块交互局部和全局特征,实现对复杂场景的更全面理解。采用对称式Transformer解码器并结合图像块扩展层将相邻维度的特征图重塑为更高分辨率的特征图,最终输出像素级深度预测结果。在NYU Depth v2数据集和KITTI数据集上进行定量实验。研究结果表明:该网络在复杂多变场景中具有高效性和实用性。研究方法突破了传统方法在复杂多变场景下的局限性,为深度估计的理论研究提供新的视角和方法。 展开更多
关键词 单目深度估计 U型编码器-解码器 逐层扩张卷积 特征交互模块 对称式Transformer解码器
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部