-
题名多级图特征融合引导相机位姿回归
- 1
-
-
作者
司钧文
周自维
-
机构
辽宁科技大学计算机与软件工程学院
-
出处
《光学精密工程》
北大核心
2025年第6期928-944,共17页
-
基金
国家自然科学基金资助项目(No.61575090)
国家自然科学基金青年基金资助项目(No.61803189)
辽宁省自然科学基金资助项目(No.2019-ZD-0031,No.2020FWDF13)。
-
文摘
为了提高复杂场景下相机位姿估计的精度和稳定性,本文自主设计了ResGraphLoc网络,该网络通过引入残差网络与图注意力机制,进一步提高相机在遮挡、光照变化和低纹理场景下的位姿回归精度问题。该网络采用ResNet101作为特征编码器,通过改进的残差块增强显著特征提取能力。利用图注意力层融合多级特征图,并通过多头自注意力机制实现特征信息扩散和聚合。最后,通过非线性MLP层从特征嵌入中提取位置和角度特征,完成端到端相机位姿回归。在大型室外数据集上,ResGraphLoc模型的位姿误差优于现有算法。在LOOP和FULL场景下,位姿回归结果分别为7.18 m,2.48°与16.96 m,3.16°,相比基准模型提升超过25%。在4Seasons数据集的Neighborhood场景下,室外定位误差最低可以达到1.40 m,0.76°。在纹理缺失及重复的室内数据集下,位置角度回归结果分别可以达到0.08 m,3.25°。实验结果验证了ResGraphLoc在复杂环境下的高精度和稳定性,能有效应对遮挡、光照变化和低纹理场景。
-
关键词
计算机视觉
相机位姿回归
相机定位
图注意力
多级特征融合
-
Keywords
computer vision
camera pose estimation
camera localization
graph attention
multi-level feature fusion
-
分类号
TP394.1
[自动化与计算机技术—计算机应用技术]
TH691.9
[机械工程—机械制造及自动化]
-