- 
                题名基于全局与局部注意力的车辆方位场景识别
                    被引量:1
            
- 1
- 
                
            
- 
                
                            作者
                                翟永杰
                                刘璇
                                王新颖
                                王乾铭
                                刘金龙
                
            
- 
                    机构
                    
                            华北电力大学控制与计算机工程学院
                            邦邦汽车销售服务(北京)有限公司
                    
                
- 
                出处
                
                
                    《电子测量技术》
                    
                            北大核心
                    
                2024年第14期96-107,共12页
            
- 
                        基金
                        
                                    国家自然科学基金资助项目(62373151)
                                    河北省自然科学基金面上项目(F2023502010)
                                    中央高校基本科研业务费专项资金(2023JC006)项目资助。
                        
                    
- 
                    文摘
                        针对当前车辆方位场景识别任务中存在因特征相似而导致的左右类别、前后类别识别混淆等问题,设计了融合全局-局部注意力的车辆方位场景识别方法。首先,引入车辆多方位场景的概念,通过OSMNet方位场景匹配网络进行特征提取并进行场景的分类,其次,为使模型在不同方位场景中聚焦关键区域以有效学习车辆的空间方位,设计了全局局部注意力模块。最后,针对部分车辆方位场景之间存在类间距离小于类内距离的问题,设计了全局-局部位置注意力模块。在构建的8类场景数据集上进行实验,消融实验显示,本文所提出的D-CBAM和HGLP模块有效地增强了对特征图的全局和局部信息的捕捉能力,将模型识别准确率提高了3.54%和4.22%;对比实验显示,所提模型的准确率达到了95.49%,与基线模型相比提高了5.46%,模型总体识别效果优于其他分类模型,其中大部分方位的识别效果优于基线模型。结果表明本文提出的改进分类模型有效的学习了车辆方位信息,为远中近景图像的匹配提供桥梁,同时也为车辆多部件检测和分割等任务奠定基础。
                        
                    
            
- 
                    关键词
                    
                            车辆方位
                            场景识别
                            深度学习
                            图像分类
                            全局注意力
                            位置注意力
                    
                
- 
                    Keywords
                    
                            vehicle orientation
                            scene recognition
                            deep learning
                            image classification
                            global attention
                            positional attention
                    
                
- 
                    分类号
                    
                            
                                
                                    TN911.73
[电子电信—通信与信息系统]                                
                            
                    
                
-