多元信息监督的遥感图像有向目标检测被引量：3

Multi-information supervision in optical remote sensing images

导出

摘要遥感图像有向目标检测是遥感图像解译中的一项基础任务,在许多领域有着广泛的应用。由于遥感图像目标尺度差异性大、方向任意且紧密排列,传统目标检测所使用的水平框无法准确的定位目标。因此,遥感图像有向目标检测成为目前遥感领域的研究热点。受益于深度学习的发展,遥感图像有向目标检测取得了突破性进展,但是大多数方法仅在检测头部加入角度预测参数,在训练过程中没有充分利用角度信息和语义信息。本文提出了一种多元信息监督的遥感图像有向目标检测方法。首先,在感兴趣区域提取阶段利用角度信息监督网络学习目标方向,从而使网络第一阶段生成更加贴近遥感图像目标的有向候选区域。其次,为了充分利用图像语义信息,本文在网络第二阶段增加语义分支,并使用图像语义标签进行监督学习。本文以Faster R-CNN OBB为基准,在DOTA数据集上验证所提方法的有效性。本文方法相比基准,平均精度(mAP)提升了2.8%,最终的检测精度(mAP)达到74.6%。 Oriented object detection is a basic task in the interpretation of high-resolution remote sensing images.Compared with general detectors,oriented detectors can locate instances with oriented bounding boxes,which are consistent with arbitrary-oriented ground truths in remote sensing images.Currently,oriented object detection has greatly progressed with the development of the convolutional neural network.However,this task is still challenging because of the extreme variation in object scales and arbitrary orientations.Most oriented detectors are evolved from horizontal detectors. They first generate horizontal proposals using the Region Proposal Network (RPN). Then,they classify these proposals into different categories and transform them into oriented bounding boxes. Despite their success, thesedetectors exploit only the annotations at the end of the network and do not fully utilize the angle and semantic information.This work proposes an Angle-based Region Proposal Network (ARPN), which learns the angle of objects and generates orientedproposals. The structure of ARPN is the same as that of RPN. However, for each proposal, instead of outputting four parameters forregression, ARPN generates five parameters, which are the center (x, y), shape (w, h), and angle (t). In the training, we first assign anchorswith ground truths by the Intersection of Unions. Then, we directly supervise the ARPN with the shape and angle information of groundtruths. We also propose a semantic branch to output image semantic results for utilizing the advantage of the semantic information. Thesemantic branch consists of two convolutional layers and is parallel with the detection head. We first assign objects to different scale levelsaccording to their areas. Then, we create semantic labels in each scale and use them to supervise the semantic branch. With the semanticinformation supervision, the model will learn translation-variant features and improve accuracy. Moreover, the outputs of the semanticbranch indicate the objectness in each place, which can filter out false positives of final predictions.We conduct comprehensive experiments on the DOTA dataset to validate the effectiveness of the proposed methods. In the datapreparation, we first crop original images into 1024×1024 patches with the stride of 824. Compared with the baseline, the ARPN achieves a2.2% increase in mAP, while the semantic branch contributes an additional 0.8% improvement in mAP. Finally, we combine both methodsand achieve a 74.64% mAP, which is competitive with those obtained by other oriented object detectors. We visualize some results on theDOTA dataset. The results show that our method is highly effective for small objects and densely packed objects.We proposed ARPN and the semantic branch to utilize the multi-information in remote sensing images. The ARPN can directlygenerate oriented proposals, which can lead to better recall of oriented objects. The semantic branch increases the translation-variantproperty of the features. Experiments demonstrate the effectiveness of our method, which achieves a 74.64% mAP on the DOTA dataset. Inthe future works, we will focus on the model efficiency and the inference speed.

作者王家宝程塨谢星星姚艳清韩军伟 WANG Jiabao;CHENG Gong;XIE Xingxing;YAO Yanqing;HAN Junwei(School of Automation,Northwestern Polytechnical University,Xi’an 710129,China)

机构地区西北工业大学自动化学院

出处《遥感学报》 EI CSCD 北大核心 2023年第12期2726-2735,共10页 NATIONAL REMOTE SENSING BULLETIN

基金国家自然科学基金(编号:61772425) 陕西省杰出青年科学基金(编号:2021JC-16)。

关键词目标检测有向目标检测区域建议提取多元信息遥感图像 object detection oriented object detection region proposal generation multi-information remote sensing images

分类号 TP701 [自动化与计算机技术—检测技术与自动化装置] P2 [天文地球—测绘科学与技术]

作者简介第一作者:王家宝,研究方向为高分辨率遥感图像理解。E-mail:jbwang@mail.nwpu.edu.cn;通信作者:程塨,研究方向为高分辨率遥感图像理解。E-mail:gcheng@nwpu.edu.cn。

引文网络
相关文献

参考文献7

1曹琼,马爱龙,钟燕飞,赵济,赵贝,张良培.高光谱-LiDAR多级融合城区地表覆盖分类[J].遥感学报,2019,23(5):892-903. 被引量：25
2陈凯强,高鑫,闫梦龙,张跃,孙显.基于编解码网络的航空影像像素级建筑物提取[J].遥感学报,2020,24(9):1134-1142. 被引量：22
3龚健雅,钟燕飞.光学遥感影像智能化处理研究进展[J].遥感学报,2016,20(5):733-747. 被引量：37
4孙显,梁伟,刁文辉,曹志颖,冯瑛超,王冰,付琨.遥感边缘智能技术研究进展及挑战[J].中国图象图形学报,2020,25(9):1719-1738. 被引量：10
5姚红革,王诚,喻钧,白小军,李蔚.复杂卫星图像中的小目标船舶识别[J].遥感学报,2020,24(2):116-125. 被引量：20
6姚艳清,程塨,谢星星,韩军伟.多分辨率特征融合的光学遥感图像目标检测[J].遥感学报,2021,25(5):1124-1137. 被引量：35
7周培诚,程塨,姚西文,韩军伟.高分辨率遥感影像解译中的机器学习范式[J].遥感学报,2021,25(1):182-197. 被引量：63

二级参考文献30

1姚红革,王诚,喻钧,白小军,李蔚.复杂卫星图像中的小目标船舶识别[J].遥感学报,2020,24(2):116-125. 被引量：20
2杨桄,刘湘南.遥感影像解译的研究现状和发展趋势[J].国土资源遥感,2004,16(2):7-10. 被引量：58
3李二森,朱述龙,周晓明,余文杰.高光谱图像端元提取算法研究进展与比较[J].遥感学报,2011,15(4):659-679. 被引量：32
4周志华.基于分歧的半监督学习[J].自动化学报,2013,39(11):1871-1878. 被引量：88
5杨名,阮雅端,陈林凯,张鹏,陈启美.甚高速区域卷积神经网络的船舶视频检测方法[J].北京邮电大学学报,2017,40(S1):130-134. 被引量：12
6童庆禧,张兵,张立福.中国高光谱遥感的前沿进展[J].遥感学报,2016,20(5):689-707. 被引量：292
7龚健雅,钟燕飞.光学遥感影像智能化处理研究进展[J].遥感学报,2016,20(5):733-747. 被引量：37
8童旭东.中国高分辨率对地观测系统重大专项建设进展[J].遥感学报,2016,20(5):775-780. 被引量：76
9张良培,沈焕锋.遥感数据融合的进展与前瞻[J].遥感学报,2016,20(5):1050-1061. 被引量：80
10范一大,吴玮,王薇,刘明,温奇.中国灾害遥感研究进展[J].遥感学报,2016,20(5):1170-1184. 被引量：81

共引文献190

1张琪,张光辉,张岩,王佳希,余双武.基于不同分辨率遥感影像自动提取切沟的精度分析和转换模型[J].遥感技术与应用,2022,37(5):1217-1226. 被引量：2
2李欣,杨懿,王宁,顾海燕,丁少鹏,李海涛.遥感影像样本自动生成与智能迭代分类方法[J].测绘科学,2022,47(8):197-203. 被引量：5
3周国清,黄景金,舒磊.基于FPGA的P-H法星上解算卫星相对姿态[J].武汉大学学报（信息科学版）,2018,43(12):1838-1846.
4王东华,张宏伟.基于国产遥感卫星的典型要素提取技术框架[J].地理信息世界,2017,24(1):9-13. 被引量：2
5夏帆.海洋争端案件中的遥感证据研究[J].太平洋学报,2017,25(6):55-64. 被引量：3
6王偲晗,万幼川,王明威,高雄.改进蚁群算法及其在高光谱影像分类中的研究[J].计算机工程与应用,2018,54(1):196-203. 被引量：8
7周峻松,李石华.2012—2015年中缅油气管道重要节点土地利用/覆被时空变化分析[J].测绘通报,2018(3):113-116. 被引量：3
8肖渝梅.基于全息技术的光学图像信息隐藏研究[J].激光杂志,2018,39(7):105-109. 被引量：7
9宋恬恬,张敏霞,鲍沁星.杭州西湖飞来峰基于“避暑”特征的山林地造园传统智慧研究[J].中国园林,2018,34(7):74-80. 被引量：9
10陈斌,王宏志,徐新良,王首泰,张亚庆.深度学习GoogleNet模型支持下的中分辨率遥感影像自动分类[J].测绘通报,2019(6):29-33. 被引量：16

同被引文献20

1Xiao-dong Hu,Xin-qing Wang,Fan-jie Meng,Xia Hua,Yu-ji Yan,Yu-yang Li,Jing Huang,Xun-lin Jiang.Gabor-CNN for object detection based on small samples[J].Defence Technology（防务技术）,2020,16(6):1116-1129. 被引量：5
2陈旭,彭冬亮,谷雨.基于改进YOLOv5s的无人机图像实时目标检测[J].光电工程,2022,49(3):67-79. 被引量：62
3马梁,苟于涛,雷涛,靳雷,宋怡萱.基于多尺度特征融合的遥感图像小目标检测[J].光电工程,2022,49(4):47-63. 被引量：42
4付宏建,白宏阳,郭宏伟,原瑜蔓,秦伟伟.融合多注意力机制的光学遥感图像目标检测方法[J].光子学报,2022,51(12):304-312. 被引量：18
5张寅,朱桂熠,施天俊,张琨,闫钧华.基于特征融合与注意力的遥感图像小目标检测[J].光学学报,2022,42(24):132-142. 被引量：63
6王友伟,郭颖,邵香迎.基于改进级联算法的遥感图像目标检测[J].光学学报,2022,42(24):195-203. 被引量：19
7汪西莉,梁正印,刘涛.基于特征注意力金字塔的遥感图像目标检测方法[J].遥感学报,2023,27(2):492-501. 被引量：14
8胡杰,安永鹏,徐文才,熊宗权,刘汉.基于激光点云的深度语义和位置信息融合的三维目标检测[J].中国激光,2023,50(10):192-202. 被引量：37
9吴洛冰,谷玉海,吴文昊,范帅鑫.基于多尺度特征提取的遥感旋转目标检测[J].激光与光电子学进展,2023,60(12):443-451. 被引量：8
10王坤,文武,铁菊红,吴锡,符颖.自适应融合多尺度特征的无锚框遥感图像目标检测算法[J].计算机辅助设计与图形学学报,2023,35(9):1405-1416. 被引量：2

引证文献3

1肖振久,张杰浩,林渤翰.特征协同与细粒度感知的遥感图像小目标检测[J].光电工程,2024,51(6):46-58. 被引量：7
2李红岩,徐保庆,张子扬,王伟峰.基于全局上下文信息的遥感图像小目标检测[J].光学学报,2024,44(24):197-204. 被引量：12
3白晨帅,白晓凤,邬开俊,王昊雯.超融合残差行进几何感知的遥感目标检测[J].光学精密工程,2025,33(8):1289-1302.

二级引证文献18

1李龙,孙雅.基于超分重建与Dy-YOLOv7的茶叶分级识别[J].安徽理工大学学报（自然科学版）,2024,44(4):29-39.
2郝明,白鹤,徐婷婷.融合ResNeSt和多尺度特征融合的遥感影像道路提取[J].光电工程,2025,52(1):39-51. 被引量：1
3沈学利,王嘉慧,吴正伟.融合空-频域的动态SAR图像目标检测[J].光电工程,2025,52(1):68-85. 被引量：2
4周韩莲,叶青,刘文祺.复杂背景下的轻量级遥感军用飞机目标检测[J].光电工程,2025,52(2):82-96.
5吴菲,陈嘉诚,杨俊,王万良,李国庆.基于自适应双域注意力网络的遥感图像重建[J].光电工程,2025,52(4):90-104.
6卜丽静,杨贝妮,董国强,张正鹏,杨银,冯聿杰.L2范数先验的可解释性深度学习图像复原算法[J].激光与光电子学进展,2025,62(6):351-360.
7邓泽平,刘辉,涂继亮,叶身辉,廖乃智,赖国超.SGS-YOLO:一种机场保障人员违规着装检测方法[J].激光与光电子学进展,2025,62(6):410-418. 被引量：1
8常凯旋,黄建华,孙希延,罗键,包世涛,黄焕生.基于双模态图像融合的无人机光学小目标检测算法[J].激光与光电子学进展,2025,62(4):269-283. 被引量：1
9贺其,沈浩.无锚点多尺度光学遥感图像条带状目标检测方法[J].激光与光电子学进展,2025,62(4):284-294. 被引量：2
10李颖婕,左东升,金伟其,裘溯.基于光学遥感影像的高铁沿线隐患目标的智能检测[J].光学学报,2025,45(7):256-274.

1齐润泉.基于卷积神经网络的智能化考试系统设计[J].信息技术,2024,48(1):158-162.
2廖玺,赵萌萌,朱晓湉.青少年党史国史教育基地VR网络地图助力“大思政”教育[J].传媒观察,2023(S02):30-32.
3张赛,李春迎,张恒,倪昕晔.基于多深度相机的三维重建技术在放疗中的应用[J].中华放射肿瘤学杂志,2024,33(1):49-55.
4徐子洋,姜新华,白洁,张文婧,李靖.基于多标记深度森林算法的冷鲜羊肉新鲜度无损检测方法[J].光谱学与光谱分析,2024,44(2):580-587. 被引量：3

遥感学报

2023年第12期

浏览历史

内容加载中请稍等...

多元信息监督的遥感图像有向目标检测被引量：3

参考文献7

二级参考文献30

共引文献190

同被引文献20

引证文献3

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

多元信息监督的遥感图像有向目标检测 被引量：3

参考文献7

二级参考文献30

共引文献190

同被引文献20

引证文献3

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

多元信息监督的遥感图像有向目标检测被引量：3