多模态自适应特征融合的目标检测被引量：3

Object Detection via Multimodal Adaptive Feature Fusion

导出

摘要随着深度学习的发展,基于卷积神经网络(CNN)的目标检测方法取得巨大成功。现有的基于CNN的目标检测模型通常采用单一模态的RGB图像进行训练和测试,但在低光照环境下,检测性能显著下降。为解决此问题,提出了一种基于YOLOv5构建的多模态目标检测网络模型,将RGB图像和热红外图像相结合,以充分利用多模态特征融合信息,从而提升目标检测精度。为了实现多模态特征信息的有效融合,提出了一种多模态自适应特征融合(MAFF)模块。该模块通过自适应地选择不同模态特征并利用各模态间的互补信息,实现多模态特征融合。实验结果表明:所提算法能有效融合不同模态的特征信息,从而显著提高检测精度。 With the advancement of deep learning,object detection methods based on convolutional neural networks(CNNs)have achieved tremendous success.Existing CNN-based object detection models typically employ single-modal RGB images for training and testing;however,their detection performance is significantly degraded in low-light conditions.To address this issue,a multimodal object detection network model built on YOLOv5 is proposed,which integrates RGB and thermal infrared imagery to fully exploit the information provided by the fusion of multi-modal features,increasing the object detection accuracy.To achieve effective fusion of multimodal feature information,a multimodal adaptive feature fusion(MAFF)module is introduced.It facilitated multimodal feature fusion by adaptively selecting diverse modal features and exploiting the complementary information between modalities.The experimental results indicate the efficacy of the proposed algorithm for seamlessly merging features from distinct modalities,which significantly increases the detection accuracy.

作者高小强常侃凌铭阳银梦雨 Gao Xiaoqiang;Chang Kan;Ling Mingyang;Yin Mengyu(School of Computer and Electronic Information,Guangxi University,Nanning 530004,Guangxi,China;Guangxi Key Laboratory of Multimedia Communications and Network Technology,Nanning 530004,Guangxi,China)

机构地区广西大学计算机与电子信息学院广西多媒体通信与网络技术重点实验室

出处《激光与光电子学进展》 CSCD 北大核心 2023年第24期100-109,共10页 Laser & Optoelectronics Progress

基金国家自然科学基金(62171145)。

关键词卷积神经网络多模态 YOLOv5 多模态目标检测自适应特征融合 convolution neural network multimodality YOLOv5 multimodal object detection adaptive feature fusion

分类号 TP391 [自动化与计算机技术—计算机应用技术]

作者简介通信作者:常侃,pandack0619@163.com。

引文网络
相关文献

参考文献10

1刘通,高思洁,聂为之.基于多模态信息融合的多目标检测算法[J].激光与光电子学进展,2022,59(8):329-338. 被引量：16
2宋子壮,杨嘉伟,张东方,王诗强,张越.基于无监督域适应的低空海面红外目标检测[J].光学学报,2022,42(4):119-126. 被引量：13
3何自芬,陈光晨,陈俊松,张印辉.多尺度特征融合轻量化夜间红外行人实时检测[J].中国激光,2022,49(17):115-124. 被引量：32
4Jinpu Lin,Florian Haberstroh,Stefan Karsch,Andreas Döpp.Applications of object detection networks in high-power laser systems and experiments[J].High Power Laser Science and Engineering,2023,11(1):52-60. 被引量：19
5薛俊达,朱家佳,张静,李晓辉,窦帅,米琳,李子扬,苑馨方,李传荣.基于FFC-SSD模型的光学遥感图像目标检测[J].光学学报,2022,42(12):130-140. 被引量：19
6王友伟,郭颖,邵香迎.基于改进级联算法的遥感图像目标检测[J].光学学报,2022,42(24):195-203. 被引量：18
7李翔,何淼,罗海波.一种面向遮挡行人检测的改进YOLOv3算法[J].光学学报,2022,42(14):152-161. 被引量：25
8琚长瑞,秦晓燕,袁广林,李豪,朱虹.尺度敏感损失与特征融合的快速小目标检测方法[J].电子学报,2022,50(9):2119-2126. 被引量：6
9徐志京,柏雪.基于双重特征增强的遥感舰船小目标检测[J].光学学报,2022,42(18):128-137. 被引量：12
10张寅,朱桂熠,施天俊,张琨,闫钧华.基于特征融合与注意力的遥感图像小目标检测[J].光学学报,2022,42(24):132-142. 被引量：58

二级参考文献45

1沈峘,李舜酩,柏方超,缪小冬,李芳培.路面车辆实时检测与跟踪的视觉方法[J].光学学报,2010,30(4):1076-1083. 被引量：19
2王文秀,傅雨田,董峰,李锋.基于深度卷积神经网络的红外船只目标检测方法[J].光学学报,2018,38(7):152-158. 被引量：49
3任进军,王宁.人工神经网络中损失函数的研究[J].甘肃高师学报,2018,23(2):61-63. 被引量：45
4朱敏超,冯涛,张钰.基于FD-SSD的遥感图像多目标检测方法[J].计算机应用与软件,2019,36(1):232-238. 被引量：23
5滕文秀,王妮,陈泰生,王本林,陈梦琳,施慧慧.基于深度对抗域适应的高分辨率遥感影像跨域分类[J].激光与光电子学进展,2019,56(11):228-238. 被引量：8
6刘学,李范鸣,刘士建.改进的SSD红外图像行人检测算法[J].电光与控制,2020,27(1):42-46. 被引量：17
7史文旭,谭代伦,鲍胜利.特征增强SSD算法及其在遥感目标检测中的应用[J].光子学报,2020,49(1):148-157. 被引量：30
8李宝奇,贺昱曜,强伟,何灵蛟.基于并行附加特征提取网络的SSD地面小目标检测模型[J].电子学报,2020,48(1):84-91. 被引量：16
9朱天佑,黄凌锋,董峰,龚惠兴.基于轻量级残差网络的红外遥感船只检测[J].光学学报,2020,40(1):246-253. 被引量：2
10戴媛,易本顺,肖进胜,雷俊锋,童乐,程志钦.基于改进旋转区域生成网络的遥感图像目标检测[J].光学学报,2020,40(1):264-274. 被引量：29

共引文献168

1李林红,杨杰,冯志成,朱浩.面向站口行人检测的改进型Yolov5s算法[J].南京大学学报（自然科学版）,2024,60(1):87-96. 被引量：2
2吕昌,尹和,邵叶秦.基于结构重参数化的目标检测模型[J].电子测量技术,2023,46(18):114-121. 被引量：1
3赵霖,王素珍,邵明伟,许浩.基于改进YOLOv5的输电线路鸟巢缺陷检测方法[J].电子测量技术,2023,46(3):157-165. 被引量：14
4王春艳,张成谦,王祥,许宁.改进YOLOv7-tiny网络的多尺度无人机航拍小目标检测[J].测绘科学,2023,48(11):189-199. 被引量：3
5郝帅,高山,马旭,安倍逸,何田,文虎,王峰.基于跨尺度特征聚合与分层注意力映射的红外行人检测[J].光子学报,2022,51(6):411-427. 被引量：5
6葛俊辉,王健,彭以平,李婕瑄,肖昌炎,刘勇.基于Mask R-CNN实例分割及FPFH特征配对的喷涂工件识别方法[J].激光与光电子学进展,2022,59(14):178-188. 被引量：1
7张宇,马杰,崔静雯,赵月华,刘宏.融合注意力机制的遥感图像旋转目标检测算法[J].激光与光电子学进展,2022,59(24):184-192. 被引量：5
8薛康,刘琨,江俊峰,王双,徐天华,孙振世,李斯晨,黄悦朗,靳喜博,刘铁根.基于YOLOv5s模型的光纤振动传感事件精准检测研究[J].光学学报,2023,43(2):254-264. 被引量：7
9张朝阳,张上,王恒涛,冉秀康.多尺度下遥感小目标多头注意力检测[J].计算机工程与应用,2023,59(8):227-238. 被引量：17
10乐壮,陈晓冬,汪毅,蔡怀宇,闫卫喜,侯丽莹.FastCrack:实时路面裂缝分割[J].激光与光电子学进展,2023,60(6):288-299.

同被引文献31

1张凌凡,陈忠辉,周天白,年庚乾,王建明,周子涵.基于梯度提升决策树的露天矿边坡多源信息融合与稳定性预测[J].煤炭学报,2020(S01):173-180. 被引量：20
2俞赛赛,王小娟,章倩倩.基于启发式搜索特征选择的加密流量恶意行为检测技术[J].计算机科学,2022,49(S02):734-739. 被引量：6
3吴畏,唐丽均,田国正.矿用机车调度管理系统设计[J].工矿自动化,2018,44(7):17-21. 被引量：12
4周翰逊,陈晨,冯润泽,熊俊坤,潘宏,郭薇.基于值导数GRU的移动恶意软件流量检测方法[J].通信学报,2020,41(1):102-113. 被引量：18
5李龙.矿用斜巷轨道运输安全闭锁监控系统的研究[J].机械管理开发,2020,35(5):184-185. 被引量：1
6刘建荣,伊玉祥,徐杜民,杜磊,于生存,刘君贤.基于工业以太网的天祝煤矿斜巷多水平提升监控系统[J].煤矿安全,2021,52(5):166-169. 被引量：9
7李刚.井下长距离遥控式设备列车组关键技术研究[J].煤炭科学技术,2021,49(5):203-207. 被引量：9
8孙懿,高见,顾益军.融合一维Inception结构与ViT的恶意加密流量检测[J].计算机工程,2023,49(1):154-162. 被引量：10
9刘洋.煤矿井下机车运输智能监控调度系统关键技术研究[J].能源与节能,2023(2):123-126. 被引量：4
10谷勇浩,徐昊,张晓青.基于多粒度表征学习的加密恶意流量检测[J].计算机学报,2023,46(9):1888-1899. 被引量：8

引证文献3

1黎斌.基于梯度提升决策树的加密恶意流量自动检测方法[J].智能物联技术,2025,57(1):144-147.
2游磊,李一文,张海峰,杨筱彧,罗明华.基于多通道图像处理的斜巷绞车运输闭锁系统[J].煤矿安全,2025,56(5):236-244.
3郭鸣翔,赵文博,袁启彤,侯豆豆,吴旭楚.基于LEDNet的露天矿监控低光照图像增强模型[J].矿山工程,2024,12(4):824-832.

1钟山,蒋盛川,杜豫川,刘成龙,吴荻非.考虑低光照场景的自适应路面病害检测模型[J].中国公路学报,2023,36(12):289-303. 被引量：5

激光与光电子学进展

2023年第24期

浏览历史

内容加载中请稍等...

多模态自适应特征融合的目标检测被引量：3

参考文献10

二级参考文献45

共引文献168

同被引文献31

引证文献3

相关作者

相关机构

相关主题

浏览历史

多模态自适应特征融合的目标检测 被引量：3

参考文献10

二级参考文献45

共引文献168

同被引文献31

引证文献3

相关作者

相关机构

相关主题

浏览历史

多模态自适应特征融合的目标检测被引量：3