基于可变形卷积和注意力机制的视频目标检测算法

Video object detection algorithm based on deformable convolution and attention mechanism

在线阅读下载PDF

导出

摘要视频帧中目标模糊、遮挡和形变是影响视频目标检测精度的重要原因,针对此类问题,提出一种DG-YOLOv8n算法。首先,基于可变形卷积对骨干网络中的C2f模块进行了重新设计,以增强骨干网络对于目标变化的处理能力;其次,在颈部网络引入GAM全局注意机制,放大全局交互表示来提高算法的性能;最后,在ImageNet VID数据集上的实验结果表明,改进的DG-YOLOv8n算法的平均精度为84.5%,较原YOLOv8n算法提高了6.1个百分点,验证了改进算法的有效性。 The blurring,occlusion,and deformation of targets in video frames are important factors affecting the accuracy of video object detection.To address these issues,a DG-YOLOv8n algorithm is proposed.Firstly,the C2f module in the backbone net-work was redesigned based on deformable convolution to enhance its ability to handle target changes.Secondly,the GAM global at-tention mechanism is introduced into the neck network to amplify the global interactive representation and improve the performance of the algorithm.Finally,the experimental results on the ImageNet VID dataset showed that the improved DG-YOLOv8n algorithm had an average precision of 84.5%,which was 6.1 percentage point higher than the original YOLOv8n algorithm,verifying the effec-tiveness of the improved algorithm.

作者魏一帆郭本华粟长权钱淑渠 Wei Yifan;Guo Benhua;Su Changquan;Qian Shuqu(School of Information,Guizhou University of Finance and Economics,Guiyang 550025,China;College of Mathematics and Computer Science,Anshun University,Anshun 561000,China)

机构地区贵州财经大学信息学院安顺学院数学与计算机科学学院

出处《现代计算机》 2024年第21期20-25,共6页 Modern Computer

基金贵州省教育厅创新群体重大资助项目(黔教合KY字[2018]034) 安顺学院研究生创新基金资助项目(asxyyjscx202401)。

关键词目标检测视频目标检测可变形卷积 GAM全局注意机制 YOLOv8 object detection video object detection deformable convolution global attention mechanism feature aggregation YOLOv8

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

作者简介魏一帆(1998-),女,河南安阳人,硕士研究生,研究方向为深度学习、目标检测;通信作者:郭本华(1964-),男,贵州兴义人,博士,硕士生导师,教授,研究方向为复杂网络、深度学习,E-mail:gbhua@126.com;粟长权(1996-),男,贵州黔东南人,硕士研究生,研究方向为深度学习、医学图像分割;钱淑渠(1978-),男,安徽枞阳人,博士,硕士生导师,教授,研究方向为智能优化算法。

引文网络
相关文献

参考文献4

1罗会兰,陈鸿坤.基于深度学习的目标检测研究综述[J].电子学报,2020,48(6):1230-1239. 被引量：188
2王迪聪,白晨帅,邬开俊.基于深度学习的视频目标检测综述[J].计算机科学与探索,2021,15(9):1563-1577. 被引量：43
3高扬,安雯.基于可变空间感知的目标检测算法[J].现代电子技术,2023,46(12):91-95. 被引量：2
4秦思怡,盖绍彦,达飞鹏.混合采样下多级特征聚合的视频目标检测算法[J].浙江大学学报（工学版）,2024,58(1):10-19. 被引量：1

二级参考文献19

1周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1951
2毕威,黄伟国,张永萍,高冠琪,朱忠奎.基于图像显著轮廓的目标检测[J].电子学报,2017,45(8):1902-1910. 被引量：17
3黄继鹏,史颖欢,高阳.面向小目标的多尺度Faster-RCNN检测算法[J].计算机研究与发展,2019,56(2):319-327. 被引量：100
4裴伟,许晏铭,朱永英,王鹏乾,鲁明羽,李飞.改进的SSD航拍目标检测方法[J].软件学报,2019,30(3):738-758. 被引量：72
5姜维,张重生,殷绪成.基于深度学习的场景文字检测综述[J].电子学报,2019,47(5):1152-1161. 被引量：28
6杜兰,魏迪,李璐,郭昱辰.基于半监督学习的SAR目标检测网络[J].电子与信息学报,2020,42(1):154-163. 被引量：18
7刘紫燕,万培佩.基于注意力机制的行人重识别特征提取方法[J].计算机应用,2020,40(3):672-676. 被引量：27
8赵永强,饶元,董世鹏,张君毅.深度学习目标检测方法综述[J].中国图象图形学报,2020,25(4):629-654. 被引量：262
9罗会兰,彭珊,陈鸿坤.目标检测难点问题最新研究进展综述[J].计算机工程与应用,2021,57(5):36-46. 被引量：16
10肖雨晴,杨慧敏.目标检测算法在交通场景中应用综述[J].计算机工程与应用,2021,57(6):30-41. 被引量：68

共引文献226

1慕君林,马博,王云飞,任卓,刘双喜,王金星.基于深度学习的农作物病虫害检测算法综述[J].农业机械学报,2023,54(S02):301-313. 被引量：34
2侯志斌,朱愿,娄静涛.面向自动驾驶的3D目标检测技术研究综述[J].军事交通学报,2022(8):78-84. 被引量：3
3汪欣,张铭毅,刘亚萍.精准推荐技术的工作逻辑和前沿应用[J].传媒论坛,2022,5(16):16-18.
4杨铭.空地一体遥感技术在轨道交通安全保护区巡查中的应用[J].测绘通报,2024(S02):178-181. 被引量：2
5黄戟雄.5G和人工智能技术在光缆巡检中的应用[J].广西通信技术,2023(4):23-28. 被引量：3
6谭瑛,黄彬,关俊波,钟雪飞,陈坚.基于5G消息和深度学习的宽带故障排查方案研究[J].广西通信技术,2022(3):26-29.
7曾永艺.理论与实践结合改善金融监管[J].金融理论与实践,2000(3):7-9.
8郑明,夏定纯,胡雨阳,张承.基于SSD网络的行人目标检测跟踪算法[J].计算机与网络,2020,46(24):62-65. 被引量：1
9魏智锋,肖书浩,蒋国璋,伍世虔,程国飞.基于深度学习的人造板表面缺陷检测研究[J].林产工业,2021,58(2):21-26. 被引量：18
10郑钦浩,杨贞,杨振.面向车辆和行人检测的KM-SSD方法[J].计算机与现代化,2021(3):51-56. 被引量：3

1凌英杰.基于YOLO、SSD与Faster R-CNN的视频监控目标检测算法优化研究[J].现代计算机,2024,30(21):49-53. 被引量：2
2庞枫骞,赵鸿飞,康营营.融合不确定性估计的端到端视频事件检测算法[J].北京航空航天大学学报,2024,50(12):3759-3770.
3曹志炜,赵朗,张琦琛.人工智能技术本地化探索及在国家审计中的应用[J].审计研究,2024(5):26-37. 被引量：15
4梁斌,黄学祥,刘天亮,徐文福,袁晗,闫磊,王学谦.绳簇主被动混合驱动空间机械臂设计及其力-位-型融合控制[J].中国科学：技术科学,2024,54(12):2319-2336. 被引量：1

现代计算机

2024年第21期

浏览历史

内容加载中请稍等...

基于可变形卷积和注意力机制的视频目标检测算法

参考文献4

二级参考文献19

共引文献226

相关作者

相关机构

相关主题

浏览历史