-
题名基于金字塔增强与跨语义交互的轻量图像目标检测网络
- 1
-
-
作者
陆蔚
-
机构
江苏信息职业技术学院物联网工程学院
-
出处
《电讯技术》
北大核心
2025年第11期1798-1805,共8页
-
基金
江苏省高校“青蓝工程”优秀教学团队资助(苏教师函[2021]11号)
物联网应用技术职业教育教师教学创新团队资助(苏教办师函[2021]23号)。
-
文摘
近年来,轻量化目标检测领域取得了显著进展。然而,现有主流方法缺乏多尺度语义信息的提取,且忽略了深层语义特征与浅层细节特征之间的关系。针对上述缺陷,提出了金字塔池化多尺度增强网络(Pyramid Pooling Enhanced Multi-scale Network,PPMENet),通过设计一个高效金字塔池化模块(Efficient Pyramid Pooling Block,EPPB)来提取多尺度深层语义信息,以加强模型的特征表达能力。另一方面,设计了跨语义交互注意力模块(Cross Semantic Level Interaction Attention Module,CSIAM)以增强不同语义特征之间的联系。MS COCO 2017测试集的实验结果表明,PPMENet取得了28.0%平均精度,模型大小仅有2.16×10^(6),GFLOPs为0.97,并获得了218 frame/s的推理速度。与其他方法相比,PPMENet在精度和执行效率间取得了较好的平衡。
-
关键词
实时图像目标检测
轻量级网络
多尺度特征提取
注意力机制
特征融合
-
Keywords
real-time image object detection
lightweight network
multi-scale feature extraction
attention mechanism
feature fusion
-
分类号
TN957.52
[电子电信—信号与信息处理]
-