-
题名基于Crowd-RetinaNet的拥挤行人检测
- 1
-
-
作者
韩鼎
喻春雨
童亦新
张俊
-
机构
南京邮电大学电子与光学工程学院、柔性电子(未来技术)学院
-
出处
《现代电子技术》
北大核心
2025年第11期34-41,共8页
-
基金
南京邮电大学校企合作项目(2018外002,2019外157)。
-
文摘
文中以RetinaNet为基础,设计一种高效的用于拥挤行人检测的网络模型。为提高特征融合性能,利用坐标注意力特征融合(CAFF)进行跨层特征融合,实现尺度特征之间高质量的语义和位置细节信息交互;为提高目标检测性能,引入任务感知检测头(TaHead)提升目标检测头的表征能力;为克服非极大值抑制算法(NMS)对遮掩目标的漏检问题,结合CrowdDet的多实例预测(MIP)算法,使用推土机距离损失算法(EMDLoss)进行模型训练,并使用Set NMS作为后处理方法,有效抑制多重冗余检测结果,最终设计出Crowd-RetinaNet拥挤行人检测模型。Crowd-RetinaNet在CrowdHuman数据集上进行训练,在CrowdHuman验证集上进行性能测试,对比改进前的RetinaNet在AP、MR-2指标上较基础模型分别改善了1.80%、3.32%,并在校园的拥挤场景中完成了性能较高的行人检测实验,实验结果表明该模型可以对行人进行精确检测,具有一定的实用性。
-
关键词
行人检测
坐标注意力特征融合
信息交互
多实例预测
注意力机制
抑制算法
-
Keywords
pedestrian detection
coordinate attention feature fusion
information exchange
MIP
attention mechanism
suppression algorithm
-
分类号
TN911.73-34
[电子电信—通信与信息系统]
TP391.4
[自动化与计算机技术—计算机应用技术]
-