-
题名基于Crowd-RetinaNet的拥挤行人检测
- 1
-
-
作者
韩鼎
喻春雨
童亦新
张俊
-
机构
南京邮电大学电子与光学工程学院、柔性电子(未来技术)学院
-
出处
《现代电子技术》
北大核心
2025年第11期34-41,共8页
-
基金
南京邮电大学校企合作项目(2018外002,2019外157)。
-
文摘
文中以RetinaNet为基础,设计一种高效的用于拥挤行人检测的网络模型。为提高特征融合性能,利用坐标注意力特征融合(CAFF)进行跨层特征融合,实现尺度特征之间高质量的语义和位置细节信息交互;为提高目标检测性能,引入任务感知检测头(TaHead)提升目标检测头的表征能力;为克服非极大值抑制算法(NMS)对遮掩目标的漏检问题,结合CrowdDet的多实例预测(MIP)算法,使用推土机距离损失算法(EMDLoss)进行模型训练,并使用Set NMS作为后处理方法,有效抑制多重冗余检测结果,最终设计出Crowd-RetinaNet拥挤行人检测模型。Crowd-RetinaNet在CrowdHuman数据集上进行训练,在CrowdHuman验证集上进行性能测试,对比改进前的RetinaNet在AP、MR-2指标上较基础模型分别改善了1.80%、3.32%,并在校园的拥挤场景中完成了性能较高的行人检测实验,实验结果表明该模型可以对行人进行精确检测,具有一定的实用性。
-
关键词
行人检测
坐标注意力特征融合
信息交互
多实例预测
注意力机制
抑制算法
-
Keywords
pedestrian detection
coordinate attention feature fusion
information exchange
MIP
attention mechanism
suppression algorithm
-
分类号
TN911.73-34
[电子电信—通信与信息系统]
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Faster R-CNN的密集人群检测算法
被引量:4
- 2
-
-
作者
邹斌
张聪
-
机构
现代汽车零部件技术湖北省重点实验室(武汉理工大学)
汽车零部件技术湖北省协同创新中心(武汉理工大学)
-
出处
《计算机应用》
CSCD
北大核心
2023年第1期61-66,共6页
-
基金
湖北省重点研发项目(2020BAB135)
新能源汽车科学与关键技术学科创新引智基地项目(B17034)。
-
文摘
为提高拥挤场景下的人群检测准确率,提出一种基于改进Faster R-CNN的密集人群检测算法。首先,在特征提取阶段添加空间与通道注意力机制,使用加强的双向特征金字塔网络(S-BiFPN)替代原网络中的多尺度特征金字塔(FPN),使网络对重要特征进行自主学习并加强对图像深层特征的提取;其次,引入多实例预测(MIP)算法对实例进行预测,以避免模型对拥挤场景下的目标造成漏检;最后,对模型中的非极大值抑制(NMS)进行优化,并额外增设一个交并比(IoU)阈值,以对检测结果的干扰项进行精确抑制。在开源的密集人群检测数据集上进行测试的结果显示,相较于原Faster R-CNN算法,所提算法的平均精度(AP)提升5.6%,Jaccard指数值提升3.2%。所提算法具有较高检测精度和稳定性,可以满足密集场景人群检测的需求。
-
关键词
密集人群检测
Faster
R-CNN
注意力机制
多实例预测
加强的双向特征金字塔网络
-
Keywords
dense crowd detection
Faster Region-based Convolutional Neural Network(Faster R-CNN)
attention mechanism
multi-instance prediction
Strong-Bidirectional Feature Pyramid Network(S-BiFPN)
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-