期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
级联式多尺度行人检测算法研究 被引量:1
1
作者 张姗 刘艳霞 方建军 《传感器与微系统》 CSCD 2020年第1期42-45,52,共5页
针对多尺度行人检测精度不够高的问题,提出了一种级联式多尺度行人检测算法,使用矩形卷积核提取行人特征,根据行人轮廓特征设计候选区域宽高比例;并提出自适应损失函数,使网络聚焦于困难样本,有效缓解了长尾效应在训练网络时带来的不利... 针对多尺度行人检测精度不够高的问题,提出了一种级联式多尺度行人检测算法,使用矩形卷积核提取行人特征,根据行人轮廓特征设计候选区域宽高比例;并提出自适应损失函数,使网络聚焦于困难样本,有效缓解了长尾效应在训练网络时带来的不利因素,提高了网络泛化能力。实验结果表明:所提算法对于Caltech数据集中的大尺度行人,漏检率比Adapt Faster Rcnn算法降低了1.36%;对于中小尺度行人,漏检率比Adapt Faster Rcnn算法下降8.82%。 展开更多
关键词 多尺度行人检测 级联卷积神经网络 正样本采集 加权损失函数
在线阅读 下载PDF
滑窗注意力多尺度均衡的密集行人检测算法 被引量:5
2
作者 于范 张菁 《计算机科学与探索》 CSCD 北大核心 2024年第5期1286-1300,共15页
由于现实场景下的行人目标在形态、尺度等方面存在巨大差异,相比于传统方法对多尺度行人检测平均精准率较低的情况,基于Transformer注意力机制的网络在行人检测领域已经展现出强大的性能。然而,密集场景下的多尺度检测仍存在一些难点。... 由于现实场景下的行人目标在形态、尺度等方面存在巨大差异,相比于传统方法对多尺度行人检测平均精准率较低的情况,基于Transformer注意力机制的网络在行人检测领域已经展现出强大的性能。然而,密集场景下的多尺度检测仍存在一些难点。在密集场景中,通常会包含大量的被遮挡或小规模的行人目标,导致模型产生大量的误检和漏检,同时耗费大量的计算资源。此外,当行人目标重叠较为严重时,准确地检出所有目标也会变得极为困难。为了解决上述问题,提出了一种基于滑窗注意力的密集场景多尺度行人检测算法。在Backbone中使用改进Swin block使得网络能够提取到更多的细节特征,同时减少注意力机制带来的繁重计算量。为有效解决特征融合问题,在Neck部分使用DyHead block来统一多个注意力运算,以此提高特征融合效率。针对特征均衡问题,设计了一种基于全连接的特征尺度均衡模块,通过在特征金字塔的各层级之间构造不同的残差结构来进行特征平衡,辅助模型生成更高质量的特征图。在WiderPerson数据集上的实验结果表明,该算法在AP值上提升了1.1个百分点,在最值得关注的小目标和中目标上也分别有1.0和0.7个百分点的提升。 展开更多
关键词 多尺度行人检测 深度学习 密集场景 滑窗注意力 特征融合均衡
在线阅读 下载PDF
基于融合FPN和Faster R-CNN的行人检测算法 被引量:17
3
作者 王飞 王林 +2 位作者 张儒良 赵勇 王全红 《数据采集与处理》 CSCD 北大核心 2019年第3期530-537,共8页
针对多尺度行人检测的问题,本文提出一种基于融合特征金字塔网络(Feature pyramidnetworks,FPN)和Faster R-CNN(Faster region convolutional neural network)的行人检测算法。首先,对FPN和区域建议网络(Region proposal networks,RPN)... 针对多尺度行人检测的问题,本文提出一种基于融合特征金字塔网络(Feature pyramidnetworks,FPN)和Faster R-CNN(Faster region convolutional neural network)的行人检测算法。首先,对FPN和区域建议网络(Region proposal networks,RPN)进行融合;然后,对FPN和Fast R-CNN进行融合;最后,在Caltech数据集、KITTI数据集和ETC数据集上分别对融合FPN和Faster R-CNN的行人检测算法进行训练和测试。该算法在Caltech数据集、KITTI数据集和ETC数据集上的mAP(meanAverage Precision)分别达到69.72%,69.76%和89.74%。与Faster R-CNN相比,该算法不仅提高了行人检测精度,而且在多尺度行人检测的问题上也获得了较为满意的检测效果。 展开更多
关键词 特征金字塔网络 区域建议网络 FASTER R-CNN 多尺度行人检测
在线阅读 下载PDF
基于改进颜色自相似特征的行人检测方法 被引量:5
4
作者 顾会建 陈俊周 《计算机应用》 CSCD 北大核心 2014年第7期2033-2035,2070,共4页
近年来多尺度行人检测在计算机视觉领域受到广泛关注。传统方法需对图像缩放,在不同尺度计算特征,大大降低了行人检测的速度。颜色自相似特征(CSSF)被提出以克服此不足。针对颜色自相似度特征具有维度高和分类器训练时间长等问题,提出... 近年来多尺度行人检测在计算机视觉领域受到广泛关注。传统方法需对图像缩放,在不同尺度计算特征,大大降低了行人检测的速度。颜色自相似特征(CSSF)被提出以克服此不足。针对颜色自相似度特征具有维度高和分类器训练时间长等问题,提出一种改进的颜色自相似度特征。改进的颜色自相似度特征结合行人结构相似度,首先定义了固定尺寸的窗口,然后在不同的颜色空间滑动固定大小的窗口进行特征提取,最后结合自适应增强(AdaBoost)算法构建行人检测分类器。实验结果显示:相对于传统颜色自相似度特征的千万级维度,新的特征只有几千维,特征提取速度和分类器训练速度显著提高,检测效果略有下降;与梯度方向直方图特征(HOG)相比,特征提取速度提高5倍,检测效果基本不变,新的方法在实时行人检测和监控系统中有很好的应用价值。 展开更多
关键词 结构相似 颜色自相似度特征 多尺度行人检测 尺度不变性 ADABOOST
在线阅读 下载PDF
基于图像融合和改进CornerNet-Squeeze的煤矿井下行人检测方法 被引量:4
5
作者 邹盛 周李兵 +1 位作者 季亮 于政乾 《工矿自动化》 CSCD 北大核心 2023年第2期77-84,共8页
在煤矿井下无人驾驶和安防监控等领域,对行人目标的检测至关重要,但受井下光线昏暗、光照不均、背景复杂、行人目标小且密集等特殊工况环境的影响,图像中的行人目标存在边缘细节特征少、信噪比低、与背景相似度高等问题,难以有效识别遮... 在煤矿井下无人驾驶和安防监控等领域,对行人目标的检测至关重要,但受井下光线昏暗、光照不均、背景复杂、行人目标小且密集等特殊工况环境的影响,图像中的行人目标存在边缘细节特征少、信噪比低、与背景相似度高等问题,难以有效识别遮挡多尺度下的行人目标。针对上述问题,提出了一种基于图像融合和改进CornerNet-Squeeze的煤矿井下行人目标检测方法。采用双尺度图像融合(TIF)算法将红外相机和深度相机采集的图像进行像素级融合,再进行形态学处理,减少背景干扰。在CornerNet-Squeeze网络基础上,将八度卷积(OctConv)引入沙漏型主干网络,处理图像特征中高低频信息,增强图像边缘特征,提高多尺度行人检测能力。实验结果表明:①在深度图像、红外图像、融合图像3种数据集上,改进CornerNet-Squeeze模型在保持原算法实时性的同时,有效提升了井下行人检测精度。②采用融合图像数据集训练的模型检测精度较红外图像和深度图像数据集训练的模型高,可见融合图像能充分发挥深度图像和红外图像的优势,有助于提高模型检测精度。③在不同程度遮挡和多尺度行人目标6种场景下,改进CornerNet-Squeeze训练的模型的行人漏检率最低。④与YOLOv4相比,在COCO2014行人数据集上改进CornerNet-Squeeze算法的平均精度提高了1.1%,检测速度提高了6.7%。⑤改进CornerNet-Squeeze能够有效检测出图像中远处小目标,对小目标的检测能力提升明显。 展开更多
关键词 煤矿井下行人检测 尺度图像融合 CornerNet-Squeeze 边缘增强 沙漏型主干网络 多尺度行人检测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部