期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于优化权重的YOLOv7密集行人检测算法 被引量:1
1
作者 曹洁 牛瑜 梁浩鹏 《液晶与显示》 北大核心 2025年第3期505-515,共11页
针对自然复杂场景中行人拥挤和相互遮挡,导致检测精度不佳的问题,提出了一种基于优化权重的YOLOv7密集行人检测算法。首先,针对遮挡行人特征提取问题,利用跨空间高效多尺度注意力机制(Efficient Multi-Scale Attention Module with Cros... 针对自然复杂场景中行人拥挤和相互遮挡,导致检测精度不佳的问题,提出了一种基于优化权重的YOLOv7密集行人检测算法。首先,针对遮挡行人特征提取问题,利用跨空间高效多尺度注意力机制(Efficient Multi-Scale Attention Module with Cross-Spatial Learning,EMA)重新分配主干网络的权重,并跨维度学习不同通道特征之间的相关性,以增强模型对行人目标可见区域的关注。其次,针对检测模型复杂性较高的问题,设计了高效轻量化连接模块(Efficient Lightweight Connection Module,ELCM),旨在提升模型表达能力的同时加快训练速度。最后,构建了聚焦边界框损失函数Focal-SIoU loss,该损失函数注重抑制低质量样本,同时添加角度损失提高模型的检测精度。实验结果表明,所提算法在行人检测数据集Wider-Person与Crowd Human数据集上的均值平均精度分别达到83.7%和82.6%,相比其他先进的算法,在密集拥挤人群检测任务中有显著检测优势。 展开更多
关键词 密集行人检测 优化权重 聚焦边界框损失函数 YOLOv7
在线阅读 下载PDF
基于改进YOLOv8n的船舶设备拆装流程规范性评估方法
2
作者 张振东 管聪 +2 位作者 张泽辉 吴超 丁学文 《中国舰船研究》 北大核心 2025年第2期140-150,共11页
[目的]船舶机舱作业规范性是船舶安全管控的关键部分,因此船员实操考试将船舶设备拆装作为一个重要考核项。为提升船员实操考试的电子化和智能化水平,提出一种基于计算机视觉的船舶设备拆装流程规范性的自动化识别方法。[方法]首先,以YO... [目的]船舶机舱作业规范性是船舶安全管控的关键部分,因此船员实操考试将船舶设备拆装作为一个重要考核项。为提升船员实操考试的电子化和智能化水平,提出一种基于计算机视觉的船舶设备拆装流程规范性的自动化识别方法。[方法]首先,以YOLOv8n构建船舶设备检测模型的骨干网络,并引入高效通道注意力机制(SA),以提高模型特征提取能力与训练效率;然后,在颈部网络中引入重参数化泛化特征的金字塔网络(GFPN)融合结构,以提高模型的多尺度特征融合能力;最后,引入动态非单调聚焦机制损失函数(WIoU)来替换原CIoU损失函数,以提高模型精度。[结果]自建数据集的试验结果表明:与YOLOv8n相比,改进目标识别算法的平均精度均值提高了0.15,实时检测的每秒帧数提升了0.6,可以准确识别齿轮泵的拆装流程。[结论]该改进算法具有更强的识别能力,可以更好地应用于船舶设备拆装流程规范性的识别任务。 展开更多
关键词 船舶设备 拆除和安装 目标检测 注意力机制(SA) 泛化特征金字塔网络(GFPN) 动态非单调聚焦机制(WIoU)损失函数
在线阅读 下载PDF
改进的U-Net网络小断层识别技术在玛湖凹陷玛中地区三叠系白碱滩组的应用 被引量:3
3
作者 宋志华 李垒 +2 位作者 雷德文 张鑫 凌勋 《岩性油气藏》 CAS CSCD 北大核心 2024年第3期40-49,共10页
利用改进的U-Net网络小断层识别技术,对准噶尔盆地玛湖凹陷玛中地区三叠系白碱滩组的小断层进行了识别。研究结果表明:(1)构造导向滤波预处理能有效改善地震资料的品质,提高断层识别的准确率。加入了跳跃连接和中继监督、正态标准化和... 利用改进的U-Net网络小断层识别技术,对准噶尔盆地玛湖凹陷玛中地区三叠系白碱滩组的小断层进行了识别。研究结果表明:(1)构造导向滤波预处理能有效改善地震资料的品质,提高断层识别的准确率。加入了跳跃连接和中继监督、正态标准化和聚焦均方损失函数的U-Net网络方法,对小断层的精细识别能力有所提升。(2)使用200组训练样本集和20组验证样本集,模型地震数据由反射系数与雷克子波褶积生成,断层由人工标注而成。选取最优的网络模型参数,并在合成的含噪地震数据上分别利用相干属性、常规U-Net网络方法及改进的U-Net网络方法进行测试,构造导向滤波有效突出了断层的边界,且增强了同相轴的横向连续性,改进后的U-Net网络方法对于7 m以上断距的断层可进行有效识别。(3)对于玛湖凹陷玛中地区三叠系白碱滩组高角度走滑断裂和伴生小断距次级断裂的识别,改进后的U-Net网络方法的识别精度明显高于相干属性和常规U-Net网络方法,研究区大侏罗沟断裂北翼的(3)号与(4)号砂体,是拓展MZ4井区三叠系白碱滩组高效勘探的有利区。 展开更多
关键词 U-Net网络 断层识别 高角度走滑断裂 伴生小断距次级断裂 正态标准化 聚焦均方损失函数 白碱滩组 三叠系 玛湖凹陷
在线阅读 下载PDF
一种双视图信息融合的乳腺肿块自动检测算法 被引量:6
4
作者 蒋慧琴 王博霖 +2 位作者 马岭 于湛 徐红卫 《郑州大学学报(理学版)》 CAS 北大核心 2020年第4期28-36,共9页
针对基于单视图的深度学习乳腺肿块检测算法假阳性率较高问题,提出一种双视图信息融合的乳腺肿块自动检测算法。首先建立双曲正割模型,利用互相关法自动搜索乳腺X线摄影图像中的肿块感兴趣区域,并根据胸壁线、乳头位置在双侧头尾位和内... 针对基于单视图的深度学习乳腺肿块检测算法假阳性率较高问题,提出一种双视图信息融合的乳腺肿块自动检测算法。首先建立双曲正割模型,利用互相关法自动搜索乳腺X线摄影图像中的肿块感兴趣区域,并根据胸壁线、乳头位置在双侧头尾位和内外侧斜位图像上建立物理坐标系,筛选标注假阳性区域以在数据层扩充监督学习信息;其次,设计空间金字塔池化模块有效融合基于YOLOv3主干网络提取的多尺度局部特征以提高检测敏感性;最后,在类别损失函数中增加聚焦参数,通过调节算法学习过程以提高检测特异性。充分利用双视图数据提供的先验信息提高检测正确率,实验结果表明检测敏感性达到92.0%,特异性达到87.7%,平均每幅图像假阳性0.041个,其检测性能较原模型大幅提升,且具有较好的鲁棒性。 展开更多
关键词 乳腺癌 乳腺X线摄影 计算机辅助诊断 双视图 YOLOv3 faster-RCNN 空间金字塔池化 聚焦损失函数
在线阅读 下载PDF
基于不均衡数据与迁移学习的面部微表情识别 被引量:5
5
作者 孔慧芳 钱世超 闫嘉鹏 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2020年第7期895-900,共6页
针对面部微表情识别研究中各类别数量不均衡造成的数据不均衡问题,文章采用端到端的深度学习方法,利用迁移学习将基于深度卷积神经网络的人脸识别模型VGGFace从人脸识别领域迁移到面部表情识别领域,并引入聚焦损失函数作为目标函数来降... 针对面部微表情识别研究中各类别数量不均衡造成的数据不均衡问题,文章采用端到端的深度学习方法,利用迁移学习将基于深度卷积神经网络的人脸识别模型VGGFace从人脸识别领域迁移到面部表情识别领域,并引入聚焦损失函数作为目标函数来降低数据不均衡的影响。对不均衡数据集(CASME II)进行的对比实验结果表明,采用端到端的深度学习方法自动提取特征的效果更好,微表情识别的准确率和F1值更高。 展开更多
关键词 微表情识别 类别不均衡 卷积神经网络 迁移学习 聚焦损失函数(FL)
在线阅读 下载PDF
基于雷达点云与图像数据的三维目标检测方法 被引量:9
6
作者 李文平 袁强 +2 位作者 陈璐 郑利彪 汤晓龙 《电光与控制》 CSCD 北大核心 2021年第10期110-115,共6页
在智能交通领域中,道路场景的三维目标实时检测对于保障汽车行驶安全具有重要意义。使用雷达点云和图像数据进行融合能够达到优势互补的效果,然而使用这两种数据融合的三维目标检测算法为得到较高的检测精度,通常都采用两阶段网络,相比... 在智能交通领域中,道路场景的三维目标实时检测对于保障汽车行驶安全具有重要意义。使用雷达点云和图像数据进行融合能够达到优势互补的效果,然而使用这两种数据融合的三维目标检测算法为得到较高的检测精度,通常都采用两阶段网络,相比于单阶段网络运算速度较慢,而在实际应用中检测系统的速度是非常重要的。针对以上问题,在单阶段网络RetinaNet上进行改进,设计了一种三维目标实时检测方法,将三维锚框映射到点云和图像的特征图上,利用ROI池化,将锚框在特征图上裁剪出的区域转换成相同大小并融合,最终输出目标边界框的回归参数和类别,并且对锚框进行调整得到目标预测边界框。在KITTI数据集上进行的实验表明,所研究的网络在行人、车辆等多目标检测的精确度和时间消耗方面均优于对比算法。 展开更多
关键词 三维目标检测 多传感器信息融合 深度学习 改进RetinaNet 聚焦损失函数
在线阅读 下载PDF
基于雷达与图像数据融合的人体目标检测方法 被引量:4
7
作者 李文平 袁强 +2 位作者 陈璐 郑利彪 汤晓龙 《数据采集与处理》 CSCD 北大核心 2021年第2期324-333,共10页
三维人体目标检测在智能安防、机器人、自动驾驶等领域具有重要的应用价值。目前基于雷达与图像数据融合的三维人体目标检测方法主要采用两阶段网络结构,分别完成目标概率较高的候选边界框的选取以及对目标候选框进行分类和边界框回归... 三维人体目标检测在智能安防、机器人、自动驾驶等领域具有重要的应用价值。目前基于雷达与图像数据融合的三维人体目标检测方法主要采用两阶段网络结构,分别完成目标概率较高的候选边界框的选取以及对目标候选框进行分类和边界框回归。目标候选边界框的预先选取使两阶段网络结构的检测准确率和定位精度得到提高,但相对复杂的网络结构导致运算速度受到限制,难以满足实时性要求较高的应用场景。针对以上问题,研究了一种基于改进型RetinaNet的三维人体目标实时检测方法,将主干网络与特征金字塔网络结合用于雷达点云和图像特征的提取,并将两者融合的特征锚框输入到功能网络从而输出三维边界框和目标类别信息。该方法采用单阶段网络结构直接回归目标的类别概率和位置坐标值,并且通过引入聚焦损失函数解决单阶段网络训练过程中存在的正负样本不平衡问题。在KITTI数据集上进行的实验表明,本文方法在三维人体目标检测的平均精度和耗时方面均优于对比算法,可有效实现目标检测的准确性和实时性之间的平衡。 展开更多
关键词 三维人体目标检测 多传感器信息融合 深度学习 改进型RetinaNet 聚焦损失函数
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部