期刊文献+
共找到112篇文章
< 1 2 6 >
每页显示 20 50 100
基于UMS-YOLO v7的面向样本不均衡的水下生物多尺度目标检测方法 被引量:3
1
作者 张明华 黄基萍 +2 位作者 宋巍 肖启华 赵丹枫 《农业机械学报》 北大核心 2025年第1期388-396,409,共10页
针对水下目标检测面临着生物尺度变化大以及样本不均衡的问题,本文提出一种水下生物多尺度目标检测方法(Underwater multi-scale-YOLO v7,UMS-YOLO v7)。首先,设计一种由可切换空洞卷积组成的特征提取模块,该模块可在不同大小的感受野... 针对水下目标检测面临着生物尺度变化大以及样本不均衡的问题,本文提出一种水下生物多尺度目标检测方法(Underwater multi-scale-YOLO v7,UMS-YOLO v7)。首先,设计一种由可切换空洞卷积组成的特征提取模块,该模块可在不同大小的感受野上捕获多尺度目标特征,使得提取的特征信息更加全面;其次,使用轻量级的上采样算子融合上下文信息,提高模型对目标的特征学习能力;最后,通过结合Wise-IoU和归一化Wasserstein距离两种相似性度量,提高了不同尺度目标的定位精度,同时降低了多尺度样本分布不均衡对模型的影响。实验结果表明,该模型相较于当前其他模型在检测精度方面表现出明显的提升,在RUOD和DUO数据集上平均精度均值分别达到64.5%和68.9%。与YOLO v7模型相比,UMS-YOLO v7提高了多种尺度目标检测精度,在DUO数据集上,针对大、中、小3种尺度目标平均精度均值分别提升8.3、4.8、12.5个百分点,其中小目标提升效果最为显著。与现有的其他模型相比,改进的模型具有更高的检测精度,更适用于水下生物多尺度目标检测任务,并且针对不同数据分布的样本具有泛化性和鲁棒性。 展开更多
关键词 水下生物 多尺度目标检测 YOLO v7 空洞卷积 上采样算子 相似性度量
在线阅读 下载PDF
基于形状流和多尺度特征融合的腺体分割
2
作者 林嘉雯 陈苏苏 +2 位作者 林智明 李笠 翁谦 《中国生物医学工程学报》 北大核心 2025年第1期52-65,共14页
睑板腺成像技术广泛应用于干眼症的分型诊断、管理与个性化治疗中,但仅靠眼科医生进行直接观察和定性评估,评价主观且可重复性低。为提高眼科医生的诊断效率,研究者们提出了一系列基于U-Net的红外睑板腺图像腺体分割方法,但在图像边缘... 睑板腺成像技术广泛应用于干眼症的分型诊断、管理与个性化治疗中,但仅靠眼科医生进行直接观察和定性评估,评价主观且可重复性低。为提高眼科医生的诊断效率,研究者们提出了一系列基于U-Net的红外睑板腺图像腺体分割方法,但在图像边缘、出现反光点以及腺体密集区域,分割结果仍不理想。考虑到红外睑板腺图像成像与腺体分布的特点,提出基于形状流和多尺度特征融合的腺体分割模型SS-UNet,引入空洞卷积模块以增强模型的特征提取能力,设计形状流辅助分支以充分学习腺体的形状信息,采用多尺度特征融合模块以获得粗细各异腺体的特征表示。为验证模型的有效性,使用由福州大学附属省立医院眼科收集的包含203幅红外睑板腺图像的全标注数据集在同等实验环境下与其他先进分割模型开展对比实验,并进行模块消融分析,同时展示了可视化结果。实验表明,SS-UNet的Acc、Dice、IoU等指标分别达到了94.62%、80.94%和68.17%,相较于基准网络U-Net分别提升了0.36%、1.41%和1.95%。研究表明,SS-UNet能够充分运用腺体的形状与尺度等信息,解决腺体粘连、漏检等错误分割问题,有效提高分割精度,为辅助临床诊断提供客观依据。 展开更多
关键词 睑板腺功能障碍 腺体分割 空洞卷积 形状流 多尺度特征融合
在线阅读 下载PDF
基于多尺度注意力U-Net的医学肝脏计算机断层扫描图片分割算法 被引量:3
3
作者 金涛 王震 李昭蒂 《哈尔滨工程大学学报》 北大核心 2025年第3期529-539,共11页
针对传统肝脏分割方法十分依赖医生的经验,并且分割过程耗时,易出错的现象,本文提出适用于临床情景中医学肝脏计算机断层扫描的分割方法。基于多尺度残差混合注意力U-Net将多尺度注意力机制模块引入U-Net网络。该模块可以抑制不相关的区... 针对传统肝脏分割方法十分依赖医生的经验,并且分割过程耗时,易出错的现象,本文提出适用于临床情景中医学肝脏计算机断层扫描的分割方法。基于多尺度残差混合注意力U-Net将多尺度注意力机制模块引入U-Net网络。该模块可以抑制不相关的区域,从多个角度提取图像特征,并突出显示分割任务;在标准卷积层中添加残差结构可以有效地避免梯度爆炸并增加网络深度;使用混合空洞注意力常规层来替换“U”形网络的底部,以获得上下文信息,避免空间信息的丢失。试验结果表明:在LiTS17和SLiver07数据集上与其他方法相比,本文方法具有更好的性能和最高的分割精度。 展开更多
关键词 神经网络 深度学习 语义分割 肝脏分割 医学图像 注意力机制 空洞卷积
在线阅读 下载PDF
基于扩张重参数化和空洞卷积架构的步态识别方法 被引量:2
4
作者 霍丽娜 薛乐仁 +3 位作者 戴钰俊 赵新宇 王世行 王威 《计算机应用》 北大核心 2025年第4期1285-1292,共8页
步态识别旨在通过人们的步行姿态进行身份识别。针对步态识别中有效感受野(ERF)与人体轮廓区域匹配不佳的问题,提出一种基于空洞卷积的步态识别方法DilatedGait。首先,采用空洞卷积扩大神经元感受野,缓解下采样和模型深度增加导致的分... 步态识别旨在通过人们的步行姿态进行身份识别。针对步态识别中有效感受野(ERF)与人体轮廓区域匹配不佳的问题,提出一种基于空洞卷积的步态识别方法DilatedGait。首先,采用空洞卷积扩大神经元感受野,缓解下采样和模型深度增加导致的分辨率下降,以提高轮廓结构的辨识度;其次,提出扩张重参数化模块(DRM),通过重参数化方法融合多尺度卷积核参数,优化ERF聚焦范围,使模型捕获更多的全局上下文信息;最后,通过特征映射提取判别性步态特征。在户外数据集Gait3D和GREW上的实验结果表明,对比目前的先进方法GaitBase,DilatedGait在Gait3D的Rank-1和平均逆负惩罚(mINP)上分别提升了9.0和14.2个百分点,在GREW的Rank-1和Rank-5上分别提升了11.6和8.8个百分点。可见,DilatedGait消除了复杂协变量带来的不利影响,能进一步提升户外场景下步态识别的准确率。 展开更多
关键词 步态识别 有效感受野 重参数化 空洞卷积 步态轮廓序列
在线阅读 下载PDF
基于多尺度空洞卷积神经网络的滚动轴承故障识别方法
5
作者 汪小虎 赵荣珍 +1 位作者 邓林峰 郑玉巧 《兰州理工大学学报》 北大核心 2025年第3期55-63,共9页
针对现有卷积神经网络模型参数偏多导致滚动轴承智能诊断效率低和识别准确率受限于训练样本数量的问题,提出了基于多尺度空洞卷积神经网络的滚动轴承故障识别方法.该方法首先在模型的输入层采用大尺寸的空洞卷积核和标准卷积核提取一维... 针对现有卷积神经网络模型参数偏多导致滚动轴承智能诊断效率低和识别准确率受限于训练样本数量的问题,提出了基于多尺度空洞卷积神经网络的滚动轴承故障识别方法.该方法首先在模型的输入层采用大尺寸的空洞卷积核和标准卷积核提取一维振动信号的多尺度敏感特征,然后使用尺寸为1×1和3×1的小卷积核以及2×1的最大池化操作对输入层所提取敏感特征进一步提取深层抽象特征,最后用全局平均池化层代替传统卷积神经网络的全连接层.同时,分别采用西储大学轴承故障数据和实验室轴承故障数据进行实验验证.结果表明,该方法泛化性能良好,并且能够在训练样本较少的情况下出色地完成故障识别任务,即使在一定噪声干扰下也能够对轴承微弱故障准确识别. 展开更多
关键词 多尺度空洞卷积神经网络 滚动轴承 故障识别 小样本 微弱故障
在线阅读 下载PDF
PMM-YOLO:多尺度特征融合的交通标志检测算法 被引量:3
6
作者 赵磊 李栋 《计算机工程与应用》 北大核心 2025年第4期262-271,共10页
交通标志在智能驾驶领域有着重要的作用,面对交通标志尺寸小,易受遮挡,在复杂环境下容易出现漏检、错检等问题,提出了一种基于YOLOv5改进的PMM-YOLO交通标志检测算法。为了能够有效提取多尺度信息,并增强模型对特征信息的表达能力,提出... 交通标志在智能驾驶领域有着重要的作用,面对交通标志尺寸小,易受遮挡,在复杂环境下容易出现漏检、错检等问题,提出了一种基于YOLOv5改进的PMM-YOLO交通标志检测算法。为了能够有效提取多尺度信息,并增强模型对特征信息的表达能力,提出了一种结合注意力机制的并行空洞卷积模块(adaptive parallel atrous convo-lution,APA),使用具有不同膨胀率的并行空洞卷积,能够有效地提取不同尺度的特征,并通过gate机制突出关键目标的特征表示,提高检测的准确性;设计了一种多分支的自适应采样(multi-branch adaptive sampling,MBAS),多分支的采样可为网络提供多条特征提取途径,丰富特征表达的多样性,并通过不同位置的权重筛选重要特征进行强化,抑制冗余特征;设计了多尺度特征融合(multi-scale feature fusion,MSFF)模块,对不同大小尺度的特征图进行拼接,充分利用多尺度信息,将多个尺度的特征图融合,以获取更全面的目标特征,提升对目标的检测效果。构建了输出重组(output reorganization,ORO)模块,增加小目标检测层并去除大目标检测层,提升对小目标的检测效果,并相应减少模型复杂度。实验结果表明,PMM-YOLO算法在TT100Ke数据集上的mAP@0.5达到了86.4%,较原YOLOv5提升了5.9个百分点,且FPS较改进前提升了4.4%,能够快速准确地对交通标志进行检测。 展开更多
关键词 交通标志检测 YOLOv5 多分支采样 特征融合 空洞卷积 注意力机制
在线阅读 下载PDF
抗锯齿无锚框目标检测模型 被引量:1
7
作者 冉梦影 杨文柱 尹群杰 《计算机应用与软件》 北大核心 2025年第1期116-123,176,共9页
为了提升无锚框目标检测模型对物体多尺度检测性能,并实现检测速度与精度的最佳折中,提出一种具有抗锯齿能力的无锚框目标检测模型。下采样操作中,使用分组自适应低通滤波器解决网络中存在的锯齿问题;并联不同空洞率的空洞卷积进行多尺... 为了提升无锚框目标检测模型对物体多尺度检测性能,并实现检测速度与精度的最佳折中,提出一种具有抗锯齿能力的无锚框目标检测模型。下采样操作中,使用分组自适应低通滤波器解决网络中存在的锯齿问题;并联不同空洞率的空洞卷积进行多尺度特征融合,扩大神经元感受野范围。防止在模型训练过程中破坏网络参数,对损失函数进行实验讨论,替换为smooth L1 Loss函数。实验结果表明,在PASCAL VOC数据集上mAP指标达到了82.1%,FPS达到了32,与CenterNet-ResNet101相比,mAP提升了4.3%,FPS提升了18.5%。 展开更多
关键词 目标检测 无锚框 锯齿问题 空洞卷积 损失函数
在线阅读 下载PDF
多尺度感受野增强的人脸表情识别方法
8
作者 袁姮 常峻溪 《传感器与微系统》 北大核心 2025年第6期51-55,共5页
针对基于卷积神经网络(CNN)的人脸表情识别方法对图像细节特征提取不充分,模型泛化能力较差,关键特征信息利用率低的问题,提出一种多尺度感受野增强的人脸表情识别网络(MRENet)。首先,设计融合空洞卷积的多尺度特征提取模块(AMF Block)... 针对基于卷积神经网络(CNN)的人脸表情识别方法对图像细节特征提取不充分,模型泛化能力较差,关键特征信息利用率低的问题,提出一种多尺度感受野增强的人脸表情识别网络(MRENet)。首先,设计融合空洞卷积的多尺度特征提取模块(AMF Block),该模块在不增加参数量的同时,融合不同感受野特征图信息,提高网络的准确率与鲁棒性;然后,融合通道注意力和空间注意力的双注意力机制(DAM),能够充分提取通道域和空间域特征,增强对关键特征的感知能力与提取能力,提升网络识别精度;最后,采用SoftMax分类器实现对人脸表情的准确识别。本文方法在数据集FER2013、CK+和JAFFE上识别准确率分别达到74.76%、98.49%和98.42%,证明了该方法的有效性。 展开更多
关键词 人脸表情识别 空洞卷积 注意力机制 多尺度特征
在线阅读 下载PDF
图像簇块扩张卷积驱动的工业相机颜色恒常系统
9
作者 陈湘军 《实验室研究与探索》 北大核心 2025年第10期105-112,共8页
为解决工业相机颜色恒常性任务中存在高质量数据集匮乏与实时处理的需求的问题,提出了一种结合数据增强与轻量网络方法。通过归一化光照色度均匀采样策略和图像簇块分割扩展数据集,解决标签分布不均和样本不足的问题;设计了一个由特征... 为解决工业相机颜色恒常性任务中存在高质量数据集匮乏与实时处理的需求的问题,提出了一种结合数据增强与轻量网络方法。通过归一化光照色度均匀采样策略和图像簇块分割扩展数据集,解决标签分布不均和样本不足的问题;设计了一个由特征提取模块和融合模块组成的5层卷积分段网络,在保证精度的同时显著降低了复杂度。实验结果表明,在Gehler-Shi/NUS数据集上,中位数误差分别仅为2.17°和2.73°。在部署工业相机并集成FPGA后,平均角度误差为1.52°,处理延迟≤10 ms,可支持4K@30f/s实时色彩校正。该方法在实现接近最优精度的同时,具备了更高的稳定性和处理效率,为工业复杂光照环境下的实时色彩校正提供了可靠解决方案。 展开更多
关键词 颜色恒常性 归一均匀采样 簇块扩张卷积 分段神经网络 扩展数据集
在线阅读 下载PDF
水下模糊目标的自适应检测方法
10
作者 刘照龙 袁宏武 余倩 《应用光学》 北大核心 2025年第5期1024-1033,共10页
水下环境存在光线衰弱、色彩失真、复杂背景干扰、目标尺度多样以及目标特征模糊等问题。针对目标尺度多样性和特征模糊难定位等问题,提出了一种基于Faster R-CNN(faster regionbased convolutional neural networks)改进的水下目标检... 水下环境存在光线衰弱、色彩失真、复杂背景干扰、目标尺度多样以及目标特征模糊等问题。针对目标尺度多样性和特征模糊难定位等问题,提出了一种基于Faster R-CNN(faster regionbased convolutional neural networks)改进的水下目标检测算法。首先,在特征提取中引入可切换的空洞卷积,解决了特征提取过程中图像全局上下文信息丢失而导致的特征损失问题;其次,使用递归特征金字塔使高层特征与底层特征多次交互融合,增强模型对水下小目标以及复杂形状目标的检测能力;最后,引入了一种基于引导锚框的建议网络,该网络根据图像的语义特征,动态生成锚点更为稀疏且形状自适应的锚框,显著地提高了模型对水下目标检测的准确性及定位能力。实验表明:改进后的算法在水下数据集DUO上mAP(mean average precision)提高了5.7%,并且在通用目标检测数据集VOC上也有较好的表现。 展开更多
关键词 水下目标检测 可切换空洞卷积 递归特征金字塔 特征模糊 锚框引导建议网络
在线阅读 下载PDF
基于改进YOLOv3-SPP算法的道路车辆检测 被引量:7
11
作者 王涛 冯浩 +4 位作者 秘蓉新 李林 何振学 傅奕茗 吴姝 《通信学报》 EI CSCD 北大核心 2024年第2期68-78,共11页
针对在城市道路场景下视觉检测车辆时,车辆密集和远处车辆呈现小尺度,导致出现检测精度低或者漏检的问题,提出了一种基于改进的YOLOv3-SPP算法,对激活函数进行优化,以DIOU-NMS Loss作为边界框损失函数,增强网络的表达能力。为提高所提... 针对在城市道路场景下视觉检测车辆时,车辆密集和远处车辆呈现小尺度,导致出现检测精度低或者漏检的问题,提出了一种基于改进的YOLOv3-SPP算法,对激活函数进行优化,以DIOU-NMS Loss作为边界框损失函数,增强网络的表达能力。为提高所提算法对小目标和遮挡目标的特征提取能力,引入空洞卷积模块,增大目标的感受野。实验结果表明,所提算法在检测车辆目标时m AP提高了1.79%,也有效减少了在检测紧密车辆目标时出现的漏检现象。 展开更多
关键词 车辆检测 YOLOv3-SPP算法 激活函数 空洞卷积 深度学习
在线阅读 下载PDF
多尺度特征和极化自注意力的Faster-RCNN水漂垃圾识别 被引量:2
12
作者 蒋占军 吴佰靖 +1 位作者 马龙 廉敬 《计算机应用》 CSCD 北大核心 2024年第3期938-944,共7页
针对小目标水漂垃圾形态多变、分辨率低且信息有限,导致检测效果不理想的问题,提出一种改进的Faster-RCNN(Faster Regions with Convolutional Neural Network)水漂垃圾检测算法MP-Faster-RCNN(Faster-RCNN with Multi-scale feature an... 针对小目标水漂垃圾形态多变、分辨率低且信息有限,导致检测效果不理想的问题,提出一种改进的Faster-RCNN(Faster Regions with Convolutional Neural Network)水漂垃圾检测算法MP-Faster-RCNN(Faster-RCNN with Multi-scale feature and Polarized self-attention)。首先,建立黄河兰州段小目标水漂垃圾数据集,将空洞卷积结合ResNet-50代替原来的VGG-16(Visual Geometry Group 16)作为主干特征提取网络,扩大感受野以提取更多小目标特征;其次,在区域生成网络(RPN)利用多尺度特征,设置3×3和1×1的两层卷积,补偿单一滑动窗口造成的特征丢失;最后,在RPN前加入极化自注意力,进一步利用多尺度和通道特征提取更细粒度的多尺度空间信息和通道间依赖关系,生成具有全局特征的特征图,实现更精确的目标框定位。实验结果表明,MP-Faster-RCNN能有效提高水漂垃圾检测精度,与原始Faster-RCNN相比,平均精度均值(mAP)提高了6.37个百分点,模型大小从521 MB降到了108 MB,且在同一训练批次下收敛更快。 展开更多
关键词 目标检测 水漂垃圾 Faster-RCNN 空洞卷积 多尺度特征融合 极化自注意力
在线阅读 下载PDF
基于改进SwiftNet的堆场图像实时分割网络 被引量:1
13
作者 陈晓玉 沈晨 +1 位作者 沈阅 孔德明 《计算机工程》 CAS CSCD 北大核心 2024年第6期296-303,共8页
在堆场环境下,实时图像语义分割可以提供直观的场景类别信息。为节约工控机等边缘设备的硬件资源以及为多源信息融合提供图像语义类别信息,提出一种轻量化的实时语义分割网络模型。首先提出基于空间注意力引导的上采样融合模块,通过引... 在堆场环境下,实时图像语义分割可以提供直观的场景类别信息。为节约工控机等边缘设备的硬件资源以及为多源信息融合提供图像语义类别信息,提出一种轻量化的实时语义分割网络模型。首先提出基于空间注意力引导的上采样融合模块,通过引入空间注意力和残差注意力结构设计一种轻量化的解码器,在上采样过程中还原空间细节,抑制冗余信息,进而融合不同来源的特征图;其次提出一种轻量化的级联空洞空间金字塔模块,利用级联的空洞卷积单元增大网络感受野,有效提取多尺度特征;最后使用通道分离、通道混洗、通道池化等操作,降低多尺度聚合过程中的计算开销。在公开数据集Camvid上,该模型的平均交并比(MIoU)为70.1%,推理速度为146.3帧/s,分割精度和推理速度优于ENet、ICNet等模型,消融实验结果也证明了所提各模块的有效性;在实际堆场图像数据集上,该模型的MIoU为93.5%,推理速度为123.8帧/s,证明模型结构具有良好的泛化性能。 展开更多
关键词 实时语义分割 注意力机制 空洞卷积 感受野 堆场图像
在线阅读 下载PDF
深层特征提取与多输出增强融合的建筑物分割
14
作者 田保慧 胡颖雷 +2 位作者 刘晓旭 刘用 杨元维 《遥感信息》 CSCD 北大核心 2024年第1期35-42,共8页
针对高分辨率遥感影像建筑物语义分割中存在单体建筑部分漏分与纹理相近的非建筑物错分的问题,提出深度特征提取与多输出增强建筑物语义分割网络。首先,在编码与解码交替处设计并行连续空洞空间注意力金字塔模块,对建筑物高维特征实现... 针对高分辨率遥感影像建筑物语义分割中存在单体建筑部分漏分与纹理相近的非建筑物错分的问题,提出深度特征提取与多输出增强建筑物语义分割网络。首先,在编码与解码交替处设计并行连续空洞空间注意力金字塔模块,对建筑物高维特征实现深层提取;然后,在网络解码阶段设计多输出增强融合模块,提升不同尺度建筑物特征对输出结果的有效参与度。选取U-Net、DeeplabV3+、MA-FCN、BRRNet同类算法进行对比,在Massachusetts和WHU公共数据集上测试,OA、precision、recall、IoU、F1指标分别达到98.87%、94.53%、95.40%、90.41%、94.96%,与同类算法相比,除precision之外其他4项指标更高,与U-Net相比,依次高出0.25%、1.12%、1.14%、2.02%、1.12%。 展开更多
关键词 建筑物提取 注意力机制 多输出融合 深层特征 空洞卷积
在线阅读 下载PDF
基于稠密块改进LinkNet的高分遥感图像道路提取 被引量:2
15
作者 王增优 张鲜化 +2 位作者 刘荣 陈志高 朱旺煌 《航天返回与遥感》 CSCD 北大核心 2024年第3期107-117,共11页
针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Bloc... 针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Block),密集连接的方式减少特征信息在传递过程中的损失,并在每个稠密块之后构建卷积注意力单元来提高模型对目标特征的学习能力,最后用空洞空间金字塔池化模块将编码区与解码区进行连接,扩大感受野的同时还能接受多尺度目标特征信息。实验表明,该方法在DeepGlobe数据集上的准确率、平均交并比和F1-score分为82.16%、83.21%和81.65%,均优于同类网络,通过对提取的路网结果对比,该算法对于树木遮蔽处以及建筑物阴影下的路网提取在完整性和准确性上都具有明显提升。 展开更多
关键词 残差网络 道路提取 稠密块 卷积注意力 空洞空间金字塔池化
在线阅读 下载PDF
健身行为的人体姿态估计及动作识别 被引量:7
16
作者 付惠琛 高军伟 车鲁阳 《液晶与显示》 CAS CSCD 北大核心 2024年第2期217-227,共11页
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法... 人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。 展开更多
关键词 图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化
在线阅读 下载PDF
融合深度迁移学习和改进ThunderNet的瓷砖表面缺陷检测 被引量:4
17
作者 陈克琼 卓士虎 +3 位作者 赵晨曦 傅立涛 王家铭 李帷韬 《电子测量与仪器学报》 CSCD 北大核心 2024年第3期208-218,共11页
瓷砖生产过程中由于环境的复杂性和随机性导致缺陷特性各异,实际中要构建大规模、高质量的瓷砖表面缺陷数据样本非常困难,而小样本条件下的可分特征信息不足对瓷砖表面缺陷检测的精度有较大影响。针对这一问题,探索了一种融合深度迁移... 瓷砖生产过程中由于环境的复杂性和随机性导致缺陷特性各异,实际中要构建大规模、高质量的瓷砖表面缺陷数据样本非常困难,而小样本条件下的可分特征信息不足对瓷砖表面缺陷检测的精度有较大影响。针对这一问题,探索了一种融合深度迁移学习和改进两阶段ThunderNet网络的瓷砖表面缺陷检测方法。首先,提出了一种基于改进ThunderNet网络的瓷砖表面缺陷检测模型,阐述了模型的结构与功能特点;其次,构造了瓷砖表面缺陷深度特征空间参数迁移决策机制,以有效提升样本特征表征能力;第三,基于可切换空洞卷积(switchable atrous convolution,SAC)优化ShuffleNet骨干网络,增强模型对缺陷形状变化的学习能力;第四,提出了基于多尺度映射和通道注意力(squeeze and excitation,SE)的特征融合算法,实现有限特征层次中瓷砖表面缺陷特征信息多层次差异化表征;最后,给出了融合深度迁移学习和改进ThunderNet网络的瓷砖表面缺陷检测算法。实验数据表明,在相同的瓷砖表面缺陷测试集上,本文方法对于小样本条件下瓷砖表面缺陷检测具有优越的性能,模型平均精度、平均召回率和平均检测速度分别达到87.22%、93.69%、61.6 ms/img,与传统ThunderNet模型相比,平均精度和平均召回率分别提高了9.30%、4.16%,其中,基于SAC最优空洞率组合{1,2},模型精度提高了5.51%,基于SE的最优压缩率24,模型精度提高了6.16%,基于本文迁移机制,模型精度提高了3.86%,同时加速了网络收敛。本文方法相比于传统ThunderNet网络和其他主流检测模型,通过迁移机制知识共享提高小样本对象特征表达能力,通过引入SAC和SE在控制模型规模的前提下实现对象特征的层次化表征,有效提升了模型的实时性和可靠性。 展开更多
关键词 瓷砖表面缺陷检测 可切换空洞卷积 迁移学习 通道注意力 特征融合 小样本
在线阅读 下载PDF
RCSA-YOLO:改进YOLOv8的SAR舰船实例分割 被引量:2
18
作者 王磊 张斌 吴奇鸿 《计算机工程与应用》 CSCD 北大核心 2024年第18期103-113,共11页
针对合成孔径雷达(synthetic aperture radar,SAR)图像中背景复杂、目标小和尺度变化大等导致分割精度低的问题,提出了一种基于改进YOLOv8的SAR图像舰船实例分割算法RCSA-YOLO。利用结构重参数技术设计特征提取模块RepBlock,用以替换原... 针对合成孔径雷达(synthetic aperture radar,SAR)图像中背景复杂、目标小和尺度变化大等导致分割精度低的问题,提出了一种基于改进YOLOv8的SAR图像舰船实例分割算法RCSA-YOLO。利用结构重参数技术设计特征提取模块RepBlock,用以替换原网络中的C2f模块,增强网络的特征提取和特征表达能力,有效过滤了复杂背景噪声的干扰。使用基于内容感知的特征重组模块(content-aware reassembly of features,CARAFE)替换最近邻上采样方法,有效缓解了小目标信息丢失现象,提升了分割精细化程度。使用可切换空洞卷积(switchable atrous convolution,SAC)进行下采样操作,动态调整感受野大小,使模型具备更强的多尺度适应能力,确保了在不同尺寸舰船目标上的分割精度。在HRSID数据集上的实验结果表明,提出的算法可以将YOLOv8模型的AP_(50)值从87.7%提高到90.7%,较原算法提高了3个百分点。与主流的实例分割算法对比,SAR舰船实例分割精度也明显提升,证明了RCSA-YOLO的有效性。 展开更多
关键词 合成孔径雷达 结构重参数化 上采样 可切换空洞卷积
在线阅读 下载PDF
基于增强特征提取网络与语义特征融合的多方向文本检测 被引量:2
19
作者 吕伶 李华 王武 《图学学报》 CSCD 北大核心 2024年第1期56-64,共9页
针对自然场景文本长度不定、角度倾斜等难题,提出了一种基于增强特征提取网络与语义特征融合的文本检测方法。通过结合可变形卷积与空洞卷积,设计了一种增强扩张残差模块EDRM(Enhanced Dilated Residual Module),将其应用于ResNet18的co... 针对自然场景文本长度不定、角度倾斜等难题,提出了一种基于增强特征提取网络与语义特征融合的文本检测方法。通过结合可变形卷积与空洞卷积,设计了一种增强扩张残差模块EDRM(Enhanced Dilated Residual Module),将其应用于ResNet18的conv4_x与conv5_x层,并以此作为骨干网络,在改善网络特征提取能力的同时提高特征图像分辨率,减少空间信息丢失。其次,针对现有算法提取文本语义特征仍不充分的问题,将双向长短期记忆网络BiLSTM(Bi-directional Long Short-Term Memory)引入特征融合部分,增强融合特征图对自然场景文本的表征能力以及特征序列的关联性,同时提高模型的文本定位能力。在多方向文本数据集ICDAR2015、长文本数据集MSRA-TD500上对模型展开评估,实验结果表明,该算法与当下高效的DBNet算法相比,F值分别提升1.8%、3.3%,表现出良好的竞争力。 展开更多
关键词 可变形卷积 空洞卷积 文本检测 语义特征 双向长短期记忆网络
在线阅读 下载PDF
基于CNN-Transformer结构的遥感影像变化检测 被引量:2
20
作者 潘梦洋 杨航 范祥晖 《液晶与显示》 CAS CSCD 北大核心 2024年第10期1361-1379,共19页
现代高分辨率遥感图像变化检测借助卷积神经网络(Convolutional Neural Network,CNN)取得了显著成果。然而,卷积操作的感受野限制导致在学习全局上下文和远程空间关系方面存在不足。虽然视觉Transformer能有效捕获远程特征的依赖性,但... 现代高分辨率遥感图像变化检测借助卷积神经网络(Convolutional Neural Network,CNN)取得了显著成果。然而,卷积操作的感受野限制导致在学习全局上下文和远程空间关系方面存在不足。虽然视觉Transformer能有效捕获远程特征的依赖性,但其对影像变化细节的处理不足,导致空间定位能力有限且计算效率低下。为解决上述问题,本文提出了一种基于空间空洞金字塔池化的跨层级联线性融合端到端编解码混合CNN-Transformer的变化检测模型,兼具视觉Transformer和CNN的优势。首先,利用孪生CNN网络提取图像特征,并借助空洞金字塔池化模块对特征进行精细处理,从而更精准地捕获图像的细节特征信息。其次,将提取的特征转化为视觉单词,并通过Transformer编码器进行建模,以获取丰富的上下文信息。这些信息随后被反馈至视觉空间,通过Transformer解码器对原始特征进行强化,提升特征的表达效果。接着,采用跨层级联的方式将CNN提取的特征与Transformer编解码的特征进行融合,利用上采样技术联系不同分辨率的特征图,实现位置信息与语义信息的融合。最后,通过差异增强模块生成包含丰富变化信息的差异特征图。在LEVIR、CDD、DSIFN和WHUCD 4个公开遥感数据集上的广泛实验验证了本文方法的有效性。与其他先进方法相比,本文模型的分类性能更出色,有效改善了变化检测中的欠分割、过分割及边缘粗糙等问题。 展开更多
关键词 遥感图像 变化检测 卷积神经网络 TRANSFORMER 空间空洞金字塔池化
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部