期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于空洞空间池化金字塔的自动驾驶图像语义分割方法 被引量:5
1
作者 王大方 刘磊 +3 位作者 曹江 赵刚 赵文硕 唐伟 《汽车工程》 EI CSCD 北大核心 2022年第12期1818-1824,共7页
如果车辆在道路上能精确而快速地理解人和车的语义,就能在很大程度上对障碍躲避、路径规划等做出指导。现有的基于深度学习的语义分割方法存在分割速度和分割精度不能兼得等问题。本文在现有语义分割网络的基础上,通过在特征提取基准网... 如果车辆在道路上能精确而快速地理解人和车的语义,就能在很大程度上对障碍躲避、路径规划等做出指导。现有的基于深度学习的语义分割方法存在分割速度和分割精度不能兼得等问题。本文在现有语义分割网络的基础上,通过在特征提取基准网络后添加空洞空间池化金字塔结构,可以获取图像的多尺度语义信息。实验结果表明,文中提出的A_ASPP_1和A_ASPP_2两个模块能对自动驾驶场景中常见的人和各类车辆图像进行有效的分割。对应的两种改进的网络结构虽然分割速度稍有降低,但其训练结果的平均交并比相比现有双分支网络BiSeNet分别提升了2.1和1.2个百分点。 展开更多
关键词 语义分割 自动驾驶 空洞空间池化金字塔
在线阅读 下载PDF
基于空洞空间金字塔池化U-Net的遥感图像多目标检测方法 被引量:2
2
作者 张善文 许新华 齐国红 《弹箭与制导学报》 北大核心 2023年第5期1-8,共8页
针对遥感图像(RSI)中的目标相对较小、形变多样,且包含分布不均匀的非目标和背景等问题,提出一种基于空洞空间金字塔池化U-Net的遥感图像多目标检测方法。该方法利用空洞多尺度卷积提取多尺度目标的分类特征,运用空洞空间池化金字塔模... 针对遥感图像(RSI)中的目标相对较小、形变多样,且包含分布不均匀的非目标和背景等问题,提出一种基于空洞空间金字塔池化U-Net的遥感图像多目标检测方法。该方法利用空洞多尺度卷积提取多尺度目标的分类特征,运用空洞空间池化金字塔模块扩大卷积特征图的感受野,提取更充分的目标特征,并采用注意力机制、残差连接和长跳跃连接充分保留卷积层提取的RSI的敏感特征。在公开遥感图像数据库EORSSD上的实验结果表明,所提出的方法能够从复杂多样的RSI中检测多尺度目标,检测精度为96.56%。 展开更多
关键词 遥感图像多目标检测 空洞多尺度卷积 空洞空间金字塔池化 空洞空间金字塔池化U-Net
在线阅读 下载PDF
基于空洞卷积神经网络的毒株胚蛋裂纹分割
3
作者 耿磊 张静 +1 位作者 肖志涛 童军 《天津工业大学学报》 CAS 北大核心 2022年第3期69-75,共7页
针对工厂机械设备的噪声和振动、胚蛋蛋壳表面的污斑和裂纹大小、光源打光方式会对裂纹检测产生严重影响,提出一种基于密集空洞卷积模块(DACM)与空洞空间金字塔池化结构(ASPP)的卷积神经网络(CNN)分割方法分割胚蛋裂纹。采用编码器-解... 针对工厂机械设备的噪声和振动、胚蛋蛋壳表面的污斑和裂纹大小、光源打光方式会对裂纹检测产生严重影响,提出一种基于密集空洞卷积模块(DACM)与空洞空间金字塔池化结构(ASPP)的卷积神经网络(CNN)分割方法分割胚蛋裂纹。采用编码器-解码器网络结构与密集连接的空洞卷积结合,增强空间信息表示并重建不同尺度目标信息;同时,在网络浅层引入ASPP,获取多尺度特征,增强细节信息,提高网络分割性能。结果表明:在自制毒株胚蛋顶部裂纹与侧面裂纹数据集上,该方法的平均交并比(MIoU)分别达到了74.2%与81.3%,具有较强的鲁棒性。 展开更多
关键词 毒株胚蛋裂纹分割 卷积神经网络 编码器-解码器 空洞卷积 空洞空间金字塔池化
在线阅读 下载PDF
基于迭代压缩U型网络的煤颗粒分割与粒度分析方法
4
作者 程德强 张瑞 +4 位作者 谢同喜 刘敬敬 郑丽娟 寇旗旗 江鹤 《煤炭学报》 北大核心 2025年第2期1362-1375,共14页
煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘... 煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘细节起着关键作用,直接影响分割结果的准确性。基于卷积神经网络架构的U型网络过于注重局部信息,忽视了全局信息的重要性,容易导致过分割现象。而基于Transformer的网络利用多头自注意力机制有效地建模了全局信息,但却没有充分利用边缘细节特征,导致煤颗粒漏分割问题。为了解决上述问题,本研究提出了迭代压缩U型网络(Iterative Squeeze UNet,ISUNet)用于煤颗粒粒度分析。ISUNet模型引入了压缩激励空洞空间金字塔池化模块和基于Transformer的多路迭代编码器。压缩激励空洞空间金字塔池化模块通过增强不同尺度特征的通道信息和全局上下文信息,解决了煤粒过分割问题。编码器中的多头自注意力模块将ResNet50的卷积特征作为其中一个输入,通过点乘自注意力机制不断强化重要的边缘细节特征,解决了煤粒漏分割问题。与5种经典图像分割模型和4种目前主流的分割模型相比,ISUNet表现出色。相较于经典的分割模型TransUNet来说,平均交并比提高了6.6%,准确率提高了0.3%,召回率提高了7.0%,相较于目前主流的图像分割大模型Segment Anything来说,平均交并比提高了4.6%,准确率提高了0.2%,召回率提高了4.9%。在煤粒粒度测量方面,准确率达到了97.49%。这些试验结果充分证实了ISUNet在煤粒粒度分析中的有效性和优越性。 展开更多
关键词 煤粒粒度分析 图像分割 基于Transformer的多路迭代编码器 压缩激励空洞空间金字塔池化 U型网络
在线阅读 下载PDF
A-LinkNet:注意力与空间信息融合的语义分割网络 被引量:3
5
作者 杜敏敏 司马海峰 《液晶与显示》 CAS CSCD 北大核心 2022年第9期1199-1208,共10页
针对道路图像语义分割中上下文信息不足以及空间细节信息易丢失等问题,本文提出一种基于LinkNet模型的实时分割方法。首先,在编码区域构建一种新的注意力机制,捕获道路图像的位置以及通道依赖,增加目标特征的提取能力。然后,在中心区域... 针对道路图像语义分割中上下文信息不足以及空间细节信息易丢失等问题,本文提出一种基于LinkNet模型的实时分割方法。首先,在编码区域构建一种新的注意力机制,捕获道路图像的位置以及通道依赖,增加目标特征的提取能力。然后,在中心区域引入空洞空间金字塔池化模型,在不影响图像分辨率的情况下捕获更加丰富的多尺度特征。在通用数据库上的实验结果表明,所提方法在Cityscapes数据集上MIoU达到了64.78%,与LinkNet相比较,提高了5.01%,同时对于细小目标物体以及边界分割视觉效果有明显的改善,分割准确率获得了较大提升。 展开更多
关键词 语义分割 注意力机制 空洞空间金字塔池化 LinkNet
在线阅读 下载PDF
基于CNN-Transformer结构的遥感影像变化检测
6
作者 潘梦洋 杨航 范祥晖 《液晶与显示》 CAS CSCD 北大核心 2024年第10期1361-1379,共19页
现代高分辨率遥感图像变化检测借助卷积神经网络(Convolutional Neural Network,CNN)取得了显著成果。然而,卷积操作的感受野限制导致在学习全局上下文和远程空间关系方面存在不足。虽然视觉Transformer能有效捕获远程特征的依赖性,但... 现代高分辨率遥感图像变化检测借助卷积神经网络(Convolutional Neural Network,CNN)取得了显著成果。然而,卷积操作的感受野限制导致在学习全局上下文和远程空间关系方面存在不足。虽然视觉Transformer能有效捕获远程特征的依赖性,但其对影像变化细节的处理不足,导致空间定位能力有限且计算效率低下。为解决上述问题,本文提出了一种基于空间空洞金字塔池化的跨层级联线性融合端到端编解码混合CNN-Transformer的变化检测模型,兼具视觉Transformer和CNN的优势。首先,利用孪生CNN网络提取图像特征,并借助空洞金字塔池化模块对特征进行精细处理,从而更精准地捕获图像的细节特征信息。其次,将提取的特征转化为视觉单词,并通过Transformer编码器进行建模,以获取丰富的上下文信息。这些信息随后被反馈至视觉空间,通过Transformer解码器对原始特征进行强化,提升特征的表达效果。接着,采用跨层级联的方式将CNN提取的特征与Transformer编解码的特征进行融合,利用上采样技术联系不同分辨率的特征图,实现位置信息与语义信息的融合。最后,通过差异增强模块生成包含丰富变化信息的差异特征图。在LEVIR、CDD、DSIFN和WHUCD 4个公开遥感数据集上的广泛实验验证了本文方法的有效性。与其他先进方法相比,本文模型的分类性能更出色,有效改善了变化检测中的欠分割、过分割及边缘粗糙等问题。 展开更多
关键词 遥感图像 变化检测 卷积神经网络 TRANSFORMER 空间空洞金字塔池化
在线阅读 下载PDF
基于改进DeepLabV3+的遥感图像分割方法
7
作者 席裕斌 赵良军 +4 位作者 宁峰 何中良 梁刚 张芸 胡月明 《现代电子技术》 北大核心 2024年第11期51-58,共8页
由于遥感图像具有高分辨率,卷积层需要扩大感受野以捕获更丰富的语义信息。在进行遥感图像分割时,DeepLabV3+模型采用较大的空洞率以获得更大感受野,导致网格伪影问题。因此,提出一种优化网格伪影的改进DeepLabV3+模型。首先,在空间空... 由于遥感图像具有高分辨率,卷积层需要扩大感受野以捕获更丰富的语义信息。在进行遥感图像分割时,DeepLabV3+模型采用较大的空洞率以获得更大感受野,导致网格伪影问题。因此,提出一种优化网格伪影的改进DeepLabV3+模型。首先,在空间空洞金字塔池化(ASPP)之前引入了一个平滑网格伪影模块,以减轻网格伪影对分割任务的影响;接着,在ASPP模块的每个空洞卷积之后添加了一个逐点卷积,以保留更多的空间信息;其次,替换空洞卷积的激活函数为LeakyReLU;最后,在DeepLabV3+中引入了ECA注意力机制。通过在GID15和Postdam遥感数据集上的验证,相对于基础的DeepLabV3+模型,改进模型在准确度和平均交并比方面均取得了显著提升,证明所提出的网络调整能有效提高遥感图像分割的精度。 展开更多
关键词 遥感图像 语义分割 网格伪影 空间空洞金字塔池化 ECA注意力机制 DeepLabV3+模型
在线阅读 下载PDF
健身行为的人体姿态估计及动作识别 被引量:4
8
作者 付惠琛 高军伟 车鲁阳 《液晶与显示》 CAS CSCD 北大核心 2024年第2期217-227,共11页
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法... 人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。 展开更多
关键词 图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化
在线阅读 下载PDF
基于改进的IIE-SegNet的快速图像语义分割方法 被引量:1
9
作者 李庆 王宏健 +2 位作者 李本银 肖瑶 迟志康 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第2期314-323,共10页
针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计... 针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计算量大的问题;研究Focal损失函数来解决正、负采样不平衡的问题。实验结果表明:与IIE-SegNet相比,本方法在PASCAL VOC 2012数据集上的语义分割速度更快,平均每次迭代快0.6 s左右,测试单张图像的时间平均减少了0.94 s;分割精度更高,MIoU提升了2.1%。在扩展的PASCAL VOC 2012(Exp-PASCAL VOC 2012)数据集上的语义分割速度更快,平均每次迭代快0.4 s左右,测试单张图像的时间平均减少了0.92 s;分割精度更高,MPA和MIoU分别提升了2.6%和2.8%,特别是对于小尺度目标分割边界更清晰,性能得到了很大的提升。 展开更多
关键词 语义分割 深度学习 多尺度空洞卷积空间金字塔池化 图像信息熵 全局加平均 VGG16 IIE-SegNet
在线阅读 下载PDF
多尺度特征融合注意力新冠肺炎病灶分割网络 被引量:1
10
作者 林洁沁 黄新 《激光杂志》 CAS 北大核心 2024年第3期168-174,共7页
新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Atte... 新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Attention Network),以图像分割效果较为出色的U-Net网络为基础,通过全局池化层和设置空洞卷积的采样率,增大网络感受野,捕获多尺度信息,实现对大目标的有效分割;使用通道注意力与空间注意力,在空间维度上建模,有效提取图像深层特征。测试结果表明,改进后的算法与U-Net网络相比,分割的平均交并比提升了1.46%,类别平均像素准确率提升了0.8%,准确率提升了1.17%。 展开更多
关键词 图像处理 特征提取 卷积块注意力模块 空洞空间卷积池化金字塔 U-Net结构 多尺度特征融合
在线阅读 下载PDF
基于稠密块改进LinkNet的高分遥感图像道路提取
11
作者 王增优 张鲜化 +2 位作者 刘荣 陈志高 朱旺煌 《航天返回与遥感》 CSCD 北大核心 2024年第3期107-117,共11页
针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Bloc... 针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Block),密集连接的方式减少特征信息在传递过程中的损失,并在每个稠密块之后构建卷积注意力单元来提高模型对目标特征的学习能力,最后用空洞空间金字塔池化模块将编码区与解码区进行连接,扩大感受野的同时还能接受多尺度目标特征信息。实验表明,该方法在DeepGlobe数据集上的准确率、平均交并比和F1-score分为82.16%、83.21%和81.65%,均优于同类网络,通过对提取的路网结果对比,该算法对于树木遮蔽处以及建筑物阴影下的路网提取在完整性和准确性上都具有明显提升。 展开更多
关键词 残差网络 道路提取 稠密块 卷积注意力 空洞空间金字塔池化
在线阅读 下载PDF
基于轻量级Transformer的隧道裂缝分割 被引量:2
12
作者 邝先验 徐姚明 +2 位作者 雷卉 程福军 桓湘澜 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第8期3421-3433,共13页
裂缝检测对保证隧道结构安全至关重要,及时发现隧道裂缝缺陷,有利于降低工程维修成本和保障行车安全。然而,传统卷积神经网络在隧道裂缝检测任务中主要侧重提高检测精度和算法复杂度,如何平衡裂缝检测的精度和实时性是当前研究的一个难... 裂缝检测对保证隧道结构安全至关重要,及时发现隧道裂缝缺陷,有利于降低工程维修成本和保障行车安全。然而,传统卷积神经网络在隧道裂缝检测任务中主要侧重提高检测精度和算法复杂度,如何平衡裂缝检测的精度和实时性是当前研究的一个难点。针对这一问题,本文提出一种基于轻量级Transformer的裂缝分割方法 CrackViT。首先,采用卷积神经网络与Transformer混合的MobileViT网络构建裂缝特征提取网络,减少网络模型参数和计算量,并且有效提取裂缝图像全局信息和局部特征信息。然后,提出改进空洞空间金字塔池化解码器实现不同尺度的特征提取和信息融合,实现像素级概率分布。同时,裂缝图像存在细节信息缺失问题,引入高效通道注意力模块,增强对裂缝特征信息的提取能力。此外,针对裂缝与背景类别不平衡问题,设计了在线困难样本挖掘损失函数进行缓解。实验结果表明:在单个3050Ti GPU上,CrackViT算法最终在裂缝数据集上以63 FPS的速度获得了75.62%的IoU,模型参数量仅为2.43 M。CrackViT-L模型精度IoU为76.83%,模型参数量为3.56 M,模型推理速度达到61FPS。算法测试精度优于大多数主流模型,并且需要更少的模型参数。研究结果表明,CrackViT所预测的隧道裂缝分割图像边缘更加清晰和完整,保持推理速度的同时,能够有效检测裂缝,该算法有助于隧道裂缝检测实际应用。 展开更多
关键词 裂缝分割 TRANSFORMER MobileViT 空洞空间金字塔池化 轻量级模型
在线阅读 下载PDF
基于注意力机制的多尺度手部分割方法
13
作者 周雯晴 代素敏 +1 位作者 王阳萍 王文润 《液晶与显示》 CAS CSCD 北大核心 2024年第11期1506-1518,共13页
针对手部边缘细节信息分割不精确及小面积手部的错检、漏检问题,提出一种基于注意力机制的多尺度手部分割方法。首先,对Transformer模块重新进行设计优化,提出窗口自注意力结构和双分支前馈神经网络(Dual-branch FeedForward Networks,D... 针对手部边缘细节信息分割不精确及小面积手部的错检、漏检问题,提出一种基于注意力机制的多尺度手部分割方法。首先,对Transformer模块重新进行设计优化,提出窗口自注意力结构和双分支前馈神经网络(Dual-branch FeedForward Networks,D-FFN)机制,通过窗口自注意力机制整合全局和局部的依赖信息,D-FFN抑制背景信息的干扰;然后,提出一种结合条形池化和级联网络的多尺度特征提取模块增大感受野,提高手部分割模型的准确性和鲁棒性;最后,提出基于Triplet Attention机制的上采样解码器模块,通过调节通道维度与空间维度的注意力权重将目标特征和背景的冗余特征区分开。将所提算法在公开数据集GTEA(Georgia Tech Egocentric Activity)和EYTH(EgoYouTubeHands)上测试,实验结果表明,该算法在两个数据集上的平均交并比(MIoU)值分别达到了95.8%和90.2%,相较于TransUnet算法分别提升了2.5%和2.1%,满足手部图像分割的稳定可靠、精度高、抗干扰能力强等要求。 展开更多
关键词 手部分割 深度学习 TransUnet 前馈神经网络 空洞空间金字塔池化模块 Triplet Attention
在线阅读 下载PDF
基于改进Swin-Unet的遥感图像分割方法 被引量:2
14
作者 张越 王逊 《无线电工程》 2024年第5期1217-1225,共9页
针对遥感图像数据本身存在分辨率高、背景复杂和光照不均等特性导致边界分割不连续、目标错分漏分以及存在孔洞等问题,提出了一种基于改进Swin-Unet的遥感图像分割方法。在编码器末端引入空洞空间金字塔池化(Atrous Spatial Pyramid Poo... 针对遥感图像数据本身存在分辨率高、背景复杂和光照不均等特性导致边界分割不连续、目标错分漏分以及存在孔洞等问题,提出了一种基于改进Swin-Unet的遥感图像分割方法。在编码器末端引入空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块,用于捕获多尺度特征,增强网络获取不同尺度的能力,充分提取上下文信息;将解码器端的Swin Transformer Block替换为残差Swin Transformer Block,不仅保留了原始信息,又能够缓解模型出现梯度弥散现象;在跳跃连接中引入残差注意力机制,可以让模型更加关注特征图中的重要特征信息,抑制无效信息,从而提高模型分割的准确率。在自建数据集上进行实验,结果表明,改进后的网络平均交并比(mean Intersection over Union,mIoU)达到了80.55%,提高了4.13个百分点,证明改进后的网络可以有效提高遥感图像分割的精度。 展开更多
关键词 遥感图像 语义分割 Swin-Unet 空洞空间金字塔池化 残差注意力机制
在线阅读 下载PDF
基于DeepLabv3+的图像边界修复语义分割
15
作者 任子玉 游新冬 +1 位作者 滕尚志 吕学强 《北京信息科技大学学报(自然科学版)》 2024年第6期17-24,共8页
针对DeepLabv3+在高分辨率遥感图像语义分割中存在的分割目标边界残缺和细节模糊问题,提出了一种图像边界修复语义分割方法。引入多深度卷积头转置注意力(multi-Dconv head transposed attention,MDTA)边界修复模块,将通道注意力机制应... 针对DeepLabv3+在高分辨率遥感图像语义分割中存在的分割目标边界残缺和细节模糊问题,提出了一种图像边界修复语义分割方法。引入多深度卷积头转置注意力(multi-Dconv head transposed attention,MDTA)边界修复模块,将通道注意力机制应用于多级低阶特征,获取不同抽象层次的边缘纹理结构;将经过通道权值分配的密集采样空洞空间金字塔池化(atrous spatial pyramid pooling,ASPP)级联模块的输出作为编码器的输出,解码器融合了低阶特征与编码器输出的增强特征,提高了目标边界的清晰度;利用空间上下文信息挖掘模块——上下文转换器(contextual transformer,CoT),增强对图像不同区域之间依赖关系的感知能力。实验证明,该方法在多个公开数据集上的性能取得了显著提升,在VOC2012的验证集上平均交并比(mean intersection over union,mIoU)达到了90.42%。 展开更多
关键词 DeepLabv3+ 语义分割 空洞空间金字塔池化 特征融合
在线阅读 下载PDF
基于深度学习的田间玉米幼苗与杂草语义分割研究
16
作者 訾彤彤 李温温 《白城师范学院学报》 2024年第2期39-47,共9页
为实现复杂田间背景下玉米幼苗和杂草的准确分割,提出了一种基于改进ResNet的语义分割网络模型.首先,对骨干网络进行调整,在保证感受野不变的情况下降低计算量,提高模型的分割精度;其次,引进空洞空间金字塔池化模块,增强模型对多尺度目... 为实现复杂田间背景下玉米幼苗和杂草的准确分割,提出了一种基于改进ResNet的语义分割网络模型.首先,对骨干网络进行调整,在保证感受野不变的情况下降低计算量,提高模型的分割精度;其次,引进空洞空间金字塔池化模块,增强模型对多尺度目标上下文信息和全局上下文信息的获取能力;最后,引入条带池化模块补充和完善上下文信息,增强全局语义信息表达.实验结果表明,该模型在自建数据上获得85.3%的平均交并比.对田间复杂环境下玉米幼苗与杂草具有良好的分割效果和泛化能力,研究结果为智能除草设备提供一定的参考. 展开更多
关键词 田间玉米幼苗与杂草 深度学习 语义分割 空洞空间金字塔池化 条带池化
在线阅读 下载PDF
基于改进YOLOv7算法的井场作业安全检测方法研究 被引量:3
17
作者 孙亚招 王景浩 李宗祥 《石油工业技术监督》 2024年第5期43-47,70,共6页
针对油井场作业中因监管效率低下导致的安全事故问题,提出了一种改进的YOLOv7算法来检测井场作业人员不安全行为。首先,将YOLOv7模型颈部中的原金字塔池化模块替换为空洞空间金字塔池化(ASPP)模块,ASPP采用多个并行的空洞卷积分支,每个... 针对油井场作业中因监管效率低下导致的安全事故问题,提出了一种改进的YOLOv7算法来检测井场作业人员不安全行为。首先,将YOLOv7模型颈部中的原金字塔池化模块替换为空洞空间金字塔池化(ASPP)模块,ASPP采用多个并行的空洞卷积分支,每个分支具有不同的采样率,从而获得不同尺度的感受野,提高了模型对多尺度特征信息的捕获能力;其次将YOLOv7模型检测头中的普通卷积替换为全维度动态卷积,从4个维度来学习卷积核内部的注意力值,从而获得全维度的卷积核权重,增强了模型对关键特征的关注度。最后,与原YOLOv7模型进行实验对比。结果表明,改进后的模型平均精度均值提高了5.58%。与其他目标检测模型相比,检测性能有显著提升。 展开更多
关键词 YOLOv7算法 不安全行为 空洞空间金字塔池化 全维度动态卷积
在线阅读 下载PDF
基于跨层非局部融合和DeepLabV3+的PCB图像分割算法
18
作者 王守印 陈健 +5 位作者 万佳泽 林丽 张定恒 何栋炜 刘丽桑 曹新容 《电子器件》 2024年第6期1547-1555,共9页
针对PCB图像在分割过程中出现的目标边缘平滑度低、连续性差、分割效率低等问题,提出一种结合注意力机制的轻量级图像分割模型。首先,利用MobileNetV2网络对图像进行深度特征提取;其次,将特征的一个分支输入到空洞空间金字塔池化模块进... 针对PCB图像在分割过程中出现的目标边缘平滑度低、连续性差、分割效率低等问题,提出一种结合注意力机制的轻量级图像分割模型。首先,利用MobileNetV2网络对图像进行深度特征提取;其次,将特征的一个分支输入到空洞空间金字塔池化模块进行多尺度特征提取并融合得到高层特征;最后,引入跨层非局部模块,将另一分支经过卷积得到的底层特征和上述高层特征融合。该方法的平均交并比为96.176%,准确率为97.59%,召回率为95.912%,分割速度为0.062 s,参数量为25.39 Mbyte。方法考虑了图像中小目标检测问题及边界信息损失,提高了图像分割的准确性和实时性。 展开更多
关键词 PCB 注意力机制 图像分割 空洞空间金字塔池化 跨层非局部模块
在线阅读 下载PDF
融合轻量化ASPP和U-Net的遥感影像烤烟种植区域提取
19
作者 郝戍峰 高宇 +5 位作者 刘萍 李宇昂 张华栋 任鸿杰 田帅杰 寇文韬 《航天返回与遥感》 CSCD 北大核心 2024年第4期139-149,共11页
针对目前遥感影像中烤烟边缘识别效率低且识别精度低等问题,文章提出一种融合轻量化ASPP和U-Net框架的遥感影像烤烟种植区域提取模型。首先,该模型在U-Net编码层和解码层连接处加入轻量化空洞空间金字塔池化模块;其次,该模型将线性整流... 针对目前遥感影像中烤烟边缘识别效率低且识别精度低等问题,文章提出一种融合轻量化ASPP和U-Net框架的遥感影像烤烟种植区域提取模型。首先,该模型在U-Net编码层和解码层连接处加入轻量化空洞空间金字塔池化模块;其次,该模型将线性整流函数(Rectified Linear Unit,ReLU)替换为ReLU6激活函数,能够在低精度计算时压缩动态范围,从而使算法更具鲁棒性;最后,该模型通过采用形态学孔洞填充构建标签图后处理算法,实现分割结果优化。为验证该模型框架的有效性和适用性,文章采用无人机遥感影像作为实验数据集,构建与传统语义分割模型的对比实验以及消融实验等。实验结果表明,通过与FCN、U-Net、SegNet和DeepLabV3+等传统语义分割算法相比较,文章提出的模型获得了较好的分割效果,其像素准确率和平均交并比分别为93.7%和84.1%。此外,该模型在保证模型精度的情况下,还能够提高模型的计算速度。 展开更多
关键词 烤烟种植区域提取 轻量化空洞空间金字塔池化模块 U型网络 后处理
在线阅读 下载PDF
基于轻量型编解码网络的复杂输电线图像识别
20
作者 李运堂 朱文凯 +5 位作者 李恒杰 冯娟 陈源 金杰 王冰清 李孝禄 《光电工程》 CAS CSCD 北大核心 2024年第10期31-40,共10页
针对现有输电线图像识别网络参数多、耗时长等问题,本文构建了轻量型编解码网络,实现了多根交叉复杂输电线的快速准确识别。编码器以常规MobileNetV3前16层为基础,通过减少网络参数,采用卷积块注意力模块代替常规MobileNetV3网络的挤压... 针对现有输电线图像识别网络参数多、耗时长等问题,本文构建了轻量型编解码网络,实现了多根交叉复杂输电线的快速准确识别。编码器以常规MobileNetV3前16层为基础,通过减少网络参数,采用卷积块注意力模块代替常规MobileNetV3网络的挤压和激励注意力模块,从而提高了网络的输电线特征信息提取能力。结合深度可分离卷积和深度空洞空间金字塔池化模块构建解码器,扩大感受野,提高网络聚合不同尺度上下文信息能力。利用L1正则方法稀疏训练网络,根据缩放因子与对应通道输出乘积的数值,设定剪枝阈值去除网络冗余通道,有效压缩网络体积,提高输电线识别速度。实验结果表明,轻量型编解码网络的平均像素精度(MPA)、平均交并比(MIoU)和识别速度分别达到了92.11%、84.19%和41f/s,优于PSPNet、U2Net和已有改进的输电线识别网络。 展开更多
关键词 复杂输电线识别 轻量型编解码网络 注意力机制 深度空洞空间金字塔池化 网络剪枝
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部