期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
基于大模型的钻井现场人体姿态估计方法研究
1
作者 刘兆年 连远锋 +2 位作者 师印亮 王宁 姜彬 《钻采工艺》 北大核心 2025年第1期104-112,共9页
准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础... 准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础上引入空洞金字塔池化技术捕捉的图像多尺度空间特征。该机制可同时关注ViT预训练模型内部特征、多尺度空间特征以及两者间的交互特征,实现多类特征的高效集成。实验结果表明,通过与基准模型HRNet的对比,文章方法在KAP和KAR上分别实现了3.6%和4.1%的显著提升。同时,在南海某平台的智能监控系统中对所提出的模型进行应用测试,仍然显示出较高的准确性,为后续深入研究员工不安全行为的智能分析提供了精确的动作估计基础。 展开更多
关键词 人体姿态估计 预训练大模型 空洞金字塔池化 双向特征融合
在线阅读 下载PDF
基于迭代压缩U型网络的煤颗粒分割与粒度分析方法
2
作者 程德强 张瑞 +4 位作者 谢同喜 刘敬敬 郑丽娟 寇旗旗 江鹤 《煤炭学报》 北大核心 2025年第2期1362-1375,共14页
煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘... 煤中甲烷气体传播与煤粒的粒度分布特征紧密相连,进而影响煤炭的安全开采和利用。随着数字图像处理技术的不断发展,基于数字图像分割的煤粒形态检测方法已成为获取煤颗粒粒度分布特征的主流方法。在数字图像分割过程中,全局信息和边缘细节起着关键作用,直接影响分割结果的准确性。基于卷积神经网络架构的U型网络过于注重局部信息,忽视了全局信息的重要性,容易导致过分割现象。而基于Transformer的网络利用多头自注意力机制有效地建模了全局信息,但却没有充分利用边缘细节特征,导致煤颗粒漏分割问题。为了解决上述问题,本研究提出了迭代压缩U型网络(Iterative Squeeze UNet,ISUNet)用于煤颗粒粒度分析。ISUNet模型引入了压缩激励空洞空间金字塔池化模块和基于Transformer的多路迭代编码器。压缩激励空洞空间金字塔池化模块通过增强不同尺度特征的通道信息和全局上下文信息,解决了煤粒过分割问题。编码器中的多头自注意力模块将ResNet50的卷积特征作为其中一个输入,通过点乘自注意力机制不断强化重要的边缘细节特征,解决了煤粒漏分割问题。与5种经典图像分割模型和4种目前主流的分割模型相比,ISUNet表现出色。相较于经典的分割模型TransUNet来说,平均交并比提高了6.6%,准确率提高了0.3%,召回率提高了7.0%,相较于目前主流的图像分割大模型Segment Anything来说,平均交并比提高了4.6%,准确率提高了0.2%,召回率提高了4.9%。在煤粒粒度测量方面,准确率达到了97.49%。这些试验结果充分证实了ISUNet在煤粒粒度分析中的有效性和优越性。 展开更多
关键词 煤粒粒度分析 图像分割 基于Transformer的多路迭代编码器 压缩激励空洞空间金字塔池化 U型网络
在线阅读 下载PDF
基于改进的IIE-SegNet的快速图像语义分割方法 被引量:1
3
作者 李庆 王宏健 +2 位作者 李本银 肖瑶 迟志康 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第2期314-323,共10页
针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计... 针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计算量大的问题;研究Focal损失函数来解决正、负采样不平衡的问题。实验结果表明:与IIE-SegNet相比,本方法在PASCAL VOC 2012数据集上的语义分割速度更快,平均每次迭代快0.6 s左右,测试单张图像的时间平均减少了0.94 s;分割精度更高,MIoU提升了2.1%。在扩展的PASCAL VOC 2012(Exp-PASCAL VOC 2012)数据集上的语义分割速度更快,平均每次迭代快0.4 s左右,测试单张图像的时间平均减少了0.92 s;分割精度更高,MPA和MIoU分别提升了2.6%和2.8%,特别是对于小尺度目标分割边界更清晰,性能得到了很大的提升。 展开更多
关键词 语义分割 深度学习 多尺度空洞卷积空间金字塔池化 图像信息熵 全局加平均 VGG16 IIE-SegNet
在线阅读 下载PDF
健身行为的人体姿态估计及动作识别 被引量:4
4
作者 付惠琛 高军伟 车鲁阳 《液晶与显示》 CAS CSCD 北大核心 2024年第2期217-227,共11页
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法... 人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。 展开更多
关键词 图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化
在线阅读 下载PDF
多尺度特征融合注意力新冠肺炎病灶分割网络 被引量:1
5
作者 林洁沁 黄新 《激光杂志》 CAS 北大核心 2024年第3期168-174,共7页
新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Atte... 新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Attention Network),以图像分割效果较为出色的U-Net网络为基础,通过全局池化层和设置空洞卷积的采样率,增大网络感受野,捕获多尺度信息,实现对大目标的有效分割;使用通道注意力与空间注意力,在空间维度上建模,有效提取图像深层特征。测试结果表明,改进后的算法与U-Net网络相比,分割的平均交并比提升了1.46%,类别平均像素准确率提升了0.8%,准确率提升了1.17%。 展开更多
关键词 图像处理 特征提取 卷积块注意力模块 空洞空间卷积池化金字塔 U-Net结构 多尺度特征融合
在线阅读 下载PDF
基于稠密块改进LinkNet的高分遥感图像道路提取
6
作者 王增优 张鲜化 +2 位作者 刘荣 陈志高 朱旺煌 《航天返回与遥感》 CSCD 北大核心 2024年第3期107-117,共11页
针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Bloc... 针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Block),密集连接的方式减少特征信息在传递过程中的损失,并在每个稠密块之后构建卷积注意力单元来提高模型对目标特征的学习能力,最后用空洞空间金字塔池化模块将编码区与解码区进行连接,扩大感受野的同时还能接受多尺度目标特征信息。实验表明,该方法在DeepGlobe数据集上的准确率、平均交并比和F1-score分为82.16%、83.21%和81.65%,均优于同类网络,通过对提取的路网结果对比,该算法对于树木遮蔽处以及建筑物阴影下的路网提取在完整性和准确性上都具有明显提升。 展开更多
关键词 残差网络 道路提取 稠密块 卷积注意力 空洞空间金字塔池化
在线阅读 下载PDF
基于轻量级Transformer的隧道裂缝分割 被引量:2
7
作者 邝先验 徐姚明 +2 位作者 雷卉 程福军 桓湘澜 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第8期3421-3433,共13页
裂缝检测对保证隧道结构安全至关重要,及时发现隧道裂缝缺陷,有利于降低工程维修成本和保障行车安全。然而,传统卷积神经网络在隧道裂缝检测任务中主要侧重提高检测精度和算法复杂度,如何平衡裂缝检测的精度和实时性是当前研究的一个难... 裂缝检测对保证隧道结构安全至关重要,及时发现隧道裂缝缺陷,有利于降低工程维修成本和保障行车安全。然而,传统卷积神经网络在隧道裂缝检测任务中主要侧重提高检测精度和算法复杂度,如何平衡裂缝检测的精度和实时性是当前研究的一个难点。针对这一问题,本文提出一种基于轻量级Transformer的裂缝分割方法 CrackViT。首先,采用卷积神经网络与Transformer混合的MobileViT网络构建裂缝特征提取网络,减少网络模型参数和计算量,并且有效提取裂缝图像全局信息和局部特征信息。然后,提出改进空洞空间金字塔池化解码器实现不同尺度的特征提取和信息融合,实现像素级概率分布。同时,裂缝图像存在细节信息缺失问题,引入高效通道注意力模块,增强对裂缝特征信息的提取能力。此外,针对裂缝与背景类别不平衡问题,设计了在线困难样本挖掘损失函数进行缓解。实验结果表明:在单个3050Ti GPU上,CrackViT算法最终在裂缝数据集上以63 FPS的速度获得了75.62%的IoU,模型参数量仅为2.43 M。CrackViT-L模型精度IoU为76.83%,模型参数量为3.56 M,模型推理速度达到61FPS。算法测试精度优于大多数主流模型,并且需要更少的模型参数。研究结果表明,CrackViT所预测的隧道裂缝分割图像边缘更加清晰和完整,保持推理速度的同时,能够有效检测裂缝,该算法有助于隧道裂缝检测实际应用。 展开更多
关键词 裂缝分割 TRANSFORMER MobileViT 空洞空间金字塔池化 轻量级模型
在线阅读 下载PDF
基于注意力机制的多尺度手部分割方法
8
作者 周雯晴 代素敏 +1 位作者 王阳萍 王文润 《液晶与显示》 CAS CSCD 北大核心 2024年第11期1506-1518,共13页
针对手部边缘细节信息分割不精确及小面积手部的错检、漏检问题,提出一种基于注意力机制的多尺度手部分割方法。首先,对Transformer模块重新进行设计优化,提出窗口自注意力结构和双分支前馈神经网络(Dual-branch FeedForward Networks,D... 针对手部边缘细节信息分割不精确及小面积手部的错检、漏检问题,提出一种基于注意力机制的多尺度手部分割方法。首先,对Transformer模块重新进行设计优化,提出窗口自注意力结构和双分支前馈神经网络(Dual-branch FeedForward Networks,D-FFN)机制,通过窗口自注意力机制整合全局和局部的依赖信息,D-FFN抑制背景信息的干扰;然后,提出一种结合条形池化和级联网络的多尺度特征提取模块增大感受野,提高手部分割模型的准确性和鲁棒性;最后,提出基于Triplet Attention机制的上采样解码器模块,通过调节通道维度与空间维度的注意力权重将目标特征和背景的冗余特征区分开。将所提算法在公开数据集GTEA(Georgia Tech Egocentric Activity)和EYTH(EgoYouTubeHands)上测试,实验结果表明,该算法在两个数据集上的平均交并比(MIoU)值分别达到了95.8%和90.2%,相较于TransUnet算法分别提升了2.5%和2.1%,满足手部图像分割的稳定可靠、精度高、抗干扰能力强等要求。 展开更多
关键词 手部分割 深度学习 TransUnet 前馈神经网络 空洞空间金字塔池化模块 Triplet Attention
在线阅读 下载PDF
基于CNN-Transformer结构的遥感影像变化检测
9
作者 潘梦洋 杨航 范祥晖 《液晶与显示》 CAS CSCD 北大核心 2024年第10期1361-1379,共19页
现代高分辨率遥感图像变化检测借助卷积神经网络(Convolutional Neural Network,CNN)取得了显著成果。然而,卷积操作的感受野限制导致在学习全局上下文和远程空间关系方面存在不足。虽然视觉Transformer能有效捕获远程特征的依赖性,但... 现代高分辨率遥感图像变化检测借助卷积神经网络(Convolutional Neural Network,CNN)取得了显著成果。然而,卷积操作的感受野限制导致在学习全局上下文和远程空间关系方面存在不足。虽然视觉Transformer能有效捕获远程特征的依赖性,但其对影像变化细节的处理不足,导致空间定位能力有限且计算效率低下。为解决上述问题,本文提出了一种基于空间空洞金字塔池化的跨层级联线性融合端到端编解码混合CNN-Transformer的变化检测模型,兼具视觉Transformer和CNN的优势。首先,利用孪生CNN网络提取图像特征,并借助空洞金字塔池化模块对特征进行精细处理,从而更精准地捕获图像的细节特征信息。其次,将提取的特征转化为视觉单词,并通过Transformer编码器进行建模,以获取丰富的上下文信息。这些信息随后被反馈至视觉空间,通过Transformer解码器对原始特征进行强化,提升特征的表达效果。接着,采用跨层级联的方式将CNN提取的特征与Transformer编解码的特征进行融合,利用上采样技术联系不同分辨率的特征图,实现位置信息与语义信息的融合。最后,通过差异增强模块生成包含丰富变化信息的差异特征图。在LEVIR、CDD、DSIFN和WHUCD 4个公开遥感数据集上的广泛实验验证了本文方法的有效性。与其他先进方法相比,本文模型的分类性能更出色,有效改善了变化检测中的欠分割、过分割及边缘粗糙等问题。 展开更多
关键词 遥感图像 变化检测 卷积神经网络 TRANSFORMER 空间空洞金字塔池化
在线阅读 下载PDF
基于改进Swin-Unet的遥感图像分割方法 被引量:2
10
作者 张越 王逊 《无线电工程》 2024年第5期1217-1225,共9页
针对遥感图像数据本身存在分辨率高、背景复杂和光照不均等特性导致边界分割不连续、目标错分漏分以及存在孔洞等问题,提出了一种基于改进Swin-Unet的遥感图像分割方法。在编码器末端引入空洞空间金字塔池化(Atrous Spatial Pyramid Poo... 针对遥感图像数据本身存在分辨率高、背景复杂和光照不均等特性导致边界分割不连续、目标错分漏分以及存在孔洞等问题,提出了一种基于改进Swin-Unet的遥感图像分割方法。在编码器末端引入空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块,用于捕获多尺度特征,增强网络获取不同尺度的能力,充分提取上下文信息;将解码器端的Swin Transformer Block替换为残差Swin Transformer Block,不仅保留了原始信息,又能够缓解模型出现梯度弥散现象;在跳跃连接中引入残差注意力机制,可以让模型更加关注特征图中的重要特征信息,抑制无效信息,从而提高模型分割的准确率。在自建数据集上进行实验,结果表明,改进后的网络平均交并比(mean Intersection over Union,mIoU)达到了80.55%,提高了4.13个百分点,证明改进后的网络可以有效提高遥感图像分割的精度。 展开更多
关键词 遥感图像 语义分割 Swin-Unet 空洞空间金字塔池化 残差注意力机制
在线阅读 下载PDF
基于深度学习的田间玉米幼苗与杂草语义分割研究
11
作者 訾彤彤 李温温 《白城师范学院学报》 2024年第2期39-47,共9页
为实现复杂田间背景下玉米幼苗和杂草的准确分割,提出了一种基于改进ResNet的语义分割网络模型.首先,对骨干网络进行调整,在保证感受野不变的情况下降低计算量,提高模型的分割精度;其次,引进空洞空间金字塔池化模块,增强模型对多尺度目... 为实现复杂田间背景下玉米幼苗和杂草的准确分割,提出了一种基于改进ResNet的语义分割网络模型.首先,对骨干网络进行调整,在保证感受野不变的情况下降低计算量,提高模型的分割精度;其次,引进空洞空间金字塔池化模块,增强模型对多尺度目标上下文信息和全局上下文信息的获取能力;最后,引入条带池化模块补充和完善上下文信息,增强全局语义信息表达.实验结果表明,该模型在自建数据上获得85.3%的平均交并比.对田间复杂环境下玉米幼苗与杂草具有良好的分割效果和泛化能力,研究结果为智能除草设备提供一定的参考. 展开更多
关键词 田间玉米幼苗与杂草 深度学习 语义分割 空洞空间金字塔池化 条带池化
在线阅读 下载PDF
基于DeepLabv3+的图像边界修复语义分割
12
作者 任子玉 游新冬 +1 位作者 滕尚志 吕学强 《北京信息科技大学学报(自然科学版)》 2024年第6期17-24,共8页
针对DeepLabv3+在高分辨率遥感图像语义分割中存在的分割目标边界残缺和细节模糊问题,提出了一种图像边界修复语义分割方法。引入多深度卷积头转置注意力(multi-Dconv head transposed attention,MDTA)边界修复模块,将通道注意力机制应... 针对DeepLabv3+在高分辨率遥感图像语义分割中存在的分割目标边界残缺和细节模糊问题,提出了一种图像边界修复语义分割方法。引入多深度卷积头转置注意力(multi-Dconv head transposed attention,MDTA)边界修复模块,将通道注意力机制应用于多级低阶特征,获取不同抽象层次的边缘纹理结构;将经过通道权值分配的密集采样空洞空间金字塔池化(atrous spatial pyramid pooling,ASPP)级联模块的输出作为编码器的输出,解码器融合了低阶特征与编码器输出的增强特征,提高了目标边界的清晰度;利用空间上下文信息挖掘模块——上下文转换器(contextual transformer,CoT),增强对图像不同区域之间依赖关系的感知能力。实验证明,该方法在多个公开数据集上的性能取得了显著提升,在VOC2012的验证集上平均交并比(mean intersection over union,mIoU)达到了90.42%。 展开更多
关键词 DeepLabv3+ 语义分割 空洞空间金字塔池化 特征融合
在线阅读 下载PDF
基于跨层非局部融合和DeepLabV3+的PCB图像分割算法
13
作者 王守印 陈健 +5 位作者 万佳泽 林丽 张定恒 何栋炜 刘丽桑 曹新容 《电子器件》 2024年第6期1547-1555,共9页
针对PCB图像在分割过程中出现的目标边缘平滑度低、连续性差、分割效率低等问题,提出一种结合注意力机制的轻量级图像分割模型。首先,利用MobileNetV2网络对图像进行深度特征提取;其次,将特征的一个分支输入到空洞空间金字塔池化模块进... 针对PCB图像在分割过程中出现的目标边缘平滑度低、连续性差、分割效率低等问题,提出一种结合注意力机制的轻量级图像分割模型。首先,利用MobileNetV2网络对图像进行深度特征提取;其次,将特征的一个分支输入到空洞空间金字塔池化模块进行多尺度特征提取并融合得到高层特征;最后,引入跨层非局部模块,将另一分支经过卷积得到的底层特征和上述高层特征融合。该方法的平均交并比为96.176%,准确率为97.59%,召回率为95.912%,分割速度为0.062 s,参数量为25.39 Mbyte。方法考虑了图像中小目标检测问题及边界信息损失,提高了图像分割的准确性和实时性。 展开更多
关键词 PCB 注意力机制 图像分割 空洞空间金字塔池化 跨层非局部模块
在线阅读 下载PDF
基于轻量型编解码网络的复杂输电线图像识别
14
作者 李运堂 朱文凯 +5 位作者 李恒杰 冯娟 陈源 金杰 王冰清 李孝禄 《光电工程》 CAS CSCD 北大核心 2024年第10期31-40,共10页
针对现有输电线图像识别网络参数多、耗时长等问题,本文构建了轻量型编解码网络,实现了多根交叉复杂输电线的快速准确识别。编码器以常规MobileNetV3前16层为基础,通过减少网络参数,采用卷积块注意力模块代替常规MobileNetV3网络的挤压... 针对现有输电线图像识别网络参数多、耗时长等问题,本文构建了轻量型编解码网络,实现了多根交叉复杂输电线的快速准确识别。编码器以常规MobileNetV3前16层为基础,通过减少网络参数,采用卷积块注意力模块代替常规MobileNetV3网络的挤压和激励注意力模块,从而提高了网络的输电线特征信息提取能力。结合深度可分离卷积和深度空洞空间金字塔池化模块构建解码器,扩大感受野,提高网络聚合不同尺度上下文信息能力。利用L1正则方法稀疏训练网络,根据缩放因子与对应通道输出乘积的数值,设定剪枝阈值去除网络冗余通道,有效压缩网络体积,提高输电线识别速度。实验结果表明,轻量型编解码网络的平均像素精度(MPA)、平均交并比(MIoU)和识别速度分别达到了92.11%、84.19%和41f/s,优于PSPNet、U2Net和已有改进的输电线识别网络。 展开更多
关键词 复杂输电线识别 轻量型编解码网络 注意力机制 深度空洞空间金字塔池化 网络剪枝
在线阅读 下载PDF
一种改进的基于Inception-ResNet v2的眼疾病识别算法
15
作者 陆阳 任世卿 《电子设计工程》 2024年第20期68-71,共4页
该文旨在解决传统方法在眼疾病识别中分类准确率低的问题,提出了一种改进的眼疾病识别算法,基于Inception-ResNet v2架构,并引入SENet注意力机制、Ghost模块和空洞空间金字塔池化等技术。通过学习通道相关性和加强对重要特征的关注,显... 该文旨在解决传统方法在眼疾病识别中分类准确率低的问题,提出了一种改进的眼疾病识别算法,基于Inception-ResNet v2架构,并引入SENet注意力机制、Ghost模块和空洞空间金字塔池化等技术。通过学习通道相关性和加强对重要特征的关注,显著提高了眼疾病分类的准确率,有效区分常见四种眼疾病数据集。为了进一步提高模型的泛化能力,还引入数据增强技术以减少过拟合。相比Efficient-Net、ResNet和Inception-ResNet等经典深度学习模型,该算法表现更优,为眼疾病早期诊断提供了更准确、高效的方法。 展开更多
关键词 深度学习 Ghost模块 注意力机制 Inception-ResNet v2算法 空洞空间金字塔池化
在线阅读 下载PDF
基于视频深度学习的铁路周界入侵检测算法研究 被引量:23
16
作者 王瑞 李霄峰 +1 位作者 史天运 邹琪 《交通运输系统工程与信息》 EI CSCD 北大核心 2020年第2期61-68,共8页
基于视频智能分析的铁路周界入侵检测算法相比于雷达、振动光纤,具有成本低、误报率低的优点.针对视频中存在不同分辨率目标的问题,提出一种改进的Cascade Mask RCNN(CMR)模型,使用级联结构获得目标的准确定位.为增强模型对小目标的检... 基于视频智能分析的铁路周界入侵检测算法相比于雷达、振动光纤,具有成本低、误报率低的优点.针对视频中存在不同分辨率目标的问题,提出一种改进的Cascade Mask RCNN(CMR)模型,使用级联结构获得目标的准确定位.为增强模型对小目标的检测能力,在原始模型的基础上,增加基于特征金字塔网络(FPN)的多尺度特征提取模块和基于空洞金字塔汇聚(ASPP)子网络的空间上下文增强模块.在实际铁路周界入侵场景视频中验证了模型的有效性.结果表明,该模型可实现不同场景下的铁路周界入侵检测,相较于原始模型,新模型对小目标检测的F-measure提高了0.24.模型既解决了不同场景下铁路周界入侵检测问题,又有效地提高了视频智能分析对小目标检测的准确率. 展开更多
关键词 铁路运输 视频智能分析 深度学习 周界入侵检测 特征金字塔 空洞卷积
在线阅读 下载PDF
一种基于PSMNet改进的立体匹配算法 被引量:2
17
作者 刘建国 冯云剑 +2 位作者 纪郭 颜伏伍 朱仕卓 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第1期60-69,83,共11页
为了解决双目视觉中的立体匹配问题、减少立体匹配网络的参数数量、降低算法的计算复杂度、提高算法的实用性。在PSMNet立体匹配网络的基础上进行改进,提出了一种具备浅层结构与宽阔视野的立体匹配算法--SWNet。浅层结构表示网络层数更... 为了解决双目视觉中的立体匹配问题、减少立体匹配网络的参数数量、降低算法的计算复杂度、提高算法的实用性。在PSMNet立体匹配网络的基础上进行改进,提出了一种具备浅层结构与宽阔视野的立体匹配算法--SWNet。浅层结构表示网络层数更少、参数更少、处理速度更快;宽阔视野则表示网络的感受野更宽广,能够获取并保留更多的空间信息。SWNet由特征提取、3D卷积和视差回归3个部分构成。在特征提取部分,引入了深色空间金字塔结构(Atrous Spatial Pyramid Pool,ASPP),用于提取多尺度的空间特征信息,设计了特征融合模块,将不同尺度的特征信息有效地融合起来以构建匹配代价卷;3D卷积神经网络利用堆叠的编码解码结构进一步对匹配代价卷进行规则化处理,获得不同视差条件下特征点之间的对应关系;最后,采用回归的方式得到视差图。SWNet在SceneFlow和KITTI 2015两个公开的数据集上均取得了优异的表现,与参考算法PSMNet相比,参数数量下降了48.9%,且误匹配率仅有2.24%。 展开更多
关键词 立体匹配 PSMNet立体匹配网络 卷积神经网络 深度学习 深色空间金字塔结构 空间特征信息 特征融合模块
在线阅读 下载PDF
改进的多任务学习方法的眼底视盘分割与定位 被引量:1
18
作者 李宁 尚英强 +2 位作者 熊俊 邰宝宇 时晨杰 《应用科学学报》 CAS CSCD 北大核心 2021年第6期952-960,共9页
提出了一种改进的多任务学习方法,网络的主结构由特征提取网络和分别进行视盘分割与视盘定位的双路径网络组成,通过端到端的训练与测试可以实现眼底图像视盘自动分割与定位相结合的多任务目的。在特征提取网络的编码阶段利用密集连接提... 提出了一种改进的多任务学习方法,网络的主结构由特征提取网络和分别进行视盘分割与视盘定位的双路径网络组成,通过端到端的训练与测试可以实现眼底图像视盘自动分割与定位相结合的多任务目的。在特征提取网络的编码阶段利用密集连接提取眼底图像视盘的上下文特征。视盘分割任务是依靠解码阶段逐步恢复原来的图像分辨率并获取整个视盘轮廓,视盘中心定位任务由空洞空间金字塔模块和金字塔池化模块来进一步提取视盘抽象特征,得到精准的视盘中心坐标。对350幅眼底图像进行了视盘分割和中心定位,实验结果表明:该方法自动分割的视盘结果与手动标注视盘区域的Dice系数为0.965,自动定位的视盘中心坐标与手动标记的视盘中心的平均绝对距离为0.191 mm(34.7像素)。 展开更多
关键词 视盘分割 视盘定位 密集块 空间金字塔池化 空洞空间金字塔池化 多任务学习
在线阅读 下载PDF
基于非下采样轮廓波变换的遥感地物分割算法 被引量:1
19
作者 闵锋 彭伟明 +2 位作者 况永刚 毛一新 郝琳琳 《电光与控制》 CSCD 北大核心 2023年第11期49-55,共7页
针对遥感地物图像具有背景复杂且种类众多的特点,利用传统算法进行分割会导致边缘模糊、信息丢失及分割精度低的问题,提出了一种基于改进DeepLabV3+网络的语义分割算法。首先,在主干网络中引入改进后的特征提取网络CHRNet;其次,使用非... 针对遥感地物图像具有背景复杂且种类众多的特点,利用传统算法进行分割会导致边缘模糊、信息丢失及分割精度低的问题,提出了一种基于改进DeepLabV3+网络的语义分割算法。首先,在主干网络中引入改进后的特征提取网络CHRNet;其次,使用非下采样轮廓波变换(NSCT)算法重构空洞空间金字塔池化(ASPP)模块中的全局池化操作;最后,在模型编码和解码阶段添加无参数的注意力机制SimAM,加强模块间的特征传递,提高特征利用率。实验表明,在PASCAL VOC2012和WHDLD数据集上,改进算法的平均交并比(MIoU)分别达到了81.56%和64.2%,较原有算法分别提升了约4.61和2.8个百分点,改进算法在保证分割速率的同时,提升了分割精度。 展开更多
关键词 遥感图像 DeepLabV3+ 非下采样轮廓波变换 空洞空间金字塔池化 注意力机制
在线阅读 下载PDF
基于空洞卷积神经网络的毒株胚蛋裂纹分割
20
作者 耿磊 张静 +1 位作者 肖志涛 童军 《天津工业大学学报》 CAS 北大核心 2022年第3期69-75,共7页
针对工厂机械设备的噪声和振动、胚蛋蛋壳表面的污斑和裂纹大小、光源打光方式会对裂纹检测产生严重影响,提出一种基于密集空洞卷积模块(DACM)与空洞空间金字塔池化结构(ASPP)的卷积神经网络(CNN)分割方法分割胚蛋裂纹。采用编码器-解... 针对工厂机械设备的噪声和振动、胚蛋蛋壳表面的污斑和裂纹大小、光源打光方式会对裂纹检测产生严重影响,提出一种基于密集空洞卷积模块(DACM)与空洞空间金字塔池化结构(ASPP)的卷积神经网络(CNN)分割方法分割胚蛋裂纹。采用编码器-解码器网络结构与密集连接的空洞卷积结合,增强空间信息表示并重建不同尺度目标信息;同时,在网络浅层引入ASPP,获取多尺度特征,增强细节信息,提高网络分割性能。结果表明:在自制毒株胚蛋顶部裂纹与侧面裂纹数据集上,该方法的平均交并比(MIoU)分别达到了74.2%与81.3%,具有较强的鲁棒性。 展开更多
关键词 毒株胚蛋裂纹分割 卷积神经网络 编码器-解码器 空洞卷积 空洞空间金字塔池化
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部