期刊文献+
共找到622篇文章
< 1 2 32 >
每页显示 20 50 100
基于自注意力机制的高分遥感影像语义分割 被引量:1
1
作者 杨军 张金影 康玥 《哈尔滨工程大学学报》 北大核心 2025年第2期344-354,共11页
针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助... 针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助于捕获局部特征;在编码器分支中提出线性的多头自注意力模块以降低模型的计算复杂度;设计一个解码器来恢复特征图分辨率,通过级联操作整合各层级的特征并生成高分辨率的语义分割结果。所提算法在ISPRS Vaihingen和Potsdam数据集上的分割结果的mF1分别达到了90.77%和92.36%,与目前主流算法相比,不透水表面、建筑、低矮植物、树木类的分割准确率及总体分割准确率均有提高。本文算法构建的线性多头自注意力网络是一种高效的高分辨率遥感影像语义分割模型。 展开更多
关键词 高分辨率遥感影像 多头自注意力 深度可分离卷积 语义分割 特征提取 卷积神经网络 编码器 解码器
在线阅读 下载PDF
融合显著边界约束的弱监督语义分割方法
2
作者 白雪飞 张丽娜 王文剑 《计算机工程与应用》 北大核心 2025年第19期214-225,共12页
针对现有弱监督语义分割方法存在的类激活不足、伪标签边界不清晰的问题,提出了融合显著边界约束的弱监督语义分割方法。提出由共享参数的孪生网络作为类激活图生成网络,将仿射变换前后的图像作为孪生网络两个分支的输入,得到不同的类... 针对现有弱监督语义分割方法存在的类激活不足、伪标签边界不清晰的问题,提出了融合显著边界约束的弱监督语义分割方法。提出由共享参数的孪生网络作为类激活图生成网络,将仿射变换前后的图像作为孪生网络两个分支的输入,得到不同的类激活图后,通过一致性损失函数融合仿射变换前后的互补信息,以生成具有完整信息的类激活图。设计显著性修正模块,在类激活图中引入边界约束,抑制背景信息的错误激活;同时,设计显著性亲和模块从显著图中学习像素之间的亲和矩阵,进一步细化初始伪标签,提升模型的语义分割性能。实验结果表明,该方法在PASCAL VOC 2012验证集上的mIoU值为71.4%,与基线相比,性能提升了2.1个百分点,测试集上的mIoU值为70.8%;在COCO 2014验证集上的mIoU值为39.2%,展现了良好的分割结果,该方法可以更好地完成弱监督语义分割任务。 展开更多
关键词 弱监督语义分割 图像级标签 TRANSFORMER 卷积神经网络 孪生网络 显著图
在线阅读 下载PDF
半监督学习模型下的露天矿高陡岩质边坡裂隙识别研究
3
作者 江松 章睿 +4 位作者 崔智翔 王会杰 刘仲光 吴祥业 饶彬舰 《安全与环境学报》 北大核心 2025年第10期3821-3829,共9页
针对传统露天矿边坡人工检测效率低、主观性强的问题,提出一种基于半监督学习的裂隙智能识别方法,旨在实现高效、精准的自动化检测。构建双模型协同训练框架:通过无人机采集露天矿高陡岩质边坡裂隙图像数据,利用少量人工标注样本与大量... 针对传统露天矿边坡人工检测效率低、主观性强的问题,提出一种基于半监督学习的裂隙智能识别方法,旨在实现高效、精准的自动化检测。构建双模型协同训练框架:通过无人机采集露天矿高陡岩质边坡裂隙图像数据,利用少量人工标注样本与大量未标注数据,设计主模型与评判模型协同迭代优化的半监督学习策略,分析模型在复杂背景下的特征学习能力,并验证半监督机制对性能的提升作用。结果表明:双模型协同训练框架在裂隙识别的精确率、召回率、交并比和平均像素精度分别达到91.9%、91.5%、88.7%和90.2%,均显著优于单一监督模型与传统图像分割算法。研究通过半监督学习策略融合标注数据与未标注数据的特征信息,为露天矿边坡裂隙检测提供了高效、鲁棒的技术路径,可降低对人工标注的依赖,提升复杂场景下的裂隙识别精度。 展开更多
关键词 安全工程 裂隙识别 图像分割 半监督学习 掩膜区域卷积神经网络 U形网络
在线阅读 下载PDF
基于机器学习的云图分割综述
4
作者 车蕾 张洪瑞 《科学技术与工程》 北大核心 2025年第6期2193-2206,共14页
云的变化复杂多样,在天气预测、灾难预警中发挥着重大作用,影响着人们的日常生活。对云的观测主要通过雷达、遥感卫星和全天空成像仪,记录的云图分为雷达云图、卫星云图和地基云图,三者都是云观测中不可或缺的部分。随着机器学习在多领... 云的变化复杂多样,在天气预测、灾难预警中发挥着重大作用,影响着人们的日常生活。对云的观测主要通过雷达、遥感卫星和全天空成像仪,记录的云图分为雷达云图、卫星云图和地基云图,三者都是云观测中不可或缺的部分。随着机器学习在多领域的发展,逐渐被运用到云图分割中去并取得了很大的进步。通过广泛调研相关领域的文献和成果,将机器学习的云图分割分为基于神经网络的云图分割方法、基于迁移学习的云图分割方法和基于轻量级模型的云图分割方法这3种类型,对每种类型中近几年提出的方法进行了对比,并进一步总结了云图分割中面对不同问题的改进方法,给出了几个改进方案供参考。 展开更多
关键词 机器学习 云图分割 神经网络 迁移学习 轻量级模型
在线阅读 下载PDF
用于医学图像分割的多层特征交叉融合网络研究
5
作者 刘玉 何立风 +1 位作者 朱纷 张梦颖 《陕西科技大学学报》 北大核心 2025年第3期181-189,共9页
针对U型结构处理医学图像分割任务时存在的编解码器特征差异大、浅层特征丢失、抽象特征学习不足等缺陷,设计了一种多层特征交叉融合网络(MFCF-Net).首先,设计了深度注意力聚合模块,采用深度可分离卷积提取多尺度特征,并通过混合注意力... 针对U型结构处理医学图像分割任务时存在的编解码器特征差异大、浅层特征丢失、抽象特征学习不足等缺陷,设计了一种多层特征交叉融合网络(MFCF-Net).首先,设计了深度注意力聚合模块,采用深度可分离卷积提取多尺度特征,并通过混合注意力机制抑制背景的影响;其次,设计了多尺度快速融合模块,融合通过不同池化策略提取的多尺度特征信息,以丰富深层网络的抽象特征;最后,通过编码支路对深层网络细节信息进行补充.在NIH数据集、ISIC2017数据集和ISIC2018数据集上进行的实验结果表明MFCF-Net的分割效果优于其他先进的网络,尤其在NIH数据集上,DSC达到了0.8837,IoU达到了0.9992. 展开更多
关键词 医学图像分割 U型结构 多尺度融合 注意力机制 卷积神经网络
在线阅读 下载PDF
MCNet:融合多层感知机和卷积的轻量级病变区域分割网络 被引量:2
6
作者 申华磊 上官国庆 +2 位作者 袁成雨 陈艳浩 刘栋 《河南师范大学学报(自然科学版)》 北大核心 2025年第3期96-103,共8页
针对现有医学图像分割网络存在计算量大、对硬件资源要求高和推理速度慢等不足,提出一种轻量级快速分割网络MCNet.MCNet采用编码器-解码器架构,使用多层感知机(MLP)和卷积分别提取并融合医学图像的全局特征和局部特征,以减少网络参数量... 针对现有医学图像分割网络存在计算量大、对硬件资源要求高和推理速度慢等不足,提出一种轻量级快速分割网络MCNet.MCNet采用编码器-解码器架构,使用多层感知机(MLP)和卷积分别提取并融合医学图像的全局特征和局部特征,以减少网络参数量并提高分割精度.在编码阶段使用卷积分支和多层感知机分支分别提取多尺度的局部特征和全局特征.通过跳跃连接融合这些特征并送入解码器.在解码阶段使用注意力门控机制进行特征增强.在BUSI和ISIC2018数据集上进行实验.和当前最优方法相比,MCNet的Dice相似系数和均交并比在BUSI数据集上分别提高0.11%和0.09%、在ISIC2018数据集上分别提高0.64%和0.95%.同时,MCNet显著减少了网络参数量、降低了浮点运算次数并缩短了CPU推理时间. 展开更多
关键词 医学图像分割 深度神经网络 多层感知机(MLP) 轻量级网络
在线阅读 下载PDF
新解码器的CNNs-Transformers融合网络及其病理图像肿瘤分割应用 被引量:1
7
作者 马丽晶 王朝立 +2 位作者 孙占全 程树群 王康 《小型微型计算机系统》 北大核心 2025年第6期1442-1449,共8页
病理图像是肿瘤诊断的"金标准",但超高分辨率的病理图像使得医生需要消耗大量的精力和时间,而且诊断结果主观性比较强.随着人工智能技术的发展,深度学习模型提供了计算机代替人对病理图像进行快速、准确和可靠诊断的可能性.然... 病理图像是肿瘤诊断的"金标准",但超高分辨率的病理图像使得医生需要消耗大量的精力和时间,而且诊断结果主观性比较强.随着人工智能技术的发展,深度学习模型提供了计算机代替人对病理图像进行快速、准确和可靠诊断的可能性.然而,目前大多数的网络更注重如何在编码器部分提取更准确的特征,而对于同等重要的解码器部分的结构设计研究则稍显不足.针对该问题,本文提出了由三类上采样模块组成的新网络,而编码器部分采用Swin Transformer和ConvNeXt作为网络的双分支并行独立结构.三类上采样模块分别是多重转置卷积采样、双线性上采样和Swin Transformer上采样,其特点是可以充分利用病理图像特征之间局部和全局的依赖关系.该网络分别在肝癌数据集和GLAS数据集上进行了验证,并与不同类型的主流网络进行了对比,性能指标皆达到比较好的结果. 展开更多
关键词 医学图像分割 深度学习 卷积神经网络 Swin Transformer
在线阅读 下载PDF
深度学习在结肠息肉图像分割中的研究综述 被引量:2
8
作者 李国威 刘静 +1 位作者 曹慧 姜良 《计算机科学与探索》 北大核心 2025年第5期1198-1216,共19页
结肠息肉是一种可能发展为结直肠癌的胃肠道异常生长组织,因此,早期检测和切除结肠息肉对预防结直肠癌具有重要意义。近年来,深度学习技术在结肠息肉图像分割领域中的应用取得了显著进展,大幅提高了分割的准确性和自动化水平。针对深度... 结肠息肉是一种可能发展为结直肠癌的胃肠道异常生长组织,因此,早期检测和切除结肠息肉对预防结直肠癌具有重要意义。近年来,深度学习技术在结肠息肉图像分割领域中的应用取得了显著进展,大幅提高了分割的准确性和自动化水平。针对深度学习在结肠息肉图像分割中的研究展开综述,介绍了多种结肠息肉成像方式及包括图片和视频在内的常用数据集,并详细说明了这些数据集的特点。深入阐述了基于深度学习的结肠息肉分割方法,涵盖了全卷积网络、Mask R-CNN、生成对抗网络、U-Net、Transformer以及多网络融合模型,其中重点强调了UNet及其变体在结肠息肉图像分割中的应用,分析了其结构改进、性能提升和实际应用效果。同时,综合对比了各网络模型的主要改进思路、优缺点及其分割结果。指出了当前深度学习在该领域面临的主要挑战,并对未来的研究方向进行了相应的展望。 展开更多
关键词 结肠息肉分割 深度学习 医学图像 卷积神经网络 U-Net
在线阅读 下载PDF
基于RGB-D图像的语义分割方法综述 被引量:1
9
作者 王晨 杜晨曦 +1 位作者 刘瑞军 齐越 《计算机辅助设计与图形学学报》 北大核心 2025年第1期100-119,共20页
语义分割技术致力于精确识别并分割图像中的各个物体或场景.基于RGB图像的方法在信息利用上存在局限,导致性能受限,随着深度传感器技术的普及,深度图的引入为语义分割网络注入了丰富的几何信息,显著地提升了分割精度.文中介绍了近几年基... 语义分割技术致力于精确识别并分割图像中的各个物体或场景.基于RGB图像的方法在信息利用上存在局限,导致性能受限,随着深度传感器技术的普及,深度图的引入为语义分割网络注入了丰富的几何信息,显著地提升了分割精度.文中介绍了近几年基于RGB-D图像的语义分割方面的显著进展和相关方法,根据对多模态融合特征处理方式的差异,将基于RGB-D图像的语义分割方法归纳为单分支、双分支、三分支网络架构3大类.其中,单分支网络在同一分支同时处理RGB和深度特征,实现特征的有机结合;双分支网络利用RGB和深度特征之间的互补性,优化多模态特征的校正与融合;三分支网络在保留原始的RGB和深度特征的同时,深入挖掘融合特征,确保信息的全面性.同时,总结注意力、模型优化等关键技术,并归纳常用的数据集和评价指标,对比分析各种方法在不同数据集上的性能,最后总结当前RGB-D图像语义分割在多模态数据交互与处理方面所面临的挑战,展望了语义分割技术在跨领域数据融合方向的发展前景. 展开更多
关键词 RGB-D图像 语义分割 多模态特征融合 卷积神经网络
在线阅读 下载PDF
基于改进DeepLabV3+的钢桥锈蚀检测方法 被引量:3
10
作者 黄海新 贺朝 +2 位作者 程寿山 许瑞宁 张连振 《重庆交通大学学报(自然科学版)》 北大核心 2025年第2期18-24,60,共8页
锈蚀检测算法是钢桥管养从人工视觉向机器视觉转型的关键,更是智能化钢桥检测机器人构建的技术基础。面向钢桥智能检测机器人对锈蚀检测算法低能耗和高精度的实际需求,针对DeepLabV3+模型加以改进,采用MobileNetV2主干网络替换原模型中... 锈蚀检测算法是钢桥管养从人工视觉向机器视觉转型的关键,更是智能化钢桥检测机器人构建的技术基础。面向钢桥智能检测机器人对锈蚀检测算法低能耗和高精度的实际需求,针对DeepLabV3+模型加以改进,采用MobileNetV2主干网络替换原模型中的Xception主干网络,使模型轻量化以易适配移动端设备,优化ASPP模块中的空洞率以提高网络对不同尺寸锈蚀的提取效果,添加CBAM注意力机制增强模型对关键特征的感知和捕捉;将改进后的DeepLabV3+模型与原DeepLabV3+模型、PSPNet模型和U-Net模型进行了对比,同时开展了消融实验;最后,将改进模型搭载于视觉机器人上,并开展实地工程测试。结果表明:相比于其它模型,改进的DeepLabV3+模型对钢桥锈蚀图像的分割准确率平均提高了7.5%,平均交并比平均提高了14.7%,召回率平均提高了9.1%。 展开更多
关键词 桥梁工程 DeepLabV3+ 钢桥锈蚀检测 卷积神经网络 图像分割
在线阅读 下载PDF
基于深度学习的目标分割在岩石智能识别上的应用 被引量:3
11
作者 何陆灏 周永章 张灿 《矿物岩石地球化学通报》 北大核心 2025年第3期525-541,共17页
随着人工智能技术的快速发展,深度学习在图像处理领域取得了显著进展,特别是在目标检测和目标分割方面。传统的岩石识别方法受限于复杂的背景和岩石的多样性,无法满足实际需求。深度学习的快速发展为岩石智能识别提供了新的思路和技术... 随着人工智能技术的快速发展,深度学习在图像处理领域取得了显著进展,特别是在目标检测和目标分割方面。传统的岩石识别方法受限于复杂的背景和岩石的多样性,无法满足实际需求。深度学习的快速发展为岩石智能识别提供了新的思路和技术支持。本研究旨在应用深度学习模型YOLOv8-seg于岩石智能识别任务中,评估其在目标检测和分割任务中的识别效果和稳定性,以期为地质勘探和地质资源管理提供技术支持。研究采用YOLOv8-seg模型,对包括玄武岩、花岗岩、大理岩、石英岩、煤炭、灰岩和砂岩在内的多种岩石类型进行训练,以优化模型的识别能力。该模型结合了目标检测和实例分割功能,并通过box_loss、seg_loss、cls_loss和dfl_loss等多种损失函数优化边界框预测、分割性能、类别识别准确性和回归精度。在目标分割任务中,YOLOv8-seg模型的precision(B)和recall(B)分别达到0.91284和0.93587,mAP50(B)和mAP50-95(B)分别为0.86666和0.83686;precision(M)和recall(M)分别为0.90394和0.93438,mAP50(M)和mAP50-95(M)分别为0.85931和0.81856,说明模型具备较高的分割精度和召回率。F1Score(B)和F1Score(M)在第551轮分别达至0.92421和0.91891,较初始值提升显著。测试集结果表明,模型在玄武岩、煤、灰岩等岩石类型的置信度均保持在90%以上,在岩石开采、煤炭运输等实际应用场景中的识别率保持在85%以上。YOLOv8-seg模型在岩石智能识别任务中表现出色,具有较高的精度、召回率和稳定性,适用于多种岩石分类和识别任务。结果表明,该模型在地质勘探和地质资源管理中具备广泛应用潜力,为岩石智能识别提供了一种可靠的解决方案。 展开更多
关键词 岩石识别 深度学习 机器学习 卷积神经网络 目标分割 图像识别
在线阅读 下载PDF
基于多尺度注意力U-Net的医学肝脏计算机断层扫描图片分割算法 被引量:2
12
作者 金涛 王震 李昭蒂 《哈尔滨工程大学学报》 北大核心 2025年第3期529-539,共11页
针对传统肝脏分割方法十分依赖医生的经验,并且分割过程耗时,易出错的现象,本文提出适用于临床情景中医学肝脏计算机断层扫描的分割方法。基于多尺度残差混合注意力U-Net将多尺度注意力机制模块引入U-Net网络。该模块可以抑制不相关的区... 针对传统肝脏分割方法十分依赖医生的经验,并且分割过程耗时,易出错的现象,本文提出适用于临床情景中医学肝脏计算机断层扫描的分割方法。基于多尺度残差混合注意力U-Net将多尺度注意力机制模块引入U-Net网络。该模块可以抑制不相关的区域,从多个角度提取图像特征,并突出显示分割任务;在标准卷积层中添加残差结构可以有效地避免梯度爆炸并增加网络深度;使用混合空洞注意力常规层来替换“U”形网络的底部,以获得上下文信息,避免空间信息的丢失。试验结果表明:在LiTS17和SLiver07数据集上与其他方法相比,本文方法具有更好的性能和最高的分割精度。 展开更多
关键词 神经网络 深度学习 语义分割 肝脏分割 医学图像 注意力机制 空洞卷积
在线阅读 下载PDF
双编码端高分辨率遥感影像语义分割算法 被引量:1
13
作者 吴梦可 高心丹 《计算机科学与探索》 北大核心 2025年第1期187-195,共9页
遥感影像具有多尺度对象、复杂背景、不均衡类别等特点。基于卷积神经网络(CNN)的语义分割算法难以捕捉到影像的全局特征,导致分割效果不佳。针对以上问题,利用Swin Transformer的全局特征提取能力,提出了双编码端高分辨率遥感影像语义... 遥感影像具有多尺度对象、复杂背景、不均衡类别等特点。基于卷积神经网络(CNN)的语义分割算法难以捕捉到影像的全局特征,导致分割效果不佳。针对以上问题,利用Swin Transformer的全局特征提取能力,提出了双编码端高分辨率遥感影像语义分割算法DEGFNet。设计特征融合模块(FFB)将Swin Transformer捕获的全局特征引入编码端,应对多尺度对象带来的挑战。在Swin Transformer中设计空间交互模块(SIB),降低复杂背景样本带来的负面影响;在解码端引入全局-局部注意力模块(GLTB)和特征细化模块(FRB),来更好地利用编码端提取的信息,提高语义分割的精确性;采用交叉熵损失和Dice Loss组成的混合损失函数训练模型,减轻样本类别不均衡带来的消极影响。在Vaihingen数据集上,宏观平均F1值(mF1)、平均交并比(mIoU)和整体准确率(OA)指标分别达到91.9%、84.8%和92.4%;在LoveDA数据集上,mIoU指标达到55.0%,均展现出了更好的语义分割效果和良好的泛化性。 展开更多
关键词 高分辨率遥感影像 语义分割 卷积神经网络 Swin Transformer
在线阅读 下载PDF
基于卷积神经网络和合成数据集训练鉴定棉花种子萌发期的耐盐性
14
作者 王勇攀 马君 +8 位作者 李晨宇 姚梦瑶 王子轩 黄灵芝 朱海艳 刘皖蓉 李波 杨洋 高文伟 《新疆农业科学》 北大核心 2025年第2期261-269,共9页
【目的】建立便捷且精准的棉花种子萌发表型的无损检测方法,鉴定不同棉花种质萌发期的耐盐性。【方法】利用150张不同阶段的棉花种子萌发图像生成合成数据集,并以此进行Mask R-CNN模型训练。利用训练好的模型,对60份棉花种子在125 mmol/... 【目的】建立便捷且精准的棉花种子萌发表型的无损检测方法,鉴定不同棉花种质萌发期的耐盐性。【方法】利用150张不同阶段的棉花种子萌发图像生成合成数据集,并以此进行Mask R-CNN模型训练。利用训练好的模型,对60份棉花种子在125 mmol/L NaCl处理下萌发真实图像中的种壳和胚芽进行实例分割和表型提取,计算种子发芽率、发芽势和胚芽长度,评价60份棉花种子的萌发期耐盐性。【结果】生成的合成数据集包含2000组合成图像及其相应掩模,利用该数据集训练的Mask R-CNN模型对真实图像中种壳和胚芽的分割准确度在95%以上,基于模型提取数据获得的种子发芽率、发芽势、胚芽长度和真实测量值高度线性相关(R^(2)>0.98,P<0.001),利用模型能够准确的获取表型。各性状的耐盐指数的聚类分析将60份棉花材料分为4个水平;珂字棉4号(0.95)、MC-30(0.88)、陆8早(0.81)等材料的D值较大,其耐盐性较高。【结论】建立了基于卷积神经网络和合成数据集训练的棉花种子萌发期性状鉴定方法,并使用该方法,无损、快速且精准的鉴定了60份棉花种质种子萌发期的耐盐性。 展开更多
关键词 棉花 卷积神经网络 图像分割 种子萌发
在线阅读 下载PDF
Transformer在医学图像分割中的研究进展
15
作者 周振霄 王华 +3 位作者 魏德健 曹慧 姜良 王锡城 《计算机工程与应用》 北大核心 2025年第20期54-74,共21页
随着社会对高精度诊断的需求持续攀升,自动化医学图像分割技术于现代医疗实践中占据着关键地位,尽管卷积神经网络(convolutional neural network,CNN)在医学图像分割方面表现优异,但由于其存在一定局限性,许多学者遂将Transformer引入... 随着社会对高精度诊断的需求持续攀升,自动化医学图像分割技术于现代医疗实践中占据着关键地位,尽管卷积神经网络(convolutional neural network,CNN)在医学图像分割方面表现优异,但由于其存在一定局限性,许多学者遂将Transformer引入医学图像分割领域,以弥补CNN在全局上下文学习层面的欠缺。综述了Transformer及其变体结构,并分析了它们在医学图像分割任务中的结合应用。从心脏、大脑、肺部、腹部和其他部位这五个主要分割任务范畴,归纳了基于U-Net以及其他模型相结合的研究进展,指出其在捕捉多尺度特征、提升分割精度以及应对不同解剖结构的复杂性方面所具备的优势。对现有研究工作进行了讨论,未来需再持续深入研究,以促进医学图像分割技术的发展。 展开更多
关键词 深度学习 TRANSFORMER 医学图像分割 卷积神经网络(CNN)
在线阅读 下载PDF
用于无人机遥感图像的高精度实时语义分割网络
16
作者 魏新雨 饶蕾 +3 位作者 范光宇 陈年生 程松林 杨定裕 《浙江大学学报(工学版)》 北大核心 2025年第7期1411-1420,共10页
用于无人机图像的语义分割模型存在推理效率低和分割效果差的问题,为此提出共享浅层特征网络(SSFNet).细节分支共享语义分支下采样时的1/4和1/8阶段,简化细节分支的下采样阶段,提高推理效率.在语义分支部分,提出基于通道分解和堆叠连接... 用于无人机图像的语义分割模型存在推理效率低和分割效果差的问题,为此提出共享浅层特征网络(SSFNet).细节分支共享语义分支下采样时的1/4和1/8阶段,简化细节分支的下采样阶段,提高推理效率.在语义分支部分,提出基于通道分解和堆叠连接的高效感受野模块(ERFB),在几乎不增加推理成本的情况下提高多尺度特征的提取能力.为了整合语义分支中的上下文信息,提出快速聚合上下文(FAC)模块,利用门控机制控制下采样时的1/16和1/32阶段为最终阶段的语义补充信息.在解码阶段,利用混合激活函数构建双边融合模块(BFM)以充分融合细节和语义信息.结果表明,SSFNet在UAVid、LoveDA和Potsdam数据集上的平均交并比分别为68.5%、52.7%和87.1%;在NVIDIA RTX 3090 GPU输入分辨率为1 024×1 024的情况下,SSFNet的推理速度达到131.1帧/s,实时分割效果良好. 展开更多
关键词 实时语义分割 无人机图像 遥感图像 卷积神经网络 多尺度特征
在线阅读 下载PDF
基于视觉双驱动认知的高分辨率遥感影像自学习分割方法
17
作者 吴志军 丛铭 +10 位作者 许妙忠 韩玲 崔建军 赵超英 席江波 杨成生 丁明涛 任超锋 顾俊凯 彭晓东 陶翊婷 《自然资源遥感》 北大核心 2025年第5期73-90,共18页
针对当前高分辨率遥感影像场景复杂难以简单解析,且变化多样难以从样本库获取准确参考的问题,文章参照视觉的双驱动认知机理,提出了一种自学习的高分辨率遥感影像分割方法。该方法在借鉴视觉感知原理的基础上,通过非监督的自适应分析解... 针对当前高分辨率遥感影像场景复杂难以简单解析,且变化多样难以从样本库获取准确参考的问题,文章参照视觉的双驱动认知机理,提出了一种自学习的高分辨率遥感影像分割方法。该方法在借鉴视觉感知原理的基础上,通过非监督的自适应分析解读场景中的典型地物,并结合神经网络实现典型地物的自学习辨识,最后结合非监督分析与神经网络学习实施分割结果的自检校修正。采用包含复杂地面场景的真实高分辨率遥感影像数据,对比2种目前流行的深度神经网络分割方法Mask R-CNN(mask region-based convolutional neural network,MR)和Scal-ableViT(scalable vision Transformers,SViT)进行实验,实验结果表明所提方法能保持稳健、可靠的分割精度,在地物认知、泛化性能和抗干扰能力方面具有显著优势,是一种性价比高、实用性强的方法。 展开更多
关键词 视觉仿生 高分辨率遥感 影像分割 非监督分析 深度学习神经网络 自学习方法
在线阅读 下载PDF
医学图像分割中的双分支特征提取器及高效特征融合方法
18
作者 张凡 侯惠芳 +1 位作者 张自豪 潘泉 《计算机工程与应用》 北大核心 2025年第14期286-296,共11页
在医学图像分割领域,卷积网络和Transformer网络均以其独特优势而备受青睐,但各自的应用也面临着特定的局限性。此外,现有的特征融合模块存在显著的信息损失,无法充分学习和利用空间和通道之间的复杂关系来实现更准确的分割。为此,提出... 在医学图像分割领域,卷积网络和Transformer网络均以其独特优势而备受青睐,但各自的应用也面临着特定的局限性。此外,现有的特征融合模块存在显著的信息损失,无法充分学习和利用空间和通道之间的复杂关系来实现更准确的分割。为此,提出了一种双分支并行网络特征提取器,解决了单个网络在信息提取方面的不足,有效地克服了两个网络串联组合时可能出现的信息瓶颈问题。同时,为了更充分地利用空间和通道之间的复杂关系,进一步引入了多分支局部全局特征融合增强模块,它能够高效地融合双分支的特征。实验表明,该算法在Synapse和ACDC数据集上表现出色,平均Dice分别达到83.32%和91.82%,HD95指标分别达到15.80 mm和1.29 mm,具有较强的竞争力。 展开更多
关键词 医学图像分割 卷积神经网络(CNN) Transformer网络 特征融合
在线阅读 下载PDF
基于段帧特征图的双流CNN噪声识别模型
19
作者 李春腾 黄智 +2 位作者 李诠娜 魏海礁 徐松岩 《海军工程大学学报》 北大核心 2025年第5期44-49,72,共7页
鉴于噪声抑制算法对不同类型激励源生成的运动感应噪声处理效果不同,为进一步提高算法对运动感应噪声的适配性,提出了一种基于段帧特征图的双流卷积神经网络噪声识别模型。首先,通过设计能够描述运动感应噪声特征的段帧特征图,为噪声识... 鉴于噪声抑制算法对不同类型激励源生成的运动感应噪声处理效果不同,为进一步提高算法对运动感应噪声的适配性,提出了一种基于段帧特征图的双流卷积神经网络噪声识别模型。首先,通过设计能够描述运动感应噪声特征的段帧特征图,为噪声识别模型提供有效的全局特征和细节特征,并构造了一种双流卷积神经网络以充分提取段帧特征图提供的噪声特征;然后,在实验室环境下搭建噪声识别模型性能测试平台,结合Quick Sounds数据库引入复杂水下激励源类型,设置了多组对照实验。结果表明:段帧特征图可以有效表征运动感应噪声类型,能够弥补神经网络识别能力的不足,从而使所提噪声识别模型展现出良好的性能。 展开更多
关键词 运动感应噪声 段特征图 帧特征图 双流卷积神经网络
在线阅读 下载PDF
嵌入注意力机制的车道线像素级识别算法研究
20
作者 肖庭舒 罗小龙 +2 位作者 相龙伟 陈阳光 王朋燕 《激光杂志》 北大核心 2025年第2期106-114,共9页
车辆自动行驶的安全性和稳定性离不开车道线准确识别。然而,日常驾驶中面临着复杂多变的天气和光照条件、道路标记模糊或遮挡等挑战。研究并设计基于深度神经网络的车道线识别算法,以提高识别技术在面对复杂环境的鲁棒性与检测结果精度... 车辆自动行驶的安全性和稳定性离不开车道线准确识别。然而,日常驾驶中面临着复杂多变的天气和光照条件、道路标记模糊或遮挡等挑战。研究并设计基于深度神经网络的车道线识别算法,以提高识别技术在面对复杂环境的鲁棒性与检测结果精度。通过构建以VGG-16为主链并嵌入通道注意力和空间注意力机制的全卷积神经网络模型,实现端到端像素级别的车道线语义分割。嵌入注意力模块的新模型在CULane通用数据集上验证结果同VGG-解码语义分割方法相比,其平均像素准确率与均交并比(Mean Intersection over Union, MIoU)分别提升2.2%与1.3%。且在车道线不存在场景下,预测结果的像素准确率达到70%。嵌入注意力机制的图像分割算法研究为车道线识别问题提供了有效解决方案,有力支撑车道线检测技术在无人驾驶场景的应用。 展开更多
关键词 注意力机制 深度神经网络 语义分割 车道线识别 图像分割
在线阅读 下载PDF
上一页 1 2 32 下一页 到第
使用帮助 返回顶部