期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
Semantic segmentation of camouflage objects via fusing reconstructed multispectral and RGB images
1
作者 Feng Huang Gonghan Yang +5 位作者 Jing Chen Yixuan Xu Jingze Su Guimin Huang Shu Wang Wenxi Liu 《Defence Technology(防务技术)》 2025年第8期324-337,共14页
Accurate segmentation of camouflage objects in aerial imagery is vital for improving the efficiency of UAV-based reconnaissance and rescue missions.However,camouflage object segmentation is increasingly challenging du... Accurate segmentation of camouflage objects in aerial imagery is vital for improving the efficiency of UAV-based reconnaissance and rescue missions.However,camouflage object segmentation is increasingly challenging due to advances in both camouflage materials and biological mimicry.Although multispectral-RGB based technology shows promise,conventional dual-aperture multispectral-RGB imaging systems are constrained by imprecise and time-consuming registration and fusion across different modalities,limiting their performance.Here,we propose the Reconstructed Multispectral-RGB Fusion Network(RMRF-Net),which reconstructs RGB images into multispectral ones,enabling efficient multimodal segmentation using only an RGB camera.Specifically,RMRF-Net employs a divergentsimilarity feature correction strategy to minimize reconstruction errors and includes an efficient boundary-aware decoder to enhance object contours.Notably,we establish the first real-world aerial multispectral-RGB semantic segmentation of camouflage objects dataset,including 11 object categories.Experimental results demonstrate that RMRF-Net outperforms existing methods,achieving 17.38 FPS on the NVIDIA Jetson AGX Orin,with only a 0.96%drop in mIoU compared to the RTX 3090,showing its practical applicability in multimodal remote sensing. 展开更多
关键词 Camouflage object detection Reconstructed multispectral image(MSI) Unmanned aerial vehicle(UAV) semantic segmentation Remote sensing
在线阅读 下载PDF
基于CNN和Transformer交叉教学的半监督医学图像分割 被引量:2
2
作者 杨云 胡雯青 +1 位作者 杨虹 吴亚男 《陕西科技大学学报》 北大核心 2025年第1期185-192,共8页
由于医学图像分割领域缺乏高质量的标注数据,半监督学习方法在医学图像语义分割任务中受到高度重视.为了充分利用卷积神经网络(Convolutional Neural Network,CNN)和Transformer在半监督学习中的优势,本文提出一种基于CNN与Transformer... 由于医学图像分割领域缺乏高质量的标注数据,半监督学习方法在医学图像语义分割任务中受到高度重视.为了充分利用卷积神经网络(Convolutional Neural Network,CNN)和Transformer在半监督学习中的优势,本文提出一种基于CNN与Transformer交叉教学的半监督医学图像分割方法.该方法将经典的深度协同训练从一致性正则化简化为交叉教学,利用循环伪标签方案使两个网络的预测差异转换为无监督损失,以鼓励两个网络具有一致的低熵预测.所提方法在ISIC 2018数据集上进行实验,在采用20%的标注比例时,Dice系数和Jaccard系数分别达到87.25%和79.17%,相比于监督U-Net++的训练结果分别提升了2.89%和3.53%,并且优于目前主流的半监督学习方法,验证了所提方法在半监督医学图像分割上的有效性和泛化性. 展开更多
关键词 半监督学习 图像语义分割 交叉教学 循环伪标签
在线阅读 下载PDF
基于伪标签去噪和SAM优化的大规模无监督语义分割
3
作者 杨维静 徐瑞 +3 位作者 顾浩文 陈涛 舒祥波 姚亚洲 《电子学报》 北大核心 2025年第3期716-727,共12页
语义分割技术能够对复杂、多元的场景实现细粒度理解,是促进无人系统高效、智能工作的关键技术之一.大规模无监督语义分割旨在从大规模未标记图像中学习语义分割能力.然而,现有方法由于自学习伪标签存在类别混淆和形状表示欠佳的问题,... 语义分割技术能够对复杂、多元的场景实现细粒度理解,是促进无人系统高效、智能工作的关键技术之一.大规模无监督语义分割旨在从大规模未标记图像中学习语义分割能力.然而,现有方法由于自学习伪标签存在类别混淆和形状表示欠佳的问题,导致最终分割精度较低.为此,本文提出一种伪标签去噪和SAM优化(Pseudo-label Denoising and SAM Optimization,PDSO)方法以解决大规模无监督语义分割问题.本文设计了一种基于去噪的特征微调模块,在基于小损失准则从大规模数据集中筛选出具有干净图像级伪标签的潜在样本后,利用这些干净样本对预训练的主干网络进行微调,使网络获得更稳健的类别表示.为了进一步减少伪标签中的类别噪声,设计了一种基于聚类的样本去噪模块,根据类别占比和样本与聚类中心之间的距离来去除干扰聚类任务的噪声样本,从而提升聚类性能.本文还设计了一种SAM提示优化模块,根据聚类距离识别出图像中的活跃类别,以过滤噪声目标,并将点和框作为SAM的目标提示信息,生成预期的目标掩膜以细化伪标签中目标的边缘.实验结果表明,在大规模语义分割数据集ImageNet-S_(50)、ImageNet-S_(300)和ImageNet-S_(919)的测试集上,本文方法在平均交并比指标上分别达到了45.0%、26.6%和14.5%,显著提高了分割目标的类别准确率和边缘精度. 展开更多
关键词 大规模无监督语义分割 图像级去噪 分割一切模型 伪标签 聚类
在线阅读 下载PDF
基于图像特定分类器的弱监督语义分割
4
作者 郭子麟 吴东岳 +1 位作者 高常鑫 桑农 《自动化学报》 北大核心 2025年第6期1191-1204,共14页
基于图像级标签的弱监督语义分割算法因极低的标注成本引起学界广泛关注.该领域的算法利用分类网络产生的类激活图实现从图像级标签到像素级标签的转化.然而类激活图往往只关注于图像中最显著的区域,致使基于类激活图产生的伪标签与真... 基于图像级标签的弱监督语义分割算法因极低的标注成本引起学界广泛关注.该领域的算法利用分类网络产生的类激活图实现从图像级标签到像素级标签的转化.然而类激活图往往只关注于图像中最显著的区域,致使基于类激活图产生的伪标签与真实标注存在较大差距,主要包括前景未被有效激活的欠激活问题以及前景间预测混淆的错误激活问题.欠激活源于数据集类内差异过大,致使单一分类器不足以准确识别同一类别的所有像素;错误激活则是数据集类间差异过小,导致分类器不能有效区分不同类别的像素.本文考虑到同一类别像素在图像内的差异小于在数据集中的差异,设计基于类中心的图像特定分类器,以提升对同类像素的识别能力,从而改善欠激活,同时考虑到类中心是类别在特征空间的代表,设计类中心约束函数,通过扩大类中心间的差距从而间接地疏远不同类别的特征分布,以缓解错误激活现象.图像特定分类器可以插入其他弱监督语义分割网络,替代分类网络的分类器,以产生更高质量的类激活图.实验结果表明,本文所提出的方案在两个基准数据集上均具有良好的表现,证实了该方案的有效性. 展开更多
关键词 语义分割 图像级标签 分类器 类激活图 弱监督学习
在线阅读 下载PDF
基于弱监督语义分割的砀山梨表面缺陷识别方法 被引量:1
5
作者 侯文慧 郭丹丹 +4 位作者 周传起 毛博 饶元 刘路 王玉伟 《农业工程学报》 北大核心 2025年第7期173-181,共9页
为识别砀山梨表面缺陷,语义分割网络需要依赖大量精细的像素级标签,样本标注成本较高,导致其实际应用受到限制。针对上述问题,该研究提出两种像素级伪标签生成方法,基于包围框和点标注,借助人工经验的全局信息与局部统计信息生成精细的... 为识别砀山梨表面缺陷,语义分割网络需要依赖大量精细的像素级标签,样本标注成本较高,导致其实际应用受到限制。针对上述问题,该研究提出两种像素级伪标签生成方法,基于包围框和点标注,借助人工经验的全局信息与局部统计信息生成精细的像素级标签;构建基于U-Net的轻量化语义分割网络,记为MCF-Unet,在骨干特征网络底层融合特征金字塔模块,以增强网络的边缘感知能力,在跳跃连接处增加CBAM(convolutional block attention module)注意力机制,以提高网络对目标信息的关注;采用自生成标签参与网络训练,实现砀山梨缺陷分割。试验结果表明,相较于其他深度学习网络模型,所构建的MCF-UNet网络经两种弱监督数据集训练后具有较高的分割准确率及较强的鲁棒性,预测平均交并比分别达70.80%和72.94%。同时,可视化效果表明MCF-UNet模型能够在较低成本的弱监督训练后快速准确地识别砀山梨缺陷。该研究探索了弱监督深度学习在砀山梨缺陷识别中的应用,为水果无损检测领域的弱监督学习提供了参考。 展开更多
关键词 图像识别 砀山梨 缺陷分割 U-Net 伪标签 弱监督 语义分割
在线阅读 下载PDF
Circular object recognition based on shape parameters 被引量:1
6
作者 Chen Aijun Li Jinzong Zhu Bing 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2007年第2期199-204,共6页
To recognize circular objects rapidly in satellite remote sensing imagery, an approach using their geometry properties is presented. The original image is segmented to be a binary one by one dimension maximum entropy ... To recognize circular objects rapidly in satellite remote sensing imagery, an approach using their geometry properties is presented. The original image is segmented to be a binary one by one dimension maximum entropy threshold algorithm and the binary image is labeled with an algorithm based on recursion technique. Then, shape parameters of all labeled regions are calculated and those regions with shape parameters satisfying certain conditions are recognized as circular objects. The algorithm is described in detail, and comparison experiments with the randomized Hough transformation (RHT) are also provided. The experimental results on synthetic images and real images show that the proposed method has the merits of fast recognition rate, high recognition efficiency and the ability of anti-noise and anti-jamming. In addition, the method performs well when some circular objects are little deformed and partly misshapen. 展开更多
关键词 Circular object Pattern recognition Shape parameter Region labeling image segmentation
在线阅读 下载PDF
基于卷积神经网络的下咽癌医学影像分析综述 被引量:2
7
作者 苗扬 张硕 +6 位作者 陈俊 张溪微 安常明 黄泽浩 韩磊 冉东升 刘海滨 《北京工业大学学报》 CAS CSCD 北大核心 2024年第7期883-896,共14页
相比于肺癌、肝癌等常见的癌症,下咽癌是一种罕见的疾病。由于下咽癌的磁共振影像往往亮度不均、模糊、噪声重,因此如何从这些磁共振图像中获取有用信息是一个难题,如何使用深度学习通过磁共振图像来检测下咽癌的病灶是一项重大挑战。首... 相比于肺癌、肝癌等常见的癌症,下咽癌是一种罕见的疾病。由于下咽癌的磁共振影像往往亮度不均、模糊、噪声重,因此如何从这些磁共振图像中获取有用信息是一个难题,如何使用深度学习通过磁共振图像来检测下咽癌的病灶是一项重大挑战。首先,综述了下咽癌的磁共振图像特点及成因,概括了Faster-RCNN、RetinaNet、FCOS、Cascade-RCNN等常见目标检测网络的特点和应用领域,并且分析了目标检测网络应用在下咽癌病灶定位上所面临的挑战,介绍了行之有效的解决方法:可变形卷积和应用定制的锚框。然后,介绍了常见的语义分割网络,并分析了把这些语义分割网络应用在下咽癌病灶分割上所面临的挑战。最后,对上述提到的目标检测网络和语义分割网络进行了总结,并对未来下咽癌医学影像的目标检测和语义分割工作进行了展望。 展开更多
关键词 下咽癌 磁共振成像(MRI) 目标检测 语义分割 深度学习 检测病灶
在线阅读 下载PDF
基于视觉的输电线路金具锈蚀缺陷检测方法研究进展 被引量:18
8
作者 刘传洋 吴一全 刘景景 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第3期286-305,共20页
输电线路金具的表面锈蚀作为常见的缺陷类型,是危害输电线路安全运行的重要隐患之一,如何快速、准确地发现锈蚀的金具设备并进行修复是线路巡检运维工作亟待解决的问题。本文综述了近十年来基于视觉的输电线路金具锈蚀缺陷检测方法的研... 输电线路金具的表面锈蚀作为常见的缺陷类型,是危害输电线路安全运行的重要隐患之一,如何快速、准确地发现锈蚀的金具设备并进行修复是线路巡检运维工作亟待解决的问题。本文综述了近十年来基于视觉的输电线路金具锈蚀缺陷检测方法的研究进展。首先简述了基于传统图像处理的金具锈蚀缺陷检测流程;然后按照基于传统图像处理、深度学习方法概述了金具设备锈蚀缺陷检测,重点阐述了基于深度卷积神经网络的目标检测和语义分割算法在输电线路金具锈蚀缺陷检测中的应用;随后介绍了基于深度学习的金具锈蚀缺陷检测自建数据集以及性能评价指标;最后指出了基于深度学习的输电线路金具锈蚀缺陷检测方法目前存在的问题,并对未来研究工作进行了展望。 展开更多
关键词 金具 锈蚀缺陷 图像处理 深度学习 目标检测 语义分割
在线阅读 下载PDF
高速铁路无砟轨道车载检测图像异物识别方法 被引量:2
9
作者 杨怀志 刘洪润 +5 位作者 宋浩然 顾子晨 王浩然 王乐 杜馨瑜 戴鹏 《中国铁路》 北大核心 2024年第4期8-14,共7页
针对高速铁路实际运营中易出现的无砟轨道异物问题,提出一种高速铁路无砟轨道异物图像识别方法。该方法基于改进的DeepLab无砟轨道异物语义分割模型,利用该模型对轨道图像的分割结果,可准确获取异物的像素级信息。为提高异物检出率和精... 针对高速铁路实际运营中易出现的无砟轨道异物问题,提出一种高速铁路无砟轨道异物图像识别方法。该方法基于改进的DeepLab无砟轨道异物语义分割模型,利用该模型对轨道图像的分割结果,可准确获取异物的像素级信息。为提高异物检出率和精确率,在模型的主干网络中引入通道注意力机制,用于关联图像上下文信息,实现模型对待识别区域的加权约束。在此基础上,针对无砟轨道异常检测中样本类别分布不平衡影响模型的问题,对模型的损失函数进行类别分配占比均衡的改进。试验结果表明,该方法可在像素级别上实现对于多种类型无砟轨道异物的识别,在测试集上检测精确率达到90%,检出率保持在95%以上。 展开更多
关键词 高速铁路 无砟轨道 轨道异物 图像识别 异常检测 语义分割 注意力机制 损失函数
在线阅读 下载PDF
一种图像分割的快速目标描述方法 被引量:8
10
作者 张庆 向健勇 +1 位作者 赵小明 孙勃 《红外技术》 CSCD 北大核心 2004年第6期83-85,88,共4页
提出了一种二值图像分割的快速目标描述算法。该方法以像素标记法为基础,利用相邻扫描行中二值像素点的邻接关系,在一次扫描的过程中完成目标标记的提取以及等价目标标记的合并,最终完成目标的标记和特征量的提取工作,具有速度快,方法简... 提出了一种二值图像分割的快速目标描述算法。该方法以像素标记法为基础,利用相邻扫描行中二值像素点的邻接关系,在一次扫描的过程中完成目标标记的提取以及等价目标标记的合并,最终完成目标的标记和特征量的提取工作,具有速度快,方法简单,处理复杂图案能力强的特点。 展开更多
关键词 图像分割 二值图像 扫描 邻接关系 描述方法 像素标记 快速 像素点 算法 等价
在线阅读 下载PDF
一种图像分割的目标描述方法及实现 被引量:10
11
作者 张新宇 刘广智 +1 位作者 李建勋 敬忠良 《系统工程与电子技术》 EI CSCD 北大核心 2003年第2期219-222,共4页
提出一种二值分割图像目标描述的实现方法 ,用以获取目标特征量。在对二值化图像形成目标块的过程中使用扩展像素标记法 ,可以在标记目标所属像素的同时标记目标的边界点 ,从而得到目标的单像素宽边界。在此基础上获得目标的面积、周长... 提出一种二值分割图像目标描述的实现方法 ,用以获取目标特征量。在对二值化图像形成目标块的过程中使用扩展像素标记法 ,可以在标记目标所属像素的同时标记目标的边界点 ,从而得到目标的单像素宽边界。在此基础上获得目标的面积、周长和质心坐标等参数 ,为图像目标识别做好准备。最后给出了算法C ++编程的具体思路和实现。仿真实验证实了该算法实用可行。 展开更多
关键词 图像分割 目标描述 像素标记 边缘勾勒
在线阅读 下载PDF
面向计算机视觉系统的对抗样本攻击综述 被引量:21
12
作者 王志波 王雪 +3 位作者 马菁菁 秦湛 任炬 任奎 《计算机学报》 EI CAS CSCD 北大核心 2023年第2期436-468,共33页
对抗样本攻击是近年来计算机视觉领域的热点研究方向,通过对图像添加细微的噪声,对抗样本使计算机视觉系统做出错误判断.对抗样本攻击的研究起初重点关注于图像分类任务,随着研究的深入逐步拓展到目标检测、人脸识别等更加复杂的计算机... 对抗样本攻击是近年来计算机视觉领域的热点研究方向,通过对图像添加细微的噪声,对抗样本使计算机视觉系统做出错误判断.对抗样本攻击的研究起初重点关注于图像分类任务,随着研究的深入逐步拓展到目标检测、人脸识别等更加复杂的计算机视觉任务中.然而,现有的对抗样本综述缺乏对新兴图像分类攻击方案的梳理总结以及针对目标检测、人脸识别等复杂任务攻击的分析总结.本论文聚焦于计算机视觉系统中的对抗样本攻击,对其理论与前沿技术进行了系统性的综述研究.首先,本论文介绍了对抗样本的关键概念与敌手模型.其次,分类总结和对比分析了对抗样本存在原因的三大类相关假设.再次,根据数字域与物理域两大应用场景,分类概述和对比分析图像分类系统中的对抗样本攻击技术.根据不同的敌手模型,我们进一步地将图像分类任务数字域的攻击方案划分为白盒和黑盒两种场景,并重点总结梳理了新兴的攻击类别.同时,在目标检测、人脸识别、语义分割、图像检索、视觉跟踪五类复杂计算机视觉任务上,根据适用场景分类总结各类任务中的对抗样本攻击方案.进一步地,从攻击场景、攻击目标、攻击效果等方面对于不同攻击方案进行详细地对比分析.最后,基于现有对抗样本攻击方法的总结,我们分析与展望了计算机视觉系统中对抗样本的未来研究方向. 展开更多
关键词 对抗样本 计算机视觉 图像分类 目标检测 人脸识别 语义分割
在线阅读 下载PDF
地理空间中的空间关系表达和推理 被引量:27
13
作者 刘瑜 龚咏喜 +1 位作者 张晶 高勇 《地理与地理信息科学》 CSCD 北大核心 2007年第5期1-7,共7页
针对地理空间中的应用,归纳了在空间关系的表达与推理中不同于人工智能领域研究的一些特点:在人工智能领域,更注重建立形式化的推理系统;而在地理信息科学中,则需更关注地理空间的特点以及地物的地理语义。该文基于地理空间和地理现象... 针对地理空间中的应用,归纳了在空间关系的表达与推理中不同于人工智能领域研究的一些特点:在人工智能领域,更注重建立形式化的推理系统;而在地理信息科学中,则需更关注地理空间的特点以及地物的地理语义。该文基于地理空间和地理现象的本质且顾及地理空间认知,总结了地理空间中空间关系表达和推理的特点,具体包括空间的有限性、地球的球面特征、地物的地理语义、地物形状的复杂性、面状地物、特殊的空间关系、空间关系的层次性与尺度相应原则、不确定性、三维与时态特性九方面;进而介绍了地理空间关系表达的两个应用,即地理信息检索和基于对象的图像分析。该文的探讨可为地理信息科学中的相关研究提供方向性指导。 展开更多
关键词 空间关系表达和推理 地理空间 地理语义 地理信息检索 基于对象的图像分析
在线阅读 下载PDF
面向对象结合深度学习方法的矿区地物提取 被引量:13
14
作者 蔡祥 李琦 +1 位作者 罗言 齐建东 《国土资源遥感》 CSCD 北大核心 2021年第1期63-71,共9页
为了快速准确获取煤炭矿区的地物信息,以达到辅助安排和部署矿区安全生产工作的目的,采用无人机低空遥感拍摄的方式获取了矿区内的高清影像数据,并提出一种基于面向对象和深度学习的矿区无人机影像地物提取方法。首先利用面向对象的分... 为了快速准确获取煤炭矿区的地物信息,以达到辅助安排和部署矿区安全生产工作的目的,采用无人机低空遥感拍摄的方式获取了矿区内的高清影像数据,并提出一种基于面向对象和深度学习的矿区无人机影像地物提取方法。首先利用面向对象的分类方法配合人工校正,制作用于深度学习语义分割的标签,再采用FCN-32s,FCN-8s和U-Net 3种深度学习语义分割模型提取图像特征,训练出3种不同的分类模型,并基于此提出多数投票和打分算法2种集成模型改进地物提取精度。实验结果表明,面向对象结合深度学习方法的地物提取准确率、Kappa系数较传统面向对象方法均有明显提升。其中打分集成模型识别效果最好,在测试集上的整体准确率为94.55%,高出面向对象方法5.96百分点;Kappa系数为0.8191。 展开更多
关键词 无人机影像 面向对象 深度学习 矿区地物提取 语义分割
在线阅读 下载PDF
结合目标检测的小目标语义分割算法 被引量:5
15
作者 胡太 杨明 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第1期73-84,共12页
卷积神经网络(Convolutional Neural Networks,CNN)可以提供比传统分类算法更强大的分类器并且能够自学习得到深层特征,有效地提高了图像语义分割的准确性.然而,基于CNN的语义分割算法依然存在一些挑战,例如在复杂场景中现有较优的方法... 卷积神经网络(Convolutional Neural Networks,CNN)可以提供比传统分类算法更强大的分类器并且能够自学习得到深层特征,有效地提高了图像语义分割的准确性.然而,基于CNN的语义分割算法依然存在一些挑战,例如在复杂场景中现有较优的方法较难分割小目标.为了解决复杂场景下小目标分割的难题,提出一种结合目标检测的小目标语义分割算法.与现有较优方法不同的是,该方法没有直接利用单个神经网络模型同时分割单幅图像中的小尺寸和较大尺寸目标,而是将小目标分割任务从完整图像的分割任务中分离.算法首先训练一个目标检测模型以获取小目标图像块,然后设计一个小目标分割网络得到图像块的分割结果,最终根据该结果修正整体图像的分割图.该算法提升了语义分割数据集的总体性能,同时能够有效地解决小目标分割的难题. 展开更多
关键词 图像语义分割 小目标分割 卷积神经网络 目标检测
在线阅读 下载PDF
图切技术和卷积网络的交通标志数据集构建方法 被引量:6
16
作者 熊昌镇 王聪 《计算机应用》 CSCD 北大核心 2017年第A01期183-186,共4页
为解决自然场景下的交通标志数据获取困难的问题,提出一种基于深度卷积神经网络结合图切技术的交通标志数据自动收集方法。该方法先利用人为收集的少量7大类交通标志数据集训练检测交通标志的卷积神经网络模型,利用该网络模型检测图像... 为解决自然场景下的交通标志数据获取困难的问题,提出一种基于深度卷积神经网络结合图切技术的交通标志数据自动收集方法。该方法先利用人为收集的少量7大类交通标志数据集训练检测交通标志的卷积神经网络模型,利用该网络模型检测图像或视频中的交通标志类别、位置及可信度,保存大于给定阈值的交通标志信息;然后采用图切技术对检测的交通标志进行分割得到精度更高的交通标志区域,将此标志的区域信息和类别作为标定信息。将对应的图片和标定信息按要求生成新的训练数据集和测试数据集,重新微调训练生成新的网络模型。实验结果表明,重新微调训练的网络比初始网络的平均检测精度提升了6.6%。该方法可将车载相机或是行车记录仪等设备获取的图像或是视频中的交通标志自动保存下来生成构建新的交通标志数据集,省去人工标定的过程。 展开更多
关键词 交通标志 深度卷积神经网络 目标检测 图像分割 图像标记
在线阅读 下载PDF
基于多尺度互注意力的遥感图像语义分割网络 被引量:6
17
作者 刘春娟 乔泽 +3 位作者 闫浩文 吴小所 王嘉伟 辛钰强 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第7期1335-1344,共10页
为了解决在遥感图像语义分割任务中存在的目标物体之间巨大尺度差异和丢失空间细节信息导致分割精度下降的问题,提出多尺度互注意力与指导上采样网络.利用多尺度互注意力模块获得不同尺度图像之间的像素关系,平衡不同尺度物体的权重,提... 为了解决在遥感图像语义分割任务中存在的目标物体之间巨大尺度差异和丢失空间细节信息导致分割精度下降的问题,提出多尺度互注意力与指导上采样网络.利用多尺度互注意力模块获得不同尺度图像之间的像素关系,平衡不同尺度物体的权重,提高小尺度物体的分割性能.编码指导上采样模块利用编码结构中的信息,指导图像上采样的过程,融合空间细节信息,提升目标物体边界像素的分类效果.在Potsdam数据集和Jiage数据集上的m IoU得分分别为85.52%和86.59%,较次优网络分别提升了1.32%和1.46%. 展开更多
关键词 遥感图像 语义分割 多尺度互注意力 小尺度物体 编码指导上采样
在线阅读 下载PDF
语义网络引导的遥感图像分类 被引量:2
18
作者 张建廷 张立民 徐涛 《遥感信息》 CSCD 北大核心 2016年第1期38-42,共5页
为将领域知识与基于对象的图像分析范式有效地结合起来,以解决遥感图像分析中的语义鸿沟问题,提出了一种语义网络引导的遥感图像分类方法。该方法包含分割、预分类、结果修正3个步骤。采用语义网络引导的分类方法进行预分类,使用定性匹... 为将领域知识与基于对象的图像分析范式有效地结合起来,以解决遥感图像分析中的语义鸿沟问题,提出了一种语义网络引导的遥感图像分类方法。该方法包含分割、预分类、结果修正3个步骤。采用语义网络引导的分类方法进行预分类,使用定性匹配度进行图像对象与概念匹配判定,定义了一种定量匹配度,并将其用于对预分类结果的修正。方法减小了图像对象与概念进行匹配的搜索空间,降低了运算复杂度。实验结果证明了该方法的有效性。 展开更多
关键词 基于对象图像分析 遥感图像分类 语义网络 匹配度 图像分割
在线阅读 下载PDF
基于背景重建和MDBP的视频对象分割算法 被引量:1
19
作者 苏大伟 周利莉 王继芳 《计算机工程与应用》 CSCD 北大核心 2005年第14期71-73,共3页
提出了背景置信度图像和背景标示图像的概念,给出了一种基于背景重建和象素最小距离(M DBP)的自动视频对象分割方法。首先运用基于背景置信度图像和背景标示图像的背景重建技术从视频序列的多帧图像中重建出可靠的背景图像,然后运用差... 提出了背景置信度图像和背景标示图像的概念,给出了一种基于背景重建和象素最小距离(M DBP)的自动视频对象分割方法。首先运用基于背景置信度图像和背景标示图像的背景重建技术从视频序列的多帧图像中重建出可靠的背景图像,然后运用差背景法分割视频对象(VO),同时再利用象素最小距离(M D BP)和总体象素最小距离(W M DBP)准则对分割出的视频对象图像进行处理,克服由于背景的微小变化而引起的前景对象的错误检测。试验结果表明该文给出方法能够较好地重建背景,对于背景静止的视频能够得到更好的分割结果。 展开更多
关键词 背景重建 置信度图像 背景标示图像 视频对象分割 视频对象
在线阅读 下载PDF
基于改进的U-Net和YOLOv5的绝缘子掩模获取与缺陷检测 被引量:10
20
作者 唐小煜 熊浩良 +1 位作者 黄锐珊 林威霖 《数据采集与处理》 CSCD 北大核心 2021年第5期1041-1049,共9页
输电线路的绝缘子定期巡检是必不可少的一项任务,而传统的人工巡检存在着效率低、工作强度大等问题。因此,本文设计了一种改进的U-Net模型实现对绝缘子的分割,并使用改进的YOLOv5实现在复杂背景下对爆破绝缘子的定位。本文基于U-Net图... 输电线路的绝缘子定期巡检是必不可少的一项任务,而传统的人工巡检存在着效率低、工作强度大等问题。因此,本文设计了一种改进的U-Net模型实现对绝缘子的分割,并使用改进的YOLOv5实现在复杂背景下对爆破绝缘子的定位。本文基于U-Net图像语义分割模型,提出一种改进的网络结构SERes-Unet。模型引入残差结构减少卷积过程中存在的梯度消失、结构信息损耗的影响,引入注意力机制对特征权重进行校正,从而提升网络性能。为实现对高分辨率图像的爆破绝缘子检测,提出将图片进行切割再进行检测,再通过非极大值抑制(Non-maximum suppression,NMS)进行筛选,获取图像全部爆破绝缘子的位置。本文设计的多组实验验证了模型的有效性和高效性。本文方法绝缘子分割精度达到0.96,爆破绝缘子检测精确率达到0.97,召回率达到0.99。 展开更多
关键词 爆破绝缘子 图像语义分割 目标检测 U-Net模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部