期刊文献+
共找到1,634篇文章
< 1 2 82 >
每页显示 20 50 100
A semantic segmentation-based underwater acoustic image transmission framework for cooperative SLAM
1
作者 Jiaxu Li Guangyao Han +1 位作者 Shuai Chang Xiaomei Fu 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2024年第3期339-351,共13页
With the development of underwater sonar detection technology,simultaneous localization and mapping(SLAM)approach has attracted much attention in underwater navigation field in recent years.But the weak detection abil... With the development of underwater sonar detection technology,simultaneous localization and mapping(SLAM)approach has attracted much attention in underwater navigation field in recent years.But the weak detection ability of a single vehicle limits the SLAM performance in wide areas.Thereby,cooperative SLAM using multiple vehicles has become an important research direction.The key factor of cooperative SLAM is timely and efficient sonar image transmission among underwater vehicles.However,the limited bandwidth of underwater acoustic channels contradicts a large amount of sonar image data.It is essential to compress the images before transmission.Recently,deep neural networks have great value in image compression by virtue of the powerful learning ability of neural networks,but the existing sonar image compression methods based on neural network usually focus on the pixel-level information without the semantic-level information.In this paper,we propose a novel underwater acoustic transmission scheme called UAT-SSIC that includes semantic segmentation-based sonar image compression(SSIC)framework and the joint source-channel codec,to improve the accuracy of the semantic information of the reconstructed sonar image at the receiver.The SSIC framework consists of Auto-Encoder structure-based sonar image compression network,which is measured by a semantic segmentation network's residual.Considering that sonar images have the characteristics of blurred target edges,the semantic segmentation network used a special dilated convolution neural network(DiCNN)to enhance segmentation accuracy by expanding the range of receptive fields.The joint source-channel codec with unequal error protection is proposed that adjusts the power level of the transmitted data,which deal with sonar image transmission error caused by the serious underwater acoustic channel.Experiment results demonstrate that our method preserves more semantic information,with advantages over existing methods at the same compression ratio.It also improves the error tolerance and packet loss resistance of transmission. 展开更多
关键词 semantic segmentation Sonar image transmission Learning-based compression
在线阅读 下载PDF
End-to-end dilated convolution network for document image semantic segmentation 被引量:8
2
作者 XU Can-hui SHI Cao CHEN Yi-nong 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第6期1765-1774,共10页
Semantic segmentation is a crucial step for document understanding.In this paper,an NVIDIA Jetson Nano-based platform is applied for implementing semantic segmentation for teaching artificial intelligence concepts and... Semantic segmentation is a crucial step for document understanding.In this paper,an NVIDIA Jetson Nano-based platform is applied for implementing semantic segmentation for teaching artificial intelligence concepts and programming.To extract semantic structures from document images,we present an end-to-end dilated convolution network architecture.Dilated convolutions have well-known advantages for extracting multi-scale context information without losing spatial resolution.Our model utilizes dilated convolutions with residual network to represent the image features and predicting pixel labels.The convolution part works as feature extractor to obtain multidimensional and hierarchical image features.The consecutive deconvolution is used for producing full resolution segmentation prediction.The probability of each pixel decides its predefined semantic class label.To understand segmentation granularity,we compare performances at three different levels.From fine grained class to coarse class levels,the proposed dilated convolution network architecture is evaluated on three document datasets.The experimental results have shown that both semantic data distribution imbalance and network depth are import factors that influence the document’s semantic segmentation performances.The research is aimed at offering an education resource for teaching artificial intelligence concepts and techniques. 展开更多
关键词 semantic segmentation document images deep learning NVIDIA jetson nano
在线阅读 下载PDF
Semantic segmentation of camouflage objects via fusing reconstructed multispectral and RGB images
3
作者 Feng Huang Gonghan Yang +5 位作者 Jing Chen Yixuan Xu Jingze Su Guimin Huang Shu Wang Wenxi Liu 《Defence Technology(防务技术)》 2025年第8期324-337,共14页
Accurate segmentation of camouflage objects in aerial imagery is vital for improving the efficiency of UAV-based reconnaissance and rescue missions.However,camouflage object segmentation is increasingly challenging du... Accurate segmentation of camouflage objects in aerial imagery is vital for improving the efficiency of UAV-based reconnaissance and rescue missions.However,camouflage object segmentation is increasingly challenging due to advances in both camouflage materials and biological mimicry.Although multispectral-RGB based technology shows promise,conventional dual-aperture multispectral-RGB imaging systems are constrained by imprecise and time-consuming registration and fusion across different modalities,limiting their performance.Here,we propose the Reconstructed Multispectral-RGB Fusion Network(RMRF-Net),which reconstructs RGB images into multispectral ones,enabling efficient multimodal segmentation using only an RGB camera.Specifically,RMRF-Net employs a divergentsimilarity feature correction strategy to minimize reconstruction errors and includes an efficient boundary-aware decoder to enhance object contours.Notably,we establish the first real-world aerial multispectral-RGB semantic segmentation of camouflage objects dataset,including 11 object categories.Experimental results demonstrate that RMRF-Net outperforms existing methods,achieving 17.38 FPS on the NVIDIA Jetson AGX Orin,with only a 0.96%drop in mIoU compared to the RTX 3090,showing its practical applicability in multimodal remote sensing. 展开更多
关键词 Camouflage object detection Reconstructed multispectral image(MSI) Unmanned aerial vehicle(UAV) semantic segmentation Remote sensing
在线阅读 下载PDF
激光三维点云在岩性语义分割中的应用综述 被引量:1
4
作者 邵燕林 刘浪 +4 位作者 曾齐红 胡忠贵 魏薇 邓帆 王庆 《科学技术与工程》 北大核心 2025年第4期1313-1324,共12页
激光三维扫描技术可快速获取扫描目标表面的点云数据,包括用于描述目标几何特征的空间点坐标和刻画目标材质反射率信息的激光反射强度。将激光三维点云的自动语义分割技术应用于地质勘探研究中,能为区域地质特征描绘奠定基础。为了展示... 激光三维扫描技术可快速获取扫描目标表面的点云数据,包括用于描述目标几何特征的空间点坐标和刻画目标材质反射率信息的激光反射强度。将激光三维点云的自动语义分割技术应用于地质勘探研究中,能为区域地质特征描绘奠定基础。为了展示激光三维扫描技术在地质场景大规模语义分割领域的最新进展,首先对摄影测量和激光雷达两种三维点云获取方式进行了比较,得到激光雷达在精度、泛用性、不易受光照条件影响等方面具有优势。通过阐述岩性语义分割的原理,将近年来基于几何特征或强度特征的岩性点云分割方法进行了全面的归纳和总结;介绍了常用大规模点云数据集和评价指标,并比较不同算法分割性能;最后总结了现有方法的局限性,并指出岩性语义分割任务未来研究方向进行展望。 展开更多
关键词 三维激光雷达 数字模型 点云语义分割 岩性分类
在线阅读 下载PDF
基于改进DeepLabv3+的马铃薯幼苗与杂草识别方法 被引量:2
5
作者 祝诗平 林曦 +2 位作者 冯川 周杰 李博鑫 《农业工程学报》 北大核心 2025年第10期147-156,共10页
针对自然环境下农作物与杂草相互交织,杂草种类繁多,难以准确识别等问题,该研究以马铃薯幼苗及其伴生杂草为研究对象,提出了一种改进DeepLabv3+模型的杂草识别方法。首先以DeepLabv3+语义分割模型为基准,将其主干网络替换为MobileNetV2... 针对自然环境下农作物与杂草相互交织,杂草种类繁多,难以准确识别等问题,该研究以马铃薯幼苗及其伴生杂草为研究对象,提出了一种改进DeepLabv3+模型的杂草识别方法。首先以DeepLabv3+语义分割模型为基准,将其主干网络替换为MobileNetV2,构成轻量化DeepLabv3+模型,随后为了提升模型的非线性能力,提出了一种基于注意力机制的激活函数(attention activate function,AAF),并将其融入到AAF-Conv卷积里,取代轻量化DeepLabv3+语义分割模型中主干网络MobileNetV2的第一个3×3Conv,建立AAF-DeepLabv3+模型。使用AAF-DeepLabv3+模型获取马铃薯幼苗的形态边界,采用图像学的方法识别图像中杂草区域。在轻量化DeepLabv3+模型基础上,AAF激活函数与常见激活函数进行对比试验,平均交并比(mean intersection over Union,mIoU)分别比ReLU6、SiLU、CeLU提升了1.58、1.31、1.99个百分点,平均像素识别准确率(mean pixel accuracy,mPA)分别提升了1.47、0.6、1.26个百分点,表现出良好的性能。AAF-DeepLabv3+模型在消融试验和与其他常见语义分割模型对比中,表现出了显著的性能优势,mIoU和m PA分别为90.82%和95.56%,比原始DeepLabv3+模型提升了1.07和1.15个百分点,帧率为69.21帧/s,比原始模型提高了30.77帧/s,模型大小为22.56 MB,比原始模型降低了185.96 MB。结果表明在同一试验环境下,该模型整体性能优于UNet、PSPNet、HrNet、DeepLabv3、FCN等主流的语义分割网络模型。该杂草识别方法不仅降低了前期图片标注工作量,还有效地解决了杂草与农作物目标交叠且杂草种类繁多带来的识别难题,为移动端设备进行农田杂草识别及研制智能化除草装置提供了技术参考。 展开更多
关键词 马铃薯幼苗 杂草识别 语义分割 激活函数 AAF-DeepLabv3+
在线阅读 下载PDF
融合动态特征增强的遥感建筑物分割 被引量:1
6
作者 肖振久 田昊 +1 位作者 张杰浩 曲海成 《光电工程》 北大核心 2025年第3期12-24,共13页
针对遥感地物建筑物图像目标尺度差异大、样本空间分布不均衡、地物边界模糊、场景区域跨度大所导致的分割效果不佳问题,本文提出一种融合动态特征增强高精度遥感建筑物分割算法。首先,构建New_GhostNetV2网络,利用自适应上下文感知卷积... 针对遥感地物建筑物图像目标尺度差异大、样本空间分布不均衡、地物边界模糊、场景区域跨度大所导致的分割效果不佳问题,本文提出一种融合动态特征增强高精度遥感建筑物分割算法。首先,构建New_GhostNetV2网络,利用自适应上下文感知卷积,增强算法对样本空间特征的捕捉能力。其次,采用Ghost Convolution结合跳跃连接和特征分支策略设计多层级信息增强模块,增强特征整合。随后引入级联注意力CGA(cascaded group attention),通过组内独立注意力计算,加强模型对多样化地物形态的适应性。最后,通过动态深度特征增强器构造特征融合模块,进一步加强模型捕获能力。在WHU数据集上实验结果表明:改进算法较基线模型F1-Score提高8.57%,mIoU提高12.48%,与其他主流语义分割模型相比,改进DeepLabv3+具有更好的分割精度。 展开更多
关键词 遥感图像 语义分割 特征增强 信息整合
在线阅读 下载PDF
基于双路径监督的遥感图像语义分割网络 被引量:1
7
作者 刘春娟 乔泽 +3 位作者 闫浩文 吴小所 王嘉伟 辛钰强 《北京航空航天大学学报》 北大核心 2025年第3期732-741,共10页
为解决遥感图像语义分割任务中目标物体边界分类模糊的问题,提出双路径监督与注意力筛选网络。引入可监督的边界提取模块来增加边界信息通道,提高边界信息在语义分割中的权重,增强对目标物体边界像素的注意力;引入注意力筛选模块,通过... 为解决遥感图像语义分割任务中目标物体边界分类模糊的问题,提出双路径监督与注意力筛选网络。引入可监督的边界提取模块来增加边界信息通道,提高边界信息在语义分割中的权重,增强对目标物体边界像素的注意力;引入注意力筛选模块,通过注意力图筛选出浅层网络中的空间细节信息和深层网络中的抽象语义信息,舍弃网络中的冗余信息,防止过拟合。双路径监督与注意力筛选网络在Potsdam数据集和Jiage数据集上的平均交并比分别为85.44%和86.07%,比次优网络MagNet和SAPNet分别提升了1.24%和1.28%、1.54%和1.27%。实验结果表明,所提网络能更精准地分割目标物体的边界。 展开更多
关键词 遥感图像 语义分割 可监督 边界信息 注意力筛选
在线阅读 下载PDF
基于CNN和Transformer交叉教学的半监督医学图像分割 被引量:2
8
作者 杨云 胡雯青 +1 位作者 杨虹 吴亚男 《陕西科技大学学报》 北大核心 2025年第1期185-192,共8页
由于医学图像分割领域缺乏高质量的标注数据,半监督学习方法在医学图像语义分割任务中受到高度重视.为了充分利用卷积神经网络(Convolutional Neural Network,CNN)和Transformer在半监督学习中的优势,本文提出一种基于CNN与Transformer... 由于医学图像分割领域缺乏高质量的标注数据,半监督学习方法在医学图像语义分割任务中受到高度重视.为了充分利用卷积神经网络(Convolutional Neural Network,CNN)和Transformer在半监督学习中的优势,本文提出一种基于CNN与Transformer交叉教学的半监督医学图像分割方法.该方法将经典的深度协同训练从一致性正则化简化为交叉教学,利用循环伪标签方案使两个网络的预测差异转换为无监督损失,以鼓励两个网络具有一致的低熵预测.所提方法在ISIC 2018数据集上进行实验,在采用20%的标注比例时,Dice系数和Jaccard系数分别达到87.25%和79.17%,相比于监督U-Net++的训练结果分别提升了2.89%和3.53%,并且优于目前主流的半监督学习方法,验证了所提方法在半监督医学图像分割上的有效性和泛化性. 展开更多
关键词 半监督学习 图像语义分割 交叉教学 循环伪标签
在线阅读 下载PDF
面向遥感图像道路提取的多尺度上下文感知网络
9
作者 李智杰 惠爱婷 +3 位作者 李昌华 董玮 张颉 介军 《光学精密工程》 北大核心 2025年第4期610-623,共14页
针对深度神经网络在遥感图像道路提取中面临的局部特征丢失和提取精度低的问题,本文基于SwinUnet网络提出了一种面向遥感图像道路提取的多尺度上下文感知网络。首先,在编码器中设计了一个具有上下文聚合模块的分支,以增强上下文信息提取... 针对深度神经网络在遥感图像道路提取中面临的局部特征丢失和提取精度低的问题,本文基于SwinUnet网络提出了一种面向遥感图像道路提取的多尺度上下文感知网络。首先,在编码器中设计了一个具有上下文聚合模块的分支,以增强上下文信息提取,并缓解因遮挡引起的语义模糊问题。其次,为了解决编解码器之间语义信息不匹配的问题并提高模型的空间信息提取能力,在跳跃连接中引入了空间特征提取模块,取代了SwinUnet中直接复制编码器特征的方法。最后,在下采样阶段设计了一个特征收缩模块,以减少编码器中信息丢失并增强网络的分割能力。在Massachusetts道路数据集上进行测试结果显示,该方法在F1,IoU,Pr和Re指标上分别达到了80.91%,69.40%,78.03%和65.20%。与主流方法UNet和SwinUnet相比,IoU分别提高了4.45%和2.72%,证明了所提算法通过全局建模、上下文增强和信息匹配优化,有效提升了遥感图像道路提取的精度和性能。 展开更多
关键词 遥感图像 道路提取 语义分割 SwinUnet
在线阅读 下载PDF
基于改进DeepLabv3+的安全帽佩戴分割算法
10
作者 邵晓艳 董文永 +2 位作者 赵雪专 李玲玲 薄树奎 《西南大学学报(自然科学版)》 北大核心 2025年第7期185-195,共11页
针对物流园区空间跨度大、作业设备繁多导致安全帽佩戴检测分割难度增加的问题,提出一种基于改进DeepLabv3+的安全帽佩戴分割算法。该算法采用ResNet-101膨胀残差网络进行特征提取;在编码阶段引入卷积注意力机制融合模块,有效增强特征... 针对物流园区空间跨度大、作业设备繁多导致安全帽佩戴检测分割难度增加的问题,提出一种基于改进DeepLabv3+的安全帽佩戴分割算法。该算法采用ResNet-101膨胀残差网络进行特征提取;在编码阶段引入卷积注意力机制融合模块,有效增强特征区域表征能力;在特征提取阶段引入图像特征网格化模块,将低分辨率图像进行平均切分,有助于获得局部图像的小目标特征。将该算法在SHWD(Safety Helmet Wearing Detect)数据集中训练测试,结果表明:算法的像素准确率达到89.23%,相比DeepLabv3+提升了2.21个百分点,有效提高了复杂场景下物流园区安全帽佩戴分割精度。 展开更多
关键词 神经网络 注意力机制 膨胀卷积 语义分割
在线阅读 下载PDF
基于动态场景的实时语义SLAM算法
11
作者 符强 钟振 +1 位作者 纪元法 任风华 《测绘通报》 北大核心 2025年第4期27-33,共7页
针对传统视觉SLAM(simultaneous localization and mapping)在动态环境下定位精度较低、稳健性较差、结合深度学习后实时性较差及无法构建稠密地图的问题,本文提出了一种基于ORB-SLAM3的改进算法。首先,采用轻量化SegFormer语义分割网络... 针对传统视觉SLAM(simultaneous localization and mapping)在动态环境下定位精度较低、稳健性较差、结合深度学习后实时性较差及无法构建稠密地图的问题,本文提出了一种基于ORB-SLAM3的改进算法。首先,采用轻量化SegFormer语义分割网络,对图像中存在的动态物体进行识别后,添加掩膜图像自适应膨胀方法,根据特征点数自动调整掩膜膨胀范围,更有效地保留静态特征点及去除潜在动态特征点;然后,改进词袋模型,提升算法的加载和匹配速度;最后,添加稠密建图线程,根据掩膜信息和关键帧,构建去除动态特征后的稠密点云地图。试验结果表明,该算法在动态场景下能够有效地剔除动态物体特征点,提高了系统的定位精度和稳健性,平均处理速度为20帧/s,基本满足实时运行的要求。 展开更多
关键词 视觉SLAM ORB-SLAM3 语义分割 稠密建图
在线阅读 下载PDF
光影智绘:基于SAM的视频阴影鲁棒抽取
12
作者 陈东 李昌隆 +2 位作者 杜振龙 宋爽 李晓丽 《图学学报》 北大核心 2025年第4期739-745,共7页
针对传统方法对于光照变化和物体遮挡引起复杂的、动态变化阴影处理易致阴影检测的准确率和鲁棒性较低问题,提出了一种基于分割万物模型(SAM)的视频阴影检测方法,对SAM解码器进行微调,使其更适合阴影检测;利用SAM提取关键帧阴影区域,引... 针对传统方法对于光照变化和物体遮挡引起复杂的、动态变化阴影处理易致阴影检测的准确率和鲁棒性较低问题,提出了一种基于分割万物模型(SAM)的视频阴影检测方法,对SAM解码器进行微调,使其更适合阴影检测;利用SAM提取关键帧阴影区域,引入XMem模型,结合感觉记忆、短时记忆和长时记忆联合前后帧信息,给出优化和稳定视频阴影检测结果。实验结果表明:在ViSha数据集的阴影实验结果与传统方法相比,该方法的均值绝对误差降低了约31.8%,交并比提升了约19.7%;定性和定量结果表明本方法不仅提升了视频阴影处理的准确率,并表现出较好的鲁棒性。 展开更多
关键词 阴影检测 语义分割 视频对象分割 SAM XMem
在线阅读 下载PDF
特征级语义感知引导的多模态图像融合算法
13
作者 张梅 金叶 +1 位作者 朱金辉 贺霖 《电子与信息学报》 北大核心 2025年第8期2909-2918,共10页
在自动驾驶领域,红外和可见光的融合图像因其能够提供显著目标和丰富的纹理细节而备受关注。然而现有的大部分融合算法单方面关注融合图像的视觉质量和评价指标,而忽略了高级视觉任务的需求。另外,虽然一些融合方法尝试结合高级视觉任务... 在自动驾驶领域,红外和可见光的融合图像因其能够提供显著目标和丰富的纹理细节而备受关注。然而现有的大部分融合算法单方面关注融合图像的视觉质量和评价指标,而忽略了高级视觉任务的需求。另外,虽然一些融合方法尝试结合高级视觉任务,但是其效果受限于语义先验和融合任务之间的交互不足且没有考虑到不同特征差异性的影响。因此,该文提出了特征级语义感知引导的多模态图像融合算法,使语义先验知识与融合任务进行充分交互,提高融合结果在后续的分割任务中的性能。对于语义特征和融合图像特征两者的差异性,提出了双特征交互模块,以实现不同特征的充分交互和选择。对于红外和可见光两种不同模态特征的差异性,提出了多源空间注意力融合模块,以实现不同模态信息的有效集成和互补。该文在3个公共数据集上进行了实验,结果表明该方法的融合结果优于其他方法且泛化能力较好,而且在各种融合算法联合分割任务的性能比较实验中也表明了该方法在分割任务中的优越性。 展开更多
关键词 图像融合 联合分割任务 语义感知 特征级引导
在线阅读 下载PDF
基于深度学习对接环识别的自主抓捕验证评估
14
作者 许哲 王捷 +1 位作者 魏鹏飞 张亚航 《航天器工程》 北大核心 2025年第3期42-47,共6页
星箭对接环是连接卫星和运载火箭的关键部件,准确识别对接环将有助于卫星捕获效果的验证评估。文章提出了一个用于星箭对接环分割的轻量级神经网络,可以用于星箭对接环的实时识别,同时有利于进一步部署和应用。实现了一种并行分解卷积,... 星箭对接环是连接卫星和运载火箭的关键部件,准确识别对接环将有助于卫星捕获效果的验证评估。文章提出了一个用于星箭对接环分割的轻量级神经网络,可以用于星箭对接环的实时识别,同时有利于进一步部署和应用。实现了一种并行分解卷积,可以有效捕获不同层次的特征信息,同时模型的参数和计算量也进一步减少,加快推理速度。设计了一种基于注意力机制的特征融合模块,通过增加少量参数和计算量,可以有效地融合不同层次的特征。在建立的星箭对接环数据集上实现了95.63%的平均交并比(mIoU),同时模型的参数和计算量只有0.36 M浮点运算次数(FLOPs)和8.10 G浮点运算次数(FLOPs),其推理速度和精度取得了较好的平衡。 展开更多
关键词 深度学习 语义分割 自主抓捕 验证 评估
在线阅读 下载PDF
一种基于多尺度特征和有效注意力的病理图像分割方法
15
作者 王建宇 王朝立 +1 位作者 孙占全 刘晓虹 《小型微型计算机系统》 北大核心 2025年第6期1416-1426,共11页
病理图像分割作为病理学图像分析的一项重要任务,为医生对患者的病情进行诊断以及后续治疗方案的制定起到了至关重要的作用.然而,病理图像因其复杂的结构,例如血管、空洞、图像中病变区域与正常区域间边界模糊及对比差异小等问题,使得... 病理图像分割作为病理学图像分析的一项重要任务,为医生对患者的病情进行诊断以及后续治疗方案的制定起到了至关重要的作用.然而,病理图像因其复杂的结构,例如血管、空洞、图像中病变区域与正常区域间边界模糊及对比差异小等问题,使得现有模型分割效果不理想.因此,本文提出了一种基于多尺度特征和有效注意力的病理图像分割模型,其挑战性困难在于如何有效地利用空间和通道的相关性从病理图像中精确分割边界平滑的癌变组织.首先,该模型用金字塔视觉Transformer架构对输入图像提取包含丰富语义信息的多尺度特征,再用级联融合解码器对高层特征进行聚合,得到全局映射图指导后续解码过程.其次,在解码器部分,提出局部增强的反向注意力模块和联合注意力模块对级联解码器中的特征进行有效处理.最后,使用深度监督的方式对模型进行有效训练,并将提出的方法在3个病理图像数据集上与多个先进的分割模型进行对比实验.大量的定性以及定量结果显示,本文提出的方法比其他模型表现出更好的性能,可以对病理图像进行有效的分割. 展开更多
关键词 病理图像 语义分割 多尺度特征 注意力机制 TRANSFORMER
在线阅读 下载PDF
基于调制-全局推理的弱监督语义分割算法研究
16
作者 刘洲峰 李冰芮 +3 位作者 杨瑞敏 李春雷 何媛 丁淑敏 《计算机工程》 北大核心 2025年第2期344-355,共12页
基于图像级标签的弱监督语义分割方法可利用少量带有图像级标签的注释对网络进行训练,从而减轻注释负担。然而,现有基于类激活映射的方法存在分割区域不完整的问题。为使最终分割预测结果包含更多前景目标,提出一种基于调制-全局推理的... 基于图像级标签的弱监督语义分割方法可利用少量带有图像级标签的注释对网络进行训练,从而减轻注释负担。然而,现有基于类激活映射的方法存在分割区域不完整的问题。为使最终分割预测结果包含更多前景目标,提出一种基于调制-全局推理的弱监督语义分割方法。在分类网络中,首先设计空间-通道激活调制模块以提取更完整的目标对象特征,从而避免类激活图过度关注显著性区域;其次提出全局推理单元模块,利用该模块捕获特征图中不相交区域和较远区域之间的全局关系以便选出包含更完整的目标对象,从而进一步增强非显著区域的特征;最后通过设计潜在目标挖掘模块以降低伪标签中的假阴性率,进而提取其中的丢失信息,从而有效缓解初始伪标签中目标区域不完整的问题。在分割网络中,将分类网络生成的初始预测和伪标签相结合,并通过非显著区域挖掘模块进一步生成掩蔽伪标签从而提升分割效果。实验结果表明,该方法在仅使用图像级标签的情况下,在Pascal VOC 2012验证集和测试集上的精度分别为69.5%和69.8%,在MS COCO 2014验证集上的精度为32.8%,同时可有效解决分割区域不完整的问题,优于已有方法。 展开更多
关键词 语义分割 弱监督 非显著区域 激活调制 全局推理单元
在线阅读 下载PDF
基于YOLO v7和改进U-Net模型的鸡冠肉垂提取与面积计算方法
17
作者 杨断利 沈洪硕 +1 位作者 陈辉 高媛 《农业机械学报》 北大核心 2025年第4期415-426,共12页
传统人工测量方法在蛋鸡鸡冠肉垂面积测算中存在接触性应激风险、人畜共患病隐患及测量误差较大等问题。为此,本研究提出基于YOLO v7与改进U-Net的鸡冠肉垂自动分割与面积计算方法。构建两阶段检测框架:利用YOLO v7完成鸡头姿态筛选与RO... 传统人工测量方法在蛋鸡鸡冠肉垂面积测算中存在接触性应激风险、人畜共患病隐患及测量误差较大等问题。为此,本研究提出基于YOLO v7与改进U-Net的鸡冠肉垂自动分割与面积计算方法。构建两阶段检测框架:利用YOLO v7完成鸡头姿态筛选与ROI提取,有效消除非正视角图像干扰;提出融合Contextual Transformer的CoT-UNet模型:通过将CoT块融入U-Net编码器实现动态和静态上下文特征融合,结合本文构建的DyC-UP上采样模块(采用动态可调卷积核强化不规则边缘特征提取),显著提升不同鸡冠特征分割能力;建立像素-面积转换算法:基于标定系数实现从图像空间到物理空间的精准映射。实验结果表明,改进CoT-UNet相较基线模型,在鸡冠和肉垂分割任务中,IoU提升4.77、8.75个百分点,精确率提升5.31、5.06个百分点,分割质量改善显著。在面积计算精度方面,鸡冠面积绝对误差(0.62~3.50 cm^(2))和肉垂面积绝对误差(0.10~2.93 cm^(2))较传统手工测量(3.58~7.27 cm^(2))具有明显优势。多场景验证显示,在不同姿态(3类)、拍摄角度(2种)和距离(2种)条件下,鸡冠面积相对误差为2.41%~13.62%,肉垂面积相对误差为1.00%~29.21%。本研究实现了非接触式禽类生物特征精准测量,为智慧化种鸡选育提供了可靠的技术支持。 展开更多
关键词 鸡冠肉垂 深度学习 语义分割 育种 YOLO v7 CoT-UNet
在线阅读 下载PDF
基于语义分割的长白山火山岩性遥感数据集
18
作者 李成范 韩晶鑫 +5 位作者 盘晓东 刘岚 颜丽丽 康建红 刘学锋 肖舟怡 《岩石学报》 北大核心 2025年第4期1442-1453,共12页
火山岩性数据集是利用深度学习进行火山遥感岩性智能识别的关键和数据基础。当前,缺乏可信的火山岩性遥感数据集,制约了大区域、复杂地质环境下火山岩性智能识别的快速发展。本文在归纳和整合长白山火山岩性主要类型的基础上,以哨兵2(Se... 火山岩性数据集是利用深度学习进行火山遥感岩性智能识别的关键和数据基础。当前,缺乏可信的火山岩性遥感数据集,制约了大区域、复杂地质环境下火山岩性智能识别的快速发展。本文在归纳和整合长白山火山岩性主要类型的基础上,以哨兵2(Sentinel-2)遥感图像为数据源,结合地质资料和野外核查制作了一个基于深度学习语义分割的长白山火山岩性遥感数据集。该数据集内容包含遥感图像、标签数据、说明文件,岩性类型覆盖玄武质火山岩、粗面质火山岩、碱流质火山岩、火山岩性混合堆积(碎屑堆积、火山泥流堆积、火山空落堆积);共计36张样本图像,单张图像尺寸为395像元×395像元,空间分辨率为10m。利用经典的深度卷积神经网络(deep convolution neural network,DCNN)DeepLab V3+模型对火山岩性数据集进行了测试和验证,实验结果表明本文数据集具有较强的火山岩性描述能力,鲁棒性和泛化性较好,总体准确率均高于88%;特征训练与提取过程中人为干扰较少,自动化水平较高。可为火山岩性智能识别提供数据基础,提高野外火山遥感岩性调查的准确性和效率。 展开更多
关键词 长白山火山 语义分割 岩性数据集 岩性识别 遥感图像
在线阅读 下载PDF
基于特征融合的复杂场景树种跨域泛化分类模型
19
作者 陈广胜 温林郅 +3 位作者 张文均 李超 于鸣 景维鹏 《林业科学》 北大核心 2025年第4期33-45,共13页
【目的】针对不同区域因气候、土壤等生态因子差异导致的域偏移问题,提出一种基于全局-局部特征融合的单域泛化方法,提升复杂森林场景下无标签树种识别的泛化性能,为跨域树种分类研究提供理论依据和实践支持。【方法】选取德国巴登-符... 【目的】针对不同区域因气候、土壤等生态因子差异导致的域偏移问题,提出一种基于全局-局部特征融合的单域泛化方法,提升复杂森林场景下无标签树种识别的泛化性能,为跨域树种分类研究提供理论依据和实践支持。【方法】选取德国巴登-符腾堡州南部和中国黄山市祁门县西部为源域,德国图林根州中部和中国黄山市祁门县东部为目标域,构建一种全局-局部特征融合网络(HUFNet)模型进行树种分类,HUFNet模型包含基于CNN的编码器层、基于Transformer的解码器层、全局-局部特征融合机制(GLAFE)、特征精炼头(FRH)和边界优化模块(ERV)。模型经源域数据集训练后,在目标域上测试验证其泛化能力,实现复杂场景跨域树种分类。【结果】通过多个源域和目标域数据集的对比验证,HUFNet模型在目标域HainichUAV数据集上对针叶和阔叶树种的分类总体准确率(OA)为75.1%,平均交并比(mIoU)为58.3%,相比基于自注意力机制的分类架构分别提升13.7%与11.7%。在目标域HuangshanEast数据集上,HUFNet模型的OA为71.7%,mIoU为56.8%,相比ViT-R50作为编码器的混合架构,OA提升1.2%。【结论】HUFNet模型的跨域树种分类性能明显提升,不仅保持了高精度的识别能力,而且在目标域上展现出强大的跨域泛化能力,同时大幅降低了模型的时间复杂度和空间复杂度,适用于资源受限的环境。该模型基于全局-局部特征融合的单域泛化方法,为跨域树种分类提供了新的研究思路。 展开更多
关键词 遥感影像 树种分类 单域泛化 语义分割 轻量化模型
在线阅读 下载PDF
基于自注意力机制的高分遥感影像语义分割 被引量:1
20
作者 杨军 张金影 康玥 《哈尔滨工程大学学报》 北大核心 2025年第2期344-354,共11页
针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助... 针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助于捕获局部特征;在编码器分支中提出线性的多头自注意力模块以降低模型的计算复杂度;设计一个解码器来恢复特征图分辨率,通过级联操作整合各层级的特征并生成高分辨率的语义分割结果。所提算法在ISPRS Vaihingen和Potsdam数据集上的分割结果的mF1分别达到了90.77%和92.36%,与目前主流算法相比,不透水表面、建筑、低矮植物、树木类的分割准确率及总体分割准确率均有提高。本文算法构建的线性多头自注意力网络是一种高效的高分辨率遥感影像语义分割模型。 展开更多
关键词 高分辨率遥感影像 多头自注意力 深度可分离卷积 语义分割 特征提取 卷积神经网络 编码器 解码器
在线阅读 下载PDF
上一页 1 2 82 下一页 到第
使用帮助 返回顶部