期刊文献+
共找到1,682篇文章
< 1 2 85 >
每页显示 20 50 100
Semantic segmentation of camouflage objects via fusing reconstructed multispectral and RGB images
1
作者 Feng Huang Gonghan Yang +5 位作者 Jing Chen Yixuan Xu Jingze Su Guimin Huang Shu Wang Wenxi Liu 《Defence Technology(防务技术)》 2025年第8期324-337,共14页
Accurate segmentation of camouflage objects in aerial imagery is vital for improving the efficiency of UAV-based reconnaissance and rescue missions.However,camouflage object segmentation is increasingly challenging du... Accurate segmentation of camouflage objects in aerial imagery is vital for improving the efficiency of UAV-based reconnaissance and rescue missions.However,camouflage object segmentation is increasingly challenging due to advances in both camouflage materials and biological mimicry.Although multispectral-RGB based technology shows promise,conventional dual-aperture multispectral-RGB imaging systems are constrained by imprecise and time-consuming registration and fusion across different modalities,limiting their performance.Here,we propose the Reconstructed Multispectral-RGB Fusion Network(RMRF-Net),which reconstructs RGB images into multispectral ones,enabling efficient multimodal segmentation using only an RGB camera.Specifically,RMRF-Net employs a divergentsimilarity feature correction strategy to minimize reconstruction errors and includes an efficient boundary-aware decoder to enhance object contours.Notably,we establish the first real-world aerial multispectral-RGB semantic segmentation of camouflage objects dataset,including 11 object categories.Experimental results demonstrate that RMRF-Net outperforms existing methods,achieving 17.38 FPS on the NVIDIA Jetson AGX Orin,with only a 0.96%drop in mIoU compared to the RTX 3090,showing its practical applicability in multimodal remote sensing. 展开更多
关键词 Camouflage object detection Reconstructed multispectral image(MSI) Unmanned aerial vehicle(UAV) semantic segmentation Remote sensing
在线阅读 下载PDF
A semantic segmentation-based underwater acoustic image transmission framework for cooperative SLAM
2
作者 Jiaxu Li Guangyao Han +1 位作者 Shuai Chang Xiaomei Fu 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2024年第3期339-351,共13页
With the development of underwater sonar detection technology,simultaneous localization and mapping(SLAM)approach has attracted much attention in underwater navigation field in recent years.But the weak detection abil... With the development of underwater sonar detection technology,simultaneous localization and mapping(SLAM)approach has attracted much attention in underwater navigation field in recent years.But the weak detection ability of a single vehicle limits the SLAM performance in wide areas.Thereby,cooperative SLAM using multiple vehicles has become an important research direction.The key factor of cooperative SLAM is timely and efficient sonar image transmission among underwater vehicles.However,the limited bandwidth of underwater acoustic channels contradicts a large amount of sonar image data.It is essential to compress the images before transmission.Recently,deep neural networks have great value in image compression by virtue of the powerful learning ability of neural networks,but the existing sonar image compression methods based on neural network usually focus on the pixel-level information without the semantic-level information.In this paper,we propose a novel underwater acoustic transmission scheme called UAT-SSIC that includes semantic segmentation-based sonar image compression(SSIC)framework and the joint source-channel codec,to improve the accuracy of the semantic information of the reconstructed sonar image at the receiver.The SSIC framework consists of Auto-Encoder structure-based sonar image compression network,which is measured by a semantic segmentation network's residual.Considering that sonar images have the characteristics of blurred target edges,the semantic segmentation network used a special dilated convolution neural network(DiCNN)to enhance segmentation accuracy by expanding the range of receptive fields.The joint source-channel codec with unequal error protection is proposed that adjusts the power level of the transmitted data,which deal with sonar image transmission error caused by the serious underwater acoustic channel.Experiment results demonstrate that our method preserves more semantic information,with advantages over existing methods at the same compression ratio.It also improves the error tolerance and packet loss resistance of transmission. 展开更多
关键词 semantic segmentation Sonar image transmission Learning-based compression
在线阅读 下载PDF
End-to-end dilated convolution network for document image semantic segmentation 被引量:8
3
作者 XU Can-hui SHI Cao CHEN Yi-nong 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第6期1765-1774,共10页
Semantic segmentation is a crucial step for document understanding.In this paper,an NVIDIA Jetson Nano-based platform is applied for implementing semantic segmentation for teaching artificial intelligence concepts and... Semantic segmentation is a crucial step for document understanding.In this paper,an NVIDIA Jetson Nano-based platform is applied for implementing semantic segmentation for teaching artificial intelligence concepts and programming.To extract semantic structures from document images,we present an end-to-end dilated convolution network architecture.Dilated convolutions have well-known advantages for extracting multi-scale context information without losing spatial resolution.Our model utilizes dilated convolutions with residual network to represent the image features and predicting pixel labels.The convolution part works as feature extractor to obtain multidimensional and hierarchical image features.The consecutive deconvolution is used for producing full resolution segmentation prediction.The probability of each pixel decides its predefined semantic class label.To understand segmentation granularity,we compare performances at three different levels.From fine grained class to coarse class levels,the proposed dilated convolution network architecture is evaluated on three document datasets.The experimental results have shown that both semantic data distribution imbalance and network depth are import factors that influence the document’s semantic segmentation performances.The research is aimed at offering an education resource for teaching artificial intelligence concepts and techniques. 展开更多
关键词 semantic segmentation document images deep learning NVIDIA jetson nano
在线阅读 下载PDF
激光三维点云在岩性语义分割中的应用综述 被引量:2
4
作者 邵燕林 刘浪 +4 位作者 曾齐红 胡忠贵 魏薇 邓帆 王庆 《科学技术与工程》 北大核心 2025年第4期1313-1324,共12页
激光三维扫描技术可快速获取扫描目标表面的点云数据,包括用于描述目标几何特征的空间点坐标和刻画目标材质反射率信息的激光反射强度。将激光三维点云的自动语义分割技术应用于地质勘探研究中,能为区域地质特征描绘奠定基础。为了展示... 激光三维扫描技术可快速获取扫描目标表面的点云数据,包括用于描述目标几何特征的空间点坐标和刻画目标材质反射率信息的激光反射强度。将激光三维点云的自动语义分割技术应用于地质勘探研究中,能为区域地质特征描绘奠定基础。为了展示激光三维扫描技术在地质场景大规模语义分割领域的最新进展,首先对摄影测量和激光雷达两种三维点云获取方式进行了比较,得到激光雷达在精度、泛用性、不易受光照条件影响等方面具有优势。通过阐述岩性语义分割的原理,将近年来基于几何特征或强度特征的岩性点云分割方法进行了全面的归纳和总结;介绍了常用大规模点云数据集和评价指标,并比较不同算法分割性能;最后总结了现有方法的局限性,并指出岩性语义分割任务未来研究方向进行展望。 展开更多
关键词 三维激光雷达 数字模型 点云语义分割 岩性分类
在线阅读 下载PDF
面向遥感图像道路提取的多尺度上下文感知网络 被引量:1
5
作者 李智杰 惠爱婷 +3 位作者 李昌华 董玮 张颉 介军 《光学精密工程》 北大核心 2025年第4期610-623,共14页
针对深度神经网络在遥感图像道路提取中面临的局部特征丢失和提取精度低的问题,本文基于SwinUnet网络提出了一种面向遥感图像道路提取的多尺度上下文感知网络。首先,在编码器中设计了一个具有上下文聚合模块的分支,以增强上下文信息提取... 针对深度神经网络在遥感图像道路提取中面临的局部特征丢失和提取精度低的问题,本文基于SwinUnet网络提出了一种面向遥感图像道路提取的多尺度上下文感知网络。首先,在编码器中设计了一个具有上下文聚合模块的分支,以增强上下文信息提取,并缓解因遮挡引起的语义模糊问题。其次,为了解决编解码器之间语义信息不匹配的问题并提高模型的空间信息提取能力,在跳跃连接中引入了空间特征提取模块,取代了SwinUnet中直接复制编码器特征的方法。最后,在下采样阶段设计了一个特征收缩模块,以减少编码器中信息丢失并增强网络的分割能力。在Massachusetts道路数据集上进行测试结果显示,该方法在F1,IoU,Pr和Re指标上分别达到了80.91%,69.40%,78.03%和65.20%。与主流方法UNet和SwinUnet相比,IoU分别提高了4.45%和2.72%,证明了所提算法通过全局建模、上下文增强和信息匹配优化,有效提升了遥感图像道路提取的精度和性能。 展开更多
关键词 遥感图像 道路提取 语义分割 SwinUnet
在线阅读 下载PDF
特征级语义感知引导的多模态图像融合算法 被引量:1
6
作者 张梅 金叶 +1 位作者 朱金辉 贺霖 《电子与信息学报》 北大核心 2025年第8期2909-2918,共10页
在自动驾驶领域,红外和可见光的融合图像因其能够提供显著目标和丰富的纹理细节而备受关注。然而现有的大部分融合算法单方面关注融合图像的视觉质量和评价指标,而忽略了高级视觉任务的需求。另外,虽然一些融合方法尝试结合高级视觉任务... 在自动驾驶领域,红外和可见光的融合图像因其能够提供显著目标和丰富的纹理细节而备受关注。然而现有的大部分融合算法单方面关注融合图像的视觉质量和评价指标,而忽略了高级视觉任务的需求。另外,虽然一些融合方法尝试结合高级视觉任务,但是其效果受限于语义先验和融合任务之间的交互不足且没有考虑到不同特征差异性的影响。因此,该文提出了特征级语义感知引导的多模态图像融合算法,使语义先验知识与融合任务进行充分交互,提高融合结果在后续的分割任务中的性能。对于语义特征和融合图像特征两者的差异性,提出了双特征交互模块,以实现不同特征的充分交互和选择。对于红外和可见光两种不同模态特征的差异性,提出了多源空间注意力融合模块,以实现不同模态信息的有效集成和互补。该文在3个公共数据集上进行了实验,结果表明该方法的融合结果优于其他方法且泛化能力较好,而且在各种融合算法联合分割任务的性能比较实验中也表明了该方法在分割任务中的优越性。 展开更多
关键词 图像融合 联合分割任务 语义感知 特征级引导
在线阅读 下载PDF
基于改进DeepLabv3+的马铃薯幼苗与杂草识别方法 被引量:2
7
作者 祝诗平 林曦 +2 位作者 冯川 周杰 李博鑫 《农业工程学报》 北大核心 2025年第10期147-156,共10页
针对自然环境下农作物与杂草相互交织,杂草种类繁多,难以准确识别等问题,该研究以马铃薯幼苗及其伴生杂草为研究对象,提出了一种改进DeepLabv3+模型的杂草识别方法。首先以DeepLabv3+语义分割模型为基准,将其主干网络替换为MobileNetV2... 针对自然环境下农作物与杂草相互交织,杂草种类繁多,难以准确识别等问题,该研究以马铃薯幼苗及其伴生杂草为研究对象,提出了一种改进DeepLabv3+模型的杂草识别方法。首先以DeepLabv3+语义分割模型为基准,将其主干网络替换为MobileNetV2,构成轻量化DeepLabv3+模型,随后为了提升模型的非线性能力,提出了一种基于注意力机制的激活函数(attention activate function,AAF),并将其融入到AAF-Conv卷积里,取代轻量化DeepLabv3+语义分割模型中主干网络MobileNetV2的第一个3×3Conv,建立AAF-DeepLabv3+模型。使用AAF-DeepLabv3+模型获取马铃薯幼苗的形态边界,采用图像学的方法识别图像中杂草区域。在轻量化DeepLabv3+模型基础上,AAF激活函数与常见激活函数进行对比试验,平均交并比(mean intersection over Union,mIoU)分别比ReLU6、SiLU、CeLU提升了1.58、1.31、1.99个百分点,平均像素识别准确率(mean pixel accuracy,mPA)分别提升了1.47、0.6、1.26个百分点,表现出良好的性能。AAF-DeepLabv3+模型在消融试验和与其他常见语义分割模型对比中,表现出了显著的性能优势,mIoU和m PA分别为90.82%和95.56%,比原始DeepLabv3+模型提升了1.07和1.15个百分点,帧率为69.21帧/s,比原始模型提高了30.77帧/s,模型大小为22.56 MB,比原始模型降低了185.96 MB。结果表明在同一试验环境下,该模型整体性能优于UNet、PSPNet、HrNet、DeepLabv3、FCN等主流的语义分割网络模型。该杂草识别方法不仅降低了前期图片标注工作量,还有效地解决了杂草与农作物目标交叠且杂草种类繁多带来的识别难题,为移动端设备进行农田杂草识别及研制智能化除草装置提供了技术参考。 展开更多
关键词 马铃薯幼苗 杂草识别 语义分割 激活函数 AAF-DeepLabv3+
在线阅读 下载PDF
基于CNN和Transformer交叉教学的半监督医学图像分割 被引量:4
8
作者 杨云 胡雯青 +1 位作者 杨虹 吴亚男 《陕西科技大学学报》 北大核心 2025年第1期185-192,共8页
由于医学图像分割领域缺乏高质量的标注数据,半监督学习方法在医学图像语义分割任务中受到高度重视.为了充分利用卷积神经网络(Convolutional Neural Network,CNN)和Transformer在半监督学习中的优势,本文提出一种基于CNN与Transformer... 由于医学图像分割领域缺乏高质量的标注数据,半监督学习方法在医学图像语义分割任务中受到高度重视.为了充分利用卷积神经网络(Convolutional Neural Network,CNN)和Transformer在半监督学习中的优势,本文提出一种基于CNN与Transformer交叉教学的半监督医学图像分割方法.该方法将经典的深度协同训练从一致性正则化简化为交叉教学,利用循环伪标签方案使两个网络的预测差异转换为无监督损失,以鼓励两个网络具有一致的低熵预测.所提方法在ISIC 2018数据集上进行实验,在采用20%的标注比例时,Dice系数和Jaccard系数分别达到87.25%和79.17%,相比于监督U-Net++的训练结果分别提升了2.89%和3.53%,并且优于目前主流的半监督学习方法,验证了所提方法在半监督医学图像分割上的有效性和泛化性. 展开更多
关键词 半监督学习 图像语义分割 交叉教学 循环伪标签
在线阅读 下载PDF
跨模态多层特征融合的遥感影像语义分割 被引量:1
9
作者 李智杰 程鑫 +3 位作者 李昌华 高元 薛靖裕 介军 《计算机科学与探索》 北大核心 2025年第4期989-1000,共12页
多模态语义分割网络能够利用不同模态中的互补信息来提高分割精度,在地物分类领域具有广泛的应用潜力。然而,现有的多模态遥感影像语义分割模型大多忽略了深度特征的几何形状信息,未将多层特征充分利用就进行融合,导致跨模态特征提取不... 多模态语义分割网络能够利用不同模态中的互补信息来提高分割精度,在地物分类领域具有广泛的应用潜力。然而,现有的多模态遥感影像语义分割模型大多忽略了深度特征的几何形状信息,未将多层特征充分利用就进行融合,导致跨模态特征提取不充分,融合效果不理想。针对这些问题,提出了一种基于多模态特征提取和多层特征融合的遥感影像语义分割模型。通过构建双分支编码器,模型能够分别提取遥感影像的光谱信息和归一化数字表面模型(nDSM)的高程信息,并深入挖掘nDSM的几何形状信息。引入跨层丰富模块细化完善每层特征,从深层到浅层充分利用多层的特征信息。完善后的特征通过注意力特征融合模块,对特征进行差异性互补和交叉融合,以减轻分支结构之间的差异,充分发挥多模态特征的优势,从而提高遥感影像分割精度。在ISPRS Vaihingen和Potsdam数据集上进行实验,mF1分数分别达到了90.88%和93.41%,平均交互比(mIoU)分别达到了83.49%和87.85%,相较于当前主流算法,该算法实现了更准确的遥感影像语义分割。 展开更多
关键词 遥感影像 归一化数字表面模型(nDSM) 语义分割 特征提取 特征融合
在线阅读 下载PDF
融合动态特征增强的遥感建筑物分割 被引量:1
10
作者 肖振久 田昊 +1 位作者 张杰浩 曲海成 《光电工程》 北大核心 2025年第3期12-24,共13页
针对遥感地物建筑物图像目标尺度差异大、样本空间分布不均衡、地物边界模糊、场景区域跨度大所导致的分割效果不佳问题,本文提出一种融合动态特征增强高精度遥感建筑物分割算法。首先,构建New_GhostNetV2网络,利用自适应上下文感知卷积... 针对遥感地物建筑物图像目标尺度差异大、样本空间分布不均衡、地物边界模糊、场景区域跨度大所导致的分割效果不佳问题,本文提出一种融合动态特征增强高精度遥感建筑物分割算法。首先,构建New_GhostNetV2网络,利用自适应上下文感知卷积,增强算法对样本空间特征的捕捉能力。其次,采用Ghost Convolution结合跳跃连接和特征分支策略设计多层级信息增强模块,增强特征整合。随后引入级联注意力CGA(cascaded group attention),通过组内独立注意力计算,加强模型对多样化地物形态的适应性。最后,通过动态深度特征增强器构造特征融合模块,进一步加强模型捕获能力。在WHU数据集上实验结果表明:改进算法较基线模型F1-Score提高8.57%,mIoU提高12.48%,与其他主流语义分割模型相比,改进DeepLabv3+具有更好的分割精度。 展开更多
关键词 遥感图像 语义分割 特征增强 信息整合
在线阅读 下载PDF
基于双路径监督的遥感图像语义分割网络 被引量:1
11
作者 刘春娟 乔泽 +3 位作者 闫浩文 吴小所 王嘉伟 辛钰强 《北京航空航天大学学报》 北大核心 2025年第3期732-741,共10页
为解决遥感图像语义分割任务中目标物体边界分类模糊的问题,提出双路径监督与注意力筛选网络。引入可监督的边界提取模块来增加边界信息通道,提高边界信息在语义分割中的权重,增强对目标物体边界像素的注意力;引入注意力筛选模块,通过... 为解决遥感图像语义分割任务中目标物体边界分类模糊的问题,提出双路径监督与注意力筛选网络。引入可监督的边界提取模块来增加边界信息通道,提高边界信息在语义分割中的权重,增强对目标物体边界像素的注意力;引入注意力筛选模块,通过注意力图筛选出浅层网络中的空间细节信息和深层网络中的抽象语义信息,舍弃网络中的冗余信息,防止过拟合。双路径监督与注意力筛选网络在Potsdam数据集和Jiage数据集上的平均交并比分别为85.44%和86.07%,比次优网络MagNet和SAPNet分别提升了1.24%和1.28%、1.54%和1.27%。实验结果表明,所提网络能更精准地分割目标物体的边界。 展开更多
关键词 遥感图像 语义分割 可监督 边界信息 注意力筛选
在线阅读 下载PDF
结合注意力特征融合的路面裂缝检测 被引量:2
12
作者 谢永华 厉涛 柏勇 《计算机工程与设计》 北大核心 2025年第1期307-313,共7页
为解决路面裂缝检测中裂缝漏检和定位不准的问题,提出一个结合注意力特征融合的可端到端训练的路面裂缝检测网络。基于Resnet-50结构设计,在特征融合部分添加注意力特征融合模块,通过注意力掩码学习,动态调整浅层特征与深层特征融合权重... 为解决路面裂缝检测中裂缝漏检和定位不准的问题,提出一个结合注意力特征融合的可端到端训练的路面裂缝检测网络。基于Resnet-50结构设计,在特征融合部分添加注意力特征融合模块,通过注意力掩码学习,动态调整浅层特征与深层特征融合权重,突出有用信息,解决裂缝漏检问题;在编码器部分,改进浅层特征与深层特征的选取方式,提升特征融合效果和检测精度。实验结果表明,该网络在各项指标上均优于其它对比网络,具有较高的检测精度。 展开更多
关键词 裂缝检测 深度学习 语义分割 卷积网络 注意力机制 特征融合 特征提取
在线阅读 下载PDF
基于样本迭代优化策略的密集连接多尺度土地覆盖语义分割 被引量:1
13
作者 郑宗生 高萌 +3 位作者 周文睆 王政翰 霍志俊 张月维 《自然资源遥感》 北大核心 2025年第2期11-18,共8页
针对分割结果小尺度地物遗漏、连续地物缺乏完整性问题,提出密集连接多尺度语义分割模型(densely connected multi-scale semantic segmentation network, DMS-Net),实现土地覆盖分割。通过多尺度密集连接空洞空间卷积金字塔池化(multi-... 针对分割结果小尺度地物遗漏、连续地物缺乏完整性问题,提出密集连接多尺度语义分割模型(densely connected multi-scale semantic segmentation network, DMS-Net),实现土地覆盖分割。通过多尺度密集连接空洞空间卷积金字塔池化(multi-scale dense connected atrous spatial convolution pyramid pooling module, MDCA)和条形池化(spatial pyramid pooling, SP)提取多尺度和空间连续性地物;利用特征增强双注意力并联模块(position paralleling channel attention module, PPCA)衡量特征权重,实现高效表达;采用浅层特征级联模块(cascade low-level feature fusion, CLFF)捕捉被忽略的浅层特征,进一步补充细节。实验结果表明:DMS-Net模型在迭代扩充数据集上的总体精度(overall accuracy, OA)达到89.97%,平均交并比(mean intersection over union, mIoU)达到75.59%,高于传统机器学习方法及U-Net, PSPNet, Deeplabv3+等深度学习模型。分割结果显示,地物结构完整且边缘分割明晰,在实现多尺度的土地覆盖遥感信息提取分析中具有较好的实用价值。 展开更多
关键词 深度学习 全卷积神经网络 多尺度 语义分割 土地覆盖
在线阅读 下载PDF
用于铁路场景语义分割的改进动态图卷积神经网络 被引量:1
14
作者 王卫东 刘延 +3 位作者 邱实 刘贤华 魏晓 王劲 《计算机辅助设计与图形学学报》 北大核心 2025年第1期139-147,共9页
针对目前在铁路场景语义分割中存在的数据获取成本高、分割精度低、泛化能力差等问题,提出了一种基于改进动态图卷积神经网络的铁路场景语义分割方法.首先利用高分辨率的无人机采集铁路场景的多视角图像,并通过结构运动恢复与基于面片... 针对目前在铁路场景语义分割中存在的数据获取成本高、分割精度低、泛化能力差等问题,提出了一种基于改进动态图卷积神经网络的铁路场景语义分割方法.首先利用高分辨率的无人机采集铁路场景的多视角图像,并通过结构运动恢复与基于面片的多视角立体视觉算法生成铁路场景的三维点云;然后在动态图卷积神经网络中引入空间注意力模块,增强网络结构的分割精度与泛化性;最后通过改进后的图卷积神经网络对预处理后的铁路场景点云完成高精度的语义分割.实验阶段采用的铁路场景包括桥梁段、路基段与联络线,共计11个区域.以平均交并比为评价指标,与动态图卷积神经网络、PointNet++进行对比,研究结果表明,基于图像点云训练的改进动态图卷积神经网络对于铁路场景语义分割具有更高的精度,与动态图卷积神经网络、PointNet++相比,分割精度分别提高3.3个百分点与6.0个百分点,且具有更好的泛化能力. 展开更多
关键词 铁道工程 点云语义分割 无人机点云 卷积神经网络
在线阅读 下载PDF
徽州村落空间景观特征要素对游客场所依恋感知的影响 被引量:1
15
作者 严敏 陈晨 张泉 《中国城市林业》 2025年第1期46-54,共9页
[目的]探讨徽州传统村落的视觉环境与其游客场所依恋情感之间的相互作用关系。[方法]以徽州传统村落屏山村为例,以问卷调查为基础,探究场所依恋的分布特征;通过图像语义分割技术筛选屏山村落视觉环境中的景观要素,最终通过构建多元线性... [目的]探讨徽州传统村落的视觉环境与其游客场所依恋情感之间的相互作用关系。[方法]以徽州传统村落屏山村为例,以问卷调查为基础,探究场所依恋的分布特征;通过图像语义分割技术筛选屏山村落视觉环境中的景观要素,最终通过构建多元线性回归方程探究水街空间、街巷空间和历史文化空间3种类型空间中场所依恋与视觉景观评估指标之间的联系。[结果]在水街空间中,色彩丰富度和建筑街道整洁度对游客依恋感知影响有着决定性作用;在街巷空间中,植物空间丰富度、色彩丰富度与徽派元素丰富度对游客依恋感知程度影响最大;在历史文化空间中,则是色彩丰富度、建筑街道整洁度、围合度、徽派元素丰富度发挥关键作用。[结论]游客对3种类型空间依恋感知存在差异,且不同空间类型中,对游客依恋感知影响的景观要素也各不相同。未来应强化屏山村的地域传统色彩特征、增加村落“过渡空间”的视觉景观层次、强化徽派建筑风格为核心的村落特色,从而加深游客对村落的场所依恋情感。 展开更多
关键词 场所依恋 景观要素 语义分割 徽州传统村落
在线阅读 下载PDF
改进的U-Net卷积网络在遥感影像地物分类中的应用 被引量:1
16
作者 苟长龙 庞敏 杨扬 《测绘通报》 北大核心 2025年第3期150-155,共6页
地物分类在环境监测、资源管理和城市规划中具有重要作用,但光谱相似性、噪声干扰及自然与人造地物混杂等因素,使得分类过程面临各种挑战。为提高分类精度,并增强模型的稳健性,本文提出了一种基于U-Net卷积网络架构且结合Transformer自... 地物分类在环境监测、资源管理和城市规划中具有重要作用,但光谱相似性、噪声干扰及自然与人造地物混杂等因素,使得分类过程面临各种挑战。为提高分类精度,并增强模型的稳健性,本文提出了一种基于U-Net卷积网络架构且结合Transformer自注意力机制的深度学习网络。在兰州市遥感影像数据集上的试验表明,该模型在平均分类精度(mAcc)、平均交并比(mIoU)和平均F1分数(m F1)等指标上均优于PSPNet、DeeplabV3、Segformer和Swin-T模型。该模型不仅提高了分类精度,还实现了较高的推理速度,展现出在复杂地物场景中的应用潜力,为遥感影像分类提供了新思路。 展开更多
关键词 深度学习 地物分类 卷积神经网络 遥感影像 语义分割
在线阅读 下载PDF
基于改进DeepLabv3+的安全帽佩戴分割算法
17
作者 邵晓艳 董文永 +2 位作者 赵雪专 李玲玲 薄树奎 《西南大学学报(自然科学版)》 北大核心 2025年第7期185-195,共11页
针对物流园区空间跨度大、作业设备繁多导致安全帽佩戴检测分割难度增加的问题,提出一种基于改进DeepLabv3+的安全帽佩戴分割算法。该算法采用ResNet-101膨胀残差网络进行特征提取;在编码阶段引入卷积注意力机制融合模块,有效增强特征... 针对物流园区空间跨度大、作业设备繁多导致安全帽佩戴检测分割难度增加的问题,提出一种基于改进DeepLabv3+的安全帽佩戴分割算法。该算法采用ResNet-101膨胀残差网络进行特征提取;在编码阶段引入卷积注意力机制融合模块,有效增强特征区域表征能力;在特征提取阶段引入图像特征网格化模块,将低分辨率图像进行平均切分,有助于获得局部图像的小目标特征。将该算法在SHWD(Safety Helmet Wearing Detect)数据集中训练测试,结果表明:算法的像素准确率达到89.23%,相比DeepLabv3+提升了2.21个百分点,有效提高了复杂场景下物流园区安全帽佩戴分割精度。 展开更多
关键词 神经网络 注意力机制 膨胀卷积 语义分割
在线阅读 下载PDF
基于动态场景的实时语义SLAM算法
18
作者 符强 钟振 +1 位作者 纪元法 任风华 《测绘通报》 北大核心 2025年第4期27-33,共7页
针对传统视觉SLAM(simultaneous localization and mapping)在动态环境下定位精度较低、稳健性较差、结合深度学习后实时性较差及无法构建稠密地图的问题,本文提出了一种基于ORB-SLAM3的改进算法。首先,采用轻量化SegFormer语义分割网络... 针对传统视觉SLAM(simultaneous localization and mapping)在动态环境下定位精度较低、稳健性较差、结合深度学习后实时性较差及无法构建稠密地图的问题,本文提出了一种基于ORB-SLAM3的改进算法。首先,采用轻量化SegFormer语义分割网络,对图像中存在的动态物体进行识别后,添加掩膜图像自适应膨胀方法,根据特征点数自动调整掩膜膨胀范围,更有效地保留静态特征点及去除潜在动态特征点;然后,改进词袋模型,提升算法的加载和匹配速度;最后,添加稠密建图线程,根据掩膜信息和关键帧,构建去除动态特征后的稠密点云地图。试验结果表明,该算法在动态场景下能够有效地剔除动态物体特征点,提高了系统的定位精度和稳健性,平均处理速度为20帧/s,基本满足实时运行的要求。 展开更多
关键词 视觉SLAM ORB-SLAM3 语义分割 稠密建图
在线阅读 下载PDF
光影智绘:基于SAM的视频阴影鲁棒抽取
19
作者 陈东 李昌隆 +2 位作者 杜振龙 宋爽 李晓丽 《图学学报》 北大核心 2025年第4期739-745,共7页
针对传统方法对于光照变化和物体遮挡引起复杂的、动态变化阴影处理易致阴影检测的准确率和鲁棒性较低问题,提出了一种基于分割万物模型(SAM)的视频阴影检测方法,对SAM解码器进行微调,使其更适合阴影检测;利用SAM提取关键帧阴影区域,引... 针对传统方法对于光照变化和物体遮挡引起复杂的、动态变化阴影处理易致阴影检测的准确率和鲁棒性较低问题,提出了一种基于分割万物模型(SAM)的视频阴影检测方法,对SAM解码器进行微调,使其更适合阴影检测;利用SAM提取关键帧阴影区域,引入XMem模型,结合感觉记忆、短时记忆和长时记忆联合前后帧信息,给出优化和稳定视频阴影检测结果。实验结果表明:在ViSha数据集的阴影实验结果与传统方法相比,该方法的均值绝对误差降低了约31.8%,交并比提升了约19.7%;定性和定量结果表明本方法不仅提升了视频阴影处理的准确率,并表现出较好的鲁棒性。 展开更多
关键词 阴影检测 语义分割 视频对象分割 SAM XMem
在线阅读 下载PDF
基于深度学习对接环识别的自主抓捕验证评估
20
作者 许哲 王捷 +1 位作者 魏鹏飞 张亚航 《航天器工程》 北大核心 2025年第3期42-47,共6页
星箭对接环是连接卫星和运载火箭的关键部件,准确识别对接环将有助于卫星捕获效果的验证评估。文章提出了一个用于星箭对接环分割的轻量级神经网络,可以用于星箭对接环的实时识别,同时有利于进一步部署和应用。实现了一种并行分解卷积,... 星箭对接环是连接卫星和运载火箭的关键部件,准确识别对接环将有助于卫星捕获效果的验证评估。文章提出了一个用于星箭对接环分割的轻量级神经网络,可以用于星箭对接环的实时识别,同时有利于进一步部署和应用。实现了一种并行分解卷积,可以有效捕获不同层次的特征信息,同时模型的参数和计算量也进一步减少,加快推理速度。设计了一种基于注意力机制的特征融合模块,通过增加少量参数和计算量,可以有效地融合不同层次的特征。在建立的星箭对接环数据集上实现了95.63%的平均交并比(mIoU),同时模型的参数和计算量只有0.36 M浮点运算次数(FLOPs)和8.10 G浮点运算次数(FLOPs),其推理速度和精度取得了较好的平衡。 展开更多
关键词 深度学习 语义分割 自主抓捕 验证 评估
在线阅读 下载PDF
上一页 1 2 85 下一页 到第
使用帮助 返回顶部