期刊文献+
共找到1,709篇文章
< 1 2 86 >
每页显示 20 50 100
Semantic segmentation of camouflage objects via fusing reconstructed multispectral and RGB images
1
作者 Feng Huang Gonghan Yang +5 位作者 Jing Chen Yixuan Xu Jingze Su Guimin Huang Shu Wang Wenxi Liu 《Defence Technology(防务技术)》 2025年第8期324-337,共14页
Accurate segmentation of camouflage objects in aerial imagery is vital for improving the efficiency of UAV-based reconnaissance and rescue missions.However,camouflage object segmentation is increasingly challenging du... Accurate segmentation of camouflage objects in aerial imagery is vital for improving the efficiency of UAV-based reconnaissance and rescue missions.However,camouflage object segmentation is increasingly challenging due to advances in both camouflage materials and biological mimicry.Although multispectral-RGB based technology shows promise,conventional dual-aperture multispectral-RGB imaging systems are constrained by imprecise and time-consuming registration and fusion across different modalities,limiting their performance.Here,we propose the Reconstructed Multispectral-RGB Fusion Network(RMRF-Net),which reconstructs RGB images into multispectral ones,enabling efficient multimodal segmentation using only an RGB camera.Specifically,RMRF-Net employs a divergentsimilarity feature correction strategy to minimize reconstruction errors and includes an efficient boundary-aware decoder to enhance object contours.Notably,we establish the first real-world aerial multispectral-RGB semantic segmentation of camouflage objects dataset,including 11 object categories.Experimental results demonstrate that RMRF-Net outperforms existing methods,achieving 17.38 FPS on the NVIDIA Jetson AGX Orin,with only a 0.96%drop in mIoU compared to the RTX 3090,showing its practical applicability in multimodal remote sensing. 展开更多
关键词 Camouflage object detection Reconstructed multispectral image(MSI) Unmanned aerial vehicle(UAV) semantic segmentation Remote sensing
在线阅读 下载PDF
A semantic segmentation-based underwater acoustic image transmission framework for cooperative SLAM 被引量:1
2
作者 Jiaxu Li Guangyao Han +1 位作者 Shuai Chang Xiaomei Fu 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2024年第3期339-351,共13页
With the development of underwater sonar detection technology,simultaneous localization and mapping(SLAM)approach has attracted much attention in underwater navigation field in recent years.But the weak detection abil... With the development of underwater sonar detection technology,simultaneous localization and mapping(SLAM)approach has attracted much attention in underwater navigation field in recent years.But the weak detection ability of a single vehicle limits the SLAM performance in wide areas.Thereby,cooperative SLAM using multiple vehicles has become an important research direction.The key factor of cooperative SLAM is timely and efficient sonar image transmission among underwater vehicles.However,the limited bandwidth of underwater acoustic channels contradicts a large amount of sonar image data.It is essential to compress the images before transmission.Recently,deep neural networks have great value in image compression by virtue of the powerful learning ability of neural networks,but the existing sonar image compression methods based on neural network usually focus on the pixel-level information without the semantic-level information.In this paper,we propose a novel underwater acoustic transmission scheme called UAT-SSIC that includes semantic segmentation-based sonar image compression(SSIC)framework and the joint source-channel codec,to improve the accuracy of the semantic information of the reconstructed sonar image at the receiver.The SSIC framework consists of Auto-Encoder structure-based sonar image compression network,which is measured by a semantic segmentation network's residual.Considering that sonar images have the characteristics of blurred target edges,the semantic segmentation network used a special dilated convolution neural network(DiCNN)to enhance segmentation accuracy by expanding the range of receptive fields.The joint source-channel codec with unequal error protection is proposed that adjusts the power level of the transmitted data,which deal with sonar image transmission error caused by the serious underwater acoustic channel.Experiment results demonstrate that our method preserves more semantic information,with advantages over existing methods at the same compression ratio.It also improves the error tolerance and packet loss resistance of transmission. 展开更多
关键词 semantic segmentation Sonar image transmission Learning-based compression
在线阅读 下载PDF
End-to-end dilated convolution network for document image semantic segmentation 被引量:8
3
作者 XU Can-hui SHI Cao CHEN Yi-nong 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第6期1765-1774,共10页
Semantic segmentation is a crucial step for document understanding.In this paper,an NVIDIA Jetson Nano-based platform is applied for implementing semantic segmentation for teaching artificial intelligence concepts and... Semantic segmentation is a crucial step for document understanding.In this paper,an NVIDIA Jetson Nano-based platform is applied for implementing semantic segmentation for teaching artificial intelligence concepts and programming.To extract semantic structures from document images,we present an end-to-end dilated convolution network architecture.Dilated convolutions have well-known advantages for extracting multi-scale context information without losing spatial resolution.Our model utilizes dilated convolutions with residual network to represent the image features and predicting pixel labels.The convolution part works as feature extractor to obtain multidimensional and hierarchical image features.The consecutive deconvolution is used for producing full resolution segmentation prediction.The probability of each pixel decides its predefined semantic class label.To understand segmentation granularity,we compare performances at three different levels.From fine grained class to coarse class levels,the proposed dilated convolution network architecture is evaluated on three document datasets.The experimental results have shown that both semantic data distribution imbalance and network depth are import factors that influence the document’s semantic segmentation performances.The research is aimed at offering an education resource for teaching artificial intelligence concepts and techniques. 展开更多
关键词 semantic segmentation document images deep learning NVIDIA jetson nano
在线阅读 下载PDF
改进的U-Net卷积网络在遥感影像地物分类中的应用 被引量:1
4
作者 苟长龙 庞敏 杨扬 《测绘通报》 北大核心 2025年第3期150-155,共6页
地物分类在环境监测、资源管理和城市规划中具有重要作用,但光谱相似性、噪声干扰及自然与人造地物混杂等因素,使得分类过程面临各种挑战。为提高分类精度,并增强模型的稳健性,本文提出了一种基于U-Net卷积网络架构且结合Transformer自... 地物分类在环境监测、资源管理和城市规划中具有重要作用,但光谱相似性、噪声干扰及自然与人造地物混杂等因素,使得分类过程面临各种挑战。为提高分类精度,并增强模型的稳健性,本文提出了一种基于U-Net卷积网络架构且结合Transformer自注意力机制的深度学习网络。在兰州市遥感影像数据集上的试验表明,该模型在平均分类精度(mAcc)、平均交并比(mIoU)和平均F1分数(m F1)等指标上均优于PSPNet、DeeplabV3、Segformer和Swin-T模型。该模型不仅提高了分类精度,还实现了较高的推理速度,展现出在复杂地物场景中的应用潜力,为遥感影像分类提供了新思路。 展开更多
关键词 深度学习 地物分类 卷积神经网络 遥感影像 语义分割
在线阅读 下载PDF
基于YOLO v7和改进U-Net模型的鸡冠肉垂提取与面积计算方法
5
作者 杨断利 沈洪硕 +1 位作者 陈辉 高媛 《农业机械学报》 北大核心 2025年第4期415-426,共12页
传统人工测量方法在蛋鸡鸡冠肉垂面积测算中存在接触性应激风险、人畜共患病隐患及测量误差较大等问题。为此,本研究提出基于YOLO v7与改进U-Net的鸡冠肉垂自动分割与面积计算方法。构建两阶段检测框架:利用YOLO v7完成鸡头姿态筛选与RO... 传统人工测量方法在蛋鸡鸡冠肉垂面积测算中存在接触性应激风险、人畜共患病隐患及测量误差较大等问题。为此,本研究提出基于YOLO v7与改进U-Net的鸡冠肉垂自动分割与面积计算方法。构建两阶段检测框架:利用YOLO v7完成鸡头姿态筛选与ROI提取,有效消除非正视角图像干扰;提出融合Contextual Transformer的CoT-UNet模型:通过将CoT块融入U-Net编码器实现动态和静态上下文特征融合,结合本文构建的DyC-UP上采样模块(采用动态可调卷积核强化不规则边缘特征提取),显著提升不同鸡冠特征分割能力;建立像素-面积转换算法:基于标定系数实现从图像空间到物理空间的精准映射。实验结果表明,改进CoT-UNet相较基线模型,在鸡冠和肉垂分割任务中,IoU提升4.77、8.75个百分点,精确率提升5.31、5.06个百分点,分割质量改善显著。在面积计算精度方面,鸡冠面积绝对误差(0.62~3.50 cm^(2))和肉垂面积绝对误差(0.10~2.93 cm^(2))较传统手工测量(3.58~7.27 cm^(2))具有明显优势。多场景验证显示,在不同姿态(3类)、拍摄角度(2种)和距离(2种)条件下,鸡冠面积相对误差为2.41%~13.62%,肉垂面积相对误差为1.00%~29.21%。本研究实现了非接触式禽类生物特征精准测量,为智慧化种鸡选育提供了可靠的技术支持。 展开更多
关键词 鸡冠肉垂 深度学习 语义分割 育种 YOLO v7 CoT-UNet
在线阅读 下载PDF
改进U-Net模型的隧道掌子面图像语义分割研究
6
作者 陈登峰 程静 +1 位作者 赵蕾 何拓航 《防灾减灾工程学报》 北大核心 2025年第4期776-783,共8页
隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征... 隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征传递到高层的跳跃连接导致特征映射过大。因此,提出加入空洞空间卷积池化金字塔模块ASPP和卷积注意力模块CBAM的改进U-Net模型。在U-Net模型的跳跃连接过程中加ASPP,利用不同膨胀率的空洞卷积捕获不同尺度的上下文信息,融合不同感受野的信息,从而更全面的理解图像内容;U-Net模型的下采样过程中加入CBAM,使网络模型更加关注有用的特征,从而增强特征的表达能力。实验结果表明,改进的网络模型相较于原始U-Net模型分割和识别性能有显著提升,在某隧道工程掌子面岩体图像数据集上Precision达到93.04%,mIoU达到74.98%,mPA达到78.89%。 展开更多
关键词 隧道掌子面 图像语义分割 卷积注意力模块 空洞空间卷积池化金字塔模块
在线阅读 下载PDF
基于多尺度注意力U-Net的医学肝脏计算机断层扫描图片分割算法 被引量:3
7
作者 金涛 王震 李昭蒂 《哈尔滨工程大学学报》 北大核心 2025年第3期529-539,共11页
针对传统肝脏分割方法十分依赖医生的经验,并且分割过程耗时,易出错的现象,本文提出适用于临床情景中医学肝脏计算机断层扫描的分割方法。基于多尺度残差混合注意力U-Net将多尺度注意力机制模块引入U-Net网络。该模块可以抑制不相关的区... 针对传统肝脏分割方法十分依赖医生的经验,并且分割过程耗时,易出错的现象,本文提出适用于临床情景中医学肝脏计算机断层扫描的分割方法。基于多尺度残差混合注意力U-Net将多尺度注意力机制模块引入U-Net网络。该模块可以抑制不相关的区域,从多个角度提取图像特征,并突出显示分割任务;在标准卷积层中添加残差结构可以有效地避免梯度爆炸并增加网络深度;使用混合空洞注意力常规层来替换“U”形网络的底部,以获得上下文信息,避免空间信息的丢失。试验结果表明:在LiTS17和SLiver07数据集上与其他方法相比,本文方法具有更好的性能和最高的分割精度。 展开更多
关键词 神经网络 深度学习 语义分割 肝脏分割 医学图像 注意力机制 空洞卷积
在线阅读 下载PDF
改进U-net的电气设备紫外图像放电光斑分割 被引量:1
8
作者 申万科 李罗璟懿 +4 位作者 方春华 江全才 陆杰炜 夏星宇 彭万钊 《红外技术》 北大核心 2025年第6期770-778,共9页
提出了一种名为VA-Unet的语义分割模型,旨在解决传统分割方法在电气设备紫外检测任务中面临的复杂背景及小光斑分离困难、特征选取复杂、分割精准度低等问题。VA-Unet引入了VGG16特征提取模块和迁移学习,提高训练速度并增强模型泛化能力... 提出了一种名为VA-Unet的语义分割模型,旨在解决传统分割方法在电气设备紫外检测任务中面临的复杂背景及小光斑分离困难、特征选取复杂、分割精准度低等问题。VA-Unet引入了VGG16特征提取模块和迁移学习,提高训练速度并增强模型泛化能力;同时,增加了注意力门(Attention Gate)以提高模型精度,从而实现对紫外图像放电光斑的精准分割。此外,VA-Unet采用混合损失函数代替单一损失函数,解决了紫外放电光斑数据集样本不平衡的问题。实验表明,VA-Unet模型在紫外图像放电光斑的精准定位和准确分割方面表现突出,其IoU,PA,F1-score评价指标分别达到84.09%,88.20%,91.35%,相较于初始U-net网络,分别提升了14.41%,3.24%,9.22%。 展开更多
关键词 紫外检测 语义分割 u-net 迁移学习 注意力机制
在线阅读 下载PDF
基于U-Net和数学形态学的混凝土桥梁病害定量识别方法研究 被引量:4
9
作者 黄彩萍 田旺源 李青 《桥梁建设》 北大核心 2025年第1期64-71,共8页
为使桥梁病害检测更加高效、客观和智能,提出一种自动识别并定量计算混凝土病害尺寸的方法。该方法采用视觉几何组网络(Visual Geometry Group Network,VGG)作为U形网络(U-Net)的主干网络,对混凝土病害(剥落、裂缝和露筋)图像进行语义分... 为使桥梁病害检测更加高效、客观和智能,提出一种自动识别并定量计算混凝土病害尺寸的方法。该方法采用视觉几何组网络(Visual Geometry Group Network,VGG)作为U形网络(U-Net)的主干网络,对混凝土病害(剥落、裂缝和露筋)图像进行语义分割,采用数学形态学算法对图像中的病害区域进行优化。通过MATLAB软件计算得到优化后的分割图像中病害区域像素点的数量,并利用参照物标定出图像中单个像素点的尺寸,计算得到混凝土病害的面积(或长度)。采用该方法对河南省许昌市17座现役钢筋混凝土桥梁病害图像进行语义分割实验。结果表明:U-Net能以较高的精度对复杂背景下混凝土桥梁多类病害进行像素级的分类,类别平均像素准确率为90.53%,平均交并比为80.54%。使用数学形态学对语义分割图像进行优化后,计算精度明显提高,优化后的误差绝对值为0.08%~0.21%。 展开更多
关键词 混凝土桥梁 u-net 数学形态学 语义分割 定量计算 病害识别
在线阅读 下载PDF
基于正则化U-net分割模型的脑胶质瘤精准密度估计方法
10
作者 夏瑞晨 叶臣 +3 位作者 赵来定 刘凯 潘敏鸿 姚佳烽 《生物化学与生物物理进展》 北大核心 2025年第11期2869-2883,共15页
目的在基于病理切片的脑胶质瘤临床诊断中,细胞核密度估计是最关键的任务之一。脑胶质瘤密度估计通常高度依赖细胞核的分割效果,而细胞核的形态多样性与染色差异性易导致语义分割模型的过拟合,最终带来密度估计误差而影响临床决策。鉴于... 目的在基于病理切片的脑胶质瘤临床诊断中,细胞核密度估计是最关键的任务之一。脑胶质瘤密度估计通常高度依赖细胞核的分割效果,而细胞核的形态多样性与染色差异性易导致语义分割模型的过拟合,最终带来密度估计误差而影响临床决策。鉴于此,本研究提出U-net+DropBlock分割模型驱动的细胞核密度估计方法,通过提升模型的泛化性以降低过拟合风险,获得精确的细胞核密度估计。方法首先,对脑胶质瘤的全切片图像(whole slice image,WSI)进行预处理,包括数据清洗、数据增强、颜色正则化、金标准确立等。然后,利用脑胶质瘤全切片的补丁图像,构建引入DropBlock正则化模块的U-net领域分割模型,称为U-net+DropBlock模型。特别是,DropBlock模块通过随机丢弃特征图中的区域信息,能够削弱特征间的过度空间相关性,以降低分割模型的过拟合风险。最后,对各补丁图像中的细胞核分割结果进行密度计算与可视化,以形成全切片范围的密度热力图。结果与最先进的细胞核领域分割模型相比,本文采用的U-net+DropBlock模型可获得更优的分割性能,确保提出的密度估计方法的准确性。结论本文提出的全域化细胞核密度估计方法,可助力脑胶质瘤临床诊疗的精准化和高效化发展。 展开更多
关键词 脑胶质瘤 细胞核分割 细胞核密度估计 u-net语义分割 DropBlock正则化
在线阅读 下载PDF
基于改进U-net的低对比度涂层表面裂纹形态视觉检测
11
作者 陈少华 张世达 +2 位作者 任姣姣 顾健 李丽娟 《红外与激光工程》 北大核心 2025年第7期77-91,共15页
多孔隙材料表面的黑色高辐射涂层在实际使用过程中,由于热应力作用表面产生微米级尺度的微裂纹,为方便后续开展热应力作用下裂纹缺陷演变扩展规律,开展了低对比度涂层表面裂纹形态视觉检测技术研究。提出了融合光学优化与深度学习的检... 多孔隙材料表面的黑色高辐射涂层在实际使用过程中,由于热应力作用表面产生微米级尺度的微裂纹,为方便后续开展热应力作用下裂纹缺陷演变扩展规律,开展了低对比度涂层表面裂纹形态视觉检测技术研究。提出了融合光学优化与深度学习的检测方法,通过设计光源激励单目视觉系统,首先从系统设计方面优化照明方式与入射角度参数以增强采集裂纹图像局部对比度,其次提出一种适应低对比度图像裂纹对比度增强的算法。进而构建改进U-Net网络,通过嵌入注意力模块、深度超参数化卷积及激活函数,提升低对比度裂纹特征提取能力。实验结果显示,在高照明方式入射光30°时所采集图像局部对比度最高,预处理后图像对比度从10.507提高到42.662,有效降低了图像低对比度时背景噪声对裂纹信息的影响,并且更能突出裂纹的形态特征。在改进网络对裂纹分割性能指标上Dice系数、SSIM指标和准确率Acc分别达到0.862、0.892、0.901,对宽度大于9.6μm裂纹检测率达90%以上,裂纹形态及走向清晰可辨。 展开更多
关键词 图像处理 裂纹提取 u-net 语义分割
在线阅读 下载PDF
基于改进U-Net的高分辨率正射影像图田间可行驶道路提取方法
12
作者 金智文 王宁 +4 位作者 肖坚星 王天海 仇瑞承 李寒 张漫 《农业机械学报》 北大核心 2025年第2期155-163,共9页
田间可行驶道路边界信息获取是制作农田高精度地图的基础。针对现有方法对高分辨率正射影像图中田间可行驶道路分割不准确、出现漏检误检等问题,本文提出了一种基于改进U-Net的深度学习网络模型。该方法首先将主干网络更换为ResNet50,... 田间可行驶道路边界信息获取是制作农田高精度地图的基础。针对现有方法对高分辨率正射影像图中田间可行驶道路分割不准确、出现漏检误检等问题,本文提出了一种基于改进U-Net的深度学习网络模型。该方法首先将主干网络更换为ResNet50,增强对田间可行驶道路特征提取能力;其次,融合可以提高管状结构精度的DSConv模块提高对田间可行驶道路的精度,并抑制与田间道路类似的田间地物背景的特征提取;最后,通过插入ECA-Net注意力机制来获取完整的上下文信息,优化田间可行驶道路的特征还原过程,从而达到提高模型整体分割精度的目的。在此基础上,通过传统图像处理方法对分割结果进一步地去噪、消孔,从而获取高精度的田间可行驶道路边界信息。试验结果表明,改进U-Net模型在所构建数据集的测试集上MIoU、MPA分别达91.12%、95.46%,与其他对比模型相比具有最高的评价指标值,使用传统图像处理方法后处理后,MIoU和MPA为92.64%和96.75%,分别提高1.52、1.29个百分点;在对高分辨率正射影像图田间可行驶道路的识别测试中,MIoU和MPA分别达86.39%和90.01%,可以明显地识别田间可行驶道路;使用传统图像处理方法后对获得的高分辨率正射影像图结果进行优化后,MIoU和MPA分别为88.34%、91.53%,分别提高1.95、1.52个百分点。该研究可以为后续制作农田高精度地图提供准确的田间可行驶道路边界信息。 展开更多
关键词 田间道路提取 语义分割 无人机 正射影像图 深度学习
在线阅读 下载PDF
基于U-Net的工件轮廓提取方法的研究
13
作者 郭凯旋 王吉芳 +1 位作者 刘相权 王凯 《组合机床与自动化加工技术》 北大核心 2025年第4期8-12,共5页
工件轮廓提取是实现工件识别和定位的重要前提,为解决传统机器视觉算法对复杂环境中的工件轮廓提取不完整、易受干扰的问题,提出了一种改进U-Net的工件轮廓分割模型,将VGG16网络应用于解码器部分,增加网络特征提取能力;将ECA注意力机制... 工件轮廓提取是实现工件识别和定位的重要前提,为解决传统机器视觉算法对复杂环境中的工件轮廓提取不完整、易受干扰的问题,提出了一种改进U-Net的工件轮廓分割模型,将VGG16网络应用于解码器部分,增加网络特征提取能力;将ECA注意力机制引入每个跳跃连接层中,提高了工件轮廓特征在模型中的权重;在编码器末端引入ASPP空洞空间卷积池化金字塔模块,以获取高层特征图中不同尺度的特征信息,进而提高目标的分割精度。试验结果表明,EVA-UNet模型在交并比、召回率、精准率和综合性能F1分数4个方面表现良好,对工件轮廓提取能力优于其他经典模型,能够为实现复杂环境下工件轮廓提取提供良好的解决方案。 展开更多
关键词 注意力机制模块 轮廓提取 语义分割 工件轮廓
在线阅读 下载PDF
基于改进U-Net3+的相控阵超声图像语义分割
14
作者 毛鑫玥 王慧锋 +2 位作者 周家乐 顾震 颜秉勇 《华东理工大学学报(自然科学版)》 北大核心 2025年第2期242-249,共8页
超声相控阵成像已广泛应用于聚乙烯燃气管道的焊接缺陷检测中,随着机器视觉技术的快速发展,利用机器辅助或自动化分析超声图像能极大地提高缺陷检测速度,减少人为判断失误的发生。在基于超声图像的焊接缺陷检测技术中,图像语义分割精度... 超声相控阵成像已广泛应用于聚乙烯燃气管道的焊接缺陷检测中,随着机器视觉技术的快速发展,利用机器辅助或自动化分析超声图像能极大地提高缺陷检测速度,减少人为判断失误的发生。在基于超声图像的焊接缺陷检测技术中,图像语义分割精度对缺陷类别和严重等级的判定至关重要。本文在U-Net3+网络的基础上提出一种融入残差及注意力机制的改进模型,并应用于电熔焊接缺陷检测的相控阵超声图像语义分割。首先,改进模型通过在编码器各层之间采用残差结构来提升编码器的图像特征提取能力;其次,通过在跳跃连接中引入卷积块注意力模块(Convolutional Block Attention Module,CBAM),加强模型对原始图像信息的利用率,使模型更易聚焦于原始图像中的有效区域。实验结果表明,改进后的模型在电熔焊接超声图像上具有良好的分割效果,在Dice、mIoU两项指标上,相比U-Net分别提升了8.81%和12.84%;相比U-Net3+的分割效果分别提升了1.09%和1.81%。 展开更多
关键词 相控阵超声图像 图像语义分割 u-net3+ 注意力机制 残差网络
在线阅读 下载PDF
基于U-Net网络与卡尔曼滤波的瞳孔检测跟踪算法 被引量:1
15
作者 张国静 王桂祥 《现代电子技术》 北大核心 2025年第9期137-142,共6页
眼动跟踪是人机交互(HCI)及其应用的重要技术之一,越来越受到人们的重视。然而,在实际情况下往往受到大量非高斯噪声的影响,如不可控的光照、人眼的遮挡及连续的人眼移动等,这会导致瞳孔检测实时性和准确性的下降。因此,文中设计了一种... 眼动跟踪是人机交互(HCI)及其应用的重要技术之一,越来越受到人们的重视。然而,在实际情况下往往受到大量非高斯噪声的影响,如不可控的光照、人眼的遮挡及连续的人眼移动等,这会导致瞳孔检测实时性和准确性的下降。因此,文中设计了一种基于U-Net语义分割网络的瞳孔检测方法。首先,利用该方法对瞳孔区域进行分割;然后对分割的瞳孔区域处理,确定其质心位置,达到瞳孔中心定位的目的;最后,又提出了一种改进的卡尔曼滤波器的稳态增益,通过在卡尔曼增益上引入分数阶反馈环路来实现,并利用改进的卡尔曼滤波器对瞳孔位置进行跟踪,消除非高斯噪声,可以大大提高瞳孔在线稳定检测的准确性。实验结果表明,所提方法能够实时跟踪人眼,具有较高的精确度和鲁棒性,且最佳均方根误差(RMSE)可达到0.78。 展开更多
关键词 眼动跟踪 人机交互 非高斯噪声 u-net网络 语义分割 瞳孔检测 分数阶 卡尔曼滤波
在线阅读 下载PDF
基于改进U-Net模型的露天矿钻孔裂隙识别研究
16
作者 宋纹瑶 张梅 +3 位作者 郭连军 邓丁 高崇 赵鑫 《矿冶工程》 北大核心 2025年第4期47-51,57,共6页
为提高钻孔图像裂隙识别精度,提出了一种露天矿钻孔裂隙识别方法,利用智能钻孔摄像技术获取露天矿钻孔图像,并运用随机裁剪和图像翻转进行数据增广,同时采用中值滤波降噪和图像灰度化,去除噪点及减少计算量。在U-Net模型中利用空间注意... 为提高钻孔图像裂隙识别精度,提出了一种露天矿钻孔裂隙识别方法,利用智能钻孔摄像技术获取露天矿钻孔图像,并运用随机裁剪和图像翻转进行数据增广,同时采用中值滤波降噪和图像灰度化,去除噪点及减少计算量。在U-Net模型中利用空间注意力和通道注意力机制改进钻孔裂隙语义分割模型,形成AU-Net模型,以强化图像全局和局部信息的特征提取能力。实验结果表明:AU-Net模型相较于U-Net模型在钻孔图像裂隙识别数据集上可以取得更低的损失、更高的精度,均交并比提高了4.38百分点,达到82.34%,图像分割效果更好。 展开更多
关键词 钻孔成像 裂隙识别 u-net网络 注意力机制 裂隙提取 机器学习 语义分割 图像识别
在线阅读 下载PDF
改进U-Net的多尺度特征融合遥感图像语义分割网络
17
作者 姜文文 夏英 《计算机科学》 北大核心 2025年第5期212-219,共8页
遥感图像的空间分辨率高,不同类型对象的尺度差异大、类别不平衡,是精准语义分割任务所面临的主要挑战。为了提高遥感图像语义分割的准确性,提出了一种改进U-Net的多尺度特征融合遥感图像语义分割网络(Multi-scale Feature Fusion Netwo... 遥感图像的空间分辨率高,不同类型对象的尺度差异大、类别不平衡,是精准语义分割任务所面临的主要挑战。为了提高遥感图像语义分割的准确性,提出了一种改进U-Net的多尺度特征融合遥感图像语义分割网络(Multi-scale Feature Fusion Network,MFFNet)。该网络以U-Net网络为基础,包含动态特征融合模块和门控注意力卷积混合模块。其中,动态特征融合模块代替跳跃连接,改进上采样层和下采样层的特征融合方式,避免特征融合导致信息丢失,同时提高浅层特征和深层特征的融合效果;门控注意力卷积混合模块通过整合自注意力、卷积和门控机制,更好地捕获局部和全局信息。在Potsdam和Vaihingen数据集上开展对比实验和消融实验,结果表明MFFNet在两个数据集上的mIoU分别达到76.95%和72.93%,有效提高了遥感图像的语义分割精度。 展开更多
关键词 语义分割 遥感图像 注意力机制 特征融合 门控机制
在线阅读 下载PDF
改进U-Net的芯片粘接区空洞缺陷检测模型
18
作者 雷佳蕊 于春和 +2 位作者 文弋 刘岗岗 夏自金 《半导体技术》 北大核心 2025年第8期843-850,共8页
为解决传统方法在陶瓷封装芯片粘接区缺陷检测中特征表达能力不足以及现有深度学习模型对微小缺陷敏感度低的问题,提出了一种基于U型网络架构(U-Net)的改进型VSCMU-Net语义分割模型。该模型以视觉几何组(VGG)网络为骨干,融合空间和通道... 为解决传统方法在陶瓷封装芯片粘接区缺陷检测中特征表达能力不足以及现有深度学习模型对微小缺陷敏感度低的问题,提出了一种基于U型网络架构(U-Net)的改进型VSCMU-Net语义分割模型。该模型以视觉几何组(VGG)网络为骨干,融合空间和通道压缩与激励(SCSE)注意力机制与多阶门控聚合(MOGA)模块,可有效提取缺陷的深层特征,实现了对微小缺陷的精准分割。实验中采用VSCMU-Net模型对粘接区域及空洞进行分割,结果表明,VSCMU-Net模型在键合区域和空隙分割方面表现出色。该模型平均交并比(mIoU)达92.21%,平均精确度均值(mAP)达95.86%,总体准确率(Accuracy)达99.11%,平均F1分数(mF1-score)达95.79%,均优于传统U-Net、DeepLabv3+、PSPNet和YOLOv8-seg模型,为半导体封装领域关键电子组件的品质保障提供了有力的技术支持。 展开更多
关键词 空洞 语义分割 缺陷检测 深度学习 空间和通道压缩与激励(SCSE)注意力机制
在线阅读 下载PDF
基于改进U-net的少样本煤岩界面图像分割方法 被引量:4
19
作者 卢才武 宋义良 +3 位作者 江松 章赛 王懋 纪凡 《金属矿山》 CAS 北大核心 2024年第1期149-157,共9页
煤岩图像语义分割技术是煤岩界面识别的重要研究方向,现有的语义分割模型通常依赖于大样本数据集进行训练,然而目前已标注的煤岩图像数据样本难以获取,并且缺乏公开数据集。针对以上问题,提出了一种基于改进U-net模型的样本煤岩界面图... 煤岩图像语义分割技术是煤岩界面识别的重要研究方向,现有的语义分割模型通常依赖于大样本数据集进行训练,然而目前已标注的煤岩图像数据样本难以获取,并且缺乏公开数据集。针对以上问题,提出了一种基于改进U-net模型的样本煤岩界面图像分割模型。将裁剪后具有更强特征提取能力且结构上更为简单的VGG16替换U-net的原始骨干特征提取网络,提升对图像信息的特征提取能力并获得更快的训练速度,在U-net网络的跳跃连接和解码器上采样部分引入注意力机制模块,对提取的特征层进行处理,提升模型对煤岩界面图像关键特征的提取能力,提高分割精度。使用迁移学习方法对改进的模型进行预训练,提高模型泛化能力同时避免过拟合,使模型更适用于小样本数据集训练。通过使用自制的煤岩界面数据集对所改进的网络模型性能进行验证,并将该模型与经典Unet、DeepLabv3+、PspNet、HrNet网络模型进行了对比。试验结果表明:在同样使用由125幅煤岩界面图片构建的小样本数据集进行训练的情况下,所提改进模型相较于经典U-net模型在分割精确度和检测效率方面都有显著提升,模型精确度提高了1.84%,平均交并比提高了5.34%,类别平均像素准确率提高了0.48%,检测速度增幅为5.3%。同时,与其他网络模型相比,所提改进模型在小样本煤岩界面图像的语义分割中优势显著,表明所提改进思路的有效性。 展开更多
关键词 煤岩识别 语义分割 少样本学习 u-net 深度学习 机器视觉技术
在线阅读 下载PDF
改进U-Net的无人机航拍路面破损检测方法 被引量:1
20
作者 韩建峰 张静 +1 位作者 宋丽丽 陶永昭 《电子测量技术》 北大核心 2024年第19期137-145,共9页
为了探究无人机航拍视角下细小裂缝难以检测和检测出现断裂的问题,基于U-Net架构提出了ASE-Net网络。首先,使用改进的VGG-16作为编码器,以便提取破损的特征信息;其次在最小尺度网络层引入多尺度特征融合(MSFF)模块、通道增强条形池化(CE... 为了探究无人机航拍视角下细小裂缝难以检测和检测出现断裂的问题,基于U-Net架构提出了ASE-Net网络。首先,使用改进的VGG-16作为编码器,以便提取破损的特征信息;其次在最小尺度网络层引入多尺度特征融合(MSFF)模块、通道增强条形池化(CESP)模块;最后在解码阶段添加ECA_X注意力模块。实验结果表明,本文模型在自建的无人机航拍路面破损数据集上的mIoU、mPA、mPrecision分别达到0.8209、0.9302、0.8651,相比于基线U-Net分别提高15.97%、12.72%、11.02%。最后,在开源数据集Crack500中验证了本文模型相比于其他主流模型具有更强的性能和泛化能力。模型能实现对路面细小裂缝、坑槽、修补的准确检测,有效解决了裂缝检测的断裂问题,可提升大尺寸航拍图像路面破损检测效果。 展开更多
关键词 无人机 破损检测 语义分割 条形池化 多尺度特征 u-net
在线阅读 下载PDF
上一页 1 2 86 下一页 到第
使用帮助 返回顶部