期刊文献+
共找到1,999篇文章
< 1 2 100 >
每页显示 20 50 100
SAM及其改进模型在图像分割中的应用综述
1
作者 马依拉木·木斯得克 高雨欣 +3 位作者 张思拓 冯珂 阿布都克力木·阿布力孜 哈里旦木·阿布都克里木 《计算机工程》 北大核心 2025年第8期16-38,共23页
随着通用人工智能技术的快速发展,基础模型在多个领域的应用日益受到广泛关注。在图像分割领域,分割一切模型(SAM)作为一种核心基础模型,在提升图像理解和处理效率方面展现出了显著优势。尽管SAM在图像分割任务中表现出色,但在功耗、计... 随着通用人工智能技术的快速发展,基础模型在多个领域的应用日益受到广泛关注。在图像分割领域,分割一切模型(SAM)作为一种核心基础模型,在提升图像理解和处理效率方面展现出了显著优势。尽管SAM在图像分割任务中表现出色,但在功耗、计算效率以及在不同应用场景中的适应性等方面,仍然存在一定的优化空间。为此,从多个维度对SAM的改进方向进行了深入探索,包括提升速度与计算效率、增强模型的精度与鲁棒性、提高模型的适应性与通用性、优化提示工程设计,以及提升数据利用效率与强化迁移学习能力等方面。通过这些改进,SAM不仅能够在更复杂的任务中保持高效性能,还能更好地适应各领域和应用场景的需求。在此基础上,总结SAM在医学、遥感、机械等领域中的实际应用,展示了其在不同场景下的适用性与挑战。此外,详细介绍了图像分割领域常用的数据集和评价指标,通过实验对比分析,进一步评估了视觉Transformer(ViT)变体对SAM性能的影响,以及EfficientSAM、EfficientViT-SAM、MobileSAM和RobustSAM等改进模型的性能表现。最后,总结了SAM及其改进模型在实际应用中面临的挑战,并展望了未来的发展方向,旨在帮助科研工作者更全面地了解SAM及其变体的改进与应用,为新模型的提出提供启发。 展开更多
关键词 分割一切模型 视觉基础模型 改进模型 图像分割 通用模型
在线阅读 下载PDF
融合邻域注意力和状态空间模型的医学视频分割算法
2
作者 丁建睿 张听 +1 位作者 刘家栋 宁春平 《电子与信息学报》 北大核心 2025年第5期1582-1595,共14页
在医学影像分析领域,精准分割视频中的病灶对于疾病的早期诊断和治疗至关重要。该文创新性地提出一种融合邻域注意力机制与状态空间模型的算法,旨在全面而精细地捕捉医学视频中的时空特征,从而对视频中的病灶进行准确分割。该算法通过... 在医学影像分析领域,精准分割视频中的病灶对于疾病的早期诊断和治疗至关重要。该文创新性地提出一种融合邻域注意力机制与状态空间模型的算法,旨在全面而精细地捕捉医学视频中的时空特征,从而对视频中的病灶进行准确分割。该算法通过两阶段的精心设计,显著提升了分割性能:第1阶段,通过深度卷积网络捕获低层次的空间语义信息,并借助邻域注意力机制,挖掘相邻帧间的局部时序语义关联。第2阶段,引入状态空间模型来捕捉全面的时序信息,并再次应用邻域注意力模块,进一步增强对局部时序特征的敏感度。该方法不仅有效整合了视频中丰富的时序信息,而且在局部和全局层面上实现了空间与时间特征的协同优化。相较于使用具有2次计算复杂度的自注意力机制,该文采用了具有线性计算复杂度的状态空间模型,显著提升了模型的训练效率和推理速度。所提算法在甲状腺超声视频数据集以及结肠息肉视频数据集CVC-ClinicDB和CVC-ColonDB上的交并比(IOU)指标分别达到了72.7%,82.3%和72.5%,相比该文的基线模型Vivim分别提高了5.7%,1.7%和5.5%。此外,消融实验进一步揭示了邻域注意力模块和状态空间模型在提取时序信息中发挥的关键作用。 展开更多
关键词 医学视频分割 邻域注意力机制 状态空间模型
在线阅读 下载PDF
基于改进U-Net的煤矸图像分割模型与放煤控制技术
3
作者 袁永 秦正寒 +3 位作者 夏永琪 武让 李立宝 李勇 《煤炭学报》 北大核心 2025年第5期2722-2738,共17页
煤矸识别技术是综放工作面实现智能化的关键技术之一,同时也是该领域面临的一个重要挑战。针对目前煤矸图像数据集整体质量差、数据规模小、煤矸图像分割模型检测速度慢、识别精度低等问题,参考实际综放工作面搭建了大尺寸等比例综放开... 煤矸识别技术是综放工作面实现智能化的关键技术之一,同时也是该领域面临的一个重要挑战。针对目前煤矸图像数据集整体质量差、数据规模小、煤矸图像分割模型检测速度慢、识别精度低等问题,参考实际综放工作面搭建了大尺寸等比例综放开采相似模拟平台,基于该平台建立了煤矸图像采集系统,采集构建了高清仿真综放工作面煤矸图像数据集,提出一种基于特征金字塔网络(FPN)和空洞空间金字塔池化(ASPP)的改进U-Net煤矸分割模型,提高了煤矸图像的分割精度。通过在U-Net模型的跳跃连接中添加FPN模块,同时在解码器部分引入ASPP模块,建立了FPN-ASPP-U-Net煤矸分割模型,消融试验验证了FPN模块和ASPP模块对U-Net模型性能的提升。结果表明:FPN-ASPP-U-Net模型分割效果最好,均准确率(M_(A))为97.29%,均F1得分(M_(F1))为97.44%,均交并比(M_(I))为95.65%,模型参数量(M_(P))为29.64 M,浮点运算量(F)为341.29 G,每秒帧数(f)为41.1 f/s,与U-Net模型相比,M_(I)、M_(F1)和M_(A)分别提升了2.64%、1.06%和1.15%,模型参数量仅仅增加了0.33 M,改进后的模型在图像分割速度上有少量提升。设计了FPN-ASPP-U-Net模型与PSPNet、SegFormer、DeepLabV3+、PSANet语义分割模型的图像分割效果对比试验,结果表明:FPN-ASPP-U-Net模型对煤矸图像分割的性能最好,同时模型整体计算参数量最小,在分割精度和分割速度之间有着较好的平衡。对于粉尘影响下的不清晰图像,采用暗通道与高斯加权相结合的方法对图像数据集进行去雾增强,轻度粉尘、中度粉尘、重度粉尘去雾前后的模型对煤的分割精度提高了14.81%、17.79%、23.62%,对矸的分割精度提高了11.73%、14.50%、14.86%。基于研究结论提出了FPN-ASPP-U-Net模型的煤矸图像混矸率计算方法,开展了煤矸图像分割控制放煤试验,以混矸率20%作为放煤口关闭的阈值,单次放煤口开关期间真实混矸率与模型预测混矸率平均误差率为4.71%,验证了基于煤矸图像混矸率对放煤控制的可行性。最后,封装模型代码研发了煤矸图像智能识别软件,设计了煤矸分割现场应用方案,在榆树田煤矿110501综放工作面进行了图像控制放煤试验,验证了该方法能够对煤矸图像进行精准分割,对放煤口开关进行合理控制,提高了综放工作面的智能化水平,为推动煤矿进一步智能化建设提供了有效的技术手段与参考价值。 展开更多
关键词 放顶煤 煤矸识别 图像分割 混矸率 U-Net模型
在线阅读 下载PDF
视觉大模型SAM在医学图像分割中的应用综述 被引量:7
4
作者 孙兴 蔡肖红 +2 位作者 李明 张帅 马金刚 《计算机工程与应用》 CSCD 北大核心 2024年第17期1-16,共16页
随着大模型技术的不断发展,以分割一切模型(segment anything model,SAM)为代表的视觉大模型在图像分割领域取得重要突破。SAM通过提示驱动完成一系列下游分割任务,旨在统一解决所有的图像分割问题。因此,将SAM应用于医学图像分割具有... 随着大模型技术的不断发展,以分割一切模型(segment anything model,SAM)为代表的视觉大模型在图像分割领域取得重要突破。SAM通过提示驱动完成一系列下游分割任务,旨在统一解决所有的图像分割问题。因此,将SAM应用于医学图像分割具有重要意义,其泛化性能够适应多种医学图像,为医生提供更全面的解剖结构和病变信息。介绍了图像分割常用的数据集;对SAM的网络结构和泛化性进行细致阐述;重点对SAM应用在全切片成像、磁共振成像、计算机断层扫描、超声和多模态图像的五大类医学图像进行梳理分析,总结优缺点和相应的改进方法;结合当前医学图像分割领域中存在的实际问题,讨论并展望了SAM未来的发展方向。 展开更多
关键词 视觉大模型 分割一切模型(sam) 医学图像 图像分割
在线阅读 下载PDF
基于边缘融合的果园贴叠葡萄簇图像分割模型
5
作者 宁政通 李健 +4 位作者 李海东 朱良宽 赵文 王扬威 郭艳玲 《农业工程学报》 北大核心 2025年第6期165-172,共8页
针对果园环境下贴叠葡萄簇的轮廓不规则且纹理颜色相似,导致葡萄采摘机器人难以依靠视觉模型准确分割簇中每串葡萄的问题,该研究提出了一种基于边缘融合的贴叠葡萄簇分割模型(overlapping grape clusters segmentation model,OGCSM)。... 针对果园环境下贴叠葡萄簇的轮廓不规则且纹理颜色相似,导致葡萄采摘机器人难以依靠视觉模型准确分割簇中每串葡萄的问题,该研究提出了一种基于边缘融合的贴叠葡萄簇分割模型(overlapping grape clusters segmentation model,OGCSM)。首先通过搭建由多尺度卷积Inception、相似性注意力(similarity attention module,SimAM)、卷积块注意力(convolutional block attention module,CBAM)改进的编码-解码器作为主干网络,捕获具有边缘层次的贴叠葡萄簇特征图;然后采用深度监督方式引导由掩码头与边缘头构成的融合网络对特征图进行卷积与反卷积,生成贴叠葡萄簇掩码图及簇中每串葡萄边缘图;最后去除冗余特征后融合掩码图与边缘图,实现对贴叠葡萄簇的分割。试验结果表明,208串左右、前后、上下贴叠葡萄簇的分割交并比(intersection over union,IoU)平均值达92.77%,不同天气光照条件下的分割精确率平均值达98.13%,单幅图像的平均分割耗时为0.379 s。与现有方法相比,OGCSM模型可更准确地划分贴叠葡萄簇中每串葡萄的分割区域,该研究为葡萄采摘机器人提供了一种分割贴叠葡萄簇的视觉模型。 展开更多
关键词 机器人 图像分割 贴叠葡萄 边缘 采摘 融合 模型
在线阅读 下载PDF
基于预训练SAM的提示式三维牙齿分割方法
6
作者 刘复昌 蔡煜晨 +1 位作者 缪永伟 范然 《浙江大学学报(理学版)》 北大核心 2025年第1期59-69,共11页
目前,大多研究采用有监督学习方法在牙齿的三维数据上训练网络,完成分割任务,但在处理缺牙、严重错位或颌部不完整的牙齿时效果不佳,泛化能力较弱。为此,提出了一种基于预训练分割一切模型(segment anything model,SAM)和提示分割技术... 目前,大多研究采用有监督学习方法在牙齿的三维数据上训练网络,完成分割任务,但在处理缺牙、严重错位或颌部不完整的牙齿时效果不佳,泛化能力较弱。为此,提出了一种基于预训练分割一切模型(segment anything model,SAM)和提示分割技术的方法。首先,在2022年国际医学图像计算和计算机辅助干预会议(MICCAI 2022)的三维牙齿公开数据集上微调模型。然后,将三维牙齿模型投影至多个二维视图,利用SAM网络进行图像分割。再将每个像素的标签映射回原始的三维三角形面片,完成三维牙齿分割。在该数据集中,测试了900个较理想的三维上下牙数据,取得了与主流技术相当的结果。对于缺牙、牙齿错位以及上下颚不完整的复杂情况,本文方法表现出显著优于现有技术的效果,展示了更强的泛化能力和稳定性。 展开更多
关键词 口腔正畸 三维牙齿分割 sam 图像分割
在线阅读 下载PDF
基于伪标签去噪和SAM优化的大规模无监督语义分割
7
作者 杨维静 徐瑞 +3 位作者 顾浩文 陈涛 舒祥波 姚亚洲 《电子学报》 北大核心 2025年第3期716-727,共12页
语义分割技术能够对复杂、多元的场景实现细粒度理解,是促进无人系统高效、智能工作的关键技术之一.大规模无监督语义分割旨在从大规模未标记图像中学习语义分割能力.然而,现有方法由于自学习伪标签存在类别混淆和形状表示欠佳的问题,... 语义分割技术能够对复杂、多元的场景实现细粒度理解,是促进无人系统高效、智能工作的关键技术之一.大规模无监督语义分割旨在从大规模未标记图像中学习语义分割能力.然而,现有方法由于自学习伪标签存在类别混淆和形状表示欠佳的问题,导致最终分割精度较低.为此,本文提出一种伪标签去噪和SAM优化(Pseudo-label Denoising and SAM Optimization,PDSO)方法以解决大规模无监督语义分割问题.本文设计了一种基于去噪的特征微调模块,在基于小损失准则从大规模数据集中筛选出具有干净图像级伪标签的潜在样本后,利用这些干净样本对预训练的主干网络进行微调,使网络获得更稳健的类别表示.为了进一步减少伪标签中的类别噪声,设计了一种基于聚类的样本去噪模块,根据类别占比和样本与聚类中心之间的距离来去除干扰聚类任务的噪声样本,从而提升聚类性能.本文还设计了一种SAM提示优化模块,根据聚类距离识别出图像中的活跃类别,以过滤噪声目标,并将点和框作为SAM的目标提示信息,生成预期的目标掩膜以细化伪标签中目标的边缘.实验结果表明,在大规模语义分割数据集ImageNet-S_(50)、ImageNet-S_(300)和ImageNet-S_(919)的测试集上,本文方法在平均交并比指标上分别达到了45.0%、26.6%和14.5%,显著提高了分割目标的类别准确率和边缘精度. 展开更多
关键词 大规模无监督语义分割 图像级去噪 分割一切模型 伪标签 聚类
在线阅读 下载PDF
FDiff-Fusion:基于模糊逻辑驱动的医学图像扩散融合网络分割模型
8
作者 耿胜 丁卫平 +3 位作者 鞠恒荣 黄嘉爽 姜舒 王海鹏 《计算机科学》 北大核心 2025年第6期274-285,共12页
医学图像分割在临床诊疗和病理分析中具有重要的应用价值。近年来,去噪扩散模型在图像分割建模方面取得了显著成功,其能够更好地捕获图像中的复杂结构和细节信息。然而,利用去噪扩散模型进行医学图像分割的方法大多忽略了分割目标的边... 医学图像分割在临床诊疗和病理分析中具有重要的应用价值。近年来,去噪扩散模型在图像分割建模方面取得了显著成功,其能够更好地捕获图像中的复杂结构和细节信息。然而,利用去噪扩散模型进行医学图像分割的方法大多忽略了分割目标的边界不确定和区域模糊因素,从而造成了最终分割结果的不稳定性和不准确性。为了解决这一问题,提出了一种基于模糊逻辑驱动的医学图像扩散融合网络分割模型(FDiff-Fusion)。该模型通过将去噪扩散模型集成到经典U-Net网络中,有效地从输入医学图像中提取丰富的语义信息。由于医学图像的分割目标边界不确定性和区域模糊化现象普遍存在,因此在U-Net网络的跳跃路径上设计了一种模糊学习模块。该模块为输入的编码特征设置多个模糊隶属度函数,以描述特征点之间的相似程度,并对模糊隶属度函数应用模糊规则处理,从而增强了模型对不确定边界和模糊区域的建模能力。此外,为了提高模型分割结果的准确性和鲁棒性,在测试阶段引入了基于迭代注意力特征融合的方法。该方法将局部上下文信息添加到注意力模块中的全局上下文信息中,以融合每个去噪时间步的预测结果。实验结果显示,与现有的先进分割网络相比,FDiff-Fusion在BRATS 2020脑肿瘤数据集上获得的平均Dice分数和HD95距离分别为84.16%和2.473mm,在BTCV腹部多器官数据集上获得的平均Dice分数和HD95距离分别为83.82%和7.98mm,表现出良好的分割性能。 展开更多
关键词 去噪扩散模型 U-Net网络 医学图像分割 模糊学习 迭代注意力特征融合
在线阅读 下载PDF
基于MSC-LSAM的多尺度交叉超声医学图像分割方法
9
作者 王朝欣 杨汶汶 +3 位作者 戎泽 李铮昱 王行 马磊 《数据采集与处理》 北大核心 2025年第2期469-484,共16页
脑卒中是全球范围内致死致残率最高的疾病之一,颈动脉狭窄和心脏病变是缺血性脑卒中的重要致病因素。超声(Ultrasound,US)是检查由颈动脉狭窄和心脏病变引起的缺血性脑卒中的常用影像学手段,但超声图像噪声多、边界模糊,具有较高的分割... 脑卒中是全球范围内致死致残率最高的疾病之一,颈动脉狭窄和心脏病变是缺血性脑卒中的重要致病因素。超声(Ultrasound,US)是检查由颈动脉狭窄和心脏病变引起的缺血性脑卒中的常用影像学手段,但超声图像噪声多、边界模糊,具有较高的分割难度。本文提出MSC⁃LSAM算法,一种多尺度交叉的双编码器超声图像分割网络,旨在实现颈动脉腔体和心脏腔体的快速、准确分割,辅助医生完成疾病诊断。MSC⁃LSAM在编码器部分并行了分割一切模型(Segment anything model,SAM)的视觉编码器和UNet编码器,在解码器部分采用UNet解码器。本研究首先冻结了预训练的SAM视觉编码器,并在Transformer层中引入高效的适配器(Adapter)块,被称可学习的分割一切模型(Learnable SAM,LSAM)。LSAM在拥有较低参数量的同时,保留学习能力和高度泛化性。然后,在UNet全局网络引入多尺度交叉注意力(Multi⁃scale cross⁃axial attention,MCA),实现多尺度特征的交叉融合,有效提升边缘分割能力,抑制模型过拟合。最后,通过高效通道注意力(Efficient channel attention,ECA)实现双编码器多尺度特征的高效融合,减少模型误分割。结果表明,本研究提出的MSC⁃LSAM在心脏超声公开数据集CAMUS和颈动脉超声自建数据集CAUS上均取得了良好的效果。CAMUS的两心腔(2CH)和四心腔(4CH)数据集分割的平均Dice相似系数(Dice similarity coefficient,DSC)分别达到0.927和0.934;CAUS数据集的平均DSC达到0.917。MSC⁃LSAM在颈动脉腔体和心脏腔体超声图像分割任务上获得了良好的分割准确度,高于主流分割算法,具有良好的应用前景。 展开更多
关键词 缺血性脑卒中 超声图像分割 分割一切模型 多尺度交叉注意力 高效通道注意力
在线阅读 下载PDF
基于分割一切模型SAM的实景三维场景语义分割
10
作者 李锋 薛梅 +1 位作者 詹勇 杨元 《测绘通报》 CSCD 北大核心 2024年第12期101-105,共5页
基于深度学习和计算机视觉技术的场景语义分割是当前研究的热点。本文提出了包含“场景输入—预处理—模型推断—语义分割”的实景三维场景语义分割框架,通过将实景三维场景作为输入,按照正交投影的方式转为多视图二维图像,开展分割推理... 基于深度学习和计算机视觉技术的场景语义分割是当前研究的热点。本文提出了包含“场景输入—预处理—模型推断—语义分割”的实景三维场景语义分割框架,通过将实景三维场景作为输入,按照正交投影的方式转为多视图二维图像,开展分割推理,获得分割掩码并进行处理,实现了实景三维对象拣选、单体化、语义化处理。试验结果表明,本文方法具有较好的语义分割效果和运行效率。 展开更多
关键词 分割一切模型 实景三维 语义分割
在线阅读 下载PDF
基于高斯混合模型的尿沉渣图像有形成分分割
11
作者 常永鑫 黄雪东 +1 位作者 马婷 张文瑞 《计算机应用与软件》 北大核心 2025年第5期209-216,共8页
针对尿沉渣图像有形成分种类多、对比度低、边界模糊问题。提出一种基于高斯混合模型的尿沉渣图像有形成分分割方法。提取图像边缘,利用构建的空间约束关系融合边缘强度和区域密度,提取图像有效区域。通过主框架增强的方式增强有效区域... 针对尿沉渣图像有形成分种类多、对比度低、边界模糊问题。提出一种基于高斯混合模型的尿沉渣图像有形成分分割方法。提取图像边缘,利用构建的空间约束关系融合边缘强度和区域密度,提取图像有效区域。通过主框架增强的方式增强有效区域的纹理特征,构建完整的观测数据,引入局部区域相邻像素的空间关联性来约束高斯混合模型,利用条件迭代算法优化求解标签场的最大后验概率,完成图像分割。实验结果表明,所提方法能够提高图像分割的精确性和完整性。 展开更多
关键词 高斯混合模型 图像分割 尿沉渣图像
在线阅读 下载PDF
AConvLSTM U-Net:基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型
12
作者 李苏强 王周阳 +1 位作者 产思贤 周小龙 《南方医科大学学报》 北大核心 2025年第5期1082-1092,共11页
目的提出一种基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型(AConvLSTM U-Net),实现颌骨囊肿图像的准确自动分割。方法使用含有2592张颌骨囊肿图像数据集。首先,AConvLSTM U-Net在编码路径上设计移动翻转瓶颈卷积模块(MBC)以... 目的提出一种基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型(AConvLSTM U-Net),实现颌骨囊肿图像的准确自动分割。方法使用含有2592张颌骨囊肿图像数据集。首先,AConvLSTM U-Net在编码路径上设计移动翻转瓶颈卷积模块(MBC)以增强特征提取能力。其次,采用双路径稠密卷积(DPD)连接编码器和解码器,在跳跃连接中引入双向ConvLSTM以获取丰富的语义信息。然后,解码路径上使用基于空间和通道注意力的解码块(scSE),以提升对重要信息的关注。最后,设计了全尺寸深度监督模块(DS),并结合联合损失函数对模型进行优化,以进一步提高分割精度。结果AConvLSTM U-Net在颌骨囊肿病灶分割的实验结果在MCC、DSC和JSC方面分别达到93.8443%、93.9067%、88.5133%,性能均优于所有被比较的分割模型。结论所提出的算法在颌骨囊肿数据集上表现出较高的准确性与鲁棒性,优于多种主流方法,展现了AConvLSTM U-Net在颌骨囊肿图像分割的优越性能和辅助诊断的巨大潜力。 展开更多
关键词 注意力机制 多尺度颌骨囊肿分割模型 稠密卷积
在线阅读 下载PDF
基于U-Net的多光谱图像林火分割模型
13
作者 袁嘉栗 曹家宝 +1 位作者 张立 何胜文 《计算机工程与设计》 北大核心 2025年第7期2117-2125,共9页
针对现有林火识别方法因图像背景复杂、分辨率限制、云层和光照干扰导致林火边界分割不清晰、火点错分和漏分等问题,提出一种融合注意力机制与高通滤波器模块的多光谱图像林火分割模型。基于残差思想构建自适应编码网络,提高特征提取能... 针对现有林火识别方法因图像背景复杂、分辨率限制、云层和光照干扰导致林火边界分割不清晰、火点错分和漏分等问题,提出一种融合注意力机制与高通滤波器模块的多光谱图像林火分割模型。基于残差思想构建自适应编码网络,提高特征提取能力;使用提出的双核双池化全维动态卷积代替普通卷积进行解码,使输出更依赖输入。在此基础上,在跳跃连接上引入CBAM注意力机制,在强化特征提取能力的同时,增强编解码器之间的信息融合。在网络模型的最后使用自定义高通滤波器模块改善边界分割不清晰的问题。在相同数据集下经过大量实验验证,该模型均优于其它基于U-Net改进的模型。 展开更多
关键词 林火 注意力机制 高通滤波器 多光谱图像 林火分割模型 残差 动态卷积
在线阅读 下载PDF
基于UNet模型燃气管道高后果区分割方法研究 被引量:4
14
作者 凌晓 王昕越 +2 位作者 郭凯 孙宝财 程凌宇 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第4期157-162,共6页
为提升燃气管道设施监测和事故应急响应中的高后果区图像分割精准度和可靠性,通过改进UNet模型结构,使用优化后的Inception Block模块、通道注意力和空间注意力机制的方法,提升模型捕捉关键特征的能力,并引入高斯噪声增强模型鲁棒性,采... 为提升燃气管道设施监测和事故应急响应中的高后果区图像分割精准度和可靠性,通过改进UNet模型结构,使用优化后的Inception Block模块、通道注意力和空间注意力机制的方法,提升模型捕捉关键特征的能力,并引入高斯噪声增强模型鲁棒性,采用保留最佳参数策略得到最优训练参数。然后对SE UNet、UNet++、原始UNet以及改进后UNet模型在航拍图像数据集上的分割效果进行对比和分析。研究结果表明:相对SE UNet、UNet++和原始UNet,改进后UNet模型在分割效果上表现更佳,综合性能优于其他模型。同时,改进后UNet模型提高了分割准确性,降低了误检和漏检风险。研究结果可为燃气管道设施的安全运行和维护提供有力支持。 展开更多
关键词 深度学习 UNet模型 卷积神经网络 高后果区 图像分割
在线阅读 下载PDF
基于肤色模型的动态手势分割与识别方法研究
15
作者 曹国华 刘福迪 +1 位作者 马国庆 刘丽 《电子测量技术》 北大核心 2024年第22期144-151,共8页
为解决现有动态手势识别方法在复杂环境下因相近肤色、光照变化等因素造成势识别率不高、鲁棒性欠佳等问题,提出一种基于椭圆肤色模型的动态手势分割与识别方法。首先利用YCrCb颜色空间中的Cr分量结合OTSU阈值分割算法分割出手部区域。... 为解决现有动态手势识别方法在复杂环境下因相近肤色、光照变化等因素造成势识别率不高、鲁棒性欠佳等问题,提出一种基于椭圆肤色模型的动态手势分割与识别方法。首先利用YCrCb颜色空间中的Cr分量结合OTSU阈值分割算法分割出手部区域。其次,针对手势复杂程度以及手指粗细不同的情况下直接运用形态学处理可能或导致细节丢失,影响识别的准确性问题,对传统Canny算法进行改进,并结合形态学处理对手部边缘填充;然后通过结合Kalman与改进的CamShift算法来对手势进行跟踪,完成动态手势分割;最后通过BP神经网络对分割后的动态手势进行识别,通过优化算法在GPU上的实现,利用GPU的并行处理能力加速图像处理、特征提取及神经网络前向传播等计算密集型任务。这部分优化措施显著提升了动态手势识别方法的实时性能,使其能够更好地适应于各类对实时性要求高的应用场景。实验结果表明:此方法在应对复杂背景及光照环境变化时具有较强的鲁棒性及抗干扰能力,平均识别率可达94.67%。 展开更多
关键词 机器视觉 动态手势分割 椭圆肤色模型 Otsu阈值分割算法 彩色-深度图像
在线阅读 下载PDF
基于Stone-SAM的便携式粗集料级配智能检测
16
作者 张鸿 杨俊雅 +2 位作者 刘可心 张益鹏 程雪聪 《建筑材料学报》 北大核心 2025年第6期581-590,共10页
为实现精确的粗集料级配检测,提出了一种便携式粗集料级配智能检测方法。采用知识蒸馏的策略对视觉大模型——分割一切模型(SAM)进行网络结构轻量化,嵌入神经网络分类器PP-HGNetV2为模型提供语义判断的能力,设计粗集料颗粒特征参数数学... 为实现精确的粗集料级配检测,提出了一种便携式粗集料级配智能检测方法。采用知识蒸馏的策略对视觉大模型——分割一切模型(SAM)进行网络结构轻量化,嵌入神经网络分类器PP-HGNetV2为模型提供语义判断的能力,设计粗集料颗粒特征参数数学表征算法,开发移动端应用程序,实现粗集料级配高通量检测。对5种粗集料级配场景进行测试。结果表明:本研究方法对于粗集料颗粒的分割精度高于原始SAM模型,并且能够精确去除背景信息,粗集料颗粒关键参数提取结果准确可靠。 展开更多
关键词 分割一切模型(sam) 粗集料级配 智能检测 移动端 工程检测
在线阅读 下载PDF
激光三维点云在岩性语义分割中的应用综述 被引量:1
17
作者 邵燕林 刘浪 +4 位作者 曾齐红 胡忠贵 魏薇 邓帆 王庆 《科学技术与工程》 北大核心 2025年第4期1313-1324,共12页
激光三维扫描技术可快速获取扫描目标表面的点云数据,包括用于描述目标几何特征的空间点坐标和刻画目标材质反射率信息的激光反射强度。将激光三维点云的自动语义分割技术应用于地质勘探研究中,能为区域地质特征描绘奠定基础。为了展示... 激光三维扫描技术可快速获取扫描目标表面的点云数据,包括用于描述目标几何特征的空间点坐标和刻画目标材质反射率信息的激光反射强度。将激光三维点云的自动语义分割技术应用于地质勘探研究中,能为区域地质特征描绘奠定基础。为了展示激光三维扫描技术在地质场景大规模语义分割领域的最新进展,首先对摄影测量和激光雷达两种三维点云获取方式进行了比较,得到激光雷达在精度、泛用性、不易受光照条件影响等方面具有优势。通过阐述岩性语义分割的原理,将近年来基于几何特征或强度特征的岩性点云分割方法进行了全面的归纳和总结;介绍了常用大规模点云数据集和评价指标,并比较不同算法分割性能;最后总结了现有方法的局限性,并指出岩性语义分割任务未来研究方向进行展望。 展开更多
关键词 三维激光雷达 数字模型 点云语义分割 岩性分类
在线阅读 下载PDF
深度学习下的医学图像分割综述
18
作者 邢素霞 李珂娴 +2 位作者 方俊泽 郭正 赵士杭 《计算机工程与应用》 北大核心 2025年第7期25-41,共17页
针对医学图像的高维性、复杂性和高精度要求等特性,深度学习下的医学图像分割方法凭借其强大的特征提取能力和对复杂模式的学习能力,能够自适应地从大量数据中学习并提取多层次特征,展现出高精度、高鲁棒性和可扩展性强等优势。通过端... 针对医学图像的高维性、复杂性和高精度要求等特性,深度学习下的医学图像分割方法凭借其强大的特征提取能力和对复杂模式的学习能力,能够自适应地从大量数据中学习并提取多层次特征,展现出高精度、高鲁棒性和可扩展性强等优势。通过端到端地提取感兴趣的器官、组织或病变区域,为医生在疾病诊断、制定治疗策略和临床研究等领域提供有力帮助。重点综述了U-Net、Transformer、Mamba、分割一切模型(segment anythingmodel,SAM)及其各自变体模型在医学图像分割中的应用情况和发展脉络,从多个维度进行了综合对比分析,对开展医学影像研究、临床疾病诊断与治疗决策,以及医疗技术创新产品开发均具有一定参考价值。在此基础上,总结了目前医学图像分割研究中面临的挑战,并对该领域未来的研究前景进行展望。 展开更多
关键词 医学图像分割 深度学习 U-Net TRANSFORMER Mamba 分割一切模型(sam)
在线阅读 下载PDF
光影智绘:基于SAM的视频阴影鲁棒抽取
19
作者 陈东 李昌隆 +2 位作者 杜振龙 宋爽 李晓丽 《图学学报》 北大核心 2025年第4期739-745,共7页
针对传统方法对于光照变化和物体遮挡引起复杂的、动态变化阴影处理易致阴影检测的准确率和鲁棒性较低问题,提出了一种基于分割万物模型(SAM)的视频阴影检测方法,对SAM解码器进行微调,使其更适合阴影检测;利用SAM提取关键帧阴影区域,引... 针对传统方法对于光照变化和物体遮挡引起复杂的、动态变化阴影处理易致阴影检测的准确率和鲁棒性较低问题,提出了一种基于分割万物模型(SAM)的视频阴影检测方法,对SAM解码器进行微调,使其更适合阴影检测;利用SAM提取关键帧阴影区域,引入XMem模型,结合感觉记忆、短时记忆和长时记忆联合前后帧信息,给出优化和稳定视频阴影检测结果。实验结果表明:在ViSha数据集的阴影实验结果与传统方法相比,该方法的均值绝对误差降低了约31.8%,交并比提升了约19.7%;定性和定量结果表明本方法不仅提升了视频阴影处理的准确率,并表现出较好的鲁棒性。 展开更多
关键词 阴影检测 语义分割 视频对象分割 sam XMem
在线阅读 下载PDF
基于DeepLabV3+模型的钝性颅脑损伤CT图像智能识别与分割
20
作者 秦豪杰 刘媛媛 +7 位作者 付恩浩 刘雅雯 田志岭 董贺文 刘太昂 邹冬华 程亦斌 刘宁国 《法医学杂志》 CSCD 北大核心 2024年第5期419-429,共11页
目的基于钝性颅脑损伤CT图像训练卷积神经网络DeepLabV3+模型,实现对常见颅脑损伤的智能化识别与分割(下文简称“分割”),探索深度学习技术在法医学钝性颅脑损伤自动化诊断中的应用价值。方法收集活体5486张钝性颅脑损伤CT图像作为训练... 目的基于钝性颅脑损伤CT图像训练卷积神经网络DeepLabV3+模型,实现对常见颅脑损伤的智能化识别与分割(下文简称“分割”),探索深度学习技术在法医学钝性颅脑损伤自动化诊断中的应用价值。方法收集活体5486张钝性颅脑损伤CT图像作为训练集、验证集和测试集进行模型训练与性能评估,另取活体255张钝性颅脑损伤与156张正常颅脑CT图像作为盲测集,评估模型分割5类颅脑损伤(头皮血肿、颅骨骨折、硬脑膜外血肿、硬脑膜下血肿和脑挫伤)的能力。再收集尸体340张钝性颅脑损伤和120张正常颅脑CT图像作为新的盲测集,探索用活体颅脑损伤CT图像训练的模型在尸体颅脑损伤分割中的应用价值。对除盲测集以外的所有钝性颅脑损伤CT图像中的5类颅脑损伤进行人工标记,再将各数据集输入模型,对模型进行训练后,根据训练集、验证集的损失函数与准确率评估并优化模型性能,根据测试集的Dice值评估模型泛化能力;根据盲测集的准确率、精确率和F1值评价模型对5类颅脑损伤的分割性能。结果经过对模型的训练和优化,最终的最优模型对头皮血肿、颅骨骨折、硬脑膜外血肿、硬脑膜下血肿和脑挫伤分割的平均Dice值分别是0.7664、0.8123、0.9387、0.7827和0.8581,均大于0.75,达到了预期要求。盲测集的外部验证结果显示,5类颅脑损伤分割的F1值在活体颅脑损伤CT图像中分别是93.02%、89.80%、87.80%、92.93%和86.57%,在尸体颅脑损伤CT图像中分别是83.92%、44.90%、76.47%、64.29%和48.89%,说明该模型在活体CT图像上能准确分割5类颅脑损伤,而在尸体CT图像上的分割能力相对较差,但仍然能够准确分割头皮血肿、硬脑膜外血肿和硬脑膜下血肿。结论基于CT图像训练的深度学习模型可用于颅脑损伤的分割,但直接将活体颅脑损伤模型用于尸体颅脑损伤的分割有局限性。本研究为钝性颅脑损伤虚拟解剖数据的智能分割提供了新途径。 展开更多
关键词 法医学 人工智能 DeepLabV3+模型 钝性颅脑损伤 深度学习 计算机体层成像 图像分割
在线阅读 下载PDF
上一页 1 2 100 下一页 到第
使用帮助 返回顶部