期刊文献+
共找到2,021篇文章
< 1 2 102 >
每页显示 20 50 100
SAM及其改进模型在图像分割中的应用综述
1
作者 马依拉木·木斯得克 高雨欣 +3 位作者 张思拓 冯珂 阿布都克力木·阿布力孜 哈里旦木·阿布都克里木 《计算机工程》 北大核心 2025年第8期16-38,共23页
随着通用人工智能技术的快速发展,基础模型在多个领域的应用日益受到广泛关注。在图像分割领域,分割一切模型(SAM)作为一种核心基础模型,在提升图像理解和处理效率方面展现出了显著优势。尽管SAM在图像分割任务中表现出色,但在功耗、计... 随着通用人工智能技术的快速发展,基础模型在多个领域的应用日益受到广泛关注。在图像分割领域,分割一切模型(SAM)作为一种核心基础模型,在提升图像理解和处理效率方面展现出了显著优势。尽管SAM在图像分割任务中表现出色,但在功耗、计算效率以及在不同应用场景中的适应性等方面,仍然存在一定的优化空间。为此,从多个维度对SAM的改进方向进行了深入探索,包括提升速度与计算效率、增强模型的精度与鲁棒性、提高模型的适应性与通用性、优化提示工程设计,以及提升数据利用效率与强化迁移学习能力等方面。通过这些改进,SAM不仅能够在更复杂的任务中保持高效性能,还能更好地适应各领域和应用场景的需求。在此基础上,总结SAM在医学、遥感、机械等领域中的实际应用,展示了其在不同场景下的适用性与挑战。此外,详细介绍了图像分割领域常用的数据集和评价指标,通过实验对比分析,进一步评估了视觉Transformer(ViT)变体对SAM性能的影响,以及EfficientSAM、EfficientViT-SAM、MobileSAM和RobustSAM等改进模型的性能表现。最后,总结了SAM及其改进模型在实际应用中面临的挑战,并展望了未来的发展方向,旨在帮助科研工作者更全面地了解SAM及其变体的改进与应用,为新模型的提出提供启发。 展开更多
关键词 分割一切模型 视觉基础模型 改进模型 图像分割 通用模型
在线阅读 下载PDF
针对SAM下游模型脆弱模块的对抗迁移攻击
2
作者 丁熠 林能健 +2 位作者 蒋昀陶 钟宇浩 曹明生 《计算机研究与发展》 北大核心 2025年第10期2455-2467,共13页
SAM(segment anything model)作为一种通用的视觉基础模型,已被广泛应用于多种图像分割任务,但其在对抗性攻击面前表现出脆弱性.提出一种针对SAM下游模型脆弱模块的对抗迁移攻击方法FSGR(fragile section gradient robustness).该方法... SAM(segment anything model)作为一种通用的视觉基础模型,已被广泛应用于多种图像分割任务,但其在对抗性攻击面前表现出脆弱性.提出一种针对SAM下游模型脆弱模块的对抗迁移攻击方法FSGR(fragile section gradient robustness).该方法在无需知晓下游微调细节的前提下,可有效生成对抗样本,实现对SAM下游模型的攻击.该方法运用“脆弱层精准定位+局部强化迁移”策略,通过特征相似度筛选出跨任务共享且最易被激活的模块,针对性地强化攻击效果;同时,引入梯度稳健损失以消除目标模型与下游任务模型间的梯度差异. FSGR方法融合了脆弱层攻击与梯度稳健损失机制,在多个数据集上均实现了相对性能的提升.实验结果表明,FSGR在多种微调模型(如医学分割、阴影分割和伪装分割)的迁移攻击中显著降低了模型性能,证明了其正确性和实用性.与基线方法相比,FSGR不仅在攻击成功率上表现出色,还通过结合脆弱层攻击和梯度稳健损失,实现了相对性能的提升. 展开更多
关键词 图像分割 对抗攻击 迁移攻击 特征相似度 模型鲁棒性
在线阅读 下载PDF
基于SoftEdge软边缘检测模型与改进分水岭的浮选泡沫图像分割方法研究
3
作者 卢才武 曹越 +4 位作者 刘迪 江松 李冠东 张泽家 赵旭阳 《金属矿山》 北大核心 2025年第8期158-164,共7页
针对浮选泡沫图像分割中传统分水岭算法的分割误差问题,研究结合SoftEdge模型与改进的分水岭算法,首先对泡沫图像进行高斯低通滤波降噪,再利用SoftEdge模型提取软边缘,从而削弱光噪声对边缘检测的干扰,进而采用基于前置背景标记技术优... 针对浮选泡沫图像分割中传统分水岭算法的分割误差问题,研究结合SoftEdge模型与改进的分水岭算法,首先对泡沫图像进行高斯低通滤波降噪,再利用SoftEdge模型提取软边缘,从而削弱光噪声对边缘检测的干扰,进而采用基于前置背景标记技术优化的分水岭算法,通过精确提取前景与背景标记,指导分水岭算法在限定区域内执行分割,显著减少了分割误差现象。研究结果表明,该方法规避了对先验知识和复杂参数的依赖,并大幅提升了分割精度。 展开更多
关键词 浮选泡沫图像分割 SoftEdge模型 改进分水岭算法 前景背景标记技术
在线阅读 下载PDF
融合邻域注意力和状态空间模型的医学视频分割算法
4
作者 丁建睿 张听 +1 位作者 刘家栋 宁春平 《电子与信息学报》 北大核心 2025年第5期1582-1595,共14页
在医学影像分析领域,精准分割视频中的病灶对于疾病的早期诊断和治疗至关重要。该文创新性地提出一种融合邻域注意力机制与状态空间模型的算法,旨在全面而精细地捕捉医学视频中的时空特征,从而对视频中的病灶进行准确分割。该算法通过... 在医学影像分析领域,精准分割视频中的病灶对于疾病的早期诊断和治疗至关重要。该文创新性地提出一种融合邻域注意力机制与状态空间模型的算法,旨在全面而精细地捕捉医学视频中的时空特征,从而对视频中的病灶进行准确分割。该算法通过两阶段的精心设计,显著提升了分割性能:第1阶段,通过深度卷积网络捕获低层次的空间语义信息,并借助邻域注意力机制,挖掘相邻帧间的局部时序语义关联。第2阶段,引入状态空间模型来捕捉全面的时序信息,并再次应用邻域注意力模块,进一步增强对局部时序特征的敏感度。该方法不仅有效整合了视频中丰富的时序信息,而且在局部和全局层面上实现了空间与时间特征的协同优化。相较于使用具有2次计算复杂度的自注意力机制,该文采用了具有线性计算复杂度的状态空间模型,显著提升了模型的训练效率和推理速度。所提算法在甲状腺超声视频数据集以及结肠息肉视频数据集CVC-ClinicDB和CVC-ColonDB上的交并比(IOU)指标分别达到了72.7%,82.3%和72.5%,相比该文的基线模型Vivim分别提高了5.7%,1.7%和5.5%。此外,消融实验进一步揭示了邻域注意力模块和状态空间模型在提取时序信息中发挥的关键作用。 展开更多
关键词 医学视频分割 邻域注意力机制 状态空间模型
在线阅读 下载PDF
基于改进U-Net的煤矸图像分割模型与放煤控制技术
5
作者 袁永 秦正寒 +3 位作者 夏永琪 武让 李立宝 李勇 《煤炭学报》 北大核心 2025年第5期2722-2738,共17页
煤矸识别技术是综放工作面实现智能化的关键技术之一,同时也是该领域面临的一个重要挑战。针对目前煤矸图像数据集整体质量差、数据规模小、煤矸图像分割模型检测速度慢、识别精度低等问题,参考实际综放工作面搭建了大尺寸等比例综放开... 煤矸识别技术是综放工作面实现智能化的关键技术之一,同时也是该领域面临的一个重要挑战。针对目前煤矸图像数据集整体质量差、数据规模小、煤矸图像分割模型检测速度慢、识别精度低等问题,参考实际综放工作面搭建了大尺寸等比例综放开采相似模拟平台,基于该平台建立了煤矸图像采集系统,采集构建了高清仿真综放工作面煤矸图像数据集,提出一种基于特征金字塔网络(FPN)和空洞空间金字塔池化(ASPP)的改进U-Net煤矸分割模型,提高了煤矸图像的分割精度。通过在U-Net模型的跳跃连接中添加FPN模块,同时在解码器部分引入ASPP模块,建立了FPN-ASPP-U-Net煤矸分割模型,消融试验验证了FPN模块和ASPP模块对U-Net模型性能的提升。结果表明:FPN-ASPP-U-Net模型分割效果最好,均准确率(M_(A))为97.29%,均F1得分(M_(F1))为97.44%,均交并比(M_(I))为95.65%,模型参数量(M_(P))为29.64 M,浮点运算量(F)为341.29 G,每秒帧数(f)为41.1 f/s,与U-Net模型相比,M_(I)、M_(F1)和M_(A)分别提升了2.64%、1.06%和1.15%,模型参数量仅仅增加了0.33 M,改进后的模型在图像分割速度上有少量提升。设计了FPN-ASPP-U-Net模型与PSPNet、SegFormer、DeepLabV3+、PSANet语义分割模型的图像分割效果对比试验,结果表明:FPN-ASPP-U-Net模型对煤矸图像分割的性能最好,同时模型整体计算参数量最小,在分割精度和分割速度之间有着较好的平衡。对于粉尘影响下的不清晰图像,采用暗通道与高斯加权相结合的方法对图像数据集进行去雾增强,轻度粉尘、中度粉尘、重度粉尘去雾前后的模型对煤的分割精度提高了14.81%、17.79%、23.62%,对矸的分割精度提高了11.73%、14.50%、14.86%。基于研究结论提出了FPN-ASPP-U-Net模型的煤矸图像混矸率计算方法,开展了煤矸图像分割控制放煤试验,以混矸率20%作为放煤口关闭的阈值,单次放煤口开关期间真实混矸率与模型预测混矸率平均误差率为4.71%,验证了基于煤矸图像混矸率对放煤控制的可行性。最后,封装模型代码研发了煤矸图像智能识别软件,设计了煤矸分割现场应用方案,在榆树田煤矿110501综放工作面进行了图像控制放煤试验,验证了该方法能够对煤矸图像进行精准分割,对放煤口开关进行合理控制,提高了综放工作面的智能化水平,为推动煤矿进一步智能化建设提供了有效的技术手段与参考价值。 展开更多
关键词 放顶煤 煤矸识别 图像分割 混矸率 U-Net模型
在线阅读 下载PDF
视觉大模型SAM在医学图像分割中的应用综述 被引量:8
6
作者 孙兴 蔡肖红 +2 位作者 李明 张帅 马金刚 《计算机工程与应用》 CSCD 北大核心 2024年第17期1-16,共16页
随着大模型技术的不断发展,以分割一切模型(segment anything model,SAM)为代表的视觉大模型在图像分割领域取得重要突破。SAM通过提示驱动完成一系列下游分割任务,旨在统一解决所有的图像分割问题。因此,将SAM应用于医学图像分割具有... 随着大模型技术的不断发展,以分割一切模型(segment anything model,SAM)为代表的视觉大模型在图像分割领域取得重要突破。SAM通过提示驱动完成一系列下游分割任务,旨在统一解决所有的图像分割问题。因此,将SAM应用于医学图像分割具有重要意义,其泛化性能够适应多种医学图像,为医生提供更全面的解剖结构和病变信息。介绍了图像分割常用的数据集;对SAM的网络结构和泛化性进行细致阐述;重点对SAM应用在全切片成像、磁共振成像、计算机断层扫描、超声和多模态图像的五大类医学图像进行梳理分析,总结优缺点和相应的改进方法;结合当前医学图像分割领域中存在的实际问题,讨论并展望了SAM未来的发展方向。 展开更多
关键词 视觉大模型 分割一切模型(sam) 医学图像 图像分割
在线阅读 下载PDF
轻量级微调SAM的结肠息肉分割方法SAMCP
7
作者 刘娜 封筠 +2 位作者 霍一儒 王弘扬 杨柳 《计算机应用》 北大核心 2025年第10期3390-3398,共9页
在胃肠道内窥镜图像处理中,精准分割结肠息肉具有重要的临床意义。传统分割方法常因细节捕捉不足和对大规模数据的依赖,在应对复杂形态的息肉时表现不佳。尽管分割一切模型(SAM)在自然图像分割中取得显著进展,但由于自然图像与医学图像... 在胃肠道内窥镜图像处理中,精准分割结肠息肉具有重要的临床意义。传统分割方法常因细节捕捉不足和对大规模数据的依赖,在应对复杂形态的息肉时表现不佳。尽管分割一切模型(SAM)在自然图像分割中取得显著进展,但由于自然图像与医学图像存在域差异,现有的SAM方法在结肠息肉分割任务上仍难以取得理想效果。为解决这一问题,基于SAM架构提出一种轻量级微调结肠息肉分割方法(SAMCP)。该方法引入精简适配器模块,重点关注通道维度信息,采用Dice和交并比(IoU)简化联合损失函数,并在训练时冻结原始图像编码器和提示编码器的参数,以低训练成本提升结肠息肉分割性能。在3个公开数据集上与9种先进方法的对比实验结果表明,相较于SAM方法,SAMCP在Kvasir-SEG数据集上的Dice和IoU值分别提高了56.7%和84.5%,在CVC-ClinicDB数据集上的Dice和IoU值分别提高了46.0%和86.0%,在CVC-ColonDB数据集上的Dice和IoU值分别提高了95.3%和122.2%,超过目前SAM-based类方法的最佳性能。在引入点提示的情况下,即使只使用1次点击,SAMCP仍能优于其他SAM-based方法。以上验证了SAMCP在处理复杂形状和局部细节时表现出色,可为医生提供更精确的分割指导。 展开更多
关键词 结肠息肉分割 分割一切模型 适配器 损失函数 轻量级微调
在线阅读 下载PDF
基于边缘融合的果园贴叠葡萄簇图像分割模型
8
作者 宁政通 李健 +4 位作者 李海东 朱良宽 赵文 王扬威 郭艳玲 《农业工程学报》 北大核心 2025年第6期165-172,共8页
针对果园环境下贴叠葡萄簇的轮廓不规则且纹理颜色相似,导致葡萄采摘机器人难以依靠视觉模型准确分割簇中每串葡萄的问题,该研究提出了一种基于边缘融合的贴叠葡萄簇分割模型(overlapping grape clusters segmentation model,OGCSM)。... 针对果园环境下贴叠葡萄簇的轮廓不规则且纹理颜色相似,导致葡萄采摘机器人难以依靠视觉模型准确分割簇中每串葡萄的问题,该研究提出了一种基于边缘融合的贴叠葡萄簇分割模型(overlapping grape clusters segmentation model,OGCSM)。首先通过搭建由多尺度卷积Inception、相似性注意力(similarity attention module,SimAM)、卷积块注意力(convolutional block attention module,CBAM)改进的编码-解码器作为主干网络,捕获具有边缘层次的贴叠葡萄簇特征图;然后采用深度监督方式引导由掩码头与边缘头构成的融合网络对特征图进行卷积与反卷积,生成贴叠葡萄簇掩码图及簇中每串葡萄边缘图;最后去除冗余特征后融合掩码图与边缘图,实现对贴叠葡萄簇的分割。试验结果表明,208串左右、前后、上下贴叠葡萄簇的分割交并比(intersection over union,IoU)平均值达92.77%,不同天气光照条件下的分割精确率平均值达98.13%,单幅图像的平均分割耗时为0.379 s。与现有方法相比,OGCSM模型可更准确地划分贴叠葡萄簇中每串葡萄的分割区域,该研究为葡萄采摘机器人提供了一种分割贴叠葡萄簇的视觉模型。 展开更多
关键词 机器人 图像分割 贴叠葡萄 边缘 采摘 融合 模型
在线阅读 下载PDF
基于预训练SAM的提示式三维牙齿分割方法
9
作者 刘复昌 蔡煜晨 +1 位作者 缪永伟 范然 《浙江大学学报(理学版)》 北大核心 2025年第1期59-69,共11页
目前,大多研究采用有监督学习方法在牙齿的三维数据上训练网络,完成分割任务,但在处理缺牙、严重错位或颌部不完整的牙齿时效果不佳,泛化能力较弱。为此,提出了一种基于预训练分割一切模型(segment anything model,SAM)和提示分割技术... 目前,大多研究采用有监督学习方法在牙齿的三维数据上训练网络,完成分割任务,但在处理缺牙、严重错位或颌部不完整的牙齿时效果不佳,泛化能力较弱。为此,提出了一种基于预训练分割一切模型(segment anything model,SAM)和提示分割技术的方法。首先,在2022年国际医学图像计算和计算机辅助干预会议(MICCAI 2022)的三维牙齿公开数据集上微调模型。然后,将三维牙齿模型投影至多个二维视图,利用SAM网络进行图像分割。再将每个像素的标签映射回原始的三维三角形面片,完成三维牙齿分割。在该数据集中,测试了900个较理想的三维上下牙数据,取得了与主流技术相当的结果。对于缺牙、牙齿错位以及上下颚不完整的复杂情况,本文方法表现出显著优于现有技术的效果,展示了更强的泛化能力和稳定性。 展开更多
关键词 口腔正畸 三维牙齿分割 sam 图像分割
在线阅读 下载PDF
空间自主感知语义分割模型的可解释性研究
10
作者 郝仁剑 胡勇 +3 位作者 施沐伽 屈金硕 冯李航 王东 《空间控制技术与应用》 北大核心 2025年第4期65-77,共13页
随着深空探测与智能自主系统技术的持续发展,语义分割模型在空间环境感知中的应用价值日益凸显,特别是在火星地形识别、路径规划与风险评估等空间自主感知任务中展现出关键作用.然而,现有基于深度学习的语义分割模型多为“黑箱结构”,... 随着深空探测与智能自主系统技术的持续发展,语义分割模型在空间环境感知中的应用价值日益凸显,特别是在火星地形识别、路径规划与风险评估等空间自主感知任务中展现出关键作用.然而,现有基于深度学习的语义分割模型多为“黑箱结构”,其内部决策过程难以解释,严重制约了其在关键任务场景中的可信度与可控性.针对当前空间自主感知场景下语义分割模型可解释性研究不足的问题,基于典型的火星遥感图像数据,引入基于扰动的可解释性方法:基于随机输入采样的解释方法(RISE),并结合Deletion机制,对模型的像素级显著性区域进行了可视化与干预实验.通过对不同显著性掩码参数设置下的热力图变化以及删除区域对模型预测影响的系统分析,揭示了模型在不同地形类别判别中的依赖特征,发现其存在过度依赖颜色、类别间显著性区域交叉等问题.在此基础上,进一步提出针对性优化建议,为语义分割模型在空间自主系统中的可靠部署与可解释增强提供了理论支持与技术路径. 展开更多
关键词 空间自主感知 语义分割模型 星表地形 可解释性 RISE方法 模型优化
在线阅读 下载PDF
基于伪标签去噪和SAM优化的大规模无监督语义分割
11
作者 杨维静 徐瑞 +3 位作者 顾浩文 陈涛 舒祥波 姚亚洲 《电子学报》 北大核心 2025年第3期716-727,共12页
语义分割技术能够对复杂、多元的场景实现细粒度理解,是促进无人系统高效、智能工作的关键技术之一.大规模无监督语义分割旨在从大规模未标记图像中学习语义分割能力.然而,现有方法由于自学习伪标签存在类别混淆和形状表示欠佳的问题,... 语义分割技术能够对复杂、多元的场景实现细粒度理解,是促进无人系统高效、智能工作的关键技术之一.大规模无监督语义分割旨在从大规模未标记图像中学习语义分割能力.然而,现有方法由于自学习伪标签存在类别混淆和形状表示欠佳的问题,导致最终分割精度较低.为此,本文提出一种伪标签去噪和SAM优化(Pseudo-label Denoising and SAM Optimization,PDSO)方法以解决大规模无监督语义分割问题.本文设计了一种基于去噪的特征微调模块,在基于小损失准则从大规模数据集中筛选出具有干净图像级伪标签的潜在样本后,利用这些干净样本对预训练的主干网络进行微调,使网络获得更稳健的类别表示.为了进一步减少伪标签中的类别噪声,设计了一种基于聚类的样本去噪模块,根据类别占比和样本与聚类中心之间的距离来去除干扰聚类任务的噪声样本,从而提升聚类性能.本文还设计了一种SAM提示优化模块,根据聚类距离识别出图像中的活跃类别,以过滤噪声目标,并将点和框作为SAM的目标提示信息,生成预期的目标掩膜以细化伪标签中目标的边缘.实验结果表明,在大规模语义分割数据集ImageNet-S_(50)、ImageNet-S_(300)和ImageNet-S_(919)的测试集上,本文方法在平均交并比指标上分别达到了45.0%、26.6%和14.5%,显著提高了分割目标的类别准确率和边缘精度. 展开更多
关键词 大规模无监督语义分割 图像级去噪 分割一切模型 伪标签 聚类
在线阅读 下载PDF
基于SAM2的腹腔镜手术多目标自动分割方法
12
作者 刘成 张家意 +2 位作者 袁烽 张睿 高欣 《图学学报》 北大核心 2025年第5期969-979,共11页
腹腔镜术中场景的自动分割是手术机器人实现自主操作的关键基础,当前仍面临三重挑战:手术目标间纹理高度相似且边界模糊,导致相似目标难以精确分割;从亚毫米级缝合线到厘米级脏器组织存在显著尺度差异,制约了多目标同步分割精度提升;运... 腹腔镜术中场景的自动分割是手术机器人实现自主操作的关键基础,当前仍面临三重挑战:手术目标间纹理高度相似且边界模糊,导致相似目标难以精确分割;从亚毫米级缝合线到厘米级脏器组织存在显著尺度差异,制约了多目标同步分割精度提升;运动伪影和烟雾遮挡等干扰进一步影响术中多目标完整分割的鲁棒性。为此,提出基于视觉大模型SAM2的腹腔镜手术多目标自动分割方法(SAM2-MSNet)。采用LoRA+微调策略优化SAM2图像编码器,高效适配腹腔镜图像的纹理特征表达;设计跨尺度特征同步提取模块,实现多尺度目标的精确分割;构建特征关系全局感知模块,增强网络对运动伪影及烟雾遮挡等干扰的鲁棒性;并引入方向梯度直方图驱动的伪标签辅助监督机制,显著提升目标边缘分割精度。实验结果表明,SAM2-MSNet在Endovis2018和AutoLaparo数据集上分别取得了70.2%和69.6%的平均交并比(mIoU),和78.5%和75.0%的平均Dice系数(mDice)。在推理速度与SAM2-UNet相当(23帧/秒VS.25帧/秒)的前提下,其分割精度显著提升了3.0%和6.7%(mIoU)和2.8%和6.8%(mDice)。SAM2-MSNet实现了对腹腔镜手术场景高精度全自动分割,为手术机器人自主化进程提供了关键技术支撑。 展开更多
关键词 腹腔镜手术场景分割 视觉大模型 跨尺度特征同步提取 特征关系全局感知 伪标签辅助监督
在线阅读 下载PDF
FDiff-Fusion:基于模糊逻辑驱动的医学图像扩散融合网络分割模型
13
作者 耿胜 丁卫平 +3 位作者 鞠恒荣 黄嘉爽 姜舒 王海鹏 《计算机科学》 北大核心 2025年第6期274-285,共12页
医学图像分割在临床诊疗和病理分析中具有重要的应用价值。近年来,去噪扩散模型在图像分割建模方面取得了显著成功,其能够更好地捕获图像中的复杂结构和细节信息。然而,利用去噪扩散模型进行医学图像分割的方法大多忽略了分割目标的边... 医学图像分割在临床诊疗和病理分析中具有重要的应用价值。近年来,去噪扩散模型在图像分割建模方面取得了显著成功,其能够更好地捕获图像中的复杂结构和细节信息。然而,利用去噪扩散模型进行医学图像分割的方法大多忽略了分割目标的边界不确定和区域模糊因素,从而造成了最终分割结果的不稳定性和不准确性。为了解决这一问题,提出了一种基于模糊逻辑驱动的医学图像扩散融合网络分割模型(FDiff-Fusion)。该模型通过将去噪扩散模型集成到经典U-Net网络中,有效地从输入医学图像中提取丰富的语义信息。由于医学图像的分割目标边界不确定性和区域模糊化现象普遍存在,因此在U-Net网络的跳跃路径上设计了一种模糊学习模块。该模块为输入的编码特征设置多个模糊隶属度函数,以描述特征点之间的相似程度,并对模糊隶属度函数应用模糊规则处理,从而增强了模型对不确定边界和模糊区域的建模能力。此外,为了提高模型分割结果的准确性和鲁棒性,在测试阶段引入了基于迭代注意力特征融合的方法。该方法将局部上下文信息添加到注意力模块中的全局上下文信息中,以融合每个去噪时间步的预测结果。实验结果显示,与现有的先进分割网络相比,FDiff-Fusion在BRATS 2020脑肿瘤数据集上获得的平均Dice分数和HD95距离分别为84.16%和2.473mm,在BTCV腹部多器官数据集上获得的平均Dice分数和HD95距离分别为83.82%和7.98mm,表现出良好的分割性能。 展开更多
关键词 去噪扩散模型 U-Net网络 医学图像分割 模糊学习 迭代注意力特征融合
在线阅读 下载PDF
基于分割一切模型SAM的实景三维场景语义分割 被引量:1
14
作者 李锋 薛梅 +1 位作者 詹勇 杨元 《测绘通报》 CSCD 北大核心 2024年第12期101-105,共5页
基于深度学习和计算机视觉技术的场景语义分割是当前研究的热点。本文提出了包含“场景输入—预处理—模型推断—语义分割”的实景三维场景语义分割框架,通过将实景三维场景作为输入,按照正交投影的方式转为多视图二维图像,开展分割推理... 基于深度学习和计算机视觉技术的场景语义分割是当前研究的热点。本文提出了包含“场景输入—预处理—模型推断—语义分割”的实景三维场景语义分割框架,通过将实景三维场景作为输入,按照正交投影的方式转为多视图二维图像,开展分割推理,获得分割掩码并进行处理,实现了实景三维对象拣选、单体化、语义化处理。试验结果表明,本文方法具有较好的语义分割效果和运行效率。 展开更多
关键词 分割一切模型 实景三维 语义分割
在线阅读 下载PDF
基于MSC-LSAM的多尺度交叉超声医学图像分割方法
15
作者 王朝欣 杨汶汶 +3 位作者 戎泽 李铮昱 王行 马磊 《数据采集与处理》 北大核心 2025年第2期469-484,共16页
脑卒中是全球范围内致死致残率最高的疾病之一,颈动脉狭窄和心脏病变是缺血性脑卒中的重要致病因素。超声(Ultrasound,US)是检查由颈动脉狭窄和心脏病变引起的缺血性脑卒中的常用影像学手段,但超声图像噪声多、边界模糊,具有较高的分割... 脑卒中是全球范围内致死致残率最高的疾病之一,颈动脉狭窄和心脏病变是缺血性脑卒中的重要致病因素。超声(Ultrasound,US)是检查由颈动脉狭窄和心脏病变引起的缺血性脑卒中的常用影像学手段,但超声图像噪声多、边界模糊,具有较高的分割难度。本文提出MSC⁃LSAM算法,一种多尺度交叉的双编码器超声图像分割网络,旨在实现颈动脉腔体和心脏腔体的快速、准确分割,辅助医生完成疾病诊断。MSC⁃LSAM在编码器部分并行了分割一切模型(Segment anything model,SAM)的视觉编码器和UNet编码器,在解码器部分采用UNet解码器。本研究首先冻结了预训练的SAM视觉编码器,并在Transformer层中引入高效的适配器(Adapter)块,被称可学习的分割一切模型(Learnable SAM,LSAM)。LSAM在拥有较低参数量的同时,保留学习能力和高度泛化性。然后,在UNet全局网络引入多尺度交叉注意力(Multi⁃scale cross⁃axial attention,MCA),实现多尺度特征的交叉融合,有效提升边缘分割能力,抑制模型过拟合。最后,通过高效通道注意力(Efficient channel attention,ECA)实现双编码器多尺度特征的高效融合,减少模型误分割。结果表明,本研究提出的MSC⁃LSAM在心脏超声公开数据集CAMUS和颈动脉超声自建数据集CAUS上均取得了良好的效果。CAMUS的两心腔(2CH)和四心腔(4CH)数据集分割的平均Dice相似系数(Dice similarity coefficient,DSC)分别达到0.927和0.934;CAUS数据集的平均DSC达到0.917。MSC⁃LSAM在颈动脉腔体和心脏腔体超声图像分割任务上获得了良好的分割准确度,高于主流分割算法,具有良好的应用前景。 展开更多
关键词 缺血性脑卒中 超声图像分割 分割一切模型 多尺度交叉注意力 高效通道注意力
在线阅读 下载PDF
基于博弈论组合赋权和二维可分割云模型的VPP运行安全风险评价研究
16
作者 廖奕洋 王晓彤 郭森 《智慧电力》 北大核心 2025年第10期70-78,共9页
虚拟电厂(VPP)通过聚合多种资源进行运行,面临内部与外部等多重风险。开展运行安全风险评价有助于防范潜在风险,保障新型电力系统的安全稳定运行。基于内外部视角,首先从系统安全风险、事故安全风险、数据安全风险和网络安全风险4个维... 虚拟电厂(VPP)通过聚合多种资源进行运行,面临内部与外部等多重风险。开展运行安全风险评价有助于防范潜在风险,保障新型电力系统的安全稳定运行。基于内外部视角,首先从系统安全风险、事故安全风险、数据安全风险和网络安全风险4个维度构建了VPP运行安全风险评价指标体系;其次,引入纳什均衡博弈思想,提出一种结合熵权法(EWM)与贝叶斯最优最劣法的组合赋权方法,并构建基于二维可分割云模型的风险评价模型;最后,对3个省份的VPP进行了实例评价。实证结果表明:出力预测偏差、需求响应执行情况、设备故障率和人为操作事故属于关键风险指标;位于J省的VPP运行安全风险等级较低,而位于H省和S省的VPP则处于中等风险等级。所提模型可为VPP运营者的风险管理提供参考。 展开更多
关键词 VPP 运行安全 风险评价 博弈论组合赋权 二维可分割模型
在线阅读 下载PDF
基于高斯混合模型的尿沉渣图像有形成分分割
17
作者 常永鑫 黄雪东 +1 位作者 马婷 张文瑞 《计算机应用与软件》 北大核心 2025年第5期209-216,共8页
针对尿沉渣图像有形成分种类多、对比度低、边界模糊问题。提出一种基于高斯混合模型的尿沉渣图像有形成分分割方法。提取图像边缘,利用构建的空间约束关系融合边缘强度和区域密度,提取图像有效区域。通过主框架增强的方式增强有效区域... 针对尿沉渣图像有形成分种类多、对比度低、边界模糊问题。提出一种基于高斯混合模型的尿沉渣图像有形成分分割方法。提取图像边缘,利用构建的空间约束关系融合边缘强度和区域密度,提取图像有效区域。通过主框架增强的方式增强有效区域的纹理特征,构建完整的观测数据,引入局部区域相邻像素的空间关联性来约束高斯混合模型,利用条件迭代算法优化求解标签场的最大后验概率,完成图像分割。实验结果表明,所提方法能够提高图像分割的精确性和完整性。 展开更多
关键词 高斯混合模型 图像分割 尿沉渣图像
在线阅读 下载PDF
改进分割大模型的桥梁缆索损伤语义分割方法
18
作者 邓小龙 黄志海 郭波 《测绘通报》 北大核心 2025年第9期112-117,共6页
桥梁缆索损伤检测是桥梁安全运营及维护的重要工作,快速、自动化地处理缆索图像进而准确检测出损伤部位是桥梁安全运营的保障。本文对分割大模型SAM进行改进并将其应用于桥梁缆索损伤语义分割,为损伤检测提供重要依据。改进SAM的方法有... 桥梁缆索损伤检测是桥梁安全运营及维护的重要工作,快速、自动化地处理缆索图像进而准确检测出损伤部位是桥梁安全运营的保障。本文对分割大模型SAM进行改进并将其应用于桥梁缆索损伤语义分割,为损伤检测提供重要依据。改进SAM的方法有两点:①对图像编码器进行Adapter微调,并通过迁移学习方法,提高模型应用于桥梁缆索数据的泛化性;②对掩码解码器进行预测头微调,使SAM无需提示,并引入多类别以实现语义分割。为了验证改进SAM的优势,与DeepLabV3+在近2200张桥梁缆索的数据集上进行了对比试验。结果表明,改进SAM面对损伤类别分布不均匀、样本数少的情况更具优势,其语义分割评价指标mIoU达到73.41%,平均F1得分为83.99%,均类精度为81.80%。 展开更多
关键词 深度学习 语义分割 模型微调 桥梁缆索损伤检测
在线阅读 下载PDF
AConvLSTM U-Net:基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型
19
作者 李苏强 王周阳 +1 位作者 产思贤 周小龙 《南方医科大学学报》 北大核心 2025年第5期1082-1092,共11页
目的提出一种基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型(AConvLSTM U-Net),实现颌骨囊肿图像的准确自动分割。方法使用含有2592张颌骨囊肿图像数据集。首先,AConvLSTM U-Net在编码路径上设计移动翻转瓶颈卷积模块(MBC)以... 目的提出一种基于双向稠密连接和注意力机制的多尺度颌骨囊肿分割模型(AConvLSTM U-Net),实现颌骨囊肿图像的准确自动分割。方法使用含有2592张颌骨囊肿图像数据集。首先,AConvLSTM U-Net在编码路径上设计移动翻转瓶颈卷积模块(MBC)以增强特征提取能力。其次,采用双路径稠密卷积(DPD)连接编码器和解码器,在跳跃连接中引入双向ConvLSTM以获取丰富的语义信息。然后,解码路径上使用基于空间和通道注意力的解码块(scSE),以提升对重要信息的关注。最后,设计了全尺寸深度监督模块(DS),并结合联合损失函数对模型进行优化,以进一步提高分割精度。结果AConvLSTM U-Net在颌骨囊肿病灶分割的实验结果在MCC、DSC和JSC方面分别达到93.8443%、93.9067%、88.5133%,性能均优于所有被比较的分割模型。结论所提出的算法在颌骨囊肿数据集上表现出较高的准确性与鲁棒性,优于多种主流方法,展现了AConvLSTM U-Net在颌骨囊肿图像分割的优越性能和辅助诊断的巨大潜力。 展开更多
关键词 注意力机制 多尺度颌骨囊肿分割模型 稠密卷积
在线阅读 下载PDF
基于U-Net的多光谱图像林火分割模型
20
作者 袁嘉栗 曹家宝 +1 位作者 张立 何胜文 《计算机工程与设计》 北大核心 2025年第7期2117-2125,共9页
针对现有林火识别方法因图像背景复杂、分辨率限制、云层和光照干扰导致林火边界分割不清晰、火点错分和漏分等问题,提出一种融合注意力机制与高通滤波器模块的多光谱图像林火分割模型。基于残差思想构建自适应编码网络,提高特征提取能... 针对现有林火识别方法因图像背景复杂、分辨率限制、云层和光照干扰导致林火边界分割不清晰、火点错分和漏分等问题,提出一种融合注意力机制与高通滤波器模块的多光谱图像林火分割模型。基于残差思想构建自适应编码网络,提高特征提取能力;使用提出的双核双池化全维动态卷积代替普通卷积进行解码,使输出更依赖输入。在此基础上,在跳跃连接上引入CBAM注意力机制,在强化特征提取能力的同时,增强编解码器之间的信息融合。在网络模型的最后使用自定义高通滤波器模块改善边界分割不清晰的问题。在相同数据集下经过大量实验验证,该模型均优于其它基于U-Net改进的模型。 展开更多
关键词 林火 注意力机制 高通滤波器 多光谱图像 林火分割模型 残差 动态卷积
在线阅读 下载PDF
上一页 1 2 102 下一页 到第
使用帮助 返回顶部