期刊文献+
共找到162篇文章
< 1 2 9 >
每页显示 20 50 100
基于DA-Attention U-Net编码-解码结构的浮选矿浆相气泡图像分割
1
作者 徐宏祥 李神舟 徐培培 《有色金属(选矿部分)》 CAS 2024年第6期106-115,131,共11页
浮选矿浆相气泡图像是采集自浮选槽内部矿浆溶液中的图像数据,与浮选泡沫相图像数据相比视觉特征显著不同。针对使用特殊设备从浮选槽矿浆溶液中原位采集的气泡图像数据,提出了一种基于DA-Attention U-Net编码-解码结构的气泡分割模型... 浮选矿浆相气泡图像是采集自浮选槽内部矿浆溶液中的图像数据,与浮选泡沫相图像数据相比视觉特征显著不同。针对使用特殊设备从浮选槽矿浆溶液中原位采集的气泡图像数据,提出了一种基于DA-Attention U-Net编码-解码结构的气泡分割模型。模型以U-Net为基础,引入CBAM模块并依据Residual残差连接思想改进模块结构,使模型同时具有通道注意力和空间注意力的优点,给予包含气泡的前景区域更大权重,减少因下采样次数多导致的信息丢失;引入ASPP模块并基于Dense密集连接思想进行改进,从多尺度提取气泡特征及整合前后特征层信息;并在完成气泡分割的基础上使用热力图与显著图对分割结果进行分析。研究结果表明,与原始U-Net相比,所提模型对气泡图像分割效果更优,训练损失、Dice系数降低了0.416、0.2,分别达到了0.015、0.12,MIoU精度值、F1_Score值提升了0.331、0.229,分别达到了0.952、0.985,并通过消融试验验证了各模块有效性。该模型对气泡图像的精确分割,可为后续提取气泡特征奠定基础,对于未来将矿浆相气泡特征信息用于浮选过程智能控制,具有重要意义。 展开更多
关键词 浮选矿浆相气泡 语义分割 密集连接机制 注意力集中机制 浮选过程智能控制
在线阅读 下载PDF
引入卷积块注意力模块的Attention U-Net木材表面裂纹检测方法
2
作者 项晓扬 王明涛 多化琼 《林业工程学报》 CSCD 北大核心 2024年第4期140-146,共7页
木材缺陷会影响木材的使用价值和使用期限,其中木材表面裂纹是严重影响木材外观质量和机械强度的一种木材缺陷。对木材表面裂纹的检测可以尽快发现此类缺陷木材,或为后续处理提供依据。针对现有的人工检测和自动化检测木材表面裂纹效率... 木材缺陷会影响木材的使用价值和使用期限,其中木材表面裂纹是严重影响木材外观质量和机械强度的一种木材缺陷。对木材表面裂纹的检测可以尽快发现此类缺陷木材,或为后续处理提供依据。针对现有的人工检测和自动化检测木材表面裂纹效率低、成本高、漏检率高等问题,采用引入卷积块注意力模块(convolutional block attention module,CBAM)的Attention U-Net深度学习模型对木材表面裂纹图像进行语义分割,从而达到木材表面裂纹检测的目的。引入的CBAM模块包含通道注意力机制和空间注意力机制,分别用于捕捉通道间的依赖关系和像素级的空间关系,该模块被添加到Attention U-Net网络的编码阶段,以增加感兴趣区域的权重并抑制冗余信息。最后,通过消融试验验证了Attention U-Net中加入CBAM对分割性能的提升。采用像素准确率(PA)、类别像素准确率(CPA)、召回率(Recall)、Dice系数、交并比(IoU)和平均交并比(MIoU)等语义分割评价指标评价各模型的优劣,并确定最佳模型及其参数。在自制木材表面数据集的裂纹分割中,使用AdamW优化器引入CBAM的Attention U-Net的PA、木材裂纹Recall、木材裂纹Dice系数、木材裂纹IoU、MIoU分别比使用SGD优化器的Attention U-Net原始模型提高了0.11%,4.14%,2.96%,3.58%和1.84%。结果表明,使用AdamW优化器引入CBAM的Attention U-Net能够较好地分割背景和木材表面裂纹,区分节点、表面纹理和木材裂纹,并将节点和表面纹理分割为背景。 展开更多
关键词 图像处理 语义分割 木材表面裂纹检测 深度学习 U-Net模型 注意力机制
在线阅读 下载PDF
基于双路径监督的遥感图像语义分割网络
3
作者 刘春娟 乔泽 +3 位作者 闫浩文 吴小所 王嘉伟 辛钰强 《北京航空航天大学学报》 北大核心 2025年第3期732-741,共10页
为解决遥感图像语义分割任务中目标物体边界分类模糊的问题,提出双路径监督与注意力筛选网络。引入可监督的边界提取模块来增加边界信息通道,提高边界信息在语义分割中的权重,增强对目标物体边界像素的注意力;引入注意力筛选模块,通过... 为解决遥感图像语义分割任务中目标物体边界分类模糊的问题,提出双路径监督与注意力筛选网络。引入可监督的边界提取模块来增加边界信息通道,提高边界信息在语义分割中的权重,增强对目标物体边界像素的注意力;引入注意力筛选模块,通过注意力图筛选出浅层网络中的空间细节信息和深层网络中的抽象语义信息,舍弃网络中的冗余信息,防止过拟合。双路径监督与注意力筛选网络在Potsdam数据集和Jiage数据集上的平均交并比分别为85.44%和86.07%,比次优网络MagNet和SAPNet分别提升了1.24%和1.28%、1.54%和1.27%。实验结果表明,所提网络能更精准地分割目标物体的边界。 展开更多
关键词 遥感图像 语义分割 可监督 边界信息 注意力筛选
在线阅读 下载PDF
一种基于轻量化卷积模块的语义分割网络
4
作者 连晓峰 康毛毛 +1 位作者 谭励 王艳莉 《应用科学学报》 北大核心 2025年第1期66-79,共14页
融合深度学习的语义同步定位与地图构建技术为处理动态场景提供了有效的解决方案,但仍面临计算资源消耗大和模型复杂度高的挑战。为此,提出了一种基于BlendMask改进的轻量化语义分割网络。首先,设计了一种轻量的GDS-ECA卷积(Ghost-depth... 融合深度学习的语义同步定位与地图构建技术为处理动态场景提供了有效的解决方案,但仍面临计算资源消耗大和模型复杂度高的挑战。为此,提出了一种基于BlendMask改进的轻量化语义分割网络。首先,设计了一种轻量的GDS-ECA卷积(Ghost-depthwise separable convolution with efficient channel attention)模块,利用深度可分离卷积替代Ghost卷积中的少量卷积操作,减少参数量和计算量,并添加注意力机制提升特征表达能力。其次,提出了特征提取网络BGTNet(bottleneck GDS-ECA attention transformer network),将GDS-ECA卷积应用于颈部模块的卷积层以提升网络的提取精度;此外,将特征金字塔网络(feature pyramid network,FPN)中的传统卷积替换为GDS-ECA卷积,构建轻量化特征金字塔网络,并结合BGTNet形成语义分割网络的主干网。最后在数据集COCO上进行了实验验证,改进后的模型处理图像时间缩短了7.3 ms,平均精度提升了1.5%。 展开更多
关键词 语义分割 同步定位与地图构建 轻量化 注意力机制 特征金字塔
在线阅读 下载PDF
基于双分支融合的图像实时语义分割方法
5
作者 宋玉琴 娄辉 +1 位作者 张琪 商纯良 《空军工程大学学报》 北大核心 2025年第2期62-70,共9页
针对现有实时语义分割网络分割多尺度目标时存在类别错分和分割不完整的问题,提出了一种基于双分支融合的图像实时语义分割方法。提出尺度注意融合模块,融合细节分支和语义分支提取到的目标空间特征和语义信息,以提高网络对多尺度目标... 针对现有实时语义分割网络分割多尺度目标时存在类别错分和分割不完整的问题,提出了一种基于双分支融合的图像实时语义分割方法。提出尺度注意融合模块,融合细节分支和语义分支提取到的目标空间特征和语义信息,以提高网络对多尺度目标识别的准确率。使用边缘损失函数引导细节分支学习目标边缘轮廓,增强网络对目标边缘细节的分割性能。最后,构建全局感知模块提高网络的全局上下文感知能力。实验结果表明:文中方法在CityScapes和CamVid数据集上平均交并比(mIoU)分别为78.1%和76.2%,平均像素准确率(mPA)分别为87.6%和85.4%,对于小尺度目标边缘实现了更精准的分割,且在一个GTX 1080Ti GPU上推理达到实时要求,帧速率(FPS)分别达到59.8和43.5。 展开更多
关键词 深度学习 实时语义分割 尺度注意 特征融合 全局感知
在线阅读 下载PDF
基于自注意力机制的高分遥感影像语义分割
6
作者 杨军 张金影 康玥 《哈尔滨工程大学学报》 北大核心 2025年第2期344-354,共11页
针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助... 针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助于捕获局部特征;在编码器分支中提出线性的多头自注意力模块以降低模型的计算复杂度;设计一个解码器来恢复特征图分辨率,通过级联操作整合各层级的特征并生成高分辨率的语义分割结果。所提算法在ISPRS Vaihingen和Potsdam数据集上的分割结果的mF1分别达到了90.77%和92.36%,与目前主流算法相比,不透水表面、建筑、低矮植物、树木类的分割准确率及总体分割准确率均有提高。本文算法构建的线性多头自注意力网络是一种高效的高分辨率遥感影像语义分割模型。 展开更多
关键词 高分辨率遥感影像 多头自注意力 深度可分离卷积 语义分割 特征提取 卷积神经网络 编码器 解码器
在线阅读 下载PDF
曲线和多头移动通道自注意力机制融合的点云语义分割
7
作者 卢健 郑雨飞 +2 位作者 梁有成 罗立果 苏盛斌 《西安工程大学学报》 2025年第2期28-38,共11页
针对点云语义分割中存在局部空间结构与深层次点云特征提取不充分问题,提出一种基于曲线和多头移动通道自注意力机制融合的三维点云语义分割网络。首先,曲线模块通过动态行走策略对点云进行分组和行走操作,获取远程点之间的关联性与几... 针对点云语义分割中存在局部空间结构与深层次点云特征提取不充分问题,提出一种基于曲线和多头移动通道自注意力机制融合的三维点云语义分割网络。首先,曲线模块通过动态行走策略对点云进行分组和行走操作,获取远程点之间的关联性与几何相关性。其次,引入多头移动通道自注意力机制模块,通过滑动窗口对通道进行划分,并构建多头自注意力聚合通道特征,以捕获点云深层次的语义信息。最后,提出了反向瓶颈模块,通过将低维度MLP嵌入到插值结构中加深网络的层次,增强特征的表达能力,同时有效改善了梯度消失和过拟合问题。实验结果表明:该模型在S3DIS第五区域数据集上的准确率为90.1%,平均交并比为68.6%;在ScanNet数据集上用于测试的平均交并比为70.9%。 展开更多
关键词 曲线模块 多头移动通道自注意力机制 点云 语义分割 深度学习
在线阅读 下载PDF
一种面向非结构化道路的点云语义分割方法 被引量:1
8
作者 王章宇 陈阳 +3 位作者 周彬 王杰 段星集 赵忠山 《北京航空航天大学学报》 北大核心 2025年第2期457-465,共9页
针对以露天矿区为代表的非结构化道路场景环境恶劣、道路边界模糊、障碍物尺寸差异较大等问题,提出一种面向非结构化道路的点云语义分割方法,包括预处理、特征提取网络及逆处理3部分。其中,预处理通过坐标转换将三维点云映射到二维Range... 针对以露天矿区为代表的非结构化道路场景环境恶劣、道路边界模糊、障碍物尺寸差异较大等问题,提出一种面向非结构化道路的点云语义分割方法,包括预处理、特征提取网络及逆处理3部分。其中,预处理通过坐标转换将三维点云映射到二维Range View(RV)图上,以提高网络推理速度;特征提取网络包括卷积注意力模块及多尺度残差模块,卷积注意力模块用于细化分割边界,解决道路边界模糊问题,多尺度残差模块使用大卷积核扩大感受野并融合上下采样特征,以适应非结构化道路环境下障碍物尺寸变化较大的问题;逆处理通过K最邻近(KNN)算法修正语义标签并将点云映射回三维空间。在典型非结构化道路露天矿区数据集上对所提方法进行测试,平均交并比达到85.1%,推理速度达到6.423 ms,与主流的基于球面投影的语义分割网络相比整体精度提升了3%,此外,所提方法在非结构化道路场景下进行了实际应用。 展开更多
关键词 三维点云 语义分割 非结构化道路 深度学习 注意力机制
在线阅读 下载PDF
基于改进U-Net3+的相控阵超声图像语义分割
9
作者 毛鑫玥 王慧锋 +2 位作者 周家乐 顾震 颜秉勇 《华东理工大学学报(自然科学版)》 北大核心 2025年第2期242-249,共8页
超声相控阵成像已广泛应用于聚乙烯燃气管道的焊接缺陷检测中,随着机器视觉技术的快速发展,利用机器辅助或自动化分析超声图像能极大地提高缺陷检测速度,减少人为判断失误的发生。在基于超声图像的焊接缺陷检测技术中,图像语义分割精度... 超声相控阵成像已广泛应用于聚乙烯燃气管道的焊接缺陷检测中,随着机器视觉技术的快速发展,利用机器辅助或自动化分析超声图像能极大地提高缺陷检测速度,减少人为判断失误的发生。在基于超声图像的焊接缺陷检测技术中,图像语义分割精度对缺陷类别和严重等级的判定至关重要。本文在U-Net3+网络的基础上提出一种融入残差及注意力机制的改进模型,并应用于电熔焊接缺陷检测的相控阵超声图像语义分割。首先,改进模型通过在编码器各层之间采用残差结构来提升编码器的图像特征提取能力;其次,通过在跳跃连接中引入卷积块注意力模块(Convolutional Block Attention Module,CBAM),加强模型对原始图像信息的利用率,使模型更易聚焦于原始图像中的有效区域。实验结果表明,改进后的模型在电熔焊接超声图像上具有良好的分割效果,在Dice、mIoU两项指标上,相比U-Net分别提升了8.81%和12.84%;相比U-Net3+的分割效果分别提升了1.09%和1.81%。 展开更多
关键词 相控阵超声图像 图像语义分割 U-Net3+ 注意力机制 残差网络
在线阅读 下载PDF
基于SC-TransUnet语义分割模型的焦炭基质提取
10
作者 张臻 阚秀 +1 位作者 孙维周 麻超 《东华大学学报(自然科学版)》 北大核心 2025年第1期147-154,共8页
焦炭基质的准确提取对于焦炭质量分析至关重要。针对焦炭基质结构复杂、边界不清晰以及显微图像含有白色光晕等问题,提出了一种基于SC-TransUnet语义分割模型的焦炭基质提取方法,模型通过CNN-Transformer混合结构进行高级语义信息提取,... 焦炭基质的准确提取对于焦炭质量分析至关重要。针对焦炭基质结构复杂、边界不清晰以及显微图像含有白色光晕等问题,提出了一种基于SC-TransUnet语义分割模型的焦炭基质提取方法,模型通过CNN-Transformer混合结构进行高级语义信息提取,增强对焦炭基质不规则结构的表征能力,通过多种注意力机制融合增强对焦炭复杂纹理特征的感知能力。与目前主流的分割模型相比,所设计的模型在焦炭基质提取中取得了更好的分割效果。试验证明该模型的A_(cc)、M_(iu)和F_(1s)分别达94.75%、89.96%和95.23%,可为焦炭基质自动提取提供一种可靠且高效的解决方案。 展开更多
关键词 焦炭基质提取 语义分割 SC-TransUnet 焦炭显微图像 CNN-Transformer 注意力机制
在线阅读 下载PDF
基于语义分割的乡村道路识别
11
作者 曹新宇 张太红 +1 位作者 赵昀杰 姚芷馨 《现代电子技术》 北大核心 2025年第2期179-186,共8页
针对目前智能农机在乡村复杂环境下行驶时对周围特征识别精度不足的问题,以乡村道路场景为研究对象,提出一种改进PP-LiteSeg模型。首先使用STDC对图像特征进行提取,在保证轻量化的同时确保特征信息完整;然后将条形池化引入简单金字塔模... 针对目前智能农机在乡村复杂环境下行驶时对周围特征识别精度不足的问题,以乡村道路场景为研究对象,提出一种改进PP-LiteSeg模型。首先使用STDC对图像特征进行提取,在保证轻量化的同时确保特征信息完整;然后将条形池化引入简单金字塔模块,加强特征的提取能力,并将坐标注意力加入统一注意力融合模块,进一步加强多尺度特征的融合,捕获更为丰富的信息,从而提高模型对乡村复杂场景识别的准确率。实验结果表明,在不同场景下,所提模型可以达到较好的分割效果,建筑物、柏油路、障碍等单个类别的准确率均达到80%以上,能够有效地分割乡村道路场景。改进模型可为智能农机在乡村道路场景下的安全行驶提供技术参考。 展开更多
关键词 语义分割 乡村道路 特征识别 条形池化 坐标注意力 场景分类 图像处理
在线阅读 下载PDF
嵌入注意力机制的车道线像素级识别算法研究
12
作者 肖庭舒 罗小龙 +2 位作者 相龙伟 陈阳光 王朋燕 《激光杂志》 北大核心 2025年第2期106-114,共9页
车辆自动行驶的安全性和稳定性离不开车道线准确识别。然而,日常驾驶中面临着复杂多变的天气和光照条件、道路标记模糊或遮挡等挑战。研究并设计基于深度神经网络的车道线识别算法,以提高识别技术在面对复杂环境的鲁棒性与检测结果精度... 车辆自动行驶的安全性和稳定性离不开车道线准确识别。然而,日常驾驶中面临着复杂多变的天气和光照条件、道路标记模糊或遮挡等挑战。研究并设计基于深度神经网络的车道线识别算法,以提高识别技术在面对复杂环境的鲁棒性与检测结果精度。通过构建以VGG-16为主链并嵌入通道注意力和空间注意力机制的全卷积神经网络模型,实现端到端像素级别的车道线语义分割。嵌入注意力模块的新模型在CULane通用数据集上验证结果同VGG-解码语义分割方法相比,其平均像素准确率与均交并比(Mean Intersection over Union, MIoU)分别提升2.2%与1.3%。且在车道线不存在场景下,预测结果的像素准确率达到70%。嵌入注意力机制的图像分割算法研究为车道线识别问题提供了有效解决方案,有力支撑车道线检测技术在无人驾驶场景的应用。 展开更多
关键词 注意力机制 深度神经网络 语义分割 车道线识别 图像分割
在线阅读 下载PDF
基于多尺度注意力U-Net的医学肝脏计算机断层扫描图片分割算法
13
作者 金涛 王震 李昭蒂 《哈尔滨工程大学学报》 北大核心 2025年第3期529-539,共11页
针对传统肝脏分割方法十分依赖医生的经验,并且分割过程耗时,易出错的现象,本文提出适用于临床情景中医学肝脏计算机断层扫描的分割方法。基于多尺度残差混合注意力U-Net将多尺度注意力机制模块引入U-Net网络。该模块可以抑制不相关的区... 针对传统肝脏分割方法十分依赖医生的经验,并且分割过程耗时,易出错的现象,本文提出适用于临床情景中医学肝脏计算机断层扫描的分割方法。基于多尺度残差混合注意力U-Net将多尺度注意力机制模块引入U-Net网络。该模块可以抑制不相关的区域,从多个角度提取图像特征,并突出显示分割任务;在标准卷积层中添加残差结构可以有效地避免梯度爆炸并增加网络深度;使用混合空洞注意力常规层来替换“U”形网络的底部,以获得上下文信息,避免空间信息的丢失。试验结果表明:在LiTS17和SLiver07数据集上与其他方法相比,本文方法具有更好的性能和最高的分割精度。 展开更多
关键词 神经网络 深度学习 语义分割 肝脏分割 医学图像 注意力机制 空洞卷积
在线阅读 下载PDF
基于VMF-UNet的液基细胞制染机缺陷图像分割
14
作者 田文豪 汪繁荣 乔一航 《现代电子技术》 北大核心 2025年第5期36-42,共7页
为了解决液基细胞制染机的成片效果缺陷识别问题,补偿设备最终成片率,文中提出一种VMF-UNet模型,模型以UNet为基础模型,使用VGG16Net的卷积部分替代UNet神经网络的编码器部分,加入多尺度高效局部注意力机制(MELA),引入特征细化模块(FRM)... 为了解决液基细胞制染机的成片效果缺陷识别问题,补偿设备最终成片率,文中提出一种VMF-UNet模型,模型以UNet为基础模型,使用VGG16Net的卷积部分替代UNet神经网络的编码器部分,加入多尺度高效局部注意力机制(MELA),引入特征细化模块(FRM),解决了图像过分割、欠分割、成片缺陷区域边缘不明显、UNet模型视野受限的问题。实验以医学检验可用性为原则,将显微镜下分割的数据集标准标签作为“金标准”。基于自建液基细胞成片缺陷区图像数据集的实验表明,改进网络在分割时平均交并比(MIo U)、平均像素精确度(MPA)、F1-score与准确率(Accuracy)分别为:82.73%、93.56%、81.93%、96.10%。实验结果证明,VMF-Unet模型对液基细胞制染机成片缺陷区域分割效果更好,可以有效补偿液基细胞制染机的最终成片率,为设备复处理提供有效依据,提高液基细胞制染机的广泛可应用性。 展开更多
关键词 深度学习 语义分割 UNet 注意力机制 缺陷检测 液基细胞制染机
在线阅读 下载PDF
CAMF-Net:基于上下文感知的高分辨率无人机图像语义分割模型
15
作者 程尧 左伟庆 +4 位作者 崔泽宇 夏国臻 刘诚锴 周晨 郭兰图 《湘潭大学学报(自然科学版)》 2025年第1期36-52,共17页
该文首先介绍了校园场景无人机图像语义分割数据集,这是一个用于校园场景语义分割的新型高分辨率无人机图像数据集.该数据集包含2 767张航拍图像,每张图像都标注了5个类别,用于语义注释任务.此外,通过采用交叉注意力来增强传统的U-Net架... 该文首先介绍了校园场景无人机图像语义分割数据集,这是一个用于校园场景语义分割的新型高分辨率无人机图像数据集.该数据集包含2 767张航拍图像,每张图像都标注了5个类别,用于语义注释任务.此外,通过采用交叉注意力来增强传统的U-Net架构,有效地融合不同分辨率下的特征,促进特征交互.这种方法解决了传统U-Net中由于下采样导致的层间信息分布不均匀的问题,确保了各级特征的完整性,从而更全面地表征图像.在校园场景无人机图像语义分割数据集上的验证显示,与其他经典方法相比,该文的方法将平均交并比提高了约2.3%.校园场景无人机图像语义分割数据集现可通过以下链接下载:https://drive.google.com/file/d/1rm-9MumRAXhe_jrFJ0igyDDiflfExvuD/view?usp=drive_link. 展开更多
关键词 无人机 语义分割 数据集 U-Net 交叉注意力 多尺度融合
在线阅读 下载PDF
融合注意力机制的弱监督语义分割自激活方法
16
作者 周凯 于莲芝 《电子科技》 2025年第4期80-86,共7页
弱监督语义分割以类激活图进行训练,但类激活图与真实像素级标签存在较大差距。针对弱监督语义分割类激活图定位信息少、分割结果的轮廓粗糙问题,文中提出基于注意力机制的弱监督语义分割自激活模型。利用仿射变化引入全监督方法中的隐... 弱监督语义分割以类激活图进行训练,但类激活图与真实像素级标签存在较大差距。针对弱监督语义分割类激活图定位信息少、分割结果的轮廓粗糙问题,文中提出基于注意力机制的弱监督语义分割自激活模型。利用仿射变化引入全监督方法中的隐性约束,提取分类网络浅层信息并融合注意力机制。利用增强后的浅层信息细化类激活图的轮廓,根据生成的类激活图对特征图进行自激活,从而生成最终的类激活图。在PASCAL VOC 2012数据集上进行实验,相较于近期先进模型,类激活图的平均交并比提升了1.7%,最终分割结果的平均交并比提升了2.4%。通过对模型进行消融实验验证了各模块的有效性。 展开更多
关键词 弱监督方法 语义分割 类激活图 注意力机制 卷积神经网络 自激活方法 仿射变换 浅层网络 隐性约束
在线阅读 下载PDF
基于跨模态融合的玻璃类似物分割方法
17
作者 万应才 房立金 赵乾坤 《东北大学学报(自然科学版)》 北大核心 2025年第1期1-8,共8页
玻璃和镜子等物体因缺乏明显纹理和形状,使得传统语义分割方法难以有效识别,影响视觉任务准确性.为了解决这个问题提出了一种基于Transformer的RGBD跨模态融合方法,用于玻璃类似物的分割.该方法采用Transformer网络,通过跨模态融合模块... 玻璃和镜子等物体因缺乏明显纹理和形状,使得传统语义分割方法难以有效识别,影响视觉任务准确性.为了解决这个问题提出了一种基于Transformer的RGBD跨模态融合方法,用于玻璃类似物的分割.该方法采用Transformer网络,通过跨模态融合模块提取RGB和深度特征的自注意力,并利用多层注意力机制(MLP)整合RGBD特征,实现3种注意力特征的融合.RGB和深度特征被反馈到各自分支,以增强网络的特征提取能力.最终,语义分割解码器结合4个阶段的融合特征输出玻璃类似物的分割结果.结果表明,本文方法与EBLNet方法相比在GDD,Trans10k和MSD数据集上的交并比分别提高1.64%,2.26%,7.38%,与PDNet方法比较在RGBD-Mirror数据集上交并比提高了9.49%,验证了其有效性. 展开更多
关键词 注意力 语义分割 玻璃类似物 跨模态 深度估计
在线阅读 下载PDF
基于轴向注意力的多任务自动驾驶环境感知算法
18
作者 李沈崇 曾新华 林传渠 《浙江大学学报(工学版)》 北大核心 2025年第4期769-777,803,共10页
为了满足自动驾驶要求并提升多模型间的协同效果,基于共享主干网络提出新的算法.为了提升模型的位置表达能力,将轴向注意力机制加入主干网络,在保持轻量化特征提取的前提下建立全局关键点间的联系.在多尺度信息提取阶段,引入自适应权重... 为了满足自动驾驶要求并提升多模型间的协同效果,基于共享主干网络提出新的算法.为了提升模型的位置表达能力,将轴向注意力机制加入主干网络,在保持轻量化特征提取的前提下建立全局关键点间的联系.在多尺度信息提取阶段,引入自适应权重分配方法和三维注意力机制,降低不同尺度特征间的信息冲突.根据难分样本区域优化损失函数,加强所提算法在难样本区域的细节识别能力.在BDD100K数据集上的实验结果表明,相比YOLOP,所提算法在交通目标检测任务中的平均精度均值(在IoU=50%的情况下)提高了3.3个百分点,在道路可行驶区域分割任务中的mIoU提升了1.0个百分点,车道线检测准确率提升了6.7个百分点,推理速度为223.7帧/s.所提算法在交通目标检测、可行驶区域分割和车道线检测任务上了均表现出良好的性能,能够较好平衡检测精度与推理速度. 展开更多
关键词 多任务学习 目标检测 语义分割 自动驾驶 特征融合 轴向注意力
在线阅读 下载PDF
基于特征拓展及分离池化的点云语义分割
19
作者 陈崇明 郁金星 +3 位作者 韩璐 王浩然 张佃卯 陈器 《激光与红外》 北大核心 2025年第1期40-45,共6页
电力场景的三维语义信息识别是其后续精细化管理的基础和关键,然而,由于电力场景地物结构信息复杂、纹理多样,为其精细化理解与识别带来了一定的困难和挑战。本文提出了一种基于改进RandLA-Net的电力场景点云语义分割方法,该方法通过引... 电力场景的三维语义信息识别是其后续精细化管理的基础和关键,然而,由于电力场景地物结构信息复杂、纹理多样,为其精细化理解与识别带来了一定的困难和挑战。本文提出了一种基于改进RandLA-Net的电力场景点云语义分割方法,该方法通过引入特征拓展和分离池化操作来提高模型的性能,并在电力数据集上测试了该方法的实际效果,将其与现有的语义分割方法进行了比较。结果表明,该方法在准确性和效率方面具有很强的优势,综合对比来看,比前沿的RandLA-Net(Random Sampling and Local Feature Aggregator Network)提高了2.64和2.9的总体精度及平均交并比值,验证了该方法的有效性。 展开更多
关键词 特征拓展 分离池化 电力场景 点云语义分割 自注意力机制
在线阅读 下载PDF
集加权K近邻与卷积块注意力的三维点云语义分割
20
作者 肖剑 王晓红 +3 位作者 周润民 李炜 杨祎斐 罗季 《激光杂志》 北大核心 2025年第2期225-231,共7页
基于深度学习的点云语义分割模型在改进模型时多采用复杂度高的注意力机制,而且在提取局部深度语义特征和近邻点特征表达中存在不足。因此,提出集加权K近邻与卷积块注意力的点云语义分割模型。在动态图卷积网络架构上,设计加权K近邻算... 基于深度学习的点云语义分割模型在改进模型时多采用复杂度高的注意力机制,而且在提取局部深度语义特征和近邻点特征表达中存在不足。因此,提出集加权K近邻与卷积块注意力的点云语义分割模型。在动态图卷积网络架构上,设计加权K近邻算法以获取更有效的局部邻域;再引入通卷积块注意力处理局部邻域中特征;在卷积块注意力中,通道注意力用于加强点云通道关联,空间注意力用于感知三维空间结构并获取上下文信息及深度语义特征。实验结果表明,该模型在ShapeNet Part部件分割数据集和S3DIS室内语义分割数据集分别达到85.86%和61.2%的平均交并比,相比其他方法具有较高的分割精度。 展开更多
关键词 语义分割 三维点云 动态图卷积网络 K近邻 卷积块注意力
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部