期刊文献+
共找到293篇文章
< 1 2 15 >
每页显示 20 50 100
基于深度学习的RGB-D图像显著性目标检测前沿进展 被引量:1
1
作者 黄年昌 杨阳 +1 位作者 张强 韩军功 《计算机学报》 北大核心 2025年第2期284-316,共33页
显著性目标检测是计算机视觉领域的基础问题之一,旨在对图像中最吸引人注意的目标进行检测和分割。随着深度学习技术的发展,基于RGB(Red-Green-Blue)图像的显著性目标检测算法取得了巨大进步,在简单场景下已经取得较为满意的结果。然而... 显著性目标检测是计算机视觉领域的基础问题之一,旨在对图像中最吸引人注意的目标进行检测和分割。随着深度学习技术的发展,基于RGB(Red-Green-Blue)图像的显著性目标检测算法取得了巨大进步,在简单场景下已经取得较为满意的结果。然而,局限于可见光相机的成像能力,RGB图像易受到光照条件的影响,且无法捕捉场景的三维空间信息。相应地,基于RGB图像的显著性目标检测算法通常难以在一些复杂场景下取得较好的检测效果。近年来,随着深度成像技术不断发展和硬件成本不断降低,深度相机得到了广泛应用。其捕获的场景空间信息,与可见光图像获取的场景细节信息相互补充,有助于提升复杂场景下显著性目标检测性能。因此,RGB-深度(RGB-Depth,RGB-D)图像显著性目标检测引起了学者广泛研究。本文对近期基于深度学习的RGB-D图像显著性目标检测算法进行了整理和分析。首先,分析了多模态RGB-D图像显著性目标检测所面临的关键问题,并以此对现有算法解决这些关键问题的主要思路和方法进行了总结和梳理。然后,介绍了用于RGB-D图像显著性目标检测算法研究的主流数据集和常用性能评价指标,并对各类主流模型进行了定量比较和定性分析。最后,本文进一步分析了RGB-D图像显著性目标检测领域有待解决的问题,同时对今后可能的研究趋势进行了展望。 展开更多
关键词 显著目标检测 RGB图像 深度图像 深度学习 多模态图像处理
在线阅读 下载PDF
基于多尺度模态融合的RGB-D显著性目标检测网络
2
作者 于明 唐世辰 刘依 《计算机应用研究》 北大核心 2025年第11期3506-3511,共6页
显著性目标检测任务旨在自动定位场景中最吸引人的物体。针对显著性目标检测算法中跨模态互补特征难以充分利用和层级特征融合易丢失有用信息的问题,提出一种基于多尺度模态融合的RGB-D显著性目标检测网络(MMFNet)。该模型主要由多尺度... 显著性目标检测任务旨在自动定位场景中最吸引人的物体。针对显著性目标检测算法中跨模态互补特征难以充分利用和层级特征融合易丢失有用信息的问题,提出一种基于多尺度模态融合的RGB-D显著性目标检测网络(MMFNet)。该模型主要由多尺度模态增强模块和并行多层解码结构组成。多尺度模态增强模块以空洞卷积细化多模态特征,通过注意力机制融合不同感受野特征减少冗余信息。并行多层解码结构采用级联的双解码器设计,以通道注意力机制实现层级特征的自适应校准,进一步优化预测的显著图,学习到更多的跨层级信息。在四个基准数据集上的实验表明,该网络模型在四种评价指标上优于近年来的九种先进方法,获得了优异的性能。 展开更多
关键词 rgb-d显著目标检测 多尺度模态增强 注意力机制 并行多层解码
在线阅读 下载PDF
HDF+:一种新的RGB-D显著性目标检测网络模型
3
作者 吴映霓 闫河 +1 位作者 姜彬 蔡朝安 《小型微型计算机系统》 北大核心 2025年第7期1645-1651,共7页
用于显著性目标检测的HDFNet模型在其编码阶段和解码阶段均缺乏有效的特征信息表示能力,分别由于其编码阶段仅把RGB特征和Depth特征进行简单相加,且解码阶段在多次上采样中缺乏有效监督,从而导致检测精度有待进一步提升.本文提出了一种... 用于显著性目标检测的HDFNet模型在其编码阶段和解码阶段均缺乏有效的特征信息表示能力,分别由于其编码阶段仅把RGB特征和Depth特征进行简单相加,且解码阶段在多次上采样中缺乏有效监督,从而导致检测精度有待进一步提升.本文提出了一种新的RGB-D显著性目标检测模型HDF+.首先,在编码阶段构建了非对称融合模块,该模块通过非对称的方式融合RGB特征和Depth特征,有效利用RGB特征的语义信息及Depth特征的空间细节信息;其次,在解码阶段采用多个深度监督模块对网络进行监督训练,并在各监督层引入IoU损失作为前景损失替换原来的区域增强损失.对比实验结果表明,本文的方法优于主流的RGB-D显著性目标检测方法. 展开更多
关键词 rgb-d 显著目标检测 非对称融合 深度监督
在线阅读 下载PDF
面向红外目标检测的显著特征测试样本排序方法
4
作者 陈晋音 严云杰 郑海斌 《小型微型计算机系统》 北大核心 2025年第8期2007-2015,共9页
红外目标检测是指在红外图像中确定目标对象的位置和类别,在自动驾驶、安防监控和电气设备检修等领域应用广泛.然而,由于深度模型存在脆弱性,红外目标检测模型容易受到对抗样本的攻击,因此对其展开安全性测试至关重要.测试样本优先级排... 红外目标检测是指在红外图像中确定目标对象的位置和类别,在自动驾驶、安防监控和电气设备检修等领域应用广泛.然而,由于深度模型存在脆弱性,红外目标检测模型容易受到对抗样本的攻击,因此对其展开安全性测试至关重要.测试样本优先级排序方法可通过对待测样本的优先级排序实现高效测试,并通过样本重训练提高模型的鲁棒性.针对现有的优先级排序测试方法存在无法适用红外目标图像的目标检测任务的问题,本文提出了一种基于显著特征的红外目标检测模型的测试样本优先级排序方法,简称SigPri,使用傅里叶变换和模型反向传播梯度筛选红外目标的关键轮廓像素特征,通过原样本与变异样本输入深度模型时激活神经元值的变化筛选关键神经元,对筛选出的关键像素特征和关键神经元实现模型变异,最后将待测样本分别输入原始模型和变异模型,通过其输出差异判定样本优先级,从而实现测试样本优先级排序.最后在不同模型和数据集上展开实验,验证了提出SigPri方法的平均排序效果(RAUC)比现有最优算法提高了9.39%.本文相关的数据集和代码公开在连接:https://github.com/TDY-raedae/infraprio. 展开更多
关键词 显著特征 红外目标检测 样本优先级排序 关键像素变异 关键神经元变异
在线阅读 下载PDF
自适应卷积注意力与掩码结构协同的显著目标检测
5
作者 朱磊 袁金垚 +1 位作者 王文武 蔡小嫚 《电子与信息学报》 北大核心 2025年第1期260-270,共11页
显著目标检测(SOD)旨在模仿人类视觉系统注意力机制和认知机制来自动提取场景中的显著物体。虽然现有基于卷积神经网络(CNN)或Transformer的模型不断刷新该领域方法的性能,但较少研究关注以下两个问题:(1)此领域多数方法常采用逐像素点... 显著目标检测(SOD)旨在模仿人类视觉系统注意力机制和认知机制来自动提取场景中的显著物体。虽然现有基于卷积神经网络(CNN)或Transformer的模型不断刷新该领域方法的性能,但较少研究关注以下两个问题:(1)此领域多数方法常采用逐像素点的密集预测方式以获取像素显著值,然而该方式不符合基于人类视觉系统的场景解析机制,即人眼通常对语义区域进行整体分析而非关注像素级信息;(2)增强上下文信息关联在SOD任务中受到广泛关注,但通过Transformer主干结构获取长程关联特征不一定具有优势。SOD应更关注目标在适当区域内其中心-邻域差异性而非全局长程依赖。针对上述问题,该文提出一种新的显著目标检测模型,将CNN形式的自适应注意力和掩码注意力集成到网络中,以提高显著目标检测的性能。该算法设计了基于掩码感知的解码模块,通过将交叉注意力限制在预测的掩码区域来感知图像特征,有助于网络更好地聚焦于显著目标的整体区域。同时,该文设计了基于卷积注意力的上下文特征增强模块,与Transformer逐层建立长程关系不同,该模块仅捕获最高层特征中的适当上下文关联,避免引入无关的全局信息。该文在4个广泛使用的数据集上进行了实验评估,结果表明,该文提出的方法在不同场景下均取得了显著的性能提升,具有良好的泛化能力和稳定性。 展开更多
关键词 显著目标检测 卷积神经网络形式的自适应注意力 掩码注意力 特征增强
在线阅读 下载PDF
场景结构知识增强的协同显著性目标检测 被引量:1
6
作者 胡升龙 陈彬 +1 位作者 张开华 宋慧慧 《计算机工程》 北大核心 2025年第1期31-41,共11页
现有的协同显著性目标检测(CoSOD)方法通过挖掘组内一致性与组间差异性来学习判别性表征,这种范式因缺乏语义标签的引导导致所学表征的判别性受限,难以应对复杂的非协同目标的干扰。为了解决这一问题,提出一种新的场景结构知识增强的Co... 现有的协同显著性目标检测(CoSOD)方法通过挖掘组内一致性与组间差异性来学习判别性表征,这种范式因缺乏语义标签的引导导致所学表征的判别性受限,难以应对复杂的非协同目标的干扰。为了解决这一问题,提出一种新的场景结构知识增强的CoSOD模型SSKNet。SSKNet利用大模型mPlug构建目标间场景结构语义关系并通过分割一切模型(SAM)将这种结构语义关系转移到最终的协同显著性结果中。具体来说:首先,为了学习语义知识,引入图像场景理解大模型,对图像组中的图像进行理解,并得到表示结构语义的文本描述组,这些文本描述组以文本的形式描述图像的显著内容;接着,为了获取协同显著信息,设计协同提示提取(CoPE)模块,通过在一组描述文本中使用协同注意力机制获取协同显著文本;最后,为了将协同显著文本转化为协同显著掩码,引入SAM,将协同显著文本以文本提示的方式引导SAM分割协同显著目标,获取最终的协同显著检测掩码。在3个公开数据集CoSal2015、CoCA和CoSOD3k上的实验结果表明,SSKNet模型的综合评估指标Fβ的取值分别为0.910、0.750和0.887,达到了先进水平。 展开更多
关键词 场景结构知识 大模型 分割一切模型 协同显著目标检测 深度学习
在线阅读 下载PDF
文本模态辅助的RGB显著性目标检测
7
作者 韩春禹 马骏 +4 位作者 沙洪涵 肖鑫 陆晨凯 颜鑫 张霞 《计算机工程与应用》 北大核心 2025年第17期259-271,共13页
显著性目标检测是从图片或视频中寻找客观上最具显著性的物体的过程。针对在杂乱且前背景区分度较低的场景中检测性能下降的问题,提出了一种基于文本信息辅助的显著性目标检测模型。所提出的模型通过融合RGB特征和图像描述网络生成的图... 显著性目标检测是从图片或视频中寻找客观上最具显著性的物体的过程。针对在杂乱且前背景区分度较低的场景中检测性能下降的问题,提出了一种基于文本信息辅助的显著性目标检测模型。所提出的模型通过融合RGB特征和图像描述网络生成的图像字幕文本信息,以捕捉场景中大多数对象的语义信息,从而抑制背景噪声、增强网络对目标的表征能力。同时提出跨模态指导融合模块,利用自交互和互交互的方式有效融合文本模态和RGB模态。针对全局注意力机制容易忽略细节信息的问题,提出了混合注意力模块,在全局和局部层次上建模上下文信息,从而进一步提高预测的准确性。在通用指标如平均绝对误差(MAE)、结构相似度(S)、加权F值(FW)上,实验证明了所提出模型的有效性。 展开更多
关键词 显著目标检测 多模态 神经网络 文本信息
在线阅读 下载PDF
基于Transformer全局-局部特征融合的RGB-D显著性检测 被引量:1
8
作者 宋梦柯 王芸 郑元超 《计算机应用与软件》 北大核心 2025年第3期176-182,共7页
现有的RGB-D方法一般通过局部操作分别应用多尺度和多模态融合,但这无法捕获远程依赖性,因此对特征整体表征能力不足。针对此问题,提出一种全局-局部特征融合网络。在低层特征提取阶段,将两个分支特征直接融合;在高层特征提取阶段,将融... 现有的RGB-D方法一般通过局部操作分别应用多尺度和多模态融合,但这无法捕获远程依赖性,因此对特征整体表征能力不足。针对此问题,提出一种全局-局部特征融合网络。在低层特征提取阶段,将两个分支特征直接融合;在高层特征提取阶段,将融合后特征送入Transformer编码器通过在所有位置同时整合多尺度和多模态的特征来进行充分的特征融合,获得全局特征依赖关系之后再送入主干网络提取全局—局部融合特征。同时提出双重注意力模块,用来增强两个分支特征的融合效果。在五个公开数据集上进行的实验表明,该网络在三个评价指标上均取得了较好的表现。 展开更多
关键词 rgb-d显著检测 全局-局部特征 跨模态融合 多尺度 TRANSFORMER
在线阅读 下载PDF
RGB深度图像显著性目标检测方法设计
9
作者 王雨夕 徐杨 袁旭祥 《液晶与显示》 北大核心 2025年第4期607-616,共10页
为了高效利用深度特征信息辅助显著性检测,实现对不同尺度特征信息的融合,本文提出了一种基于CDINet算法改进的RGB-D图像显著性目标检测算法。首先,添加了多尺度特征融合模块用来加强编码器和解码器之间特征信息的传输,有效减少浅层特... 为了高效利用深度特征信息辅助显著性检测,实现对不同尺度特征信息的融合,本文提出了一种基于CDINet算法改进的RGB-D图像显著性目标检测算法。首先,添加了多尺度特征融合模块用来加强编码器和解码器之间特征信息的传输,有效减少浅层特征丢失,通过辅助解码器的跳跃连接获得更多的显著物体的特征信息。接着,在CDINet的网络结构尾部连接了一个循环注意力模块,通过使用面向记忆的场景理解功能,逐渐优化局部细节。最后,对损失函数进行调整,使用一致性增强损失(CEL)处理因为不同尺度特征融合产生的空间一致性等问题,并在不增加参数的情况下均匀突出显著区域。实验结果表明,改进后的模型与原CDINet算法模型相比,在LFSD数据集上的F-measure提高了0.6%,MAE下降了0.4%;在STERE数据集上的F-measure提高了0.4%,S-measure提升了0.5%。相对于其他算法模型,本模型基本满足检测性能更好、适应性更高等要求。 展开更多
关键词 显著目标检测 计算机视觉 边缘检测 深度学习
在线阅读 下载PDF
基于无监督的西藏古建筑室内显著性目标检测
10
作者 罗骞 杨晓波 +3 位作者 李建邦 许应成 周明强 王怡彤 《实验室研究与探索》 北大核心 2025年第3期101-107,共7页
针对西藏室内复杂纹理背景下显著性目标检测算法难以全面标记显著区域的问题,在A2SNet模型基础上提出改进的MA2SNet模型。引入高效通道注意力模块,增强预训练模型对复杂场景的检测能力;添加基于区域扩张的冲量策略,结合高置信度标签和... 针对西藏室内复杂纹理背景下显著性目标检测算法难以全面标记显著区域的问题,在A2SNet模型基础上提出改进的MA2SNet模型。引入高效通道注意力模块,增强预训练模型对复杂场景的检测能力;添加基于区域扩张的冲量策略,结合高置信度标签和噪声线索,提高伪标签的全面性和准确性;改进实时标签纠正策略,实时优化伪标签质量。采用深度学习的无监督显著性目标检测方法,降低了为众多物品手动注释标签的人力成本。实验结果表明,F_(2)和召回率相较于基线模型,在西藏数据集和公共数据集都有所提高,可稳定、全面地检测图像占比大于40%的单物体显著目标。 展开更多
关键词 无监督学习 显著目标检测 西藏古建筑 冲量扩张 室内检测
在线阅读 下载PDF
基于深度学习网络显著目标检测算法的强降水落区临近预报技术
11
作者 张亚萍 刘伯骏 +3 位作者 庞玥 张焱 张勇 黎中菊 《气象学报》 北大核心 2025年第2期334-349,共16页
降水持续时间相同时,降水强度越大,诱发城市积涝、山洪、泥石流、滑坡等次生灾害的可能性越大。在全球气候变暖的背景下,亚小时降水极端事件比小时以上时间尺度的极端事件增加得更快,有必要研究亚小时尺度上的强降水监测预警技术。选取 ... 降水持续时间相同时,降水强度越大,诱发城市积涝、山洪、泥石流、滑坡等次生灾害的可能性越大。在全球气候变暖的背景下,亚小时降水极端事件比小时以上时间尺度的极端事件增加得更快,有必要研究亚小时尺度上的强降水监测预警技术。选取 2013-2021 年重庆地区 30 次暴雨天气过程,以显著目标检测深度网络 U2-Net 为基础,将 30 min 短时强降水落区作为显 著目标,天气雷达反射率因子拼图作为输入,通过数据驱动方式自动学习某一时次的天气雷达反射率因子空间分布与其后 30 min 的强降水落区的非线性关系,进行强降水落区预报。强降水落区标签按照 10、20 和 30 mm 阈值分为 3 种,由雷达融合地面分钟 级雨量的定量降水估计得到。模型输入为 3、4.5 和 7 km 高度的雷达反射率因子拼图。经过训练和验证,得到针对 3 种强降水阈 值的 3 个强降水落区预报模型。对测试集的检验结果表明,当邻域半径为 5 km 时,10、20 和 30 mm 阈值模型输出的命中率分别 为 0.66、 0.73 和 0.72,虚警率分别为 0.06、 0.32 和 0.57,临界成功指数分别为 0.64、 0.54 和 0.37;强降水落区预报图中的概率越大, 对强降水落区的预报越可靠。综上所述,强降水落区预报模型通过提取单个时次的三维反射率因子多尺度特征,预报未来 30 min 强降水落区,可以有效补充雨量计布设稀疏地区的强降水监测和预报信息,也为需要提取多源探测资料多尺度特征的临近预报 技术研究提供参考。 展开更多
关键词 显著目标检测 深度网络 天气雷达 短时强降水 临近预报
在线阅读 下载PDF
基于多模态特征对齐的弱对齐RGBT显著目标检测
12
作者 刘成壮 翟素兰 +1 位作者 刘海庆 王鲲鹏 《计算机科学》 北大核心 2025年第7期142-150,共9页
可见光和热红外(RGBT)显著目标检测(SOD)旨在从可见光和热红外图像中识别共同的显著物体。然而,现有技术大多在完全对齐的图像对上进行训练,忽略了实际成像过程中由传感器差异造成的“弱对齐”问题,即同一物体在不同模态中虽然结构相关... 可见光和热红外(RGBT)显著目标检测(SOD)旨在从可见光和热红外图像中识别共同的显著物体。然而,现有技术大多在完全对齐的图像对上进行训练,忽略了实际成像过程中由传感器差异造成的“弱对齐”问题,即同一物体在不同模态中虽然结构相关,但是它们的位置、尺度存在差异。因此,如果不经对齐处理,直接使用弱对齐RGBT图像训练模型,会导致检测性能严重下降。为应对这一挑战,提出了一个多模态特征对齐融合网络(AFNet),专门针对弱对齐RGBT SOD。该网络由3个主要模块组成:分布对齐模块(DAM)、注意力引导的可变形卷积对齐模块(AGDCM)和交叉融合模块(CAM)。DAM基于最优传输理论,使热红外和RGB特征的分布尽可能接近,实现特征的初步对齐。AGDCM基于可变形卷积,在学习特征偏移量的过程中引入注意力权重,使不同的区域可以学习到适合自身的偏移量,实现多模态特征的精准对齐。CAM通过交叉注意力机制融合对齐后的特征,增强融合特征的判别能力并提高计算效率。通过在对齐和弱对齐数据集上进行大量实验,证明了所提方法的高效性。 展开更多
关键词 弱对齐RGBT图像 显著目标检测 多模态特征对齐 多模态特征融合 注意力机制
在线阅读 下载PDF
基于无源领域自适应的低光照显著性目标检测
13
作者 李书玮 黄正翔 +5 位作者 胡云 刘兴 卢笑 郭畅 吴成中 王耀南 《计算机工程》 北大核心 2025年第4期75-84,共10页
为了解决低光照条件下校园环境等场景监控摄像头图像质量和监控效果受影响而带来的安全问题,提出一种低光照显著性目标检测(SOD)方法,以提高低光照条件下目标检测能力。针对低光照条件下图像的显著性特征弱化和缺乏大规模标注数据的问题... 为了解决低光照条件下校园环境等场景监控摄像头图像质量和监控效果受影响而带来的安全问题,提出一种低光照显著性目标检测(SOD)方法,以提高低光照条件下目标检测能力。针对低光照条件下图像的显著性特征弱化和缺乏大规模标注数据的问题,提出一种无源领域自适应(SFDA)方法,将正常光照图像(源域)下训练的模型知识迁移至低光照条件图像(目标域)。该方法采用两阶段策略:在第一阶段,利用源域模型生成低光照图像的伪标签,为提高伪标签生成的质量,提出集合熵最小化损失抑制高熵区域,同时引入选择性投票方法来增强伪标签的生成;在第二阶段,采用基于增强引导一致性的教师-学生网络自训练方法对显著图进行精细化,进一步提高检测结果的精度。在SOD-LL数据集上的实验结果表明,所提出的方法在低光照场景下总体性能优于其他图像显著性检测方法,相较于正常光照的SOD方法,其平均绝对误差(MAE)降低15.15%,加权F1值(wFm)提高4.73%。 展开更多
关键词 显著目标检测 低光照场景 无源领域自适应 伪标签 教师-学生网络 集合熵最小化 选择性投票
在线阅读 下载PDF
基于稀疏对比自蒸馏的RGB-D显著性物体检测
14
作者 于洋洋 吴敦全 陈程立诏 《计算机工程》 北大核心 2025年第10期327-335,共9页
近年来,红绿蓝-深度(RGB-D)显著性目标检测技术取得了巨大进展,性能得到显著提高。然而,该技术依赖于复杂且资源密集的网络架构,无法应用于资源受限环境。虽然,轻量级网络在尺寸和速度上有所改善,但往往以牺牲性能为代价。为了克服上述... 近年来,红绿蓝-深度(RGB-D)显著性目标检测技术取得了巨大进展,性能得到显著提高。然而,该技术依赖于复杂且资源密集的网络架构,无法应用于资源受限环境。虽然,轻量级网络在尺寸和速度上有所改善,但往往以牺牲性能为代价。为了克服上述限制,提出了一种新颖的轻量化解决方案,以实现网络参数的精简和性能的提升。本文提供了一种有效的通用训练策略,提出稀疏对比自蒸馏技术。该技术旨在对现有的RGB-D显著性检测模型进行压缩和加速,同时增强模型性能。本文方法由两个关键技术组成:稀疏自蒸馏和对抗性对比学习。稀疏自蒸馏排除显著性检测模型中的非必要参数,同时保留关键参数,从而实现更高效和有效的显著性预测。而对抗性对比学习通过纠正潜在错误,进一步完善自蒸馏过程,以提高模型的整体性能。在NJUD、NLPR、LFSD、ReDWeb-S和COME15K等基准数据集上的实验结果显示,与现有SOTA(State-of-The-Art)方法相比,本文方法能够产生更为准确的显著性检测结果。此外,本文方法与现有SOTA轻量级RGB-D显著性检测模型的比较结果进一步证实了本文方法在不牺牲性能的前提下能够在模型尺寸减小和性能提升之间实现平衡。 展开更多
关键词 红绿蓝-深度(rgb-d)显著目标检测 稀疏自蒸馏 对比学习
在线阅读 下载PDF
RGB-T显著性目标检测综述
15
作者 吴锦涛 王安志 任春洪 《红外技术》 北大核心 2025年第1期1-9,共9页
除RGB图像外,热红外图像也能提取出对显著性目标检测至关重要的显著性信息。热红外图像随着红外传感设备的发展和普及已经变得易于获取,RGB-T显著性目标检测已成为了热门研究领域,但目前仍缺少对现有方法全面的综述。首先介绍了基于机... 除RGB图像外,热红外图像也能提取出对显著性目标检测至关重要的显著性信息。热红外图像随着红外传感设备的发展和普及已经变得易于获取,RGB-T显著性目标检测已成为了热门研究领域,但目前仍缺少对现有方法全面的综述。首先介绍了基于机器学习的RGB-T显著性目标检测方法,然后着重介绍了两类基于深度学习的RGB-T显著性目标检测方法:基于卷积神经网络和基于Vision Transformer的方法。随后对相关数据集和评价指标进行介绍,并在这些数据集上对代表性的方法进行了定性和定量的比较分析。最后对RGB-T显著性目标检测面临的挑战及未来的发展方向进行了总结与展望。 展开更多
关键词 显著目标检测 热红外图像 RGB-T显著目标检测 深度学习
在线阅读 下载PDF
基于深度网络特征交互的RGB-T显著目标检测
16
作者 魏明军 杨轩 +2 位作者 葛一珲 刘亚志 李辉 《电子测量技术》 北大核心 2025年第13期174-182,共9页
针对现有方法中多模态间的互补信息利用不充分、特征交互易引入噪声的问题,提出了一种深度特征交互网络。首先,在编码阶段提出了深度特征多层交互模块,使用深度特征作为特征交互的线索,以充分利用可见光的纹理信息和热成像的位置信息。... 针对现有方法中多模态间的互补信息利用不充分、特征交互易引入噪声的问题,提出了一种深度特征交互网络。首先,在编码阶段提出了深度特征多层交互模块,使用深度特征作为特征交互的线索,以充分利用可见光的纹理信息和热成像的位置信息。其次,设计了纹理位置特征交互模块,通过纹理信息与位置信息进行交互以实现同层级间的特征互补。然后,在解码阶段提出了膨胀卷积特征融合模块,通过膨胀卷积块提高模型感受野,使模型关注网络中的多尺度信息。最后,在公共RGB-T数据集VT5000、VT1000、VT821进行了广泛实验,实验表明,所提出网络的平均绝对误差分别达到2.2%、1.5%、2.5%,与领域内先进的方法相比,取得了优异的性能。 展开更多
关键词 显著目标检测 多模态 特征融合 RGB-T 特征交互 深度学习
在线阅读 下载PDF
基于跨层级注意力学习的RGB-T显著目标检测
17
作者 魏明军 魏帅 +1 位作者 刘亚志 李辉 《郑州大学学报(理学版)》 北大核心 2025年第3期42-48,共7页
RGB-热成像显著目标检测(RGB-T SOD)旨在分割可见光图像和相应热红外图像中的常见突出区域。针对现有方法中没有充分利用多模态间的跨层级互补信息的问题,提出了一种用于RGB-T SOD任务的跨层级特征注意力学习网络(CALNet)。具体来说,该... RGB-热成像显著目标检测(RGB-T SOD)旨在分割可见光图像和相应热红外图像中的常见突出区域。针对现有方法中没有充分利用多模态间的跨层级互补信息的问题,提出了一种用于RGB-T SOD任务的跨层级特征注意力学习网络(CALNet)。具体来说,该网络中包含一个跨层级注意力学习模块(CAL),CAL使用非局部注意力对多模态间的跨层级信息进行交互,能够充分探索不同模态和不同层级间的全局位置与局部细节线索。此外,网络还引入了全局信息模块(GIM)与多交互模块(MIB),二者能够在逐层级解码中建模和挖掘多类型信息,以实现更精准的RGB-T SOD。在公共数据集RGB-T上进行的广泛实验表明,所提出的网络与领域内先进的算法相比,取得了优异的性能。 展开更多
关键词 多模态 非局部注意力 RGB-T 显著目标检测 特征融合
在线阅读 下载PDF
基于特征交互引导的弱监督显著目标检测
18
作者 李永强 石艳娇 张晴 《计算机工程与设计》 北大核心 2025年第4期1234-1240,F0003,共8页
为解决现有的基于稀疏标记的弱监督显著目标检测模型需要引入额外标签恢复显著目标结构、模型检测效果不佳等问题,提出一种基于涂鸦注释的特征交互引导网络用于弱监督显著目标检测,无需预处理/后处理操作或额外标签。模型集成特征增强... 为解决现有的基于稀疏标记的弱监督显著目标检测模型需要引入额外标签恢复显著目标结构、模型检测效果不佳等问题,提出一种基于涂鸦注释的特征交互引导网络用于弱监督显著目标检测,无需预处理/后处理操作或额外标签。模型集成特征增强机制分别对浅层和深层的多尺度特征进行扩展与聚合,轮廓重定位模块恢复并优化显著目标结构,所提全局特征对齐损失辅助模型感知显著目标的全局结构。实验结果表明,所提出模型优于现有的弱监督方法。 展开更多
关键词 显著目标检测 弱监督 涂鸦注释 特征交互引导 特征增强 多尺度特征 特征对齐
在线阅读 下载PDF
跨模态交互融合与全局感知的RGB-D显著性目标检测 被引量:2
19
作者 孙福明 胡锡航 +2 位作者 武景宇 孙静 王法胜 《软件学报》 EI CSCD 北大核心 2024年第4期1899-1913,共15页
近年来,RGB-D显著性检测方法凭借深度图中丰富的几何结构和空间位置信息,取得了比RGB显著性检测模型更好的性能,受到学术界的高度关注.然而,现有的RGB-D检测模型仍面临着持续提升检测性能的需求.最近兴起的Transformer擅长建模全局信息... 近年来,RGB-D显著性检测方法凭借深度图中丰富的几何结构和空间位置信息,取得了比RGB显著性检测模型更好的性能,受到学术界的高度关注.然而,现有的RGB-D检测模型仍面临着持续提升检测性能的需求.最近兴起的Transformer擅长建模全局信息,而卷积神经网络(CNN)擅长提取局部细节.因此,如何有效结合CNN和Transformer两者的优势,挖掘全局和局部信息,将有助于提升显著性目标检测的精度.为此,提出一种基于跨模态交互融合与全局感知的RGB-D显著性目标检测方法,通过将Transformer网络嵌入U-Net中,从而将全局注意力机制与局部卷积结合在一起,能够更好地对特征进行提取.首先借助U-Net编码-解码结构,高效地提取多层次互补特征并逐级解码生成显著特征图.然后,使用Transformer模块学习高级特征间的全局依赖关系增强特征表示,并针对输入采用渐进上采样融合策略以减少噪声信息的引入.其次,为了减轻低质量深度图带来的负面影响,设计一个跨模态交互融合模块以实现跨模态特征融合.最后,5个基准数据集上的实验结果表明,所提算法与其他最新的算法相比具有显著优势. 展开更多
关键词 显著目标检测 跨模态 全局注意力机制 rgb-d检测模型
在线阅读 下载PDF
基于多模态特征交互的RGB-D显著性目标检测 被引量:3
20
作者 高悦 戴蒙 张晴 《计算机工程与应用》 CSCD 北大核心 2024年第2期211-220,共10页
现有的大多数RGB-D显著性目标检测方法利用深度图来提高检测效果,而忽视了其质量的影响。低质量的深度图会对最终显著目标预测结果造成污染,影响显著性检测的性能。为了消除低质量深度图带来的干扰,并准确突出RGB图像中的显著目标,提出... 现有的大多数RGB-D显著性目标检测方法利用深度图来提高检测效果,而忽视了其质量的影响。低质量的深度图会对最终显著目标预测结果造成污染,影响显著性检测的性能。为了消除低质量深度图带来的干扰,并准确突出RGB图像中的显著目标,提出了一个用于多模态特征交互的RGB-D显著性目标检测模型。在编码阶段,设计了一个特征交互模块,其包含三个子模块:用于增强特征表述能力的全局特征采集子模块、用于过滤低质量深度信息的深度特征精炼子模块和用于实现特征融合的多模态特征交互子模块。在解码阶段,逐层融合经过特征交互后的多模态特征,实现多层次特征融合。通过在五个基准数据集上与十二种先进方法进行的综合实验表明,该模型在NLPR、SIP和NJU2K数据集上的指标上均优于其他对比方法,其中在NJU2K数据集上,该模型的性能比第二名在平均F值上提升了0.008,加权F值上提升了0.014,E-measure上提升了0.007,表现出了较好的检测效果。 展开更多
关键词 rgb-d显著检测 多模态特征 特征交互 特征融合
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部