期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于上下文信息和大语言模型的开放词汇室内三维目标检测
1
作者 张胜 程俊 《集成技术》 2025年第3期51-63,共13页
现有室内三维目标检测算法能检测的目标类别通常有限,这限制其在智能机器人领域的应用。开放词汇目标检测能在不定义目标类别的前提下检测给定场景的所有感兴趣目标,从而解决室内三维目标检测的不足。与此同时,大语言模型的先验知识能... 现有室内三维目标检测算法能检测的目标类别通常有限,这限制其在智能机器人领域的应用。开放词汇目标检测能在不定义目标类别的前提下检测给定场景的所有感兴趣目标,从而解决室内三维目标检测的不足。与此同时,大语言模型的先验知识能显著提升视觉任务的性能。然而现有的开放词汇室内三维目标检测研究存在仅关注目标信息,而忽视了上下文信息的问题。室内三维目标检测的输入数据主要是点云,存在稀疏和噪声问题。仅依赖目标点云信息会对三维目标检测结果产生负面影响。上下文信息包含场景描述,能对目标信息进行补充,从而提升目标检测中类别判定的准确率。为此,本文提出了基于上下文信息和大语言模型的开放词汇室内三维目标检测算法,该算法通过结合上下文信息和大语言模型的思维链推理获取检测结果。此外,该算法在SUN RGB-D和ScanNetV2数据集上进行了验证,实验结果表明了其有效性。 展开更多
关键词 大语言模型 室内三维目标检测 开放词汇 上下文信息 思维链
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部