期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于上下文信息和大语言模型的开放词汇室内三维目标检测
1
作者
张胜
程俊
《集成技术》
2025年第3期51-63,共13页
现有室内三维目标检测算法能检测的目标类别通常有限,这限制其在智能机器人领域的应用。开放词汇目标检测能在不定义目标类别的前提下检测给定场景的所有感兴趣目标,从而解决室内三维目标检测的不足。与此同时,大语言模型的先验知识能...
现有室内三维目标检测算法能检测的目标类别通常有限,这限制其在智能机器人领域的应用。开放词汇目标检测能在不定义目标类别的前提下检测给定场景的所有感兴趣目标,从而解决室内三维目标检测的不足。与此同时,大语言模型的先验知识能显著提升视觉任务的性能。然而现有的开放词汇室内三维目标检测研究存在仅关注目标信息,而忽视了上下文信息的问题。室内三维目标检测的输入数据主要是点云,存在稀疏和噪声问题。仅依赖目标点云信息会对三维目标检测结果产生负面影响。上下文信息包含场景描述,能对目标信息进行补充,从而提升目标检测中类别判定的准确率。为此,本文提出了基于上下文信息和大语言模型的开放词汇室内三维目标检测算法,该算法通过结合上下文信息和大语言模型的思维链推理获取检测结果。此外,该算法在SUN RGB-D和ScanNetV2数据集上进行了验证,实验结果表明了其有效性。
展开更多
关键词
大语言模型
室内三维目标检测
开放词汇
上下文信息
思维链
在线阅读
下载PDF
职称材料
题名
基于上下文信息和大语言模型的开放词汇室内三维目标检测
1
作者
张胜
程俊
机构
中国科学院深圳先进技术研究院
出处
《集成技术》
2025年第3期51-63,共13页
基金
国家自然科学基金项目(U21A20487)
深圳市科技计划项目(JCYJ20220818101206014)。
文摘
现有室内三维目标检测算法能检测的目标类别通常有限,这限制其在智能机器人领域的应用。开放词汇目标检测能在不定义目标类别的前提下检测给定场景的所有感兴趣目标,从而解决室内三维目标检测的不足。与此同时,大语言模型的先验知识能显著提升视觉任务的性能。然而现有的开放词汇室内三维目标检测研究存在仅关注目标信息,而忽视了上下文信息的问题。室内三维目标检测的输入数据主要是点云,存在稀疏和噪声问题。仅依赖目标点云信息会对三维目标检测结果产生负面影响。上下文信息包含场景描述,能对目标信息进行补充,从而提升目标检测中类别判定的准确率。为此,本文提出了基于上下文信息和大语言模型的开放词汇室内三维目标检测算法,该算法通过结合上下文信息和大语言模型的思维链推理获取检测结果。此外,该算法在SUN RGB-D和ScanNetV2数据集上进行了验证,实验结果表明了其有效性。
关键词
大语言模型
室内三维目标检测
开放词汇
上下文信息
思维链
Keywords
large language model
indoor 3D object detection
open-vocabulary
contextual information
chain of thoughts
分类号
TP183 [自动化与计算机技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于上下文信息和大语言模型的开放词汇室内三维目标检测
张胜
程俊
《集成技术》
2025
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部