检索结果-维普期刊中文期刊服务平台

面向多模态交互式融合与渐进式优化的三维视觉理解被引量：3: 1; 作者何鸿添陈晗 +3 位作者刘洋周礼亮张敏雷印杰《计算机应用研究》 CSCD 北大核心 2024年第5期1554-1561,共8页; 三维视觉理解旨在智能地感知和解释三维场景,实现对物体、环境和动态变化的深入理解与分析。三维目标检测作为其核心技术,发挥着不可或缺的作用。针对当前的三维检测算法对于远距离目标和小目标检测精度较低的问题,提出了一种面向多模... 展开更多; 关键词三维视觉理解多模态交互式融合渐进式注意力目标检测; 在线阅读下载PDF 职称材料

基于多模态特征频域融合的零样本指称图像分割被引量：2: 2; 作者林浩然刘春黔 +2 位作者薛榕融谢勋伟雷印杰《计算机应用研究》 CSCD 北大核心 2024年第5期1562-1568,共7页; 为了解决语义分割应用到现实世界的下游任务时无法处理未定义类别的问题,提出了指称图像分割任务。该任务根据自然语言文本的描述找到图像中对应的目标。现有方法大多使用一个跨模态解码器来融合从视觉编码器和语言编码器中独立提取的特... 展开更多; 关键词指称图像分割 CLIP 小波变换零样本; 在线阅读下载PDF 职称材料

基于语义一致性约束与局部-全局感知的多模态3D视觉定位: 3; 作者罗寒马浩统 +2 位作者刘杰严华雷印杰《计算机应用研究》 CSCD 北大核心 2024年第7期2203-2208,共6页; 3D多模态数据稀缺,使得传统方法进行监督训练时文本与视觉特征缺乏语义一致性。同时传统方法还易忽视局部关系与全局信息,从而导致性能不佳。针对上述问题,提出了一种基于语义一致性约束与局部-全局感知的多模态3D视觉定位方法。首先,... 展开更多; 关键词 3D视觉定位多模态特征一致性约束局部关系全局位置信息; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	面向多模态交互式融合与渐进式优化的三维视觉理解	何鸿添陈晗刘洋周礼亮张敏雷印杰	《计算机应用研究》 CSCD 北大核心	2024	3	在线阅读下载PDF 职称材料
2	基于多模态特征频域融合的零样本指称图像分割	林浩然刘春黔薛榕融谢勋伟雷印杰	《计算机应用研究》 CSCD 北大核心	2024	2	在线阅读下载PDF 职称材料
3	基于语义一致性约束与局部-全局感知的多模态3D视觉定位	罗寒马浩统刘杰严华雷印杰	《计算机应用研究》 CSCD 北大核心	2024	0	在线阅读下载PDF 职称材料