检索结果-维普期刊中文期刊服务平台

基于视觉语言大模型的腿臂机器人实验系统设计: 1; 作者陈腾肖仕钧 +2 位作者荣学文李贻斌荣海林《实验室研究与探索》北大核心 2025年第8期67-71,93,共6页; 针对移动作业机器人自然语言交互性不足、多模态自主感知能力弱以及自主行为控制复杂等问题,设计了一套基于视觉语言大模型的腿臂机器人自主行为控制实验系统。首先明确了系统的硬件组成,搭建了腿臂机器人实验平台;然后通过自然语言识... 展开更多; 关键词腿臂机器人视觉语言大模型环境感知自主行为控制; 在线阅读下载PDF 职称材料

提示学习在计算机视觉中的分类、应用及展望: 2; 作者刘袁缘刘树阳 +3 位作者刘云娇袁雨晨唐厂罗威《自动化学报》北大核心 2025年第5期1021-1040,共20页; 随着计算机视觉(CV)的快速发展,人们对于提高视觉任务的性能和泛化能力的需求不断增长,导致模型的复杂度与对各种资源的需求进一步提高.提示学习(PL)作为一种能有效地提升模型性能和泛化能力、重用预训练模型和降低计算量的方法,在一系... 展开更多; 关键词计算机视觉提示学习视觉−语言大模型预训练模型; 在线阅读下载PDF 职称材料

基于CLIP文本特征增强的剪纸图像分类: 3; 作者张新生陈鼎秦一冰《计算机应用研究》北大核心 2025年第7期1994-2002,共9页; 针对剪纸图像分类中文本与图像模态差异大、类原型表达能力弱的问题,提出了一种基于CLIP模型的文本特征增强方法(CLIP visual text enhancer,C-VTE)。该方法通过人工提示模板提取文本特征,设计了一种视觉文本增强模块,并利用Cross Atten... 展开更多; 关键词视觉语言大模型剪纸分类小样本分类模态融合提示学习; 在线阅读下载PDF 职称材料