检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到8篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

面向视觉-语言模型的递进互提示学习: 1; 作者陶俊杰张卫锋 +2 位作者王玉霞缪翌徐领《计算机应用研究》北大核心 2025年第6期1648-1655,共8页; 大规模预训练视觉-语言模型CLIP(contrastive language-image pretraining)可将输入图像和文本投影到公共语义空间实现跨模态对齐,且在广泛的下游任务上展现了较强的泛化能力。然而,现有的提示学习方法通常在CLIP的视觉编码器和文本编... 展开更多; 关键词多模态提示学习视觉-语言模型 Transformer编码器; 在线阅读下载PDF 职称材料

基于视觉-语言预训练模型的开集交通目标检测算法: 2; 作者黄琦强安国成熊刚《计算机工程》北大核心 2025年第6期375-384,共10页; 交通目标检测是智慧交通系统的重要组成部分,但现有的交通目标检测算法只能实现对于预设目标的检测,无法应对开集目标场景。为此,提出一种基于视觉-语言预训练(VLP)模型的开集交通目标检测算法。首先,基于Faster R-CNN修改预测网络使其... 展开更多; 关键词视觉-语言预训练模型 Faster R-CNN 开集目标检测交通目标检测; 在线阅读下载PDF 职称材料

基于视觉-语言预训练模型的零样本迁移学习方法综述被引量：1: 3; 作者孙仁科许靖昊 +2 位作者皇甫志宇李仲年许新征《计算机工程》 CAS CSCD 北大核心 2024年第10期1-15,共15页; 近年来随着人工智能(AI)技术在计算机视觉与自然语言处理等单模态领域表现出愈发优异的性能,多模态学习的重要性和必要性逐渐展现出来,其中基于视觉-语言预训练模型的零样本迁移(ZST)方法得到了国内外研究者的广泛关注。得益于预训练模... 展开更多; 关键词零样本学习视觉-语言预训练模型零样本迁移多模态计算机视觉; 在线阅读下载PDF 职称材料

基于推理阶段的对抗视觉调优方法: 4; 作者张家明桑基韬于剑《计算机学报》北大核心 2025年第6期1443-1457,共15页; 近年来,大规模预训练视觉-语言模型在图像描述、视觉问答和图像检索等任务中展现出卓越的性能。然而,这些模型在安全性方面存在显著的脆弱性,尤其容易受到几乎不可见的对抗噪声的攻击。对抗噪声通过在输入图像中加入人眼几乎不可察觉的... 展开更多; 关键词深度学习视觉-语言模型对抗防御提示学习图像识别; 在线阅读下载PDF 职称材料

视觉语义增强的联合小样本开集识别分类器: 5; 作者丁相舒耿传兴陈松灿《南京航空航天大学学报(自然科学版)》北大核心 2025年第5期861-869,共9页; 探究了视觉-语言预训练模型对比语言-图像预训练(Contrastive language-image pre-training,CLIP)在小样本开集识别(Few-shot open-set recognition,FSOR)任务中的潜力。实验发现基于CLIP图像编码特征的视觉原型分类器通常不如传统FSOR... 展开更多; 关键词小样本开集识别视觉-语言模型原型分类器分布差异决策边界; 在线阅读下载PDF 职称材料

基于图像内容理解的判别性类别提示学习被引量：1: 6; 作者王楠井刘阿建 +4 位作者梁凤梅张小梅万军谢珺雷震《电子学报》北大核心 2025年第2期493-502,共10页; 近年来,通过图像与文本的联合表示,基于对比语言-图像预训练(Contrastive Language-Image Pre-training,CLIP)的方法将文本信息作为分类器的权值,在通用图像识别任务中展现出卓越性能.但是现有方法仅单独构建类别文本提示,比如上下文优... 展开更多; 关键词视觉-语言模型图像识别提示调优注意力机制文本监督(TS) 适配器微调 TRANSFORMER; 在线阅读下载PDF 职称材料

基于多粒度共享语义中心关联的文本到人物检索方法: 7; 作者康斌陈斌 +3 位作者王俊杰李昱林赵军智咸伟志《计算机应用》北大核心 2025年第3期808-814,共7页; 基于文本的人物检索旨在通过使用文本描述作为查询来识别特定人物。现有的先进方法通常设计多种对齐机制实现跨模态数据在全局和局部的对应关系,然而忽略了不同对齐机制之间的相互影响。因此,提出一种多粒度共享语义中心关联机制,深入... 展开更多; 关键词视觉-语言模型人物检索全局对齐局部对齐共享语义中心; 在线阅读下载PDF 职称材料

语义增强的零样本甲骨文字符识别被引量：1: 8; 作者刘宗昊彭文杰 +2 位作者代港黄双萍刘永革《电子学报》 EI CAS CSCD 北大核心 2024年第10期3347-3358,共12页; 甲骨文识别对于了解中国历史和传承中华文化都有重要的价值.目前,人工识别甲骨文需要具备丰富的专家经验并耗费大量的时间,而自动识别甲骨文的方法绝大部分受制于闭集假设,在甲骨文这种陆续发现新字符的现实场景下适用范围受限.为此,有... 展开更多; 关键词甲骨文字识别零样本识别视觉匹配语义增强视觉-语言模型对比学习; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部