检索结果-维普期刊中文期刊服务平台

基于跨模态引导和对齐的多模态预训练方法: 1; 作者才华易亚希 +2 位作者付强冉越孙俊喜《电子学报》 EI CAS CSCD 北大核心 2024年第10期3368-3381,共14页; 现有的视觉语言多模态预训练方法仅在图像和文本的全局语义上进行特征对齐,对模态间细粒度特征交互的探索不足.针对这一问题,本文提出了一种基于跨模态引导和对齐的多模态预训练方法.该方法在模态特征提取阶段,采用基于视觉序列压缩的... 展开更多; 关键词多模态预训练跨模态引导视觉序列压缩双流特征提取细粒度关系推理局部特征对齐; 在线阅读下载PDF 职称材料

悟道·文澜:超大规模多模态预训练模型带来了什么? 被引量：1: 2; 作者卢志武金琴 +1 位作者宋睿华文继荣《中兴通讯技术》 2022年第2期25-32,共8页; 提出了悟道·文澜的BriVL双塔模型。该模型利用6.5亿对互联网图文数据,通过自监督的任务来训练,是目前最大的中文通用图文预训练模型。同时,还提出了悟道·文澜的多语言多模态预训练单塔模型—MLMM。实验结果证明,这两个模型在... 展开更多; 关键词多模态预训练多语言预训练双塔模型单塔模型; 在线阅读下载PDF 职称材料

超大规模多模态预训练模型M6的关键技术及产业应用被引量：4: 3; 作者林俊旸周畅杨红霞《中兴通讯技术》 2022年第2期44-50,共7页; 阿里巴巴达摩院研发了超大规模中文多模态预训练模型M6,并陆续推出了百亿、千亿、万亿和十万亿参数规模的预训练模型,实现了高效低碳的预训练,推动超大规模预训练模型的产业化应用。同时,推出了M6服务化平台,帮助广大用户快速使用大模... 展开更多; 关键词多模态预训练大规模预训练图像生成文本生成; 在线阅读下载PDF 职称材料