检索结果-维普期刊中文期刊服务平台

基于跨模态级联扩散模型的图像描述方法: 1; 作者陈巧红郭孟浩 +1 位作者方贤孙麒《浙江大学学报(工学版)》北大核心 2025年第4期787-794,共8页; 现有文本扩散模型方法无法有效根据语义条件控制扩散过程,扩散模型训练过程的收敛较为困难,为此提出基于跨模态级联扩散模型的非自回归图像描述方法.引入跨模态语义对齐模块用于对齐视觉模态和文本模态之间的语义关系,将对齐后的语义特... 展开更多; 关键词深度学习图像描述扩散模型多模态编码器级联结构; 在线阅读下载PDF 职称材料

基于模态语义增强的跨模态食谱检索方法被引量：1: 2; 作者李明周栋 +1 位作者雷芳曹步清《计算机应用研究》 CSCD 北大核心 2024年第4期1131-1137,共7页; 在跨模态食谱检索任务中,如何有效地对模态进行特征表示是一个热点问题。目前一般使用两个独立的神经网络分别获取图像和食谱的特征,通过跨模态对齐实现跨模态检索。但这些方法主要关注模态内的特征信息,忽略了模态间的特征交互,导致部... 展开更多; 关键词跨模态食谱检索特征提取模态语义增强多模态编码器; 在线阅读下载PDF 职称材料

基于多语种文本符号的艺术图像生成模型: 3; 作者唐宏卓诗语《无线电通信技术》北大核心 2025年第3期486-492,共7页; 文本生成图像(Text-to-Image,TTI)任务是指利用文本符号来生成图像,在艺术设计领域中有重要应用前景。由于缺乏不同语种的注释图像数据,对TTI的研究主要集中在英文领域,现有TTI模型无法利用其他语种数据进行图像生成。基于上述考虑,研... 展开更多; 关键词设计领域多语种文本生成图像多模态编码器神经机器翻译; 在线阅读下载PDF 职称材料