期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于多模态表征学习的自动音频字幕方法
1
作者 谭力文 周翊 +1 位作者 柳银 曹寅 《计算机应用研究》 北大核心 2025年第6期1662-1667,共6页
在自动音频字幕(automated audio captioning,AAC)和大多数多模态研究领域中,模态差异一直构成重大挑战。增强模型对文本信息的理解,在建立文本和音频两种模态之间的无缝连接中起着至关重要的作用。最近的研究集中在通过对比学习的方法... 在自动音频字幕(automated audio captioning,AAC)和大多数多模态研究领域中,模态差异一直构成重大挑战。增强模型对文本信息的理解,在建立文本和音频两种模态之间的无缝连接中起着至关重要的作用。最近的研究集中在通过对比学习的方法来缩小这两种模态之间的差距,但仅使用简单的对比损失函数来弥合这两种模态之间的差异是具有挑战性的。为减少模态差异带来的影响,增强模型对两种模态特征的利用率,提出基于多模态表征学习的音频字幕方法SimTLNet,通过引入一种全新的表征模块TRANSLATOR,构造孪生表征结构,并联合对比学习和动量更新模型权重的方式,使模型能够同时学习音频模态和文本模态之间共有的高维语义信息。该方法在AudioCaps和Clotho V2数据集上的METEOR、CIDEr和SPIDEr-FL分别达到了0.251、0.782、0.480和0.187、0.475、0.303,并取得了可以与先进方法相媲美的结果,有效弥合了两种模态之间的差异。 展开更多
关键词 音频字幕 表征学习 对比学习 模态差异 孪生网络
在线阅读 下载PDF
汽车内饰品质感的感知模态研究 被引量:19
2
作者 尹彦青 赵丹华 谭征宇 《包装工程》 CAS CSCD 北大核心 2016年第20期35-40,共6页
目的从用户感知模态出发,构建内饰品质感性意象评价模型。方法以情感设计为背景,提出了用户对汽车内饰的品质感是由直接知觉和认知意象共同构成;从感知觉特性出发,通过30名用户对6个汽车内饰皮质纹理样本质感的评价进行情感语义量化,形... 目的从用户感知模态出发,构建内饰品质感性意象评价模型。方法以情感设计为背景,提出了用户对汽车内饰的品质感是由直接知觉和认知意象共同构成;从感知觉特性出发,通过30名用户对6个汽车内饰皮质纹理样本质感的评价进行情感语义量化,形成皮质纹理意象感知尺度。结果从触觉单模态感知和视触觉双模态感知的角度,验证了用户不同感觉模态下对汽车内饰皮质纹理情感的感知差异。结论基于汽车内饰品质的情感设计,其核心在于对用户感知与情感之间客观联系的挖掘,以材料工艺所表现的产品造型感知质量成为内饰设计的必然趋势。 展开更多
关键词 汽车内饰 情感设计 感知模态差异 内饰品质感
在线阅读 下载PDF
跨域和跨模态适应学习的无监督细粒度视频分类 被引量:4
3
作者 何相腾 彭宇新 《软件学报》 EI CSCD 北大核心 2021年第11期3482-3495,共14页
细粒度视频分类旨在识别粗粒度大类中的细粒度子类,是计算机视觉中一个极具挑战的任务.考虑到视频数据的标注成本巨大,而图像的标注成本相对较小,且细粒度图像分类已经取得了较为显著的进展,一个自然的想法是不用标注,以无监督的方式将... 细粒度视频分类旨在识别粗粒度大类中的细粒度子类,是计算机视觉中一个极具挑战的任务.考虑到视频数据的标注成本巨大,而图像的标注成本相对较小,且细粒度图像分类已经取得了较为显著的进展,一个自然的想法是不用标注,以无监督的方式将细粒度图像分类中学习到的知识自适应地迁移到细粒度视频分类中.然而,来源不同的图像和视频之间存在着域差异和模态差异,这导致细粒度图像分类的模型不能直接应用于细粒度视频分类.为了实现无监督的细粒度视频分类,提出一种无监督辨识适应网络,能够将辨识性定位能力从细粒度图像分类迁移到细粒度视频分类.进一步,提出一种渐进式伪标签策略来迭代地引导无监督辨识适应网络学习目标域视频的数据分布.在CUB-200-2011、Cars-196图像数据集和YouTube Birds、YouTube Cars视频数据集上验证该方法跨域、跨模态的适应能力,实验结果证明了该方法在无监督细粒度视频分类上的优势. 展开更多
关键词 细粒度视频分类 无监督辨识适应网络 差异 模态差异 域适应
在线阅读 下载PDF
中国冬夏季气温和降水异常耦合关系的SVD与MEOF分析对比 被引量:7
4
作者 李丽平 马晨誉 +2 位作者 倪语蔓 袁爱军 王盘兴 《大气科学学报》 CSCD 北大核心 2018年第5期647-656,共10页
以揭示中国冬、夏季气温、降水之间的同期耦合时空特征为例,比较了SVD与MEOF分析所得主要正交模的相关关系及均衡性,论证了SVD方法在揭示两个要素场序列互相关关系上的优越性。结果表明:1) SVD的分解对象仅包含反映两种要素场相关关系... 以揭示中国冬、夏季气温、降水之间的同期耦合时空特征为例,比较了SVD与MEOF分析所得主要正交模的相关关系及均衡性,论证了SVD方法在揭示两个要素场序列互相关关系上的优越性。结果表明:1) SVD的分解对象仅包含反映两种要素场相关关系的信息,而MEOF还包含了两个要素场各自的自相关信息,前者分解对象更纯粹。2) MEOF和SVD揭示的气温和降水空间耦合模态正负异常分布大致相似,但相较SVD所揭示的耦合模态,MEOF分析的冬、夏季气温、降水主要正交模存在不均衡现象,即一个主要MEOF正交模往往侧重描述两种异常要素场中的一种,这种差异在冬季尤为突出。SVD方法揭示了中国冬、夏季同期气温、降水间局域高温少降水或低温多降水是二者主要异常配置,且相关性夏强冬弱。3)比较SVD、MEOF方法同序正交模的相关系数和均衡度发现,SVD多数正交模的相关系数较MEOF的更大、更稳定,且均通过显著性检验,MEOF的冬季部分正交模相关系数未通过显著性检验; SVD主要正交模的均衡性冬季优于MEOF分析、夏季优于(第一模态)或者接近于(第二、三模态) MEOF分析。故SVD方法是揭示两要素之间耦合关系的更好方法。 展开更多
关键词 气温 降水 SVD MEOF分析 均衡性 相关性 耦合模态差异
在线阅读 下载PDF
基于身份感知模型的素描人脸识别方法 被引量:4
5
作者 段中钰 李玉涛 +3 位作者 田澍 郭亚男 杜康宁 张帆 《电讯技术》 北大核心 2023年第5期725-732,共8页
针对素描图像和光学图像之间存在较大的模态差异这一问题,提出了一种基于身份感知模型的素描人脸识别方法,实现跨模态图像生成和素描人脸识别。该方法应用新的感知损失来监督图像生成网络,生成更好的跨模态图像,减少模态差异带来的识别... 针对素描图像和光学图像之间存在较大的模态差异这一问题,提出了一种基于身份感知模型的素描人脸识别方法,实现跨模态图像生成和素描人脸识别。该方法应用新的感知损失来监督图像生成网络,生成更好的跨模态图像,减少模态差异带来的识别精度损失,并通过三元组损失来正则化类内和类间距离,增强识别模型的性能,用联合训练策略提升素描人脸识别能力。在UoM-SGFSv2、e-PRIP等素描人脸数据集上的实验结果表明,该方法识别效果优于其他对比算法。 展开更多
关键词 素描人脸识别 模态差异 图像生成 感知损失 人脸合成
在线阅读 下载PDF
无监督迁移学习红外行为识别 被引量:2
6
作者 黑鸿中 肖儿良 简献忠 《小型微型计算机系统》 CSCD 北大核心 2020年第4期704-709,共6页
为了缩小可见光视频和红外视频之间的模态差异而提高红外行为识别率,以及简化深度学习用于红外行为识别需人工标注数据集繁琐的问题.基于迁移学习的思想,本文提出一种用可见光动作(源域)来识别红外动作(目标域)的无监督异构红外行为识... 为了缩小可见光视频和红外视频之间的模态差异而提高红外行为识别率,以及简化深度学习用于红外行为识别需人工标注数据集繁琐的问题.基于迁移学习的思想,本文提出一种用可见光动作(源域)来识别红外动作(目标域)的无监督异构红外行为识别算法(UHDIAR).UHDIAR算法将可见光数据和红外数据映射到同一个对齐的特征空间中,采取余弦相似度调整源域样本的权重,利用对齐后的可见光数据训练权重支持向量机(W-SVM),进而识别红外动作并自动标注.采用可见光动作数据集(XD145)和红外动作数据集(InfAR)进行实验,结果表明UHDIAR的平均识别率与标准的SVM相比相对提高68.65%. 展开更多
关键词 可见光 红外 行为识别 模态差异 迁移学习 无监督 异构
在线阅读 下载PDF
基于转换生成网络的素描人脸识别 被引量:1
7
作者 霍西宝 曹林 +1 位作者 郭亚男 杜康宁 《计算机工程与设计》 北大核心 2022年第1期269-276,共8页
针对素描图像和可见光图像存在较大模态差异这一问题,提出一种基于转换生成网络的素描人脸识别方法,该网络同时实现跨模态图像生成和素描人脸识别。转换生成网络由生成器、判别器和特征转换网络(S网络)组成。生成器生成图像,判别器使得... 针对素描图像和可见光图像存在较大模态差异这一问题,提出一种基于转换生成网络的素描人脸识别方法,该网络同时实现跨模态图像生成和素描人脸识别。转换生成网络由生成器、判别器和特征转换网络(S网络)组成。生成器生成图像,判别器使得生成图像具备两种模态信息,S网络提取高级语义特征来辅助生成图像和识别。使用端对端训练来更新模型参数,通过引入识别损失约束项指导生成更好的跨模态图像,通过生成的跨模态图像减少模态差异带来的识别精度损失。在UoM-SGFSv2、e-PRIP等素描人脸数据集上验证该方法识别性能,实验结果表明,该方法识别效果优于其它对比算法。 展开更多
关键词 素描人脸识别 模态差异 转换生成网络 图像生成 特征转换网络 模态图像
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部