检索结果-维普期刊中文期刊服务平台

基于多模态表征学习的自动音频字幕方法: 1; 作者谭力文周翊 +1 位作者柳银曹寅《计算机应用研究》北大核心 2025年第6期1662-1667,共6页; 在自动音频字幕(automated audio captioning,AAC)和大多数多模态研究领域中,模态差异一直构成重大挑战。增强模型对文本信息的理解,在建立文本和音频两种模态之间的无缝连接中起着至关重要的作用。最近的研究集中在通过对比学习的方法... 展开更多; 关键词音频字幕表征学习对比学习模态差异孪生网络; 在线阅读下载PDF 职称材料

汽车内饰品质感的感知模态研究被引量：19: 2; 作者尹彦青赵丹华谭征宇《包装工程》 CAS CSCD 北大核心 2016年第20期35-40,共6页; 目的从用户感知模态出发,构建内饰品质感性意象评价模型。方法以情感设计为背景,提出了用户对汽车内饰的品质感是由直接知觉和认知意象共同构成;从感知觉特性出发,通过30名用户对6个汽车内饰皮质纹理样本质感的评价进行情感语义量化,形... 展开更多; 关键词汽车内饰情感设计感知模态差异内饰品质感; 在线阅读下载PDF 职称材料

跨域和跨模态适应学习的无监督细粒度视频分类被引量：4: 3; 作者何相腾彭宇新《软件学报》 EI CSCD 北大核心 2021年第11期3482-3495,共14页; 细粒度视频分类旨在识别粗粒度大类中的细粒度子类,是计算机视觉中一个极具挑战的任务.考虑到视频数据的标注成本巨大,而图像的标注成本相对较小,且细粒度图像分类已经取得了较为显著的进展,一个自然的想法是不用标注,以无监督的方式将... 展开更多; 关键词细粒度视频分类无监督辨识适应网络域差异模态差异域适应; 在线阅读下载PDF 职称材料

中国冬夏季气温和降水异常耦合关系的SVD与MEOF分析对比被引量：7: 4; 作者李丽平马晨誉 +2 位作者倪语蔓袁爱军王盘兴《大气科学学报》 CSCD 北大核心 2018年第5期647-656,共10页; 以揭示中国冬、夏季气温、降水之间的同期耦合时空特征为例,比较了SVD与MEOF分析所得主要正交模的相关关系及均衡性,论证了SVD方法在揭示两个要素场序列互相关关系上的优越性。结果表明:1) SVD的分解对象仅包含反映两种要素场相关关系... 展开更多; 关键词气温降水 SVD MEOF分析均衡性相关性耦合模态差异; 在线阅读下载PDF 职称材料

基于身份感知模型的素描人脸识别方法被引量：4: 5; 作者段中钰李玉涛 +3 位作者田澍郭亚男杜康宁张帆《电讯技术》北大核心 2023年第5期725-732,共8页; 针对素描图像和光学图像之间存在较大的模态差异这一问题,提出了一种基于身份感知模型的素描人脸识别方法,实现跨模态图像生成和素描人脸识别。该方法应用新的感知损失来监督图像生成网络,生成更好的跨模态图像,减少模态差异带来的识别... 展开更多; 关键词素描人脸识别模态差异图像生成感知损失人脸合成; 在线阅读下载PDF 职称材料

无监督迁移学习红外行为识别被引量：2: 6; 作者黑鸿中肖儿良简献忠《小型微型计算机系统》 CSCD 北大核心 2020年第4期704-709,共6页; 为了缩小可见光视频和红外视频之间的模态差异而提高红外行为识别率,以及简化深度学习用于红外行为识别需人工标注数据集繁琐的问题.基于迁移学习的思想,本文提出一种用可见光动作(源域)来识别红外动作(目标域)的无监督异构红外行为识... 展开更多; 关键词可见光红外行为识别模态差异迁移学习无监督异构; 在线阅读下载PDF 职称材料

基于转换生成网络的素描人脸识别被引量：1: 7; 作者霍西宝曹林 +1 位作者郭亚男杜康宁《计算机工程与设计》北大核心 2022年第1期269-276,共8页; 针对素描图像和可见光图像存在较大模态差异这一问题,提出一种基于转换生成网络的素描人脸识别方法,该网络同时实现跨模态图像生成和素描人脸识别。转换生成网络由生成器、判别器和特征转换网络(S网络)组成。生成器生成图像,判别器使得... 展开更多; 关键词素描人脸识别模态差异转换生成网络图像生成特征转换网络跨模态图像; 在线阅读下载PDF 职称材料

题名基于多模态表征学习的自动音频字幕方法: 1; 作者谭力文周翊柳银曹寅; 机构重庆邮电大学通信与信息工程学院西交利物浦大学智能科学系; 出处《计算机应用研究》北大核心 2025年第6期1662-1667,共6页; 基金国家自然科学基金资助项目(62301096) 重庆市自然科学基金资助项目(CSTB2023NSCQMSX0659) +1 种基金西交利物浦大学资助项目(RDF-22-01-084)。; 文摘在自动音频字幕(automated audio captioning,AAC)和大多数多模态研究领域中,模态差异一直构成重大挑战。增强模型对文本信息的理解,在建立文本和音频两种模态之间的无缝连接中起着至关重要的作用。最近的研究集中在通过对比学习的方法来缩小这两种模态之间的差距,但仅使用简单的对比损失函数来弥合这两种模态之间的差异是具有挑战性的。为减少模态差异带来的影响,增强模型对两种模态特征的利用率,提出基于多模态表征学习的音频字幕方法SimTLNet,通过引入一种全新的表征模块TRANSLATOR,构造孪生表征结构,并联合对比学习和动量更新模型权重的方式,使模型能够同时学习音频模态和文本模态之间共有的高维语义信息。该方法在AudioCaps和Clotho V2数据集上的METEOR、CIDEr和SPIDEr-FL分别达到了0.251、0.782、0.480和0.187、0.475、0.303,并取得了可以与先进方法相媲美的结果,有效弥合了两种模态之间的差异。; 关键词音频字幕表征学习对比学习模态差异孪生网络; Keywords audio captioning representation learning contrastive learning modality discrepancies twin network; 分类号 TP37 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名汽车内饰品质感的感知模态研究被引量：19: 2; 作者尹彦青赵丹华谭征宇; 机构湖南大学汽车车身先进设计制造国家重点实验室; 出处《包装工程》 CAS CSCD 北大核心 2016年第20期35-40,共6页; 基金国家自然科学基金(61402159 51605154); 文摘目的从用户感知模态出发,构建内饰品质感性意象评价模型。方法以情感设计为背景,提出了用户对汽车内饰的品质感是由直接知觉和认知意象共同构成;从感知觉特性出发,通过30名用户对6个汽车内饰皮质纹理样本质感的评价进行情感语义量化,形成皮质纹理意象感知尺度。结果从触觉单模态感知和视触觉双模态感知的角度,验证了用户不同感觉模态下对汽车内饰皮质纹理情感的感知差异。结论基于汽车内饰品质的情感设计,其核心在于对用户感知与情感之间客观联系的挖掘,以材料工艺所表现的产品造型感知质量成为内饰设计的必然趋势。; 关键词汽车内饰情感设计感知模态差异内饰品质感; Keywords automotive interior emotion design perceptual modal difference interior quality sense; 分类号 TB472 [一般工业技术—工业设计]; 在线阅读下载PDF 职称材料

题名跨域和跨模态适应学习的无监督细粒度视频分类被引量：4: 3; 作者何相腾彭宇新; 机构北京大学王选计算机研究所; 出处《软件学报》 EI CSCD 北大核心 2021年第11期3482-3495,共14页; 基金国家自然科学基金(61925201,61771025)。; 文摘细粒度视频分类旨在识别粗粒度大类中的细粒度子类,是计算机视觉中一个极具挑战的任务.考虑到视频数据的标注成本巨大,而图像的标注成本相对较小,且细粒度图像分类已经取得了较为显著的进展,一个自然的想法是不用标注,以无监督的方式将细粒度图像分类中学习到的知识自适应地迁移到细粒度视频分类中.然而,来源不同的图像和视频之间存在着域差异和模态差异,这导致细粒度图像分类的模型不能直接应用于细粒度视频分类.为了实现无监督的细粒度视频分类,提出一种无监督辨识适应网络,能够将辨识性定位能力从细粒度图像分类迁移到细粒度视频分类.进一步,提出一种渐进式伪标签策略来迭代地引导无监督辨识适应网络学习目标域视频的数据分布.在CUB-200-2011、Cars-196图像数据集和YouTube Birds、YouTube Cars视频数据集上验证该方法跨域、跨模态的适应能力,实验结果证明了该方法在无监督细粒度视频分类上的优势.; 关键词细粒度视频分类无监督辨识适应网络域差异模态差异域适应; Keywords fine-grained video categorization unsupervised discriminative adaptation network domain distinction modality distinction domain adaption; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名中国冬夏季气温和降水异常耦合关系的SVD与MEOF分析对比被引量：7: 4; 作者李丽平马晨誉倪语蔓袁爱军王盘兴; 机构南京信息工程大学气象灾害预报预警与评估协同创新中心/气象灾害教育部重点实验室南京信息工程大学大气科学学院安徽省气象台 [; 出处《大气科学学报》 CSCD 北大核心 2018年第5期647-656,共10页; 基金国家重点基础研究发展计划(973计划)项目(2015CB453202) 江苏高校优势学科建设工程资助项目(PAPD); 文摘以揭示中国冬、夏季气温、降水之间的同期耦合时空特征为例,比较了SVD与MEOF分析所得主要正交模的相关关系及均衡性,论证了SVD方法在揭示两个要素场序列互相关关系上的优越性。结果表明:1) SVD的分解对象仅包含反映两种要素场相关关系的信息,而MEOF还包含了两个要素场各自的自相关信息,前者分解对象更纯粹。2) MEOF和SVD揭示的气温和降水空间耦合模态正负异常分布大致相似,但相较SVD所揭示的耦合模态,MEOF分析的冬、夏季气温、降水主要正交模存在不均衡现象,即一个主要MEOF正交模往往侧重描述两种异常要素场中的一种,这种差异在冬季尤为突出。SVD方法揭示了中国冬、夏季同期气温、降水间局域高温少降水或低温多降水是二者主要异常配置,且相关性夏强冬弱。3)比较SVD、MEOF方法同序正交模的相关系数和均衡度发现,SVD多数正交模的相关系数较MEOF的更大、更稳定,且均通过显著性检验,MEOF的冬季部分正交模相关系数未通过显著性检验; SVD主要正交模的均衡性冬季优于MEOF分析、夏季优于(第一模态)或者接近于(第二、三模态) MEOF分析。故SVD方法是揭示两要素之间耦合关系的更好方法。; 关键词气温降水 SVD MEOF分析均衡性相关性耦合模态差异; Keywords temperature precipitation SVD MEOF analysis equilibrium correlation difference of coupling modes; 分类号 P423 [天文地球—大气科学及气象学] P426.6 [天文地球—大气科学及气象学]; 在线阅读下载PDF 职称材料

题名基于身份感知模型的素描人脸识别方法被引量：4: 5; 作者段中钰李玉涛田澍郭亚男杜康宁张帆; 机构北京信息科技大学光电测试技术及仪器教育部重点实验室北京信息科技大学信息与通信工程学院; 出处《电讯技术》北大核心 2023年第5期725-732,共8页; 基金国家自然科学基金资助项目(U20A20163,62001033) 北京市教委面上项目(KM202011232021,KM202111232014,KZ202111232049) “勤信人才”培育计划(QXTCP A201902,QXTCPC202108)。; 文摘针对素描图像和光学图像之间存在较大的模态差异这一问题,提出了一种基于身份感知模型的素描人脸识别方法,实现跨模态图像生成和素描人脸识别。该方法应用新的感知损失来监督图像生成网络,生成更好的跨模态图像,减少模态差异带来的识别精度损失,并通过三元组损失来正则化类内和类间距离,增强识别模型的性能,用联合训练策略提升素描人脸识别能力。在UoM-SGFSv2、e-PRIP等素描人脸数据集上的实验结果表明,该方法识别效果优于其他对比算法。; 关键词素描人脸识别模态差异图像生成感知损失人脸合成; Keywords sketch face recognition domain gap image generation perception loss face synthesis; 分类号 TP391.41 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名无监督迁移学习红外行为识别被引量：2: 6; 作者黑鸿中肖儿良简献忠; 机构上海理工大学光电信息与计算机工程学院; 出处《小型微型计算机系统》 CSCD 北大核心 2020年第4期704-709,共6页; 基金国家自然科学基金项目(11774017)资助。; 文摘为了缩小可见光视频和红外视频之间的模态差异而提高红外行为识别率,以及简化深度学习用于红外行为识别需人工标注数据集繁琐的问题.基于迁移学习的思想,本文提出一种用可见光动作(源域)来识别红外动作(目标域)的无监督异构红外行为识别算法(UHDIAR).UHDIAR算法将可见光数据和红外数据映射到同一个对齐的特征空间中,采取余弦相似度调整源域样本的权重,利用对齐后的可见光数据训练权重支持向量机(W-SVM),进而识别红外动作并自动标注.采用可见光动作数据集(XD145)和红外动作数据集(InfAR)进行实验,结果表明UHDIAR的平均识别率与标准的SVM相比相对提高68.65%.; 关键词可见光红外行为识别模态差异迁移学习无监督异构; Keywords visible light infrared human action recognition modal difference transfer learning unsupervised heterogeneous; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于转换生成网络的素描人脸识别被引量：1: 7; 作者霍西宝曹林郭亚男杜康宁; 机构北京信息科技大学光电测试技术及仪器教育部重点实验室北京信息科技大学信息与通信工程学院; 出处《计算机工程与设计》北大核心 2022年第1期269-276,共8页; 基金国家自然科学基金项目(61671069、62001033) 北京信息科技大学“勤信人才”培育计划基金项目(QXTCPA201902) +1 种基金北京信息科技大学校基金项目(2025017)。; 文摘针对素描图像和可见光图像存在较大模态差异这一问题,提出一种基于转换生成网络的素描人脸识别方法,该网络同时实现跨模态图像生成和素描人脸识别。转换生成网络由生成器、判别器和特征转换网络(S网络)组成。生成器生成图像,判别器使得生成图像具备两种模态信息,S网络提取高级语义特征来辅助生成图像和识别。使用端对端训练来更新模型参数,通过引入识别损失约束项指导生成更好的跨模态图像,通过生成的跨模态图像减少模态差异带来的识别精度损失。在UoM-SGFSv2、e-PRIP等素描人脸数据集上验证该方法识别性能,实验结果表明,该方法识别效果优于其它对比算法。; 关键词素描人脸识别模态差异转换生成网络图像生成特征转换网络跨模态图像; Keywords sketch face recognition domain gap transformation generation network image generation feature transformation network cross-modality images; 分类号 TP391.41 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于多模态表征学习的自动音频字幕方法	谭力文周翊柳银曹寅	《计算机应用研究》北大核心	2025	0	在线阅读下载PDF 职称材料
2	汽车内饰品质感的感知模态研究	尹彦青赵丹华谭征宇	《包装工程》 CAS CSCD 北大核心	2016	19	在线阅读下载PDF 职称材料
3	跨域和跨模态适应学习的无监督细粒度视频分类	何相腾彭宇新	《软件学报》 EI CSCD 北大核心	2021	4	在线阅读下载PDF 职称材料
4	中国冬夏季气温和降水异常耦合关系的SVD与MEOF分析对比	李丽平马晨誉倪语蔓袁爱军王盘兴	《大气科学学报》 CSCD 北大核心	2018	7	在线阅读下载PDF 职称材料
5	基于身份感知模型的素描人脸识别方法	段中钰李玉涛田澍郭亚男杜康宁张帆	《电讯技术》北大核心	2023	4	在线阅读下载PDF 职称材料
6	无监督迁移学习红外行为识别	黑鸿中肖儿良简献忠	《小型微型计算机系统》 CSCD 北大核心	2020	2	在线阅读下载PDF 职称材料
7	基于转换生成网络的素描人脸识别	霍西宝曹林郭亚男杜康宁	《计算机工程与设计》北大核心	2022	1	在线阅读下载PDF 职称材料