期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多模态表征学习的自动音频字幕方法
1
作者
谭力文
周翊
+1 位作者
柳银
曹寅
《计算机应用研究》
北大核心
2025年第6期1662-1667,共6页
在自动音频字幕(automated audio captioning,AAC)和大多数多模态研究领域中,模态差异一直构成重大挑战。增强模型对文本信息的理解,在建立文本和音频两种模态之间的无缝连接中起着至关重要的作用。最近的研究集中在通过对比学习的方法...
在自动音频字幕(automated audio captioning,AAC)和大多数多模态研究领域中,模态差异一直构成重大挑战。增强模型对文本信息的理解,在建立文本和音频两种模态之间的无缝连接中起着至关重要的作用。最近的研究集中在通过对比学习的方法来缩小这两种模态之间的差距,但仅使用简单的对比损失函数来弥合这两种模态之间的差异是具有挑战性的。为减少模态差异带来的影响,增强模型对两种模态特征的利用率,提出基于多模态表征学习的音频字幕方法SimTLNet,通过引入一种全新的表征模块TRANSLATOR,构造孪生表征结构,并联合对比学习和动量更新模型权重的方式,使模型能够同时学习音频模态和文本模态之间共有的高维语义信息。该方法在AudioCaps和Clotho V2数据集上的METEOR、CIDEr和SPIDEr-FL分别达到了0.251、0.782、0.480和0.187、0.475、0.303,并取得了可以与先进方法相媲美的结果,有效弥合了两种模态之间的差异。
展开更多
关键词
音频字幕
表征学习
对比学习
模态差异
孪生网络
在线阅读
下载PDF
职称材料
汽车内饰品质感的感知模态研究
被引量:
19
2
作者
尹彦青
赵丹华
谭征宇
《包装工程》
CAS
CSCD
北大核心
2016年第20期35-40,共6页
目的从用户感知模态出发,构建内饰品质感性意象评价模型。方法以情感设计为背景,提出了用户对汽车内饰的品质感是由直接知觉和认知意象共同构成;从感知觉特性出发,通过30名用户对6个汽车内饰皮质纹理样本质感的评价进行情感语义量化,形...
目的从用户感知模态出发,构建内饰品质感性意象评价模型。方法以情感设计为背景,提出了用户对汽车内饰的品质感是由直接知觉和认知意象共同构成;从感知觉特性出发,通过30名用户对6个汽车内饰皮质纹理样本质感的评价进行情感语义量化,形成皮质纹理意象感知尺度。结果从触觉单模态感知和视触觉双模态感知的角度,验证了用户不同感觉模态下对汽车内饰皮质纹理情感的感知差异。结论基于汽车内饰品质的情感设计,其核心在于对用户感知与情感之间客观联系的挖掘,以材料工艺所表现的产品造型感知质量成为内饰设计的必然趋势。
展开更多
关键词
汽车内饰
情感设计
感知
模态差异
内饰品质感
在线阅读
下载PDF
职称材料
跨域和跨模态适应学习的无监督细粒度视频分类
被引量:
4
3
作者
何相腾
彭宇新
《软件学报》
EI
CSCD
北大核心
2021年第11期3482-3495,共14页
细粒度视频分类旨在识别粗粒度大类中的细粒度子类,是计算机视觉中一个极具挑战的任务.考虑到视频数据的标注成本巨大,而图像的标注成本相对较小,且细粒度图像分类已经取得了较为显著的进展,一个自然的想法是不用标注,以无监督的方式将...
细粒度视频分类旨在识别粗粒度大类中的细粒度子类,是计算机视觉中一个极具挑战的任务.考虑到视频数据的标注成本巨大,而图像的标注成本相对较小,且细粒度图像分类已经取得了较为显著的进展,一个自然的想法是不用标注,以无监督的方式将细粒度图像分类中学习到的知识自适应地迁移到细粒度视频分类中.然而,来源不同的图像和视频之间存在着域差异和模态差异,这导致细粒度图像分类的模型不能直接应用于细粒度视频分类.为了实现无监督的细粒度视频分类,提出一种无监督辨识适应网络,能够将辨识性定位能力从细粒度图像分类迁移到细粒度视频分类.进一步,提出一种渐进式伪标签策略来迭代地引导无监督辨识适应网络学习目标域视频的数据分布.在CUB-200-2011、Cars-196图像数据集和YouTube Birds、YouTube Cars视频数据集上验证该方法跨域、跨模态的适应能力,实验结果证明了该方法在无监督细粒度视频分类上的优势.
展开更多
关键词
细粒度视频分类
无监督辨识适应网络
域
差异
模态差异
域适应
在线阅读
下载PDF
职称材料
中国冬夏季气温和降水异常耦合关系的SVD与MEOF分析对比
被引量:
7
4
作者
李丽平
马晨誉
+2 位作者
倪语蔓
袁爱军
王盘兴
《大气科学学报》
CSCD
北大核心
2018年第5期647-656,共10页
以揭示中国冬、夏季气温、降水之间的同期耦合时空特征为例,比较了SVD与MEOF分析所得主要正交模的相关关系及均衡性,论证了SVD方法在揭示两个要素场序列互相关关系上的优越性。结果表明:1) SVD的分解对象仅包含反映两种要素场相关关系...
以揭示中国冬、夏季气温、降水之间的同期耦合时空特征为例,比较了SVD与MEOF分析所得主要正交模的相关关系及均衡性,论证了SVD方法在揭示两个要素场序列互相关关系上的优越性。结果表明:1) SVD的分解对象仅包含反映两种要素场相关关系的信息,而MEOF还包含了两个要素场各自的自相关信息,前者分解对象更纯粹。2) MEOF和SVD揭示的气温和降水空间耦合模态正负异常分布大致相似,但相较SVD所揭示的耦合模态,MEOF分析的冬、夏季气温、降水主要正交模存在不均衡现象,即一个主要MEOF正交模往往侧重描述两种异常要素场中的一种,这种差异在冬季尤为突出。SVD方法揭示了中国冬、夏季同期气温、降水间局域高温少降水或低温多降水是二者主要异常配置,且相关性夏强冬弱。3)比较SVD、MEOF方法同序正交模的相关系数和均衡度发现,SVD多数正交模的相关系数较MEOF的更大、更稳定,且均通过显著性检验,MEOF的冬季部分正交模相关系数未通过显著性检验; SVD主要正交模的均衡性冬季优于MEOF分析、夏季优于(第一模态)或者接近于(第二、三模态) MEOF分析。故SVD方法是揭示两要素之间耦合关系的更好方法。
展开更多
关键词
气温
降水
SVD
MEOF分析
均衡性
相关性
耦合
模态差异
在线阅读
下载PDF
职称材料
基于身份感知模型的素描人脸识别方法
被引量:
4
5
作者
段中钰
李玉涛
+3 位作者
田澍
郭亚男
杜康宁
张帆
《电讯技术》
北大核心
2023年第5期725-732,共8页
针对素描图像和光学图像之间存在较大的模态差异这一问题,提出了一种基于身份感知模型的素描人脸识别方法,实现跨模态图像生成和素描人脸识别。该方法应用新的感知损失来监督图像生成网络,生成更好的跨模态图像,减少模态差异带来的识别...
针对素描图像和光学图像之间存在较大的模态差异这一问题,提出了一种基于身份感知模型的素描人脸识别方法,实现跨模态图像生成和素描人脸识别。该方法应用新的感知损失来监督图像生成网络,生成更好的跨模态图像,减少模态差异带来的识别精度损失,并通过三元组损失来正则化类内和类间距离,增强识别模型的性能,用联合训练策略提升素描人脸识别能力。在UoM-SGFSv2、e-PRIP等素描人脸数据集上的实验结果表明,该方法识别效果优于其他对比算法。
展开更多
关键词
素描人脸识别
模态差异
图像生成
感知损失
人脸合成
在线阅读
下载PDF
职称材料
无监督迁移学习红外行为识别
被引量:
2
6
作者
黑鸿中
肖儿良
简献忠
《小型微型计算机系统》
CSCD
北大核心
2020年第4期704-709,共6页
为了缩小可见光视频和红外视频之间的模态差异而提高红外行为识别率,以及简化深度学习用于红外行为识别需人工标注数据集繁琐的问题.基于迁移学习的思想,本文提出一种用可见光动作(源域)来识别红外动作(目标域)的无监督异构红外行为识...
为了缩小可见光视频和红外视频之间的模态差异而提高红外行为识别率,以及简化深度学习用于红外行为识别需人工标注数据集繁琐的问题.基于迁移学习的思想,本文提出一种用可见光动作(源域)来识别红外动作(目标域)的无监督异构红外行为识别算法(UHDIAR).UHDIAR算法将可见光数据和红外数据映射到同一个对齐的特征空间中,采取余弦相似度调整源域样本的权重,利用对齐后的可见光数据训练权重支持向量机(W-SVM),进而识别红外动作并自动标注.采用可见光动作数据集(XD145)和红外动作数据集(InfAR)进行实验,结果表明UHDIAR的平均识别率与标准的SVM相比相对提高68.65%.
展开更多
关键词
可见光
红外
行为识别
模态差异
迁移学习
无监督
异构
在线阅读
下载PDF
职称材料
基于转换生成网络的素描人脸识别
被引量:
1
7
作者
霍西宝
曹林
+1 位作者
郭亚男
杜康宁
《计算机工程与设计》
北大核心
2022年第1期269-276,共8页
针对素描图像和可见光图像存在较大模态差异这一问题,提出一种基于转换生成网络的素描人脸识别方法,该网络同时实现跨模态图像生成和素描人脸识别。转换生成网络由生成器、判别器和特征转换网络(S网络)组成。生成器生成图像,判别器使得...
针对素描图像和可见光图像存在较大模态差异这一问题,提出一种基于转换生成网络的素描人脸识别方法,该网络同时实现跨模态图像生成和素描人脸识别。转换生成网络由生成器、判别器和特征转换网络(S网络)组成。生成器生成图像,判别器使得生成图像具备两种模态信息,S网络提取高级语义特征来辅助生成图像和识别。使用端对端训练来更新模型参数,通过引入识别损失约束项指导生成更好的跨模态图像,通过生成的跨模态图像减少模态差异带来的识别精度损失。在UoM-SGFSv2、e-PRIP等素描人脸数据集上验证该方法识别性能,实验结果表明,该方法识别效果优于其它对比算法。
展开更多
关键词
素描人脸识别
模态差异
转换生成网络
图像生成
特征转换网络
跨
模态
图像
在线阅读
下载PDF
职称材料
题名
基于多模态表征学习的自动音频字幕方法
1
作者
谭力文
周翊
柳银
曹寅
机构
重庆邮电大学通信与信息工程学院
西交利物浦大学智能科学系
出处
《计算机应用研究》
北大核心
2025年第6期1662-1667,共6页
基金
国家自然科学基金资助项目(62301096)
重庆市自然科学基金资助项目(CSTB2023NSCQMSX0659)
+1 种基金
国家重点研究与发展(R&D)计划资助项目(2024QY2630)
西交利物浦大学资助项目(RDF-22-01-084)。
文摘
在自动音频字幕(automated audio captioning,AAC)和大多数多模态研究领域中,模态差异一直构成重大挑战。增强模型对文本信息的理解,在建立文本和音频两种模态之间的无缝连接中起着至关重要的作用。最近的研究集中在通过对比学习的方法来缩小这两种模态之间的差距,但仅使用简单的对比损失函数来弥合这两种模态之间的差异是具有挑战性的。为减少模态差异带来的影响,增强模型对两种模态特征的利用率,提出基于多模态表征学习的音频字幕方法SimTLNet,通过引入一种全新的表征模块TRANSLATOR,构造孪生表征结构,并联合对比学习和动量更新模型权重的方式,使模型能够同时学习音频模态和文本模态之间共有的高维语义信息。该方法在AudioCaps和Clotho V2数据集上的METEOR、CIDEr和SPIDEr-FL分别达到了0.251、0.782、0.480和0.187、0.475、0.303,并取得了可以与先进方法相媲美的结果,有效弥合了两种模态之间的差异。
关键词
音频字幕
表征学习
对比学习
模态差异
孪生网络
Keywords
audio captioning
representation learning
contrastive learning
modality discrepancies
twin network
分类号
TP37 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
汽车内饰品质感的感知模态研究
被引量:
19
2
作者
尹彦青
赵丹华
谭征宇
机构
湖南大学汽车车身先进设计制造国家重点实验室
出处
《包装工程》
CAS
CSCD
北大核心
2016年第20期35-40,共6页
基金
国家自然科学基金(61402159
51605154)
文摘
目的从用户感知模态出发,构建内饰品质感性意象评价模型。方法以情感设计为背景,提出了用户对汽车内饰的品质感是由直接知觉和认知意象共同构成;从感知觉特性出发,通过30名用户对6个汽车内饰皮质纹理样本质感的评价进行情感语义量化,形成皮质纹理意象感知尺度。结果从触觉单模态感知和视触觉双模态感知的角度,验证了用户不同感觉模态下对汽车内饰皮质纹理情感的感知差异。结论基于汽车内饰品质的情感设计,其核心在于对用户感知与情感之间客观联系的挖掘,以材料工艺所表现的产品造型感知质量成为内饰设计的必然趋势。
关键词
汽车内饰
情感设计
感知
模态差异
内饰品质感
Keywords
automotive interior
emotion design
perceptual modal difference
interior quality sense
分类号
TB472 [一般工业技术—工业设计]
在线阅读
下载PDF
职称材料
题名
跨域和跨模态适应学习的无监督细粒度视频分类
被引量:
4
3
作者
何相腾
彭宇新
机构
北京大学王选计算机研究所
出处
《软件学报》
EI
CSCD
北大核心
2021年第11期3482-3495,共14页
基金
国家自然科学基金(61925201,61771025)。
文摘
细粒度视频分类旨在识别粗粒度大类中的细粒度子类,是计算机视觉中一个极具挑战的任务.考虑到视频数据的标注成本巨大,而图像的标注成本相对较小,且细粒度图像分类已经取得了较为显著的进展,一个自然的想法是不用标注,以无监督的方式将细粒度图像分类中学习到的知识自适应地迁移到细粒度视频分类中.然而,来源不同的图像和视频之间存在着域差异和模态差异,这导致细粒度图像分类的模型不能直接应用于细粒度视频分类.为了实现无监督的细粒度视频分类,提出一种无监督辨识适应网络,能够将辨识性定位能力从细粒度图像分类迁移到细粒度视频分类.进一步,提出一种渐进式伪标签策略来迭代地引导无监督辨识适应网络学习目标域视频的数据分布.在CUB-200-2011、Cars-196图像数据集和YouTube Birds、YouTube Cars视频数据集上验证该方法跨域、跨模态的适应能力,实验结果证明了该方法在无监督细粒度视频分类上的优势.
关键词
细粒度视频分类
无监督辨识适应网络
域
差异
模态差异
域适应
Keywords
fine-grained video categorization
unsupervised discriminative adaptation network
domain distinction
modality distinction
domain adaption
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
中国冬夏季气温和降水异常耦合关系的SVD与MEOF分析对比
被引量:
7
4
作者
李丽平
马晨誉
倪语蔓
袁爱军
王盘兴
机构
南京信息工程大学气象灾害预报预警与评估协同创新中心/气象灾害教育部重点实验室
南京信息工程大学大气科学学院
安徽省气象台
[
出处
《大气科学学报》
CSCD
北大核心
2018年第5期647-656,共10页
基金
国家重点基础研究发展计划(973计划)项目(2015CB453202)
江苏高校优势学科建设工程资助项目(PAPD)
文摘
以揭示中国冬、夏季气温、降水之间的同期耦合时空特征为例,比较了SVD与MEOF分析所得主要正交模的相关关系及均衡性,论证了SVD方法在揭示两个要素场序列互相关关系上的优越性。结果表明:1) SVD的分解对象仅包含反映两种要素场相关关系的信息,而MEOF还包含了两个要素场各自的自相关信息,前者分解对象更纯粹。2) MEOF和SVD揭示的气温和降水空间耦合模态正负异常分布大致相似,但相较SVD所揭示的耦合模态,MEOF分析的冬、夏季气温、降水主要正交模存在不均衡现象,即一个主要MEOF正交模往往侧重描述两种异常要素场中的一种,这种差异在冬季尤为突出。SVD方法揭示了中国冬、夏季同期气温、降水间局域高温少降水或低温多降水是二者主要异常配置,且相关性夏强冬弱。3)比较SVD、MEOF方法同序正交模的相关系数和均衡度发现,SVD多数正交模的相关系数较MEOF的更大、更稳定,且均通过显著性检验,MEOF的冬季部分正交模相关系数未通过显著性检验; SVD主要正交模的均衡性冬季优于MEOF分析、夏季优于(第一模态)或者接近于(第二、三模态) MEOF分析。故SVD方法是揭示两要素之间耦合关系的更好方法。
关键词
气温
降水
SVD
MEOF分析
均衡性
相关性
耦合
模态差异
Keywords
temperature
precipitation
SVD
MEOF analysis
equilibrium
correlation
difference of coupling modes
分类号
P423 [天文地球—大气科学及气象学]
P426.6 [天文地球—大气科学及气象学]
在线阅读
下载PDF
职称材料
题名
基于身份感知模型的素描人脸识别方法
被引量:
4
5
作者
段中钰
李玉涛
田澍
郭亚男
杜康宁
张帆
机构
北京信息科技大学光电测试技术及仪器教育部重点实验室
北京信息科技大学信息与通信工程学院
出处
《电讯技术》
北大核心
2023年第5期725-732,共8页
基金
国家自然科学基金资助项目(U20A20163,62001033)
北京市教委面上项目(KM202011232021,KM202111232014,KZ202111232049)
“勤信人才”培育计划(QXTCP A201902,QXTCPC202108)。
文摘
针对素描图像和光学图像之间存在较大的模态差异这一问题,提出了一种基于身份感知模型的素描人脸识别方法,实现跨模态图像生成和素描人脸识别。该方法应用新的感知损失来监督图像生成网络,生成更好的跨模态图像,减少模态差异带来的识别精度损失,并通过三元组损失来正则化类内和类间距离,增强识别模型的性能,用联合训练策略提升素描人脸识别能力。在UoM-SGFSv2、e-PRIP等素描人脸数据集上的实验结果表明,该方法识别效果优于其他对比算法。
关键词
素描人脸识别
模态差异
图像生成
感知损失
人脸合成
Keywords
sketch face recognition
domain gap
image generation
perception loss
face synthesis
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
无监督迁移学习红外行为识别
被引量:
2
6
作者
黑鸿中
肖儿良
简献忠
机构
上海理工大学光电信息与计算机工程学院
出处
《小型微型计算机系统》
CSCD
北大核心
2020年第4期704-709,共6页
基金
国家自然科学基金项目(11774017)资助。
文摘
为了缩小可见光视频和红外视频之间的模态差异而提高红外行为识别率,以及简化深度学习用于红外行为识别需人工标注数据集繁琐的问题.基于迁移学习的思想,本文提出一种用可见光动作(源域)来识别红外动作(目标域)的无监督异构红外行为识别算法(UHDIAR).UHDIAR算法将可见光数据和红外数据映射到同一个对齐的特征空间中,采取余弦相似度调整源域样本的权重,利用对齐后的可见光数据训练权重支持向量机(W-SVM),进而识别红外动作并自动标注.采用可见光动作数据集(XD145)和红外动作数据集(InfAR)进行实验,结果表明UHDIAR的平均识别率与标准的SVM相比相对提高68.65%.
关键词
可见光
红外
行为识别
模态差异
迁移学习
无监督
异构
Keywords
visible light
infrared
human action recognition
modal difference
transfer learning
unsupervised
heterogeneous
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于转换生成网络的素描人脸识别
被引量:
1
7
作者
霍西宝
曹林
郭亚男
杜康宁
机构
北京信息科技大学光电测试技术及仪器教育部重点实验室
北京信息科技大学信息与通信工程学院
出处
《计算机工程与设计》
北大核心
2022年第1期269-276,共8页
基金
国家自然科学基金项目(61671069、62001033)
北京信息科技大学“勤信人才”培育计划基金项目(QXTCPA201902)
+1 种基金
北京市教委面上基金项目(KM202011232021)
北京信息科技大学校基金项目(2025017)。
文摘
针对素描图像和可见光图像存在较大模态差异这一问题,提出一种基于转换生成网络的素描人脸识别方法,该网络同时实现跨模态图像生成和素描人脸识别。转换生成网络由生成器、判别器和特征转换网络(S网络)组成。生成器生成图像,判别器使得生成图像具备两种模态信息,S网络提取高级语义特征来辅助生成图像和识别。使用端对端训练来更新模型参数,通过引入识别损失约束项指导生成更好的跨模态图像,通过生成的跨模态图像减少模态差异带来的识别精度损失。在UoM-SGFSv2、e-PRIP等素描人脸数据集上验证该方法识别性能,实验结果表明,该方法识别效果优于其它对比算法。
关键词
素描人脸识别
模态差异
转换生成网络
图像生成
特征转换网络
跨
模态
图像
Keywords
sketch face recognition
domain gap
transformation generation network
image generation
feature transformation network
cross-modality images
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多模态表征学习的自动音频字幕方法
谭力文
周翊
柳银
曹寅
《计算机应用研究》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
汽车内饰品质感的感知模态研究
尹彦青
赵丹华
谭征宇
《包装工程》
CAS
CSCD
北大核心
2016
19
在线阅读
下载PDF
职称材料
3
跨域和跨模态适应学习的无监督细粒度视频分类
何相腾
彭宇新
《软件学报》
EI
CSCD
北大核心
2021
4
在线阅读
下载PDF
职称材料
4
中国冬夏季气温和降水异常耦合关系的SVD与MEOF分析对比
李丽平
马晨誉
倪语蔓
袁爱军
王盘兴
《大气科学学报》
CSCD
北大核心
2018
7
在线阅读
下载PDF
职称材料
5
基于身份感知模型的素描人脸识别方法
段中钰
李玉涛
田澍
郭亚男
杜康宁
张帆
《电讯技术》
北大核心
2023
4
在线阅读
下载PDF
职称材料
6
无监督迁移学习红外行为识别
黑鸿中
肖儿良
简献忠
《小型微型计算机系统》
CSCD
北大核心
2020
2
在线阅读
下载PDF
职称材料
7
基于转换生成网络的素描人脸识别
霍西宝
曹林
郭亚男
杜康宁
《计算机工程与设计》
北大核心
2022
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部