检索结果-维普期刊中文期刊服务平台

基于音视频的情感识别方法研究被引量：7: 1; 作者林淑瑞张晓辉 +2 位作者郭敏张卫强王贵锦《信号处理》 CSCD 北大核心 2021年第10期1889-1898,共10页; 近年来,情感计算逐渐成为人机交互发展突破的关键,而情感识别作为情感计算的重要部分,也受到了广泛的关注。本文实现了基于ResNet18的面部表情识别系统和基于HGFM架构的语音情感识别模型,通过调整参数,训练出了性能较好的模型。在此基础... 展开更多; 关键词情感识别深度学习多模态融合残差网络分层粒度和特征模型; 在线阅读下载PDF 职称材料

无线电区域定位系统的分布式空间基准自主建立技术被引量：1: 2; 作者窦子铮姚铮陆明泉《电子学报》 EI CAS CSCD 北大核心 2022年第4期841-848,共8页; 为了满足无线电区域定位系统(Radio Local Positioning System,RLPS)空间基准自主建立技术高精度、高效率、高鲁棒性的要求,在交替坐标下降法(Alternating Coordinate Descent,ACD)的基础上进行了改进,提出了一种分布式的空间基准自主... 展开更多; 关键词区域定位系统分布式算法基准自主建立坐标下降法并行优化绝对坐标; 在线阅读下载PDF 职称材料

采用注意力机制和多任务训练的端到端无语音识别关键词检索系统被引量：20: 3; 作者赵泽宇张卫强刘加《信号处理》 CSCD 北大核心 2020年第6期839-851,共13页; 传统的关键词搜索(KWS,Keyword Search)系统依靠自动语音识别(ASR,Automatic Speech Recognition),通常在资源不足的情况下很难训练。为了免去训练完整的语音识别系统,无语音识别(ASR-free)的关键词检索系统受到越来越多的欢迎。本文提... 展开更多; 关键词关键词检索语音识别端到端低资源语种; 在线阅读下载PDF 职称材料

基于声学模型共享的零资源韩语语音识别被引量：3: 4; 作者王皓宇 JEON Eunah +2 位作者张卫强李科黄宇凯《数据采集与处理》 CSCD 北大核心 2023年第1期93-100,共8页; 精准的语音识别系统通常使用大量的有标注语音数据训练得到,但现有的开源大规模数据集只包含一些广泛使用的语言,诸多小语种则面临着训练数据不足的问题。声学模型共享方法给出了这个问题的一种解决方法,它利用不同语种间的相似性,可以... 展开更多; 关键词语音识别零资源语音识别韩语语音识别; 在线阅读下载PDF 职称材料

GaN基三维结构生长与器件应用: 5; 作者王珣汪莱 +6 位作者郝智彪罗毅孙长征韩彦军熊兵王健李洪涛《人工晶体学报》 EI CAS 北大核心 2020年第11期1984-1995,共12页; 目前,c面氮化镓(GaN)基发光二极管的制备技术已经十分成熟并取得了商业化成功,但仍面临极化电场导致的大电流密度下效率下降(Droop效应)和黄绿光波段效率低的问题。为消除极化电场的影响,人们开始关注半极性和非极性面GaN。其中,基于传... 展开更多; 关键词氮化镓发光二极管三维结构无荧光粉白光效率下降; 在线阅读下载PDF 职称材料

题名基于音视频的情感识别方法研究被引量：7: 1; 作者林淑瑞张晓辉郭敏张卫强王贵锦; 机构清华大学电子工程系清华大学深圳国际研究生院北京交通大学电子信息工程学院; 出处《信号处理》 CSCD 北大核心 2021年第10期1889-1898,共10页; 基金 NSFC-通用技术基础研究联合基金重点项目(U1836219)。; 文摘近年来,情感计算逐渐成为人机交互发展突破的关键,而情感识别作为情感计算的重要部分,也受到了广泛的关注。本文实现了基于ResNet18的面部表情识别系统和基于HGFM架构的语音情感识别模型,通过调整参数,训练出了性能较好的模型。在此基础上,通过特征级融合和决策级融合这两种多模态融合策略,实现了包含视频和音频信号的多模态情感识别系统,展现了多模态情感识别系统性能的优越性。两种不同融合策略下的音视频情感识别模型相比视频模态和音频模态,在准确率上都有一定的提升,验证了多模态模型往往比最优的单模态模型的识别性能更好的结论。本文所实现的模型取得了较好的情感识别性能,融合后的音视频双模态模型的准确率达到了76.84%,与现有最优模型相比提升了3.50%,在与现有的音视频情感识别模型的比较中具有性能上的优势。; 关键词情感识别深度学习多模态融合残差网络分层粒度和特征模型; Keywords emotion recognition deep learning multimodal fusion residual network hierarchical grained and feature model; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名无线电区域定位系统的分布式空间基准自主建立技术被引量：1: 2; 作者窦子铮姚铮陆明泉; 机构清华大学电子工程系北京国家信息科学技术研究中心; 出处《电子学报》 EI CAS CSCD 北大核心 2022年第4期841-848,共8页; 基金国家重点研发计划项目(No.2021YFA0716600) 北京信息科学与技术国家研究中心青年创新基金(No.BNR2021RC01015)。; 文摘为了满足无线电区域定位系统(Radio Local Positioning System,RLPS)空间基准自主建立技术高精度、高效率、高鲁棒性的要求,在交替坐标下降法(Alternating Coordinate Descent,ACD)的基础上进行了改进,提出了一种分布式的空间基准自主建立技术.通过关联节点局部优化与系统全局优化,利用坐标下降法实现了分布式高精度定位.在算法收敛约束分析的基础上,通过寻找节点拓扑独立集,提出了系统并行策略,缩短了定位耗时.同时,将测距信息与锚点信息深度融合,对优化模型进行了更新,提出了分布式的节点绝对坐标获取方法.通过仿真和实验验证,所提分布式算法在获取高精度定位结果的同时,有效缩短了定位耗时.; 关键词区域定位系统分布式算法基准自主建立坐标下降法并行优化绝对坐标; Keywords local positioning system distributed algorithm reference autonomous establishment coordinate descent algorithm parallel optimization absolute coordinate; 分类号 TN961 [电子电信—信号与信息处理]; 在线阅读下载PDF 职称材料

题名采用注意力机制和多任务训练的端到端无语音识别关键词检索系统被引量：20: 3; 作者赵泽宇张卫强刘加; 机构清华大学电子工程系; 出处《信号处理》 CSCD 北大核心 2020年第6期839-851,共13页; 基金 NSFC-通用技术基础研究联合基金重点项目(U1836219)。; 文摘传统的关键词搜索(KWS,Keyword Search)系统依靠自动语音识别(ASR,Automatic Speech Recognition),通常在资源不足的情况下很难训练。为了免去训练完整的语音识别系统,无语音识别(ASR-free)的关键词检索系统受到越来越多的欢迎。本文提出了一个端到端(E2E,End-to-End)的关键词检索系统,该系统由两个编码器,两个解码器,一个注意机制和一个判别器组成。本文在所提出的系统中引入了注意力机制,该机制可以合并编码器输出的文本和音频特征从而辅助定位关键词所在的位置。在文本和音频解码器的不同组合情况下,使用Babel阿萨姆语和普什图语数据集测试系统。实验结果表明,相比于基线系统而言,该系统拥有更好的检测性能。相比于基于语音识别的关键词检索系统,该系统对于集外词(OOV,Out-Of-Vocabulary),在STWV(Supremum Term Weighted Value)指标上,取得了更好的效果。当训练数据量受限时,该系统比基于语音识别的关键词检索系统更具有优势。; 关键词关键词检索语音识别端到端低资源语种; Keywords keyword search speech recognition end-to-end low resource languages; 分类号 TN912 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名基于声学模型共享的零资源韩语语音识别被引量：3: 4; 作者王皓宇 JEON Eunah 张卫强李科黄宇凯; 机构清华大学电子工程系北京海天瑞声科技股份有限公司; 出处《数据采集与处理》 CSCD 北大核心 2023年第1期93-100,共8页; 基金 NSFC-通用技术基础研究联合基金重点项目(U1836219)。; 文摘精准的语音识别系统通常使用大量的有标注语音数据训练得到,但现有的开源大规模数据集只包含一些广泛使用的语言,诸多小语种则面临着训练数据不足的问题。声学模型共享方法给出了这个问题的一种解决方法,它利用不同语种间的相似性,可以实现不需要小语种语音数据的语音识别。本文将声学模型共享方法扩展到韩语语音识别上,利用汉语声学模型构建韩语和汉语之间的音素映射关系。在不使用任何韩语语音数据的情况下构建的语音识别系统在Zeroth测试集上的字错误率达到了27.33%。同时本文还测试了不同映射方式之间的差异,结果表明这种共享模型的音素映射应当采用将目标语言词汇映射为源语言音素的方式。; 关键词语音识别零资源语音识别韩语语音识别; Keywords speech recognition zero resource speech recognition Korean speech recognition; 分类号 TN912 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名GaN基三维结构生长与器件应用: 5; 作者王珣汪莱郝智彪罗毅孙长征韩彦军熊兵王健李洪涛; 机构清华大学电子工程系; 出处《人工晶体学报》 EI CAS 北大核心 2020年第11期1984-1995,共12页; 基金国家重点研发计划(2018YFB0406702) 国家自然科学基金(61974080)。; 文摘目前,c面氮化镓(GaN)基发光二极管的制备技术已经十分成熟并取得了商业化成功,但仍面临极化电场导致的大电流密度下效率下降(Droop效应)和黄绿光波段效率低的问题。为消除极化电场的影响,人们开始关注半极性和非极性面GaN。其中,基于传统极性面衬底通过三维结构生长来获得半极性和非极性GaN的方法,由于其低成本和生长的灵活性,受到了广泛研究。本文首先总结了三种GaN三维结构的制备方法并分析其生长机理。接着,在此基础上介绍了不同晶面InGaN量子阱的外延生长和发光特性。最后,列举了GaN基三维结构在半极性面LED、颜色可调LED和无荧光粉白光发光二极管方面的应用。; 关键词氮化镓发光二极管三维结构无荧光粉白光效率下降; Keywords GaN light-emitting diode three-dimensional structure phosphor-free white light efficiency droop; 分类号 O484.1 [理学—固体物理] O471 [理学—半导体物理]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于音视频的情感识别方法研究	林淑瑞张晓辉郭敏张卫强王贵锦	《信号处理》 CSCD 北大核心	2021	7	在线阅读下载PDF 职称材料
2	无线电区域定位系统的分布式空间基准自主建立技术	窦子铮姚铮陆明泉	《电子学报》 EI CAS CSCD 北大核心	2022	1	在线阅读下载PDF 职称材料
3	采用注意力机制和多任务训练的端到端无语音识别关键词检索系统	赵泽宇张卫强刘加	《信号处理》 CSCD 北大核心	2020	20	在线阅读下载PDF 职称材料
4	基于声学模型共享的零资源韩语语音识别	王皓宇 JEON Eunah 张卫强李科黄宇凯	《数据采集与处理》 CSCD 北大核心	2023	3	在线阅读下载PDF 职称材料
5	GaN基三维结构生长与器件应用	王珣汪莱郝智彪罗毅孙长征韩彦军熊兵王健李洪涛	《人工晶体学报》 EI CAS 北大核心	2020	0	在线阅读下载PDF 职称材料