期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于音视频的情感识别方法研究 被引量:7
1
作者 林淑瑞 张晓辉 +2 位作者 郭敏 张卫强 王贵锦 《信号处理》 CSCD 北大核心 2021年第10期1889-1898,共10页
近年来,情感计算逐渐成为人机交互发展突破的关键,而情感识别作为情感计算的重要部分,也受到了广泛的关注。本文实现了基于ResNet18的面部表情识别系统和基于HGFM架构的语音情感识别模型,通过调整参数,训练出了性能较好的模型。在此基础... 近年来,情感计算逐渐成为人机交互发展突破的关键,而情感识别作为情感计算的重要部分,也受到了广泛的关注。本文实现了基于ResNet18的面部表情识别系统和基于HGFM架构的语音情感识别模型,通过调整参数,训练出了性能较好的模型。在此基础上,通过特征级融合和决策级融合这两种多模态融合策略,实现了包含视频和音频信号的多模态情感识别系统,展现了多模态情感识别系统性能的优越性。两种不同融合策略下的音视频情感识别模型相比视频模态和音频模态,在准确率上都有一定的提升,验证了多模态模型往往比最优的单模态模型的识别性能更好的结论。本文所实现的模型取得了较好的情感识别性能,融合后的音视频双模态模型的准确率达到了76.84%,与现有最优模型相比提升了3.50%,在与现有的音视频情感识别模型的比较中具有性能上的优势。 展开更多
关键词 情感识别 深度学习 多模态融合 残差网络 分层粒度和特征模型
在线阅读 下载PDF
无线电区域定位系统的分布式空间基准自主建立技术 被引量:1
2
作者 窦子铮 姚铮 陆明泉 《电子学报》 EI CAS CSCD 北大核心 2022年第4期841-848,共8页
为了满足无线电区域定位系统(Radio Local Positioning System,RLPS)空间基准自主建立技术高精度、高效率、高鲁棒性的要求,在交替坐标下降法(Alternating Coordinate Descent,ACD)的基础上进行了改进,提出了一种分布式的空间基准自主... 为了满足无线电区域定位系统(Radio Local Positioning System,RLPS)空间基准自主建立技术高精度、高效率、高鲁棒性的要求,在交替坐标下降法(Alternating Coordinate Descent,ACD)的基础上进行了改进,提出了一种分布式的空间基准自主建立技术.通过关联节点局部优化与系统全局优化,利用坐标下降法实现了分布式高精度定位.在算法收敛约束分析的基础上,通过寻找节点拓扑独立集,提出了系统并行策略,缩短了定位耗时.同时,将测距信息与锚点信息深度融合,对优化模型进行了更新,提出了分布式的节点绝对坐标获取方法.通过仿真和实验验证,所提分布式算法在获取高精度定位结果的同时,有效缩短了定位耗时. 展开更多
关键词 区域定位系统 分布式算法 基准自主建立 坐标下降法 并行优化 绝对坐标
在线阅读 下载PDF
采用注意力机制和多任务训练的端到端无语音识别关键词检索系统 被引量:20
3
作者 赵泽宇 张卫强 刘加 《信号处理》 CSCD 北大核心 2020年第6期839-851,共13页
传统的关键词搜索(KWS,Keyword Search)系统依靠自动语音识别(ASR,Automatic Speech Recognition),通常在资源不足的情况下很难训练。为了免去训练完整的语音识别系统,无语音识别(ASR-free)的关键词检索系统受到越来越多的欢迎。本文提... 传统的关键词搜索(KWS,Keyword Search)系统依靠自动语音识别(ASR,Automatic Speech Recognition),通常在资源不足的情况下很难训练。为了免去训练完整的语音识别系统,无语音识别(ASR-free)的关键词检索系统受到越来越多的欢迎。本文提出了一个端到端(E2E,End-to-End)的关键词检索系统,该系统由两个编码器,两个解码器,一个注意机制和一个判别器组成。本文在所提出的系统中引入了注意力机制,该机制可以合并编码器输出的文本和音频特征从而辅助定位关键词所在的位置。在文本和音频解码器的不同组合情况下,使用Babel阿萨姆语和普什图语数据集测试系统。实验结果表明,相比于基线系统而言,该系统拥有更好的检测性能。相比于基于语音识别的关键词检索系统,该系统对于集外词(OOV,Out-Of-Vocabulary),在STWV(Supremum Term Weighted Value)指标上,取得了更好的效果。当训练数据量受限时,该系统比基于语音识别的关键词检索系统更具有优势。 展开更多
关键词 关键词检索 语音识别 端到端 低资源语种
在线阅读 下载PDF
基于声学模型共享的零资源韩语语音识别 被引量:3
4
作者 王皓宇 JEON Eunah +2 位作者 张卫强 李科 黄宇凯 《数据采集与处理》 CSCD 北大核心 2023年第1期93-100,共8页
精准的语音识别系统通常使用大量的有标注语音数据训练得到,但现有的开源大规模数据集只包含一些广泛使用的语言,诸多小语种则面临着训练数据不足的问题。声学模型共享方法给出了这个问题的一种解决方法,它利用不同语种间的相似性,可以... 精准的语音识别系统通常使用大量的有标注语音数据训练得到,但现有的开源大规模数据集只包含一些广泛使用的语言,诸多小语种则面临着训练数据不足的问题。声学模型共享方法给出了这个问题的一种解决方法,它利用不同语种间的相似性,可以实现不需要小语种语音数据的语音识别。本文将声学模型共享方法扩展到韩语语音识别上,利用汉语声学模型构建韩语和汉语之间的音素映射关系。在不使用任何韩语语音数据的情况下构建的语音识别系统在Zeroth测试集上的字错误率达到了27.33%。同时本文还测试了不同映射方式之间的差异,结果表明这种共享模型的音素映射应当采用将目标语言词汇映射为源语言音素的方式。 展开更多
关键词 语音识别 零资源语音识别 韩语语音识别
在线阅读 下载PDF
GaN基三维结构生长与器件应用
5
作者 王珣 汪莱 +6 位作者 郝智彪 罗毅 孙长征 韩彦军 熊兵 王健 李洪涛 《人工晶体学报》 EI CAS 北大核心 2020年第11期1984-1995,共12页
目前,c面氮化镓(GaN)基发光二极管的制备技术已经十分成熟并取得了商业化成功,但仍面临极化电场导致的大电流密度下效率下降(Droop效应)和黄绿光波段效率低的问题。为消除极化电场的影响,人们开始关注半极性和非极性面GaN。其中,基于传... 目前,c面氮化镓(GaN)基发光二极管的制备技术已经十分成熟并取得了商业化成功,但仍面临极化电场导致的大电流密度下效率下降(Droop效应)和黄绿光波段效率低的问题。为消除极化电场的影响,人们开始关注半极性和非极性面GaN。其中,基于传统极性面衬底通过三维结构生长来获得半极性和非极性GaN的方法,由于其低成本和生长的灵活性,受到了广泛研究。本文首先总结了三种GaN三维结构的制备方法并分析其生长机理。接着,在此基础上介绍了不同晶面InGaN量子阱的外延生长和发光特性。最后,列举了GaN基三维结构在半极性面LED、颜色可调LED和无荧光粉白光发光二极管方面的应用。 展开更多
关键词 氮化镓 发光二极管 三维结构 无荧光粉白光 效率下降
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部