期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进LSTM的儿童语音情感识别模型 被引量:11
1
作者 余莉萍 梁镇麟 梁瑞宇 《计算机工程》 CAS CSCD 北大核心 2020年第6期40-49,共10页
为实现不同儿童情感需求状态下帧级语音特征的有效获取,建立一种基于改进长短时记忆(LSTM)网络的儿童语音情感识别模型。采用帧级语音特征代替传统统计特征以保留原始语音中的时序关系,通过引入注意力机制将传统遗忘门和输入门转换为注... 为实现不同儿童情感需求状态下帧级语音特征的有效获取,建立一种基于改进长短时记忆(LSTM)网络的儿童语音情感识别模型。采用帧级语音特征代替传统统计特征以保留原始语音中的时序关系,通过引入注意力机制将传统遗忘门和输入门转换为注意力门,并根据自定义的深度策略计算得到深度注意力门,从而提高语音情感识别性能。实验结果表明,在Fau Aibo儿童情感数据语料库及婴儿哭声情感需求数据库上,该模型在召回率和F1分数上相比基于传统LSTM的识别模型分别提高了3.14%、5.50%和1.84%、5.49%,在CASIA中文情感数据库上,其相比基于传统LSTM和GRU的识别模型训练时间更短、儿童语音情感识别率更高。 展开更多
关键词 儿童情感 时序关系 帧级语音特征 深度注意力门 长短时记忆网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部