期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
融合生成对抗网络与时间卷积网络的普通话情感识别
1
作者 李海烽 张雪英 +2 位作者 段淑斐 贾海蓉 Huizhi Liang 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第9期1865-1875,共11页
为了探究声学与发音学转换对普通话情感识别的影响,提出融合声学与发音特征转换的情感识别系统.根据人体发音机制,录制普通话多模态音视频情感数据库.设计双向映射生成对抗网络(Bi-MGAN)来解决双模态间的特征转换问题,定义生成器损失函... 为了探究声学与发音学转换对普通话情感识别的影响,提出融合声学与发音特征转换的情感识别系统.根据人体发音机制,录制普通话多模态音视频情感数据库.设计双向映射生成对抗网络(Bi-MGAN)来解决双模态间的特征转换问题,定义生成器损失函数和映射损失函数来优化网络.搭建基于特征-维度注意力机制的残差时间卷积网络(ResTCN-FDA),利用注意力机制自适应地为不同种类特征和不同维度通道赋予不同的权重.实验结果表明,Bi-MGAN在正向和反向映射任务中的转换精度均优于主流的转换网络算法;ResTCN-FDA在给定情感数据集上的评价指标远高于传统的情感识别算法;真实特征融合映射特征使得情感被正确识别的准确率显著提升,证明了映射对普通话情感识别的积极作用. 展开更多
关键词 循环生成对抗网络 情感识别 声学与发音学转换 时间卷积网络 注意力机制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部