期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进ConvMixer和动态焦点损失的视听情感识别
1
作者 师硕 覃嘉俊 +1 位作者 于洋 郝小可 《电子学报》 EI CAS CSCD 北大核心 2024年第8期2824-2835,共12页
视听双模态情感识别是情感计算领域的研究热点.目前情感识别方法存在无法同时提取视频局部和全局特征,多模态数据融合简单,损失函数在模型优化中无法关注错分样本等问题,导致情感识别结果精确度不高.本文提出一种基于改进的ConvMixer和... 视听双模态情感识别是情感计算领域的研究热点.目前情感识别方法存在无法同时提取视频局部和全局特征,多模态数据融合简单,损失函数在模型优化中无法关注错分样本等问题,导致情感识别结果精确度不高.本文提出一种基于改进的ConvMixer和动态权重焦点损失函数的视听情感识别方法.采用空间和时间邻接矩阵代替ConvMixer中的深度分离卷积,提取视频时域空域上的全局和局部特征.提出跨模态时间注意力模块,以对称结构捕捉模态间的时间相关性,提高特征融合效果.结合混淆矩阵计算具有动态权重的焦点损失函数,差异化地加大错分样本在损失中的占比,优化模型参数.在公开数据集上的实验结果表明,本文方法能提取到代表性特征,可有效优化网络结构,提高了情感识别的准确率. 展开更多
关键词 情感识别 ConvMixer 注意力机制 多模态特征融合 焦点损失函数
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部