期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
借助语音和面部图像的双模态情感识别
1
作者 薛珮芸 戴书涛 +1 位作者 白静 高翔 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第12期4542-4552,共11页
为提升情感识别模型的准确率,解决情感特征提取不充分的问题,对语音和面部图像的双模态情感识别进行研究。语音模态提出一种结合通道-空间注意力机制的多分支卷积神经网络(Multi-branch Convolutional Neural Networks, MCNN)的特征提... 为提升情感识别模型的准确率,解决情感特征提取不充分的问题,对语音和面部图像的双模态情感识别进行研究。语音模态提出一种结合通道-空间注意力机制的多分支卷积神经网络(Multi-branch Convolutional Neural Networks, MCNN)的特征提取模型,在时间、空间和局部特征维度对语音频谱图提取情感特征;面部图像模态提出一种残差混合卷积神经网络(Residual Hybrid Convolutional Neural Network, RHCNN)的特征提取模型,进一步建立并行注意力机制关注全局情感特征,提高识别准确率;将提取到的语音和面部图像特征分别通过分类层进行分类识别,并使用决策融合对识别结果进行最终的融合分类。实验结果表明,所提双模态融合模型在RAVDESS, eNTERFACE’05, RML三个数据集上的识别准确率分别达到了97.22%, 94.78%和96.96%,比语音单模态的识别准确率分别提升了11.02%, 4.24%, 8.83%,比面部图像单模态的识别准确率分别提升了4.60%, 6.74%,4.10%,且与近年来对应数据集上的相关方法相比均有所提升。说明了所提的双模态融合模型能有效聚焦情感信息,从而提升情感识别的准确率。 展开更多
关键词 情感识别 注意力机制 多分支卷积 残差混合 决策融合
在线阅读 下载PDF
多视角特征融合的孤立手语识别方法
2
作者 唐翱 薛珮芸 +3 位作者 强彦 白静 乔安然 许乾明 《小型微型计算机系统》 2025年第10期2392-2400,共9页
目前国内尚无公开的多视角手语数据集,手语识别研究主要围绕单一视角数据展开,由于手势遮挡问题,模型识别效果不佳.针对这些问题,创建了一个多视角孤立手语数据集(Multi-View Chinese Isolated Sign Language Dataset,MV-CISL);基于该... 目前国内尚无公开的多视角手语数据集,手语识别研究主要围绕单一视角数据展开,由于手势遮挡问题,模型识别效果不佳.针对这些问题,创建了一个多视角孤立手语数据集(Multi-View Chinese Isolated Sign Language Dataset,MV-CISL);基于该数据集,提出了一种多视角特征融合的孤立手语识别方法,该方法使用基于改进的3D-ResNet18的端到端多流网络提取不同视角的特征信息,并通过决策级融合来整合这些特征信息;为提高网络识别性能,使用CSL-500单视角数据集对所提出网络进行迁移学习,并将其应用于MVCISL数据集.实验结果表明,所提出方法在性能上优于单视角和双视角方法;在多流网络骨干模型ResNet+LSTM、ResNet+BiLSTM、3D-MobileNet和3D-ShuffleNet上进一步验证了该方法的有效性;与基于正面视角RGB和深度信息融合的方法相比,数据采集成本更低,性能更优良. 展开更多
关键词 多视角特征 孤立手语识别 迁移学习 决策级融合
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部