期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
融合关键区域信息的双流网络视频表情识别
1
作者 孔英会 崔文婷 +1 位作者 张珂 车辚辚 《智能系统学报》 北大核心 2025年第3期658-669,共12页
人脸表情识别是计算机视觉领域中的一个重要研究课题,而视频中的表情识别在很多场景下具有实用价值。视频序列包含丰富的帧内空间信息与帧间时间信息,同时面部关键区域的提取也对表情识别结果有重要影响,本文提出一种融合关键区域信息... 人脸表情识别是计算机视觉领域中的一个重要研究课题,而视频中的表情识别在很多场景下具有实用价值。视频序列包含丰富的帧内空间信息与帧间时间信息,同时面部关键区域的提取也对表情识别结果有重要影响,本文提出一种融合关键区域信息的双流网络表情识别方法。构建空间-时间双流网络,其中空间网络分支结合面部运动单元和CSFA(channel-spatial frame attention),重点关注影响表情识别结果的面部关键区域,以实现空间特征的有效提取;时间分支通过Farneback提取光流获得帧间的表情运动信息,并借助空间关键区域掩模选取降低光流计算复杂度。对空间-时间双流网络识别结果进行决策融合,得到最终视频表情识别结果。该方法在eNTERFACE'05、CK+数据集上进行实验测试,结果表明本文所提方法可有效提升识别精度,且提高了运行效率。 展开更多
关键词 视频表情识别 双流网络 注意力机制 光流 卷积神经网络 掩模 特征融合 面部表情识别
在线阅读 下载PDF
端到端增强特征神经网络的视频表情识别 被引量:6
2
作者 陈乐 童莹 +1 位作者 陈瑞 曹雪虹 《重庆理工大学学报(自然科学)》 CAS 北大核心 2019年第9期125-131,共7页
以卷积神经网络结合循环神经网络搭建端到端的深度学习网络,提出一种增强特征的视频表情识别方法。其中,卷积神经网络采用传统的VGG-16-FACE模型作为初始模型,完成特征提取;循环神经网络采用具有记忆能力的长期短时记忆模型网络(LSTM)... 以卷积神经网络结合循环神经网络搭建端到端的深度学习网络,提出一种增强特征的视频表情识别方法。其中,卷积神经网络采用传统的VGG-16-FACE模型作为初始模型,完成特征提取;循环神经网络采用具有记忆能力的长期短时记忆模型网络(LSTM)结合连续视频的帧间信息给出最优预测。首先,对VGG-16和LSTM模型分别进行独立训练。因预测结果很大程度取决于LSTM模型,针对LSTM的层数和输出神经元个数进行优化调试后,得到两层LSTM,发现输出维度为2 048时识别效果最好。考虑到增加负责特征提取的VGG模型对预测结果的影响比重,模型由独立训练2个模型连接为端到端的1个模型。实验中考虑到1层LSTM输出会造成特征丢失,在端到端模型的基础上加入跳层连接,增强特征输入,最终实验结果表明:在AFEW数据集上对视频表情识别的准确率从32. 88%提升到37. 34%,F1分数从0. 289 5提升到0. 339 9,证实了端到端增强特征混合神经网络的有效性。 展开更多
关键词 视频表情识别 卷积神经网络 循环神经网络 深度学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部