期刊文献+
共找到346篇文章
< 1 2 18 >
每页显示 20 50 100
Real-Time Facial Expression Recognition on Res-MobileNetV3
1
作者 Li Beibei Zhu Jiansheng +3 位作者 Li Suwen Dai Linlin Yan Zhiyuan Ma Liangde 《China Communications》 2025年第3期54-64,共11页
Artificial intelligence,such as deep learning technology,has advanced the study of facial expression recognition since facial expression carries rich emotional information and is significant for many naturalistic situ... Artificial intelligence,such as deep learning technology,has advanced the study of facial expression recognition since facial expression carries rich emotional information and is significant for many naturalistic situations.To pursue a high facial expression recognition accuracy,the network model of deep learning is generally designed to be very deep while the model’s real-time performance is typically constrained and limited.With MobileNetV3,a lightweight model with a good accuracy,a further study is conducted by adding a basic ResNet module to each of its existing modules and an SSH(Single Stage Headless Face Detector)context module to expand the model’s perceptual field.In this article,the enhanced model named Res-MobileNetV3,could alleviate the subpar of real-time performance and compress the size of large network models,which can process information at a rate of up to 33 frames per second.Although the improved model has been verified to be slightly inferior to the current state-of-the-art method in aspect of accuracy rate on the publically available face expression datasets,it can bring a good balance on accuracy,real-time performance,model size and model complexity in practical applications. 展开更多
关键词 artificial intelligence facial expression recognition MobileNetV3 ResNet SSH
在线阅读 下载PDF
Different levels of facial expression recognition in patients with firstepisode schizophrenia:A functional MRI study
2
作者 Chengqing Yang Ansi Qi +10 位作者 Huangfang Yu Xiaofeng Guan Jijun Wang Na Liu Tianhong Zhang Hui Li Hui Zhou Junjuan Zhu Nan Huang Yingying Tang Zheng Lu 《General Psychiatry》 CSCD 2018年第5期76-81,共6页
Background The impairment of facial expression recognition has become a biomarker for early identification of first-episode schizophrenia, and this kind of research is increasing.Aims To explore the differences in bra... Background The impairment of facial expression recognition has become a biomarker for early identification of first-episode schizophrenia, and this kind of research is increasing.Aims To explore the differences in brain area activation using different degrees of disgusted facial expression recognition in antipsychotic-na?ve patients with firstepisode schizophrenia and healthy controls.Methods In this study, facial expression recognition tests were performed on 30 first-episode, antipsychoticna?ve patients with schizophrenia(treatment group) and 30 healthy subjects(control group) with matched age, educational attainment and gender. Functional MRI was used for comparing the differences of the brain areas of activation between the two groups.Results The average response time difference between the patient group and the control group in the ‘high degree of disgust' facial expression recognition task was statistically significant(1.359(0.408)/2.193(0.625), F=26.65, p<0.001), and the correct recognition rate of the treatment group was lower than that of the control group(41.05(22.25)/59.84(13.91, F=19.81, p<0.001). Compared with the control group, the left thalamus, right lingual gyrus and right middle temporal gyrus were negatively activated in the patients with first-episode schizophrenia in the ‘high degree of disgust' emotion recognition, and there was a significant activation in the left and right middle temporal gyrus and the right caudate nucleus. However, there was no significant activation difference in the ‘low degree of disgust' recognition.Conclusions In patients with first-episode schizophrenia, the areas of facial recognition impairment are significantly different in different degrees of disgust facial expression recognition. 展开更多
关键词 FUNCTIONAL MRI expression recognition
在线阅读 下载PDF
Facial expression recognition with contextualized histograms
3
作者 岳雷 沈庭芝 +2 位作者 杜部致 张超 赵三元 《Journal of Beijing Institute of Technology》 EI CAS 2015年第3期392-397,共6页
A new algorithm taking the spatial context of local features into account by utilizing contextualized histograms was proposed to recognize facial expression. The contextualized histograms were extracted fromtwo widely... A new algorithm taking the spatial context of local features into account by utilizing contextualized histograms was proposed to recognize facial expression. The contextualized histograms were extracted fromtwo widely used descriptors—the local binary pattern( LBP) and weber local descriptor( WLD). The LBP and WLD feature histograms were extracted separately fromeach facial image,and contextualized histogram was generated as feature vectors to feed the classifier. In addition,the human face was divided into sub-blocks and each sub-block was assigned different weights by their different contributions to the intensity of facial expressions to improve the recognition rate. With the support vector machine(SVM) as classifier,the experimental results on the 2D texture images fromthe 3D-BU FE dataset indicated that contextualized histograms improved facial expression recognition performance when local features were employed. 展开更多
关键词 facial expression recognition local binary pattern weber local descriptor spatial context contextualized histogram
在线阅读 下载PDF
基于特征增强和多头注意力融合的表情识别
4
作者 于霞 武家逸 +3 位作者 杨畅 杨海波 付琪 孙佳毓 《沈阳大学学报(自然科学版)》 2025年第1期44-52,F0003,共10页
为了解决近年来基于深度学习的人脸表情识别研究主要依赖实验室受控环境,难以反映现实场景中的自发性和无约束性的问题,同时针对人脸表情变化受多个关键区域影响以及表情数据存在显著类间相似性与类内差异性的挑战,提出了一种基于特征... 为了解决近年来基于深度学习的人脸表情识别研究主要依赖实验室受控环境,难以反映现实场景中的自发性和无约束性的问题,同时针对人脸表情变化受多个关键区域影响以及表情数据存在显著类间相似性与类内差异性的挑战,提出了一种基于特征增强和多头注意力融合的人脸表情识别模型。设计改进中心损失函数来增强面部特征的可区分性,增大类间差异,减小类内差异;通过多头注意力学习表情变化的区域相关性;进行注意力融合,提出融合损失函数避免注意力区域重叠,输出表情类别。在基于真实场景的RAF-DB和AffectNet数据集上取得了89.37%和65.31%的准确率,与现有模型相比,有效提高了表情识别精度。 展开更多
关键词 表情识别 真实场景 特征增强 多头注意力 注意力融合
在线阅读 下载PDF
基于特征解码的表情识别方法研究
5
作者 吴东升 林玉婷 徐鹏飞 《沈阳理工大学学报》 CAS 2025年第1期19-24,共6页
针对目前大多数面部表情提取未充分考虑语义特征以及个人独特面部特征导致面部表情识别准确性低的问题,提出一种基于特征解码的高效表情识别方法,称为FER-FD方法。该方法由两个模块组成,即特征解耦模块(FFD)和语义强化模块(VTS)。首先,... 针对目前大多数面部表情提取未充分考虑语义特征以及个人独特面部特征导致面部表情识别准确性低的问题,提出一种基于特征解码的高效表情识别方法,称为FER-FD方法。该方法由两个模块组成,即特征解耦模块(FFD)和语义强化模块(VTS)。首先,FFD模块使用两个深度二维卷积神经网络从输入图像中提取面部和表情特征,面部特征解耦器将面部特征与表情特征解耦,以最大限度地减少个人独特面部特征的影响;其次,VTS模块采用两个关键思想以无监督的方式自动捕获面部运动,从而建立全局面部区域的深层语义信息;最后,将两个模块的特征串联起来,以更准确地预测样本的面部表情。实验结果表明,本文提出的特征解码方法在CK+数据集上获得了98.78%的准确率,对不同场景具有可扩展性和适应性,具有较好的泛化能力。 展开更多
关键词 表情识别 特征解码 注意力机制 深度学习
在线阅读 下载PDF
轻量型Swin Transformer与多尺度特征融合相结合的人脸表情识别方法
6
作者 李艳秋 李胜赵 +1 位作者 孙光灵 颜普 《光电工程》 北大核心 2025年第1期24-37,共14页
针对Swin Transformer模型应用在表情识别上参数量过大、实时性较差和对表情中存在的复杂且微小的表情变化特征捕捉能力有限的问题,提出了一个轻量型Swin Transformer和多尺度特征融合(EMA)模块相结合的人脸表情识别方法。该方法首先利... 针对Swin Transformer模型应用在表情识别上参数量过大、实时性较差和对表情中存在的复杂且微小的表情变化特征捕捉能力有限的问题,提出了一个轻量型Swin Transformer和多尺度特征融合(EMA)模块相结合的人脸表情识别方法。该方法首先利用提出的SPST模块替换掉原Swin Transformer模型第四个stage中的Swin Transformer block模块,来降低模型的参数量,实现模型的轻量化。然后在轻量型模型的第二个stage后嵌入了多尺度特征融合(EMA)模块,通过多尺度特征提取和跨空间信息聚合,有效地增强了模型对人脸表情细节的捕捉能力,从而提高人脸表情识别的准确性和鲁棒性。实验结果表明,所提方法在JAFFE、FERPLUS、RAF-DB和FANE这4个公共数据集上分别达到了97.56%、86.46%、87.29%和70.11%的识别准确率,且相比于原Swin Transformer模型,改进后的模型参数量下降了15.8%,FPS提升了9.6%,在保持模型较低参数量的同时,显著增强了模型的实时性。 展开更多
关键词 表情识别 Swin Transformer SPST模块 EMA模块
在线阅读 下载PDF
基于注意力机制与特征融合的表情识别方法
7
作者 江涛 李楚贞 《现代信息科技》 2025年第4期43-46,52,共5页
为了提高非约束环境下的人脸表情识别效果,研究并设计了一种嵌入注意力机制的两阶段特征融合表情识别深度卷积神经网络框架。该网络框架设计和引入了多个注意力模块,旨在精准提取图像局部位置的表情特征信息。同时,通过构建密集连接残差... 为了提高非约束环境下的人脸表情识别效果,研究并设计了一种嵌入注意力机制的两阶段特征融合表情识别深度卷积神经网络框架。该网络框架设计和引入了多个注意力模块,旨在精准提取图像局部位置的表情特征信息。同时,通过构建密集连接残差块,有效提升了特征提取的质量并增强了网络的稳定性。在此基础上,将局部特征与多尺度模块提取的全局特征进行融合,从而获得更具判别力的表情特征。实验结果显示,所提方法在RAF-DB数据集上表现出较好的表情识别性能。 展开更多
关键词 表情识别 注意力机制 局部特征 特征融合
在线阅读 下载PDF
基于门控剪枝的轻量级表情识别方法
8
作者 孙培源 袁甲 孙玉宝 《中国电子科学研究院学报》 2025年第1期75-82,共8页
针对当前主流表情识别方法虽然具备较高精度但难以部署到边缘设备上的问题,文中提出了一种基于门控剪枝的轻量级表情识别模型的构建方法。首先,选用几种主流的轻量级模型进行人脸识别预训练并从中筛选出精度最高的模型进行迁移学习,以... 针对当前主流表情识别方法虽然具备较高精度但难以部署到边缘设备上的问题,文中提出了一种基于门控剪枝的轻量级表情识别模型的构建方法。首先,选用几种主流的轻量级模型进行人脸识别预训练并从中筛选出精度最高的模型进行迁移学习,以简化后续训练流程和提高模型精度;其次,通过基于门控的全局滤波器剪枝算法对迁移学习后的模型进行剪枝压缩,降低模型的计算复杂度和内存占用,为此,文中提出了一种Punish-Reward-Judge三阶段的迭代剪枝框架用以在剪枝过程中逐步恢复模型精度;最后,对模型进行微调以进一步地提高模型精度。模型的评估是基于当前主流的表情识别数据集AffectNet和RAF-DB上进行的。实验结果表明,在MobileNetV2模型内存压缩了23%的情况下,模型在AffectNet数据集上实现了63.92%的分类精度,超越了很多大体量模型。 展开更多
关键词 面部表情识别 模型轻量化 AffectNet 迁移学习 门控剪枝
在线阅读 下载PDF
基于改进卷积神经网络的心理状态预警技术 被引量:1
9
作者 王克 《电子设计工程》 2024年第10期49-53,共5页
针对传统问卷法难以真实反映被调查者心理状态的问题,基于光流法和卷积神经网络提出了一种微表情判断方法,并将其作为心理状态预警技术的核心模块。对于数据集中人脸数据离散的问题,该方法采用人眼权重法对图像进行预处理,且通过金字塔... 针对传统问卷法难以真实反映被调查者心理状态的问题,基于光流法和卷积神经网络提出了一种微表情判断方法,并将其作为心理状态预警技术的核心模块。对于数据集中人脸数据离散的问题,该方法采用人眼权重法对图像进行预处理,且通过金字塔光流算法提取预处理图像序列的光流特征,再利用三维卷积神经网络对该特征加以训练。与传统算法相比,所提方法在减少模型训练参数与运算时间的同时还具有更优的学习能力。实验测试结果表明,该算法在CASME数据集上的微表情识别准确率为89.2%,F1值为0.6751,均优于其他对比方法。由此证明,该算法可实现对人脸微表情的准确识别,进而为学生心理状态预警提供客观的数据支撑。 展开更多
关键词 金字塔光流法 三维卷积神经网络 微表情识别 人脸识别 心理预警
在线阅读 下载PDF
融合rPPG和人脸三维法向量的非接触情绪感知技术
10
作者 王宇 刘宇昂 +9 位作者 赵梦洁 涂晓光 牛知艺 杨明 刘建华 殷举航 朱新宇 石臣鹏 章超 张铖方 《电讯技术》 北大核心 2024年第10期1667-1676,共10页
近年来,基于深度学习的情绪识别技术取得了显著进展。然而,现有方法主要集中在面部图像或视频上,忽略了其他模态信息,导致鲁棒性和稳定性不足。为了解决这一问题,提出了一种融合多模态信息的面部表情识别方法。首先将输入的人脸视频进... 近年来,基于深度学习的情绪识别技术取得了显著进展。然而,现有方法主要集中在面部图像或视频上,忽略了其他模态信息,导致鲁棒性和稳定性不足。为了解决这一问题,提出了一种融合多模态信息的面部表情识别方法。首先将输入的人脸视频进行远程光电容积脉搏波(Remote Photo plethysmography,rPPG)信号和人脸三维法向量的提取,其次将这两种模态的信息输入其相应的情绪特征提取子网络,提取出对应的情绪特征向量。然后,将这两种模态提取出的情绪特征向量进行融合,生成一个丰富的特征向量,最后将其输入分类器进行情绪分类任务。通过这种多模态信息融合的方式,提高了面部表情识别的准确性和稳定性。对所提方法在不同数据集上进行了验证,实验结果表明,该方法在多样化面部表情识别中的表现优于当前先进的情感识别方法,具有更高的鲁棒性和稳定性。 展开更多
关键词 非接触情绪感知 多模态表情识别 远程光电容积脉搏波描记法(rppG) 人脸三维法向量
在线阅读 下载PDF
基于表情识别技术的教学效果反馈研究 被引量:2
11
作者 许晓萍 《现代信息科技》 2024年第6期194-198,共5页
随着人工智能技术的飞速发展,人脸表情识别技术的应用越来越广泛。学校是学生的聚集地,人脸表情数据的来源充足,为表情识别技术的研究提供了数据支撑。文章以课堂实录视频为研究对象,采用K210检测人脸进行表情特征提取及分类,借此对课... 随着人工智能技术的飞速发展,人脸表情识别技术的应用越来越广泛。学校是学生的聚集地,人脸表情数据的来源充足,为表情识别技术的研究提供了数据支撑。文章以课堂实录视频为研究对象,采用K210检测人脸进行表情特征提取及分类,借此对课堂质量进行等级评分,并以皮尔逊积矩相关系数验证课堂质量等级评分与教师评价的相关性,最终进行教学效果反馈的研究。 展开更多
关键词 人工智能 表情识别 教学效果
在线阅读 下载PDF
基于注意力融合特征增强的座舱表情识别模型
12
作者 罗玉涛 郭丰瑞 《汽车工程》 EI CSCD 北大核心 2024年第9期1697-1706,1686,共11页
针对智能座舱驾驶员表情识别深度学习模型准确率和实时性难以兼顾的问题,提出一种基于注意力融合与特征增强网络的表情识别模型EmotionNet。模型以GhostNet为基础,在特征提取模块内利用两个检测分支融合坐标注意力和通道注意力机制,实... 针对智能座舱驾驶员表情识别深度学习模型准确率和实时性难以兼顾的问题,提出一种基于注意力融合与特征增强网络的表情识别模型EmotionNet。模型以GhostNet为基础,在特征提取模块内利用两个检测分支融合坐标注意力和通道注意力机制,实现注意力机制互补与对重要特征的全方位关注;建立特征增强颈部网络以融合不同尺度特征信息;最终通过头部网络实现不同尺度特征信息决策级融合。在训练中则引入迁移学习思想和中心损失函数以进一步提高模型的识别准确性。在RAF-DB和KMU-FED数据集实验中,模型分别取得85.23%和99.95%识别准确率,并达到59.89 FPS的识别速度。EmotionNet平衡了识别准确率和实时性,达到了较为先进的水平并具备一定的智能座舱表情识别任务的适用性。 展开更多
关键词 智能座舱 表情识别 注意力机制 特征增强网络
在线阅读 下载PDF
基于CNN的在线多媒体英语教学情感交互研究
13
作者 梁珊 《兵工自动化》 北大核心 2024年第9期36-39,共4页
针对多媒体英语教学中情感缺失的问题,提出一种基于人脸表情识别的智能网络教学系统模型。应用主成分分析(principal component analysis,PCA)提取在线学习者视频中面部表情的重要特征帧;基于CNN架构的面部情绪识别网络判断和理解学习... 针对多媒体英语教学中情感缺失的问题,提出一种基于人脸表情识别的智能网络教学系统模型。应用主成分分析(principal component analysis,PCA)提取在线学习者视频中面部表情的重要特征帧;基于CNN架构的面部情绪识别网络判断和理解学习者的情绪状态,根据学习者的具体情绪状态给予相应的情绪鼓励或情绪补偿策略。仿真结果表明:与VGG16和ResNet50比较,该算法平均检测率为78.28%,平均识别准确率为81.78%,性能明显较优。 展开更多
关键词 多媒体英语教学 情感 人脸表情识别 卷积神经网络
在线阅读 下载PDF
基于半监督对比学习的人脸表情识别
14
作者 刘帅师 倪世豪 《长春工业大学学报》 CAS 2024年第1期9-14,F0003,共7页
为解决面部表情识别(FER)大规模表情收集困难和现有表情无法满足实际细粒度需求的问题,在ResNet系列网络,以Resnet-18残差网络作为基础,首先引入图像预处理算法处理人脸表情图片,然后利用半监督学习方法将未标记数据与标记数据相结合,... 为解决面部表情识别(FER)大规模表情收集困难和现有表情无法满足实际细粒度需求的问题,在ResNet系列网络,以Resnet-18残差网络作为基础,首先引入图像预处理算法处理人脸表情图片,然后利用半监督学习方法将未标记数据与标记数据相结合,用以描述输入空间的数据分布。最后利用对比学习方法扩大类间距,减少类内差异。该方法在RAF-DB真实场景人脸表情识别数据集上进行了测试,其中2000个有标签的训练集测试准确率为81.37%,4000个有标签的训练集测试准确率为83.63%。 展开更多
关键词 半监督 对比学习 神经网络 表情识别
在线阅读 下载PDF
基于关系感知和标签消歧的细粒度面部表情识别算法 被引量:1
15
作者 刘雅芝 许喆铭 +2 位作者 郎丛妍 王涛 李浥东 《电子学报》 EI CAS CSCD 北大核心 2024年第10期3336-3346,共11页
细粒度表情识别任务因其包含更丰富真实的人类情感而备受关注.现有面部表情识别算法通过提取局部关键区域等方式学习更优的图像表征.然而,这些方法忽略了图像数据集内在的结构关系,且没有充分利用标签间的语义关联度以及图像和标签间的... 细粒度表情识别任务因其包含更丰富真实的人类情感而备受关注.现有面部表情识别算法通过提取局部关键区域等方式学习更优的图像表征.然而,这些方法忽略了图像数据集内在的结构关系,且没有充分利用标签间的语义关联度以及图像和标签间的相关性,导致所学特征带来的性能提升有限.其次,现有细粒度表情识别方法并未有效利用和挖掘粗细粒度的层级关系,因而限制了模型的识别性能.此外,现有细粒度表情识别算法忽略了由于标注主观性和情感复杂性导致的标签歧义性问题,极大影响了模型的识别性能.针对上述问题,本文提出一种基于关系感知和标签消歧的细粒度面部表情识别算法(fine-grained facial expression recognition algorithm based on Relationship-Awareness and Label Disambiguation,RALD).该算法通过构建层级感知的图像特征增强网络,充分挖掘图像之间、层级标签之间以及图像和标签之间的依赖关系,以获得更具辨别性的图像特征.针对标签歧义性问题,算法设计了基于近邻样本的标签分布学习模块,通过整合邻域信息进行标签消歧,进一步提升模型识别性能.在细粒度表情识别数据集FG-Emotions上算法的准确度达到97.34%,在粗粒度表情识别数据集RAF-DB上比现有主流表情分类方法提高了0.80%~4.55%. 展开更多
关键词 细粒度面部表情识别 注意力机制 关系感知 特征优化 标签分布学习
在线阅读 下载PDF
NCA-MobileNet:一种轻量化人脸表情识别方法 被引量:1
16
作者 左义海 白武尚 何秋生 《液晶与显示》 CAS CSCD 北大核心 2024年第4期522-531,共10页
针对目前人脸面部表情识别方法存在参数量多、计算资源消耗大和识别精度低的问题,提出了一种基于条件协调注意力机制的轻量化人脸面部表情识别方法。首先,对MobileNet V3网络层数进行缩减,同时将倒残差结构中间通道数和输出通道数增大... 针对目前人脸面部表情识别方法存在参数量多、计算资源消耗大和识别精度低的问题,提出了一种基于条件协调注意力机制的轻量化人脸面部表情识别方法。首先,对MobileNet V3网络层数进行缩减,同时将倒残差结构中间通道数和输出通道数增大至原来的1.5~3.2倍,使用Mish代替Hardswish激活函数,实现特征提取后的非线性化。其次,引入改进的协调注意力机制,在张量信息嵌入中沿水平和竖直方向依次通过最大池化和平均池化进行编码,并通过张量信息集成产生具有全局感受野和精确位置信息特征,提取面部表情在空间和通道位置上的详细信息。最后,在公开数据集FERPlus和RAF-DB上进行实验,结果表明所提方法参数量降低15.91%,准确率分别为88.84%和85.90%,比改进前模型准确率分别提升0.83%和1.39%。该方法具有良好的识别性能,验证了所提方法的有效性。 展开更多
关键词 表情识别 轻量化 注意力机制 特征提取
在线阅读 下载PDF
群体信息对面部表情识别的影响 被引量:1
17
作者 王伟晗 曹斐臻 +3 位作者 余林伟 曾珂 杨鑫超 徐强 《心理学报》 CSSCI CSCD 北大核心 2024年第3期268-280,共13页
本研究通过3个实验探讨群体信息对面部表情识别的影响。结果发现:(1)周围面孔的情绪状态影响个体对目标面孔情绪的识别,两者情绪一致时的反应时显著短于不一致时的反应时,且面部表情识别准确性更高。(2)群体信息会调节周围面孔情绪对目... 本研究通过3个实验探讨群体信息对面部表情识别的影响。结果发现:(1)周围面孔的情绪状态影响个体对目标面孔情绪的识别,两者情绪一致时的反应时显著短于不一致时的反应时,且面部表情识别准确性更高。(2)群体信息会调节周围面孔情绪对目标面孔的影响,进而影响面部表情识别。具体而言,群体条件下,个体对目标面部表情的识别受到周围面孔情绪状态的影响,相比周围面孔情绪与目标面孔情绪不一致,两者情绪一致时,即符合个体基于知觉线索建立的群体成员情绪具有一致性的预期,面部表情识别的准确性更高、速度更快;而非群体条件下,个体则不受周围面孔情绪状态的影响。研究结果表明,个体能够基于互动人物之间的社会关系识别面孔情绪,群体存在时,会建立群体成员情绪具有一致性的预期,进而影响面部表情识别。 展开更多
关键词 面部表情 群体信息 情绪识别 情绪一致性 预期
在线阅读 下载PDF
基于多任务学习的课堂表情分类模型
18
作者 贺加贝 周菊香 +2 位作者 甘健侯 吴迪 温晓宇 《应用科学学报》 CAS CSCD 北大核心 2024年第6期947-961,共15页
基于课堂视频图像理解的学生表情识别与学习情感分析技术已然成为当前智慧教育领域的研究热点,但在图像视频采集质量低、环境复杂、多目标遮挡严重的真实应用场景中往往面临很大的挑战。针对目前大多课堂表情分类模型仅关注离散表情单... 基于课堂视频图像理解的学生表情识别与学习情感分析技术已然成为当前智慧教育领域的研究热点,但在图像视频采集质量低、环境复杂、多目标遮挡严重的真实应用场景中往往面临很大的挑战。针对目前大多课堂表情分类模型仅关注离散表情单一维度存在的不足,提出了一种多任务识别的学生表情分类模型。首先,基于课堂表情分类模型构建了真实场景下的多任务课堂表情数据集,并通过数据平衡技术解决数据集类别标签分布不平衡问题。其次,提出了一种基于多任务学习的课堂表情分类模型,通过引入知识蒸馏并设计双通道融合机制,有效融合离散表情、人脸动作单元和效价-唤醒三个表情识别任务,利用多任务之间的关系进一步增强离散表情分类任务的性能。最后,该方法在多个数据集上与现有先进方法进行了实验对比分析,结果表明所提模型能够有效提升表情分类精度,且在课堂表情多任务识别中具有优越表现,为实现课堂情感多维度评估分析提供技术支持。 展开更多
关键词 深度学习 表情识别 情感计算 课堂表情
在线阅读 下载PDF
基于特征融合和注意力机制的人脸表情识别 被引量:2
19
作者 张博程 李威 《长江信息通信》 2024年第4期17-20,35,共5页
文章针对现有单通道卷积神经网络对表情特征聚焦不够、特征提取不充分而损失部分有效信息的问题,提出了一种多通道融合并行网络特征的人脸表情识别算法,融合局部细节特征和全局整体特征,同时使用双网络对不同通道特征进行提取,实现粗细... 文章针对现有单通道卷积神经网络对表情特征聚焦不够、特征提取不充分而损失部分有效信息的问题,提出了一种多通道融合并行网络特征的人脸表情识别算法,融合局部细节特征和全局整体特征,同时使用双网络对不同通道特征进行提取,实现粗细粒度结合,增强模型对不同表情的识别能力。该算法采用双特征提取通道,使用并行的两个网络对面部特征进行提取。其中分为使用结合注意力机制的残差网络提取全局特征的M-CNN通道和使用多尺度特征提取网络提取眼部和嘴部特征的P-CNN通道。随后将三个通道提取的特征进行融合,再经通道注意力模块划分重要性后降维,最后送入联合损失函数层分类。该模型已经在CK+数据集和FER2013数据集上进行了大量实验,结果表明,该模型的识别精度相比其他先进方法有所提升,证明了所提模型的先进性和有效性。 展开更多
关键词 深度学习 人脸表情识别 特征融合 注意力机制
在线阅读 下载PDF
基于MD-CycleGAN的手写表达式图像识别算法研究
20
作者 吕闯 水卿梅 《激光杂志》 CAS 北大核心 2024年第8期169-174,共6页
针对使用生成对抗网络生成图像时词向量或者字符向量难以重建数学表达式中的二维结构的问题,将手写数学表达式的图像生成任务转换为印刷体数学表达式到手写体数学表达式的风格转换问题,并自建了一个带有手写风格分类的数据集来训练风格... 针对使用生成对抗网络生成图像时词向量或者字符向量难以重建数学表达式中的二维结构的问题,将手写数学表达式的图像生成任务转换为印刷体数学表达式到手写体数学表达式的风格转换问题,并自建了一个带有手写风格分类的数据集来训练风格转换模型。为了解决CycleGAN网络生成的图像内容不全、细节失真、质量不高的问题,设计了一种多尺度判别循环一致性生成对抗网络MD-CycleGAN,引入了CBAM注意力机制,弥补下采样环节信息丢失的问题,引入ACON激活函数代替ReLU激活函数,通过自适应学习控制网络每一层的非线性程度。实验结果表明基于生成对抗网络的数据增强方法能有效降低模型过拟合的程度。本研究为手写数学表达式图像的自动识别提供了一种新的方法,克服了数据标注问题和模型泛化问题,具有广泛的应用潜力,包括数学教育、科学文档处理和数学搜索引擎等领域。 展开更多
关键词 MD-CycleGAN 手写数学表达式 图像识别 神经网络
在线阅读 下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部