期刊文献+
共找到631篇文章
< 1 2 32 >
每页显示 20 50 100
融合关键区域信息的双流网络视频表情识别
1
作者 孔英会 崔文婷 +1 位作者 张珂 车辚辚 《智能系统学报》 北大核心 2025年第3期658-669,共12页
人脸表情识别是计算机视觉领域中的一个重要研究课题,而视频中的表情识别在很多场景下具有实用价值。视频序列包含丰富的帧内空间信息与帧间时间信息,同时面部关键区域的提取也对表情识别结果有重要影响,本文提出一种融合关键区域信息... 人脸表情识别是计算机视觉领域中的一个重要研究课题,而视频中的表情识别在很多场景下具有实用价值。视频序列包含丰富的帧内空间信息与帧间时间信息,同时面部关键区域的提取也对表情识别结果有重要影响,本文提出一种融合关键区域信息的双流网络表情识别方法。构建空间-时间双流网络,其中空间网络分支结合面部运动单元和CSFA(channel-spatial frame attention),重点关注影响表情识别结果的面部关键区域,以实现空间特征的有效提取;时间分支通过Farneback提取光流获得帧间的表情运动信息,并借助空间关键区域掩模选取降低光流计算复杂度。对空间-时间双流网络识别结果进行决策融合,得到最终视频表情识别结果。该方法在eNTERFACE'05、CK+数据集上进行实验测试,结果表明本文所提方法可有效提升识别精度,且提高了运行效率。 展开更多
关键词 视频表情识别 双流网络 注意力机制 光流 卷积神经网络 掩模 特征融合 面部表情识别
在线阅读 下载PDF
基于上下文通道注意力机制的人脸属性估计与表情识别 被引量:2
2
作者 徐杰 钟勇 +2 位作者 王阳 张昌福 杨观赐 《计算机应用》 北大核心 2025年第1期253-260,共8页
人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先... 人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先,构建基于ConvNext的局部特征编码骨干网络,并运用骨干网络编码局部特征的有效性来充分表征人脸局部特征之间的差异性;其次,提出上下文通道注意力(CC Attention)机制,通过动态自适应调整特征通道上的权重信息,表征深度特征的全局和局部特征,从而弥补骨干网络编码全局特征能力的不足;最后,设计不同分类策略,针对人脸属性估计(FAE)和面部表情识别(FER)任务,分别采用不同损失函数组合,以促使模型学习更多的面部细粒度特征。实验结果表明,所提FAER模型在人脸属性数据集CelebA(CelebFaces Attributes)上取得了91.87%的平均准确率,相较于次优模型SwinFace(Swin transformer for Face)高出0.55个百分点;在面部表情数据集RAF-DB和AffectNet上分别取得了91.75%和66.66%的准确率,相较于次优模型TransFER(Transformers for Facial Expression Recognition)分别高出0.84和0.43个百分点。 展开更多
关键词 人脸属性估计 面部表情识别 注意力机制 细粒度特征 特征差异
在线阅读 下载PDF
基于扩展局部二值模式的多尺度人脸表情识别方法
3
作者 胡黄水 戚星烁 +1 位作者 王出航 王玲 《吉林大学学报(理学版)》 北大核心 2025年第5期1427-1436,共10页
针对人脸表情识别在复杂环境下姿态和光照鲁棒性差的问题,提出一种融合扩展局部二值模式和多尺度网络结构的人脸表情识别方法.该方法通过扩展传统局部二值模式的感受野并增强像素间的空间联系,减少光照对人脸表情识别的噪声干扰;通过将... 针对人脸表情识别在复杂环境下姿态和光照鲁棒性差的问题,提出一种融合扩展局部二值模式和多尺度网络结构的人脸表情识别方法.该方法通过扩展传统局部二值模式的感受野并增强像素间的空间联系,减少光照对人脸表情识别的噪声干扰;通过将特征图在通道维度均匀分为若干子集并利用不同数量相同卷积块的方式提取特征图的多尺度特征,有效处理人脸姿态变化.在数据集Fer2013和RAF-DB上的实验结果表明,该方法可有效提高人脸表情识别的准确率和鲁棒性,为复杂环境下的人脸表情识别提供了有效解决方案. 展开更多
关键词 人脸表情识别 局部二值模式 多尺度网络 卷积神经网络
在线阅读 下载PDF
基于双流特征交叉融合Efficient Transformer的人脸表情识别
4
作者 党宏社 孟饶辰 高宛蓉 《计算机工程与应用》 北大核心 2025年第15期251-257,共7页
面部表情识别在人机交互等现实应用中得到了越来越多的重视。为解决传统方法中由于类间相似性和类内差异引起的识别准确率低等问题,提出了一种双流特征交叉融合Efficient Transformer识别人脸表情的方法。使用IResNet50和MobileFaceNet... 面部表情识别在人机交互等现实应用中得到了越来越多的重视。为解决传统方法中由于类间相似性和类内差异引起的识别准确率低等问题,提出了一种双流特征交叉融合Efficient Transformer识别人脸表情的方法。使用IResNet50和MobileFaceNet分别提取人脸表情的图像和关键点的多尺度特征,同时采用通道注意力机制来增强关键特征并减少参数量;引入了交叉融合高效多头自注意力机制(cross fusion efficient multi-head self-attention,CFEMSA),对相同尺度的双流特征进行交叉融合,以突出面部显著特征;最后采用特征金字塔结构对不同尺度的交叉融合结果进行多尺度融合,以提高识别的准确性。提出的方法在RAF-DB、AffecNet-7和AffecNet-8数据集上的识别准确率分别为91.82%、67.46%和63.65%,实验结果证明该方法有效缓解了类间相似性和类内差异所引起的识别准确率低的问题。 展开更多
关键词 面部表情识别 Efficient Transformer 交叉融合 多尺度特征 特征融合
在线阅读 下载PDF
深度度量注意力混合模型表情识别方法
5
作者 姚丽莎 《计算机工程与应用》 北大核心 2025年第7期245-254,共10页
深度学习网络在人脸表情识别中已广泛采用,但因表情图像复杂多变,受光照、个体差异等各个因素的影响,现有方法的识别效果有待提高。为了提高深度学习网络的表达能力,在深度学习网络中,结合面部关键区域的位置特征,提出融合位置信息的深... 深度学习网络在人脸表情识别中已广泛采用,但因表情图像复杂多变,受光照、个体差异等各个因素的影响,现有方法的识别效果有待提高。为了提高深度学习网络的表达能力,在深度学习网络中,结合面部关键区域的位置特征,提出融合位置信息的深层注意力反馈机制卷积神经网络模型。同时,由于表情特征的类间差异小,为了提高分类器的分类学习能力,引入度量学习方法增强特征的判别性,使同类之间的距离减小,异类之间的距离加大。通过度量学习将面部表情图像的特征映射到具有表情判别性的新的特征空间中,由此判断各表情样本的表情类别。对原图进行人脸检测,确定人脸裁剪出人脸关键区域,去除头发、背景等因素的干扰;通过深层注意力反馈机制的CNN模型对人脸关键区域进行特征学习,学习获得面部表情深度特征,之后引入判别性度量学习方法,通过度量矩阵将特征向量映射为新的学习后的特征向量;将提取的样本表情特征送入全连接层并通过Softmax分类器识别划分到预先定义好的7种基本表情。在CK+和RAF-DB数据库的实验表明,该方法取得了98.69%和87.68%的平均识别率,提高了分类器的分类学习能力。 展开更多
关键词 深度注意力 表情识别 卷积神经网络 度量学习
在线阅读 下载PDF
带标签噪声的人脸表情识别模型
6
作者 李慧 师文 《小型微型计算机系统》 北大核心 2025年第10期2401-2408,共8页
真实场景下人脸表情数据集中标签噪声大量存在且难以避免,因此降低标签噪声对人脸表情识别效果的影响,提高真实环境中人脸表情识别的准确率具有重要现实意义.为解决此问题,本文提出融合自注意力机制和人脸局部特征的对抗自编码器SLAAE.... 真实场景下人脸表情数据集中标签噪声大量存在且难以避免,因此降低标签噪声对人脸表情识别效果的影响,提高真实环境中人脸表情识别的准确率具有重要现实意义.为解决此问题,本文提出融合自注意力机制和人脸局部特征的对抗自编码器SLAAE.首先,在AAE模型中加入自注意力机制,实现图像内部信息的交互,帮助网络更好地提取特征;其次,提取面部图像中更能体现表情特征的人脸关键点,作为局部特征输入模型,从而提高表情识别的准确率;最后,在真实数据集中添加不同比例、不同类型的标签噪声进行对比实验.实验结果表明本文提出的SLAAE模型与其他模型相比,能有效提升带标签噪声的人脸表情识别效果. 展开更多
关键词 人脸表情识别 标签噪声 对抗自编码器 自注意力机制 局部特征
在线阅读 下载PDF
结合多区域特征和特征融合的微表情识别
7
作者 曹春萍 张迪 《小型微型计算机系统》 北大核心 2025年第8期1986-1992,共7页
微表情运动微弱、短暂和局部化的特点,使得难以从微表情视频序列中相关的局部区域中提取有效特征,进而导致准确识别微表情变得十分困难.针对上述问题,基于残差网络和长短期记忆网络,提出一种结合多区域特征提取模块(Multi-region Featur... 微表情运动微弱、短暂和局部化的特点,使得难以从微表情视频序列中相关的局部区域中提取有效特征,进而导致准确识别微表情变得十分困难.针对上述问题,基于残差网络和长短期记忆网络,提出一种结合多区域特征提取模块(Multi-region Feature Extraction Module,MFEM)和多层特征融合模块(Multi-level Feature Fusion Module,MFFM)的微表情识别方法.首先,对微表情视频序列采用欧拉视频放大算法实现运动增强得到灰度序列,并结合TV-L1光流法的光流序列作为输入.有效特征提取阶段中,利用MFEM模块提取多个相关的局部区域中的显著特征,增强网络提取有效特征的能力;通过MFFM模块减少信息丢失,产生更综合的特征,提高模型学习微表情特征的能力;然后进行时序建模并分类.在casme2和samm数据集上进行实验,准确率分别达到84.959%、74.265%,UF1分别为0.855和0.604,优于现有方法. 展开更多
关键词 表情识别 残差网络 多区域特征提取 多层特征融合
在线阅读 下载PDF
基于图神经网络的多域特征融合表情识别算法研究
8
作者 张俊杰 费程 何伏刚 《计算机工程与应用》 北大核心 2025年第20期182-193,共12页
针对现有深度模型需要大量训练数据且无法基于同一网络架构同时对宏表情和微表情进行识别的问题,提出一种基于空域与谱域特征级融合的图神经网络表情识别算法S2GNN(spatial and spectral graph neural networks)。以图像像素点作为节点... 针对现有深度模型需要大量训练数据且无法基于同一网络架构同时对宏表情和微表情进行识别的问题,提出一种基于空域与谱域特征级融合的图神经网络表情识别算法S2GNN(spatial and spectral graph neural networks)。以图像像素点作为节点,节点间的距离作为边,将面部建模为无向加权图,利用邻接矩阵存储图中的距离信息。得到邻接矩阵后,一方面基于图傅里叶变换将图像由空域转化为谱域,在谱域对图像进行卷积,得到图像的谱域特征。另一方面基于无向加权图在空域对图中节点及其相邻节点进行卷积,得到图像的空域特征。利用提出的基于空域特征引导的特征选择模块实现空域和谱域特征的融合。基于融合后的特征进行表情识别。实验结果表明,将空域特征和谱域特征相结合可以提高表情识别的准确率,即使在少量训练数据情况下也可取得较高的分类准确率。在8个公开数据集上进行测试,平均准确率可达89.11%。宏表情和微表情混合数据情况下,未加权F1值和未加权平均召回率分别为0.954和0.970。对实验结果进一步分析可以发现,眼部区域对提高遮挡情况下表情识别的准确率具有重要作用。 展开更多
关键词 图神经网络 表情识别 表情识别 空域特征引导
在线阅读 下载PDF
基于视觉Transformer的运动特征选择融合微表情识别算法 被引量:1
9
作者 杜含月 张鹏 +3 位作者 林强 李晓桐 徐森 贲晛烨 《信号处理》 北大核心 2025年第2期267-278,共12页
微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,... 微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,微表情特征与受试者身份以及面部外观信息存在强耦合性,不利于分离和提取微表情语义信息。为了解决上述问题,本文提出了一种基于视觉Transformer和运动特征选择的微表情识别算法。首先,利用TVL1光流算法计算水平和垂直光流运动图,用以表征面部运动。随后,利用视觉Transformer网络编码微表情发生时面部运动单元间的运动依赖关系,为了进一步提升特征表达能力,本文设计了特征选择融合模块(Feature Selection Fusion Module,FSFM)以实现微表情关键的局部信息的有效获取,并引入空间一致性注意力模块(Spatial Consistency Attention Module,SCAM)以确保不同运动特征在空间分布上的一致性。此外,本文提出的交叉注意力融合模块(Cross Attention Fusion Module,CAFM)能够增强微表情语义信息的表征能力。与现有方法相比,本文所提出的算法在三个权威的微表情数据库上微表情识别任务中表现出显著的准确率提升,进一步验证了该方法的有效性与优越性。 展开更多
关键词 表情识别 特征选择与融合 交叉注意力机制 视觉Transformer
在线阅读 下载PDF
抗噪声双约束网络的面部表情识别 被引量:1
10
作者 苏春海 夏海英 《广西师范大学学报(自然科学版)》 北大核心 2025年第2期70-82,共13页
由于标注主观性、图像模糊等因素,数据集不可避免存在噪声,使表情识别更具挑战性。现有面部表情识别方法在处理噪声标签时,模型会部分过度拟合噪声标签,对此,本文提出一种新颖的抗噪声双约束网络(NDC-Net)来自动抑制噪声样本。NDC-Net... 由于标注主观性、图像模糊等因素,数据集不可避免存在噪声,使表情识别更具挑战性。现有面部表情识别方法在处理噪声标签时,模型会部分过度拟合噪声标签,对此,本文提出一种新颖的抗噪声双约束网络(NDC-Net)来自动抑制噪声样本。NDC-Net主要包括2个约束机制:类激活映射注意一致性(CAC)和通道空间特征一致性(CSC)。CAC使模型集中于局部重要特征信息,减少对噪声标签的过度关注,而CSC鼓励和确保模型在提取特征时从通道和空间上更加关注到与任务相关的信息,忽略不相关信息,减少对噪声标签的依赖。此外,为增强NDC-Net性能,输入样本采用旋转、缩放等策略进行增强。在RAF-DB、FERPlus和AffectNet数据集30%标签噪声下,NDC-Net的识别性能分别为86.57%、88.22%和59.78%,显著优于EAC、NCCTFER等先进的噪声标签处理方法,并且在计算机视觉领域中被广泛应用于评估算法性能和泛化能力的CIFAR100和Tiny-ImageNet中也取得不错的效果。 展开更多
关键词 噪声标签 面部表情识别 深度学习 监督学习 注意力机制
在线阅读 下载PDF
基于轻量级注意力残差网络的面部表情识别方法
11
作者 郜高飞 邵党国 +1 位作者 马磊 易三莉 《吉林大学学报(理学版)》 北大核心 2025年第2期437-444,共8页
针对卷积神经网络参数量大、训练时间长的问题,提出一种基于轻量级注意力残差网络的面部表情识别方法.首先,以残差网络为骨架重新搭建模型,通过减少层数并改进残差模块提高模型性能;其次,引入深度可分离卷积减少模型的参数量和计算工作... 针对卷积神经网络参数量大、训练时间长的问题,提出一种基于轻量级注意力残差网络的面部表情识别方法.首先,以残差网络为骨架重新搭建模型,通过减少层数并改进残差模块提高模型性能;其次,引入深度可分离卷积减少模型的参数量和计算工作量;最后,采用Mish函数替代ReLU函数的挤压激励模块自适应地调整通道权重.该模型在两个公共数据集CK+和JAFFE上采用经典的十折交叉验证方式进行验证,分别获得了98.16%和96.67%的准确率.实验结果表明,该方法在模型识别精度和复杂度之间进行了较好权衡. 展开更多
关键词 面部表情识别 轻量级 残差网络 深度可分离卷积 注意力机制
在线阅读 下载PDF
可变光照下多姿态人脸表情识别方法
12
作者 王灵月 李颖 +1 位作者 郭磊 杨新生 《现代电子技术》 北大核心 2025年第14期154-158,共5页
为消除光照度变化对图像的影响,提供更为全面和清晰的面部信息,并提高表情识别鲁棒性,提出一种可变光照下多姿态人脸表情识别方法。利用自商图像法对原始人脸图像进行光照处理,消除光照度变化对图像的影响。利用生成对抗网络建立多姿态... 为消除光照度变化对图像的影响,提供更为全面和清晰的面部信息,并提高表情识别鲁棒性,提出一种可变光照下多姿态人脸表情识别方法。利用自商图像法对原始人脸图像进行光照处理,消除光照度变化对图像的影响。利用生成对抗网络建立多姿态人脸正面化模型,对光照处理后的人脸图像进行再处理,得到标准正面姿态的人脸图像,为表情识别提供更为全面和清晰的面部信息,提高表情识别鲁棒性。利用局部二值卷积神经网络处理标准正面姿态的人脸图像,完成可变光照下多姿态人脸表情识别。实验结果表明:所提方法可有效地对人脸图像进行光照与人脸正面化处理,不同姿态情况下,该方法均可完成人脸表情的精准识别;在不同光照条件下,人脸表情识别的精度均较高。 展开更多
关键词 人脸表情识别 光照处理 多姿态人脸识别 人脸正面化 自商图像法 局部二值卷积神经网络 生成对抗网络
在线阅读 下载PDF
基于注意力引导的遮挡感知面部表情识别
13
作者 黎豊玮 谭玉枚 +1 位作者 宋树祥 夏海英 《广西师范大学学报(自然科学版)》 北大核心 2025年第5期104-113,共10页
遮挡和姿态变化是自然场景中影响面部表情识别的主要干扰因素。现有大多数方法采用注意力来增强与表情相关的信息,减少遮挡和姿态变化对表情识别性能的影响。然而,这些方法在网络中不同位置使用相同的注意力机制,忽视浅层和深层特征张... 遮挡和姿态变化是自然场景中影响面部表情识别的主要干扰因素。现有大多数方法采用注意力来增强与表情相关的信息,减少遮挡和姿态变化对表情识别性能的影响。然而,这些方法在网络中不同位置使用相同的注意力机制,忽视浅层和深层特征张量在空间和通道维度上的差异,影响了特征表达的准确性。为此,本文提出一种粒度感知多维自适应注意力网络(GA-MDA)。首先,设计跨粒度空间感知注意力模块(CSA),用于增强浅层网络的特征表达能力;其次,引入多维度自适应注意力模块(MAA),自适应地优化不同维度的空间与通道特征表示,以进一步提升模型的特征表达能力。实验结果表明,GA-MDA在RAF-DB和FERPlus数据集上表情识别准确率分别达到92.01%和90.36%,与目前先进方法HANet和GE-LA相比,识别性能分别提升0.09和0.43个百分点,模型参数量分别减少2.963×10^(7)和6.341×10^(7)。 展开更多
关键词 表情识别 注意力机制 遮挡 鲁棒性
在线阅读 下载PDF
仿真假体视觉下基于风格迁移的人脸表情识别
14
作者 王盛 赵瑛 张岩 《现代电子技术》 北大核心 2025年第15期45-50,共6页
目前对于重度视网膜色素变性或老年性黄斑变性患者而言,视网膜假体仍是其唯一有效的视觉康复手段。为了实现假体视觉下表情的准确识别,文中提出采用AdaIN算法实现图像风格转换的图像处理策略,将原始人脸图像转换成简笔画人脸图像,并利用... 目前对于重度视网膜色素变性或老年性黄斑变性患者而言,视网膜假体仍是其唯一有效的视觉康复手段。为了实现假体视觉下表情的准确识别,文中提出采用AdaIN算法实现图像风格转换的图像处理策略,将原始人脸图像转换成简笔画人脸图像,并利用Dlib库实现人脸关键点的标记,借助关键点坐标截取人脸区域,最后进行像素化处理。同时,正常人视觉下对原始图像和该方法的表情识别效果,以及仿真假体视觉下该方法在三种分辨率(24×24、32×32与48×48)与原始图像直接像素化后表情识别的效果均开展了对比研究。实验结果证明,正常人视觉下对于原始图像和该方法的表情识别效果的准确率分别为71.58%和60.41%,在24×24与32×32低分辨率下,文中方法与原始图像直接像素化相比更有助于表情的识别。 展开更多
关键词 视觉假体 仿真假体视觉 风格迁移 表情识别 像素化 AdaIN算法
在线阅读 下载PDF
基于非线性深度子空间学习的微表情识别方法研究
15
作者 冉光伟 何祺 +2 位作者 王楠 冯为嘉 姜立标 《重庆大学学报》 北大核心 2025年第6期98-111,共14页
针对微表情识别中深度子空间网络鲁棒性差和泛化能力弱的问题,提出了基于非线性深度子空间学习和光流计算的微表情识别方法。该方法通过引入核变换充分挖掘微表情中的情感信息,同时使用光流特征捕捉微表情的运动信息,提高识别的鲁棒性。... 针对微表情识别中深度子空间网络鲁棒性差和泛化能力弱的问题,提出了基于非线性深度子空间学习和光流计算的微表情识别方法。该方法通过引入核变换充分挖掘微表情中的情感信息,同时使用光流特征捕捉微表情的运动信息,提高识别的鲁棒性。在SMIC、SAMM、CASME和CASMEⅡ4个广泛使用的自发微表情数据集和3DB-combined复合数据集上的实验表明,所提方法识别性能优于MACNN、Micro-Attention等深度学习方法,在复合数据集上的准确率达到0.834 6。此外,在SMIC数据集上添加10%、20%、30%和40%的随机噪声块后,在不同噪声水平下的未加权F1分数均优于其他算法,表明该方法在微表情识别任务中的有效性和鲁棒性。 展开更多
关键词 深度子空间 表情识别 光流特征 主成分分析
在线阅读 下载PDF
轻量型Swin Transformer与多尺度特征融合相结合的人脸表情识别方法 被引量:1
16
作者 李艳秋 李胜赵 +1 位作者 孙光灵 颜普 《光电工程》 北大核心 2025年第1期24-37,共14页
针对Swin Transformer模型应用在表情识别上参数量过大、实时性较差和对表情中存在的复杂且微小的表情变化特征捕捉能力有限的问题,提出了一个轻量型Swin Transformer和多尺度特征融合(EMA)模块相结合的人脸表情识别方法。该方法首先利... 针对Swin Transformer模型应用在表情识别上参数量过大、实时性较差和对表情中存在的复杂且微小的表情变化特征捕捉能力有限的问题,提出了一个轻量型Swin Transformer和多尺度特征融合(EMA)模块相结合的人脸表情识别方法。该方法首先利用提出的SPST模块替换掉原Swin Transformer模型第四个stage中的Swin Transformer block模块,来降低模型的参数量,实现模型的轻量化。然后在轻量型模型的第二个stage后嵌入了多尺度特征融合(EMA)模块,通过多尺度特征提取和跨空间信息聚合,有效地增强了模型对人脸表情细节的捕捉能力,从而提高人脸表情识别的准确性和鲁棒性。实验结果表明,所提方法在JAFFE、FERPLUS、RAF-DB和FANE这4个公共数据集上分别达到了97.56%、86.46%、87.29%和70.11%的识别准确率,且相比于原Swin Transformer模型,改进后的模型参数量下降了15.8%,FPS提升了9.6%,在保持模型较低参数量的同时,显著增强了模型的实时性。 展开更多
关键词 表情识别 Swin Transformer SPST模块 EMA模块
在线阅读 下载PDF
基于改进3D ResNet18的多模态微表情识别
17
作者 梁岩 黄润才 卢士铖 《计算机应用研究》 北大核心 2025年第3期903-910,共8页
针对微表情识别技术面临的时间特征提取挑战包括短暂性带来的捕捉难题、时空信息融合的难点、数据稀疏性导致的过拟合问题、静态特征提取方法的局限性、数据预处理对识别性能的影响,提出了一种基于改进3D ResNet的多模态微表情识别方法(... 针对微表情识别技术面临的时间特征提取挑战包括短暂性带来的捕捉难题、时空信息融合的难点、数据稀疏性导致的过拟合问题、静态特征提取方法的局限性、数据预处理对识别性能的影响,提出了一种基于改进3D ResNet的多模态微表情识别方法(IM3DR-MFER)。通过在传统3D ResNet中融入了参数精简策略和多尺度上下文感知融合策略改进3D ResNet18,在降低参数的同时提升对面部局部特征及其在广泛上下文中的信息捕捉能力。通过融合面部全局特征与光流动态特征,构建了一个双模态输入框架,从而显著提升了模型在不同维度上的特征表征能力。通过创新性地引入新型三维注意力机制(CASANet),自适应地识别并突出微表情序列中各个时间点的关键特征。经过在CASME II、SAMM以及复合数据集(CD)上的实验验证结果表明,所提方法分别取得了93.2%、88.7%和84.6%的准确率,从而验证了所提方法在人脸微表情识别任务中的有效性和先进性。 展开更多
关键词 表情识别 3D ResNet18 双模态 CASANet
在线阅读 下载PDF
融合LBP与并行注意力机制的微表情识别方法
18
作者 李帅超 李明泽 +1 位作者 孙嘉傲 卢树华 《北京航空航天大学学报》 北大核心 2025年第4期1404-1414,共11页
针对面部微表情变化强度弱、背景噪声干扰及特征区分度较小等问题,提出了一种融合LBP与并行注意力机制的微表情识别网络。该网络将RGB图像输入密集连接改进的Shuffle Stage分支提取面部全局特征,增强上下文语义信息关联;将LBP图像输入... 针对面部微表情变化强度弱、背景噪声干扰及特征区分度较小等问题,提出了一种融合LBP与并行注意力机制的微表情识别网络。该网络将RGB图像输入密集连接改进的Shuffle Stage分支提取面部全局特征,增强上下文语义信息关联;将LBP图像输入多尺度分层卷积神经网络构成的局部纹理特征分支,提取细节信息;双分支特征提取后,在网络后端引入并行注意力机制提高特征融合能力,抑制背景干扰,专注微表情特征兴趣区域;所提方法在CASME、CASME II和SMIC等3个公开数据集上进行了测试,识别准确率分别达到了85.18%、74.53%和81.19%;实验结果表明,所提方法有效提高了微表情识别准确率,优于当前诸多先进方法。 展开更多
关键词 表情识别 密集连接 Shuffle Stage分支 多尺度分层卷积 并行注意力机制
在线阅读 下载PDF
基于自监督掩码光流的人脸微表情识别
19
作者 刘晓宇 谢志华 周志武 《浙江大学学报(理学版)》 北大核心 2025年第1期87-97,共11页
在人脸微表情识别研究领域,现有特征提取方法主要依赖于有监督学习方式,限制了模型在微表情表征中的应用场景和泛化能力。为此,利用掩码自编码器(MAE)技术构建了面向微表情数据集特点的自监督特征编码器,并将其应用于下游微表情识别任务... 在人脸微表情识别研究领域,现有特征提取方法主要依赖于有监督学习方式,限制了模型在微表情表征中的应用场景和泛化能力。为此,利用掩码自编码器(MAE)技术构建了面向微表情数据集特点的自监督特征编码器,并将其应用于下游微表情识别任务,提出了一种基于自监督掩码光流(self-supervised masked optical flow,SMOF)的人脸微表情识别方法。首先,使用微表情数据集中每个顶点帧的左右各两帧与起始帧计算的光流图作为初步输入。然后,使用重采样技术平衡数据集中各类样本。最后,利用增广后的数据集预训练SMOF模型,通过随机掩盖输入图像的局部块,重构缺失块的像素。在下游任务中,使用ViT-Large模型加载已训练好的特征提取器,取得了较好的微表情分类结果。采用留一受试者交叉验证(LOSO)方法,评估了模型在3DB微表情数据集上的性能,未加权F1分数(UF1)和未加权平均召回率(UAR)分别达0.8614和0.8716,优于其他深度学习微表情识别方法。实验结果表明,基于SMOF的微表情识别方法可行且有效,具有较好的可迁移性和扩展性。 展开更多
关键词 自监督学习 掩码自编码器 光流 表情识别
在线阅读 下载PDF
融合注意力与多尺度特征的微表情识别方法
20
作者 张波 李孟新 《计算机工程与设计》 北大核心 2025年第11期3248-3257,共10页
针对卷积神经网络在微表情识别中存在对不同尺度信息表达能力不足和细节信息丢失的问题,提出一种融合注意力与多尺度特征的微表情识别方法,使用双分支网络进行特征提取,捕获注意力感知的微表情运动在时空上的局部与全局信息。结合特征... 针对卷积神经网络在微表情识别中存在对不同尺度信息表达能力不足和细节信息丢失的问题,提出一种融合注意力与多尺度特征的微表情识别方法,使用双分支网络进行特征提取,捕获注意力感知的微表情运动在时空上的局部与全局信息。结合特征金字塔和MobileViT提取空间特征,联合多级特征并捕捉细节信息;结合Inception模块与卷积块注意模块提取时间特征,融合多尺度特征并关注重要信息;将时空特征通道叠加融合并分类。实验结果表明在MEGC2019-CD数据集上实现了0.783的URA和0.798的UF1,与其它主流方法相比有更好的识别性能。 展开更多
关键词 表情识别 多尺度特征 注意力机制 MobileViT INCEPTION 特征金字塔 卷积块注意模块
在线阅读 下载PDF
上一页 1 2 32 下一页 到第
使用帮助 返回顶部