期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
Multimodal Emotion Recognition with Transfer Learning of Deep Neural Network 被引量:2
1
作者 HUANG Jian LI Ya +1 位作者 TAO Jianhua YI Jiangyan 《ZTE Communications》 2017年第B12期23-29,共7页
Due to the lack of large-scale emotion databases,it is hard to obtain comparable improvement in multimodal emotion recognition of the deep neural network by deep learning,which has made great progress in other areas.W... Due to the lack of large-scale emotion databases,it is hard to obtain comparable improvement in multimodal emotion recognition of the deep neural network by deep learning,which has made great progress in other areas.We use transfer learning to improve its performance with pretrained models on largescale data.Audio is encoded using deep speech recognition networks with 500 hours’speech and video is encoded using convolutional neural networks with over 110,000 images.The extracted audio and visual features are fed into Long Short-Term Memory to train models respectively.Logistic regression and ensemble method are performed in decision level fusion.The experiment results indicate that 1)audio features extracted from deep speech recognition networks achieve better performance than handcrafted audio features;2)the visual emotion recognition obtains better performance than audio emotion recognition;3)the ensemble method gets better performance than logistic regression and prior knowledge from micro-F1 value further improves the performance and robustness,achieving accuracy of 67.00%for“happy”,54.90%for“an?gry”,and 51.69%for“sad”. 展开更多
关键词 DEEP NEUTRAL network ENSEMBLE method MULTIMODAL emotion recognition TRANSFER learning
在线阅读 下载PDF
基于模糊综合评价法的情感语音数据库的建立 被引量:9
2
作者 宋静 张雪英 +1 位作者 孙颖 畅江 《现代电子技术》 北大核心 2016年第13期51-54,58,共5页
为建立一个真实、自然、丰富的情感语音数据库,研究选择高兴、惊奇、悲伤、生气四种情感类型,利用截取广播剧的方式获得初选阶段的情感语音数据库。通过模糊综合评价与层次分析法、熵权法相结合建立情感语音的模糊综合评价模型,利用该... 为建立一个真实、自然、丰富的情感语音数据库,研究选择高兴、惊奇、悲伤、生气四种情感类型,利用截取广播剧的方式获得初选阶段的情感语音数据库。通过模糊综合评价与层次分析法、熵权法相结合建立情感语音的模糊综合评价模型,利用该模型对初选阶段的数据库进行模糊评价,筛选得到最终高质量的情感语音数据库。将三种类型的数据库用于情感语音识别实验,对比分析了不同类型数据库的差异,同时也验证了本数据库的有效性。 展开更多
关键词 情感语音数据库 模糊综合评价 层次分析法 熵权法 情感语音识别
在线阅读 下载PDF
基于LDA+kernel-KNNFLC的语音情感识别方法 被引量:8
3
作者 张昕然 查诚 +2 位作者 徐新洲 宋鹏 赵力 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第1期5-11,共7页
结合K近邻、核学习方法、特征线重心法和LDA算法,提出了用于情感识别的LDA+kernel-KNNFLC方法.首先针对先验样本特征造成的计算量庞大问题,采用重心准则学习样本距离,改进了核学习的K近邻方法;然后加入LDA对情感特征向量进行优化,在避... 结合K近邻、核学习方法、特征线重心法和LDA算法,提出了用于情感识别的LDA+kernel-KNNFLC方法.首先针对先验样本特征造成的计算量庞大问题,采用重心准则学习样本距离,改进了核学习的K近邻方法;然后加入LDA对情感特征向量进行优化,在避免维度冗余的情况下,更好地保证了情感信息识别的稳定性.最后,通过对特征空间再学习,结合LDA的kernel-KNNFLC方法优化了情感特征向量的类间区分度,适合于语音情感识别.对包含120维全局统计特征的语音情感数据库进行仿真实验,对降维方案、情感分类器和维度参数进行了多组对比分析.结果表明,LDA+kernel-KNNFLC方法在同等条件下性能提升效果最显著. 展开更多
关键词 语音情感识别 K近邻 核学习 特征重心线 线性判别分析
在线阅读 下载PDF
基于脑电同源样本捆绑法的情绪识别研究^ 被引量:2
4
作者 刘爽 仝晶晶 +2 位作者 杨佳佳 綦宏志 明东 《中国生物医学工程学报》 CAS CSCD 北大核心 2016年第3期272-277,共6页
近年来,越来越多的研究者投入到基于脑电的情绪识别研究中,新理论方法的提出使得情绪的识别准确率有了进一步提高。然而,一旦走向实际应用,识别率大幅度下降,建立高精确率的情绪识别模型仍面临巨大的挑战。一个非常重要的原因是同源样... 近年来,越来越多的研究者投入到基于脑电的情绪识别研究中,新理论方法的提出使得情绪的识别准确率有了进一步提高。然而,一旦走向实际应用,识别率大幅度下降,建立高精确率的情绪识别模型仍面临巨大的挑战。一个非常重要的原因是同源样本携带的非情绪信息使情绪识别模型更容易识别测试集的样本,使得传统的情绪识别方法出现识别正确率虚高的问题。为此,提出一种新的样本划分方法-同源样本捆绑法,并对10名被试开展情绪诱发实验,利用情绪图片和视频诱发平静、愉悦、难过和恶心等4种情绪状态。提取6个频段的脑电信号(θ∶4~8 Hz,α:8~12 Hz,β1:13~18 Hz,β2:18~30 Hz,γ1:30~36 Hz和γ2:36~44 Hz)的功率谱特征,然后利用支持向量机进行情绪识别,并对比传统随机方法与同源样本捆绑法的情绪识别效果。结果显示,对于图片诱发任务,随机法四分类平均正确率为43.92%,而捆绑法只得到34.15%的平均正确率;在视频诱发任务下,随机法和捆绑法分别得到94.45%和37.88%的平均正确率,随机法显著高于捆绑法,证明传统的样本随机划分方法会带来虚高情绪识别率。最后利用基于递归筛选的支持向量机(SVM-RFE)算法剔除基于同源样本捆绑法下的非情绪特征,提高情绪识别正确率,图片和视频诱发任务分别得到76.22%和72.53%的平均识别正确率。综上,所提出的同源样本捆绑法可以剔除非情绪因素的影响,避免传统的样本划分方法带来的虚高情绪识别率,是情绪识别从理论研究走向实际应用重要且必要的一步。 展开更多
关键词 脑电 情绪识别 支持向量机(SVM) 同源样本捆绑法
在线阅读 下载PDF
语音情感识别算法中新型参数研究 被引量:3
5
作者 余华 章勤杰 赵力 《电子器件》 CAS 北大核心 2017年第5期1234-1237,共4页
语音情感识别是实现智能人机交互的关键技术之一。然而,用于语音情感识别的语音情感特征十分有限。为此,提出一种新型的语谱图显著性特征来改善语音情感识别效果。识别算法利用选择性注意模型获取语音信号语谱图像的显著图,并从中提取... 语音情感识别是实现智能人机交互的关键技术之一。然而,用于语音情感识别的语音情感特征十分有限。为此,提出一种新型的语谱图显著性特征来改善语音情感识别效果。识别算法利用选择性注意模型获取语音信号语谱图像的显著图,并从中提取显著性特征,结合语音信号传统的时频特征构成语音情感识别特征向量。最后,利用KNN分类方法进行语音情感识别。实验结果表明,加入显著性特征后识别率有明显提升。 展开更多
关键词 语音情感识别 显著性特征 KNN分类
在线阅读 下载PDF
MEF融合HFF的戏剧视频关键情节自动提取
6
作者 尚雪莲 秦健勇 《电视技术》 北大核心 2015年第8期50-54,共5页
为了更好地从戏剧视频提取关键情节,提出了一种基于音乐情感特征(MEF)融合人脸特征(HFF)的自动提取方法。首先,利用基于音频指纹技术的二级音乐情感识别方法进行音频识别,并利用人脸特征进行视频识别;然后,利用音频和视频识别得到的各... 为了更好地从戏剧视频提取关键情节,提出了一种基于音乐情感特征(MEF)融合人脸特征(HFF)的自动提取方法。首先,利用基于音频指纹技术的二级音乐情感识别方法进行音频识别,并利用人脸特征进行视频识别;然后,利用音频和视频识别得到的各元素获取关键情节值,从而提取关键情节;最后,提出了一种量化评估方法评估关键情节提取方法的一致性。在四个戏剧视频上的评估实验验证了该方法的有效性及可靠性,相比其他几种较新的提取模型,该方法提取效果更好。 展开更多
关键词 音乐情感特征 人脸特征 视频关键情节 二级音乐情感识别 定量评估
在线阅读 下载PDF
基于BOOSTING框架的视觉语音多模态情感识别检测方法
7
作者 张芬 《现代电子技术》 北大核心 2017年第23期59-63,共5页
情感识别技术是智能人机交互的重要基础,它涉及计算机科学、语言学、心理学等多个研究领域,是模式识别和图像处理领域的研究热点。鉴于此,基于Boosting框架提出两种有效的视觉语音多模态融合情感识别方法:第一种方法将耦合HMM(coupled H... 情感识别技术是智能人机交互的重要基础,它涉及计算机科学、语言学、心理学等多个研究领域,是模式识别和图像处理领域的研究热点。鉴于此,基于Boosting框架提出两种有效的视觉语音多模态融合情感识别方法:第一种方法将耦合HMM(coupled HMM)作为音频流和视频流的模型层融合技术,使用改进的期望最大化算法对其进行训练,着重学习难于识别的(即含有更多信息的)样本,并将Ada Boost框架应用于耦合HMM的训练过程,从而得到Ada Boost-CHMM总体分类器;第二种方法构建了多层Boosted HMM(MBHMM)分类器,将脸部表情、肩部运动和语音三种模态的数据流分别应用于分类器的某一层,当前层的总体分类器在训练时会聚焦于前一层总体分类器难于识别的样本,充分利用各模态特征数据间的互补特性。实验结果验证了两种方法的有效性。 展开更多
关键词 情感识别 表情识别 BOOSTING方法 情感数据库
在线阅读 下载PDF
基于深度学习的多模态情感识别综述 被引量:3
8
作者 刘颖 艾豪 张伟东 《西安邮电大学学报》 2022年第1期60-71,95,共13页
简要介绍了文本、语音和人脸等3种单模态情感识别方法,总结了常用的多模态情感数据集。通过分析基于深度学习的多模态情感识别的研究现状,按照融合方式将基于深度学习的多模态情感识别分为基于早期融合、晚期融合、混合融合以及多核融合... 简要介绍了文本、语音和人脸等3种单模态情感识别方法,总结了常用的多模态情感数据集。通过分析基于深度学习的多模态情感识别的研究现状,按照融合方式将基于深度学习的多模态情感识别分为基于早期融合、晚期融合、混合融合以及多核融合等4种情感识别方法,并进行了对比分析。最后,指出了情感识别技术研究进展存在的问题及未来发展趋势。 展开更多
关键词 多模态 情感识别 深度学习 融合方式
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部