基于MFCC和GFCC混合特征的语音情感识别研究被引量：10

Research on Speech Emotion Recognition Based on Mixed Features of MFCC and GFCC

在线阅读下载PDF

导出

摘要针对MFCC滤波器存在语音高频信号泄露的问题,为避免基于MFCC特征对语音进行情感识别时存在有效情感特征丢失的局限性,结合MFCC的高准确性和GFCC的强鲁棒性,提出了基于MFCC与GFCC混合特征训练CNN对语音进行情感识别的方法,有效提高了语音情感识别的准确率,改善了CNN模型的识别性能。实验结果表明,所设计的混合特征识别方法较传统识别方法识别率明显升高并达到了83%,实现了语言情感识别准确率的有效提升。 Aiming at the problem of voice high frequency signal leakage in Mel-scale frequency cepstral coefficients(MFCC)filter,in order to avoid the limitation of effective emotional feature loss when emotion recognition based on MFCC feature,combined with the high accuracy of MFCC and the strong robustness of GFCC,based on the hybrid feature of MFCC and GFCC,CNN is used to identify the emotion of speech,which improves the accuracy of speech emotion recognition and improves the recognition performance of CNN model.Experimental results show that the proposed hybrid feature recognition method has a significantly higher recognition rate than the traditional recognition method and reaches 83%,which achieves an effective improvement of the language emotion recognition accuracy.

作者郭卉姜囡任杰 GUO Hui;JIANG Nan;REN Jie(Criminal Investigation Police University of China,Shenyang 110854,China)

机构地区中国刑事警察学院

出处《光电技术应用》 2019年第6期34-39,共6页 Electro-Optic Technology Application

关键词 MFCC GFCC 语音情感识别 CNN 混合特征 Mel-scale frequency cepstral coefficients(MFCC) Gammatone frequency cepstral coefficients(GFCC) speech emotion recognition cellular neural network(CNN) mixed features

分类号 TP393 [自动化与计算机技术—计算机应用技术]

作者简介郭卉(1996-),女,湖北武汉人,硕士研究生,主要研究方向为视听资料检验技术;姜囡(1979-),女,山东武城人,博士,副教授,硕士研究生导师,主要研究方向为公安视听技术及模式识别;任杰(1995-),男,陕西黄陵人,硕士研究生,主要研究方向为视听资料检验技术。

引文网络
相关文献

参考文献7

1任浩,叶亮,李月,沙学军.基于多级SVM分类的语音情感识别算法[J].计算机应用研究,2017,34(6):1682-1684. 被引量：26
2韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：172
3邵兵,杜鹏飞.基于卷积神经网络的语音情感识别方法[J].科技创新导报,2016,13(6):87-90. 被引量：6
4茅正冲,王正创,王丹.基于Gammatone滤波器组的说话人识别算法研究[J].计算机工程与应用,2015,51(1):200-203. 被引量：9
5Jian-Hua Tao,Jian Huang,Ya Li,Zheng Lian,Ming-Yue Niu.Semi-supervised Ladder Networks for Speech Emotion Recognition[J].International Journal of Automation and computing,2019,16(4):437-448. 被引量：9
6王华朋,姜囡,晁亚东,刘恩.噪声环境下法庭语音证据量化评价方法[J].计算机应用与软件,2019,36(7):65-68. 被引量：2
7周萍,沈昊,郑凯鹏.基于MFCC与GFCC混合特征参数的说话人识别[J].应用科学学报,2019,37(1):24-32. 被引量：44

二级参考文献114

1王伟,邓辉文.基于MFCC参数和VQ的说话人识别系统[J].仪器仪表学报,2006,27(z3):2253-2255. 被引量：30
2van Bezooijen R,Otto SA,Heenan TA. Recognition of vocal expressions of emotion:A three-nation study to identify universal characteristics[J].{H}JOURNAL OF CROSS-CULTURAL PSYCHOLOGY,1983,(04):387-406.
3Tolkmitt FJ,Scherer KR. Effect of experimentally induced stress on vocal parameters[J].Journal of Experimental Psychology Human Perception Performance,1986,(03):302-313.
4Cahn JE. The generation of affect in synthesized speech[J].Journal of the American Voice Input/Output Society,1990.1-19.
5Moriyama T,Ozawa S. Emotion recognition and synthesis system on speech[A].Florence:IEEE Computer Society,1999.840-844.
6Cowie R,Douglas-Cowie E,Savvidou S,McMahon E,Sawey M,Schro. Feeltrace:An instrument for recording perceived emotion in real time[A].Belfast:ISCA,2000.19-24.
7Grimm M,Kroschel K. Evaluation of natural emotions using self assessment manikins[A].Cancun,2005.381-385.
8Grimm M,Kroschel K,Narayanan S. Support vector regression for automatic recognition of spontaneous emotions in speech[A].IEEE Computer Society,2007.1085-1088.
9Eyben F,Wollmer M,Graves A,Schuller B Douglas-Cowie E Cowie R. On-Line emotion recognition in a 3-D activation-valencetime continuum using acoustic and linguistic cues[J].Journal on Multimodal User Interfaces,2010,(1-2):7-19.
10Giannakopoulos T,Pikrakis A,Theodoridis S. A dimensional approach to emotion recognition of speech from movies[A].Taibe:IEEE Computer Society,2009.65-68.

共引文献247

1郑成杰,郑之.基于最大分类器差异域适应方法的3维点云分类[J].信息与控制,2023,52(5):588-597. 被引量：1
2艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量：13
3崔琳,王芷悦.基于LFBank与FBank混合特征的声纹识别研究[J].计算机科学,2022,49(S02):621-625. 被引量：5
4张会云.语音情感识别研究综述[J].信息通信,2019,0(11):58-60. 被引量：2
5葛海燕,左国华,高明发.^(131)I标记抗CEA单抗预防人结肠癌肝转移的实验研究[J].第三军医大学学报,2000,22(5):430-432. 被引量：5
6胡冬妮,王武军,王青.基于知网数据的情感识别国内研究情况综述[J].网络新媒体技术,2018,7(6):1-9. 被引量：4
7李霞,卢官明,闫静杰,张正言.多模态维度情感预测综述[J].自动化学报,2018,44(12):2142-2159. 被引量：27
8李高玲,帖云,齐林.基于随机森林分类优化的多特征语音情感识别[J].微电子学与计算机,2019,36(1):70-73. 被引量：12
9张福泉.情感建模及情感识别技术研究[J].廊坊师范学院学报（自然科学版）,2014,14(5):23-26. 被引量：4
10孙凌云,何博伟,刘征,杨智渊.基于语义细胞的语音情感识别[J].浙江大学学报（工学版）,2015,49(6):1001-1008. 被引量：2

同被引文献82

1李艳生,刘园,张毅,杨美美.混响环境下移动机器人语音控制方法及系统实现[J].仪器仪表学报,2019,40(11):165-171. 被引量：15
2张会云.语音情感识别研究综述[J].信息通信,2019,0(11):58-60. 被引量：2
3尹向雷,郑恩让,马令坤,马晓虹.基于掩蔽效应的维纳滤波器语音增强及DSP实现[J].电子技术应用,2010,36(4):123-126. 被引量：1
4朱勇,詹永照.基于CBP-TOP特征的人脸表情识别[J].计算机应用研究,2011,28(5):1957-1960. 被引量：2
5贺玲玲,周元.基于改进MFCC的异常声音识别算法[J].重庆工商大学学报（自然科学版）,2012,29(2):52-57. 被引量：10
6屠彬彬,于凤芹.基于样本熵与MFCC融合的语音情感识别[J].计算机工程,2012,38(7):142-144. 被引量：7
7戴小溪,刘爱伦.基于Levinson-Durbin算法的变采样周期调度[J].微计算机信息,2012(7):19-21. 被引量：2
8胡峰松,张璇.基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J].计算机应用,2012,32(9):2542-2544. 被引量：22
9周萍,李晓盼,李杰,景新幸.混合MFCC特征参数应用于语音情感识别[J].计算机测量与控制,2013,21(7):1966-1968. 被引量：19
10姚登举,杨静,詹晓娟.基于随机森林的特征选择算法[J].吉林大学学报（工学版）,2014,44(1):137-141. 被引量：257

引证文献10

1毛文青,管业鹏.基于LPBMFCC的文本无关说话人识别[J].电子测量技术,2020,43(19):169-176. 被引量：1
2龙英潮,丁美荣,林桂锦,刘鸿业,曾碧卿.基于视听觉感知系统的多模态情感识别[J].计算机系统应用,2021,30(12):218-225. 被引量：3
3翟永杰,彭雅妮,杨旭,胡东阳,王新颖.融合MFCC和IMFCC特征的电厂设备声音识别算法[J].现代电子技术,2022,45(8):6-12. 被引量：7
4张敏,贾海蓉,张刚敏,王素英.结合自适应软掩模和混合特征的语音增强[J].西安电子科技大学学报,2022,49(2):108-115.
5王赵国,韦存海,彭雅妮,武明路,李军彬,翟永杰.基于GFCC-SVM-RFE的电力设备声音特征提取方法[J].电力信息与通信技术,2022,20(9):34-42. 被引量：2
6邓鑫,杨超,王岩松,郭辉.基于VMD和ReliefF算法的汽车鸣笛声识别方法[J].电子设计工程,2023,31(10):54-58. 被引量：1
7郑晨颖,马建芬,张朝霞.基于多特征融合的参数再合成语音增强算法[J].计算机工程与设计,2023,44(8):2367-2373. 被引量：2
8李牧,杨宇恒,柯熙政.基于混合特征提取与跨模态特征预测融合的情感识别模型[J].计算机应用,2024,44(1):86-93.
9孙洪涛,刘春防,李望荣.一种基于K210的声音采集与识别系统设计[J].计算机应用文摘,2024,40(8):99-101.
10吴婷,刘琼,郭慧茹.基于鲁棒纹理特征的环境声音事件检测方法[J].电子器件,2024,47(2):530-535. 被引量：1

二级引证文献16

1奚琰.基于对比学习的细粒度遮挡人脸表情识别[J].计算机系统应用,2022,31(11):175-183. 被引量：4
2宋诚,夏翔,王鑫一,杨文星,姚平.基于MFCC和CNN的变压器声学特征提取及故障识别[J].电工电气,2023(6):49-54. 被引量：6
3杨磊,权伟,李亮,王镜淇,高帆,于轩.基于ITD-MFCC与卷积神经网络的核电电气设备异音检测技术[J].噪声与振动控制,2023,43(4):122-128. 被引量：4
4董绍江,刘伟.DenseNet结合空间通道注意力机制的环境声音分类[J].重庆理工大学学报（自然科学）,2023,37(11):179-187. 被引量：2
5李牧,杨宇恒,柯熙政.基于混合特征提取与跨模态特征预测融合的情感识别模型[J].计算机应用,2024,44(1):86-93.
6邱书琦,蹇照民,方立雄,秦婧雯,万俊岭,袁培森.基于变分模态分解和集成学习的光伏发电预测[J].智慧电力,2024,52(3):32-38. 被引量：3
7张瑞宏.基于驾驶员视觉与语音的多模态情感特征识别系统应用研究[J].中国新通信,2024,26(8):49-51.
8付兆婷.复杂环境下基于深度学习的声音识别研究[J].电声技术,2024,48(5):40-42.
9刘雪晴.声音识别技术在日语自然语言处理系统中的应用[J].电声技术,2024,48(7):72-74.
10薛珮芸,白静,张楠,赵建星.基于VMD的双通道构音障碍语音特征图谱提取算法[J].东北大学学报（自然科学版）,2024,45(6):793-801.

1刘景天,姜囡.基于混合特征的说话人语音分割聚类研究[J].光电技术应用,2019,34(5):37-41. 被引量：3
2刘志彬.中等职业学校如何在德育课中进行情感教育[J].辽宁教育,2019(12):80-82.
3孙敬彬.小学数学深度课堂的维度构建[J].数学教学通讯,2019,0(13):3-4.
4张仕凤.幼儿绘本阅读中情感教育分析[J].南北桥,2018,0(21):200-200.
5陈耀东,彭蝶飞.一种面向旅游评论的情感特征识别方法[J].计算机技术与发展,2018,28(11):107-110. 被引量：2
6袁奋华.开展问题式教学培养数学思维能力探究[J].成才之路,2019,0(25):43-44.
7潘剑飞,曹燕,董一鸿,陈华辉,钱江波.基于Attention深度随机森林的社区演化事件预测[J].电子学报,2019,47(10):2050-2060. 被引量：6
8梁志祥,刘晓明,牟颖,刘玉田.基于深度学习的新能源爬坡事件预测方法[J].山东大学学报（工学版）,2019,49(5):24-28. 被引量：4
9米热吉古丽·热扎克,吐尔尼亚孜·艾比布.基于MFC的实训室课程显示系统的设计与实现[J].电脑知识与技术,2019,15(10):83-84. 被引量：2
10刘旺茂,刘旺盛,李发慧.小学语文教学中渗透情感教育面临的问题与对策[J].中华传奇,2019,0(15):0090-0091.

光电技术应用

2019年第6期

浏览历史

内容加载中请稍等...

基于MFCC和GFCC混合特征的语音情感识别研究被引量：10

参考文献7

二级参考文献114

共引文献247

同被引文献82

引证文献10

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于MFCC和GFCC混合特征的语音情感识别研究 被引量：10

参考文献7

二级参考文献114

共引文献247

同被引文献82

引证文献10

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于MFCC和GFCC混合特征的语音情感识别研究被引量：10