期刊文献+

面向语音情感识别的Gabor分块局部二值模式特征 被引量:5

Gabor Block Spectrum Features Based on Local Binary Pattern for Speech Emotion Recognition
在线阅读 下载PDF
导出
摘要 谱特征在语音情感识别中起到了重要的作用,然而现有的谱特征仍未能充分表达谱图中的语音情感信息。为研究语音情感与谱图之间的联系,提出了一种面向语音情感识别的Gabor分块局部二值模式特征(GBLBP)。首先,获取情感语音的对数能量谱;然后,采用多尺度,多方向的Gabor小波对对数能量谱进行处理,得到Gabor谱图;再次,对每张Gabor谱图进行分块,采用局部二值模式提取每个块的局部能量分布信息;最后,将提取到的所有特征级联,得到GBLBP特征。EMO-DB库及中文语音库上的实验结果表明:GBLBP特征的平均加权召回率比MFCC高了9%~10%,识别性能显著优于众多谱特征,且与现有声学特征有较好的融合性。 Spectral features play an important role in speech emotion recognition. However,the existing spectral features still can't fully express emotion information in spectrum. In order to study the relationship between speech emotion and spectrum,a new feature called Gabor block spectrum features based on local binary pattern( GBLBP) is proposed in this paper. Firstly,the logarithmic energy spectrum of emotion speech is obtained. Then,the Gabor spectrums are obtained through computing convolution between Gabor wavelet with logarithmic energy spectrum. Thirdly,the local energy distribution information of each block from Gabor spectrums is extracted by using local binary pattern. Finally,the GBLBP features are obtained by jointing all the features from Gabor spectrums. The experimental results on EMO-DB and Chinese speech database show that the average weighted recall rate of GBLBP 9% ~ 10% higher than that of MFCC,and the recognition performance of GBLBP is significantly better than most of spectral features,and GBLBP has a better fusion performance with the existing acoustic features.
出处 《信号处理》 CSCD 北大核心 2016年第5期505-511,共7页 Journal of Signal Processing
基金 国家自然基金(61273266 61231002 61301219) 教育部博士点专项基金(20110092130004) 江苏省自然科学基金(BK20130241)
关键词 GABOR小波 局部二值模式 语音情感识别 谱特征 Gabor wavelet local binary pattern speech emotion recognition spectral features
作者简介 陶华伟 男,1987年生,河南郑州人,东南大学信息科学与工程学院博士生。主要研究方向为语音情感识别。E-mail:ttkhao@163.cam 柳晶晶 女,1987年生,东南大学信息科学与工程学院博士生。主要研究方向为图像识别、语音识别。E-mail:279160210@qq.com 梁瑞字 男,1978年生,东南大学信息科学与工程学院博士后,南京工程学院通信工程学院副教授。主要研究方向为语音信号处理。E—mail:5205396@qq.com 查诚 男,1979年生,东南大学信息科学与工程学院博十生。主要研究方向为语音情感识别。E-mail:chengzha@sell.edu.cn 张昕然 男,1987年生,东南大学信息科学与工程学院博士生。主要研究方向为语音情感识别。E-mail:415067556@qq.com 赵力 男,1958年生,东南大学信息科学与工程学院教授,博士生导师。主要研究方向为语音信号处理、图像信号处理。E-mail:zhaoli@seu.edu.cn
  • 相关文献

参考文献4

二级参考文献56

  • 1韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报(自然科学版),2008,48(S1):708-714. 被引量:20
  • 2杨莉莉,李燕,徐柏龄.汉语耳语音库的建立与听觉实验研究[J].南京大学学报(自然科学版),2005,41(3):311-317. 被引量:13
  • 3王治平,赵力,邹采荣.基于基音参数规整及统计分布模型距离的语音情感识别[J].声学学报,2006,31(1):28-34. 被引量:26
  • 4R. Cowie, E. Douglas-Cowie, N. Tsapatsoulis, et al. Emotion recognition in human-computer interaction [ J ]. IEEE Signal Processing magazine, 2001, 18( 1 ) :32-80.
  • 5Klaus R. Scherer, Vocal communication of emotion: A review of research paradigms [ J ]. Speech Communication, 2003, 40 : 227-256.
  • 6Zhongzhe Xiao, Dellandrea E, Weibei Dou, et al. Features extraction and selection for emotional speech classification [ C ]. IEEE Conference on Advanced Video and Signal Based Surveillance, 2005:411-416.
  • 7D. Ververidis, C. Kotropoulos,I. Pitas. Automatic emotional speech classification[ C]. Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing, 2004, 1:593-596.
  • 8B. Sehuller, G. Rigoll and M. Lang. Hidden markov model-based speech emotion recognition [ C ]. Proceedings of IEEE-ICASSP, 2003:401-405.
  • 9T. Johnstone. Emotional speech elicited using computer games [ C ]. Fourth International Conference on Spoken Language, 1996, 3 : 1985-1988.
  • 10T. Johnstone, CM van Reekum, K hird, K Kirsner, et al. Affective speech elicited with a computer game [ J ]. Emotion, 2005, 5(4) :513-518.

共引文献44

同被引文献38

引证文献5

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部