摘要
谱特征在语音情感识别中起到了重要的作用,然而现有的谱特征仍未能充分表达谱图中的语音情感信息。为研究语音情感与谱图之间的联系,提出了一种面向语音情感识别的Gabor分块局部二值模式特征(GBLBP)。首先,获取情感语音的对数能量谱;然后,采用多尺度,多方向的Gabor小波对对数能量谱进行处理,得到Gabor谱图;再次,对每张Gabor谱图进行分块,采用局部二值模式提取每个块的局部能量分布信息;最后,将提取到的所有特征级联,得到GBLBP特征。EMO-DB库及中文语音库上的实验结果表明:GBLBP特征的平均加权召回率比MFCC高了9%~10%,识别性能显著优于众多谱特征,且与现有声学特征有较好的融合性。
Spectral features play an important role in speech emotion recognition. However,the existing spectral features still can't fully express emotion information in spectrum. In order to study the relationship between speech emotion and spectrum,a new feature called Gabor block spectrum features based on local binary pattern( GBLBP) is proposed in this paper. Firstly,the logarithmic energy spectrum of emotion speech is obtained. Then,the Gabor spectrums are obtained through computing convolution between Gabor wavelet with logarithmic energy spectrum. Thirdly,the local energy distribution information of each block from Gabor spectrums is extracted by using local binary pattern. Finally,the GBLBP features are obtained by jointing all the features from Gabor spectrums. The experimental results on EMO-DB and Chinese speech database show that the average weighted recall rate of GBLBP 9% ~ 10% higher than that of MFCC,and the recognition performance of GBLBP is significantly better than most of spectral features,and GBLBP has a better fusion performance with the existing acoustic features.
出处
《信号处理》
CSCD
北大核心
2016年第5期505-511,共7页
Journal of Signal Processing
基金
国家自然基金(61273266
61231002
61301219)
教育部博士点专项基金(20110092130004)
江苏省自然科学基金(BK20130241)
作者简介
陶华伟 男,1987年生,河南郑州人,东南大学信息科学与工程学院博士生。主要研究方向为语音情感识别。E-mail:ttkhao@163.cam
柳晶晶 女,1987年生,东南大学信息科学与工程学院博士生。主要研究方向为图像识别、语音识别。E-mail:279160210@qq.com
梁瑞字 男,1978年生,东南大学信息科学与工程学院博士后,南京工程学院通信工程学院副教授。主要研究方向为语音信号处理。E—mail:5205396@qq.com
查诚 男,1979年生,东南大学信息科学与工程学院博十生。主要研究方向为语音情感识别。E-mail:chengzha@sell.edu.cn
张昕然 男,1987年生,东南大学信息科学与工程学院博士生。主要研究方向为语音情感识别。E-mail:415067556@qq.com
赵力 男,1958年生,东南大学信息科学与工程学院教授,博士生导师。主要研究方向为语音信号处理、图像信号处理。E-mail:zhaoli@seu.edu.cn