-
题名基于瞬时频率估计和特征映射的汉语耳语音话者识别
被引量:5
- 1
-
-
作者
王敏
赵鹤鸣
张庆芳
-
机构
苏州大学电子信息学院
-
出处
《数据采集与处理》
CSCD
北大核心
2011年第6期686-690,共5页
-
基金
国家自然科学基金(60572076
61071215)资助项目
-
文摘
耳语音是有别于正常音的一种微弱语音信号,在正常音训练的说话人识别系统中,用耳语音进行识别时会造成系统性能的急速下降。本文在基于语音产生的调幅-调频(AM-FM)模型基础上,采用多带解调分析(Multi-band demodulation analysis,MDA)和能量分离算法(Energy separation algorithm,ESA)计算语音信号的瞬时频率,作为语音的一种特征。随后在基于耳语音和正常音来自不同信道的假设下,对语音的参数做特征映射后再进行训练和识别,以减少信道对系统的影响。实验表明,和传统的MFCC参数相比,加入特征映射后系统的识别率得到提高,且IFE的识别率和稳健性都优于MFCC。
-
关键词
耳语音话者识别
AM—FM模型
瞬时频率估计
特征映射
-
Keywords
whisper speaker identification
AM-FM model
instantaneous frequency estimation
feature mapping
-
分类号
TN912.3
[电子电信—通信与信息系统]
-