-
题名基于双耳语音分离和丢失数据技术的鲁棒语音识别算法
被引量:11
- 1
-
-
作者
周琳
赵一良
朱竑谕
汤一彬
-
机构
东南大学信息与工程学院水声信号处理教育部重点实验室
河海大学物联网学院
-
出处
《声学技术》
CSCD
北大核心
2019年第5期545-553,共9页
-
基金
国家自然科学基金(61571106、61501169、61201345)
中央高校基本科研业务费专项资金(2242013K30010)
-
文摘
鲁棒语音识别技术在人机交互、智能家居、语音翻译系统等方面有重要应用。为了提高在噪声和语音干扰等复杂声学环境下的语音识别性能,基于人耳听觉系统的掩蔽效应和鸡尾酒效应,利用不同声源的空间方位,提出了基于双耳声源分离和丢失数据技术的鲁棒语音识别算法。该算法首先根据目标语音的空间方位信息,在双耳声信号的等效矩形带宽(EquivalentRectangularBandwidth,ERB)子带内进行混合语音信号的分离,从而得到目标语音的数据流。针对分离后目标语音在频域存在频谱数据丢失的问题,利用丢失数据技术修正基于隐马尔科夫模型的概率计算,再进行语音识别。仿真实验表明,由于双耳声源分离方法得到的目标语音数据去除了噪声和干扰的影响,所提出的算法显著提高了复杂声学环境下的语音识别性能。
-
关键词
空间听觉
双耳声源分离
丢失数据技术
误识率
-
Keywords
spatial hearing
binaural speech separation
missing data technique.
speech recognition
word error rate (WER)
-
分类号
H107
[语言文字—汉语]
-