摘要
提出了一种基于BP神经网络的汉语耳语音转换为正常语音的方法。首先提取正常语音、耳语音的共振峰参数,使用BP神经网络训练出耳语音到正常语音共振峰参数的转换模型;然后根据模型求出与耳语音对应的正常语音共振峰参数,采用共振峰合成的方法将耳语音转换为正常语音。实验结果表明:使用该方法转换的正常语音DRT得分为80%,MOS得分为3.5,在可懂度和音质方面均达到了满意的效果。
This paper tells of a new approach for reconstructing normal speech from Chinese whispered speech based on BP neural network. First, the formants of normal speech and whispered speech are acquired, and the BP neural network is used to get a model of the conversion from the whispered speech to the formants of normal speech, then the formant of whispered speech is converted by adopting this model. Finally, the whispered speech is converted into the normal speech by using the formant synthesizer. Simulation results show that the score of the DRT of the converted speech is 80% and the MOS is 3.5, both intelligibility and quality of the converted speech are satisfied.
出处
《通信技术》
2009年第2期152-155,共4页
Communications Technology
基金
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60572076)
江苏省高校自然科学研究计划基金资助项目(No.05JKB510113)
国家级大学生创新性实验计划项目(No.57315755)。
关键词
耳语音
语音转换
BP神经网络
共振峰
whispered speech
speech conversion
BP neural network
formant
作者简介
韩韬(1984-),男,硕士研究生,主要研究方向为语音信号处理;
陶智(1970-),男,副教授,硕导,主要研究方向为多媒体信息处理和语音信号处理;
顾济华(1957-),男,教授,博导,主要研究方向为信息处理和光电子技术;
赵鹤鸣(1957-),男,教授,博导,主要研究方向为语音信号处理、多媒体信息处理和智能计算;
李玲,(1986-),女,本科生。