期刊文献+

基于BP神经网络的耳语音转换为正常语音的研究 被引量:3

Reconstruction of Normal Speech from Whispered Speech based on BP Neural Network
原文传递
导出
摘要 提出了一种基于BP神经网络的汉语耳语音转换为正常语音的方法。首先提取正常语音、耳语音的共振峰参数,使用BP神经网络训练出耳语音到正常语音共振峰参数的转换模型;然后根据模型求出与耳语音对应的正常语音共振峰参数,采用共振峰合成的方法将耳语音转换为正常语音。实验结果表明:使用该方法转换的正常语音DRT得分为80%,MOS得分为3.5,在可懂度和音质方面均达到了满意的效果。 This paper tells of a new approach for reconstructing normal speech from Chinese whispered speech based on BP neural network. First, the formants of normal speech and whispered speech are acquired, and the BP neural network is used to get a model of the conversion from the whispered speech to the formants of normal speech, then the formant of whispered speech is converted by adopting this model. Finally, the whispered speech is converted into the normal speech by using the formant synthesizer. Simulation results show that the score of the DRT of the converted speech is 80% and the MOS is 3.5, both intelligibility and quality of the converted speech are satisfied.
出处 《通信技术》 2009年第2期152-155,共4页 Communications Technology
基金 国家自然科学基金(the National Natural Science Foundation of China under Grant No.60572076) 江苏省高校自然科学研究计划基金资助项目(No.05JKB510113) 国家级大学生创新性实验计划项目(No.57315755)。
关键词 耳语音 语音转换 BP神经网络 共振峰 whispered speech speech conversion BP neural network formant
作者简介 韩韬(1984-),男,硕士研究生,主要研究方向为语音信号处理; 陶智(1970-),男,副教授,硕导,主要研究方向为多媒体信息处理和语音信号处理; 顾济华(1957-),男,教授,博导,主要研究方向为信息处理和光电子技术; 赵鹤鸣(1957-),男,教授,博导,主要研究方向为语音信号处理、多媒体信息处理和智能计算; 李玲,(1986-),女,本科生。
  • 相关文献

参考文献9

二级参考文献23

  • 1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量:34
  • 2刘莹,李国锋.用线性预测法实现气声语音的重建[J].电声技术,1995,19(9):2-4. 被引量:2
  • 3Morris R W,Clements M A.Reconstruction of Speech From Whispers.Medical Engineering & Physics,2002,24(8) :515-520.
  • 4杨顺安.浊音源动态特性对合成音质的影响[J].中国语文,1986,3:173-181.
  • 5.[EB/OL].http://www.enounce.com,.
  • 6J D Markel, A H Gray Jr. Linear Prediction of Speech[M].New York: Springer-verlag, 1976.
  • 7B S Atal, S L hananer. Speech Analysis and Synthesis by Linear Prediction of the Speech Ware[J]. JASA, 1971, 50:637-655.
  • 8J D Markel. Digital Inverse Filtering A New Tool for Formant Trajectory Estimation[J]. IEEE Trans on Audio and Electroacoustics, 1972, 20:129-13.
  • 9J Makhoul. Linear prediction: A tutorial review[J]. Proc IEEE, 1976, 64: 99-118.
  • 10DGChilders.Speech processing and Synthesis Toolboxes[M].北京:清华大学出版社,2004..

共引文献24

同被引文献15

引证文献3

二级引证文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部