摘要
提出并实现了一种基于广义人工神经网络和STRAIGHT模型的高效基频轨迹跟踪算法。一方面,STRAIGHT模型可以对语音信号的基频进行较大幅度的修改而不至于引起合成语音质量的下降。另一方面,利用人工神经网络优良的预测能力,学习源说话人和目标说话人的基频轨迹之间的内在联系,实现基音频率的转换。语谱图分析、主观意见分评价结果表明:提出的基频轨迹跟踪算法在合成语音质量及目标特征映射上都远远好于传统的基频转换算法。
This paper proposes an efficient morphing algorithm of pitch based on generalized artificial intelligence and the STRAIGHT model.The STRAIGHT model can modifies the pitch without loss of the quality of the voice.Moreover,based on GANN predictable ability,we can get the relationship between source and object,and realizes pitch conversion.Subjective evaluation and objective measurement indicate that the performance of the proposed method is better that that of the traditional method in term of synthesized quality and precision of mapping target characteristics.
出处
《南京邮电大学学报(自然科学版)》
2010年第5期83-87,共5页
Journal of Nanjing University of Posts and Telecommunications:Natural Science Edition
基金
国家自然科学基金(60872105)资助项目
作者简介
陈芝(1984-),男,江苏盐城人。南京邮电大学信号与信息处理专业硕士研究生。研究方向为现代语音处理与通信技术。
张玲华(1964-),女,江苏淮安人。南京邮电大学通信与信息工程学院副院长、教授,博士。 通讯作者:张玲华 电话:(025)85881968 E-mail:zhanglh@njupt.edu.cn