-
题名考虑语速和前后环境的基频Target模型及实现
被引量:3
- 1
-
-
作者
陈高鹏
胡郁
王仁华
-
机构
中国科学技术大学电子工程与信息科学系
-
出处
《中文信息学报》
CSCD
北大核心
2004年第3期81-85,共5页
-
文摘
本文通过一些实验和数据分析 ,对以音节为单位的基频target模型 (认为音节的实际基频是一个有语音学意义的隐藏的目标target和前后环境作用的结果 )的实现进行修正 ,并结合数据挖掘的方法自动得到了一个实用化的target基频模型。文中指出 ,音节的target必须不受语速影响 ,但同时受前后语言环境影响 ,实际的基频曲线是在前后的韵律曲线作用下向target的一个逼近过程。文章的主要任务就是如何假设一个合理的target,实现基频的target参数自动提取 ,最后进行基于机器学习的模型训练 ,成功实现了完全自动化的完整句子的基频预测和合成。集外测试结果预测的均方误差为 2 2Hz ,相关系数为 0 72。
-
关键词
计算机应用
中文信息处理
语音合成
韵律模型
基频
target
-
Keywords
computer application
Chinese information processing
tts, prosody model, pitch, target
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名采用超音段韵律特征联合短时频谱的语音转换
被引量:3
- 2
-
-
作者
李力
俞一彪
-
机构
苏州大学电子信息学院
-
出处
《信号处理》
CSCD
北大核心
2012年第2期289-294,共6页
-
文摘
传统的语音转换方法往往着重于语音的声道特征和基频的转换,而忽视了其他的超音段韵律特征,这导致转换后的语音目标倾向性不够明显,合成语音自然度不高,不能很好地反应说话人个性化特征。本文在短时谱包络转换的基础上,加入了基频、语速、停顿、重音等多种超音段韵律特征进行转换处理,以提高语音转换性能。其中,采用基频目标模型对基音频率建模,然后运用高斯混合模型(GMM)训练得到转换规则,而语速、停顿、重音则采用基于单高斯统计分析的最大似然估计方法训练得到转换规则。实验结果表明,在加入超音段韵律特征转换之后,系统非常明显地提高了转换语音的目标倾向性和自然度。
-
关键词
语音转换
韵律特征
基频目标模型
-
Keywords
voice conversion
prosody feature
pitch target model
-
分类号
TN912.3
[电子电信—通信与信息系统]
-