-
题名基于双因子高斯过程动态模型的声道谱转换方法
被引量:3
- 1
-
-
作者
孙新建
张雄伟
杨吉斌
曹铁勇
钟新毅
-
机构
解放军理工大学通信工程学院
解放军理工大学指挥信息系统学院
-
出处
《自动化学报》
EI
CSCD
北大核心
2014年第6期1198-1207,共10页
-
基金
国家自然科学基金(61072042)
江苏省自然科学基金(BK2012510)
+1 种基金
解放军理工大学预先研究基金(20110205
20110211)资助~~
-
文摘
针对作者已经提出的双因子高斯过程隐变量模型(Two-factorGaussianprocesslatentvariablemodel,TF-GPLVM)用于语音转换时未考虑语音的动态特征,并且模型训练时需要估计的参数较多的问题,提出引入隐马尔科夫模型(Hidden Markov model,HMM)对语音动态特征进行建模,并利用HMM隐状态对各帧语音进行关于语义内容的概率软分类,建立了分离精度更高、运算负荷较小的双因子高斯过程动态模型(Two-factor Gaussian process dynamic model,TF-GPDM).基于此模型,设计了一种全新的基于说话人特征替换的语音声道谱转换方案.主、客观实验结果表明,无论是与传统的统计映射和频率弯折转换方法相比,还是与双因子高斯过程隐变量模型方法相比,本文方法都获得了语音质量和转换相似度的提升,以及两项性能的更佳平衡.
-
关键词
声道谱转换
高斯过程隐变量模型
双因子模型
隐马尔科夫模型
语音动态特征
-
Keywords
Vocal tract spectrum conversion, Gaussian process latent variable model (GPLVM), two-factor model,hidden Markov model (HMM), speech dynamical characteristics
-
分类号
TN912.3
[电子电信—通信与信息系统]
-