-
题名数据驱动方法的语音库裁剪研究
- 1
-
-
作者
张巍
吴晓如
王仁华
-
机构
中国海洋大学计算机科学系
安徽中科大讯飞信息科技股份有限公司
中国科学技术大学电子工程与信息科学系
-
出处
《高技术通讯》
EI
CAS
CSCD
北大核心
2008年第1期26-32,共7页
-
基金
国家自然科学基金(60602017)
863计划(2004AA114030)资助项目
-
文摘
为解决语音库裁剪会造成不定长损失的问题,首先提出了 NuClustering-VPA 算法,该算法对不同粒度的不定长变体进行递阶聚类,根据高阶聚类结果调整低阶变体的聚类,从而保留在声韵上最为重要的变体。接着提出了虚拟不定长替换的概念,意图弥补不定长的损失,并结合合成使用变体的频度,给出了可以任意比例裁剪语音库的 StaRp-VPA算法。大规模测听表明,两种算法在裁剪率小于50%时,合成自然度几乎没有下降;当裁剪率大于50%时,StaRp-VPA 给出的音库合成自然度也不会严重降低。两种裁剪在合成系统的移植中得到了很好的应用。
-
关键词
语音合成
语音库裁剪
可伸缩语音合成系统
-
Keywords
speech synthesis, synthesis instances pruning, sealable text-to-speech system
-
分类号
TN912.33
[电子电信—通信与信息系统]
TS941.712
[轻工技术与工程—服装设计与工程]
-