-
题名英语语音合成中基于DFGA的字音转换算法
被引量:3
- 1
-
-
作者
王永生
柴佩琪
宣国荣
-
机构
上海同济大学留德预备部
上海同济大学计算机科学与工程系
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第13期158-161,190,共5页
-
文摘
在英语语音合成中,由于英语有着几乎无限多的词汇,我们不可能创建包含所有词汇的词库。因而对于未包含在词库中的英语单词,通过“字素转换成音素(G2P)”算法自动生成其音标是一个最好的解决办法。为此,论文提出了一种动态有限泛化法(DFGA)的机器学习算法,用于进行字素/音素转换规则的学习。用于学习的词典库有27040个单词,其中90%的词用于规则学习,剩下的10%用于测试。经过10轮交叉验证,学习集和测试集的平均字素转换正确率为99.78%和93.14%,平均单词转换正确率为99.56%和73.51%。
-
关键词
语音合成
字素转换成音素
机器学习
有限泛化
-
Keywords
speech synthesis,G2P,machine learning,finite generalization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名英语语音合成中基于WordNet的多音词消歧算法
被引量:1
- 2
-
-
作者
王永生
李梅
-
机构
上海同济大学留德预备部
上海同济大学外国语学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2008年第26期138-140,共3页
-
文摘
英语中的多音词分成两类,一是因词性不同而读音不同,一是因词义不同而读音不同。前者只需经词性标注,根据其词性标记就可判别其正确的读音。而后者则复杂得多,论文采用了一种基于WordNet语义信息的多音词消歧算法,该算法将多音词的语义信息与上下文中词的语义信息进行匹配,根据匹配结果来判别多音词的读音。
-
关键词
多音词消歧
词义消歧
语音合成
-
Keywords
homograph disambiguation
word sense disambiguation
speech synthesis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名德语语音合成中的字音转换研究
被引量:1
- 3
-
-
作者
王永生
-
机构
上海同济大学留德预备部
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第35期132-134,共3页
-
基金
国家社会科学基金项目资助No.08CYY001~~
-
文摘
字音转换是德语语音合成系统不得不解决的难题。可以使用基于规则驱动的迭代有限状态转录机来解决这一问题。在该算法中,首先在一个词库的基础上制定一些字音转换规则,然后在此规则的基础上通过迭代有限状态转录机将德语单词中的所有字素转换成音素。经过对整个词库进行算法测试,单词的字音转换正确率可以达到94.4%。
-
关键词
德语语音合成
字音转换
有限状态转录机
-
Keywords
German speech synthesis
grapheme-to-phoneme conversion
finite state transducer
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名德语字素音素转换学习语料库的自动生成算法
- 4
-
-
作者
王永生
-
机构
上海同济大学留德预备部
-
出处
《计算机应用》
CSCD
北大核心
2008年第B06期7-9,共3页
-
基金
同济大学文科科研基金资助项目(1100219038)
-
文摘
提出了一种基于迭代的有限状态转录机的字素音素转换学习语料库的自动生成算法,针对一个德语单词及其音标进行基于形态规则和语音规则的迭代,最终将字素和音素完全一一对应起来。经过抽样测试,算法的正确率可以达到98.6%。
-
关键词
语音合成
字素音素转换
语料库
有限状态转录机
-
Keywords
speech synthesis
grapheme-to-phoneme conversion
corpus
finite state transducer
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-