-
题名语音识别错误的分类分析
被引量:1
- 1
-
-
作者
付跃文
杜利民
-
机构
中国科学院声学研究所
-
出处
《计算机应用》
CSCD
北大核心
2005年第2期291-293,共3页
-
基金
国家 973计划项目(G1998030505)
-
文摘
大词表连续语音识别系统由多个组件构成,识别错误受多种因素的影响。系统开发者需要分析错误发生的不同原因。根据语音识别的基本理论给出了对错误进行分类分析的原理,将识别错误按错误原因分为解码错误、声学模型错误、语言模型错误、声学和语言复合错误四大类,并对分类后的错误做了统计分析。实验证明,识别错误的分类分析为系统的改进提供了参考依据。
-
关键词
大词表连续语音识别
识别错误
分类
-
Keywords
large vocabulary continuous speech recognition
recognition error
classification
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名基于决策树的藏语拉萨话三音子模型
被引量:4
- 2
-
-
作者
李冠宇
于洪志
李永宏
马宁
-
机构
西北民族大学中国民族语言文字教育部重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2013年第9期146-150,共5页
-
基金
国家自然科学基金资助项目(61262054)
西北民族大学中央高校基本科研业务费专项资金项目(zyz2011100)
-
文摘
对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个关键问题和基本算法,结合国际音标分类和经验知识,确定了38个藏语拉萨话音子类别集及相应的决策树问题集。建立了共20个发音人8 170句的训练语料,在HTK平台上建立和训练得到了基于决策树的藏语拉萨话三音子模型,并分析了不同隐马尔可夫模型状态数及高斯混合度下的识别结果,确定了一套藏语大词表连续语音识别的完整方案。
-
关键词
藏语
拉萨话
大词表连续语音识别
隐马尔可夫模型
三音子模型
-
Keywords
Tibetan
Lhasa dialect ~ LVCSR ~ HMM ~ triphone model
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-