期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于DNN-HMM的蒙古语声学模型结构实验研究 被引量:2
1
作者 李晋益 马志强 +2 位作者 刘志强 朱方圆 王洪彬 《中文信息学报》 CSCD 北大核心 2023年第8期52-65,共14页
DNN-HMM作为语音识别中的一种混合建模技术,由深度神经网络和隐马尔可夫模型组成。在使用蒙古语语料库构建DNN-HMM声学模型的过程中,为了研究DNN-HMM结构对蒙古语声学建模的影响以及蒙古语语料库规模与DNN-HMM声学模型结构的关系,通过设... DNN-HMM作为语音识别中的一种混合建模技术,由深度神经网络和隐马尔可夫模型组成。在使用蒙古语语料库构建DNN-HMM声学模型的过程中,为了研究DNN-HMM结构对蒙古语声学建模的影响以及蒙古语语料库规模与DNN-HMM声学模型结构的关系,通过设计DNN-HMM声学模型中DNN的结构,该文提出Rectangle DNN-HMM、Trapezoid DNN-HMM、Polygon DNN-HMM和Hourglass DNN-HMM四种结构的DNNHMM声学模型,并以Kaldi实验平台为基础进行实验,选取音素作为建模单元,使用三种规模的蒙古语语料库分别构建四种结构的DNN-HMM声学模型。深度结构和宽度结构实验结果表明,深度为6层的Polygon DNNHMM结构适合蒙古语声学模型建模;随着语料库规模的增大,通过适当增加声学模型的宽度,可以使声学模型的每一层都能学习到更丰富的语音特征,提高语音识别的准确率。 展开更多
关键词 DNN-HMM 模型 深度神经网络 蒙古语声学模型
在线阅读 下载PDF
基于端到端的蒙古语异形同音词声学建模方法 被引量:1
2
作者 陈艳 李图雅 +2 位作者 马志强 谢秀兰 王洪彬 《中文信息学报》 CSCD 北大核心 2022年第3期27-35,共9页
蒙古语声学模型的训练过程是模型学习发音数据与标注数据之间关系的一个过程。针对以音素为建模粒子的蒙古语声学模型建模,由于蒙古语词的发音与语义存在一对多映射现象,会造成解码出的蒙古语文本错误,进而导致蒙古语语音识别系统识别... 蒙古语声学模型的训练过程是模型学习发音数据与标注数据之间关系的一个过程。针对以音素为建模粒子的蒙古语声学模型建模,由于蒙古语词的发音与语义存在一对多映射现象,会造成解码出的蒙古语文本错误,进而导致蒙古语语音识别系统识别率降低的问题。对此,该文以端到端模型为基础,以蒙古语音素、字母为蒙古语声学模型建模粒子,设计了基于BLSTM-CTC的蒙古语声学模型,并给出了动量训练算法。实验结果表明,基于蒙古语字母的BLSTM-CTC蒙古语声学模型可以有效降低蒙古语语音识别系统中异形同音词的词错率。 展开更多
关键词 异形同音词 建模粒子 端到端 蒙古语声学模型 语音识别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部