-
题名基于DNN-HMM的蒙古语声学模型结构实验研究
被引量:2
- 1
-
-
作者
李晋益
马志强
刘志强
朱方圆
王洪彬
-
机构
内蒙古工业大学数据科学与应用学院
内蒙古自治区基于大数据的软件服务工程技术研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2023年第8期52-65,共14页
-
基金
国家自然科学基金(61762070,62166029)
内蒙古自然科学基金(2019MS06004)
+3 种基金
内蒙古自治区科技重大专项(2019ZD015)
内蒙古自治区关键技术攻关计划项目(2019GG273)
内蒙古自治区科技成果转化专项资金项目(2020CG0073)
内蒙古自治区研究生科研创新项目(SZ2020073)。
-
文摘
DNN-HMM作为语音识别中的一种混合建模技术,由深度神经网络和隐马尔可夫模型组成。在使用蒙古语语料库构建DNN-HMM声学模型的过程中,为了研究DNN-HMM结构对蒙古语声学建模的影响以及蒙古语语料库规模与DNN-HMM声学模型结构的关系,通过设计DNN-HMM声学模型中DNN的结构,该文提出Rectangle DNN-HMM、Trapezoid DNN-HMM、Polygon DNN-HMM和Hourglass DNN-HMM四种结构的DNNHMM声学模型,并以Kaldi实验平台为基础进行实验,选取音素作为建模单元,使用三种规模的蒙古语语料库分别构建四种结构的DNN-HMM声学模型。深度结构和宽度结构实验结果表明,深度为6层的Polygon DNNHMM结构适合蒙古语声学模型建模;随着语料库规模的增大,通过适当增加声学模型的宽度,可以使声学模型的每一层都能学习到更丰富的语音特征,提高语音识别的准确率。
-
关键词
DNN-HMM
声学模型
深度神经网络
蒙古语声学模型
-
Keywords
DNN-HMM
acoustic model
deep neural network
Mongolian acoustic model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于端到端的蒙古语异形同音词声学建模方法
被引量:1
- 2
-
-
作者
陈艳
李图雅
马志强
谢秀兰
王洪彬
-
机构
内蒙古工业大学数据科学与应用学院
内蒙古工业大学内蒙古自治区基于大数据的软件服务工程技术研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2022年第3期27-35,共9页
-
基金
国家自然科学基金(61762070,61862048)
内蒙古自治区自然科学基金(2019MS06004)
+1 种基金
内蒙古自治区科技重大专项(2019ZD015)
内蒙古自治区关键技术攻关计划项目(2019GG273)。
-
文摘
蒙古语声学模型的训练过程是模型学习发音数据与标注数据之间关系的一个过程。针对以音素为建模粒子的蒙古语声学模型建模,由于蒙古语词的发音与语义存在一对多映射现象,会造成解码出的蒙古语文本错误,进而导致蒙古语语音识别系统识别率降低的问题。对此,该文以端到端模型为基础,以蒙古语音素、字母为蒙古语声学模型建模粒子,设计了基于BLSTM-CTC的蒙古语声学模型,并给出了动量训练算法。实验结果表明,基于蒙古语字母的BLSTM-CTC蒙古语声学模型可以有效降低蒙古语语音识别系统中异形同音词的词错率。
-
关键词
异形同音词
建模粒子
端到端
蒙古语声学模型
语音识别
-
Keywords
heteromorphic homophone
modeling unit
End-to-End
Mongolian acoustic model
speech recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-