-
题名基于隐马尔科夫模型的中文发音动作参数预测方法
被引量:5
- 1
-
-
作者
蔡明琦
凌震华
戴礼荣
-
机构
中国科学技术大学电子工程与信息科学系
-
出处
《数据采集与处理》
CSCD
北大核心
2014年第2期204-210,共7页
-
基金
国家自然科学基金青年基金(60905010)资助项目
-
文摘
发音动作参数描述发音过程中唇、舌、颚等发音器官的位置与运动。本文对给定文本与语音情况下中文发音动作参数的预测方法进行了研究。首先,设计并实现了基于电磁发音仪的发音动作参数采集与预处理方法,通过头部运动规整与咬合面规整保证了发音动作参数的可靠性;其次,将隐马尔科夫模型应用于中文发音动作参数预测,采用包含声学参数与发音动作参数的双流模型结构实现从声学参数到发音动作参数的映射,并且分析对比了建模过程中不同上下文属性、模型聚类方式以及流间相关性假设对于中文发音动作参数预测性能的影响。实验结果表明,当采用三音素模型、双流独立聚类并且考虑流间相关性的情况下,可以获得最优的预测性能。
-
关键词
隐马尔科夫模型
发音器官
电磁发音仪
发音动作参数
-
Keywords
hidden Markov model (HMM)
articulatory organ
electromagnetic articulography (EMA)
articulatory features
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名普通话双模态情感语音数据库的设计与评价
被引量:1
- 2
-
-
作者
任国凤
张雪英
李东
闫建政
-
机构
太原理工大学信息工程学院
忻州师范学院电子系
-
出处
《现代电子技术》
北大核心
2018年第14期182-186,共5页
-
基金
国家自然科学基金(61371193)
山西省研究生创新基金(2015BY24)
山西省教育改革创新项目(J2016097)~~
-
文摘
针对包含发音动作参数和情感语音的双模态汉语普通话数据库非常匮乏的问题,设计包含中性、高兴、愤怒及悲伤4种情感的普通话语音库。该语音库由10名被试录制的1 440段音频及发音动作数据组成,文本长度有双音节词和句子两种类型。为了确保该数据库的有效性,邀请普通话较好、听力正常的10名评价者组成评价小组,对数据库内所有音频文件进行评价。根据评价小组评价结果结合发音动作数据的稳定性进行筛选,得到语音质量较好、发音动作参数稳定的双模态情感语音数据库。该数据库可用于开展情感语音的发音动作研究,进而单独或联合作为情感语音识别算法的样本数据,对情感语音识别率的提高具有积极的作用。
-
关键词
数据库
情感语音
发音动作参数
汉语普通话
信号处理
普通话语音库
-
Keywords
database
emotional speech
pronunciation action parameter
Chinese Mandarin
signal processing
Mandarinspeech corpus
-
分类号
TN912.34
[电子电信—通信与信息系统]
-