检索结果-维普期刊中文期刊服务平台

基于瓶颈特征的藏语拉萨话连续语音识别研究被引量：9: 1; 作者周楠赵悦 +3 位作者李要嫱徐晓娜才旺拉姆吴立成《北京大学学报（自然科学版）》 EI CAS CSCD 北大核心 2018年第2期249-254,共6页; 基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征... 展开更多; 关键词藏语拉萨话连续语音识别高斯混合–隐马尔科夫模型瓶颈特征深度神经网络; 在线阅读下载PDF 职称材料

藏语拉萨话大词表连续语音识别声学模型研究被引量：16: 2; 作者李冠宇孟猛《计算机工程》 CAS CSCD 2012年第5期189-191,共3页; 根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语... 展开更多; 关键词藏语拉萨话连续语音识别隐马尔可夫模型 HTK工具声学模型; 在线阅读下载PDF 职称材料

基于决策树的藏语拉萨话三音子模型被引量：4: 3; 作者李冠宇于洪志 +1 位作者李永宏马宁《计算机工程与科学》 CSCD 北大核心 2013年第9期146-150,共5页; 对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个... 展开更多; 关键词藏语拉萨话大词表连续语音识别隐马尔可夫模型三音子模型; 在线阅读下载PDF 职称材料

藏语拉萨话单音节嗓音声学参数分析被引量：2: 4; 作者陈小莹艾金勇于洪志《中文信息学报》 CSCD 北大核心 2015年第3期184-189,共6页; 该文对藏语拉萨话单音节的嗓音特征进行了实验研究,实验首先对藏语拉萨话单音节进行语音标注,然后根据语音标注的位置信息,利用对应的程序提取音节结构中的元音和辅音的嗓音声学参数,对基频、开商和速度商分别统计分析,并做了显著性分... 展开更多; 关键词拉萨话嗓音特征基频开商速度商; 在线阅读下载PDF 职称材料

藏语口语语音语料库的设计与研究被引量：9: 5; 作者黄晓辉李京马睿《计算机工程与应用》 CSCD 北大核心 2018年第13期231-235,共5页; 基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时,包含音素、半音节、... 展开更多; 关键词语音语料库口语语音语音识别标注规范藏语拉萨话; 在线阅读下载PDF 职称材料

临近最优主动学习的藏语语音识别方法研究被引量：3: 6; 作者赵悦李要嫱 +1 位作者徐晓娜吴立成《计算机工程与应用》 CSCD 北大核心 2018年第22期156-159,215,共5页; 语音识别模型需要大量带标注语音语料进行训练,作为少数民族语言的藏语,由于语音标注专家十分匮乏,人工标注语音语料是一件非常费时费力的工作。然而,主动学习方法可以根据语音识别的目标从大量未标注的语音数据中挑选一些具有价值的样... 展开更多; 关键词临近最优批量主动学习 submodular函数语音语料选择藏语拉萨话语音识别; 在线阅读下载PDF 职称材料

题名基于瓶颈特征的藏语拉萨话连续语音识别研究被引量：9: 1; 作者周楠赵悦李要嫱徐晓娜才旺拉姆吴立成; 机构中央民族大学信息工程学院; 出处《北京大学学报（自然科学版）》 EI CAS CSCD 北大核心 2018年第2期249-254,共6页; 基金教育部人文社会科学规划基金(15YJAZH120) 中央民族大学双一流学科建设项目资助; 文摘基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。; 关键词藏语拉萨话连续语音识别高斯混合–隐马尔科夫模型瓶颈特征深度神经网络; Keywords Lhasa-Tibetan continuous speech recognition GMM-HMM bottleneck features deep neural network(DNN); 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名藏语拉萨话大词表连续语音识别声学模型研究被引量：16: 2; 作者李冠宇孟猛; 机构西北民族大学中国民族信息技术研究院中国科学院自动化研究所数字内容技术与系统研究中心; 出处《计算机工程》 CAS CSCD 2012年第5期189-191,共3页; 基金国家自然科学基金资助项目(60970071) 中央高校基本科研业务费专项基金资助项目(zyz2011100 ycx11009); 文摘根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语音识别。实验结果表明,在最优情况下,该模型词错误率只有7.8%。; 关键词藏语拉萨话连续语音识别隐马尔可夫模型 HTK工具声学模型; Keywords Tibetan Lhasa continuous speech recognition Hidden Markov Model（HMM） Hidden Markov Model Toolkit（HTK） acoustic model; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于决策树的藏语拉萨话三音子模型被引量：4: 3; 作者李冠宇于洪志李永宏马宁; 机构西北民族大学中国民族语言文字教育部重点实验室; 出处《计算机工程与科学》 CSCD 北大核心 2013年第9期146-150,共5页; 基金国家自然科学基金资助项目(61262054) 西北民族大学中央高校基本科研业务费专项资金项目(zyz2011100); 文摘对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个关键问题和基本算法,结合国际音标分类和经验知识,确定了38个藏语拉萨话音子类别集及相应的决策树问题集。建立了共20个发音人8 170句的训练语料,在HTK平台上建立和训练得到了基于决策树的藏语拉萨话三音子模型,并分析了不同隐马尔可夫模型状态数及高斯混合度下的识别结果,确定了一套藏语大词表连续语音识别的完整方案。; 关键词藏语拉萨话大词表连续语音识别隐马尔可夫模型三音子模型; Keywords Tibetan Lhasa dialect ~ LVCSR ~ HMM ~ triphone model; 分类号 TP391.4 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名藏语拉萨话单音节嗓音声学参数分析被引量：2: 4; 作者陈小莹艾金勇于洪志; 机构西藏民族学院信息工程学院西藏民族学院图书馆西北民族大学中国民族信息技术研究院; 出处《中文信息学报》 CSCD 北大核心 2015年第3期184-189,共6页; 基金西藏自治区专项资金项目(13BYY001) 中国民族语言文字信息技术实验室开放基金课题(2012KF013) 藏语方言的孤立词识别技术研究(11myz05); 文摘该文对藏语拉萨话单音节的嗓音特征进行了实验研究,实验首先对藏语拉萨话单音节进行语音标注,然后根据语音标注的位置信息,利用对应的程序提取音节结构中的元音和辅音的嗓音声学参数,对基频、开商和速度商分别统计分析,并做了显著性分析。实验结果表明不同元音和辅音的嗓音参数与发声方式以及其在音节中位置有关,元音和音节结构的不同会显著影响开商和速度商的值,但对于基频数据的影响并不显著。同时嗓音参数之间也存在一定的关联性,即基频和开商、速度商之间是反比关系,开商和速度商之间是正比的关系。; 关键词拉萨话嗓音特征基频开商速度商; Keywords Lhasa dialect characteristic of phonation F0 open quotient （OQ） speed quotient （SQ）; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名藏语口语语音语料库的设计与研究被引量：9: 5; 作者黄晓辉李京马睿; 机构中国科学技术大学计算机科学与技术学院解放军外国语学院工程系中央民族大学藏学研究院; 出处《计算机工程与应用》 CSCD 北大核心 2018年第13期231-235,共5页; 基金国家重点研发计划项目(No.2016YFB0201402); 文摘基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时,包含音素、半音节、音节、藏文字以及语句共5层标注信息的藏语拉萨话口语语音语料库。统计结果显示,该语料库在保留口语语音自然属性的同时,对音素、半音节等常用语音建模单元也有均衡的覆盖,为基于藏语口语语音数据的语音识别技术研究提供了可靠的数据支撑。; 关键词语音语料库口语语音语音识别标注规范藏语拉萨话; Keywords speech corpus spoken speech speech recognition annotation standard Tibetan Lhasa words; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名临近最优主动学习的藏语语音识别方法研究被引量：3: 6; 作者赵悦李要嫱徐晓娜吴立成; 机构中央民族大学信息工程学院; 出处《计算机工程与应用》 CSCD 北大核心 2018年第22期156-159,215,共5页; 基金教育部人文社科规划项目(No.15YJAZH120); 文摘语音识别模型需要大量带标注语音语料进行训练,作为少数民族语言的藏语,由于语音标注专家十分匮乏,人工标注语音语料是一件非常费时费力的工作。然而,主动学习方法可以根据语音识别的目标从大量未标注的语音数据中挑选一些具有价值的样本交给用户进行标注,以便利用少量高质量的训练样本构建与大数据量训练方式一样精准的识别模型。研究了基于主动学习的藏语拉萨话语音语料选择方法,提出了一种临近最优的批量样本选择目标函数,并验证了其具有submodular函数性质。通过实验验证,该方法能够使用较少的训练数据保证语音识别模型的精度,从而减少了人工标注语料的工作量。; 关键词临近最优批量主动学习 submodular函数语音语料选择藏语拉萨话语音识别; Keywords near-optimal batch mode active learning submodular function speech corpus selection Lhasa-Tibetan speech recognition; 分类号 TP391.43 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于瓶颈特征的藏语拉萨话连续语音识别研究	周楠赵悦李要嫱徐晓娜才旺拉姆吴立成	《北京大学学报（自然科学版）》 EI CAS CSCD 北大核心	2018	9	在线阅读下载PDF 职称材料
2	藏语拉萨话大词表连续语音识别声学模型研究	李冠宇孟猛	《计算机工程》 CAS CSCD	2012	16	在线阅读下载PDF 职称材料
3	基于决策树的藏语拉萨话三音子模型	李冠宇于洪志李永宏马宁	《计算机工程与科学》 CSCD 北大核心	2013	4	在线阅读下载PDF 职称材料
4	藏语拉萨话单音节嗓音声学参数分析	陈小莹艾金勇于洪志	《中文信息学报》 CSCD 北大核心	2015	2	在线阅读下载PDF 职称材料
5	藏语口语语音语料库的设计与研究	黄晓辉李京马睿	《计算机工程与应用》 CSCD 北大核心	2018	9	在线阅读下载PDF 职称材料
6	临近最优主动学习的藏语语音识别方法研究	赵悦李要嫱徐晓娜吴立成	《计算机工程与应用》 CSCD 北大核心	2018	3	在线阅读下载PDF 职称材料