期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于瓶颈特征的藏语拉萨话连续语音识别研究
被引量:
9
1
作者
周楠
赵悦
+3 位作者
李要嫱
徐晓娜
才旺拉姆
吴立成
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第2期249-254,共6页
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征...
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。
展开更多
关键词
藏语
拉萨话
连续语音识别
高斯混合–隐马尔科夫模型
瓶颈特征
深度神经网络
在线阅读
下载PDF
职称材料
藏语拉萨话大词表连续语音识别声学模型研究
被引量:
16
2
作者
李冠宇
孟猛
《计算机工程》
CAS
CSCD
2012年第5期189-191,共3页
根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语...
根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语音识别。实验结果表明,在最优情况下,该模型词错误率只有7.8%。
展开更多
关键词
藏语
拉萨话
连续语音识别
隐马尔可夫模型
HTK工具
声学模型
在线阅读
下载PDF
职称材料
基于决策树的藏语拉萨话三音子模型
被引量:
4
3
作者
李冠宇
于洪志
+1 位作者
李永宏
马宁
《计算机工程与科学》
CSCD
北大核心
2013年第9期146-150,共5页
对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个...
对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个关键问题和基本算法,结合国际音标分类和经验知识,确定了38个藏语拉萨话音子类别集及相应的决策树问题集。建立了共20个发音人8 170句的训练语料,在HTK平台上建立和训练得到了基于决策树的藏语拉萨话三音子模型,并分析了不同隐马尔可夫模型状态数及高斯混合度下的识别结果,确定了一套藏语大词表连续语音识别的完整方案。
展开更多
关键词
藏语
拉萨话
大词表连续语音识别
隐马尔可夫模型
三音子模型
在线阅读
下载PDF
职称材料
藏语拉萨话单音节嗓音声学参数分析
被引量:
2
4
作者
陈小莹
艾金勇
于洪志
《中文信息学报》
CSCD
北大核心
2015年第3期184-189,共6页
该文对藏语拉萨话单音节的嗓音特征进行了实验研究,实验首先对藏语拉萨话单音节进行语音标注,然后根据语音标注的位置信息,利用对应的程序提取音节结构中的元音和辅音的嗓音声学参数,对基频、开商和速度商分别统计分析,并做了显著性分...
该文对藏语拉萨话单音节的嗓音特征进行了实验研究,实验首先对藏语拉萨话单音节进行语音标注,然后根据语音标注的位置信息,利用对应的程序提取音节结构中的元音和辅音的嗓音声学参数,对基频、开商和速度商分别统计分析,并做了显著性分析。实验结果表明不同元音和辅音的嗓音参数与发声方式以及其在音节中位置有关,元音和音节结构的不同会显著影响开商和速度商的值,但对于基频数据的影响并不显著。同时嗓音参数之间也存在一定的关联性,即基频和开商、速度商之间是反比关系,开商和速度商之间是正比的关系。
展开更多
关键词
拉萨话
嗓音特征
基频
开商
速度商
在线阅读
下载PDF
职称材料
藏语口语语音语料库的设计与研究
被引量:
9
5
作者
黄晓辉
李京
马睿
《计算机工程与应用》
CSCD
北大核心
2018年第13期231-235,共5页
基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时,包含音素、半音节、...
基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时,包含音素、半音节、音节、藏文字以及语句共5层标注信息的藏语拉萨话口语语音语料库。统计结果显示,该语料库在保留口语语音自然属性的同时,对音素、半音节等常用语音建模单元也有均衡的覆盖,为基于藏语口语语音数据的语音识别技术研究提供了可靠的数据支撑。
展开更多
关键词
语音语料库
口语语音
语音识别
标注规范
藏语
拉萨话
在线阅读
下载PDF
职称材料
临近最优主动学习的藏语语音识别方法研究
被引量:
3
6
作者
赵悦
李要嫱
+1 位作者
徐晓娜
吴立成
《计算机工程与应用》
CSCD
北大核心
2018年第22期156-159,215,共5页
语音识别模型需要大量带标注语音语料进行训练,作为少数民族语言的藏语,由于语音标注专家十分匮乏,人工标注语音语料是一件非常费时费力的工作。然而,主动学习方法可以根据语音识别的目标从大量未标注的语音数据中挑选一些具有价值的样...
语音识别模型需要大量带标注语音语料进行训练,作为少数民族语言的藏语,由于语音标注专家十分匮乏,人工标注语音语料是一件非常费时费力的工作。然而,主动学习方法可以根据语音识别的目标从大量未标注的语音数据中挑选一些具有价值的样本交给用户进行标注,以便利用少量高质量的训练样本构建与大数据量训练方式一样精准的识别模型。研究了基于主动学习的藏语拉萨话语音语料选择方法,提出了一种临近最优的批量样本选择目标函数,并验证了其具有submodular函数性质。通过实验验证,该方法能够使用较少的训练数据保证语音识别模型的精度,从而减少了人工标注语料的工作量。
展开更多
关键词
临近最优批量主动学习
submodular函数
语音语料选择
藏语
拉萨话
语音识别
在线阅读
下载PDF
职称材料
题名
基于瓶颈特征的藏语拉萨话连续语音识别研究
被引量:
9
1
作者
周楠
赵悦
李要嫱
徐晓娜
才旺拉姆
吴立成
机构
中央民族大学信息工程学院
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第2期249-254,共6页
基金
教育部人文社会科学规划基金(15YJAZH120)
中央民族大学双一流学科建设项目资助
文摘
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。
关键词
藏语
拉萨话
连续语音识别
高斯混合–隐马尔科夫模型
瓶颈特征
深度神经网络
Keywords
Lhasa-Tibetan
continuous speech recognition
GMM-HMM
bottleneck features
deep neural network(DNN)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
藏语拉萨话大词表连续语音识别声学模型研究
被引量:
16
2
作者
李冠宇
孟猛
机构
西北民族大学中国民族信息技术研究院
中国科学院自动化研究所数字内容技术与系统研究中心
出处
《计算机工程》
CAS
CSCD
2012年第5期189-191,共3页
基金
国家自然科学基金资助项目(60970071)
中央高校基本科研业务费专项基金资助项目(zyz2011100
ycx11009)
文摘
根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语音识别。实验结果表明,在最优情况下,该模型词错误率只有7.8%。
关键词
藏语
拉萨话
连续语音识别
隐马尔可夫模型
HTK工具
声学模型
Keywords
Tibetan
Lhasa
continuous speech recognition
Hidden Markov Model(HMM)
Hidden Markov Model Toolkit(HTK)
acoustic model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于决策树的藏语拉萨话三音子模型
被引量:
4
3
作者
李冠宇
于洪志
李永宏
马宁
机构
西北民族大学中国民族语言文字教育部重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2013年第9期146-150,共5页
基金
国家自然科学基金资助项目(61262054)
西北民族大学中央高校基本科研业务费专项资金项目(zyz2011100)
文摘
对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个关键问题和基本算法,结合国际音标分类和经验知识,确定了38个藏语拉萨话音子类别集及相应的决策树问题集。建立了共20个发音人8 170句的训练语料,在HTK平台上建立和训练得到了基于决策树的藏语拉萨话三音子模型,并分析了不同隐马尔可夫模型状态数及高斯混合度下的识别结果,确定了一套藏语大词表连续语音识别的完整方案。
关键词
藏语
拉萨话
大词表连续语音识别
隐马尔可夫模型
三音子模型
Keywords
Tibetan
Lhasa dialect ~ LVCSR ~ HMM ~ triphone model
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
藏语拉萨话单音节嗓音声学参数分析
被引量:
2
4
作者
陈小莹
艾金勇
于洪志
机构
西藏民族学院信息工程学院
西藏民族学院图书馆
西北民族大学中国民族信息技术研究院
出处
《中文信息学报》
CSCD
北大核心
2015年第3期184-189,共6页
基金
西藏自治区专项资金项目(13BYY001)
中国民族语言文字信息技术实验室开放基金课题(2012KF013)
藏语方言的孤立词识别技术研究(11myz05)
文摘
该文对藏语拉萨话单音节的嗓音特征进行了实验研究,实验首先对藏语拉萨话单音节进行语音标注,然后根据语音标注的位置信息,利用对应的程序提取音节结构中的元音和辅音的嗓音声学参数,对基频、开商和速度商分别统计分析,并做了显著性分析。实验结果表明不同元音和辅音的嗓音参数与发声方式以及其在音节中位置有关,元音和音节结构的不同会显著影响开商和速度商的值,但对于基频数据的影响并不显著。同时嗓音参数之间也存在一定的关联性,即基频和开商、速度商之间是反比关系,开商和速度商之间是正比的关系。
关键词
拉萨话
嗓音特征
基频
开商
速度商
Keywords
Lhasa dialect
characteristic of phonation
F0
open quotient (OQ)
speed quotient (SQ)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
藏语口语语音语料库的设计与研究
被引量:
9
5
作者
黄晓辉
李京
马睿
机构
中国科学技术大学计算机科学与技术学院
解放军外国语学院工程系
中央民族大学藏学研究院
出处
《计算机工程与应用》
CSCD
北大核心
2018年第13期231-235,共5页
基金
国家重点研发计划项目(No.2016YFB0201402)
文摘
基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时,包含音素、半音节、音节、藏文字以及语句共5层标注信息的藏语拉萨话口语语音语料库。统计结果显示,该语料库在保留口语语音自然属性的同时,对音素、半音节等常用语音建模单元也有均衡的覆盖,为基于藏语口语语音数据的语音识别技术研究提供了可靠的数据支撑。
关键词
语音语料库
口语语音
语音识别
标注规范
藏语
拉萨话
Keywords
speech corpus
spoken speech
speech recognition
annotation standard
Tibetan Lhasa words
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
临近最优主动学习的藏语语音识别方法研究
被引量:
3
6
作者
赵悦
李要嫱
徐晓娜
吴立成
机构
中央民族大学信息工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2018年第22期156-159,215,共5页
基金
教育部人文社科规划项目(No.15YJAZH120)
文摘
语音识别模型需要大量带标注语音语料进行训练,作为少数民族语言的藏语,由于语音标注专家十分匮乏,人工标注语音语料是一件非常费时费力的工作。然而,主动学习方法可以根据语音识别的目标从大量未标注的语音数据中挑选一些具有价值的样本交给用户进行标注,以便利用少量高质量的训练样本构建与大数据量训练方式一样精准的识别模型。研究了基于主动学习的藏语拉萨话语音语料选择方法,提出了一种临近最优的批量样本选择目标函数,并验证了其具有submodular函数性质。通过实验验证,该方法能够使用较少的训练数据保证语音识别模型的精度,从而减少了人工标注语料的工作量。
关键词
临近最优批量主动学习
submodular函数
语音语料选择
藏语
拉萨话
语音识别
Keywords
near-optimal batch mode active learning
submodular function
speech corpus selection
Lhasa-Tibetan speech recognition
分类号
TP391.43 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于瓶颈特征的藏语拉萨话连续语音识别研究
周楠
赵悦
李要嫱
徐晓娜
才旺拉姆
吴立成
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018
9
在线阅读
下载PDF
职称材料
2
藏语拉萨话大词表连续语音识别声学模型研究
李冠宇
孟猛
《计算机工程》
CAS
CSCD
2012
16
在线阅读
下载PDF
职称材料
3
基于决策树的藏语拉萨话三音子模型
李冠宇
于洪志
李永宏
马宁
《计算机工程与科学》
CSCD
北大核心
2013
4
在线阅读
下载PDF
职称材料
4
藏语拉萨话单音节嗓音声学参数分析
陈小莹
艾金勇
于洪志
《中文信息学报》
CSCD
北大核心
2015
2
在线阅读
下载PDF
职称材料
5
藏语口语语音语料库的设计与研究
黄晓辉
李京
马睿
《计算机工程与应用》
CSCD
北大核心
2018
9
在线阅读
下载PDF
职称材料
6
临近最优主动学习的藏语语音识别方法研究
赵悦
李要嫱
徐晓娜
吴立成
《计算机工程与应用》
CSCD
北大核心
2018
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部