期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
说话人自适应技术在维吾尔语语音识别中的应用研究 被引量:4
1
作者 努尔麦麦提.尤鲁瓦斯 张力文 吾守尔.斯拉木 《中文信息学报》 CSCD 北大核心 2016年第3期79-84,共6页
该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较为常用的MLLR和MAP以及MLLR和MAP相结合的自适应方法应用于维吾尔语连续语音识别的声学模型训练中,并用这... 该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较为常用的MLLR和MAP以及MLLR和MAP相结合的自适应方法应用于维吾尔语连续语音识别的声学模型训练中,并用这三种方法自适应后的声学模型分别在测试集上进行识别实验。实验结果表明MLLR、MAP以及MAP+MLLR自适应方法使基线识别系统的单词错误识别率分别降低了0.6%、2.34%和2.57%。 展开更多
关键词 维吾尔语 语音识别 说话人自适应 MLLR MAP
在线阅读 下载PDF
面向大词汇量的维吾尔语连续语音识别研究 被引量:7
2
作者 努尔麦麦提.尤鲁瓦斯 吾守尔.斯拉木 《计算机工程与应用》 CSCD 2013年第9期115-119,共5页
近年来大词汇量连续语音识别技术得到了迅速的发展,国内外研究机构加大了对汉语和英语语音识别技术的研究,然而,维吾尔语语音识别技术的研究工作最近才起步。建立了面向大词汇量的维吾尔语语音语料库,研究了维吾尔语声学模型和语言模型... 近年来大词汇量连续语音识别技术得到了迅速的发展,国内外研究机构加大了对汉语和英语语音识别技术的研究,然而,维吾尔语语音识别技术的研究工作最近才起步。建立了面向大词汇量的维吾尔语语音语料库,研究了维吾尔语声学模型和语言模型建模技术、解码技术,进行了面向大词汇量的维吾尔语连续语音识别实验。对维吾尔语大词汇量连续语音识别技术进一步发展中存在的问题进行了讨论。 展开更多
关键词 维吾尔语 语音语料库 大词汇 识别技术
在线阅读 下载PDF
维吾尔语大词汇语音识别系统识别单元研究 被引量:4
3
作者 努尔麦麦提.尤鲁瓦斯 吾守尔.斯拉木 热依曼.吐尔逊 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期149-152,共4页
维吾尔语是一种黏着语,单词不太适合作为维吾尔语大词汇连续语音识别系统识别单元。针对维吾尔语大词汇连续语音识别系统中的识别单元选择问题,设计更适合维吾尔语的子词识别单元,提出维吾尔语单词和子词相结合的组合识别单元构建方法,... 维吾尔语是一种黏着语,单词不太适合作为维吾尔语大词汇连续语音识别系统识别单元。针对维吾尔语大词汇连续语音识别系统中的识别单元选择问题,设计更适合维吾尔语的子词识别单元,提出维吾尔语单词和子词相结合的组合识别单元构建方法,并对单词、子词和组合识别单元的语言模型和语音识别性能进行评价。实验结果表明,所提出的识别单元在单元数量、语言模型复杂度等方面表现出更加优越的性能,并且使识别系统的单词错误率比基于单词的系统相对减少22%。 展开更多
关键词 维吾尔语 大词汇 语音识别 识别单元
在线阅读 下载PDF
维吾尔语连续语音识别声学模型优化研究 被引量:4
4
作者 努尔麦麦提.尤鲁瓦斯 吾守尔.斯拉木 《计算机工程与应用》 CSCD 2013年第2期145-147,共3页
综合了语音识别中常用的高斯混合模型和人工神经网络框架优点的Tandem特征提取方法应用于维吾尔语声学模型训练中,经过一系列后续处理,将原始的MFCC特征转化为Tandem特征,以此作为基于隐马尔可夫统计模型的语音识别系统的输入,并使用最... 综合了语音识别中常用的高斯混合模型和人工神经网络框架优点的Tandem特征提取方法应用于维吾尔语声学模型训练中,经过一系列后续处理,将原始的MFCC特征转化为Tandem特征,以此作为基于隐马尔可夫统计模型的语音识别系统的输入,并使用最小音素错误区分性训练准则训练声学模型,进而完成在测试集上的识别实验。实验结果显示,Tandem区分性训练方法使识别系统的单词错误率比原先的基于最大似然估计准则的系统相对减少13%。 展开更多
关键词 维吾尔语 语音识别 最小音素错误 Tandem特征
在线阅读 下载PDF
维吾尔语的重音检测 被引量:1
5
作者 金惠琴 努尔麦麦提.尤鲁瓦斯 +1 位作者 吾守尔.斯拉木 王辉 《计算机工程与应用》 CSCD 2014年第9期197-199,213,共4页
根据维吾尔语词重音的位置规律进行音节级标注,提取不同的特征参数(能量、基频等),对各个特征参数作单流、分流及特征级融合识别实验,对比分析各特征参数对重音检测识别率的影响。对融合后的高维单流特征采用主成分分析作降维、去冗余处... 根据维吾尔语词重音的位置规律进行音节级标注,提取不同的特征参数(能量、基频等),对各个特征参数作单流、分流及特征级融合识别实验,对比分析各特征参数对重音检测识别率的影响。对融合后的高维单流特征采用主成分分析作降维、去冗余处理,并作识别实验。参照识别精确率结合语音语言学知识对实验结果进行分析。 展开更多
关键词 维吾尔语 重音检测 特征融合 主成分分析
在线阅读 下载PDF
维吾尔语语音检索技术研究 被引量:3
6
作者 张力文 努尔麦麦提.尤鲁瓦斯 吾守尔.斯拉木 《中文信息学报》 CSCD 北大核心 2014年第5期182-186,197,共6页
随着大数据时代的到来,各种音频、视频文件日益增多,如何高效地定位关键敏感信息具有非常重要的研究意义。目前研究人员对针对英语和汉语的语音检索技术进行了深入的研究,而针对维吾尔语的语音检索技术还处于起步阶段。该文对维吾尔语... 随着大数据时代的到来,各种音频、视频文件日益增多,如何高效地定位关键敏感信息具有非常重要的研究意义。目前研究人员对针对英语和汉语的语音检索技术进行了深入的研究,而针对维吾尔语的语音检索技术还处于起步阶段。该文对维吾尔语语音关键词检索技术进行了研究并采用了大词汇量连续语音识别、利用聚类算法将多候选词图转换为混淆网络、倒排索引、置信度以及相关度的计算等技术和方法,对维吾尔语语音检索系统进行了研究与搭建。最后在测试集上对该系统进行测试,测试结果显示,在语音识别正确率为82.1%的情况下,检索系统的召回率分别达到97.0%和79.1%时,虚警率分别为13.5%和8.5%。 展开更多
关键词 维吾尔语 语音检索 语音识别 词图 混淆网络 倒排索引
在线阅读 下载PDF
关于维吾尔语口语语料的三音子选取方法研究 被引量:2
7
作者 徐宝龙 努尔麦麦提.尤鲁瓦斯 吾守尔.斯拉木 《中文信息学报》 CSCD 北大核心 2015年第2期118-124,共7页
在大词汇量连续语音识别应用中,优质的语音训练语料是所有识别工作的基础和前提,能否挑选出覆盖更多语音现象的语料是提高语音识别性能的关键。该文在多种维吾尔文口语化传播平台中采集了大量口语句子语料,并考虑协同发音的影响和常用... 在大词汇量连续语音识别应用中,优质的语音训练语料是所有识别工作的基础和前提,能否挑选出覆盖更多语音现象的语料是提高语音识别性能的关键。该文在多种维吾尔文口语化传播平台中采集了大量口语句子语料,并考虑协同发音的影响和常用词的适用性,根据评估函数对语料筛选。经过筛选后的语料包含的三音子更加均衡和高效,囊括的语音现象更加全面,为训练准确而牢靠的语音模型打下了稳固的根基。 展开更多
关键词 维吾尔语 语音识别 语料库 三音子
在线阅读 下载PDF
哈萨克语元音格局研究 被引量:1
8
作者 达吾勒.阿布都哈依尔 努尔麦麦提.尤鲁瓦斯 刘艳 《中文信息学报》 CSCD 北大核心 2018年第7期52-57,共6页
由于哈萨克语构词法的特点,九个元音的声频特性在语音识别中具有重要的作用。该文采用实验语音学的基本理论和方法,研究了哈萨克语多音节词中的元音格局。针对从语音库中挑选的1 062个多音节词,分别对其词首、词腹和词尾音节中的元音共... 由于哈萨克语构词法的特点,九个元音的声频特性在语音识别中具有重要的作用。该文采用实验语音学的基本理论和方法,研究了哈萨克语多音节词中的元音格局。针对从语音库中挑选的1 062个多音节词,分别对其词首、词腹和词尾音节中的元音共振峰频率值进行统计,并采用Joos方法详细地归纳和分析了哈萨克语词首、词腹和词尾音节元音格局以及存在的差异,绘制出了哈萨克语多音节词元音的共振峰模式。该项研究结果对哈萨克语的语音研究及应用具有较高的参考价值。 展开更多
关键词 哈萨克语 多音节词 共振峰 元音格局
在线阅读 下载PDF
维吾尔语音素的声学特征分析 被引量:1
9
作者 王辉 努尔麦麦提.尤鲁瓦斯 吾守尔.斯拉木 《中文信息学报》 CSCD 北大核心 2014年第1期100-106,共7页
该文对不同语速下,人工标注的维吾尔语连续语音语料中各音素进行共振峰频率、音长、音强的统计分析,并完成辅—元结构下的塞音、塞擦音的声学特征分析。该文通过美尔频率倒谱系数与共振峰频率等声学特征的融合及模型状态数的修改,对维... 该文对不同语速下,人工标注的维吾尔语连续语音语料中各音素进行共振峰频率、音长、音强的统计分析,并完成辅—元结构下的塞音、塞擦音的声学特征分析。该文通过美尔频率倒谱系数与共振峰频率等声学特征的融合及模型状态数的修改,对维吾尔语音素识别的声学模型进行了改进,并验证了不同声学特征对音素识别的影响。相比于基线系统,改进后声学模型的识别率取得一定提升。同时,利用语音学知识分析维吾尔语易混淆音素产生原因,为音素识别声学模型的进一步改进提供参考依据。 展开更多
关键词 维吾尔语 声学特征 特征融合 语速
在线阅读 下载PDF
RNN编码器-解码器在维汉机器翻译中的应用 被引量:9
10
作者 帕丽旦.木合塔尔 吾守尔.斯拉木 +1 位作者 买买提阿依甫 努尔麦麦提.尤鲁瓦斯 《计算机工程与应用》 CSCD 北大核心 2018年第15期235-240,共6页
将RNN编码器-解码器作为传统的基于短语的PSMT系统的一部分,在传统统计机器翻译基础上,集成RNN解码器-编码器,兼容PSMT创建了新联合模型(RNN+PSMT)。新的模型不仅在维-汉、汉-英机器翻译的应用中取得了成效,而且能够捕捉到语言的规律,... 将RNN编码器-解码器作为传统的基于短语的PSMT系统的一部分,在传统统计机器翻译基础上,集成RNN解码器-编码器,兼容PSMT创建了新联合模型(RNN+PSMT)。新的模型不仅在维-汉、汉-英机器翻译的应用中取得了成效,而且能够捕捉到语言的规律,使得机器翻译中的一个重要评价指标的BLEU值得到了显著提高。实验结果表明,系统的整体性能超过了传统统计机器翻译。 展开更多
关键词 统计机器翻译 神经网络 RNN编码器-解码器 长短时记忆 维吾尔语
在线阅读 下载PDF
基于N元模型的维吾尔文文本分类技术研究 被引量:6
11
作者 买买提依明.哈斯木 吾守尔.斯拉木 +1 位作者 维尼拉.木沙江 努尔麦麦提.尤鲁瓦斯 《计算机应用研究》 CSCD 北大核心 2015年第7期1986-1988,2004,共4页
考虑到维吾尔文词干提取、词性标注等工具不够成熟和相关的开源资源很少的实际情况,提出了基于N元模型的维吾尔文文本分类技术。其特点是不需要任何自然语言处理工具,拼写错误率对分类结果的影响很低。在训练阶段分别提取字符级别的三... 考虑到维吾尔文词干提取、词性标注等工具不够成熟和相关的开源资源很少的实际情况,提出了基于N元模型的维吾尔文文本分类技术。其特点是不需要任何自然语言处理工具,拼写错误率对分类结果的影响很低。在训练阶段分别提取字符级别的三元和四元模型构造不同规模的N元词典,在分类测试阶段分别用曼哈顿距离计算和骰子测量对文本进行分类。实验结果表明,当四元模型词典的规模为500时,使用骰子测量分类时性能最佳,平准准确率达到86.56%。 展开更多
关键词 N元 文本分类 维吾尔文 N元词典 相似度 曼哈顿距离 骰子测量
在线阅读 下载PDF
基于统计专用字符的维、哈、柯文文种识别研究 被引量:5
12
作者 买买提依明.哈斯木 吾守尔.斯拉木 +1 位作者 维尼拉.木沙江 努尔麦麦提.尤鲁瓦斯 《中文信息学报》 CSCD 北大核心 2015年第2期111-117,共7页
在Unicode编码方案中维、哈、柯文字符安排在阿拉伯字符区域,三种语言中共享字符比较多,跟阿拉伯字符区域混在一起,没有专用的语言ID。在信息检索和自然语言处理领域对维、哈、柯文的识别、处理带来不便。该文首先分析并总结了维、哈、... 在Unicode编码方案中维、哈、柯文字符安排在阿拉伯字符区域,三种语言中共享字符比较多,跟阿拉伯字符区域混在一起,没有专用的语言ID。在信息检索和自然语言处理领域对维、哈、柯文的识别、处理带来不便。该文首先分析并总结了维、哈、柯文三种语言中的专用字符、复合字符、某些字符在某种语言中出现形势的独特性等特征,然后在此基础上设计了维、哈、柯文种识别算法。实验结果表明该文提出的文种识别算法的正确率在文本多于70词时达到96.67%以上。 展开更多
关键词 文种识别 专用字符 复合字符 维文 哈文 柯文 UNICODE
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部