期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
不同水平的普通话学习者单字调声调感知研究 被引量:7
1
作者 帕丽扎提·克依木 古力努尔·艾尔肯 +1 位作者 米吉提·阿不里米提 艾斯卡尔·艾木都拉 《声学技术》 CSCD 北大核心 2020年第1期61-68,共8页
首先采用实验语音学的理论和方法进行比较分析,进一步了解普通话学习者声调学习的情况,通过定量研究的方法,对两种不同水平(高级水平和初级水平)学习者的声调感知进行声学分析并对学习普通话过程中的语调掌握状况展开探讨。考察了20名... 首先采用实验语音学的理论和方法进行比较分析,进一步了解普通话学习者声调学习的情况,通过定量研究的方法,对两种不同水平(高级水平和初级水平)学习者的声调感知进行声学分析并对学习普通话过程中的语调掌握状况展开探讨。考察了20名不同水平学习者对普通话声调学习的感知情况。按学习者对汉语9个单元音的4个声调感知和12个复合元音的4个声调的单字调辨认,以及阳平-上声的区分实验数据,统计学习者的辨认准确率、各调类的偏误率和反应时间,最后利用SPSS数据分析软件从统计的角度进行了辨认准确率和反应时间的相关性分析,分别对声调感知的准确率和反应时间的显著性差异进行检验。 展开更多
关键词 普通话习得者 声调感知 单字调 偏误分析
在线阅读 下载PDF
基于深度神经网络的资源匮乏语言语音关键词检索 被引量:5
2
作者 张伟涛 米吉提·阿不里米提 +1 位作者 郑方 艾斯卡尔·艾木都拉 《现代电子技术》 2022年第11期68-72,共5页
资源匮乏语言语音信息检索研究比汉语、英语等大语言进展缓慢,需要大量预处理工作。神经网络模型在低资源环境下的高效建模能力给低资源语言信息处理工作带来便利。文中以维⁃哈等低资源语言为基础,通过一系列预处理过程获得了这些语言... 资源匮乏语言语音信息检索研究比汉语、英语等大语言进展缓慢,需要大量预处理工作。神经网络模型在低资源环境下的高效建模能力给低资源语言信息处理工作带来便利。文中以维⁃哈等低资源语言为基础,通过一系列预处理过程获得了这些语言的语音及文本资源,再利用高斯混合隐马尔可夫模型GMM⁃HMM、深度神经网络隐马尔可夫模型DNN⁃HMM等完成了关键词检索实验。实验结果表明,三音素下的DNN⁃HMM模型比GMM⁃HMM模型检索性能要好。维吾尔语的ATWV达到了0.368,MTWV达到了0.491,检索结果准确率达到了89.36%;哈萨克语的ATWV达到了0.382,MTWV达到了0.421,检索结果准确率达到了82.15%。 展开更多
关键词 语音关键词检索 维吾尔语 哈萨克语 深度神经网络 检索流程 声学模型
在线阅读 下载PDF
基于CNN-HMM和RNN的维吾尔语语音识别 被引量:4
3
作者 穆凯代姆罕·伊敏江 艾斯卡尔·艾木都拉 米吉提·阿不里米提 《现代电子技术》 2021年第11期172-176,共5页
神经网络模型的发展给资源匮乏语言的语音及语言信息处理带来新的机遇,基于神经网络的少数民族语言的语音识别系统效率及准确率比传统方法有了很大提高。对于大词汇量语音识别系统,适当选择声学模型和语言模型很重要。对较小的维吾尔语... 神经网络模型的发展给资源匮乏语言的语音及语言信息处理带来新的机遇,基于神经网络的少数民族语言的语音识别系统效率及准确率比传统方法有了很大提高。对于大词汇量语音识别系统,适当选择声学模型和语言模型很重要。对较小的维吾尔语语料库(THUYG公开语料库)进行了深入研究,采用Kaldi开源语音识别平台将深度的CNN-HMM作为声学模型,通过理论分析和对比实验,分别在N-gram和RNN两种语言模型上进行对比实验。实验结果表明,基于神经网络RNN语言模型的系统有更好的识别效果,提升了维吾尔语语音识别准确率,并将词错误率降到15.06%。 展开更多
关键词 语音识别 维吾尔语 声学模型 语言模型 CNN-HMM N-GRAM语言模型 循环神经网络 Kaldi
在线阅读 下载PDF
基于DNN-HMM和RNN的维吾尔语语音识别 被引量:4
4
作者 阿地力江·阿布都尼亚孜 米吉提·阿不里米提 艾斯卡尔·艾木都拉 《现代电子技术》 2021年第17期90-94,共5页
基于深层神经网络(DNN)的语音识别模型不仅在单个语言上表现出色,而且在多语言信息处理领域也表现出了优异的能力。随着语音数据量的增加,高斯混合模型(GMM)在有效提升大词汇量连续语音识别系统性能以及识别效果上被神经网络(NN)模型超... 基于深层神经网络(DNN)的语音识别模型不仅在单个语言上表现出色,而且在多语言信息处理领域也表现出了优异的能力。随着语音数据量的增加,高斯混合模型(GMM)在有效提升大词汇量连续语音识别系统性能以及识别效果上被神经网络(NN)模型超越。文中采用Kaldi开源语音识别平台,结合RNN语言模型和DNN模型的三种损失函数,即最大互信息量(MMI)、最小贝叶斯风险(sMBR)和最小因素错误率(MPE),在维吾尔语语料库(THUYG-20公开语料库)测试数据上分别取得了16.73%,16.55%和15.95%的词错误率。相比高斯混合模型的词错误率分别降低了2.88%,3.06%和3.66%。深层神经网络在资源匮乏的少数民族语言以及多语言信息处理上有更强的能力。 展开更多
关键词 维吾尔语语音识别 RNN语言模型 DNN-HMM 声学模型 判别式训练 损失函数 Kaldi
在线阅读 下载PDF
非汉语母语者的普通话元音和辅音感知研究 被引量:2
5
作者 古扎丽努尔·德力木拉提 古力努尔·艾尔肯 +1 位作者 米吉提·阿不里米提 艾斯卡尔·艾木都拉 《声学技术》 CSCD 北大核心 2020年第2期214-219,共6页
语音感知研究是语音学主要研究内容之一。为了解学习者对普通话元音和辅音的感知情况,并为汉语教学提供借鉴,拓宽言语学习模型的应用领域,减少教学的盲目性,根据第二语言习得理论模式,采用实验语音学和统计学的方法,设计辨认实验和区分... 语音感知研究是语音学主要研究内容之一。为了解学习者对普通话元音和辅音的感知情况,并为汉语教学提供借鉴,拓宽言语学习模型的应用领域,减少教学的盲目性,根据第二语言习得理论模式,采用实验语音学和统计学的方法,设计辨认实验和区分实验,分别对普通话水平处于高级和初级水平的20名维吾尔族大学生元音、塞音、擦音和塞擦音的感知情况进行研究。辨认实验考察学习者对元音和辅音的感知反应时间和感知准确率。在区分实验中,计算元音对的频谱距离,辅音对的频谱距离,以及它们的时长差异,对学习者的区分能力进行分析。实验结果显示高级水平学习者的感知元音和辅音的能力明显高于初级水平学习者。学习者对发音部位靠后的元音反应时间快且感知准确率高,对于发音部位靠前的元音反应时间较慢且感知准确率低,对塞擦音的辨认准确率高,对擦音的辨认准确度最低。元音对的频谱距离和辅音对的时长差异会影响到学习者的区分能力,但辅音对的频谱距离和区分情况不存在密切联系。 展开更多
关键词 辨认实验 区分实验 语音感知 频谱距离 时长差异
在线阅读 下载PDF
基于ResNeSt网络的音频欺骗检测 被引量:1
6
作者 何信 胡金瑶 +1 位作者 艾斯卡尔·艾木都拉 米吉提·阿不里米提 《现代电子技术》 2022年第23期88-92,共5页
目前最先进的语音合成和语音转换模型能够生成人耳无法区分的虚假语音,这对自动说话人验证(ASV)系统的安全构成巨大威胁。近年来,越来越多抗欺骗对策用于提高ASV系统的可靠性。然而,在实际使用中,在检测未知攻击时遇到困难,特别是,合成... 目前最先进的语音合成和语音转换模型能够生成人耳无法区分的虚假语音,这对自动说话人验证(ASV)系统的安全构成巨大威胁。近年来,越来越多抗欺骗对策用于提高ASV系统的可靠性。然而,在实际使用中,在检测未知攻击时遇到困难,特别是,合成语音欺骗算法的快速发展正在产生越来越强大的未知攻击。在这项工作中,由于ResNeSt网络模型在图像分类和检测任务中取得较好的成绩,因此构建了残差卷积神经网络的变体ResNeSt,使用时域二维特征转换、频域特征等各种特征提取方法(MFCC、LFCC、CQCC)来检测未知的合成语音欺骗攻击。实验结果表明,ResNeSt系统在ASV的逻辑评估集上达到了6.04%的等错误率(EER),相比ASVspoof2019的基线模型提高了25%的性能。 展开更多
关键词 自动说话人验证 ResNeSt模型 语音合成 语音转换 倒谱系数 EER 神经网络
在线阅读 下载PDF
维-哈-柯多语言词素切分集成环境研究 被引量:1
7
作者 穆凯代姆罕·伊敏江 沙尔旦尔·帕尔哈提 +1 位作者 艾斯卡尔·艾木都拉 米吉提·阿不里米提 《电视技术》 2020年第6期46-51,63,共7页
开发一个多语言统一用户界面的集成信息处理软件环境,对少数民族自然语言处理研究工作特别是派生类语言的文本及语音等信息处理带来了巨大便利。系统基于词-词素平行语料库,从语音、词素、词以及句子等多个层面出发,对3种派生类黏着性... 开发一个多语言统一用户界面的集成信息处理软件环境,对少数民族自然语言处理研究工作特别是派生类语言的文本及语音等信息处理带来了巨大便利。系统基于词-词素平行语料库,从语音、词素、词以及句子等多个层面出发,对3种派生类黏着性语言进行声学和形态分析层面的分析,将繁杂的归一化、单元切分等工作集成到一个工程内。系统在语言和功能上可扩展,可嵌入独立的统计模型,对维-哈-柯语的词素切分准确率分别达到96%、92%和88%。 展开更多
关键词 多语言 形态学 词素切分 词干提取
在线阅读 下载PDF
基于扇区化光波束切换的站址受限可见光通信覆盖方法 被引量:1
8
作者 丁举鹏 易芝玲 米吉提·阿不里米提 《光通信技术》 2023年第1期63-67,共5页
传统的静态朗伯和非朗伯光波束配置难以较好地解决发射器站址受限问题。针对单一发射器的应用场景,提出了一种基于扇区化光波束切换的信道站址受限可见光通信覆盖方法。该方法采用商业可用的倾斜非朗伯光波束,根据接收器在不同位置反馈... 传统的静态朗伯和非朗伯光波束配置难以较好地解决发射器站址受限问题。针对单一发射器的应用场景,提出了一种基于扇区化光波束切换的信道站址受限可见光通信覆盖方法。该方法采用商业可用的倾斜非朗伯光波束,根据接收器在不同位置反馈的状态信息,动态地确定能提供最佳覆盖信噪比的候选光波束,构建定向传输链路。仿真结果表明:在典型室内环境下,与传统静态朗伯光波束配置相比,该方法通过增加2个或3个候选扇区波束切换选项,接收器可分别获得4.48 dB、5.94 dB的平均信噪比增益。 展开更多
关键词 扇区化光波束 波束切换 站址资源受限 无线光通信
在线阅读 下载PDF
基于小样本学习的语音端点检测
9
作者 单蒙 米吉提·阿不里米提 艾斯卡尔·艾木都拉 《现代电子技术》 2022年第24期145-150,共6页
语音端点检测作为语音信号处理前端处理部分的一个重要环节,是各种语音任务的基础。基于深度神经网络的语音端点检测在数据支撑上需要对语音进行大量帧级别的标注,针对此问题,文中提出一种基于原型网络(ProtoNet)的小样本学习(Few⁃shot ... 语音端点检测作为语音信号处理前端处理部分的一个重要环节,是各种语音任务的基础。基于深度神经网络的语音端点检测在数据支撑上需要对语音进行大量帧级别的标注,针对此问题,文中提出一种基于原型网络(ProtoNet)的小样本学习(Few⁃shot Learning)的语音端点检测算法,进一步减少在语音端点检测算法过程中因帧级别数据标注带来的繁琐工作。该算法利用所给出的标签计算出一个分类中心,通过计算查询点到分类中心的距离将未给出标签的查询点归类到分类中心,得到一个原型中心;在测试集上,计算测试集中的查询点与原型中心的距离并进行测试。实验语料基于MUSAN语音库,使用该语音库自带的噪声库进行加噪。实验结果表明,在各种环境噪声下,基于小样本学习的语音端点检测算法的性能优于基于深度神经网络的语音端点检测算法,而且该算法能够显著减少语音端点检测算法的数据准备工作量与系统数据量。 展开更多
关键词 语音端点检测 原型网络 小样本学习 数据标注 语音信号处理 深度学习 结果分析
在线阅读 下载PDF
跨信道环境下语种识别方法的研究
10
作者 迪力扎提·伊力哈木 米吉提·阿不里米提 +1 位作者 郑方 艾斯卡尔·艾木都拉 《现代电子技术》 2022年第24期37-43,共7页
针对现有语种识别方法对跨信道环境下关注较少的问题进行研究,在实际应用场景中语音采集设备与传输信道差异使得语种识别性能急剧下降。为降低跨信道对识别性能的影响,文中提出一种基于注意力机制的BiLSTM语种识别方法,在特征提取阶段对... 针对现有语种识别方法对跨信道环境下关注较少的问题进行研究,在实际应用场景中语音采集设备与传输信道差异使得语种识别性能急剧下降。为降低跨信道对识别性能的影响,文中提出一种基于注意力机制的BiLSTM语种识别方法,在特征提取阶段对比MFCC、FBANK、LPCC等不同语音特征的识别效果。实验证明FBANK特征在跨信道环境下的识别效果更好,引入注意力机制能够关注跨信道语音片段中与语种相关的信息,忽略非语种信息。所提方法在东方语种识别竞赛两个跨信道数据集(AP19⁃OLR和AP20⁃OLR)上进行实验,通过与基线系统X⁃VECTOR等语种识别方法进行对比,得出所提方法在两个数据集上的等错误率(EER)降低3.48%和5.66%。实验结果表明,基于注意力机制的BiLSTM语种识别方法能够有效提高语种识别任务中的特征提取能力,并改善跨信道环境下的语种识别性能。 展开更多
关键词 语种识别 跨信道 特征提取 注意力机制 识别方法对比 BiLSTM模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部