检索结果-维普期刊中文期刊服务平台

基于改进Conformer的新闻领域端到端语音识别被引量：4: 1; 作者张济民早克热·卡德尔 +2 位作者艾山·吾买尔申云飞汪烈军《中文信息学报》 CSCD 北大核心 2024年第4期156-164,共9页; 目前,开源的中文语音识别数据集大多面向通用领域,缺少面向新闻领域的开源语音识别语料库,因此该文构建了面向新闻领域的中文语音识别数据集CH_NEWS_ASR,并使用ESPNET-0.9.6框架的RNN、Transformer和Conformer等模型对数据集的有效性进... 展开更多; 关键词端到端语音识别 CONFORMER 句子层级一致性; 在线阅读下载PDF 职称材料

基于Conformer的端到端语音识别模型的压缩优化策略被引量：2: 2; 作者桑江坤努尔麦麦提·尤鲁瓦斯《信号处理》 CSCD 北大核心 2022年第12期2639-2649,共11页; 随着深度学习的兴起,端到端语音识别模型受到越来越多的关注。最近,基于Conformer框架的提出,使得端到端语音识别模型的性能得到进一步的提升,同时在语音识别领域也得到了广泛的应用。然而,这些端到端模型由于内存和计算需求较大,所以... 展开更多; 关键词深度学习端到端语音识别 CONFORMER 量化剪枝分解; 在线阅读下载PDF 职称材料

TCN-Transformer-CTC的端到端语音识别被引量：21: 3; 作者谢旭康陈戈 +1 位作者孙俊陈祺东《计算机应用研究》 CSCD 北大核心 2022年第3期699-703,共5页; 基于Transformer的端到端语音识别系统获得广泛的普及,但Transformer中的多头自注意力机制对输入序列的位置信息不敏感,同时它灵活的对齐方式在面对带噪语音时泛化性能较差。针对以上问题,首先提出使用时序卷积神经网络(TCN)来加强神经... 展开更多; 关键词端到端语音识别 TRANSFORMER 时序卷积神经网络连接时序分类; 在线阅读下载PDF 职称材料

基于分解门控注意力单元的高效Conformer模型被引量：1: 4; 作者李宜亭屈丹 +2 位作者杨绪魁张昊沈小龙《计算机工程》 CAS CSCD 北大核心 2023年第5期73-80,共8页; 为利用有限的存储和计算资源,在保证Conformer端到端语音识别模型精度的前提下,减少模型参数量并加快训练和识别速度,构建一个基于分解门控注意力单元与低秩分解的高效Conformer模型。在前馈和卷积模块中,通过低秩分解进行计算加速,提高... 展开更多; 关键词端到端语音识别 Conformer模型分解门控注意力单元模型压缩低秩分解; 在线阅读下载PDF 职称材料

题名基于改进Conformer的新闻领域端到端语音识别被引量：4: 1; 作者张济民早克热·卡德尔艾山·吾买尔申云飞汪烈军; 机构新疆大学信息科学与工程学院新疆大学新疆多语种信息技术实验室新疆大学软件学院; 出处《中文信息学报》 CSCD 北大核心 2024年第4期156-164,共9页; 基金新疆维吾尔自治区科技创新领军人才项目——高层次领军人才(2022TSYCLJ0036)。; 文摘目前,开源的中文语音识别数据集大多面向通用领域,缺少面向新闻领域的开源语音识别语料库,因此该文构建了面向新闻领域的中文语音识别数据集CH_NEWS_ASR,并使用ESPNET-0.9.6框架的RNN、Transformer和Conformer等模型对数据集的有效性进行了验证,实验表明,该文所构建的语料在最好的模型上CER为4.8%,SER为39.4%。由于新闻联播主持人说话语速相对较快,该文构建的数据集文本平均长度为28个字符,是Aishell_1数据集文本平均长度的2倍;且以往的研究中训练目标函数通常为基于字或词水平,缺乏明确的句子水平关系,因此该文提出了一个句子层级的一致性模块,与Conformer模型结合,直接减少源语音和目标文本的表示差异,在开源的Aishell_1数据集上其CER降低0.4%,SER降低2%;在CH_NEWS_ASR数据集上其CER降低0.9%,SER降低3%,实验结果表明,该方法在不增加模型参数量的前提下能有效提升语音识别的质量。; 关键词端到端语音识别 CONFORMER 句子层级一致性; Keywords end-to-end speech recognition conformer sentence-level agreement; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于Conformer的端到端语音识别模型的压缩优化策略被引量：2: 2; 作者桑江坤努尔麦麦提·尤鲁瓦斯; 机构新疆大学信息科学与工程学院新疆多语种信息技术实验室; 出处《信号处理》 CSCD 北大核心 2022年第12期2639-2649,共11页; 基金国家自然科学基金(62066043)。; 文摘随着深度学习的兴起,端到端语音识别模型受到越来越多的关注。最近,基于Conformer框架的提出,使得端到端语音识别模型的性能得到进一步的提升,同时在语音识别领域也得到了广泛的应用。然而,这些端到端模型由于内存和计算需求较大,所以在资源有限的设备上部署和推理是受限的。该文为了保证模型精度损失较小的情况下,尽可能地减少模型的大小和计算量,分别采用了模型量化,基于权重通道的结构化剪枝以及奇异值分解等三种压缩优化策略,同时对模型量化进行了改进。探究了不同程度的压缩对模型精度损失所造成的影响。通过结合这些策略在不同设备进行了测试,相比于基线在其字错误率误差小于3%的情况下,模型推理识别的速度约提升3~4倍。; 关键词深度学习端到端语音识别 CONFORMER 量化剪枝分解; Keywords deep learning end-to-end speech recognition Conformer quantization pruning decomposition; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名TCN-Transformer-CTC的端到端语音识别被引量：21: 3; 作者谢旭康陈戈孙俊陈祺东; 机构江南大学人工智能与计算机学院; 出处《计算机应用研究》 CSCD 北大核心 2022年第3期699-703,共5页; 基金国家自然科学基金面上项目(61672263)。; 文摘基于Transformer的端到端语音识别系统获得广泛的普及,但Transformer中的多头自注意力机制对输入序列的位置信息不敏感,同时它灵活的对齐方式在面对带噪语音时泛化性能较差。针对以上问题,首先提出使用时序卷积神经网络(TCN)来加强神经网络模型对位置信息的捕捉,其次在上述基础上融合连接时序分类(CTC),提出TCN-Transformer-CTC模型。在不使用任何语言模型的情况下,在中文普通话开源语音数据库AISHELL-1上的实验结果表明,TCN-Transformer-CTC相较于Transformer字错误率相对降低了10.91%,模型最终字错误率降低至5.31%,验证了提出的模型具有一定的先进性。; 关键词端到端语音识别 TRANSFORMER 时序卷积神经网络连接时序分类; Keywords end-to-end speech recognition Transformer temporal convolutional neural network connectionist temporal classification; 分类号 TN912.34 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名基于分解门控注意力单元的高效Conformer模型被引量：1: 4; 作者李宜亭屈丹杨绪魁张昊沈小龙; 机构中国人民解放军战略支援部队信息工程大学信息系统工程学院; 出处《计算机工程》 CAS CSCD 北大核心 2023年第5期73-80,共8页; 基金国家自然科学基金(62171470) 河南省中原科技创新领军人才项目(234200510019) 河南省自然科学基金面上项目(232300421240)。; 文摘为利用有限的存储和计算资源,在保证Conformer端到端语音识别模型精度的前提下,减少模型参数量并加快训练和识别速度,构建一个基于分解门控注意力单元与低秩分解的高效Conformer模型。在前馈和卷积模块中,通过低秩分解进行计算加速,提高Conformer模型的泛化能力。在自注意力模块中,使用分解门控注意力单元降低注意力计算复杂度,同时引入余弦加权机制对门控注意力进行加权保证其向邻近位置集中,提高模型识别精度。在AISHELL-1数据集上的实验结果表明,在引入分解门控注意力单元和余弦编码后,该模型的参数量和语音识别字符错误率(CER)明显降低,尤其当参数量被压缩为Conformer端到端语音识别模型的50%后语音识别CER仅增加了0.34个百分点,并且具有较低的计算复杂度和较高的语音识别精度。; 关键词端到端语音识别 Conformer模型分解门控注意力单元模型压缩低秩分解; Keywords end-to-end speech recognition Conformer model Factorized Gated Attention Unit(FGAU) model compression low rank decomposition; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于改进Conformer的新闻领域端到端语音识别	张济民早克热·卡德尔艾山·吾买尔申云飞汪烈军	《中文信息学报》 CSCD 北大核心	2024	4	在线阅读下载PDF 职称材料
2	基于Conformer的端到端语音识别模型的压缩优化策略	桑江坤努尔麦麦提·尤鲁瓦斯	《信号处理》 CSCD 北大核心	2022	2	在线阅读下载PDF 职称材料
3	TCN-Transformer-CTC的端到端语音识别	谢旭康陈戈孙俊陈祺东	《计算机应用研究》 CSCD 北大核心	2022	21	在线阅读下载PDF 职称材料
4	基于分解门控注意力单元的高效Conformer模型	李宜亭屈丹杨绪魁张昊沈小龙	《计算机工程》 CAS CSCD 北大核心	2023	1	在线阅读下载PDF 职称材料