期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
低资源语言自动语音识别中的数据处理与数据增强综述
1
作者 杨健 孙浏 张丽芳 《计算机科学》 北大核心 2025年第8期86-99,共14页
由于标注语音数据不足,端到端自动语音识别(Automatic Speech Recognition,ASR)技术难以直接应用到低资源语言场景,低资源语言ASR也成为NLP领域的热点问题。目前,低资源环境下ASR的研究可以从数据增强和模型改进两方面开展,以低资源语言... 由于标注语音数据不足,端到端自动语音识别(Automatic Speech Recognition,ASR)技术难以直接应用到低资源语言场景,低资源语言ASR也成为NLP领域的热点问题。目前,低资源环境下ASR的研究可以从数据增强和模型改进两方面开展,以低资源语言ASR中的训练数据处理为主要研究对象,重点从数据增强、样本处理、特征工程等角度,对近年来该领域的重要研究成果进行梳理和总结。分析了不同类型的数据增强方案,强调未配对语音和文本的利用,并从特征抽取、嵌入和融合等不同方面对低资源环境下ASR的特征工程进行分析和总结,阐述了低资源语音语料库建设等问题,并对低资源环境下用于语音识别的数据增强技术未来可以进一步深入研究的重要方向进行展望。 展开更多
关键词 低资源 自动语音识别 数据增强 特征表示
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部