-
题名低资源语言自动语音识别中的数据处理与数据增强综述
- 1
-
-
作者
杨健
孙浏
张丽芳
-
机构
玉溪师范学院工学院
玉溪师范学院云南省智慧城市网络空间安全重点实验室
-
出处
《计算机科学》
北大核心
2025年第8期86-99,共14页
-
基金
国家自然科学基金(62266048,62466060)。
-
文摘
由于标注语音数据不足,端到端自动语音识别(Automatic Speech Recognition,ASR)技术难以直接应用到低资源语言场景,低资源语言ASR也成为NLP领域的热点问题。目前,低资源环境下ASR的研究可以从数据增强和模型改进两方面开展,以低资源语言ASR中的训练数据处理为主要研究对象,重点从数据增强、样本处理、特征工程等角度,对近年来该领域的重要研究成果进行梳理和总结。分析了不同类型的数据增强方案,强调未配对语音和文本的利用,并从特征抽取、嵌入和融合等不同方面对低资源环境下ASR的特征工程进行分析和总结,阐述了低资源语音语料库建设等问题,并对低资源环境下用于语音识别的数据增强技术未来可以进一步深入研究的重要方向进行展望。
-
关键词
低资源
自动语音识别
数据增强
特征表示
-
Keywords
Low-resource
Automatic speech recognition
Data augmentation
Feature representation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-