-
题名倒谱形状规整在噪声鲁棒性语音识别中的应用
被引量:2
- 1
-
-
作者
杜俊
戴礼荣
王仁华
-
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
-
出处
《中文信息学报》
CSCD
北大核心
2010年第2期104-109,共6页
-
文摘
该文提出了一种新的用于鲁棒性语音识别的特征规整方法。我们观察到在噪声环境下语音特征分布的形状相比于干净环境变化很大,因此提出了一种称为倒谱形状规整的新方法,它是利用引入一个指数因子来达到对倒谱分布形状进行规整的目的。这种方法被证明在噪声环境下非常有效,特别是在低信噪比情况下。实验结果表明此新方法在au-rora2和aurora3两个标准数据库上比经典的均值方差规整算法在词错误率方面分别有38%和25%的相对降低,并且倒谱形状规整也好于其它传统方法,比如直方图均衡和高阶倒谱矩规整方法。
-
关键词
计算机应用
中文信息处理
鲁棒性语音识别
形状规整
-
Keywords
computer application
Chinese information processing
robust speech recognition
shape normalization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于自监督知识迁移的鲁棒性语音识别技术
被引量:2
- 2
-
-
作者
柏财通
崔翛龙
郑会吉
李爱
-
机构
武警工程大学研究生大队
武警工程大学反恐指挥信息工程研究团队
武警工程大学乌鲁木齐校区
-
出处
《计算机应用》
CSCD
北大核心
2022年第10期3217-3223,共7页
-
基金
国家自然科学基金资助项目(U1603261)
网信融合项目(LXJH-10(A)-09)。
-
文摘
针对标注神经网络训练数据的成本日益增加与噪声干扰阻碍语音识别系统性能提升的问题,提出一种基于自监督知识迁移的鲁棒性语音识别模型的模型训练算法。首先,在预处理阶段提取原始语音样本的三个人工特征;然后,在训练阶段将特征提取网络生成的高级特征分别通过三个浅层网络来拟合预处理阶段提取的人工特征;同时,把特征提取前端与语音识别后端进行交叉训练,并合并它们的损失函数;最后,通过梯度反向传播令特征提取网络学会提取更有助于去噪语音识别的高级特征,从而实现人工知识迁移与去噪,并高效利用了训练数据。在军事装备控制的应用场景下,基于加噪后的THCHS-30、希尔贝壳数据集AISHELL-1与ST-CMDS这三个开源中文语音识别数据集以及军事装备控制指令的数据集上进行测试,实验结果表明,基于自监督知识迁移的鲁棒性语音识别模型的模型训练算法词错率可以降低到0.12,不仅可以实现对鲁棒性语音识别模型的模型训练,同时通过自监督知识迁移提高了训练样本的利用率,可完成装备控制任务。
-
关键词
知识迁移
鲁棒性语音识别
自监督学习
中文语音识别
语音去噪
-
Keywords
knowledge transfer
robust speech recognition
self-supervised learning
Chinese speech recognition
speech denoising
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP309
[自动化与计算机技术—计算机系统结构]
-