-
题名基于融合特征ADRMFCC的语音识别方法
被引量:1
- 1
-
-
作者
朵琳
马建
韦贵香
唐剑
-
机构
昆明理工大学信息工程与自动化学院
-
出处
《吉林大学学报(理学版)》
CAS
北大核心
2024年第4期943-950,共8页
-
基金
国家自然科学基金(批准号:61962032)。
-
文摘
针对在复杂噪声环境下语音识别准确率低和鲁棒性差的问题,提出一种基于增减残差Mel倒谱融合特征的语音识别方法.该方法首先利用增减分量法筛选关键语音特征,然后将其映射到Mel域-残差域空间坐标系中生成增减残差Mel倒谱系数,最后将这些融合特征用于训练端到端模型.实验结果表明,该方法在不同噪声类型和信噪比条件下均显著提高了语音识别准确率及性能,在-5 dB低信噪比条件下,语音识别准确率达73.13%,而在其他噪声条件下的平均语音识别准确率达88.67%,充分证明了该方法的有效性和鲁棒性.
-
关键词
语音识别
残差Mel倒谱系数
特征筛选
增减分量法
-
Keywords
speech recognition
residual Mel cepstral coefficient
feature screening
increase and decrease component method
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于特征相对贡献度对加权Mel倒谱的改进
被引量:5
- 2
-
-
作者
王家盛
郭其威
吴松
马建敏
-
机构
复旦大学航空航天系
上海宇航系统工程研究所
-
出处
《声学技术》
CSCD
北大核心
2021年第3期408-414,共7页
-
基金
上海航天科技创新基金(SAST2019-021)资助项目。
-
文摘
在声纹识别系统的搭建过程中,提高识别率的一个重要做法是使语音信号中能够提取出的特征尽可能包含更多的说话人个性特征。为了探究特征参数各分量对识别系统性能的影响,文章基于高斯混合-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)基线系统,研究了在无噪环境中各维特征组合下的识别率,利用增减分量法定量计算出各维特征分量对识别率的相对贡献程度,并根据贡献度的强弱对各维特征分量进行合理加权,得到了贡献度拟合权重系数,将此系数用于改进梅尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征参数。仿真结果表明,对特征参数进行贡献度拟合权重系数加权后,声纹识别的正确率得到了提升。
-
关键词
增减分量法
贡献度
梅尔(Mel)倒谱系数
高斯混合-通用背景模型(GMM-UBM)
-
Keywords
increment-subtraction component method
degree of contribution
Mel frequency cepstrum coefficient(MFCC)
Gaussian mixture model-universal background model(GMM-UBM)
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-