题名 基于GFCC与RLS的说话人识别抗噪系统研究
被引量:5
1
作者
茅正冲
王正创
黄芳
机构
江南大学轻工过程先进控制教育部重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2015年第10期215-218,231,共5页
基金
江苏省自然科学基金项目(No.BK20131107)
文摘
为了提高说话人识别抗噪系统的性能,提出了将RLS自适应滤波器作为语音信号去噪的预处理器,进一步提高语音信号的信噪比,再通过Gammatone滤波器组,对去噪后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC,进而将特征参数GFCC用于说话人识别系统中。仿真实验在高斯混合模型识别系统中进行。实验结果表明,采用这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显的提高。
关键词
抗噪系统
递归式最小均方(RLS)
Grammatone频率倒谱系数(gfcc )
识别率
Keywords
anti-noise system
Recursivel East Squares ( RLS)
gammatone frequency cepstrum confficient ( gfcc)
recognition rate
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于深度自编码网络语音识别噪声鲁棒性研究
被引量:9
2
作者
黄丽霞
王亚楠
张雪英
王洪翠
机构
太原理工大学信息工程学院
天津大学计算机科学与技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2017年第13期49-54,共6页
基金
国家自然科学基金(No.61371193
No.61303109)
+1 种基金
山西省留学回国择优资助项目(晋人社厅函[2013]68号)
山西省自然科学基金(No.2014021022-6)
文摘
为了解决传统径向基(Radial basis function,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,使用深度自编码网络作为语音识别的声学模型,分析梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)和基于Gammatone听觉滤波器频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)下非特定人小词汇量孤立词的抗噪性能。实验结果表明,深度自编码网络在MFCC特征下较径向基神经网络表现出更优越的抗噪性能;而与经典的MFCC特征相比,GFCC特征在深度自编码网络下平均识别率相对提升1.87%。
关键词
语音识别
鲁棒性
深度自编码网络
gfcc 特征
MFCC特征
Keywords
speech recognition
robustness
Deep Auto-Encoder(DAE)neural network
gammatone frequency cepstrum Coefficient(gfcc )
Mel frequency cepstrum Coefficient(MFCC)
分类号
TN391.42
[电子电信—物理电子学]
题名 多类型语音特征进化选择算法
3
作者
张小恒
谢文宾
李勇明
机构
重庆广播电视大学
重庆大学通信工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2016年第14期150-155,219,共7页
基金
国家自然科学基金(No.91438104)
中央高校基本科研业务费专项资金(No.CDJZR10160003
+3 种基金
No.CDJZR13160008
No.CDJZR155507)
中国博士后科学基金(No.2013M532153)
重庆市博士后科研项目特别资助
文摘
基于特征选择的语音特征获取用于说话人识别是目前较为有效的方式。但是,最优语音特征随着具体应用环境的变化而不同。因此,提出了基于四类型语音特征封装式遗传特征选择算法(FSF-Wr GAF),该算法提取了四种类型的语音特征参数,通过链式智能体遗传算法和GMM-UBM进行封装式动态特征选择,获取高精度的识别准确率。采用了多种指标完成该算法的性能测试。实验结果表明,该算法具体实现过程简便,改进效果明显,较同类算法在多项指标(识别率,EER,DET曲线)上都有显著提高。
关键词
说话人识别
多类型语音特征
链式智能体遗传算法
伽马通滤波器倒谱系数(gfcc )
梅尔频率倒谱系数(MFCC)
线性预测倒谱系数(LPCC)
Keywords
speaker recognition
multiple voice features types
chain-like agent genetic algorithm
gammatone frequency cepstrum Coefficient(gfcc)
Mel frequency cepstrum Coefficient(MFCC)
Linear Prediction cepstrum Coefficient(LPCC)
分类号
TN912
[电子电信—通信与信息系统]