期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于梅尔频率倒谱系数的语音清晰度DRT识别 被引量:2
1
作者 马成龙 焦俊清 +4 位作者 焦富清 王杰 陈巧特 谢武俊 李军 《信息化研究》 2024年第2期63-68,共6页
语音清晰度在通信终端、设备系统语音识别方面具有重要意义。本文对110dB噪声干扰下采集到的语音信号进行谱减法降噪,双门限端点检测提取发音字段,然后提取梅尔频率倒谱系数(MFCC),再将其进行差分计算,得到一阶和二阶分量,结合短时能量... 语音清晰度在通信终端、设备系统语音识别方面具有重要意义。本文对110dB噪声干扰下采集到的语音信号进行谱减法降噪,双门限端点检测提取发音字段,然后提取梅尔频率倒谱系数(MFCC),再将其进行差分计算,得到一阶和二阶分量,结合短时能量作为语音信号的特征参数,最后通过动态时间归整(DTW)进行相似度识别。实验表明,本文算法对汉语清晰度诊断押韵测试(DRT)字表的测试结果高达92.90%,有良好的识别率。 展开更多
关键词 语音清晰度 减法 端点检测 梅尔频率系数 动态时间归整 汉语清晰度诊断押韵测试
在线阅读 下载PDF
基于MFCC相似度和谱熵的端点检测算法 被引量:6
2
作者 邓瑞 肖纯智 高勇 《现代电子技术》 2013年第21期67-69,共3页
为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离... 为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离与谱熵做综合判决。实验结果表明,在低信噪比环境下此方法相对谱熵法能够提高检测准确率。 展开更多
关键词 语音信号处理 端点检测 Mel频率参数 相关系数
在线阅读 下载PDF
基于GMM模型和LPC-MFCC联合特征的声道谱转换研究 被引量:9
3
作者 曾歆 张雄伟 +2 位作者 孙蒙 苗晓孔 姚琨 《声学技术》 CSCD 北大核心 2020年第4期451-455,共5页
声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略... 声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略了不同声道特征参数之间可能存在的互补性。针对这一问题,研究了不同声道特征参数之间进行联合建模的方法,引入了一种由线性预测系数(LinearPredictionCoefficient,LPC)和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)联合构成的LPC-MFCC特征参数,提出了一种基于高斯混合模型(Gaussian Mixture Model, GMM)和LPC-MFCC联合特征参数的语音转换方法。为验证文中方法的有效性,仿真实验选取了基于GMM和LPC的语音转换方法进行对比,对多组实验数据进行主观和客观测试,结果表明,文中提出的语音转换方法可以获得相似度更高的转换语音。 展开更多
关键词 语音转换 声道转换 高斯混合模型 联合建模 线性预测系数-梅尔频率系数
在线阅读 下载PDF
基于MFCC与CNN的机械故障声音自动识别
4
作者 黄炜 罗谢飞 《电声技术》 2024年第6期129-131,共3页
针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明... 针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明,该方法在机械故障声音识别中具有较高的准确率、精确率及召回率,能够有效识别故障案例。 展开更多
关键词 机械故障 声音识别 梅尔频率系数(mfcc) 卷积神经网络(CNN)
在线阅读 下载PDF
基于MFCC和HMM的语音识别优化方法研究
5
作者 郭佳淇 张继通 《电声技术》 2024年第10期83-85,共3页
为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectatio... 为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectation Maximization,EM)算法优化HMM参数,最后利用THCHS-30数据集进行实验验证。结果表明,引入EM算法优化HMM,可有效克服传统HMM在复杂语音环境下的识别困难问题,显著提升系统的识别精度和健壮性。 展开更多
关键词 语音识别 梅尔频率系数(mfcc) 隐马尔可夫模型(HMM) 期望最大化(EM)
在线阅读 下载PDF
藏语语音处理中对MFCC参数提取的研究 被引量:1
6
作者 张金溪 徐慧 李照耀 《无线互联科技》 2012年第11期141-141,共1页
本文在掌握了MFCC参数提取的理论基础上,对基元的选择、HMM建模进行了深入学习与探索,在HTK工具的帮助下完成了MFCC参数的提取,为藏语语音识别系统、藏语语音合成系统的实现奠定了一定的基础。
关键词 梅尔系数(mfcc) mfcc参数提取 HMM建模
在线阅读 下载PDF
基于改进迁移学习的煤矿井下设备音频信号故障诊断方法
7
作者 邱吉尔 王琪 王鹏 《工矿自动化》 北大核心 2025年第2期91-99,共9页
煤矿井下生产运行环境恶劣,其关键设备如瓦斯泵、通风机、采煤机等长期处于启动状态,易产生缺陷性故障。目前端到端音频数据故障诊断方法的模型训练与更新高度依赖于数据标注,尽管可以获取海量原始数据,但这些数据通常未经标注,难以直... 煤矿井下生产运行环境恶劣,其关键设备如瓦斯泵、通风机、采煤机等长期处于启动状态,易产生缺陷性故障。目前端到端音频数据故障诊断方法的模型训练与更新高度依赖于数据标注,尽管可以获取海量原始数据,但这些数据通常未经标注,难以直接用于模型训练,设备运行工况的突变和设备重组等因素可能导致数据分布发生变化,从而引起模型性能下降。针对上述问题,提出了一种基于改进迁移学习的煤矿井下设备音频信号故障诊断方法。首先,对煤矿设备音频信号进行梅尔频率倒谱系数(MFCC)特征提取,捕捉设备运行状态中的关键信息,得到故障特征二维系数图。然后,构建基于改进迁移学习的故障诊断网络模型,以改进最大均值差异,即多核联合最大均值差异作为度量标准,借助伪标签计算联合分布距离,将标签信息通过多重线性映射进行特征匹配,以减少数据分布差异,实现边缘分布和条件分布同时对齐。实验结果表明:所提方法在无标签条件下能够实现高精度的故障诊断,准确率达到96.99%,标准差为0.014;在模型抗噪性能实验中,基于改进迁移学习的故障诊断模型在低信噪比(如10 dB)条件下仍能保持80%的故障诊断准确率,展现出较强的抗噪鲁棒性。 展开更多
关键词 煤矿井下设备 音频信号 故障诊断 迁移学习 梅尔频率系数 mfcc 最大均值差异 多核联合最大均值差异 源域 目标域
在线阅读 下载PDF
基于PMFCC-DTW的轨道电路暂态故障诊断 被引量:15
8
作者 杨璟 王小敏 +2 位作者 张文芳 郑启明 陈磊 《铁道学报》 EI CAS CSCD 北大核心 2021年第5期104-111,共8页
针对轨道电路稳态条件下诊断的时效性不足,提出一种基于集中监测系统采集暂态信号,并使用梅尔频率系数和动态时间规整模型的轨道电路故障诊断方法。该模型利用暂态理论分析轨道电路设备的故障状态,将轨道电路设备的状态进行多状态分类... 针对轨道电路稳态条件下诊断的时效性不足,提出一种基于集中监测系统采集暂态信号,并使用梅尔频率系数和动态时间规整模型的轨道电路故障诊断方法。该模型利用暂态理论分析轨道电路设备的故障状态,将轨道电路设备的状态进行多状态分类。采用PMFCC进行特征提取,再使用Fisher准则和K-means聚类处理后,形成不同类型故障的模板库,通过DTW模型比较测试数据与模板库的匹配距离进行故障识别。使用实地测得的轨道电路暂态电压数据,对模型的性能进行测试,完成了故障识别的实现与验证。结果表明:采用八维特征信息时,其诊断时间相对于其他机器学习方法有了较大提高,正确率高达90%以上。该方法对轨道电路的暂态情况进行分类,可为基于集中监测系统的多故障诊断提供一种解决思路。 展开更多
关键词 ZPW-2000轨道电路 梅尔频率 动态时间规整 暂态分析 故障诊断
在线阅读 下载PDF
基于MFCC的汽车敲击异响识别 被引量:3
9
作者 黄凯 郑瑶辰 邓兆祥 《振动与冲击》 EI CSCD 北大核心 2022年第13期275-282,共8页
现阶段,汽车异响的诊断主要依赖有经验的工程师进行主观评判,存在不准确、易错判、易漏判的问题。针对汽车敲击异响实测信号进行统计分析得到梅尔倒谱系数(Mel frequency cepstrum coefficient,MFCC),并以此作为表征异响来源的特征向量... 现阶段,汽车异响的诊断主要依赖有经验的工程师进行主观评判,存在不准确、易错判、易漏判的问题。针对汽车敲击异响实测信号进行统计分析得到梅尔倒谱系数(Mel frequency cepstrum coefficient,MFCC),并以此作为表征异响来源的特征向量,基于最大似然估计法构建其联合概率分布高斯混合模型(Gaussian mixture model,GMM),从而针对未知实测异响信号可利用该GMM模型进行似然判别。指出了说话人识别技术与敲击异响识别的不同之处即Mel三角滤波器个数和离散余弦变换输出系数个数的选取方式,并对方法的可行性进行分析,最后试验加以验证。结果显示此方法的识别率达100%,拒绝率达100%以上,为汽车异响的客观评价方法打下基础。 展开更多
关键词 说话人识别 敲击异响 梅尔系数(mfcc) 高斯混合模型(GMM)
在线阅读 下载PDF
基于鲁棒主成分分析和MFCC反复结构的歌声分离方法 被引量:1
10
作者 熊天 张天骐 +1 位作者 闻斌 吴超 《声学技术》 CSCD 北大核心 2023年第6期794-803,共10页
针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效... 针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效地改善了鲁棒主成分分析对歌声分离不完全和梅尔频率倒谱系数反复结构歌声在低频处分离不佳的问题。首先使用鲁棒主成分分析将混合音乐信号分解为低秩矩阵和稀疏矩阵,然后分别对其提取梅尔频率倒谱系数特征参数并且对其进行相似运算,构建相似矩阵及建立梅尔频率倒谱系数反复结构模型并通过反复结构模型分别得到低秩矩阵和稀疏矩阵相关的掩蔽矩阵,最后根据构建的掩蔽矩阵模型以及傅里叶逆变换得到背景音乐和歌声。在公开数据集上进行了实验,实验结果表明本文算法在歌声分离性能上与比较算法相比,平均信号干扰比值最高有接近7 dB的提高。 展开更多
关键词 鲁棒主成分分析(RPCA) 梅尔频率系数(mfcc) 歌声伴奏分离 反复结构
在线阅读 下载PDF
基于MFCC均值特征的电台语言类节目相似度比对算法研究
11
作者 聂晨淅 《电声技术》 2022年第4期50-53,58,共5页
为了提高广播语言类节目的播出安全,提出一种基于梅尔频率倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)的算法,对两段音频信号进行相似度比对。通过对音频频谱特征提取得到均值特征参数,再计算两者的特征参数矩阵的欧式距... 为了提高广播语言类节目的播出安全,提出一种基于梅尔频率倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)的算法,对两段音频信号进行相似度比对。通过对音频频谱特征提取得到均值特征参数,再计算两者的特征参数矩阵的欧式距离,根据欧氏距离的大小判定两段音频的相似度来完成对比任务。实践证明,该方法对于语言类音频比对具有较高的准确性。 展开更多
关键词 播出安全 特征提取 梅尔频率系数(mfcc) 欧氏距离 音频比对
在线阅读 下载PDF
基于MFCC的空中交通管制语音指令的特征提取研究
12
作者 王兴林 《电声技术》 2023年第6期68-72,共5页
随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义... 随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义。文章介绍空中交通管制指令的基本要求,详细分析语音信号特征提取的各个环节,通过梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)提取语音信号的特征,再使用高斯混合模型(Gaussian Mixture Model,GMM)进行训练和分类,从而实现语音信号的识别,具有一定的实际运用价值。 展开更多
关键词 语音信号 特征提取 梅尔频率系数(mfcc) 高斯混合模型(GMM) 模型训练
在线阅读 下载PDF
结合MGCC特征与多尺度通道注意力的环境声深度学习分类方法
13
作者 杨俊杰 丁家辉 +2 位作者 杨柳 冯丽 杨超 《应用声学》 CSCD 北大核心 2024年第3期513-524,共12页
环境声分类技术在家居安全监测、人机语声交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,该文提出一种基于多尺度通道注意力机制的深度学习分类模型。所提模... 环境声分类技术在家居安全监测、人机语声交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,该文提出一种基于多尺度通道注意力机制的深度学习分类模型。所提模型由特征提取模块、多尺度卷积模块、高效通道注意力模块、输出层四部分组成。首先,通过引入加权型梅尔Gammatone频率倒谱系数(MGCC)挖掘环境声频谱幅值与相位结构信息;其次,融合多尺度卷积核与高效通道注意力机制优选出声频关键局部细节和通道特征;最后,在全连接层采用softmax函数映射特征并输出环境声类型的概率值。所提模型在6种环境声的iFLYTEK、10种环境声的Urbansound8k数据集上开展测试验证,分别取得了94%、76.52%、79.24%(iFLYTEK+Urbansound8k)的分类准确率。消融实验结果进一步表明:引入的多尺度卷积模块、通道注意力机制模块对分类准确率的提升贡献率分别接近于3.77%和1.89%。实验还详细对比了7种现有的深度学习分类方法,所提算法在分类准确率上排名第二;另外,在同级别算法中如ResNet18、GoogLeNet,所提算法在模型参数量和计算复杂度方面上实现了进一步的约减。 展开更多
关键词 环境声分类 梅尔Gammatone频率 多尺度核卷积 高效通道注意力 卷积神经网络
在线阅读 下载PDF
基于声音特征的隧道衬砌空洞识别方法研究
14
作者 代晓景 暴学志 +2 位作者 柴雪松 周城光 阎兆立 《声学技术》 CSCD 北大核心 2024年第1期135-141,共7页
目前隧道衬砌空洞检测以人工敲击判断为主,检测过程中由于受到检测人员水平、注意力等主观因素影响,检测结果存在较大不确定性,因此有必要研制一种智能化的检测装置实现空洞自动识别。文章开展了衬砌空洞敲击回声智能识别算法研究,通过... 目前隧道衬砌空洞检测以人工敲击判断为主,检测过程中由于受到检测人员水平、注意力等主观因素影响,检测结果存在较大不确定性,因此有必要研制一种智能化的检测装置实现空洞自动识别。文章开展了衬砌空洞敲击回声智能识别算法研究,通过提取隧道衬砌冲击回波的梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)作为特征,针对敲击回声脉冲信号长度不一的特点,提出了变帧长MFCC优化算法,并面向小样本条件,建立了支持向量机(Support Vector Machine,SVM)的识别模型。试验结果表明,该模型对衬砌空洞识别准确率可达89.9%。 展开更多
关键词 隧道衬砌空洞 声学信号处理 梅尔系数(mfcc) 支持向量机(SVM)
在线阅读 下载PDF
基于音频特征的水车室工作状态异常检测 被引量:2
15
作者 曾广栋 魏学锋 +2 位作者 何林 孙长江 张旋 《水电能源科学》 北大核心 2024年第8期168-172,共5页
水电站的水车室包含轴承和顶盖等机械设备,受水力因素影响,水车室的异常工作会带来较大的安全隐患,基于大数据分析的精确维护对于水车室的可靠运行至关重要。针对水车室的异常工作状态,通过模型训练、特征工程和分类模型的开发等过程,采... 水电站的水车室包含轴承和顶盖等机械设备,受水力因素影响,水车室的异常工作会带来较大的安全隐患,基于大数据分析的精确维护对于水车室的可靠运行至关重要。针对水车室的异常工作状态,通过模型训练、特征工程和分类模型的开发等过程,采用STFT、Log-Mel、MFCC等方法对音频数据进行了预处理,建立了基于音频数据的异常检测模型,并对溪洛渡水电站水车室工作状态进行了异常检测。结果表明,Log-Mel方法具有有效性。研究结果不仅降低了异常检测的成本,还为水电机组的健康监测提供了参考。 展开更多
关键词 音频数据 水车室 STFT Log-Mel 梅尔频率系数(mfcc) 时域特征 支持向量机
在线阅读 下载PDF
基于LSTM模型的音乐推荐系统研究
16
作者 范凯燕 胡彦红 《电声技术》 2024年第9期136-138,共3页
随着音乐推荐技术的快速发展,如何提升音乐推荐系统的准确性和用户满意度成为研究的重点。研究一种结合梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)、长短期记忆(Long Short-Term Memory,LSTM)网络、内容推荐方法的音... 随着音乐推荐技术的快速发展,如何提升音乐推荐系统的准确性和用户满意度成为研究的重点。研究一种结合梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)、长短期记忆(Long Short-Term Memory,LSTM)网络、内容推荐方法的音乐推荐系统,并通过MATLAB平台进行测试。结果表明,该推荐系统表现良好。 展开更多
关键词 音乐推荐 梅尔频率系数(mfcc) 长短期记忆(LSTM) 内容推荐
在线阅读 下载PDF
基于用户语音情感分析的景区反馈评估方法
17
作者 胡辉 《电声技术》 2024年第10期95-97,共3页
提出一种基于用户语音情感分析的景区反馈评估方法。首先,构建一个面向景区评估的情感分析框架,采用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)提取语音特征。其次,利用长短期记忆(Long Short-Term Memory,LSTM)网络... 提出一种基于用户语音情感分析的景区反馈评估方法。首先,构建一个面向景区评估的情感分析框架,采用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)提取语音特征。其次,利用长短期记忆(Long Short-Term Memory,LSTM)网络对提取的特征进行情感极性分类,将情感分为积极、消极、中性。最后,在交互式情感二元动作捕捉(Interactive Emotional Dyadic Motion Capture,IEMOCAP)数据集上进行实验。实验结果显示,本方法在精确率、召回率、准确率等指标上均表现出色,特别是在中性情感分类中达到了较高的识别性能。 展开更多
关键词 语音情感分析 景区评估 梅尔频率系数(mfcc) 长短期记忆(LSTM)网络
在线阅读 下载PDF
基于声纹识别技术的电力调度系统设计
18
作者 沈亚玲 《电声技术》 2024年第12期1-3,共3页
为提升电力调度的效率与安全性,探讨声纹识别技术在电力调度系统中的应用。采用梅尔频率倒谱系数(Mel Frequency Ceptral Coefficient,MFCC)特征提取与高斯混合模型(Gaussian Mixture Model,GMM)建模方法,结合大词汇量连续语音识别(Larg... 为提升电力调度的效率与安全性,探讨声纹识别技术在电力调度系统中的应用。采用梅尔频率倒谱系数(Mel Frequency Ceptral Coefficient,MFCC)特征提取与高斯混合模型(Gaussian Mixture Model,GMM)建模方法,结合大词汇量连续语音识别(Large Vocabulary Continuous Speech Recognition,LVCSR)技术和改进的蚁群优化(Ant Colony Optimization,ACO)算法,设计基于声纹识别的电力调度系统。实验结果显示,该系统在身份验证和指令处理方面表现出色,具备较高的准确率与响应速度,能够有效保障电网运行的安全性与稳定性。 展开更多
关键词 声纹识别 电力调度 梅尔频率系数(mfcc)
在线阅读 下载PDF
基于MATLAB GUI的语音信号特征提取系统设计 被引量:11
19
作者 王光艳 赵晓群 王霞 《河北工业大学学报》 CAS 北大核心 2010年第4期14-18,共5页
语音信号的典型时频特性和核心处理算法是语音识别、合成和说话人识别等系统中的关键问题.结合线性预测分析技术(LPC)和美尔倒谱参数(MFCC)的算法原理,基于MATLAB GUI技术,设计完成了语音信号典型特征提取系统的界面平台,可实现语音信... 语音信号的典型时频特性和核心处理算法是语音识别、合成和说话人识别等系统中的关键问题.结合线性预测分析技术(LPC)和美尔倒谱参数(MFCC)的算法原理,基于MATLAB GUI技术,设计完成了语音信号典型特征提取系统的界面平台,可实现语音信号的装载、播放和波形显示,LPC和MFCC的计算结果显示和数据存储等功能.界面的人机交互性好,操作简单方便,可提高对算法或数据处理效果的直观认识,对语音信号分析和处理等各个研究领域具有重要的现实意义. 展开更多
关键词 语音信号 线性预测分析(LPC) 美尔系数(mfcc) MATLABGUI
在线阅读 下载PDF
基于频域ICA的语音特征增强 被引量:1
20
作者 吕钊 吴小培 李密 《振动与冲击》 EI CSCD 北大核心 2011年第2期238-242,257,共6页
为了降低卷积噪声对语音特征所产生的影响,提高语音识别正确率,在此提出了一种基于频域ICA(Independent Component Analysis,独立分量分析)的语音特征增强算法。该算法首先使用频域ICA方法作对噪声进行估计,然后在倒谱域内将带噪语音信... 为了降低卷积噪声对语音特征所产生的影响,提高语音识别正确率,在此提出了一种基于频域ICA(Independent Component Analysis,独立分量分析)的语音特征增强算法。该算法首先使用频域ICA方法作对噪声进行估计,然后在倒谱域内将带噪语音信号的短时谱减去所估计噪声的短时谱,最后根据去噪后语音信号的短时谱计算美尔倒谱系数(MFCC)作为特征参数。在仿真和真实环境下的语音识别实验中,所提出的语音特征参数相比较传统的MFCC其识别正确率分别提升了38.2%和35.8%。实验结果表明该算法能够较好地解决卷积噪声环境下训练与识别特征不匹配的问题,有效提高了语音识别系统的识别正确率。 展开更多
关键词 频域ICA 语音 特征增强 美尔系数(mfcc)
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部