期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法 被引量:6
1
作者 张怡然 白静 王力 《科学技术与工程》 北大核心 2014年第19期253-256,274,共5页
语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行... 语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。 展开更多
关键词 mel频率系数 多窗频估计 滑动平均滤波 包络 说话人识别
在线阅读 下载PDF
基于基音周期与清浊音信息的梅尔倒谱参数 被引量:1
2
作者 郭武 王仁华 戴礼荣 《数据采集与处理》 CSCD 北大核心 2007年第2期229-233,共5页
提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel-cepstrum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模... 提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel-cepstrum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模型(Gaussian mixture models,GMM)的情况下,取得了比常用的梅尔刻度式倒频谱参数(Mel-frequency cepstral coefficient,MFCC)更高的识别率,在NIST 2002年测试数据库中,512个混合高斯下能够将等错误率(EER)由9.4%降低到8.3%,2 048个混合高斯下能够将等错误率由7.8%降低到6.9%。 展开更多
关键词 说话人确认 梅尔参数 基音频率 清浊音信息
在线阅读 下载PDF
利用抗噪幂归一化倒谱系数的鸟类声音识别 被引量:18
3
作者 颜鑫 李应 《电子学报》 EI CAS CSCD 北大核心 2013年第2期295-300,共6页
针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪... 针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪的声音功率谱提取抗噪幂归一化倒谱系数(APNCC).最后,采用支持向量机(SVM)分别对提取的APNCC,幂归一化倒谱系数(PNCC)和Mel频率倒谱系数(MFCC)对34种鸟类声音进行不同环境和信噪比情况下的对比实验.实验表明,提取的APNCC具有较好的平均识别效果及较强的噪声鲁棒性,更适用于信噪比低于30dB环境下的鸟类声音识别. 展开更多
关键词 鸟类声音识别 非平稳噪声估计 多频带减法 抗噪幂归一化系数 mel频率系数
在线阅读 下载PDF
基于改进GFCC特征参数的广播音频语种识别 被引量:1
4
作者 邵玉斌 陈亮 +1 位作者 龙华 杜庆治 《吉林大学学报(理学版)》 CAS 北大核心 2022年第2期417-424,共8页
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题,提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法.通过提取每帧信号的能量谱包络,去除部分与说话人相关的特征,采用Gammatone滤波器组滤波,经离散余弦... 针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题,提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法.通过提取每帧信号的能量谱包络,去除部分与说话人相关的特征,采用Gammatone滤波器组滤波,经离散余弦变换后再进行倒谱提升,得到改进的伽马频率倒谱系数特征参数.将广播音频信号提取特征参数输入隐Markov模型中进行训练测试,得到的语种识别结果表明,该方法有效提升了广播音频语种识别的准确率,优于目前使用的伽马频率倒谱系数特征及其衍生方法. 展开更多
关键词 广播音频语种识别 能量包络 提升 改进伽马频率系数
在线阅读 下载PDF
采用复倒谱峰值滤波GMM识别混响语音
5
作者 孔荣 吴迪 +3 位作者 廖启鹏 朱俊杰 周强 陶智 《计算机工程与应用》 CSCD 2014年第15期191-193,203,共4页
针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下... 针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下语音识别率。经实验验证,该方法避免了在现实条件下准确估计房间冲击响应函数的麻烦,降低了计算难度,提高了混响环境下至少4%的系统识别率。 展开更多
关键词 高斯混合模型 mel频率系数(MFCC)
在线阅读 下载PDF
语音MFCC特征计算的改进算法 被引量:6
6
作者 章熙春 曹燕 +1 位作者 张军 韦岗 《数据采集与处理》 CSCD 北大核心 2005年第2期161-165,共5页
提出了一种计算Mel频倒谱参数(Melfrequencycepstralcoefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(WrappeddiscreteFouriertransform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同... 提出了一种计算Mel频倒谱参数(Melfrequencycepstralcoefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(WrappeddiscreteFouriertransform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同时还运用了加权滤波器分析(Weightedfilterbankanalysis,WFBA)技术,以提高MFCC的鲁棒性。对TIMIT连续语音数据库中DR1集的音素识别结果表明,本文提出的改进算法比传统MFCC算法具有更好的识别率。 展开更多
关键词 语音识别 弯折离散傅里叶变换(WDFT) mel频标参数 加权滤波器分析
在线阅读 下载PDF
改进的混合MFCC语音识别算法研究 被引量:18
7
作者 袁正午 肖旺辉 《计算机工程与应用》 CSCD 北大核心 2009年第33期108-110,共3页
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音... 针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。 展开更多
关键词 mel频率系数(MFCC) 语音识别 特征提取
在线阅读 下载PDF
基于MFCC与GFCC混合特征参数的说话人识别 被引量:46
8
作者 周萍 沈昊 郑凯鹏 《应用科学学报》 CAS CSCD 北大核心 2019年第1期24-32,共9页
针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,... 针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,舍弃其中贡献较低的分量以实现特征参数降维的目的,并将混合参数应用于基于高斯混合模型的说话人识别系统.仿真实验表明,该混合特征参数具有更好的识别性能和抗噪性. 展开更多
关键词 说话人识别 混合特征参数 mel频率系数 Gammatone滤波器
在线阅读 下载PDF
加性白噪声环境下语音特征参数鲁棒性的研究 被引量:1
9
作者 孙林慧 杨震 《南京邮电学院学报(自然科学版)》 EI 2005年第5期53-56,共4页
随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪... 随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪声环境下研究M el倒谱参数、M el差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进。从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声。 展开更多
关键词 鲁棒性 mel参数 mel差分 系数零均值化
在线阅读 下载PDF
基于MFCC相似度和谱熵的端点检测算法 被引量:6
10
作者 邓瑞 肖纯智 高勇 《现代电子技术》 2013年第21期67-69,共3页
为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离... 为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离与谱熵做综合判决。实验结果表明,在低信噪比环境下此方法相对谱熵法能够提高检测准确率。 展开更多
关键词 语音信号处理 端点检测 mel频率参数 相关系数
在线阅读 下载PDF
采用GW-MFCC模型空间参数的语音情感识别 被引量:2
11
作者 沈燕 肖仲喆 +3 位作者 李冰洁 周孝进 周强 陶智 《计算机工程与应用》 CSCD 北大核心 2015年第10期219-222,226,共5页
针对单一语音特征对语音情感表达不完整的问题,将具有良好量化和插值特性的LSF参数与体现人耳听觉特性的MFCC参数相融合,提出基于线谱权重的MFCC(WMFCC)新特征。同时,通过高斯混合模型来对该参数建立模型空间,进一步得到GW-MFCC模型空... 针对单一语音特征对语音情感表达不完整的问题,将具有良好量化和插值特性的LSF参数与体现人耳听觉特性的MFCC参数相融合,提出基于线谱权重的MFCC(WMFCC)新特征。同时,通过高斯混合模型来对该参数建立模型空间,进一步得到GW-MFCC模型空间参数,以获取更高维的细节信息,进一步提高情感识别性能。采用柏林情感语料库进行验证,新参数的识别率比传统的MFCC和LSF分别有5.7%和6.9%的提高。实验结果表明,提出的WMFCC以及GW-MFCC参数可以有效地表现语音情感信息,提高语音情感识别率。 展开更多
关键词 语音情感识别 线频率(LSF) mel频率系数(MFCC) 高斯混合模型 模型空间
在线阅读 下载PDF
固话信道下语音特征参数影响研究 被引量:3
12
作者 郭逾 张二华 +1 位作者 刘驰 杨子凡 《现代电子技术》 北大核心 2015年第11期73-78,82,共7页
通过对比麦克风与固话信道下语音信号的时域、频域参数,结合固话传输系统的特性,分析语音信号经过固话信道传输后,各参数的异同点以及固话信道对语音信号的影响。并采用F比的方法,分析麦克风信道和固话信道下语音信号MFCC特征参数的差... 通过对比麦克风与固话信道下语音信号的时域、频域参数,结合固话传输系统的特性,分析语音信号经过固话信道传输后,各参数的异同点以及固话信道对语音信号的影响。并采用F比的方法,分析麦克风信道和固话信道下语音信号MFCC特征参数的差异。实验结果表明,语音信号经过固话信道传输后,不仅造成信号的频率失真,还伴随有宽带噪声和共振型噪声。在MFCC特征参数方面,麦克风和固话信道的第二维MFCC参数差异最明显,低维参数相比高维参数差异较大,男性说话人特征参数相比女性说话人差异较大。 展开更多
关键词 固话信道 噪声 语音参数 mel频率系数 F比
在线阅读 下载PDF
多频带谱减法用于生态环境声音分类 被引量:5
13
作者 王熙 李应 《计算机工程与应用》 CSCD 2014年第3期190-193,220,共5页
基于人类听觉特性的Mel频率倒谱系数广泛用于声音识别,然而在生态环境中噪声的出现导致其识别率剧减。提出一种在噪声背景下生态环境声音分类方法。利用非线性多频带谱减法对声音功率谱进行去噪处理并提取改进Mel频率倒谱系数,有效削弱... 基于人类听觉特性的Mel频率倒谱系数广泛用于声音识别,然而在生态环境中噪声的出现导致其识别率剧减。提出一种在噪声背景下生态环境声音分类方法。利用非线性多频带谱减法对声音功率谱进行去噪处理并提取改进Mel频率倒谱系数,有效削弱不同频率段噪声功率谱干扰。利用支持向量机良好的鲁棒性和抗噪能力对含有噪声的生态环境声音进行分类。实验表明该方法能有效在噪声背景下对生态环境声音准确分类。 展开更多
关键词 多频带减 生态环境声音分类 mel频率系数 支持向量机
在线阅读 下载PDF
短时谱特征的汉语重音检测方法研究 被引量:2
14
作者 赵云雪 张珑 郑世杰 《计算机科学与探索》 CSCD 2014年第9期1120-1128,共9页
重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual line... 重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chinese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。 展开更多
关键词 重音检测 mel频率系数(MFCC) 相关感知线性预测(RASTA-PLP) 短时特征
在线阅读 下载PDF
基于MFCC特征提取和改进SVM的语音情感数据挖掘分类识别方法研究 被引量:27
15
作者 张钰莎 蒋盛益 《计算机应用与软件》 北大核心 2020年第8期160-165,212,共7页
设计一种语音情感数据挖掘分类识别方法。对语音情感信号进行预处理,进一步从语音话语中提取Mel频率倒谱系数(MFCC)和Mel能谱动态系数(MEDC);使用支持向量机(SVM)来分类不同的情绪状态,如愤怒、快乐、悲伤、中立、恐惧等,并基于径向基函... 设计一种语音情感数据挖掘分类识别方法。对语音情感信号进行预处理,进一步从语音话语中提取Mel频率倒谱系数(MFCC)和Mel能谱动态系数(MEDC);使用支持向量机(SVM)来分类不同的情绪状态,如愤怒、快乐、悲伤、中立、恐惧等,并基于径向基函数(RBF)内核进行训练阶段;应用柏林情感数据库和CASIA汉语情感语料库从情绪语音文件中提取特征。实验结果表明,柏林数据库和CASIA汉语情感语料库的正确识别率分别为82%和90.39%。与几种先进的对比方法进行比较,该方法在不同降维、不同信噪比下均取得了最优的识别精度。 展开更多
关键词 语音情感识别 支持向量机 数据挖掘 mel频率系数 mel动态系数
在线阅读 下载PDF
用于分布式识别的语音参数的提取和性能分析 被引量:1
16
作者 郑清 杨震 《南京邮电学院学报(自然科学版)》 2003年第2期31-34,共4页
主要研究用于分布式语音识别(DSR)的语音参数的提取方法以及参数性能分析。以前所用到的语音参数大部分是LPC倒谱参数,但其抗噪声性能较差。文中主要讨论了MEL倒谱参数,并在移动通信环境下,比较了两者的性能。
关键词 分布式语音识别 DSR Q-CELP语音编码 mel参数 LPC参数
在线阅读 下载PDF
新型MFCC和波动模型相结合的二层环境声音识别 被引量:3
17
作者 李勇 李应 余清清 《计算机工程与应用》 CSCD 北大核心 2011年第30期132-135,139,共5页
对生态环境中各种不同的声音进行快速准确的识别有重要的现实意义,但是因其具有较高背景噪声加大了识别的难度。提出一种具有良好抗噪能力和较高识别性能的两层音频识别技术。选择经过改进的新型的MFCC参数以及波动模型作为生态环境声... 对生态环境中各种不同的声音进行快速准确的识别有重要的现实意义,但是因其具有较高背景噪声加大了识别的难度。提出一种具有良好抗噪能力和较高识别性能的两层音频识别技术。选择经过改进的新型的MFCC参数以及波动模型作为生态环境声音的特征集合。利用这种新型的MFCC系数构造音频信号的高斯分布模型,并且计算未知音频信号与样本音频信号的高斯分布模型之间的Kullback-Leibler距离,随后计算它们的波动模型之间的欧几里德距离。根据计算出的Kullback-Leibler距离和欧几里德距离实现两层音频识别系统。实验结果表明两层音频识别技术即使在噪声的影响下也能保持较高的识别率。 展开更多
关键词 生态环境 声音识别 改进的mel频率倒谱参数 波动模型 Kullback-Leibler距离
在线阅读 下载PDF
融合GMM及SVM的特定音频事件高精度识别方法 被引量:5
18
作者 罗森林 王坤 +2 位作者 谢尔曼 潘丽敏 李金玉 《北京理工大学学报》 EI CAS CSCD 北大核心 2014年第7期716-722,共7页
针对特定音频事件识别中持续时间特别短的音频事件漏检概率高、识别速度较慢的问题,提出一种融合高斯混合模型(GMM)及支持向量机(SVM)的特定音频事件识别算法.该方法利用GMM的统计分布描述能力和SVM的推广泛化能力,将GMM和SVM分别识别... 针对特定音频事件识别中持续时间特别短的音频事件漏检概率高、识别速度较慢的问题,提出一种融合高斯混合模型(GMM)及支持向量机(SVM)的特定音频事件识别算法.该方法利用GMM的统计分布描述能力和SVM的推广泛化能力,将GMM和SVM分别识别的结果进行融合处理,以手枪、步枪、机关枪等10类以上枪声为实验数据,无需针对每种枪声生成相应的识别模板,仅需训练生成2个识别模板.实验结果表明,识别准确率达到92.71%.该方法模板数量少,不需要多次训练,算法复杂度较低,不仅便于应用而且可大幅提升识别效率. 展开更多
关键词 音频识别 高斯混合模型(GMM) 支持向量机(SVM) mel频率系数(MFCC) 特定音频事件
在线阅读 下载PDF
混响声场中语音识别方法研究 被引量:9
19
作者 栗学丽 徐柏龄 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第4期525-531,共7页
免提式话筒语音识别系统是语音识别走向实用的目标之一,实现这一系统,首先要解决房间效应引起的混响问题。通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC),即MFCC参数在对数功率谱域进... 免提式话筒语音识别系统是语音识别走向实用的目标之一,实现这一系统,首先要解决房间效应引起的混响问题。通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC),即MFCC参数在对数功率谱域进行低通滤波,倒谱域进行均值减,并用标准差加权进行非线性规整,采用这3种措施来消除混响引起的语音参数的变化,识别方法用矢量量化法,用4组无混响数码语音进行训练,对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98.7%。提出的这一新方法在不降低无混响音识别率的情况下,提高了混响声场的语音识别率。该方法不仅识别率高,而且运算量小、所需内存空间小,易于做成小型实用的快速识别系统。 展开更多
关键词 语音识别 混响声场 房间效应 滤波规整 mel频率参数 矢量量化
在线阅读 下载PDF
PSO-BP神经网络在语音干扰效果评估中的应用 被引量:5
20
作者 许亮 赵松波 +3 位作者 高强 莫家庆 吕小毅 郭翔 《现代电子技术》 北大核心 2019年第6期43-46,50,共5页
为了克服BP神经网络在连续语音数据干扰效果评估过程中存在的弊端缺陷,提出一种利用粒子群优化算法神经网络的客观语音干扰效果评估方法。该方法利用Mel倒谱技术提取所得的连续语音数据特征参数作为模型输入,再通过粒子群优化对BP神经... 为了克服BP神经网络在连续语音数据干扰效果评估过程中存在的弊端缺陷,提出一种利用粒子群优化算法神经网络的客观语音干扰效果评估方法。该方法利用Mel倒谱技术提取所得的连续语音数据特征参数作为模型输入,再通过粒子群优化对BP神经网络的初始权系进行多点优化,建立了粒子群算法优化的BP神经网络模型,通过优化后的神经网络模型实现输入值到对应主观评价MOS证,对比表明,粒子群算法优化后的BP神经网络模型,其收敛速度较传统BP在4%以内,模型相关系数和标准差更加接近理想参数。 展开更多
关键词 干扰 BP神经网络 粒子群优化算法 mel 特征参数 主观MOS
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部