期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
改善线性预测系数倒谱抗噪声性能的方法
1
作者 韩春光 《计算机工程与设计》 CSCD 北大核心 2005年第5期1377-1379,共3页
线性预测系数倒谱(LPCC)是说话人辨认系统中较为有效的特征参数之一,但是该参数的抗噪性能不好,当语音中含有噪声时,系统的识别率明显下降。基于MATLAB软件,建立了一高斯混合模型(GMM)的说话人辨认系统,提出了特征参数加权窗口的方法。... 线性预测系数倒谱(LPCC)是说话人辨认系统中较为有效的特征参数之一,但是该参数的抗噪性能不好,当语音中含有噪声时,系统的识别率明显下降。基于MATLAB软件,建立了一高斯混合模型(GMM)的说话人辨认系统,提出了特征参数加权窗口的方法。通过对多种加权窗口的正确识别率比较,发现对LPCC低阶参数的加窗提升,可以改善系统的噪声鲁棒性。MATLAB仿真结果显示,采用加窗后的系统识别率得到了明显改善。 展开更多
关键词 线性预测系数 说话人辨认 加权窗口 高斯混合模型 抗噪声性能 语音信号处理
在线阅读 下载PDF
一种基于线性预测残差倒谱的基音检测算法 被引量:9
2
作者 钱博 李燕萍 +1 位作者 唐振民 徐丽敏 《计算机工程与应用》 CSCD 北大核心 2007年第32期210-213,共4页
基音检测算法一直是音频处理领域的研究热点,但是语音信号声道特征对基音及其谐振结构的影响很大,增加了检测的难度。利用LP残差仅仅保留声门激励信号的特点,通过倒谱分析避免了声道特征和噪声的影响。同时针对倒谱分析中经常出现的半... 基音检测算法一直是音频处理领域的研究热点,但是语音信号声道特征对基音及其谐振结构的影响很大,增加了检测的难度。利用LP残差仅仅保留声门激励信号的特点,通过倒谱分析避免了声道特征和噪声的影响。同时针对倒谱分析中经常出现的半频倍频问题和低频截断问题,引入了谐波积谱(HPS)的解决方案,提高了识别的精度。实验表明,该方法能够较好地避免半频倍频错误,对于截去了低频和高频的电话信道语音也能够得到令人满意的检测结果,同时作为帧检测技术能够满足实时应用的需要。 展开更多
关键词 基音检测 线性预测残差 谐波积
在线阅读 下载PDF
改进加权线性预测倒谱的复合参数说话人识别
3
作者 杨顺辽 林峰 +1 位作者 刘焕升 陈玉炎 《计算机应用与软件》 CSCD 2011年第2期242-245,共4页
说话人识别和确认是信号处理中研究的热点之一,但有关文献表明识别效率并不是很高,而且训练和识别的语音要求都比较长,距离实际应用还有一定差距。分析了说话人识别中有关参数的选取对识别结果的影响,采用线性预测倒谱和基音参数共同作... 说话人识别和确认是信号处理中研究的热点之一,但有关文献表明识别效率并不是很高,而且训练和识别的语音要求都比较长,距离实际应用还有一定差距。分析了说话人识别中有关参数的选取对识别结果的影响,采用线性预测倒谱和基音参数共同作为识别参数,并采用矢量量化,改进了线性预测倒谱距离的加权函数,提供了与文本无关的说话人识别系统。最后给出了实验结果和有关分析,在低噪声时识别正确率可达99%以上,在高噪声时也能达到98%以上的正确率。 展开更多
关键词 说话人识别 线性预测 基音 矢量量化
在线阅读 下载PDF
铣削声谱LPCC与刀具切削时间的关系 被引量:3
4
作者 艾长胜 何光伟 +2 位作者 董全成 昃向博 孙选 《振动.测试与诊断》 EI CSCD 北大核心 2010年第3期264-268,共5页
提出了采用线性预测倒谱系数(linear predictive cepstrum coefficient,简称LPCC)监测刀具磨损的方法。使用LPCC作为可听阈内铣削声信号的声谱特征参数,对LPCC进行统计处理,计算LPCC分量的F比,分析LPCC分量与切削时间的关系,寻找LPCC与... 提出了采用线性预测倒谱系数(linear predictive cepstrum coefficient,简称LPCC)监测刀具磨损的方法。使用LPCC作为可听阈内铣削声信号的声谱特征参数,对LPCC进行统计处理,计算LPCC分量的F比,分析LPCC分量与切削时间的关系,寻找LPCC与刀具磨损之间的规律。研究结果表明,铣削声信号的LPCC相关分量加权和可以有效地反映铣刀的磨损变化规律。 展开更多
关键词 刀具 磨损 声音 监测 线性预测系数(lpcc)
在线阅读 下载PDF
两种倒谱特征提取技术在水声目标识别中的应用 被引量:11
5
作者 柳革命 孙超 杨益新 《西北工业大学学报》 EI CAS CSCD 北大核心 2008年第3期276-281,共6页
按照声纳员的感受,被动声纳目标被看作为一个发声体,目标噪声信号表示为激励噪声源与发声体冲激响应的卷积,在这一模型下,使用倒谱分析水声目标噪声的时域特征。提出利用线性预测倒谱和考虑人耳听觉特点的美尔倒谱分析发声体的冲激响应... 按照声纳员的感受,被动声纳目标被看作为一个发声体,目标噪声信号表示为激励噪声源与发声体冲激响应的卷积,在这一模型下,使用倒谱分析水声目标噪声的时域特征。提出利用线性预测倒谱和考虑人耳听觉特点的美尔倒谱分析发声体的冲激响应在倒谱域中的表示,据此对水声噪声信号提取这两种倒谱的特征,进行分类识别。设计了神经网络分类器,利用实测数据对三类目标进行分类。分析比较两种方法的分类结果,验证了基于倒谱的水声目标特征提取方法的可行性。 展开更多
关键词 被动声纳目标识别 线性预测(LPC) 美尔(Mel) 特征提取
在线阅读 下载PDF
基于倒谱修正模型的语音基音检测算法 被引量:3
6
作者 曾毓敏 吴镇扬 《南京理工大学学报》 EI CAS CSCD 北大核心 2007年第4期503-508,共6页
该文提出了一种基于修正倒谱模型的改进的倒谱基音检测算法。该算法首先对分帧语音进行10阶线性预测编码(LPC)分析和逆滤波,获得LPC预测残差;然后对残差信号进行倒谱分析,倒谱分析中采用了离散傅里叶变换频谱的高频分量置零的计算措施;... 该文提出了一种基于修正倒谱模型的改进的倒谱基音检测算法。该算法首先对分帧语音进行10阶线性预测编码(LPC)分析和逆滤波,获得LPC预测残差;然后对残差信号进行倒谱分析,倒谱分析中采用了离散傅里叶变换频谱的高频分量置零的计算措施;最后根据倒谱的特征求得浊音语音的基音周期。仿真检测结果表明:该算法无论对纯净语音,还是对不同加噪情况下的含噪语音,其基音检测结果都明显优于传统倒谱基音检测算法,并且也明显优于基于平均幅度差函数的基音检测算法,而略优于基于自相关函数的基音检测算法。 展开更多
关键词 基音 线性预测编码 预测残差
在线阅读 下载PDF
一种改进的倒谱基音提取算法 被引量:3
7
作者 朱颖 钱盛友 《计算机工程与应用》 CSCD 北大核心 2009年第15期158-159,172,共3页
介绍一种基音检测的新方法。该算法首先对分帧语音采用Burg算法进行LPC分析,获取最佳预测系数构造逆滤波器;然后通过逆滤波得到预测误差序列代替原输入语音序列进行倒谱分析;最后在恰当的范围里测出最大峰值,进行基音检测。实验结果表明... 介绍一种基音检测的新方法。该算法首先对分帧语音采用Burg算法进行LPC分析,获取最佳预测系数构造逆滤波器;然后通过逆滤波得到预测误差序列代替原输入语音序列进行倒谱分析;最后在恰当的范围里测出最大峰值,进行基音检测。实验结果表明,与传统方法相比,该方法鲁棒性好,在信噪比低的情况下仍可获得较高的准确率。 展开更多
关键词 基音 线性预测编码 预测误差 Burg算法
在线阅读 下载PDF
一种新的基于倒谱的共振峰频率检测算法 被引量:9
8
作者 赵毅 尹雪飞 陈克安 《应用声学》 CSCD 北大核心 2010年第6期416-424,共9页
共振峰频率是语音信号的一个重要参数。传统的基于线性预测的共振峰检测算法由于受到计算量的限制,很难实现实时处理。本文提出一种基于倒谱变换的共振峰频率检测算法,采用后置处理,比较声道冲击响应对数幅频特性的二次导数和相频特性... 共振峰频率是语音信号的一个重要参数。传统的基于线性预测的共振峰检测算法由于受到计算量的限制,很难实现实时处理。本文提出一种基于倒谱变换的共振峰频率检测算法,采用后置处理,比较声道冲击响应对数幅频特性的二次导数和相频特性一次导数检测出的结果,删除伪峰数值和甄别合并共振峰,提高检测精度。仿真结果证明,该算法计算效率高,低信噪比下仍能保持较好的检测性能。 展开更多
关键词 变换 共振峰频率 检测算法 based detection algorithm 语音信号 相频特性 线性预测 实时处理 仿真结果 检测性能 检测精度 计算效率 后置处理 幅频特性 二次导数 低信噪比 冲击响应 计算量 证明
在线阅读 下载PDF
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别 被引量:5
9
作者 曾毓敏 吴镇扬 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第6期935-941,共7页
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系... 提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率. 展开更多
关键词 说话人识别 重建 感知线性预测系数 噪声补偿 平坦度测度
在线阅读 下载PDF
基于神经网络由语音预测视位参数 被引量:2
10
作者 王志明 蔡莲红 《小型微型计算机系统》 CSCD 北大核心 2005年第6期1083-1087,共5页
语音是由多个发音器官共同作用产生的,发音器官动作与语音之间有着内在的必然联系.研究了利用神经网络预测视位参数中的选择语音参数、确定输入语音时域范围、优化神经网络结构等因素.实验结果表明,线性预测参数加短时能量优于其他语音... 语音是由多个发音器官共同作用产生的,发音器官动作与语音之间有着内在的必然联系.研究了利用神经网络预测视位参数中的选择语音参数、确定输入语音时域范围、优化神经网络结构等因素.实验结果表明,线性预测参数加短时能量优于其他语音参数,前向协同发音较后向协同发音影响更大,反馈对前馈神经网络的性能有所改善.考虑到实验采用的是任意连续语流,均方误差约为0.0114的实验结果还是很有吸引力的. 展开更多
关键词 前馈神经网络 视位 线性预测系数 线系数 系数 反射系数 MEL系数 均方误差
在线阅读 下载PDF
语音识别中谱包自相关技术 被引量:1
11
作者 徐静波 于洪涛 冉崇森 《数据采集与处理》 CSCD 2004年第4期421-424,共4页
提出了一种语音识别线性预测分析方法 :基于谱自相关和频率抽样获得谱包 ,即由归一化频率估计谱包 ,此谱包规定在 Mel频率级 ;再由语音信号谱包估计抽样自相关 ,用 IDFT提取抽样自相关估计。从抽样自相关的结果 ,最终获得谱包倒谱系数。... 提出了一种语音识别线性预测分析方法 :基于谱自相关和频率抽样获得谱包 ,即由归一化频率估计谱包 ,此谱包规定在 Mel频率级 ;再由语音信号谱包估计抽样自相关 ,用 IDFT提取抽样自相关估计。从抽样自相关的结果 ,最终获得谱包倒谱系数。HMM识别试验显示 :谱包倒谱系数与其他算法相比较 ,在低信噪比时 ,识别率可提高 1 0 %以上 ,识别性能明显提高 ,在噪声环境下也能达到好的识别效果。 展开更多
关键词 自相关 语音识别 IDFT 语音信号 频率估计 线性预测 系数 识别率 显示
在线阅读 下载PDF
基于LPCC和能量熵的端点检测 被引量:6
12
作者 朱晓晶 侯旭初 +1 位作者 崔慧娟 唐昆 《电讯技术》 北大核心 2010年第6期41-45,共5页
为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法。首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率... 为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法。首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率的比较作出有声无声初判决;联合能量熵端点检测结果得到最终判决,最后通过Hangover机制最大限度的保护了语音。实验结果表明,此方法改善了能量熵端点检测法在babble噪声下的劣势,且在不同噪声环境下均优于G.729 Annex B的性能。 展开更多
关键词 语音信号处理 话音端点检测 线性预测系数 系数 高斯混合模型
在线阅读 下载PDF
短时谱特征的汉语重音检测方法研究 被引量:2
13
作者 赵云雪 张珑 郑世杰 《计算机科学与探索》 CSCD 2014年第9期1120-1128,共9页
重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual line... 重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chinese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。 展开更多
关键词 重音检测 Mel频率系数(MFCC) 相关感知线性预测(RASTA-PLP) 短时特征
在线阅读 下载PDF
基于GMM模型和LPC-MFCC联合特征的声道谱转换研究 被引量:11
14
作者 曾歆 张雄伟 +2 位作者 孙蒙 苗晓孔 姚琨 《声学技术》 CSCD 北大核心 2020年第4期451-455,共5页
声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略... 声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略了不同声道特征参数之间可能存在的互补性。针对这一问题,研究了不同声道特征参数之间进行联合建模的方法,引入了一种由线性预测系数(LinearPredictionCoefficient,LPC)和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)联合构成的LPC-MFCC特征参数,提出了一种基于高斯混合模型(Gaussian Mixture Model, GMM)和LPC-MFCC联合特征参数的语音转换方法。为验证文中方法的有效性,仿真实验选取了基于GMM和LPC的语音转换方法进行对比,对多组实验数据进行主观和客观测试,结果表明,文中提出的语音转换方法可以获得相似度更高的转换语音。 展开更多
关键词 语音转换 声道转换 高斯混合模型 联合建模 线性预测系数-梅尔频率系数
在线阅读 下载PDF
试验环境水下声信号的特征提取方法 被引量:1
15
作者 王红滨 王永乐 +1 位作者 何鸣 薛垚 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第3期489-495,共7页
水下试验环境参数的反演是水声学研究领域的重要内容。而当前研究的关键是通过对水下声信号做特征提取从而获取参数信息。针对特征提取较难、模型很难拟合等问题。本文提出了一种试验环境水下声信号的特征提取方法。将水下声信号同时用... 水下试验环境参数的反演是水声学研究领域的重要内容。而当前研究的关键是通过对水下声信号做特征提取从而获取参数信息。针对特征提取较难、模型很难拟合等问题。本文提出了一种试验环境水下声信号的特征提取方法。将水下声信号同时用梅尔频谱倒谱系数及线性预测系数处理,两者运用特征加权组合方法得到新的特征矩阵;再应用映射插值算法对特征矩阵进行处理,获得适应神经网络输入的三通道矩阵。本文选取的网络模型为残差神经网络。利用实验室所录制的对河口水库数据集测试表明,本文提出的特征提取方法普遍优于仅利用梅尔频谱倒谱系数或线性预测系数的特征处理方法。利用单频矩形脉冲信号对环境进行深度5分类,准确率平均提升2%。利用线性调频信号对环境进行深度5分类,准确率平均提升2.03%。本文提出的特征提取方法对线性调频信号在深度分类任务下处理的结果要优于单频矩形脉冲信号处理的结果。 展开更多
关键词 环境反演 特征提取 梅尔频系数 线性预测系数 特征加权组合方法 残差神经网络 神经网络 水下声信号
在线阅读 下载PDF
特定人孤立词的语音识别系统研究 被引量:17
16
作者 彭辉 魏玮 陆建华 《控制工程》 CSCD 北大核心 2011年第3期397-400,404,共5页
语音识别是让机器自动识别和理解语音信号,并把语音信号转变为相应的文本或命令的技术。通过对特定人孤立词语音特点的研究,在对语音信号进行预处理的过程中,选择过零率与短时平均能量两项指标作为对语音信号端点检测的依据,提取语音线... 语音识别是让机器自动识别和理解语音信号,并把语音信号转变为相应的文本或命令的技术。通过对特定人孤立词语音特点的研究,在对语音信号进行预处理的过程中,选择过零率与短时平均能量两项指标作为对语音信号端点检测的依据,提取语音线性预测系数,通过计算分析后获得线性预测倒谱系数,作为语音特征参数。选择动态时间规整法为模板匹配算法,并针对传统匹配算法中计算量大的特点,作出改进,采用全局限制的方法以减小匹配过程中的计算量。采用上述算法设计了一种基于特定人的孤立词语音识别系统,并对该系统进行了多种背景条件下的M atlab仿真研究。仿真实验结果表明,此算法对于特点人孤立词的语音识别能达到较好的识别效果。 展开更多
关键词 语音识别 线性预测 动态规划 动态时间规整
在线阅读 下载PDF
基于声道特性的腭裂语音高鼻音等级自动识别 被引量:2
17
作者 唐铭 何岩萍 +2 位作者 尹恒 刘奇 何凌 《计算机工程与应用》 CSCD 北大核心 2018年第21期141-147,共7页
腭裂语音高鼻音等级的自动识别对于腭咽功能的评估具有重要临床价值。对腭裂语音高鼻音等级自动识别算法进行了研究,提出基于声道特性的腭裂语音高鼻音等级自动识别算法。利用高低阶线性预测倒谱系数(Linear Prediction Cepstrum Coeffi... 腭裂语音高鼻音等级的自动识别对于腭咽功能的评估具有重要临床价值。对腭裂语音高鼻音等级自动识别算法进行了研究,提出基于声道特性的腭裂语音高鼻音等级自动识别算法。利用高低阶线性预测倒谱系数(Linear Prediction Cepstrum Coefficient,LPCC)与倒谱系数结合成为LPCC-Cep特征组作为声学特征参数,采用稀疏表示分类器(Sparse Representation based Classification,SRC)实现腭裂语音四类高鼻音等级(正常、轻度、中度和重度)的自动识别。实验结果表明,提出的自动识别算法取得了较高的高鼻音类别正确识别率。其中,LPCC-Cep特征组参数对高鼻音等级的正确识别率为83.38%。 展开更多
关键词 腭裂语音 高鼻音 线性预测 稀疏表示
在线阅读 下载PDF
鼾声的基频分布与SAHS的关联性 被引量:4
18
作者 侯丽敏 施晓宇 +1 位作者 童超 刘焕成 《声学技术》 CSCD 北大核心 2019年第2期176-181,共6页
由于鼾声中包含较多的呼吸气流引起的随机信号,采用两次线性预测残差处理得到鼾声的声源信号,再经过倒谱计算,提取鼾声的基频值。按鼾声时域波形的准周期性将其分类,提取鼾声的基频并统计其分布,与睡眠呼吸暂停低通气综合征(Sleep Apnea... 由于鼾声中包含较多的呼吸气流引起的随机信号,采用两次线性预测残差处理得到鼾声的声源信号,再经过倒谱计算,提取鼾声的基频值。按鼾声时域波形的准周期性将其分类,提取鼾声的基频并统计其分布,与睡眠呼吸暂停低通气综合征(Sleep Apnea Hypopnea Syndrome, SAHS)诊断的严重程度做对比,对93名受试者的鼾声做了分析,发现随着SAHS严重程度的加重,鼾声具有的准周期性减少,基频轨迹的抖动有增大的趋势。利用基频与Mel频率倒谱系数(Mel-Frequency Cepstral Coefficients, MFCC)特征对SAHS严重程度的诊断进行估计,正确率为85.8%。鼾声基频相关的统计特性可以作为判断SAHS严重程度的参数之一。研究成果对便携式鼾症检测仪的设计与实现起到了很好的参考作用。 展开更多
关键词 睡眠呼吸暂停低通气综合征 线性预测 鼾声 基频
在线阅读 下载PDF
基于DSP的语音识别智能控制系统 被引量:7
19
作者 常丹华 郑春蕾 《电子测量技术》 2008年第4期175-178,共4页
介绍了语音识别的基本原理及用浮点数字信号处理器(DSP)TMS320C32实现语音识别算法的一些原则和方法,阐述了语音识别的DSP实现技术,系统以预测倒谱参数为特征参数,并采用计算量相对较小的改进的动态时间规整(DTW)算法实现语音参数模板匹... 介绍了语音识别的基本原理及用浮点数字信号处理器(DSP)TMS320C32实现语音识别算法的一些原则和方法,阐述了语音识别的DSP实现技术,系统以预测倒谱参数为特征参数,并采用计算量相对较小的改进的动态时间规整(DTW)算法实现语音参数模板匹配,能够实现特定人、孤立词、小词汇量的语音识别,并用MATLAB进行了算法仿真,从而将语音识别技术应用到智能控制系统中,给出了实验结果和误差分析。试验结果表明,系统正确识别率在89.96%,具有一定的实用价值。 展开更多
关键词 DSP 语音识别 线性预测参数 动态时间规整(DTW)算法
在线阅读 下载PDF
说话人识别中基于Fisher比的特征组合方法 被引量:3
20
作者 谢小娟 曾以成 熊冰峰 《计算机应用》 CSCD 北大核心 2016年第5期1421-1425,共5页
为了提高说话人识别的准确率,可以同时采用多个特征参数,针对综合特征参数中各维分量对识别结果的影响可能不一样,同等对待并不一定是最优的方案这个问题,提出基于Fisher准则的梅尔频率倒谱系数(MFCC)、线性预测梅尔倒谱系数(LPMFCC)、T... 为了提高说话人识别的准确率,可以同时采用多个特征参数,针对综合特征参数中各维分量对识别结果的影响可能不一样,同等对待并不一定是最优的方案这个问题,提出基于Fisher准则的梅尔频率倒谱系数(MFCC)、线性预测梅尔倒谱系数(LPMFCC)、Teager能量算子倒谱参数(TEOCC)相混合的特征参数提取方法。首先,提取语音信号的MFCC、LPMFCC和TEOCC三种参数;然后,计算MFCC和LPMFCC参数中各维分量的Fisher比,分别选出六个Fisher比高的分量与TEOCC参数组合成混合特征参数;最后,采用TIMIT语音库和NOISEX-92噪声库进行说话人识别实验。仿真实验表明,所提方法与MFCC、LPMFCC、MFCC+LPMFCC、基于Fisher比的梅尔倒谱系数混合特征提取方法以及基于主成分分析(PCA)的特征抽取方法相比,在采用高斯混合模型(GMM)和BP神经网络的平均识别率在纯净语音环境下分别提高了21.65个百分点、18.39个百分点、15.61个百分点、15.01个百分点与22.70个百分点;在30 d B噪声环境下,则分别提升了15.15个百分点、10.81个百分点、8.69个百分点、7.64个百分点与17.76个百分点。实验结果表明,该混合特征参数能够有效提高说话人识别率,且具有更好的鲁棒性。 展开更多
关键词 说话人识别 FISHER准则 梅尔频率系数 线性预测系数 TEAGER能量算子
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部