期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
一种基于MFCC和LPCC的文本相关说话人识别方法 被引量:14
1
作者 于明 袁玉倩 +1 位作者 董浩 王哲 《计算机应用》 CSCD 北大核心 2006年第4期883-885,共3页
在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。... 在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。通过与动态时间规整算法和传统的矢量量化方法进行比较表明,在系统响应时间并未明显增加的基础上,该模型识别率有一定提高。 展开更多
关键词 说话人识别 线性预测倒谱系数 美尔倒谱系数 矢量量化 动态时间规整
在线阅读 下载PDF
基于切削声LPCC的刀具磨损监测 被引量:6
2
作者 艾长胜 何光伟 +1 位作者 董全成 昃向博 《中国机械工程》 EI CAS CSCD 北大核心 2009年第17期2045-2048,共4页
提出了基于切削声线性预测倒谱系数(LPCC)的刀具磨损状态监测方法。采用LPCC对可听阈内的切削声信号进行表征,分析了LPCC的分量与刀具磨损的关系。利用LPCC相关分量加权和反映刀具的磨损状态,并进行了验证。研究结果表明,切削声信号的L... 提出了基于切削声线性预测倒谱系数(LPCC)的刀具磨损状态监测方法。采用LPCC对可听阈内的切削声信号进行表征,分析了LPCC的分量与刀具磨损的关系。利用LPCC相关分量加权和反映刀具的磨损状态,并进行了验证。研究结果表明,切削声信号的LPCC相关分量加权和可以有效地反映刀具的磨损状态。 展开更多
关键词 刀具磨损 在线监测 切削声 线性预测倒谱系数 相关分析
在线阅读 下载PDF
基于MFCC和LPCC的说话人识别 被引量:48
3
作者 余建潮 张瑞林 《计算机工程与设计》 CSCD 北大核心 2009年第5期1189-1191,共3页
MFCC参数和LPCC参数是说话人识别中两种最常用的特征参数,研究了MFCC和LPCC参数提取的算法原理及差分倒谱参数的提取方法,采用MFCC、LPCC及其一阶、二阶差分作为特征参数,通过k均值算法与三层BP神经网络来进行说话人识别。实验结果表明... MFCC参数和LPCC参数是说话人识别中两种最常用的特征参数,研究了MFCC和LPCC参数提取的算法原理及差分倒谱参数的提取方法,采用MFCC、LPCC及其一阶、二阶差分作为特征参数,通过k均值算法与三层BP神经网络来进行说话人识别。实验结果表明,该方法可以有效提高识别率,同时也验证MFCC参数的鲁棒性优于LPCC参数。 展开更多
关键词 lpcc MFCC 特征提取 说话人识别 神经网络 K均值算法
在线阅读 下载PDF
铣削声谱LPCC与刀具切削时间的关系 被引量:3
4
作者 艾长胜 何光伟 +2 位作者 董全成 昃向博 孙选 《振动.测试与诊断》 EI CSCD 北大核心 2010年第3期264-268,共5页
提出了采用线性预测倒谱系数(linear predictive cepstrum coefficient,简称LPCC)监测刀具磨损的方法。使用LPCC作为可听阈内铣削声信号的声谱特征参数,对LPCC进行统计处理,计算LPCC分量的F比,分析LPCC分量与切削时间的关系,寻找LPCC与... 提出了采用线性预测倒谱系数(linear predictive cepstrum coefficient,简称LPCC)监测刀具磨损的方法。使用LPCC作为可听阈内铣削声信号的声谱特征参数,对LPCC进行统计处理,计算LPCC分量的F比,分析LPCC分量与切削时间的关系,寻找LPCC与刀具磨损之间的规律。研究结果表明,铣削声信号的LPCC相关分量加权和可以有效地反映铣刀的磨损变化规律。 展开更多
关键词 刀具 磨损 声音 监测 线性预测倒谱系数(lpcc)
在线阅读 下载PDF
基于LPCC和能量熵的端点检测 被引量:6
5
作者 朱晓晶 侯旭初 +1 位作者 崔慧娟 唐昆 《电讯技术》 北大核心 2010年第6期41-45,共5页
为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法。首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率... 为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法。首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率的比较作出有声无声初判决;联合能量熵端点检测结果得到最终判决,最后通过Hangover机制最大限度的保护了语音。实验结果表明,此方法改善了能量熵端点检测法在babble噪声下的劣势,且在不同噪声环境下均优于G.729 Annex B的性能。 展开更多
关键词 语音信号处理 话音端点检测 谱熵 线性预测系数 倒谱系数 高斯混合模型
在线阅读 下载PDF
话者识别系统中语音特征参数的研究与仿真 被引量:17
6
作者 王金明 张雄伟 《系统仿真学报》 CAS CSCD 2003年第9期1276-1278,共3页
在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用... 在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用对识别系统性能的影响。通过仿真和实验,证明混合参数识别方法能使话者识别系统的正确识别率有明显的提高。 展开更多
关键词 说话者识别 动态特征 线性预测倒谱系数 美尔倒谱系数 仿真
在线阅读 下载PDF
两种倒谱特征提取技术在水声目标识别中的应用 被引量:11
7
作者 柳革命 孙超 杨益新 《西北工业大学学报》 EI CAS CSCD 北大核心 2008年第3期276-281,共6页
按照声纳员的感受,被动声纳目标被看作为一个发声体,目标噪声信号表示为激励噪声源与发声体冲激响应的卷积,在这一模型下,使用倒谱分析水声目标噪声的时域特征。提出利用线性预测倒谱和考虑人耳听觉特点的美尔倒谱分析发声体的冲激响应... 按照声纳员的感受,被动声纳目标被看作为一个发声体,目标噪声信号表示为激励噪声源与发声体冲激响应的卷积,在这一模型下,使用倒谱分析水声目标噪声的时域特征。提出利用线性预测倒谱和考虑人耳听觉特点的美尔倒谱分析发声体的冲激响应在倒谱域中的表示,据此对水声噪声信号提取这两种倒谱的特征,进行分类识别。设计了神经网络分类器,利用实测数据对三类目标进行分类。分析比较两种方法的分类结果,验证了基于倒谱的水声目标特征提取方法的可行性。 展开更多
关键词 被动声纳目标识别 线性预测(LPC)倒谱 美尔(Mel)倒谱 特征提取
在线阅读 下载PDF
语音信号时频特征显示系统的设计和仿真 被引量:3
8
作者 王光艳 赵晓群 王霞 《计算机工程与应用》 CSCD 北大核心 2010年第29期73-75,97,共4页
语音信号处理算法众多,但用于语音处理算法验证和开发的可视化研究平台极少。基于MATLAB GUI技术,完成语音信号典型时频特征参数提取和显示系统仿真平台的设计。可实现多种格式音频文件的载入和播放、波形和频谱显示、以及线性预测倒谱... 语音信号处理算法众多,但用于语音处理算法验证和开发的可视化研究平台极少。基于MATLAB GUI技术,完成语音信号典型时频特征参数提取和显示系统仿真平台的设计。可实现多种格式音频文件的载入和播放、波形和频谱显示、以及线性预测倒谱系数和美尔倒谱系数的计算、存储和显示等功能。系统界面友好、操作方便,可实现参数的交互输入并控制显示结果。仿真结果验证了相关时频特征参数提取算法的正确性,提高了对算法或数据处理效果的直观认识。 展开更多
关键词 时频特征 频谱 线性预测倒谱系数 美尔倒谱系数
在线阅读 下载PDF
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别 被引量:5
9
作者 曾毓敏 吴镇扬 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第6期935-941,共7页
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系... 提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率. 展开更多
关键词 说话人识别 频谱重建 感知线性预测倒谱系数 噪声补偿 谱平坦度测度
在线阅读 下载PDF
基于DSP的语音识别智能控制系统 被引量:7
10
作者 常丹华 郑春蕾 《电子测量技术》 2008年第4期175-178,共4页
介绍了语音识别的基本原理及用浮点数字信号处理器(DSP)TMS320C32实现语音识别算法的一些原则和方法,阐述了语音识别的DSP实现技术,系统以预测倒谱参数为特征参数,并采用计算量相对较小的改进的动态时间规整(DTW)算法实现语音参数模板匹... 介绍了语音识别的基本原理及用浮点数字信号处理器(DSP)TMS320C32实现语音识别算法的一些原则和方法,阐述了语音识别的DSP实现技术,系统以预测倒谱参数为特征参数,并采用计算量相对较小的改进的动态时间规整(DTW)算法实现语音参数模板匹配,能够实现特定人、孤立词、小词汇量的语音识别,并用MATLAB进行了算法仿真,从而将语音识别技术应用到智能控制系统中,给出了实验结果和误差分析。试验结果表明,系统正确识别率在89.96%,具有一定的实用价值。 展开更多
关键词 DSP 语音识别 线性预测倒谱参数 动态时间规整(DTW)算法
在线阅读 下载PDF
说话人识别中基于Fisher比的特征组合方法 被引量:3
11
作者 谢小娟 曾以成 熊冰峰 《计算机应用》 CSCD 北大核心 2016年第5期1421-1425,共5页
为了提高说话人识别的准确率,可以同时采用多个特征参数,针对综合特征参数中各维分量对识别结果的影响可能不一样,同等对待并不一定是最优的方案这个问题,提出基于Fisher准则的梅尔频率倒谱系数(MFCC)、线性预测梅尔倒谱系数(LPMFCC)、T... 为了提高说话人识别的准确率,可以同时采用多个特征参数,针对综合特征参数中各维分量对识别结果的影响可能不一样,同等对待并不一定是最优的方案这个问题,提出基于Fisher准则的梅尔频率倒谱系数(MFCC)、线性预测梅尔倒谱系数(LPMFCC)、Teager能量算子倒谱参数(TEOCC)相混合的特征参数提取方法。首先,提取语音信号的MFCC、LPMFCC和TEOCC三种参数;然后,计算MFCC和LPMFCC参数中各维分量的Fisher比,分别选出六个Fisher比高的分量与TEOCC参数组合成混合特征参数;最后,采用TIMIT语音库和NOISEX-92噪声库进行说话人识别实验。仿真实验表明,所提方法与MFCC、LPMFCC、MFCC+LPMFCC、基于Fisher比的梅尔倒谱系数混合特征提取方法以及基于主成分分析(PCA)的特征抽取方法相比,在采用高斯混合模型(GMM)和BP神经网络的平均识别率在纯净语音环境下分别提高了21.65个百分点、18.39个百分点、15.61个百分点、15.01个百分点与22.70个百分点;在30 d B噪声环境下,则分别提升了15.15个百分点、10.81个百分点、8.69个百分点、7.64个百分点与17.76个百分点。实验结果表明,该混合特征参数能够有效提高说话人识别率,且具有更好的鲁棒性。 展开更多
关键词 说话人识别 FISHER准则 梅尔频率倒谱系数 线性预测系数 TEAGER能量算子
在线阅读 下载PDF
基于神经网络由语音预测视位参数 被引量:2
12
作者 王志明 蔡莲红 《小型微型计算机系统》 CSCD 北大核心 2005年第6期1083-1087,共5页
语音是由多个发音器官共同作用产生的,发音器官动作与语音之间有着内在的必然联系.研究了利用神经网络预测视位参数中的选择语音参数、确定输入语音时域范围、优化神经网络结构等因素.实验结果表明,线性预测参数加短时能量优于其他语音... 语音是由多个发音器官共同作用产生的,发音器官动作与语音之间有着内在的必然联系.研究了利用神经网络预测视位参数中的选择语音参数、确定输入语音时域范围、优化神经网络结构等因素.实验结果表明,线性预测参数加短时能量优于其他语音参数,前向协同发音较后向协同发音影响更大,反馈对前馈神经网络的性能有所改善.考虑到实验采用的是任意连续语流,均方误差约为0.0114的实验结果还是很有吸引力的. 展开更多
关键词 前馈神经网络 视位 线性预测系数 线谱对系数 实倒谱系数 反射系数 MEL倒谱系数 均方误差
在线阅读 下载PDF
基于频率段的语音识别算法设计与实现 被引量:1
13
作者 袁正午 肖旺辉 《计算机工程与设计》 CSCD 北大核心 2011年第2期659-662,共4页
线性预测倒谱参数(LPCC)能很好的体现人的声道特性,而梅尔倒谱参数(MFCC)能很好的模拟人耳的听觉效应。针对MFCC在不同频率段的识别精度不一致和LPCC不能准确模拟人的听觉系统问题,将MFCC参数和IMFCC参数分别作为语音不同频率段的特征参... 线性预测倒谱参数(LPCC)能很好的体现人的声道特性,而梅尔倒谱参数(MFCC)能很好的模拟人耳的听觉效应。针对MFCC在不同频率段的识别精度不一致和LPCC不能准确模拟人的听觉系统问题,将MFCC参数和IMFCC参数分别作为语音不同频率段的特征参数,结合线性预测参数(LPCC),均衡滤波器的分布,完整覆盖到整个频率段范围。将梅尔倒谱参数和线性预测参数结合起来作为语音识别的特征提取参数。实验结果表明,改进之后的算法从效率上和识别率上都有不同程度的提高。 展开更多
关键词 线性预测参数(lpcc) 梅尔倒谱系数(MFCC) 逆梅尔倒谱系数(IMFCC) 语音识别 特征提取
在线阅读 下载PDF
多类型语音特征进化选择算法
14
作者 张小恒 谢文宾 李勇明 《计算机工程与应用》 CSCD 北大核心 2016年第14期150-155,219,共7页
基于特征选择的语音特征获取用于说话人识别是目前较为有效的方式。但是,最优语音特征随着具体应用环境的变化而不同。因此,提出了基于四类型语音特征封装式遗传特征选择算法(FSF-Wr GAF),该算法提取了四种类型的语音特征参数,通过链式... 基于特征选择的语音特征获取用于说话人识别是目前较为有效的方式。但是,最优语音特征随着具体应用环境的变化而不同。因此,提出了基于四类型语音特征封装式遗传特征选择算法(FSF-Wr GAF),该算法提取了四种类型的语音特征参数,通过链式智能体遗传算法和GMM-UBM进行封装式动态特征选择,获取高精度的识别准确率。采用了多种指标完成该算法的性能测试。实验结果表明,该算法具体实现过程简便,改进效果明显,较同类算法在多项指标(识别率,EER,DET曲线)上都有显著提高。 展开更多
关键词 说话人识别 多类型语音特征 链式智能体遗传算法 伽马通滤波器倒谱系数(GFCC) 梅尔频率倒谱系数(MFCC) 线性预测倒谱系数(lpcc)
在线阅读 下载PDF
基于线性预测倒谱系数的地震相分析 被引量:12
15
作者 解滔 郑晓东 张? 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2016年第11期4266-4277,共12页
本文借鉴语音识别技术中的线性预测倒谱系数(LPCC系数)特征参数提取方法对地震数据进行分解,这种方法的优点是:可以获得将子波和反射系数信息分离的地震语音特征参数,对地质现象边界具有较好的描述能力,使我们可以从不同维度更细致地观... 本文借鉴语音识别技术中的线性预测倒谱系数(LPCC系数)特征参数提取方法对地震数据进行分解,这种方法的优点是:可以获得将子波和反射系数信息分离的地震语音特征参数,对地质现象边界具有较好的描述能力,使我们可以从不同维度更细致地观察隐藏在地震数据中的地质特征.理论模型分析表明,基于LPCC系数的地震分析具有较高的地震相划分能力.实际地震资料应用表明,LPCC系数对储层特征的描述比常规三瞬属性更为细致,不同阶次LPCC系数在描述储层不同特征时也保持了内在的联系.采用K均值聚类方法对提取的12阶和24阶LPCC系数进行聚类分析,聚类结果与目的层段古地形较为吻合,较好地反映了研究区的断裂、礁滩相带、深水扇和储层的分布特征,说明在地震相分析中采用LPCC系数作为特征参数是可行和有效的. 展开更多
关键词 线性预测倒谱系数 地震相分析 储层预测 K均值聚类 语音识别
全文增补中
不同录音系统对声纹检测的影响 被引量:5
16
作者 达钊 李倩 +1 位作者 郭霞生 章东 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第2期201-207,共7页
声纹识别已在身份识别中得以应用.本文采用三种常用数字录音系统(语音笔、话筒及手机)录制样本,并对这些样本进行基音分析,线性预测系数法提取共振峰以及美尔倒谱系数.结果表明,录音设备自身性能的差异对声纹参数存在影响,尤其是存在共... 声纹识别已在身份识别中得以应用.本文采用三种常用数字录音系统(语音笔、话筒及手机)录制样本,并对这些样本进行基音分析,线性预测系数法提取共振峰以及美尔倒谱系数.结果表明,录音设备自身性能的差异对声纹参数存在影响,尤其是存在共振峰的丢失现象,提取的美尔倒谱系数包络存在一定差异. 展开更多
关键词 声纹 线性预测系数 录音系统 美尔倒谱系数 共振峰 基音
在线阅读 下载PDF
语音识别方法在水下目标识别中的应用 被引量:1
17
作者 曾渊 李钢虎 +1 位作者 赵亚楠 苗雨 《声学技术》 CSCD 2012年第5期530-534,共5页
水下目标识别是潜艇在海战中,先敌发现并有效进行水声对抗的关键技术。然而,如何根据声纳接收到的舰船辐射噪声对三类目标进行分类识别是长期困扰人们的问题。研究了四种语音识别中常用的方法——线性预测系数(LPC),线性预测倒谱系数(LP... 水下目标识别是潜艇在海战中,先敌发现并有效进行水声对抗的关键技术。然而,如何根据声纳接收到的舰船辐射噪声对三类目标进行分类识别是长期困扰人们的问题。研究了四种语音识别中常用的方法——线性预测系数(LPC),线性预测倒谱系数(LPCC),美尔倒谱系数(MFCC)和最小均方无失真响应(MVDR),在水下目标识别中的应用效果,并比较了这四种方法在无噪声情况下的识别概率,以及在不同信噪比下的识别概率,并通过比较找到在无噪声和有噪声情况下的最佳方法。实验表明,在无噪声的情况下,MFCC方法总体识别率最高,第一类目标MFCC方法的识别率最高,第二类目标MFCC和MVDR方法识别率相似,好于其他两者,第三类目标MVDR方法识别率最高。在加入噪声的情况下,MVDR方法对三类目标的识别和抗噪声性能明显好于其余三者。 展开更多
关键词 语音识别 线性预测系数 线性预测倒谱系数 美尔倒谱系数 最小均方无失真响应
在线阅读 下载PDF
说话人识别的特征组合方法 被引量:2
18
作者 毛燕湖 曾以成 +1 位作者 陈雨莺 谢小娟 《计算机应用》 CSCD 北大核心 2015年第A02期242-244,共3页
针对说话人识别中线性预测系数(LPC)和梅尔频率倒谱系数(MFCC)的直接组合会增加特征参数的维数和出现运算量大的问题,提出了将LPC参数融入到MFCC参数的计算中的特征提取方法。首先,计算语音信号的LPC系数,求出LPC功率谱;其次,将LPC功率... 针对说话人识别中线性预测系数(LPC)和梅尔频率倒谱系数(MFCC)的直接组合会增加特征参数的维数和出现运算量大的问题,提出了将LPC参数融入到MFCC参数的计算中的特征提取方法。首先,计算语音信号的LPC系数,求出LPC功率谱;其次,将LPC功率谱通过三角形滤波器组,并取对数;最后,将取对数后的输出做离散余弦变换,得到新特征线性预测梅尔频率倒谱系数(LPMFCC)。LPMFCC参数兼具LPC参数的声道特性和MFCC参数的听觉特性,虽增加了一步计算,但不增加参数的维数,运算量相对较少。实验结果表明,在纯净语音环境下,提出的LPMFCC参数的说话人识别率较LPC参数和MFCC参数的说话人识别率分别提升了18.57%和10%,在不同噪声环境下,分别提高了13.22%和4.55%。 展开更多
关键词 说话人识别 梅尔频率倒谱系数 线性预测系数 矢量量化 高斯混合模型
在线阅读 下载PDF
基于发声机理与人耳感知特性的说话人识别 被引量:3
19
作者 杜晓青 于凤芹 《计算机工程》 CAS CSCD 2013年第11期197-199,204,共4页
Mel频率倒谱系数(MFCC)与线性预测倒谱系数(LPCC)融合算法只能反映语音静态特征,且LPCC对语音低频局部特征描述不足。为此,提出将希尔伯特黄变换(HHT)倒谱系数与相对光谱-感知线性预测倒谱系数(RASTA-PLPCC)融合,得到一种既反映发声机... Mel频率倒谱系数(MFCC)与线性预测倒谱系数(LPCC)融合算法只能反映语音静态特征,且LPCC对语音低频局部特征描述不足。为此,提出将希尔伯特黄变换(HHT)倒谱系数与相对光谱-感知线性预测倒谱系数(RASTA-PLPCC)融合,得到一种既反映发声机理又体现人耳感知特性的说话人识别算法。HHT倒谱系数体现发声机理,能反映语音动态特性,并更好地描述信号低频局部特征,可改进LPCC的不足。PLPCC体现人耳感知特性,识别性能强于MFCC,用3种融合算法对两者进行融合,将融合特征用于高斯混合模型进行说话人识别。仿真实验结果表明,该融合算法较已有的MFCC与LPCC融合算法识别率提高了8.0%。 展开更多
关键词 说话人识别 发声机理 人耳感知特性 希尔伯特黄变换倒谱系数 感知线性预测倒谱系数 RELATIVE Spectra滤波
在线阅读 下载PDF
短时谱特征的汉语重音检测方法研究 被引量:2
20
作者 赵云雪 张珑 郑世杰 《计算机科学与探索》 CSCD 2014年第9期1120-1128,共9页
重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual line... 重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chinese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。 展开更多
关键词 重音检测 Mel频率倒谱系数(MFCC) 相关谱感知线性预测(RASTA-PLP) 短时谱特征
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部