期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
两种倒谱特征提取技术在水声目标识别中的应用 被引量:11
1
作者 柳革命 孙超 杨益新 《西北工业大学学报》 EI CAS CSCD 北大核心 2008年第3期276-281,共6页
按照声纳员的感受,被动声纳目标被看作为一个发声体,目标噪声信号表示为激励噪声源与发声体冲激响应的卷积,在这一模型下,使用倒谱分析水声目标噪声的时域特征。提出利用线性预测倒谱和考虑人耳听觉特点的美尔倒谱分析发声体的冲激响应... 按照声纳员的感受,被动声纳目标被看作为一个发声体,目标噪声信号表示为激励噪声源与发声体冲激响应的卷积,在这一模型下,使用倒谱分析水声目标噪声的时域特征。提出利用线性预测倒谱和考虑人耳听觉特点的美尔倒谱分析发声体的冲激响应在倒谱域中的表示,据此对水声噪声信号提取这两种倒谱的特征,进行分类识别。设计了神经网络分类器,利用实测数据对三类目标进行分类。分析比较两种方法的分类结果,验证了基于倒谱的水声目标特征提取方法的可行性。 展开更多
关键词 被动声纳目标识别 线性预测(LPC) 美尔(Mel) 特征提取
在线阅读 下载PDF
多特征相结合的带噪语音端点检测算法的研究 被引量:13
2
作者 张君昌 姜菲 刘红 《计算机工程与应用》 CSCD 北大核心 2009年第32期114-116,共3页
提出了一种抗噪声的端点检测新方法。针对谱熵特征对清音的检测性能以及抗噪声性能较差的缺点,结合对清音检测性能较好的短时过零率特征,以及抗噪声性能良好的美尔倒谱距离特征,实现了基于多种特征相结合的抗噪声的语音端点检测。仿真... 提出了一种抗噪声的端点检测新方法。针对谱熵特征对清音的检测性能以及抗噪声性能较差的缺点,结合对清音检测性能较好的短时过零率特征,以及抗噪声性能良好的美尔倒谱距离特征,实现了基于多种特征相结合的抗噪声的语音端点检测。仿真实验表明,该方法能显著提高端点检测在高噪声环境下的检测性能。 展开更多
关键词 高噪声 美尔倒谱距离 短时过零率 端点检测
在线阅读 下载PDF
基于改进的MFCC战场被动声目标识别 被引量:7
3
作者 蒋永生 张雄伟 +2 位作者 闵刚 刘光云 陈功 《弹箭与制导学报》 CSCD 北大核心 2008年第6期231-234,共4页
从战场声信号与语音信号特征的相似性出发,提出基于MFCC参数的战场声目标识别方法。针对战场环境存在强噪声干扰情况,提出一种改进的MFCC特征参数(DWTMFCC)提取方法,该方法将小波分析和Mel倒谱分析结合,提高了特征参数的鲁棒性。仿真结... 从战场声信号与语音信号特征的相似性出发,提出基于MFCC参数的战场声目标识别方法。针对战场环境存在强噪声干扰情况,提出一种改进的MFCC特征参数(DWTMFCC)提取方法,该方法将小波分析和Mel倒谱分析结合,提高了特征参数的鲁棒性。仿真结果表明:在噪声条件下,利用DWTMFCC参数进行声目标识别,平均识别率比MFCC参数高出3.134个百分点,信噪比为5dB时,识别率仍达到93.67%。 展开更多
关键词 被动声目标 目标识别 美尔倒谱参数 离散小波变换 鲁棒性
在线阅读 下载PDF
基于心理声学模型的高性能语音质量评价算法 被引量:1
4
作者 张军 张德运 +1 位作者 高磊 赵东平 《西安交通大学学报》 EI CAS CSCD 北大核心 2006年第4期437-440,共4页
提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由... 提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由此模拟人的感知过程.计算原始语音和受损语音响度之间的感知扰动,并依次在频域和时域进行聚合,从而获得单一的扰动值,该值再经认知模型计算,可以得到最终的客观评分.实验表明,所提算法的平均运行时间比国际电信联盟提出的语音质量感知评价算法减少了41%,内存占用降低了51%,而仅比主观评价的相关度下降6.8%. 展开更多
关键词 心理声学模型 美尔倒谱 感知扰动 质量评价
在线阅读 下载PDF
基于频域ICA的语音特征增强 被引量:1
5
作者 吕钊 吴小培 李密 《振动与冲击》 EI CSCD 北大核心 2011年第2期238-242,257,共6页
为了降低卷积噪声对语音特征所产生的影响,提高语音识别正确率,在此提出了一种基于频域ICA(Independent Component Analysis,独立分量分析)的语音特征增强算法。该算法首先使用频域ICA方法作对噪声进行估计,然后在倒谱域内将带噪语音信... 为了降低卷积噪声对语音特征所产生的影响,提高语音识别正确率,在此提出了一种基于频域ICA(Independent Component Analysis,独立分量分析)的语音特征增强算法。该算法首先使用频域ICA方法作对噪声进行估计,然后在倒谱域内将带噪语音信号的短时谱减去所估计噪声的短时谱,最后根据去噪后语音信号的短时谱计算美尔倒谱系数(MFCC)作为特征参数。在仿真和真实环境下的语音识别实验中,所提出的语音特征参数相比较传统的MFCC其识别正确率分别提升了38.2%和35.8%。实验结果表明该算法能够较好地解决卷积噪声环境下训练与识别特征不匹配的问题,有效提高了语音识别系统的识别正确率。 展开更多
关键词 频域ICA 语音 特征增强 美尔倒谱系数(MFCC)
在线阅读 下载PDF
提高MFCC鲁棒性的方法 被引量:1
6
作者 韩春光 李华 《计算机工程与设计》 CSCD 北大核心 2008年第1期160-162,180,共4页
在噪声环境中,基于笔记本电脑录音的情况下,采用特征参数加窗的方法,以提高系统的噪声鲁棒性。在Matlab环境下,建立了基于高斯混合模型(GMM)的说话人辨认系统,并进行实验。通过对多种窗口的正识率比较,发现对美尔倒谱(MFCC)高阶参数的... 在噪声环境中,基于笔记本电脑录音的情况下,采用特征参数加窗的方法,以提高系统的噪声鲁棒性。在Matlab环境下,建立了基于高斯混合模型(GMM)的说话人辨认系统,并进行实验。通过对多种窗口的正识率比较,发现对美尔倒谱(MFCC)高阶参数的加窗提升,可以改善系统的鲁棒性。实验结果表明,采用加窗后的系统识别率得到了明显改善。 展开更多
关键词 美尔倒谱参数 说话人辨认 高斯混合模型 加窗提升 噪声鲁棒性
在线阅读 下载PDF
GMM文本无关的说话人识别系统研究 被引量:27
7
作者 蒋晔 唐振民 《计算机工程与应用》 CSCD 北大核心 2010年第11期179-182,195,共5页
在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。... 在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。 展开更多
关键词 说话人识别 高斯混合模型 美尔频率系数(MFCC) 分裂法与K均值聚类结合法
在线阅读 下载PDF
基于元音检测的汉语连续语音端点检测方法 被引量:3
8
作者 张利平 冯宏伟 王艳 《计算机工程与应用》 CSCD 北大核心 2010年第27期114-116,共3页
在汉语连续语音识别中,准确检测出音节的始点和终点是很重要的一步,传统的端点检测方法在非连续语音中检测准确度很高,但在连续语音中检测准确度会大幅度降低。利用MFCC0参数和汉语元音的共振峰能量设计了一种新的端点检测方法,可以准... 在汉语连续语音识别中,准确检测出音节的始点和终点是很重要的一步,传统的端点检测方法在非连续语音中检测准确度很高,但在连续语音中检测准确度会大幅度降低。利用MFCC0参数和汉语元音的共振峰能量设计了一种新的端点检测方法,可以准确检测出汉语连续语音中的音节端点。实验结果表明:这种端点检测方法在低信噪比下也有很高的检测正确率。 展开更多
关键词 连续语音识别 端点检测 美尔频标系数(MFCC) 共振峰
在线阅读 下载PDF
分组网络环境下的实时语音质量客观评价 被引量:2
9
作者 张军 张德运 《西安交通大学学报》 EI CAS CSCD 北大核心 2006年第8期936-939,共4页
提出了一种利用前馈随机神经网络在分组网络中进行实时语音质量评价的新方法.从接收到的语音分组中提取美尔频率倒谱系数向量,利用实时传输控制协议计算语音分组传输过程中的丢包率、延迟和抖动,构成网络传输参数向量.将随机神经元组织... 提出了一种利用前馈随机神经网络在分组网络中进行实时语音质量评价的新方法.从接收到的语音分组中提取美尔频率倒谱系数向量,利用实时传输控制协议计算语音分组传输过程中的丢包率、延迟和抖动,构成网络传输参数向量.将随机神经元组织成具有1个输入层、1个隐含层和1个输出层的3层前馈网络结构,再以上述2种向量作为输入的多类别信号,以相应的主观平均意见(MOS)评分值作为输出对网络进行训练,从而获得稳定的权值矩阵.利用训练过的网络进行多类别信号的语音质量评分映射,并将映射结果与MOS进行二次多项式拟合,得到最终的语音质量评分值.实验表明,所提算法与主观评价之间的平均相关度可达到0.881. 展开更多
关键词 分组网络 美尔频率 随机神经网络 语音质量评价
在线阅读 下载PDF
一种提取说话人特征的新方法
10
作者 毛鹏 杨鼎才 《电子测量技术》 2008年第9期126-128,共3页
抽取最佳鉴别特征是说话人辨认中的重要一步。本文在使用美尔倒谱系数(MFCC)及一阶差分组成的特征参数的基础上利用主分量分析(PCA)和线性判决分析(LDA)结合的提取方法,构造了一种新的特征参数。这种新的参数具有最佳鉴别特性,然后用支... 抽取最佳鉴别特征是说话人辨认中的重要一步。本文在使用美尔倒谱系数(MFCC)及一阶差分组成的特征参数的基础上利用主分量分析(PCA)和线性判决分析(LDA)结合的提取方法,构造了一种新的特征参数。这种新的参数具有最佳鉴别特性,然后用支持向量机(SVM)对提取的特征分类辨认。实验结果表明该方法能更好地识别说话人,有更好的识别能力。 展开更多
关键词 主分量分析(PCA) 美尔倒谱系数(MFCC) 线性判决分析(LDA) 支持向量机
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部