期刊文献+
共找到73篇文章
< 1 2 4 >
每页显示 20 50 100
基于Mel倒谱系数和矢量量化的昆虫声音自动鉴别 被引量:10
1
作者 竺乐庆 王鸿斌 张真 《昆虫学报》 CAS CSCD 北大核心 2010年第8期901-907,共7页
为了给生产单位害虫管理的普通技术人员提供简便易操作的昆虫种类鉴别方法,本研究把人类语音识别领域的先进技术应用于昆虫识别,提出了一种新颖的昆虫声音自动鉴别方法,用声音参数化技术为昆虫声纹识别设计了一种简单易行的方案。声音... 为了给生产单位害虫管理的普通技术人员提供简便易操作的昆虫种类鉴别方法,本研究把人类语音识别领域的先进技术应用于昆虫识别,提出了一种新颖的昆虫声音自动鉴别方法,用声音参数化技术为昆虫声纹识别设计了一种简单易行的方案。声音信号经过预处理、分段得到一系列的声音样本,从声音样本提取Mel倒谱系数(MFCC),并用Linde-Buzo-Gray(LBG)算法对提取的MFCC进行矢量量化(VQ),所得码字作为声音样本的特征模型。特征参数之间的匹配用搜索最近邻的方法实现。本文方法在包含70种昆虫声音的库中进行了试验,取得了超过96%的识别率和理想的时间性能。试验结果证明了该方法的有效性。 展开更多
关键词 昆虫 声音识别 mel倒谱系数 LBG算法 矢量量化
在线阅读 下载PDF
基于FPGA的Mel倒谱系数提取方法设计与实现
2
作者 杨鸿武 张帅 丁朋程 《仪表技术与传感器》 CSCD 北大核心 2017年第3期82-85,89,共5页
为了在嵌入式系统中实现参数化语音合成,提出一种在FPGA(field programmable gate array)中通过SOPC(system on programmable chip)系统提取Mel倒谱系数的方法。用SOPC Builder搭建硬件平台,然后在嵌入式NiosⅡ处理器中对语音信号做短... 为了在嵌入式系统中实现参数化语音合成,提出一种在FPGA(field programmable gate array)中通过SOPC(system on programmable chip)系统提取Mel倒谱系数的方法。用SOPC Builder搭建硬件平台,然后在嵌入式NiosⅡ处理器中对语音信号做短时傅里叶变换、对数幅度运算、逆傅里叶变换,最后通过牛顿迭代法实现Mel倒谱系数的求解。将NiosⅡ处理器得到的Mel倒谱系数通过JTAG接口回传到计算机上,并与MATLAB仿真结果进行比较,结果表明NiosⅡ处理器提取的Mel倒谱系数与MATLAB提取的系数结果相同。 展开更多
关键词 语音合成 现场可编程门阵列(FPGA) 可编程片上系统(SOPC) mel倒谱系数 提取
在线阅读 下载PDF
基于Mel频率倒谱系数和遗传算法的煤矸界面识别研究 被引量:6
3
作者 何爱香 王平建 +1 位作者 魏广芬 张守祥 《工矿自动化》 北大核心 2013年第2期66-71,共6页
针对现有的煤矸界面识别技术采用的γ射线法不适用于顶板不含放射性元素或者放射性元素含量较低的工作面,而雷达探测法探测范围小、信号衰减严重的问题,提出了一种基于Mel频率倒谱系数和遗传算法的煤矸界面识别方法。该方法利用煤矸放... 针对现有的煤矸界面识别技术采用的γ射线法不适用于顶板不含放射性元素或者放射性元素含量较低的工作面,而雷达探测法探测范围小、信号衰减严重的问题,提出了一种基于Mel频率倒谱系数和遗传算法的煤矸界面识别方法。该方法利用煤矸放落过程中产生的声波信号的特征差异进行煤矸识别,采用Mel频率倒谱系数将去噪后的煤矸声波信号变换到频域进行处理,提取出煤矸声波信号的32维特征参数;采用遗传算法优化处理32维特征参数,得到最优参数组合;采用支持向量机和BP神经网络对最优参数进行识别。实验结果表明,该方法能够准确识别出煤矸下落状态。 展开更多
关键词 放顶煤开采 煤矸界面识别 mel频率谱系 MFCC 遗传算法 支持向量机 BP神经网络
在线阅读 下载PDF
基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法 被引量:7
4
作者 张怡然 白静 王力 《科学技术与工程》 北大核心 2014年第19期253-256,274,共5页
语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行... 语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。 展开更多
关键词 mel频率谱系 多窗频谱估计 滑动平均滤波 谱包络 说话人识别
在线阅读 下载PDF
Mel频率倒谱系数平滑的耳机均衡 被引量:2
5
作者 李光炬 罗平展 +2 位作者 钱鹏 甘维明 邢锰 《应用声学》 CSCD 北大核心 2023年第1期67-75,共9页
适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函... 适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函数平滑方法,用于模拟人耳听觉感知特性和平滑耳机到鼓膜的传递函数,使均衡后的幅频响应保持相应的峰谷,避免了幅度峰谷过渡均衡。实验结果表明,进行耳机到鼓膜的传递函数平滑的幅度均衡对提高耳机的音色有显著作用,基于Mel频率倒谱系数平滑的幅度均衡对提高耳机的音色最为显著。 展开更多
关键词 耳机到鼓膜的传递函 mel频率谱系 平滑 均衡 耳机声重放
在线阅读 下载PDF
利用抗噪幂归一化倒谱系数的鸟类声音识别 被引量:18
6
作者 颜鑫 李应 《电子学报》 EI CAS CSCD 北大核心 2013年第2期295-300,共6页
针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪... 针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪的声音功率谱提取抗噪幂归一化倒谱系数(APNCC).最后,采用支持向量机(SVM)分别对提取的APNCC,幂归一化倒谱系数(PNCC)和Mel频率倒谱系数(MFCC)对34种鸟类声音进行不同环境和信噪比情况下的对比实验.实验表明,提取的APNCC具有较好的平均识别效果及较强的噪声鲁棒性,更适用于信噪比低于30dB环境下的鸟类声音识别. 展开更多
关键词 鸟类声音识别 非平稳噪声估计 多频带谱减法 抗噪幂归一化谱系 mel频率谱系
在线阅读 下载PDF
一种适用于说话人识别的改进Mel滤波器 被引量:8
7
作者 项要杰 杨俊安 +1 位作者 李晋徽 陆俊 《计算机工程》 CAS CSCD 2013年第11期214-217,222,共5页
Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适... Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。 展开更多
关键词 说话人识别 mel倒谱系数 个性信息 mel倒谱系数 频谱分布 语音信号
在线阅读 下载PDF
基于特征相对贡献度对加权Mel倒谱的改进 被引量:7
8
作者 王家盛 郭其威 +1 位作者 吴松 马建敏 《声学技术》 CSCD 北大核心 2021年第3期408-414,共7页
在声纹识别系统的搭建过程中,提高识别率的一个重要做法是使语音信号中能够提取出的特征尽可能包含更多的说话人个性特征。为了探究特征参数各分量对识别系统性能的影响,文章基于高斯混合-通用背景模型(Gaussian Mixture Model-Universa... 在声纹识别系统的搭建过程中,提高识别率的一个重要做法是使语音信号中能够提取出的特征尽可能包含更多的说话人个性特征。为了探究特征参数各分量对识别系统性能的影响,文章基于高斯混合-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)基线系统,研究了在无噪环境中各维特征组合下的识别率,利用增减分量法定量计算出各维特征分量对识别率的相对贡献程度,并根据贡献度的强弱对各维特征分量进行合理加权,得到了贡献度拟合权重系数,将此系数用于改进梅尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征参数。仿真结果表明,对特征参数进行贡献度拟合权重系数加权后,声纹识别的正确率得到了提升。 展开更多
关键词 增减分量法 贡献度 梅尔(mel)谱系 高斯混合-通用背景模型(GMM-UBM)
在线阅读 下载PDF
水下蛙人呼吸声Mel倒谱特征的实验研究 被引量:5
9
作者 朱知萌 郭育 +1 位作者 王冠 章佳荣 《声学技术》 CSCD 北大核心 2017年第3期286-292,共7页
为提高水下蛙人呼吸声识别的准确度,提出一种基于Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)的蛙人呼吸声信号特征匹配方法。计算呼吸声信号之间、信号与环境噪声及舰船辐射噪声的MFCC夹角和MFCC距离并进行匹配比较,以... 为提高水下蛙人呼吸声识别的准确度,提出一种基于Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)的蛙人呼吸声信号特征匹配方法。计算呼吸声信号之间、信号与环境噪声及舰船辐射噪声的MFCC夹角和MFCC距离并进行匹配比较,以进行分类识别。某湖试验数据的处理结果表明:蛙人呼吸声与舰船辐射噪声及环境噪声的MFCC参数有着明显的差异,能够对蛙人呼吸声信号与干扰噪声进行区分,证明了基于MFCC特征算法的有效性,对发展港口、码头等近海海域附近的水下蛙人探测声呐和预警系统具有实际意义。 展开更多
关键词 被动声呐 水下小目标 mel频率谱系 特征匹配
在线阅读 下载PDF
基于MFCC参数和VQ的说话人识别系统 被引量:30
10
作者 王伟 邓辉文 《仪器仪表学报》 EI CAS CSCD 北大核心 2006年第z3期2253-2255,共3页
采用能够反映人对语音的感知特性的Mel频率倒谱系数(MFCC)作为特征参数,以及为避免时间规整问题采用矢量量化技术开发的说话人识别系统。MFCC主要的是模拟人耳的听觉过程,相对于其它参数它对语音波形的变化不敏感,更加稳定,系统取得很... 采用能够反映人对语音的感知特性的Mel频率倒谱系数(MFCC)作为特征参数,以及为避免时间规整问题采用矢量量化技术开发的说话人识别系统。MFCC主要的是模拟人耳的听觉过程,相对于其它参数它对语音波形的变化不敏感,更加稳定,系统取得很好的识别结果,实验表明系统训练和识别的计算量和存储量都比较低。 展开更多
关键词 说话人识别 mel倒谱系数 矢量量化
在线阅读 下载PDF
基于倒谱特征和小波包特征熵的直升机声目标识别 被引量:9
11
作者 黄博 高勇 《探测与控制学报》 CSCD 北大核心 2007年第6期15-18,23,共5页
提出了一种将倒谱特征和小波包特征熵相结合的直升机声目标识别新算法,首先分析了直升机声信号的特点,计算了声信号的MFCC(MEL频率倒谱系数)、差分MFCC(差分MEL频率倒谱系数)和小波包分解后各个频带内的小波包特征熵组成的特征向量,并... 提出了一种将倒谱特征和小波包特征熵相结合的直升机声目标识别新算法,首先分析了直升机声信号的特点,计算了声信号的MFCC(MEL频率倒谱系数)、差分MFCC(差分MEL频率倒谱系数)和小波包分解后各个频带内的小波包特征熵组成的特征向量,并以此向量输入反向误差传播(Back Propagation,BP)神经网络进行训练,再用训练好的神经网络进行不同直升机型号的识别,最后给出了统计结果。结果表明:该算法对直升机机型的识别有较好的效果。 展开更多
关键词 识别 直升机声信号 mel倒谱系数 小波包特征熵 特征向量 BP神经网络
在线阅读 下载PDF
基于修正Mel频率映射的应力影响下变异语音识别方法 被引量:1
12
作者 马永林 韩纪庆 +1 位作者 张磊 王承发 《计算机工程与应用》 CSCD 北大核心 2002年第20期75-76,91,共3页
文章在对应力影响下变异语音进行分频带分析的基础上,选用了可以提升语音信号中频段影响的修正Mel频率映射,并将其对应的MFCC系数作为新的语音识别特征。通过采用正常/变异语音分类器和新特征来进行变异语音识别。实验结果表明:采用修正... 文章在对应力影响下变异语音进行分频带分析的基础上,选用了可以提升语音信号中频段影响的修正Mel频率映射,并将其对应的MFCC系数作为新的语音识别特征。通过采用正常/变异语音分类器和新特征来进行变异语音识别。实验结果表明:采用修正Mel频率映射的MFCC特征改进了变异语音的识别性能。 展开更多
关键词 修正 mel频率映射 应力 变异语音识别 语音分类器 mel倒谱系数
在线阅读 下载PDF
基于神经网络由语音预测视位参数 被引量:2
13
作者 王志明 蔡莲红 《小型微型计算机系统》 CSCD 北大核心 2005年第6期1083-1087,共5页
语音是由多个发音器官共同作用产生的,发音器官动作与语音之间有着内在的必然联系.研究了利用神经网络预测视位参数中的选择语音参数、确定输入语音时域范围、优化神经网络结构等因素.实验结果表明,线性预测参数加短时能量优于其他语音... 语音是由多个发音器官共同作用产生的,发音器官动作与语音之间有着内在的必然联系.研究了利用神经网络预测视位参数中的选择语音参数、确定输入语音时域范围、优化神经网络结构等因素.实验结果表明,线性预测参数加短时能量优于其他语音参数,前向协同发音较后向协同发音影响更大,反馈对前馈神经网络的性能有所改善.考虑到实验采用的是任意连续语流,均方误差约为0.0114的实验结果还是很有吸引力的. 展开更多
关键词 前馈神经网络 视位 线性预测系 线谱对系 谱系 反射系 mel倒谱系数 均方误差
在线阅读 下载PDF
混合窗函数和子带频谱质心在MFCC特征提取过程中的应用 被引量:1
14
作者 赵欢 张林 陈珍文 《计算机应用》 CSCD 北大核心 2009年第2期389-391,共3页
为改善低信噪比环境下语音的质量,在传统MFCC特征提取的基础上,提出了两种提高识别系统鲁棒性的方法。一种方法利用混合窗函数对旁瓣的抑制来提高系统的鲁棒性;另一种方法是基于频谱峰值位置受背景噪声影响相对较小,将子带幅度信息和Me... 为改善低信噪比环境下语音的质量,在传统MFCC特征提取的基础上,提出了两种提高识别系统鲁棒性的方法。一种方法利用混合窗函数对旁瓣的抑制来提高系统的鲁棒性;另一种方法是基于频谱峰值位置受背景噪声影响相对较小,将子带幅度信息和Mel子带频谱质心(MSSC)相结合。实验表明混合窗函数和子带频谱质心(MSSC)以及它们相结合的系统与使用传统MFCC的基准系统相比,在低信噪比的平稳噪声环境下系统的鲁棒性得到了一定的提高。 展开更多
关键词 语音识别 mel倒谱系数 低信噪比 子带频谱质心
在线阅读 下载PDF
语音特征参数MFCC的提取及其应用 被引量:11
15
作者 陈勇 屈志毅 +3 位作者 刘莹 酒康 郭爱平 杨志国 《湖南农业大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第10X期106-107,共2页
Mel频率是能够反映人耳对不同频率语音感知能力的一种频率表达方式.主要介绍了Mel频率倒谱系数(MFCC)的特点及提取方法,并提取了MFCC的一阶差分,使特征参数在说话人识别上能够更加准确的反映语音信息,提高识别率.
关键词 语音 mel频率谱系 离散余弦变换
在线阅读 下载PDF
基于MFCC与GFCC混合特征参数的说话人识别 被引量:46
16
作者 周萍 沈昊 郑凯鹏 《应用科学学报》 CAS CSCD 北大核心 2019年第1期24-32,共9页
针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,... 针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,舍弃其中贡献较低的分量以实现特征参数降维的目的,并将混合参数应用于基于高斯混合模型的说话人识别系统.仿真实验表明,该混合特征参数具有更好的识别性能和抗噪性. 展开更多
关键词 说话人识别 混合特征参 mel频率谱系 Gammatone滤波器
在线阅读 下载PDF
固话信道下语音特征参数影响研究 被引量:3
17
作者 郭逾 张二华 +1 位作者 刘驰 杨子凡 《现代电子技术》 北大核心 2015年第11期73-78,82,共7页
通过对比麦克风与固话信道下语音信号的时域、频域参数,结合固话传输系统的特性,分析语音信号经过固话信道传输后,各参数的异同点以及固话信道对语音信号的影响。并采用F比的方法,分析麦克风信道和固话信道下语音信号MFCC特征参数的差... 通过对比麦克风与固话信道下语音信号的时域、频域参数,结合固话传输系统的特性,分析语音信号经过固话信道传输后,各参数的异同点以及固话信道对语音信号的影响。并采用F比的方法,分析麦克风信道和固话信道下语音信号MFCC特征参数的差异。实验结果表明,语音信号经过固话信道传输后,不仅造成信号的频率失真,还伴随有宽带噪声和共振型噪声。在MFCC特征参数方面,麦克风和固话信道的第二维MFCC参数差异最明显,低维参数相比高维参数差异较大,男性说话人特征参数相比女性说话人差异较大。 展开更多
关键词 固话信道 噪声 语音参 mel频率谱系 F比
在线阅读 下载PDF
基于融合特征ADRMFCC的语音识别方法 被引量:1
18
作者 朵琳 马建 +1 位作者 韦贵香 唐剑 《吉林大学学报(理学版)》 CAS 北大核心 2024年第4期943-950,共8页
针对在复杂噪声环境下语音识别准确率低和鲁棒性差的问题,提出一种基于增减残差Mel倒谱融合特征的语音识别方法.该方法首先利用增减分量法筛选关键语音特征,然后将其映射到Mel域-残差域空间坐标系中生成增减残差Mel倒谱系数,最后将这些... 针对在复杂噪声环境下语音识别准确率低和鲁棒性差的问题,提出一种基于增减残差Mel倒谱融合特征的语音识别方法.该方法首先利用增减分量法筛选关键语音特征,然后将其映射到Mel域-残差域空间坐标系中生成增减残差Mel倒谱系数,最后将这些融合特征用于训练端到端模型.实验结果表明,该方法在不同噪声类型和信噪比条件下均显著提高了语音识别准确率及性能,在-5 dB低信噪比条件下,语音识别准确率达73.13%,而在其他噪声条件下的平均语音识别准确率达88.67%,充分证明了该方法的有效性和鲁棒性. 展开更多
关键词 语音识别 残差mel倒谱系数 特征筛选 增减分量法
在线阅读 下载PDF
基于小波子带分解的特征参数对语音自动切分的改进 被引量:2
19
作者 秦欢 柴佩琪 陈锴 《计算机应用》 CSCD 北大核心 2005年第6期1345-1346,共2页
采用了基于小波子带分解的特征提取方法,根据DCT和DWT两种去相关方法的不同,得到语音信号的特征参数分别为SubbandBasedCepstral(SBC)和WaveletPacketParameters(WPP)。实验切分结果表明,基于小波子带分解的特征参数比MFCC取得更好的切... 采用了基于小波子带分解的特征提取方法,根据DCT和DWT两种去相关方法的不同,得到语音信号的特征参数分别为SubbandBasedCepstral(SBC)和WaveletPacketParameters(WPP)。实验切分结果表明,基于小波子带分解的特征参数比MFCC取得更好的切分效果。 展开更多
关键词 隐马尔可夫模型 语音自动切分 mel频率谱系 小波子带分解
在线阅读 下载PDF
基于MFCC特征提取和改进SVM的语音情感数据挖掘分类识别方法研究 被引量:27
20
作者 张钰莎 蒋盛益 《计算机应用与软件》 北大核心 2020年第8期160-165,212,共7页
设计一种语音情感数据挖掘分类识别方法。对语音情感信号进行预处理,进一步从语音话语中提取Mel频率倒谱系数(MFCC)和Mel能谱动态系数(MEDC);使用支持向量机(SVM)来分类不同的情绪状态,如愤怒、快乐、悲伤、中立、恐惧等,并基于径向基函... 设计一种语音情感数据挖掘分类识别方法。对语音情感信号进行预处理,进一步从语音话语中提取Mel频率倒谱系数(MFCC)和Mel能谱动态系数(MEDC);使用支持向量机(SVM)来分类不同的情绪状态,如愤怒、快乐、悲伤、中立、恐惧等,并基于径向基函数(RBF)内核进行训练阶段;应用柏林情感数据库和CASIA汉语情感语料库从情绪语音文件中提取特征。实验结果表明,柏林数据库和CASIA汉语情感语料库的正确识别率分别为82%和90.39%。与几种先进的对比方法进行比较,该方法在不同降维、不同信噪比下均取得了最优的识别精度。 展开更多
关键词 语音情感识别 支持向量机 据挖掘 mel频率谱系 mel能谱动态系
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部