期刊文献+
共找到97篇文章
< 1 2 5 >
每页显示 20 50 100
基于Mel倒谱系数和矢量量化的昆虫声音自动鉴别 被引量:10
1
作者 竺乐庆 王鸿斌 张真 《昆虫学报》 CAS CSCD 北大核心 2010年第8期901-907,共7页
为了给生产单位害虫管理的普通技术人员提供简便易操作的昆虫种类鉴别方法,本研究把人类语音识别领域的先进技术应用于昆虫识别,提出了一种新颖的昆虫声音自动鉴别方法,用声音参数化技术为昆虫声纹识别设计了一种简单易行的方案。声音... 为了给生产单位害虫管理的普通技术人员提供简便易操作的昆虫种类鉴别方法,本研究把人类语音识别领域的先进技术应用于昆虫识别,提出了一种新颖的昆虫声音自动鉴别方法,用声音参数化技术为昆虫声纹识别设计了一种简单易行的方案。声音信号经过预处理、分段得到一系列的声音样本,从声音样本提取Mel倒谱系数(MFCC),并用Linde-Buzo-Gray(LBG)算法对提取的MFCC进行矢量量化(VQ),所得码字作为声音样本的特征模型。特征参数之间的匹配用搜索最近邻的方法实现。本文方法在包含70种昆虫声音的库中进行了试验,取得了超过96%的识别率和理想的时间性能。试验结果证明了该方法的有效性。 展开更多
关键词 昆虫 声音识别 mel谱系 LBG算法 矢量量化
在线阅读 下载PDF
说话人识别中的Mel特征频率倒谱系数 被引量:13
2
作者 曹辉 徐晨 +1 位作者 赵晓 吴胜举 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第2期203-208,共6页
目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向... 目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向量进行说话人分类识别,能得到维数更低、识别率更高的特征参数。结论通过MIV值可判断各维特征参数分量的重要性,选取权重值高的MFCC特征参数来提高系统识别率和缩短系统运行时间。 展开更多
关键词 说话人识别 语音特征参数 梅尔频率谱系 支持向量机 平均影响值
在线阅读 下载PDF
基于Mel频率倒谱系数和遗传算法的煤矸界面识别研究 被引量:6
3
作者 何爱香 王平建 +1 位作者 魏广芬 张守祥 《工矿自动化》 北大核心 2013年第2期66-71,共6页
针对现有的煤矸界面识别技术采用的γ射线法不适用于顶板不含放射性元素或者放射性元素含量较低的工作面,而雷达探测法探测范围小、信号衰减严重的问题,提出了一种基于Mel频率倒谱系数和遗传算法的煤矸界面识别方法。该方法利用煤矸放... 针对现有的煤矸界面识别技术采用的γ射线法不适用于顶板不含放射性元素或者放射性元素含量较低的工作面,而雷达探测法探测范围小、信号衰减严重的问题,提出了一种基于Mel频率倒谱系数和遗传算法的煤矸界面识别方法。该方法利用煤矸放落过程中产生的声波信号的特征差异进行煤矸识别,采用Mel频率倒谱系数将去噪后的煤矸声波信号变换到频域进行处理,提取出煤矸声波信号的32维特征参数;采用遗传算法优化处理32维特征参数,得到最优参数组合;采用支持向量机和BP神经网络对最优参数进行识别。实验结果表明,该方法能够准确识别出煤矸下落状态。 展开更多
关键词 放顶煤开采 煤矸界面识别 mel频率谱系 MFCC 遗传算法 支持向量机 BP神经网络
在线阅读 下载PDF
基于梅尔频率倒谱系数与动态时间规整的安卓声纹解锁系统 被引量:11
4
作者 陈锦飞 徐欣 《计算机工程》 CAS CSCD 北大核心 2017年第2期201-205,共5页
安卓设备通常采用数字或图形密码解锁,但此类口令形式的密码安全性不高,而且部分安卓版本存在锁屏绕过漏洞的问题。为此,设计一种利用用户声纹特征的安卓解锁系统。采用梅尔频率倒谱系数提取声纹特征,使用动态时间规整算法进行文本相关... 安卓设备通常采用数字或图形密码解锁,但此类口令形式的密码安全性不高,而且部分安卓版本存在锁屏绕过漏洞的问题。为此,设计一种利用用户声纹特征的安卓解锁系统。采用梅尔频率倒谱系数提取声纹特征,使用动态时间规整算法进行文本相关的声纹模式匹配,并结合安卓NDK技术实现快速声纹识别。实验结果表明,该系统具有较高的解锁成功率和较快的解锁速度,相比数字或图形解锁,声纹解锁安全性更高,用户体验更好。 展开更多
关键词 梅尔频率谱系 动态时间规整 声纹识别 安卓系统 声纹解锁
在线阅读 下载PDF
基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法 被引量:6
5
作者 张怡然 白静 王力 《科学技术与工程》 北大核心 2014年第19期253-256,274,共5页
语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行... 语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。 展开更多
关键词 mel频率谱系 多窗频谱估计 滑动平均滤波 谱包络 说话人识别
在线阅读 下载PDF
基于FPGA的Mel倒谱系数提取方法设计与实现
6
作者 杨鸿武 张帅 丁朋程 《仪表技术与传感器》 CSCD 北大核心 2017年第3期82-85,89,共5页
为了在嵌入式系统中实现参数化语音合成,提出一种在FPGA(field programmable gate array)中通过SOPC(system on programmable chip)系统提取Mel倒谱系数的方法。用SOPC Builder搭建硬件平台,然后在嵌入式NiosⅡ处理器中对语音信号做短... 为了在嵌入式系统中实现参数化语音合成,提出一种在FPGA(field programmable gate array)中通过SOPC(system on programmable chip)系统提取Mel倒谱系数的方法。用SOPC Builder搭建硬件平台,然后在嵌入式NiosⅡ处理器中对语音信号做短时傅里叶变换、对数幅度运算、逆傅里叶变换,最后通过牛顿迭代法实现Mel倒谱系数的求解。将NiosⅡ处理器得到的Mel倒谱系数通过JTAG接口回传到计算机上,并与MATLAB仿真结果进行比较,结果表明NiosⅡ处理器提取的Mel倒谱系数与MATLAB提取的系数结果相同。 展开更多
关键词 语音合成 现场可编程门阵列(FPGA) 可编程片上系统(SOPC) mel谱系 参数提取
在线阅读 下载PDF
Mel频率倒谱系数平滑的耳机均衡 被引量:1
7
作者 李光炬 罗平展 +2 位作者 钱鹏 甘维明 邢锰 《应用声学》 CSCD 北大核心 2023年第1期67-75,共9页
适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函... 适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函数平滑方法,用于模拟人耳听觉感知特性和平滑耳机到鼓膜的传递函数,使均衡后的幅频响应保持相应的峰谷,避免了幅度峰谷过渡均衡。实验结果表明,进行耳机到鼓膜的传递函数平滑的幅度均衡对提高耳机的音色有显著作用,基于Mel频率倒谱系数平滑的幅度均衡对提高耳机的音色最为显著。 展开更多
关键词 耳机到鼓膜的传递函 mel频率谱系 平滑 均衡 耳机声重放
在线阅读 下载PDF
利用抗噪幂归一化倒谱系数的鸟类声音识别 被引量:18
8
作者 颜鑫 李应 《电子学报》 EI CAS CSCD 北大核心 2013年第2期295-300,共6页
针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪... 针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪的声音功率谱提取抗噪幂归一化倒谱系数(APNCC).最后,采用支持向量机(SVM)分别对提取的APNCC,幂归一化倒谱系数(PNCC)和Mel频率倒谱系数(MFCC)对34种鸟类声音进行不同环境和信噪比情况下的对比实验.实验表明,提取的APNCC具有较好的平均识别效果及较强的噪声鲁棒性,更适用于信噪比低于30dB环境下的鸟类声音识别. 展开更多
关键词 鸟类声音识别 非平稳噪声估计 多频带谱减法 抗噪幂归一化谱系 mel频率谱系
在线阅读 下载PDF
融合CFCC和Teager能量算子倒谱参数的语音识别 被引量:9
9
作者 史燕燕 白静 《计算机科学》 CSCD 北大核心 2019年第5期286-289,共4页
针对现有表征语音特性的特征提取不完善的问题,提出了一种耳蜗滤波倒谱系数(Cochlear Filter Cepstral Coefficients,CFCC)和Teager能量算子倒谱参数(Teager Energy Operators Cepstral Coefficients,TEOCC)相互融合的方法。该方法将表... 针对现有表征语音特性的特征提取不完善的问题,提出了一种耳蜗滤波倒谱系数(Cochlear Filter Cepstral Coefficients,CFCC)和Teager能量算子倒谱参数(Teager Energy Operators Cepstral Coefficients,TEOCC)相互融合的方法。该方法将表征人耳听觉特性的CFCC和体现非线性能量特性的TEOCC的融合特征应用到语音识别系统中,并联合主成分分析(Principal Components Analysis,PCA)对该融合特征进行特征选择和优化,最后通过支持向量机进行语音识别。实验结果表明:该融合特征与单一特征相比具有更佳的语音识别性能,结合PCA后其语音识别的准确率平均提高了3.7%。 展开更多
关键词 耳蜗滤波谱系 Teager能量算子参数 主成分分析 语音识别
在线阅读 下载PDF
羊咳嗽声的特征参数提取与识别方法 被引量:25
10
作者 宣传忠 武佩 +3 位作者 张丽娜 马彦华 张永安 邬娟 《农业机械学报》 EI CAS CSCD 北大核心 2016年第3期342-348,共7页
为在设施圈养羊只产生呼吸道疾病的初期,通过监测其咳嗽声进行疾病预警和健康状况诊断,以内蒙古地区广泛推广的杜泊羊为例,对杜泊羊的咳嗽声信号进行自动采集和计算机识别,在不增加羊咳嗽声特征参数维数的前提下,提出一种改进的梅尔频... 为在设施圈养羊只产生呼吸道疾病的初期,通过监测其咳嗽声进行疾病预警和健康状况诊断,以内蒙古地区广泛推广的杜泊羊为例,对杜泊羊的咳嗽声信号进行自动采集和计算机识别,在不增加羊咳嗽声特征参数维数的前提下,提出一种改进的梅尔频率倒谱系数(MFCC),试验结果表明,该参数和短时能量、过零率组合的14维特征参数,经过羊咳嗽声隐马尔可夫模型(HMM)识别系统,其识别率、误识别率和总识别率分别达到了86.23%、7.17%和88.43%,该组合特征参数经主成分分析可降到9维,而通过BP神经网络改善的HMM咳嗽声识别系统,对咳嗽声的识别率、误识别率和总识别率分别达到了92.54%、5.37%和95.04%,满足了杜泊羊咳嗽声识别的要求。 展开更多
关键词 杜泊羊 咳嗽声 特征参数提取 梅尔频率谱系 隐马尔可夫模型
在线阅读 下载PDF
语音特征参数MFCC的提取及其应用 被引量:11
11
作者 陈勇 屈志毅 +3 位作者 刘莹 酒康 郭爱平 杨志国 《湖南农业大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第10X期106-107,共2页
Mel频率是能够反映人耳对不同频率语音感知能力的一种频率表达方式.主要介绍了Mel频率倒谱系数(MFCC)的特点及提取方法,并提取了MFCC的一阶差分,使特征参数在说话人识别上能够更加准确的反映语音信息,提高识别率.
关键词 语音 mel频率谱系 离散余弦变换
在线阅读 下载PDF
基于MFCC参数和VQ的说话人识别系统 被引量:30
12
作者 王伟 邓辉文 《仪器仪表学报》 EI CAS CSCD 北大核心 2006年第z3期2253-2255,共3页
采用能够反映人对语音的感知特性的Mel频率倒谱系数(MFCC)作为特征参数,以及为避免时间规整问题采用矢量量化技术开发的说话人识别系统。MFCC主要的是模拟人耳的听觉过程,相对于其它参数它对语音波形的变化不敏感,更加稳定,系统取得很... 采用能够反映人对语音的感知特性的Mel频率倒谱系数(MFCC)作为特征参数,以及为避免时间规整问题采用矢量量化技术开发的说话人识别系统。MFCC主要的是模拟人耳的听觉过程,相对于其它参数它对语音波形的变化不敏感,更加稳定,系统取得很好的识别结果,实验表明系统训练和识别的计算量和存储量都比较低。 展开更多
关键词 说话人识别 mel谱系 矢量量化
在线阅读 下载PDF
话者识别系统中语音特征参数的研究与仿真 被引量:17
13
作者 王金明 张雄伟 《系统仿真学报》 CAS CSCD 2003年第9期1276-1278,共3页
在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用... 在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用对识别系统性能的影响。通过仿真和实验,证明混合参数识别方法能使话者识别系统的正确识别率有明显的提高。 展开更多
关键词 说话者识别 动态特征 线性预测谱系 美尔谱系 仿真
在线阅读 下载PDF
基于MFCC与GFCC混合特征参数的说话人识别 被引量:46
14
作者 周萍 沈昊 郑凯鹏 《应用科学学报》 CAS CSCD 北大核心 2019年第1期24-32,共9页
针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,... 针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,舍弃其中贡献较低的分量以实现特征参数降维的目的,并将混合参数应用于基于高斯混合模型的说话人识别系统.仿真实验表明,该混合特征参数具有更好的识别性能和抗噪性. 展开更多
关键词 说话人识别 混合特征参数 mel频率谱系 Gammatone滤波器
在线阅读 下载PDF
基于神经网络由语音预测视位参数 被引量:2
15
作者 王志明 蔡莲红 《小型微型计算机系统》 CSCD 北大核心 2005年第6期1083-1087,共5页
语音是由多个发音器官共同作用产生的,发音器官动作与语音之间有着内在的必然联系.研究了利用神经网络预测视位参数中的选择语音参数、确定输入语音时域范围、优化神经网络结构等因素.实验结果表明,线性预测参数加短时能量优于其他语音... 语音是由多个发音器官共同作用产生的,发音器官动作与语音之间有着内在的必然联系.研究了利用神经网络预测视位参数中的选择语音参数、确定输入语音时域范围、优化神经网络结构等因素.实验结果表明,线性预测参数加短时能量优于其他语音参数,前向协同发音较后向协同发音影响更大,反馈对前馈神经网络的性能有所改善.考虑到实验采用的是任意连续语流,均方误差约为0.0114的实验结果还是很有吸引力的. 展开更多
关键词 前馈神经网络 视位 线性预测系 线谱对系 谱系 反射系 mel谱系 均方误差
在线阅读 下载PDF
固话信道下语音特征参数影响研究 被引量:3
16
作者 郭逾 张二华 +1 位作者 刘驰 杨子凡 《现代电子技术》 北大核心 2015年第11期73-78,82,共7页
通过对比麦克风与固话信道下语音信号的时域、频域参数,结合固话传输系统的特性,分析语音信号经过固话信道传输后,各参数的异同点以及固话信道对语音信号的影响。并采用F比的方法,分析麦克风信道和固话信道下语音信号MFCC特征参数的差... 通过对比麦克风与固话信道下语音信号的时域、频域参数,结合固话传输系统的特性,分析语音信号经过固话信道传输后,各参数的异同点以及固话信道对语音信号的影响。并采用F比的方法,分析麦克风信道和固话信道下语音信号MFCC特征参数的差异。实验结果表明,语音信号经过固话信道传输后,不仅造成信号的频率失真,还伴随有宽带噪声和共振型噪声。在MFCC特征参数方面,麦克风和固话信道的第二维MFCC参数差异最明显,低维参数相比高维参数差异较大,男性说话人特征参数相比女性说话人差异较大。 展开更多
关键词 固话信道 噪声 语音参数 mel频率谱系 F比
在线阅读 下载PDF
基于小波子带分解的特征参数对语音自动切分的改进 被引量:2
17
作者 秦欢 柴佩琪 陈锴 《计算机应用》 CSCD 北大核心 2005年第6期1345-1346,共2页
采用了基于小波子带分解的特征提取方法,根据DCT和DWT两种去相关方法的不同,得到语音信号的特征参数分别为SubbandBasedCepstral(SBC)和WaveletPacketParameters(WPP)。实验切分结果表明,基于小波子带分解的特征参数比MFCC取得更好的切... 采用了基于小波子带分解的特征提取方法,根据DCT和DWT两种去相关方法的不同,得到语音信号的特征参数分别为SubbandBasedCepstral(SBC)和WaveletPacketParameters(WPP)。实验切分结果表明,基于小波子带分解的特征参数比MFCC取得更好的切分效果。 展开更多
关键词 隐马尔可夫模型 语音自动切分 mel频率谱系 小波子带分解
在线阅读 下载PDF
基于二维主成分分析法的变压器声纹特征参数融合方法 被引量:2
18
作者 孙安青 贾廷波 +3 位作者 王丰华 杨秀龙 岳美 许景华 《广东电力》 2022年第9期127-134,共8页
运行中的变压器声信号以其非接触式测量、高灵敏度和强时效性等优点逐渐成为基于数据驱动模型的变压器状态监测领域的关注热点,如何从非平稳的声信号中获取合理有效及区分度高的声纹特征参数是变压器状态监测的关键。对此,在分别计算变... 运行中的变压器声信号以其非接触式测量、高灵敏度和强时效性等优点逐渐成为基于数据驱动模型的变压器状态监测领域的关注热点,如何从非平稳的声信号中获取合理有效及区分度高的声纹特征参数是变压器状态监测的关键。对此,在分别计算变压器声信号Mel频率倒谱系数和常Q倒谱系数特征参数的基础上,引入二维主成分分析法对这2种声纹特征参数进行融合降维,旨在降低数据维数的同时获取主要声纹特征,并以平均类间区分度表征声纹特征参数的区分度。某变压器不同直流偏磁状态下声信号的计算结果表明,所提出的变压器声信号特征参数表征方法更加全面高效且区分度高,可为变压器运行状态声信号监测技术提供重要参考。 展开更多
关键词 变压器 mel频率谱系 常Q谱系 二维主成分分析法 声信号
在线阅读 下载PDF
车辆发动机异响信号的故障特征参数提取方法 被引量:7
19
作者 王昱翔 殷希梅 +1 位作者 陈凯 胡子阳 《兵器装备工程学报》 CAS 北大核心 2020年第2期44-48,共5页
选取某型运输车发动机正常运转与缺缸运转状态下音频信号作为样本,对原始信号进行预加重、分帧、加窗的预处理;在时域范围内获取分析帧信号的短时能量特征;在频域范围内计算离散功率谱,将其通过梅尔滤波器组,经离散余弦变换得到梅尔频... 选取某型运输车发动机正常运转与缺缸运转状态下音频信号作为样本,对原始信号进行预加重、分帧、加窗的预处理;在时域范围内获取分析帧信号的短时能量特征;在频域范围内计算离散功率谱,将其通过梅尔滤波器组,经离散余弦变换得到梅尔频率倒谱系数。研究结果表明,此方法得到的时、频域特征参数均能反映发动机的运转状态信息,可以有效区分是否缺缸运转,适合作为车辆发动机故障诊断与预测的特征向量,为下一步混合特征提取以及多故障识别打下基础,具有实际应用价值。 展开更多
关键词 故障诊断 特征参数 短时能量 梅尔频率谱系
在线阅读 下载PDF
基于特征相对贡献度对加权Mel倒谱的改进 被引量:5
20
作者 王家盛 郭其威 +1 位作者 吴松 马建敏 《声学技术》 CSCD 北大核心 2021年第3期408-414,共7页
在声纹识别系统的搭建过程中,提高识别率的一个重要做法是使语音信号中能够提取出的特征尽可能包含更多的说话人个性特征。为了探究特征参数各分量对识别系统性能的影响,文章基于高斯混合-通用背景模型(Gaussian Mixture Model-Universa... 在声纹识别系统的搭建过程中,提高识别率的一个重要做法是使语音信号中能够提取出的特征尽可能包含更多的说话人个性特征。为了探究特征参数各分量对识别系统性能的影响,文章基于高斯混合-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)基线系统,研究了在无噪环境中各维特征组合下的识别率,利用增减分量法定量计算出各维特征分量对识别率的相对贡献程度,并根据贡献度的强弱对各维特征分量进行合理加权,得到了贡献度拟合权重系数,将此系数用于改进梅尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征参数。仿真结果表明,对特征参数进行贡献度拟合权重系数加权后,声纹识别的正确率得到了提升。 展开更多
关键词 增减分量法 贡献度 梅尔(mel)谱系 高斯混合-通用背景模型(GMM-UBM)
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部