期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
改进的美尔倒谱系数用于说话人识别研究 被引量:3
1
作者 刘宏 刘立群 《计算机工程与应用》 CSCD 2012年第8期155-157,共3页
基于人耳听觉感知的MFCC较其他说话人特征具有强抗噪性、高识别率特点。考虑美尔滤波器组的结构,其只在低频区具有较高的分辨率,在高频区分辨率却较低,这样势必会遗失一些包含在高频区域的重要信息。利用反美尔域下的特征R-MFCC与MFCC... 基于人耳听觉感知的MFCC较其他说话人特征具有强抗噪性、高识别率特点。考虑美尔滤波器组的结构,其只在低频区具有较高的分辨率,在高频区分辨率却较低,这样势必会遗失一些包含在高频区域的重要信息。利用反美尔域下的特征R-MFCC与MFCC的各自优点,将R-MFCC与MFCC结合,形成优势互补,并给出了衡量各种特征参数识别能力的Fisher准则,结合Fisher准则构造出一种新的混合特征参数。采用支持向量机分别以MFCC、R-MFCC以及新构造的混合特征为参数进行说话人的识别,实验证明基于Fisher准则的优选混合特征作为说话人识别特征是可行的。 展开更多
关键词 说话人识别 美尔谱系 FIsHER准则 支持向量机
在线阅读 下载PDF
基于傅里叶变换和倒谱系数的电子音乐标记算法 被引量:2
2
作者 范勇冠 《现代电子技术》 北大核心 2020年第13期155-158,共4页
为解决当前对电子音乐标记准确性差、分辨率低的问题,提出基于傅里叶变换和倒谱系数的电子音乐标记算法。首先结合傅里叶变换算法采集电子音乐的特征频谱,并进行特征信号的分辨,以此计算出电子音乐的倒谱系数,根据匹配后的倒谱系数对电... 为解决当前对电子音乐标记准确性差、分辨率低的问题,提出基于傅里叶变换和倒谱系数的电子音乐标记算法。首先结合傅里叶变换算法采集电子音乐的特征频谱,并进行特征信号的分辨,以此计算出电子音乐的倒谱系数,根据匹配后的倒谱系数对电子音乐进行高精度分辨处理,根据分辨结果实现对电子音乐特征数值的准确标记。最后通过实验证实,基于傅里叶变换和倒谱系数的电子音乐标记算法相对于传统方法具有更高的准确性和分辨率,充分满足研究要求。 展开更多
关键词 傅里叶变换 谱系 电子音乐 音乐速度 节拍 谱图
在线阅读 下载PDF
一种新的可应用于声目标识别的倒谱系数 被引量:12
3
作者 马元锋 陈克安 +1 位作者 马苗 张成 《兵工学报》 EI CAS CSCD 北大核心 2009年第11期1477-1483,共7页
提出一种新的倒谱系数,与目前广泛采用的美尔倒谱系数(MFCC)相比有以下改进:1)基于听觉外周模型改进了美尔频率倒谱系数(MFCC)的三角滤波器;2)用与频率相关的指数压缩代替固定的对数压缩;3)分析了频率的临界带变换在语音识别中所起的作... 提出一种新的倒谱系数,与目前广泛采用的美尔倒谱系数(MFCC)相比有以下改进:1)基于听觉外周模型改进了美尔频率倒谱系数(MFCC)的三角滤波器;2)用与频率相关的指数压缩代替固定的对数压缩;3)分析了频率的临界带变换在语音识别中所起的作用,从声目标识别的角度提出在临界带变换中引入与信号相关的自适应机制。通过4组声目标识别仿真对比试验,表明了新的倒谱系数比MFCC在抗噪声能力方面有明显提升。 展开更多
关键词 信息处理技术 谱系 听觉模型 临界带变换 目标识别
在线阅读 下载PDF
听觉模型倒谱系数及其在声目标识别中的应用 被引量:1
4
作者 刘辉 杨俊安 周志增 《应用科学学报》 EI CAS CSCD 北大核心 2011年第1期51-55,共5页
针对目前广泛采用的美尔倒谱系数(MFCC)鲁棒性不足的问题,基于人类听觉模型提出了一种可用于战场声目标识别的倒谱系数.用小波包变换代替了传统的傅里叶变换,克服了傅里叶变换在频域上单分辨率的缺陷和对噪声的敏感性.用指数压缩替换固... 针对目前广泛采用的美尔倒谱系数(MFCC)鲁棒性不足的问题,基于人类听觉模型提出了一种可用于战场声目标识别的倒谱系数.用小波包变换代替了传统的傅里叶变换,克服了傅里叶变换在频域上单分辨率的缺陷和对噪声的敏感性.用指数压缩替换固定的对数压缩,较好地模拟了人耳处理信号的非线性能力.在SensIT实验数据和外场实际采集的低空目标数据上的实验结果表明:相对于经典的美尔倒谱系数,本文提出的倒谱系数在识别准确性和抗噪声能力方面都有较明显的提高. 展开更多
关键词 声目标识别 美尔谱系 听觉模型
在线阅读 下载PDF
基于HHT倒谱系数的说话人识别算法 被引量:4
5
作者 杜晓青 于凤芹 《计算机工程与应用》 CSCD 2014年第3期198-202,共5页
针对LPCC只反应语音静态特征且不能突出其低频局部特征问题,提出一种以HHT倒谱系数为特征的说话人识别算法,HHT的经验模态分解使语音的低频局部特征得到更好的描述,Hilbert变换能够刻画语音动态特性,改进了LPCC的不足。用经验模态分解... 针对LPCC只反应语音静态特征且不能突出其低频局部特征问题,提出一种以HHT倒谱系数为特征的说话人识别算法,HHT的经验模态分解使语音的低频局部特征得到更好的描述,Hilbert变换能够刻画语音动态特性,改进了LPCC的不足。用经验模态分解将语音分解为一系列固有模态函数分量并做Hilbert变换求得Hilbert边际谱,计算总边际谱的对数功率谱并做DCT得13维倒谱系数,将此特征送入高斯混合模型进行说话人识别。仿真实验结果表明,基于HHT倒谱系数的说话人识别算法,相较LPCC识别率提高了12.59%,但特征提取时间增加了19.27 s。 展开更多
关键词 说话人识别 希尔伯特黄变换(HHT) 谱系
在线阅读 下载PDF
基于短时傅里叶变换的智能音乐生成系统分析与研究
6
作者 李一熙 汪镭 +1 位作者 薛愈 吴启迪 《智能系统学报》 北大核心 2025年第3期750-760,共11页
在基于短时傅里叶变换(short-time Fourier transform,STFT)的智能音乐生成系统中,引入梅尔倒谱系数(Mel frequency cepstrum coefficient,MFCC)作为输入特征,并对STFT的损失函数进行优化设计,以提升音乐生成的质量。在对音符输入信号... 在基于短时傅里叶变换(short-time Fourier transform,STFT)的智能音乐生成系统中,引入梅尔倒谱系数(Mel frequency cepstrum coefficient,MFCC)作为输入特征,并对STFT的损失函数进行优化设计,以提升音乐生成的质量。在对音符输入信号进行短时傅里叶变换时,需要对时域信号进行截断并添加窗函数,对信号添加时域窗等效于在频域信号中进行卷积。时域信号在截断过程中存在频谱分析误差,使得频谱以实际频率值为中心,以窗函数频谱波形的形状向两侧扩散,从而产生频谱泄漏。不同窗函数的选择对最终生成音乐的品质具有显著影响。为此,提出一种基于能量校正因子、频域最大副瓣和主瓣增益的窗函数分析与选择方法,并开发相应脚本工具,从而完成基于符号域音乐的混合窗函数设计。实验结果表明,混合窗函数在不同的MIDI(musical instrument digital interface)数据集上均可有效减少频谱泄漏对信号截断的影响,具有很好的适应性和灵活性,从而更好地作用于基于STFT的智能音乐生成系统中。 展开更多
关键词 短时傅里叶变换 人工智能 音乐生成 窗函 梅尔谱系 频谱泄漏 主瓣增益 混合函
在线阅读 下载PDF
SMFCC:一种新的语音信号特征提取方法 被引量:4
7
作者 汪海彬 余正涛 +1 位作者 毛存礼 郭剑毅 《计算机应用》 CSCD 北大核心 2016年第6期1735-1740,共6页
针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD... 针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD)方法的二维时频矩阵有效去噪性,并结合相关统计分析方法最终获得语音特征.采用TIMIT语音数据库,将所提的特征和现有特征进行对比实验.SMFCC特征的等错误率(EER)和最小检测代价(Min DCF)均小于线性预测倒谱系数(LPCC)、MFCC及其结合方法 LMFCC,比MFCC的EER和Min DCF08分别下降了3.6%与17.9%.实验结果表明所提方法能够有效去除语音信号中的噪声,提升局部分辨率. 展开更多
关键词 s变换 奇异值分解 基于s变换的美尔倒谱系数 高斯混合模型-通用背景模型 说话人识别
在线阅读 下载PDF
特征降维与融合的水声目标识别方法 被引量:4
8
作者 李昊鑫 肖长诗 +2 位作者 元海文 郭玉滨 刘加轩 《哈尔滨工程大学学报》 北大核心 2025年第1期102-110,共9页
为解决水声目标在强噪声环境下识别困难以及特征高维问题,本文提出一种将水声信号进行离散小波变换并提取其低频系数与重组一维梅尔倒谱系数融合的方法,以减少特征维度并弥补信息损失。利用1D-CNN-LSTM神经网络在DeepShip和ShipsEar 2... 为解决水声目标在强噪声环境下识别困难以及特征高维问题,本文提出一种将水声信号进行离散小波变换并提取其低频系数与重组一维梅尔倒谱系数融合的方法,以减少特征维度并弥补信息损失。利用1D-CNN-LSTM神经网络在DeepShip和ShipsEar 2个数据集上进行实验,识别准确率均在99%以上。结果表明:该算法能够有效抑制噪声,具备较强的鲁棒性。将所提算法应用到单船识别,实验结果表明该算法能够有效区分同类型的不同船舶。 展开更多
关键词 水声目标识别 离散小波变换 梅尔谱系 特征融合 联合神经网络 单船识别 深度学习 船舶辐射噪声
在线阅读 下载PDF
语音特征参数MFCC的提取及其应用 被引量:11
9
作者 陈勇 屈志毅 +3 位作者 刘莹 酒康 郭爱平 杨志国 《湖南农业大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第10X期106-107,共2页
Mel频率是能够反映人耳对不同频率语音感知能力的一种频率表达方式.主要介绍了Mel频率倒谱系数(MFCC)的特点及提取方法,并提取了MFCC的一阶差分,使特征参数在说话人识别上能够更加准确的反映语音信息,提高识别率.
关键词 语音 MEL频率谱系 离散余弦变换
在线阅读 下载PDF
话者识别系统中语音特征参数的研究与仿真 被引量:17
10
作者 王金明 张雄伟 《系统仿真学报》 CAS CSCD 2003年第9期1276-1278,共3页
在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用... 在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用对识别系统性能的影响。通过仿真和实验,证明混合参数识别方法能使话者识别系统的正确识别率有明显的提高。 展开更多
关键词 说话者识别 动态特征 线性预测谱系 美尔谱系 仿真
在线阅读 下载PDF
融合LPC与MFCC的特征参数 被引量:8
11
作者 张学锋 王芳 夏萍 《计算机工程》 CAS CSCD 北大核心 2011年第4期216-217,229,共3页
在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一... 在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一阶差分、MFCC及其一阶差分和基于小波包分析的特征参数(WPDC)及其一阶差分作为识别参数进行对比实验。结果表明,以LPMFCC作为特征参数的系统具有较高的识别率。 展开更多
关键词 线性预测 美尔谱系 说话人识别
在线阅读 下载PDF
一种改进的基于倒谱特征的带噪端点检测方法 被引量:13
12
作者 于迎霞 史家茂 《计算机工程》 CAS CSCD 北大核心 2004年第19期85-87,共3页
影响语音识别性能的一个关键因素是端点检测的准确性。实际应用中的信噪比较低,使得某些高信噪比下性能好的检测算法不能有效地工作,影响系统的识别率。该文针对基于倒谱特征的带噪端点检测算法提出了3点改进:(1) 将语音信号经滤波后分... 影响语音识别性能的一个关键因素是端点检测的准确性。实际应用中的信噪比较低,使得某些高信噪比下性能好的检测算法不能有效地工作,影响系统的识别率。该文针对基于倒谱特征的带噪端点检测算法提出了3点改进:(1) 将语音信号经滤波后分成高低频两子带,分别进行分析;(2) 用LPC美尔倒谱特征LPCCMCC代替常规倒谱特征作为特征参数;(3) 改进噪声估计,使其具有自适应性。实验结果表明本方法在低信噪比下有较好的检测性能。 展开更多
关键词 端点检测 LPC美尔谱系 语音识别 滤波 Mel谱距离
在线阅读 下载PDF
基于LPCMCC的音频数据检索方法 被引量:5
13
作者 江星华 李应 《计算机工程》 CAS CSCD 北大核心 2009年第11期246-247,253,共3页
LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法... LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法的检索精度高于LPCC,检索效率高于美尔倒谱系数(MFCC)。 展开更多
关键词 LPC谱系 LPC美尔谱系 音频检索 美尔谱系
在线阅读 下载PDF
基于DSP和FPGA的机器人声控系统设计与实现 被引量:7
14
作者 刘京诚 高海英 廖志勇 《现代电子技术》 2006年第14期109-112,共4页
介绍了一种基于DSP和FPGA的机器人声控系统。在语音采集上,将DSP芯片TMS320C5509和音频芯片TLV320AIC23相结合进行语音的采集。在软件开发上,开发环境采用CCS 3.1,语音特征向量采用美尔频率倒谱系数,模式匹配和训练采用隐马尔可夫模型,... 介绍了一种基于DSP和FPGA的机器人声控系统。在语音采集上,将DSP芯片TMS320C5509和音频芯片TLV320AIC23相结合进行语音的采集。在软件开发上,开发环境采用CCS 3.1,语音特征向量采用美尔频率倒谱系数,模式匹配和训练采用隐马尔可夫模型,实现了语音指令的识别。在动作控制上,采用FPGA作为机器人头部动作逻辑控制器,使机器人能够根据非特定人的语音命令做出规定的头部动作。 展开更多
关键词 语音识别 DsP FPGA 机器人 美尔频率谱系 隐马尔可夫模型
在线阅读 下载PDF
基于HMM与SVM的语音活动检测 被引量:10
15
作者 肖佳林 赵聿晴 王英 《计算机工程》 CAS CSCD 2014年第1期203-208,共6页
工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通... 工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通过Viterbi算法得到N维最佳识别结果,将其转换为SVM特征向量输入到SVM分类器中进行分类判别,得到判决结果。实验结果表明,该算法在机械工作噪音的情况下,语音检测率较静态统计类算法平均提高9%,比小波支持向量机方法提高11%,在驾驶室噪音的情况下比小波SVM方法有较小幅度的提高,但其增长速度较快,且比传统的统计类算法提高9%。 展开更多
关键词 美尔频率谱系 隐马尔科夫模型 支持向量机 语音活动检测 核函
在线阅读 下载PDF
基于径向基神经网络的数字“0”~“9”语音识别 被引量:3
16
作者 余华 李海洋 李启元 《江西师范大学学报(自然科学版)》 CAS 北大核心 2009年第6期701-705,共5页
介绍了语音信号分析方法中的线性预测编码技术和滤波器组分析方法,并推导了MFCC系数.分析并讨论了语音识别研究中径向基神经网络的设计原则,以及特征参数等对语音识别结果的影响.实验结果表明:基于径向基神经网络的语音识别方法有着较... 介绍了语音信号分析方法中的线性预测编码技术和滤波器组分析方法,并推导了MFCC系数.分析并讨论了语音识别研究中径向基神经网络的设计原则,以及特征参数等对语音识别结果的影响.实验结果表明:基于径向基神经网络的语音识别方法有着较好的识别性能和应用效果,针对非特定人的孤立词识别,识别率可以达到90%以上. 展开更多
关键词 语音识别 特征提取 美尔谱系 径向基神经网络
在线阅读 下载PDF
基于感知模型的美尔谱失真测度 被引量:4
17
作者 陈华伟 靳蕃 《西南交通大学学报》 EI CSCD 北大核心 2006年第6期723-728,共6页
为了有效评价通信系统中的语音质量,基于语音感知分析,提出了M el域上一种新的语音信号特征表示方法———MFSC(美尔谱系数).MFSC既考虑人耳对频率的非线性感知特性,又结合了声音强度-响度非线性变换特性,符合语音感知分析.基于MFSC特... 为了有效评价通信系统中的语音质量,基于语音感知分析,提出了M el域上一种新的语音信号特征表示方法———MFSC(美尔谱系数).MFSC既考虑人耳对频率的非线性感知特性,又结合了声音强度-响度非线性变换特性,符合语音感知分析.基于MFSC特征参数的提取,提出了用于语音质量客观评价的美尔谱失真测度(M el-SD),并将其应用于干扰条件下的无线通信系统语音质量评价.实验结果表明,M el-SD的平均相关值为0.942,分别比M el-CD和PESQ(语音质量感知评价)提高了0.089和0.031. 展开更多
关键词 语音质量 客观评价 美尔谱系 Mel谱失真测度 Mel谱距离测度
在线阅读 下载PDF
基于HHT变换的病态嗓音特征提取及识别研究 被引量:7
18
作者 龚英姬 胡维平 《计算机工程与应用》 CSCD 北大核心 2007年第34期217-219,245,共4页
主要介绍基于HHT变换提取的瞬时能量(A)和瞬时频率(f)的标准差参数作为病态嗓音特征参数的有效性,详细描述了A-f新特征参数的提取过程,并利用DHMM模型对A-f标准差新特征参数,与语音识别中常用的MFCC系数进行识别。识别结果表明,由HHT变... 主要介绍基于HHT变换提取的瞬时能量(A)和瞬时频率(f)的标准差参数作为病态嗓音特征参数的有效性,详细描述了A-f新特征参数的提取过程,并利用DHMM模型对A-f标准差新特征参数,与语音识别中常用的MFCC系数进行识别。识别结果表明,由HHT变换提取的A-f标准差参数更适合于描述病态嗓音,更能有效区分病态嗓音和正常嗓音。 展开更多
关键词 希尔伯特黄变换 病态嗓音 A—f标准差参 离散隐含马尔可夫模型 MEL频率谱系
在线阅读 下载PDF
基于DSP的高速实时语音识别系统的设计与实现 被引量:4
19
作者 李邵梅 陈鸿昶 王凯 《现代电子技术》 2007年第15期109-111,共3页
识别正确率和抗噪性能固然是语音识别的研究重点,但是识别响应速度也是决定系统实用化的关键所在。以TMS320C6713为核心构建硬件平台,通过采用高效C语言和线性汇编混合编程的方式,结合硬件特点,对代码进行了优化,实现了以美尔频率倒谱... 识别正确率和抗噪性能固然是语音识别的研究重点,但是识别响应速度也是决定系统实用化的关键所在。以TMS320C6713为核心构建硬件平台,通过采用高效C语言和线性汇编混合编程的方式,结合硬件特点,对代码进行了优化,实现了以美尔频率倒谱系数为特征参数,采用动态时间弯折算法的高速语音实时识别系统,识别速率达0.29倍实时,可实现多路语音的并行识别。 展开更多
关键词 多路实时语音识别 字信号处理器 美尔频率谱系 动态时间弯折
在线阅读 下载PDF
基于提升小波变换的MFCC在目标识别中的应用 被引量:10
20
作者 石超雄 李钢虎 +1 位作者 何会会 赵妮 《声学技术》 CSCD 2014年第4期372-375,共4页
水下环境噪声对被动声呐目标的分类识别影响显著,为了提高水声信号识别系统对环境噪声的鲁棒性,采用提升小波变换方法提取MFCC特征,对水下被动声呐目标进行分类和识别。仿真实验表明,与传统MFCC和小波变换的MFCC相比,在信噪比相近的情况... 水下环境噪声对被动声呐目标的分类识别影响显著,为了提高水声信号识别系统对环境噪声的鲁棒性,采用提升小波变换方法提取MFCC特征,对水下被动声呐目标进行分类和识别。仿真实验表明,与传统MFCC和小波变换的MFCC相比,在信噪比相近的情况下,提升小波变换方法提取MFCC具有识别率较高、对噪声鲁棒性较好的显著优点。 展开更多
关键词 提升小波变换 MEL频率谱系 分类识别
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部