期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
美尔谱系数与卷积神经网络相组合的环境声音识别方法 被引量:10
1
作者 刘亚荣 黄昕哲 +1 位作者 谢晓兰 刘鑫 《信号处理》 CSCD 北大核心 2020年第6期1020-1028,共9页
通过对复杂环境下声音识别技术进行研究,本文提出了美尔谱系数(MFSC)与卷积神经网络(CNN)相组合的环境声音识别方法。对声音事件提取其MFSC特征,将特征参数作为输入送入设计好的CNN模型中对声音事件进行分类。实验数据集采用ESC-10,将... 通过对复杂环境下声音识别技术进行研究,本文提出了美尔谱系数(MFSC)与卷积神经网络(CNN)相组合的环境声音识别方法。对声音事件提取其MFSC特征,将特征参数作为输入送入设计好的CNN模型中对声音事件进行分类。实验数据集采用ESC-10,将构建的卷积神经网络模型与随机森林、支持向量机(SVM)、深度神经网络(DNN)及DCASE比赛中常用的三种识别模型进行对比实验。实验结果表明,在相同数据集下,本文所设计的美尔谱系数与卷积神经网络相组合的环境声音识别方法相较传统的声音识别方法在识别率上分别有13.1%,18.3%,15.7%的提升,相较于DCASE比赛中的三种常用识别模型,本文所设计识别模型识别率及识别效率均有明显的优势。 展开更多
关键词 卷积神经网络 美尔谱系数 环境声音识别
在线阅读 下载PDF
改进的美尔倒谱系数用于说话人识别研究 被引量:3
2
作者 刘宏 刘立群 《计算机工程与应用》 CSCD 2012年第8期155-157,共3页
基于人耳听觉感知的MFCC较其他说话人特征具有强抗噪性、高识别率特点。考虑美尔滤波器组的结构,其只在低频区具有较高的分辨率,在高频区分辨率却较低,这样势必会遗失一些包含在高频区域的重要信息。利用反美尔域下的特征R-MFCC与MFCC... 基于人耳听觉感知的MFCC较其他说话人特征具有强抗噪性、高识别率特点。考虑美尔滤波器组的结构,其只在低频区具有较高的分辨率,在高频区分辨率却较低,这样势必会遗失一些包含在高频区域的重要信息。利用反美尔域下的特征R-MFCC与MFCC的各自优点,将R-MFCC与MFCC结合,形成优势互补,并给出了衡量各种特征参数识别能力的Fisher准则,结合Fisher准则构造出一种新的混合特征参数。采用支持向量机分别以MFCC、R-MFCC以及新构造的混合特征为参数进行说话人的识别,实验证明基于Fisher准则的优选混合特征作为说话人识别特征是可行的。 展开更多
关键词 说话人识别 美尔谱系 FISHER准则 支持向量机
在线阅读 下载PDF
听觉模型倒谱系数及其在声目标识别中的应用 被引量:1
3
作者 刘辉 杨俊安 周志增 《应用科学学报》 EI CAS CSCD 北大核心 2011年第1期51-55,共5页
针对目前广泛采用的美尔倒谱系数(MFCC)鲁棒性不足的问题,基于人类听觉模型提出了一种可用于战场声目标识别的倒谱系数.用小波包变换代替了传统的傅里叶变换,克服了傅里叶变换在频域上单分辨率的缺陷和对噪声的敏感性.用指数压缩替换固... 针对目前广泛采用的美尔倒谱系数(MFCC)鲁棒性不足的问题,基于人类听觉模型提出了一种可用于战场声目标识别的倒谱系数.用小波包变换代替了传统的傅里叶变换,克服了傅里叶变换在频域上单分辨率的缺陷和对噪声的敏感性.用指数压缩替换固定的对数压缩,较好地模拟了人耳处理信号的非线性能力.在SensIT实验数据和外场实际采集的低空目标数据上的实验结果表明:相对于经典的美尔倒谱系数,本文提出的倒谱系数在识别准确性和抗噪声能力方面都有较明显的提高. 展开更多
关键词 声目标识别 美尔谱系 听觉模型
在线阅读 下载PDF
MFSC系数特征局部有限权重共享CNN语音识别 被引量:9
4
作者 黄玉蕾 罗晓霞 刘笃仁 《控制工程》 CSCD 北大核心 2017年第7期1507-1513,共7页
针对传统语音识别应用中识别效果不理想的问题,提出一种基于美尔谱系数(MFSC)特征的有限局部权重共享卷积神经网络(CNN)语音识别。首先,借鉴图像处理中对输入图像信息的处理方式,构建语音信号的二维阵列特征映射输入形式,每个映射表示... 针对传统语音识别应用中识别效果不理想的问题,提出一种基于美尔谱系数(MFSC)特征的有限局部权重共享卷积神经网络(CNN)语音识别。首先,借鉴图像处理中对输入图像信息的处理方式,构建语音信号的二维阵列特征映射输入形式,每个映射表示为含静态数据、一阶导数、二阶导数的MFSC系数特征,便于应用图像处理方式进行识别;其次,引入图像处理的卷积神经网络,并且针对语音信号特征的局部特性,构建有限局部权重共享卷积神经网络学习算法,提高语音信号辨识度并降低算法复杂度;最后,通过实验对所提算法进行验证,并且给出算法参数变化影响实验,为具体应用提供依据。 展开更多
关键词 卷积神经网络 局部权重共享 语音识别 特征映射 美尔谱系数
在线阅读 下载PDF
基于感知模型的美尔谱失真测度 被引量:4
5
作者 陈华伟 靳蕃 《西南交通大学学报》 EI CSCD 北大核心 2006年第6期723-728,共6页
为了有效评价通信系统中的语音质量,基于语音感知分析,提出了M el域上一种新的语音信号特征表示方法———MFSC(美尔谱系数).MFSC既考虑人耳对频率的非线性感知特性,又结合了声音强度-响度非线性变换特性,符合语音感知分析.基于MFSC特... 为了有效评价通信系统中的语音质量,基于语音感知分析,提出了M el域上一种新的语音信号特征表示方法———MFSC(美尔谱系数).MFSC既考虑人耳对频率的非线性感知特性,又结合了声音强度-响度非线性变换特性,符合语音感知分析.基于MFSC特征参数的提取,提出了用于语音质量客观评价的美尔谱失真测度(M el-SD),并将其应用于干扰条件下的无线通信系统语音质量评价.实验结果表明,M el-SD的平均相关值为0.942,分别比M el-CD和PESQ(语音质量感知评价)提高了0.089和0.031. 展开更多
关键词 语音质量 客观评价 美尔谱系数 Mel谱失真测度 Mel倒谱距离测度
在线阅读 下载PDF
融合LPC与MFCC的特征参数 被引量:8
6
作者 张学锋 王芳 夏萍 《计算机工程》 CAS CSCD 北大核心 2011年第4期216-217,229,共3页
在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一... 在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一阶差分、MFCC及其一阶差分和基于小波包分析的特征参数(WPDC)及其一阶差分作为识别参数进行对比实验。结果表明,以LPMFCC作为特征参数的系统具有较高的识别率。 展开更多
关键词 线性预测 美尔谱系 说话人识别
在线阅读 下载PDF
话者识别系统中语音特征参数的研究与仿真 被引量:17
7
作者 王金明 张雄伟 《系统仿真学报》 CAS CSCD 2003年第9期1276-1278,共3页
在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用... 在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用对识别系统性能的影响。通过仿真和实验,证明混合参数识别方法能使话者识别系统的正确识别率有明显的提高。 展开更多
关键词 说话者识别 动态特征 线性预测倒谱系 美尔谱系 仿真
在线阅读 下载PDF
基于LPCMCC的音频数据检索方法 被引量:5
8
作者 江星华 李应 《计算机工程》 CAS CSCD 北大核心 2009年第11期246-247,253,共3页
LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法... LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法的检索精度高于LPCC,检索效率高于美尔倒谱系数(MFCC)。 展开更多
关键词 LPC倒谱系 LPC美尔谱系 音频检索 美尔谱系
在线阅读 下载PDF
基于径向基神经网络的数字“0”~“9”语音识别 被引量:3
9
作者 余华 李海洋 李启元 《江西师范大学学报(自然科学版)》 CAS 北大核心 2009年第6期701-705,共5页
介绍了语音信号分析方法中的线性预测编码技术和滤波器组分析方法,并推导了MFCC系数.分析并讨论了语音识别研究中径向基神经网络的设计原则,以及特征参数等对语音识别结果的影响.实验结果表明:基于径向基神经网络的语音识别方法有着较... 介绍了语音信号分析方法中的线性预测编码技术和滤波器组分析方法,并推导了MFCC系数.分析并讨论了语音识别研究中径向基神经网络的设计原则,以及特征参数等对语音识别结果的影响.实验结果表明:基于径向基神经网络的语音识别方法有着较好的识别性能和应用效果,针对非特定人的孤立词识别,识别率可以达到90%以上. 展开更多
关键词 语音识别 特征提取 美尔谱系 径向基神经网络
在线阅读 下载PDF
一种基于MFCC和LPCC的文本相关说话人识别方法 被引量:14
10
作者 于明 袁玉倩 +1 位作者 董浩 王哲 《计算机应用》 CSCD 北大核心 2006年第4期883-885,共3页
在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。... 在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。通过与动态时间规整算法和传统的矢量量化方法进行比较表明,在系统响应时间并未明显增加的基础上,该模型识别率有一定提高。 展开更多
关键词 说话人识别 线性预测倒谱系 美尔谱系 矢量量化 动态时间规整
在线阅读 下载PDF
实时说话人辨识系统中改进的DTW算法 被引量:20
11
作者 李邵梅 刘力雄 陈鸿昶 《计算机工程》 CAS CSCD 北大核心 2008年第4期218-219,共2页
识别正确率和抗噪性能是语音识别的研究重点,而识别响应速度也是决定系统实用化的关键。文章改进了传统的动态时间弯折算法结构,将其应用于实时说话人辨识系统中,极大地提高了系统运行速度,随着待识别语音数目的增多,该算法优势更加明... 识别正确率和抗噪性能是语音识别的研究重点,而识别响应速度也是决定系统实用化的关键。文章改进了传统的动态时间弯折算法结构,将其应用于实时说话人辨识系统中,极大地提高了系统运行速度,随着待识别语音数目的增多,该算法优势更加明显。实验表明,在不影响系统识别率的情况下,该方法使系统的运行速度平均提高了1.5倍。 展开更多
关键词 说话人辨识 美尔谱系 动态时间弯折
在线阅读 下载PDF
一种改进的基于倒谱特征的带噪端点检测方法 被引量:13
12
作者 于迎霞 史家茂 《计算机工程》 CAS CSCD 北大核心 2004年第19期85-87,共3页
影响语音识别性能的一个关键因素是端点检测的准确性。实际应用中的信噪比较低,使得某些高信噪比下性能好的检测算法不能有效地工作,影响系统的识别率。该文针对基于倒谱特征的带噪端点检测算法提出了3点改进:(1) 将语音信号经滤波后分... 影响语音识别性能的一个关键因素是端点检测的准确性。实际应用中的信噪比较低,使得某些高信噪比下性能好的检测算法不能有效地工作,影响系统的识别率。该文针对基于倒谱特征的带噪端点检测算法提出了3点改进:(1) 将语音信号经滤波后分成高低频两子带,分别进行分析;(2) 用LPC美尔倒谱特征LPCCMCC代替常规倒谱特征作为特征参数;(3) 改进噪声估计,使其具有自适应性。实验结果表明本方法在低信噪比下有较好的检测性能。 展开更多
关键词 端点检测 LPC美尔谱系 语音识别 滤波 Mel倒谱距离
在线阅读 下载PDF
基于K-L距离的两步固定音频检索方法 被引量:8
13
作者 齐晓倩 陈鸿昶 黄海 《计算机工程》 CAS CSCD 北大核心 2011年第19期160-162,共3页
根据音频文件数据量大、数据间存在一定相关性的特点,提出一种基于K-L距离的两步固定音频检索方法。该方法采用基于可变门限的直方图检索方法快速筛选出相似度较高的语音文件,利用特征矩阵的K-L距离对剩余语音进行精确比较,取得较好的... 根据音频文件数据量大、数据间存在一定相关性的特点,提出一种基于K-L距离的两步固定音频检索方法。该方法采用基于可变门限的直方图检索方法快速筛选出相似度较高的语音文件,利用特征矩阵的K-L距离对剩余语音进行精确比较,取得较好的效果。实验结果证明,该方法能使检索准确率达到90%左右。 展开更多
关键词 固定音频检索 过零率 直方图 美尔频率倒谱系 K-L距离
在线阅读 下载PDF
SMFCC:一种新的语音信号特征提取方法 被引量:4
14
作者 汪海彬 余正涛 +1 位作者 毛存礼 郭剑毅 《计算机应用》 CSCD 北大核心 2016年第6期1735-1740,共6页
针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD... 针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD)方法的二维时频矩阵有效去噪性,并结合相关统计分析方法最终获得语音特征.采用TIMIT语音数据库,将所提的特征和现有特征进行对比实验.SMFCC特征的等错误率(EER)和最小检测代价(Min DCF)均小于线性预测倒谱系数(LPCC)、MFCC及其结合方法 LMFCC,比MFCC的EER和Min DCF08分别下降了3.6%与17.9%.实验结果表明所提方法能够有效去除语音信号中的噪声,提升局部分辨率. 展开更多
关键词 S变换 奇异值分解 基于S变换的美尔谱系 高斯混合模型-通用背景模型 说话人识别
在线阅读 下载PDF
语音信号时频特征显示系统的设计和仿真 被引量:3
15
作者 王光艳 赵晓群 王霞 《计算机工程与应用》 CSCD 北大核心 2010年第29期73-75,97,共4页
语音信号处理算法众多,但用于语音处理算法验证和开发的可视化研究平台极少。基于MATLAB GUI技术,完成语音信号典型时频特征参数提取和显示系统仿真平台的设计。可实现多种格式音频文件的载入和播放、波形和频谱显示、以及线性预测倒谱... 语音信号处理算法众多,但用于语音处理算法验证和开发的可视化研究平台极少。基于MATLAB GUI技术,完成语音信号典型时频特征参数提取和显示系统仿真平台的设计。可实现多种格式音频文件的载入和播放、波形和频谱显示、以及线性预测倒谱系数和美尔倒谱系数的计算、存储和显示等功能。系统界面友好、操作方便,可实现参数的交互输入并控制显示结果。仿真结果验证了相关时频特征参数提取算法的正确性,提高了对算法或数据处理效果的直观认识。 展开更多
关键词 时频特征 频谱 线性预测倒谱系 美尔谱系
在线阅读 下载PDF
基于DSP和FPGA的机器人声控系统设计与实现 被引量:7
16
作者 刘京诚 高海英 廖志勇 《现代电子技术》 2006年第14期109-112,共4页
介绍了一种基于DSP和FPGA的机器人声控系统。在语音采集上,将DSP芯片TMS320C5509和音频芯片TLV320AIC23相结合进行语音的采集。在软件开发上,开发环境采用CCS 3.1,语音特征向量采用美尔频率倒谱系数,模式匹配和训练采用隐马尔可夫模型,... 介绍了一种基于DSP和FPGA的机器人声控系统。在语音采集上,将DSP芯片TMS320C5509和音频芯片TLV320AIC23相结合进行语音的采集。在软件开发上,开发环境采用CCS 3.1,语音特征向量采用美尔频率倒谱系数,模式匹配和训练采用隐马尔可夫模型,实现了语音指令的识别。在动作控制上,采用FPGA作为机器人头部动作逻辑控制器,使机器人能够根据非特定人的语音命令做出规定的头部动作。 展开更多
关键词 语音识别 DSP FPGA 机器人 美尔频率倒谱系 隐马尔可夫模型
在线阅读 下载PDF
基于HMM与SVM的语音活动检测 被引量:10
17
作者 肖佳林 赵聿晴 王英 《计算机工程》 CAS CSCD 2014年第1期203-208,共6页
工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通... 工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通过Viterbi算法得到N维最佳识别结果,将其转换为SVM特征向量输入到SVM分类器中进行分类判别,得到判决结果。实验结果表明,该算法在机械工作噪音的情况下,语音检测率较静态统计类算法平均提高9%,比小波支持向量机方法提高11%,在驾驶室噪音的情况下比小波SVM方法有较小幅度的提高,但其增长速度较快,且比传统的统计类算法提高9%。 展开更多
关键词 美尔频率倒谱系 隐马尔科夫模型 支持向量机 语音活动检测 核函
在线阅读 下载PDF
MFCC中DCT结构的设计与实现 被引量:3
18
作者 孔维功 张国杰 张效军 《计算机工程》 CAS CSCD 北大核心 2009年第5期265-267,共3页
根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实... 根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实时性要求和精度要求。 展开更多
关键词 说话人识别 美尔频率倒谱系 离散余弦变换 分布式算法
在线阅读 下载PDF
基于信息融合的短语音说话人识别方法研究 被引量:3
19
作者 周萍 唐李珍 《计算机工程》 CAS CSCD 北大核心 2011年第2期169-171,共3页
针对短训练语音的说话人识别系统,提出一种基于决策层融合的识别算法。识别时运用经验模式分解法对语音信号进行处理,对获取的固有模态函数分量提取语音特征序列,分别进行匹配,通过决策层融合算法,将所得的匹配结果与传统独立识别结果... 针对短训练语音的说话人识别系统,提出一种基于决策层融合的识别算法。识别时运用经验模式分解法对语音信号进行处理,对获取的固有模态函数分量提取语音特征序列,分别进行匹配,通过决策层融合算法,将所得的匹配结果与传统独立识别结果相结合,最终输出识别结果。利用信号分解的方法,实现待测语音信号的重复识别,同时采用决策层融合算法优化识别结果,从而在短训练语音情况下,使系统的识别率得到保障。实验结果表明,该算法在短训练语音识别系统中的识别效果优于传统方法。 展开更多
关键词 短语音 说话人识别 美尔频率倒谱系 经验模式分解 决策层融合
在线阅读 下载PDF
基于DSP的高速实时语音识别系统的设计与实现 被引量:4
20
作者 李邵梅 陈鸿昶 王凯 《现代电子技术》 2007年第15期109-111,共3页
识别正确率和抗噪性能固然是语音识别的研究重点,但是识别响应速度也是决定系统实用化的关键所在。以TMS320C6713为核心构建硬件平台,通过采用高效C语言和线性汇编混合编程的方式,结合硬件特点,对代码进行了优化,实现了以美尔频率倒谱... 识别正确率和抗噪性能固然是语音识别的研究重点,但是识别响应速度也是决定系统实用化的关键所在。以TMS320C6713为核心构建硬件平台,通过采用高效C语言和线性汇编混合编程的方式,结合硬件特点,对代码进行了优化,实现了以美尔频率倒谱系数为特征参数,采用动态时间弯折算法的高速语音实时识别系统,识别速率达0.29倍实时,可实现多路语音的并行识别。 展开更多
关键词 多路实时语音识别 字信号处理器 美尔频率倒谱系 动态时间弯折
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部