期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
改进的美尔倒谱系数用于说话人识别研究 被引量:3
1
作者 刘宏 刘立群 《计算机工程与应用》 CSCD 2012年第8期155-157,共3页
基于人耳听觉感知的MFCC较其他说话人特征具有强抗噪性、高识别率特点。考虑美尔滤波器组的结构,其只在低频区具有较高的分辨率,在高频区分辨率却较低,这样势必会遗失一些包含在高频区域的重要信息。利用反美尔域下的特征R-MFCC与MFCC... 基于人耳听觉感知的MFCC较其他说话人特征具有强抗噪性、高识别率特点。考虑美尔滤波器组的结构,其只在低频区具有较高的分辨率,在高频区分辨率却较低,这样势必会遗失一些包含在高频区域的重要信息。利用反美尔域下的特征R-MFCC与MFCC的各自优点,将R-MFCC与MFCC结合,形成优势互补,并给出了衡量各种特征参数识别能力的Fisher准则,结合Fisher准则构造出一种新的混合特征参数。采用支持向量机分别以MFCC、R-MFCC以及新构造的混合特征为参数进行说话人的识别,实验证明基于Fisher准则的优选混合特征作为说话人识别特征是可行的。 展开更多
关键词 说话人识别 美尔倒谱系数 FISHER准则 支持向量机
在线阅读 下载PDF
听觉模型倒谱系数及其在声目标识别中的应用 被引量:1
2
作者 刘辉 杨俊安 周志增 《应用科学学报》 EI CAS CSCD 北大核心 2011年第1期51-55,共5页
针对目前广泛采用的美尔倒谱系数(MFCC)鲁棒性不足的问题,基于人类听觉模型提出了一种可用于战场声目标识别的倒谱系数.用小波包变换代替了传统的傅里叶变换,克服了傅里叶变换在频域上单分辨率的缺陷和对噪声的敏感性.用指数压缩替换固... 针对目前广泛采用的美尔倒谱系数(MFCC)鲁棒性不足的问题,基于人类听觉模型提出了一种可用于战场声目标识别的倒谱系数.用小波包变换代替了传统的傅里叶变换,克服了傅里叶变换在频域上单分辨率的缺陷和对噪声的敏感性.用指数压缩替换固定的对数压缩,较好地模拟了人耳处理信号的非线性能力.在SensIT实验数据和外场实际采集的低空目标数据上的实验结果表明:相对于经典的美尔倒谱系数,本文提出的倒谱系数在识别准确性和抗噪声能力方面都有较明显的提高. 展开更多
关键词 声目标识别 美尔倒谱系数 听觉模型
在线阅读 下载PDF
基于LPCMCC的音频数据检索方法 被引量:5
3
作者 江星华 李应 《计算机工程》 CAS CSCD 北大核心 2009年第11期246-247,253,共3页
LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法... LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法的检索精度高于LPCC,检索效率高于美尔倒谱系数(MFCC)。 展开更多
关键词 LPC谱系 LPC美尔倒谱系数 音频检索 美尔倒谱系数
在线阅读 下载PDF
融合LPC与MFCC的特征参数 被引量:8
4
作者 张学锋 王芳 夏萍 《计算机工程》 CAS CSCD 北大核心 2011年第4期216-217,229,共3页
在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一... 在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一阶差分、MFCC及其一阶差分和基于小波包分析的特征参数(WPDC)及其一阶差分作为识别参数进行对比实验。结果表明,以LPMFCC作为特征参数的系统具有较高的识别率。 展开更多
关键词 线性预测 美尔倒谱系数 说话人识别
在线阅读 下载PDF
一种改进的基于倒谱特征的带噪端点检测方法 被引量:13
5
作者 于迎霞 史家茂 《计算机工程》 CAS CSCD 北大核心 2004年第19期85-87,共3页
影响语音识别性能的一个关键因素是端点检测的准确性。实际应用中的信噪比较低,使得某些高信噪比下性能好的检测算法不能有效地工作,影响系统的识别率。该文针对基于倒谱特征的带噪端点检测算法提出了3点改进:(1) 将语音信号经滤波后分... 影响语音识别性能的一个关键因素是端点检测的准确性。实际应用中的信噪比较低,使得某些高信噪比下性能好的检测算法不能有效地工作,影响系统的识别率。该文针对基于倒谱特征的带噪端点检测算法提出了3点改进:(1) 将语音信号经滤波后分成高低频两子带,分别进行分析;(2) 用LPC美尔倒谱特征LPCCMCC代替常规倒谱特征作为特征参数;(3) 改进噪声估计,使其具有自适应性。实验结果表明本方法在低信噪比下有较好的检测性能。 展开更多
关键词 端点检测 LPC美尔倒谱系数 语音识别 滤波 Mel谱距离
在线阅读 下载PDF
话者识别系统中语音特征参数的研究与仿真 被引量:17
6
作者 王金明 张雄伟 《系统仿真学报》 CAS CSCD 2003年第9期1276-1278,共3页
在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用... 在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用对识别系统性能的影响。通过仿真和实验,证明混合参数识别方法能使话者识别系统的正确识别率有明显的提高。 展开更多
关键词 说话者识别 动态特征 线性预测谱系 美尔倒谱系数 仿真
在线阅读 下载PDF
基于径向基神经网络的数字“0”~“9”语音识别 被引量:3
7
作者 余华 李海洋 李启元 《江西师范大学学报(自然科学版)》 CAS 北大核心 2009年第6期701-705,共5页
介绍了语音信号分析方法中的线性预测编码技术和滤波器组分析方法,并推导了MFCC系数.分析并讨论了语音识别研究中径向基神经网络的设计原则,以及特征参数等对语音识别结果的影响.实验结果表明:基于径向基神经网络的语音识别方法有着较... 介绍了语音信号分析方法中的线性预测编码技术和滤波器组分析方法,并推导了MFCC系数.分析并讨论了语音识别研究中径向基神经网络的设计原则,以及特征参数等对语音识别结果的影响.实验结果表明:基于径向基神经网络的语音识别方法有着较好的识别性能和应用效果,针对非特定人的孤立词识别,识别率可以达到90%以上. 展开更多
关键词 语音识别 特征提取 美尔倒谱系数 径向基神经网络
在线阅读 下载PDF
一种基于MFCC和LPCC的文本相关说话人识别方法 被引量:14
8
作者 于明 袁玉倩 +1 位作者 董浩 王哲 《计算机应用》 CSCD 北大核心 2006年第4期883-885,共3页
在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。... 在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。通过与动态时间规整算法和传统的矢量量化方法进行比较表明,在系统响应时间并未明显增加的基础上,该模型识别率有一定提高。 展开更多
关键词 说话人识别 线性预测谱系 美尔倒谱系数 矢量量化 动态时间规整
在线阅读 下载PDF
实时说话人辨识系统中改进的DTW算法 被引量:20
9
作者 李邵梅 刘力雄 陈鸿昶 《计算机工程》 CAS CSCD 北大核心 2008年第4期218-219,共2页
识别正确率和抗噪性能是语音识别的研究重点,而识别响应速度也是决定系统实用化的关键。文章改进了传统的动态时间弯折算法结构,将其应用于实时说话人辨识系统中,极大地提高了系统运行速度,随着待识别语音数目的增多,该算法优势更加明... 识别正确率和抗噪性能是语音识别的研究重点,而识别响应速度也是决定系统实用化的关键。文章改进了传统的动态时间弯折算法结构,将其应用于实时说话人辨识系统中,极大地提高了系统运行速度,随着待识别语音数目的增多,该算法优势更加明显。实验表明,在不影响系统识别率的情况下,该方法使系统的运行速度平均提高了1.5倍。 展开更多
关键词 说话人辨识 美尔倒谱系数 动态时间弯折
在线阅读 下载PDF
SMFCC:一种新的语音信号特征提取方法 被引量:4
10
作者 汪海彬 余正涛 +1 位作者 毛存礼 郭剑毅 《计算机应用》 CSCD 北大核心 2016年第6期1735-1740,共6页
针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD... 针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD)方法的二维时频矩阵有效去噪性,并结合相关统计分析方法最终获得语音特征.采用TIMIT语音数据库,将所提的特征和现有特征进行对比实验.SMFCC特征的等错误率(EER)和最小检测代价(Min DCF)均小于线性预测倒谱系数(LPCC)、MFCC及其结合方法 LMFCC,比MFCC的EER和Min DCF08分别下降了3.6%与17.9%.实验结果表明所提方法能够有效去除语音信号中的噪声,提升局部分辨率. 展开更多
关键词 S变换 奇异值分解 基于S变换的美尔倒谱系数 高斯混合模型-通用背景模型 说话人识别
在线阅读 下载PDF
语音信号时频特征显示系统的设计和仿真 被引量:3
11
作者 王光艳 赵晓群 王霞 《计算机工程与应用》 CSCD 北大核心 2010年第29期73-75,97,共4页
语音信号处理算法众多,但用于语音处理算法验证和开发的可视化研究平台极少。基于MATLAB GUI技术,完成语音信号典型时频特征参数提取和显示系统仿真平台的设计。可实现多种格式音频文件的载入和播放、波形和频谱显示、以及线性预测倒谱... 语音信号处理算法众多,但用于语音处理算法验证和开发的可视化研究平台极少。基于MATLAB GUI技术,完成语音信号典型时频特征参数提取和显示系统仿真平台的设计。可实现多种格式音频文件的载入和播放、波形和频谱显示、以及线性预测倒谱系数和美尔倒谱系数的计算、存储和显示等功能。系统界面友好、操作方便,可实现参数的交互输入并控制显示结果。仿真结果验证了相关时频特征参数提取算法的正确性,提高了对算法或数据处理效果的直观认识。 展开更多
关键词 时频特征 频谱 线性预测谱系 美尔倒谱系数
在线阅读 下载PDF
改进的DTW算法在实时语音辨识系统中的应用 被引量:4
12
作者 曹茂俊 尚福华 《科学技术与工程》 2010年第7期1652-1655,共4页
改进了传统的动态时间弯曲算法结构,将其应用到实时语音辨识系统中,并在计算机上进行了仿真。实验结果表明采用改进后的DTW算法有效地降低了待处理数据量和识别时间,提高了系统的运行速度。随着待识别语音信号数量的增多,该算法优势更... 改进了传统的动态时间弯曲算法结构,将其应用到实时语音辨识系统中,并在计算机上进行了仿真。实验结果表明采用改进后的DTW算法有效地降低了待处理数据量和识别时间,提高了系统的运行速度。随着待识别语音信号数量的增多,该算法优势更加明显。 展开更多
关键词 动态时间弯曲 端点检测 美尔倒谱系数 语音辨识
在线阅读 下载PDF
用于版权和内容认证的音频水印 被引量:5
13
作者 林晓丹 《计算机应用》 CSCD 北大核心 2010年第8期2269-2271,共3页
提出了一种多功能水印算法,能同时对数字音频版权和内容完整性进行认证。首先将代表版权信息的二值图像以零水印方式嵌入音频美尔倒谱系数(MFCC),再将该系数转换成二进制串,作为最终的水印信息以量化方式嵌入音频离散余弦变换(DCT)域。... 提出了一种多功能水印算法,能同时对数字音频版权和内容完整性进行认证。首先将代表版权信息的二值图像以零水印方式嵌入音频美尔倒谱系数(MFCC),再将该系数转换成二进制串,作为最终的水印信息以量化方式嵌入音频离散余弦变换(DCT)域。检测时可实现两种水印信息的盲提取。实验结果表明,该方法不但对音频内容的恶意篡改非常敏感,而且能够定位出被篡改音频的位置;此外,还能有效抵抗诸如滤波、MP3压缩等常规信号处理操作,正确恢复版权信息。 展开更多
关键词 音频水印 内容认证 版权保护 美尔倒谱系数
在线阅读 下载PDF
不同录音系统对声纹检测的影响 被引量:5
14
作者 达钊 李倩 +1 位作者 郭霞生 章东 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第2期201-207,共7页
声纹识别已在身份识别中得以应用.本文采用三种常用数字录音系统(语音笔、话筒及手机)录制样本,并对这些样本进行基音分析,线性预测系数法提取共振峰以及美尔倒谱系数.结果表明,录音设备自身性能的差异对声纹参数存在影响,尤其是存在共... 声纹识别已在身份识别中得以应用.本文采用三种常用数字录音系统(语音笔、话筒及手机)录制样本,并对这些样本进行基音分析,线性预测系数法提取共振峰以及美尔倒谱系数.结果表明,录音设备自身性能的差异对声纹参数存在影响,尤其是存在共振峰的丢失现象,提取的美尔倒谱系数包络存在一定差异. 展开更多
关键词 声纹 线性预测系 录音系统 美尔倒谱系数 共振峰 基音
在线阅读 下载PDF
语音识别方法在水下目标识别中的应用 被引量:1
15
作者 曾渊 李钢虎 +1 位作者 赵亚楠 苗雨 《声学技术》 CSCD 2012年第5期530-534,共5页
水下目标识别是潜艇在海战中,先敌发现并有效进行水声对抗的关键技术。然而,如何根据声纳接收到的舰船辐射噪声对三类目标进行分类识别是长期困扰人们的问题。研究了四种语音识别中常用的方法——线性预测系数(LPC),线性预测倒谱系数(LP... 水下目标识别是潜艇在海战中,先敌发现并有效进行水声对抗的关键技术。然而,如何根据声纳接收到的舰船辐射噪声对三类目标进行分类识别是长期困扰人们的问题。研究了四种语音识别中常用的方法——线性预测系数(LPC),线性预测倒谱系数(LPCC),美尔倒谱系数(MFCC)和最小均方无失真响应(MVDR),在水下目标识别中的应用效果,并比较了这四种方法在无噪声情况下的识别概率,以及在不同信噪比下的识别概率,并通过比较找到在无噪声和有噪声情况下的最佳方法。实验表明,在无噪声的情况下,MFCC方法总体识别率最高,第一类目标MFCC方法的识别率最高,第二类目标MFCC和MVDR方法识别率相似,好于其他两者,第三类目标MVDR方法识别率最高。在加入噪声的情况下,MVDR方法对三类目标的识别和抗噪声性能明显好于其余三者。 展开更多
关键词 语音识别 线性预测系 线性预测谱系 美尔倒谱系数 最小均方无失真响应
在线阅读 下载PDF
基于LVQ混合网络的非特定语音识别 被引量:1
16
作者 梁树岭 王朝立 +1 位作者 梁振英 杜佳明 《计算机应用与软件》 CSCD 2010年第12期5-7,11,共4页
介绍一种新的等距离采样参数归一化方法。针对美尔倒谱系数(MFCC)和一阶、二阶美尔倒谱系数,提出了一种新的学习矢量量化(LVQ1)和改进学习矢量量化(LVQ2)结合的识别算法。仿真结果表明所提出的算法相对于只用LVQ1网络识别,可以有效改善... 介绍一种新的等距离采样参数归一化方法。针对美尔倒谱系数(MFCC)和一阶、二阶美尔倒谱系数,提出了一种新的学习矢量量化(LVQ1)和改进学习矢量量化(LVQ2)结合的识别算法。仿真结果表明所提出的算法相对于只用LVQ1网络识别,可以有效改善学习效率。 展开更多
关键词 语音识别 归一化 美尔倒谱系数 学习矢量量化网络
在线阅读 下载PDF
基于K-L距离的两步固定音频检索方法 被引量:8
17
作者 齐晓倩 陈鸿昶 黄海 《计算机工程》 CAS CSCD 北大核心 2011年第19期160-162,共3页
根据音频文件数据量大、数据间存在一定相关性的特点,提出一种基于K-L距离的两步固定音频检索方法。该方法采用基于可变门限的直方图检索方法快速筛选出相似度较高的语音文件,利用特征矩阵的K-L距离对剩余语音进行精确比较,取得较好的... 根据音频文件数据量大、数据间存在一定相关性的特点,提出一种基于K-L距离的两步固定音频检索方法。该方法采用基于可变门限的直方图检索方法快速筛选出相似度较高的语音文件,利用特征矩阵的K-L距离对剩余语音进行精确比较,取得较好的效果。实验结果证明,该方法能使检索准确率达到90%左右。 展开更多
关键词 固定音频检索 过零率 直方图 美尔频率谱系 K-L距离
在线阅读 下载PDF
基于DSP和FPGA的机器人声控系统设计与实现 被引量:7
18
作者 刘京诚 高海英 廖志勇 《现代电子技术》 2006年第14期109-112,共4页
介绍了一种基于DSP和FPGA的机器人声控系统。在语音采集上,将DSP芯片TMS320C5509和音频芯片TLV320AIC23相结合进行语音的采集。在软件开发上,开发环境采用CCS 3.1,语音特征向量采用美尔频率倒谱系数,模式匹配和训练采用隐马尔可夫模型,... 介绍了一种基于DSP和FPGA的机器人声控系统。在语音采集上,将DSP芯片TMS320C5509和音频芯片TLV320AIC23相结合进行语音的采集。在软件开发上,开发环境采用CCS 3.1,语音特征向量采用美尔频率倒谱系数,模式匹配和训练采用隐马尔可夫模型,实现了语音指令的识别。在动作控制上,采用FPGA作为机器人头部动作逻辑控制器,使机器人能够根据非特定人的语音命令做出规定的头部动作。 展开更多
关键词 语音识别 DSP FPGA 机器人 美尔频率谱系 隐马尔可夫模型
在线阅读 下载PDF
基于HMM与SVM的语音活动检测 被引量:10
19
作者 肖佳林 赵聿晴 王英 《计算机工程》 CAS CSCD 2014年第1期203-208,共6页
工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通... 工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通过Viterbi算法得到N维最佳识别结果,将其转换为SVM特征向量输入到SVM分类器中进行分类判别,得到判决结果。实验结果表明,该算法在机械工作噪音的情况下,语音检测率较静态统计类算法平均提高9%,比小波支持向量机方法提高11%,在驾驶室噪音的情况下比小波SVM方法有较小幅度的提高,但其增长速度较快,且比传统的统计类算法提高9%。 展开更多
关键词 美尔频率谱系 隐马尔科夫模型 支持向量机 语音活动检测 核函
在线阅读 下载PDF
MFCC中DCT结构的设计与实现 被引量:3
20
作者 孔维功 张国杰 张效军 《计算机工程》 CAS CSCD 北大核心 2009年第5期265-267,共3页
根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实... 根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实时性要求和精度要求。 展开更多
关键词 说话人识别 美尔频率谱系 离散余弦变换 分布式算法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部