期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于K-L距离的两步固定音频检索方法 被引量:8
1
作者 齐晓倩 陈鸿昶 黄海 《计算机工程》 CAS CSCD 北大核心 2011年第19期160-162,共3页
根据音频文件数据量大、数据间存在一定相关性的特点,提出一种基于K-L距离的两步固定音频检索方法。该方法采用基于可变门限的直方图检索方法快速筛选出相似度较高的语音文件,利用特征矩阵的K-L距离对剩余语音进行精确比较,取得较好的... 根据音频文件数据量大、数据间存在一定相关性的特点,提出一种基于K-L距离的两步固定音频检索方法。该方法采用基于可变门限的直方图检索方法快速筛选出相似度较高的语音文件,利用特征矩阵的K-L距离对剩余语音进行精确比较,取得较好的效果。实验结果证明,该方法能使检索准确率达到90%左右。 展开更多
关键词 固定音频检索 过零率 直方图 美尔频率倒谱系数 K-L距离
在线阅读 下载PDF
基于HMM与SVM的语音活动检测 被引量:10
2
作者 肖佳林 赵聿晴 王英 《计算机工程》 CAS CSCD 2014年第1期203-208,共6页
工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通... 工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通过Viterbi算法得到N维最佳识别结果,将其转换为SVM特征向量输入到SVM分类器中进行分类判别,得到判决结果。实验结果表明,该算法在机械工作噪音的情况下,语音检测率较静态统计类算法平均提高9%,比小波支持向量机方法提高11%,在驾驶室噪音的情况下比小波SVM方法有较小幅度的提高,但其增长速度较快,且比传统的统计类算法提高9%。 展开更多
关键词 美尔频率倒谱系数 隐马尔科夫模型 支持向量机 语音活动检测 核函
在线阅读 下载PDF
基于DSP和FPGA的机器人声控系统设计与实现 被引量:7
3
作者 刘京诚 高海英 廖志勇 《现代电子技术》 2006年第14期109-112,共4页
介绍了一种基于DSP和FPGA的机器人声控系统。在语音采集上,将DSP芯片TMS320C5509和音频芯片TLV320AIC23相结合进行语音的采集。在软件开发上,开发环境采用CCS 3.1,语音特征向量采用美尔频率倒谱系数,模式匹配和训练采用隐马尔可夫模型,... 介绍了一种基于DSP和FPGA的机器人声控系统。在语音采集上,将DSP芯片TMS320C5509和音频芯片TLV320AIC23相结合进行语音的采集。在软件开发上,开发环境采用CCS 3.1,语音特征向量采用美尔频率倒谱系数,模式匹配和训练采用隐马尔可夫模型,实现了语音指令的识别。在动作控制上,采用FPGA作为机器人头部动作逻辑控制器,使机器人能够根据非特定人的语音命令做出规定的头部动作。 展开更多
关键词 语音识别 DSP FPGA 机器人 美尔频率倒谱系数 隐马尔可夫模型
在线阅读 下载PDF
MFCC中DCT结构的设计与实现 被引量:3
4
作者 孔维功 张国杰 张效军 《计算机工程》 CAS CSCD 北大核心 2009年第5期265-267,共3页
根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实... 根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实时性要求和精度要求。 展开更多
关键词 说话人识别 美尔频率倒谱系数 离散余弦变换 分布式算法
在线阅读 下载PDF
基于信息融合的短语音说话人识别方法研究 被引量:3
5
作者 周萍 唐李珍 《计算机工程》 CAS CSCD 北大核心 2011年第2期169-171,共3页
针对短训练语音的说话人识别系统,提出一种基于决策层融合的识别算法。识别时运用经验模式分解法对语音信号进行处理,对获取的固有模态函数分量提取语音特征序列,分别进行匹配,通过决策层融合算法,将所得的匹配结果与传统独立识别结果... 针对短训练语音的说话人识别系统,提出一种基于决策层融合的识别算法。识别时运用经验模式分解法对语音信号进行处理,对获取的固有模态函数分量提取语音特征序列,分别进行匹配,通过决策层融合算法,将所得的匹配结果与传统独立识别结果相结合,最终输出识别结果。利用信号分解的方法,实现待测语音信号的重复识别,同时采用决策层融合算法优化识别结果,从而在短训练语音情况下,使系统的识别率得到保障。实验结果表明,该算法在短训练语音识别系统中的识别效果优于传统方法。 展开更多
关键词 短语音 说话人识别 美尔频率倒谱系数 经验模式分解 决策层融合
在线阅读 下载PDF
基于DSP的高速实时语音识别系统的设计与实现 被引量:4
6
作者 李邵梅 陈鸿昶 王凯 《现代电子技术》 2007年第15期109-111,共3页
识别正确率和抗噪性能固然是语音识别的研究重点,但是识别响应速度也是决定系统实用化的关键所在。以TMS320C6713为核心构建硬件平台,通过采用高效C语言和线性汇编混合编程的方式,结合硬件特点,对代码进行了优化,实现了以美尔频率倒谱... 识别正确率和抗噪性能固然是语音识别的研究重点,但是识别响应速度也是决定系统实用化的关键所在。以TMS320C6713为核心构建硬件平台,通过采用高效C语言和线性汇编混合编程的方式,结合硬件特点,对代码进行了优化,实现了以美尔频率倒谱系数为特征参数,采用动态时间弯折算法的高速语音实时识别系统,识别速率达0.29倍实时,可实现多路语音的并行识别。 展开更多
关键词 多路实时语音识别 字信号处理器 美尔频率倒谱系数 动态时间弯折
在线阅读 下载PDF
基于MFCC和HMM的腭裂语音辅音省略识别算法 被引量:6
7
作者 袁亚南 何凌 +2 位作者 龚晓峰 尹恒 李杨 《计算机工程与设计》 CSCD 北大核心 2014年第2期615-619,共5页
为了弥补国内外在腭裂语音辅音发音错误识别方面的漏缺,以及为临床腭裂语音类型的诊断提供一种非主观的辅助措施,提出了一种基于语音识别系统的腭裂语音辅音省略识别算法。对腭裂语音辅音发音错误特点进行了语谱图上的能量研究,建立了... 为了弥补国内外在腭裂语音辅音发音错误识别方面的漏缺,以及为临床腭裂语音类型的诊断提供一种非主观的辅助措施,提出了一种基于语音识别系统的腭裂语音辅音省略识别算法。对腭裂语音辅音发音错误特点进行了语谱图上的能量研究,建立了改进参数的基于美尔频率倒谱系数和隐马尔科夫模型的腭裂语音识别系统。实验结果表明,该语音辅音省略识别算法取得了较高的正确率,实现了对腭裂语音清晰度的自动量化评估,可以用于临床辅助诊断。 展开更多
关键词 腭裂语音 辅音省略 美尔频率倒谱系数 隐马尔科夫模型 语音识别
在线阅读 下载PDF
重录语音检测算法 被引量:5
8
作者 李山路 王泳 甘俊英 《信号处理》 CSCD 北大核心 2017年第1期95-101,共7页
非法认证者可通过播放重新录制合法认证者的语音欺骗说话人识别系统以获得进入系统的权限,为社会安全带来威胁。因此,重录语音的检测具有现实的紧迫性,但相关的研究报道仍较缺乏。为此,本文提出一种重录语音的检测算法。该算法以MFCC(Me... 非法认证者可通过播放重新录制合法认证者的语音欺骗说话人识别系统以获得进入系统的权限,为社会安全带来威胁。因此,重录语音的检测具有现实的紧迫性,但相关的研究报道仍较缺乏。为此,本文提出一种重录语音的检测算法。该算法以MFCC(Mel-Frequency Cepstral Coefficients,美尔频率倒谱系数)的统计量作为SVM(Support Vector Machine,支持向量机)和KNN(K-Nearest Neighbors,K最近邻)分类方法的特征;除以上两种分类方法外,本文亦考察使用SAE(Sparse Autoencoder,稀疏自动编码器)的检测性能。为模拟现实生活中重录语音的真实情景,本文实验通过不同的录音设备、录音距离及录音环境对算法进行全面的测试。实验结果表明,通过增加重录语音的多样性作为训练可以使该算法的正确率提高到99.67%,达到了较好的检测性能。 展开更多
关键词 重录语音检测 社会安全 美尔频率倒谱系数 支持向量机 K最近邻 稀疏自动编码器
在线阅读 下载PDF
发音特征在维汉语音识别中的应用
9
作者 秦春香 黄浩 《计算机工程》 CAS CSCD 2012年第23期177-180,共4页
采用传统谱特征作为输入进行语音识别通常会受到声学环境差异的影响。为此,提出汉语和维语音素和音位的对应规则,并将这种规则应用于基于发音特征的语音识别系统。训练神经网络多层感知器,获取语音信号各类发音特征的后验概率,将其与美... 采用传统谱特征作为输入进行语音识别通常会受到声学环境差异的影响。为此,提出汉语和维语音素和音位的对应规则,并将这种规则应用于基于发音特征的语音识别系统。训练神经网络多层感知器,获取语音信号各类发音特征的后验概率,将其与美尔频率倒谱系数(MFCC)拼接后送入隐马尔科夫模型进行声学模型训练。将不同发音特征分别与传统MFCC特征进行组合并给出测试结果。实验结果表明,当汉语声带状况和送气发音特征与传统MFCC组合时,以及维语的发音方式和声带状况特征与MFCC组合之后,系统误识率较低。 展开更多
关键词 维汉语音识别 多层感知器 声学模型 美尔频率倒谱系数 特征组合
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部