期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
一种噪声环境下的实时语音端点检测算法 被引量:30
1
作者 徐大为 吴边 +1 位作者 赵建伟 刘重庆 《计算机工程与应用》 CSCD 北大核心 2003年第1期115-117,共3页
语音识别中的端点检测要求对噪声有很强的鲁棒性。该文提出一种方法,综合采用了语音信号中的4个相互之间独立性强的特征-短时能量、倒谱距离、能量谱方差和能量-熵特征,有效地改进传统的基于单一语音特征方法的缺陷,在动态变化的噪声环... 语音识别中的端点检测要求对噪声有很强的鲁棒性。该文提出一种方法,综合采用了语音信号中的4个相互之间独立性强的特征-短时能量、倒谱距离、能量谱方差和能量-熵特征,有效地改进传统的基于单一语音特征方法的缺陷,在动态变化的噪声环境中,大大提高了端点检测对噪声的鲁棒性;为了克服分类回归树(CART)决策法的过度复杂性,引入一种新的5状态自动机进行快速决策,以保证算法的实时性能,并且能够提高端点检测的可靠性。通过各种实际噪声环境的测试,实验表明这一算法可以显著提高在低信噪比、噪声动态变化的各种环境下的端点检测性能。 展开更多
关键词 噪声环境 实时语音端点检测算法 语音识别 语音分割 倒谱距离 能量-熵特征 5状态自动机
在线阅读 下载PDF
一种噪声环境下连续语音识别的快速端点检测算法 被引量:4
2
作者 崔冬青 李治柱 吴亚栋 《计算机工程与应用》 CSCD 北大核心 2003年第23期95-97,138,共4页
根据汉语语音的特点,该算法利用幅度及功率谱对语音端点进行检测,有效地消除了背景噪声及DC分量的干扰。算法采用实际语音采样进行分析,试验结果表明此算法不仅能有效地标识出语音的起始及终止点,并且还具有相当高的运算效率。
关键词 功率谱 端点检测算法 DC分量 汉语 语音识别 背景噪声
在线阅读 下载PDF
一种实时基音检测算法 被引量:3
3
作者 王都生 铁满霞 樊昌信 《电子学报》 EI CAS CSCD 北大核心 2000年第10期9-11,共3页
为了克服目前诸多基音周期检测算法迟延较大的缺点 ,本文提出了一种基音周期的实时检测算法 .实验结果表明 :该算法可在当前帧内实时提取精确的基音周期估计值 ,减少了传统的自相关基音检测算法因平滑处理而带来的编码迟延 .
关键词 基音检测 实时 语音编码 算法
在线阅读 下载PDF
基于小波变换C_0复杂度的语音端点检测方法 被引量:3
4
作者 王纲金 赵欢 胡炼 《计算机工程与应用》 CSCD 北大核心 2010年第29期134-136,195,共4页
对传统的C0复杂度语音端点检测方法改进,提出一种基于小波变换的C0复杂度(WC0)方法,其特征门限估计采用模糊C均值聚类算法和贝叶斯信息准则算法,并采用双门限法进行语音端点检测。在TIMIT连续语音库上的实验表明,在低信噪比环境下,WC0... 对传统的C0复杂度语音端点检测方法改进,提出一种基于小波变换的C0复杂度(WC0)方法,其特征门限估计采用模糊C均值聚类算法和贝叶斯信息准则算法,并采用双门限法进行语音端点检测。在TIMIT连续语音库上的实验表明,在低信噪比环境下,WC0法的检测性能明显优于基于传统的C0复杂度法,特别是在车辆噪声和车内噪声环境下,WC0法表现出更好的检测性能。 展开更多
关键词 语音端点检测 C0复杂度 小波变换 模糊C均值聚类算法 贝叶斯信息准则算法
在线阅读 下载PDF
一种改进的含噪语音端点检测方法 被引量:3
5
作者 汪鲁才 曹鹏霞 姜小龙 《计算机工程与应用》 CSCD 北大核心 2016年第15期162-167,177,共7页
语音端点检测是语音识别系统的重要环节之一。针对噪声环境下的语音端点检测困难,提出了一种改进的支持向量机的语音端点检测方法。利用小波分析(WA)提取含噪语音信号的特征向量。采用遗传算法(GA)得到最优的SVM核函数参数γ和惩罚因子... 语音端点检测是语音识别系统的重要环节之一。针对噪声环境下的语音端点检测困难,提出了一种改进的支持向量机的语音端点检测方法。利用小波分析(WA)提取含噪语音信号的特征向量。采用遗传算法(GA)得到最优的SVM核函数参数γ和惩罚因子C。建立语音端点检测模型。在Matlab软件平台下进行仿真实验,结果表明在不同的噪声条件下,GA-SVM算法的平均检测率达到94.5%,明显优于传统的双门限算法和普通的SVM算法。 展开更多
关键词 小波分析(WA) 支持向量机(SVM) 遗传算法(GA) 语音端点检测
在线阅读 下载PDF
模糊熵在车载环境下语音端点检测中的应用 被引量:2
6
作者 恩德 张凤磊 +1 位作者 张昭 忽胜强 《计算机工程与应用》 CSCD 北大核心 2016年第10期147-150,共4页
为了提高车载噪声环境下语音端点检测的准确性,介绍了一种新的时间序列复杂性测度:模糊熵,并将其应用于语音信号的特征提取。分别以样本熵和模糊熵提取含噪语音信号的特征,使用双门限法对语音信号进行端点检测,特征门限值使用模糊C均值... 为了提高车载噪声环境下语音端点检测的准确性,介绍了一种新的时间序列复杂性测度:模糊熵,并将其应用于语音信号的特征提取。分别以样本熵和模糊熵提取含噪语音信号的特征,使用双门限法对语音信号进行端点检测,特征门限值使用模糊C均值聚类算法和贝叶斯信息准则算法确定。仿真结果表明在车载噪声环境下与样本熵算法相比,模糊熵算法能更好地区分噪声信号和语音信号,具有更好的端点检测性能,相同环境下模糊熵算法的错误率比样本熵算法降低了16%以上。 展开更多
关键词 模糊熵 样本熵 语音端点检测 模糊C均值聚类算法 贝叶斯信息准则
在线阅读 下载PDF
基于自适应阈值活动语音检测和最小均方误差对数谱幅度估计的低信噪比降噪算法 被引量:7
7
作者 张皓然 王学渊 李小霞 《计算机应用》 CSCD 北大核心 2020年第6期1763-1768,共6页
针对低信噪比(SNR)环境下传统方法对声信号降噪的局限性,提出了一种联合自适应阈值活动语音检测(VAD)算法和最小均方误差对数谱幅度估计(MMSE-LSA)的实时降噪算法。首先,在VAD算法中通过基于能量概率最大值的概率统计来对背景噪声进行估... 针对低信噪比(SNR)环境下传统方法对声信号降噪的局限性,提出了一种联合自适应阈值活动语音检测(VAD)算法和最小均方误差对数谱幅度估计(MMSE-LSA)的实时降噪算法。首先,在VAD算法中通过基于能量概率最大值的概率统计来对背景噪声进行估计,对得到的背景噪声进行实时更新并保存;然后,将实时更新的背景噪声作为MMSE-LSA的参考噪声,并对噪声幅度谱进行自适应更新,最后进行降噪处理。通过在真实场景中对四类声信号进行实验,结果表明,该算法在保证对低SNR声信号的实时处理的情况下,相较于传统MMSE-LSA算法,降噪信号的SNR能够提高10~15 dB,且不存在信号过减的情况,可应用于实际工程。 展开更多
关键词 真实环境 自适应阈值 活动语音检测算法 实时最小均方误差对数谱幅度估计算法 实时背景 低信噪比
在线阅读 下载PDF
飞机驾驶舱噪声环境下的飞行员语音端点检测 被引量:1
8
作者 诸心阳 黄丹 +1 位作者 陆燕玉 傅山 《计算机工程》 CAS CSCD 北大核心 2018年第1期317-321,共5页
为在飞行驾驶舱噪声环境下准确判定飞行员语音端点,提出一种鲁棒语音端点检测方法。使用最优改进对数谱幅度估计语音增强算法进行初步语音降噪,通过Teager能量算子进一步滤除残余噪声,并将降噪后语音短时能量与子带谱熵的比值作为双门... 为在飞行驾驶舱噪声环境下准确判定飞行员语音端点,提出一种鲁棒语音端点检测方法。使用最优改进对数谱幅度估计语音增强算法进行初步语音降噪,通过Teager能量算子进一步滤除残余噪声,并将降噪后语音短时能量与子带谱熵的比值作为双门限判决参数,检测飞行员语音起止点。实验结果表明,与基于能量参数或频谱熵参数的语音端点检测方法相比,该方法能有效提高检测正确率。 展开更多
关键词 驾驶舱人为因素 语音端点检测 最优改进对数谱幅度估计算法 TEAGER能量算子 子带谱熵
在线阅读 下载PDF
一种新的基于倒谱的共振峰频率检测算法 被引量:9
9
作者 赵毅 尹雪飞 陈克安 《应用声学》 CSCD 北大核心 2010年第6期416-424,共9页
共振峰频率是语音信号的一个重要参数。传统的基于线性预测的共振峰检测算法由于受到计算量的限制,很难实现实时处理。本文提出一种基于倒谱变换的共振峰频率检测算法,采用后置处理,比较声道冲击响应对数幅频特性的二次导数和相频特性... 共振峰频率是语音信号的一个重要参数。传统的基于线性预测的共振峰检测算法由于受到计算量的限制,很难实现实时处理。本文提出一种基于倒谱变换的共振峰频率检测算法,采用后置处理,比较声道冲击响应对数幅频特性的二次导数和相频特性一次导数检测出的结果,删除伪峰数值和甄别合并共振峰,提高检测精度。仿真结果证明,该算法计算效率高,低信噪比下仍能保持较好的检测性能。 展开更多
关键词 倒谱变换 共振峰频率 检测算法 based detection algorithm 语音信号 相频特性 线性预测 实时处理 仿真结果 检测性能 检测精度 计算效率 后置处理 幅频特性 二次导数 低信噪比 冲击响应 计算量 证明
在线阅读 下载PDF
蒙古语长音频语音文本自动对齐的研究 被引量:5
10
作者 牛米佳 飞龙 高光来 《中文信息学报》 CSCD 北大核心 2020年第1期51-57,共7页
目前,面向蒙古语的语音识别语音库资源相对稀缺,但存在较多的电视剧、广播等蒙古语音频和对应的文本。该文提出基于语音识别的蒙古语长音频语音文本自动对齐方法,实现蒙古语电视剧语音的自动标注,扩充了蒙古语语音库。在前端处理阶段,... 目前,面向蒙古语的语音识别语音库资源相对稀缺,但存在较多的电视剧、广播等蒙古语音频和对应的文本。该文提出基于语音识别的蒙古语长音频语音文本自动对齐方法,实现蒙古语电视剧语音的自动标注,扩充了蒙古语语音库。在前端处理阶段,使用基于高斯混合模型的语音端点检测技术筛选并删除噪音段;在语音识别阶段,构建基于前向型序列记忆网络的蒙古语声学模型;最后基于向量空间模型,将语音识别得到的假设序列和参考音素序列进行句子级别的动态时间归整算法匹配。实验结果表明,与基于Needleman-Wunsch算法的语音对齐比较,该文提出的蒙古语长音频语音文本自动对齐方法的对齐正确率提升了31.09%。 展开更多
关键词 蒙古语 语音端点检测 语音文本对齐 动态时间归整算法
在线阅读 下载PDF
说话人识别技术及其在工厂自动控制系统中的应用 被引量:1
11
作者 覃爱娜 韩华 《长沙电力学院学报(自然科学版)》 2003年第2期68-70,共3页
说话人识别是以话音对说话人进行区分,从而进行身份鉴别与认证的技术.介绍了在工厂自动控制系统中说话人识别技术的应用,包含其原理、所采用的识别方法及其系统实现.
关键词 说话人识别 身份鉴别 语音识别 工厂自动控制系统 实时端点检测算法 MEL倒谱系数 动态时间规整 矢量量化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部