期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
基于G.729的自适应实时语音活动检测方法研究 被引量:5
1
作者 刘思伟 吕海波 慕德俊 《计算机工程与应用》 CSCD 北大核心 2007年第34期57-60,共4页
提出了一种运用短时能量和短时过零率两个参数进行静音检测的模型,针对不同情况下的语音数据动态调整模型,实现了不同噪声环境下对语音片段的有效检测。该算法实现简单,可实时的对活动语音进行检测不引入延迟。实验结果表明所采用的方... 提出了一种运用短时能量和短时过零率两个参数进行静音检测的模型,针对不同情况下的语音数据动态调整模型,实现了不同噪声环境下对语音片段的有效检测。该算法实现简单,可实时的对活动语音进行检测不引入延迟。实验结果表明所采用的方法能够比较准确地检测出语音片断,对于噪声环境和音量低的语音都有很好的自适应性。 展开更多
关键词 语音编码器 语音活动检测 短时能量 过零率
在线阅读 下载PDF
基于噪声倒谱阈值频谱估计的语音活动检测 被引量:3
2
作者 李宇 郭雷勇 谭洪舟 《计算机工程》 CAS CSCD 北大核心 2011年第14期140-142,共3页
针对低方差频谱估计的语音活动检测(VAD)中Welch频谱估计方法计算量大的问题,提出利用倒谱阈值方法估计VAD中的噪声功率谱。该方法在静音时期为噪声的倒谱设置阈值,利用快速傅里叶变换计算频谱,再更新VAD中的判决阈值。算法复杂度分析... 针对低方差频谱估计的语音活动检测(VAD)中Welch频谱估计方法计算量大的问题,提出利用倒谱阈值方法估计VAD中的噪声功率谱。该方法在静音时期为噪声的倒谱设置阈值,利用快速傅里叶变换计算频谱,再更新VAD中的判决阈值。算法复杂度分析与仿真结果表明,该方法的检测性能与Welch方法相当,计算量降低约18%,同时降低整个VAD的时间复杂度。 展开更多
关键词 语音活动检测 频谱估计 倒谱阈值方法 功率谱密度 快速傅里叶变换
在线阅读 下载PDF
基于HMM与SVM的语音活动检测 被引量:10
3
作者 肖佳林 赵聿晴 王英 《计算机工程》 CAS CSCD 2014年第1期203-208,共6页
工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通... 工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通过Viterbi算法得到N维最佳识别结果,将其转换为SVM特征向量输入到SVM分类器中进行分类判别,得到判决结果。实验结果表明,该算法在机械工作噪音的情况下,语音检测率较静态统计类算法平均提高9%,比小波支持向量机方法提高11%,在驾驶室噪音的情况下比小波SVM方法有较小幅度的提高,但其增长速度较快,且比传统的统计类算法提高9%。 展开更多
关键词 美尔频率倒谱系数 隐马尔科夫模型 支持向量机 语音活动检测 核函数
在线阅读 下载PDF
音乐噪声环境下的双声道语音活动检测 被引量:2
4
作者 廖逢钗 李鹏 徐波 《信号处理》 CSCD 北大核心 2009年第11期1820-1824,共5页
提出双声道的语音活动检测算法(DCVAD,Dual-Channel Voice Activity Detection)。该算法首先利用骨架互相关的方法估计目标语音和背景音乐的时延,然后在对目标语音进行时延补偿的基础上,利用通道间语音和背景音乐自身以及二者相互之间... 提出双声道的语音活动检测算法(DCVAD,Dual-Channel Voice Activity Detection)。该算法首先利用骨架互相关的方法估计目标语音和背景音乐的时延,然后在对目标语音进行时延补偿的基础上,利用通道间语音和背景音乐自身以及二者相互之间的相关性,实现了语音活动检测的目标。实验表明,在背景音乐环境DCVAD算法语音活动检测的平均正确率比单通道基于谱熵的方法高约22%。 展开更多
关键词 语音活动检测 时延估计 互相关 听觉滤波器
在线阅读 下载PDF
基于噪声分类和双自适应阈值判决的语音活动检测方法 被引量:1
5
作者 姚睿 曾泽清 杜君杰 《工程科学与技术》 EI CAS CSCD 北大核心 2018年第4期170-178,共9页
为了解决复杂背景噪声环境中语音活动检测(voice activity detection,VAD)命中率较低的问题,提出具有环境意识的VAD算法。针对常用算法中采用单阈值抗噪性差的不足,对语音帧和噪声帧相互转换过程采用不同阈值,并对两个阈值进行自适应更... 为了解决复杂背景噪声环境中语音活动检测(voice activity detection,VAD)命中率较低的问题,提出具有环境意识的VAD算法。针对常用算法中采用单阈值抗噪性差的不足,对语音帧和噪声帧相互转换过程采用不同阈值,并对两个阈值进行自适应更新;为克服单一特征无法应对复杂环境的缺陷,提出将统计模型似然比、能量熵特征和平均谐波数量值特征等进行特征联合的方法;引入环境噪声分类的思想,利用支持向量机对噪声环境进行分类,并根据噪声类型选择最优特征组合,进一步提升算法性能。使用NOIZEUS语音库,以babble、pink、white、f16、volvo这5类噪声作为背景噪声,通过仿真实验评估了所提出算法的性能,比较了各类特征组合的命中率。实验结果证明,所提方法的识别效果优于现有算法,针对各种噪声可取得约80%的总体命中率,且能更好地平衡语音命中率和虚警率。 展开更多
关键词 语音活动检测 双自适应阈值 噪声分类 特征联合
在线阅读 下载PDF
基于分层增长语音活动检测的鲁棒性说话人识别
6
作者 解焱陆 张劲松 +1 位作者 刘明辉 黄中伟 《深圳大学学报(理工版)》 EI CAS 北大核心 2012年第4期328-334,共7页
基于欧洲电信标准化协会颁布的分布式语音识别和前端标准(ETSI-DSR-AFE).针对分布式说话人识别噪声鲁棒性较差的问题,提出一种新的前端处理方法.该方法以似然距离为测度,对语音进行无监督聚类,为减少计算量,采用分层增长(level-building... 基于欧洲电信标准化协会颁布的分布式语音识别和前端标准(ETSI-DSR-AFE).针对分布式说话人识别噪声鲁棒性较差的问题,提出一种新的前端处理方法.该方法以似然距离为测度,对语音进行无监督聚类,为减少计算量,采用分层增长(level-building)方法进行逐层分割,从而准确找出语音和静音的边界点.实验结果表明,用该方法改进ETSI-DSR-AFE标准后,信噪比在大于0 dB时,说话人辨认系统识别率相对改进了18.9%,相对原有的Mel频率倒谱系数(Mel-frequenly Ceptral coefficients,MFCC)系统识别率改进了60.7%. 展开更多
关键词 语音信号处理 说话人识别 分布式语音识别 分层增长 语音活动检测 似然距离
在线阅读 下载PDF
基于帧间相关性的语音活动检测方法
7
作者 李宇 郭雷勇 谭洪舟 《计算机应用》 CSCD 北大核心 2011年第5期1447-1449,共3页
为了提高统计模型似然比测试的语音活动检测(VAD)的检测性能,利用前后语音帧间存在的统计相关特性,提出一种改进VAD算法。通过前帧语音频谱分量对先验信噪比进行递归估计,然后利用前一帧的语音检测状态来设计判决阈值,建立了双阈值隐马... 为了提高统计模型似然比测试的语音活动检测(VAD)的检测性能,利用前后语音帧间存在的统计相关特性,提出一种改进VAD算法。通过前帧语音频谱分量对先验信噪比进行递归估计,然后利用前一帧的语音检测状态来设计判决阈值,建立了双阈值隐马尔可夫模型语音活动判决规则。实验表明,此帧间相关性VAD算法的检测指标值优于Sohn算法。 展开更多
关键词 语音活动检测 统计模型 相关性 似然比测试 先验信噪比 阈值
在线阅读 下载PDF
基于子频带加权的语音活动检测算法
8
作者 张玲 顾彦飞 何伟 《计算机应用》 CSCD 北大核心 2010年第5期1262-1265,1279,共5页
为了降低噪声及决策导向(DD)参数估计算法的帧延迟特性对语音活动检测(VAD)算法鲁棒性的影响,首先采用两步降噪(TSNR)技术估计算法提高语音瞬变时刻参数估计准确性,并针对语音噪声的频率选择性,通过频带分割,将噪声污染限制到孤立子频带... 为了降低噪声及决策导向(DD)参数估计算法的帧延迟特性对语音活动检测(VAD)算法鲁棒性的影响,首先采用两步降噪(TSNR)技术估计算法提高语音瞬变时刻参数估计准确性,并针对语音噪声的频率选择性,通过频带分割,将噪声污染限制到孤立子频带中,构建了由子频带特征与可靠性因子结合提供判别结果的子频带加权VAD算法。实验表明,此子频带加权算法优于Sohn算法、Cho算法以及G.729B等全频带算法。 展开更多
关键词 统计模型 语音活动检测 两步降噪技术 子频带 决策导向
在线阅读 下载PDF
低信噪比下噪声抑制的语音活动检测 被引量:3
9
作者 刘海波 李辉 张琨磊 《小型微型计算机系统》 CSCD 北大核心 2012年第6期1381-1384,共4页
传统的语音活动检测的方法,在噪声比较恶劣(一般指信噪比在5db以下)的环境下,效果很差,而本文提出的语音活动检测的方法在低信噪比的情况下仍然能够达到很好的效果.该方法主要包含两部分:第一部分是噪声抑制,第二部分是基于状态机的语... 传统的语音活动检测的方法,在噪声比较恶劣(一般指信噪比在5db以下)的环境下,效果很差,而本文提出的语音活动检测的方法在低信噪比的情况下仍然能够达到很好的效果.该方法主要包含两部分:第一部分是噪声抑制,第二部分是基于状态机的语音活动检测.通过实验结果可以证明,本文提出的方法在白噪声,嘈杂人声和汽车噪声的环境下比G.729采用的语音活动检测的方法提高很多. 展开更多
关键词 语音活动检测 噪声抑制 状态机 噪声估计 最小均方误差
在线阅读 下载PDF
用于周期分解语音活动检测的基频提取方法研究 被引量:1
10
作者 刘海波 李辉 凌震华 《中国科学技术大学学报》 CAS CSCD 北大核心 2012年第2期106-111,共6页
介绍了基于语音信号周期分解的语音活动检测算法.传统语音活动检测算法在动态低信噪比背景噪声环境下的效果很不理想,这主要是因为传统方法中提取的能量与过零率等检测特征针对的是平稳噪声,对信噪比的变化很敏感.而本文介绍的周期分解... 介绍了基于语音信号周期分解的语音活动检测算法.传统语音活动检测算法在动态低信噪比背景噪声环境下的效果很不理想,这主要是因为传统方法中提取的能量与过零率等检测特征针对的是平稳噪声,对信噪比的变化很敏感.而本文介绍的周期分解语音活动检测方法能较好地解决这个问题,因为语音信号中浊音段的周期性是区别一般噪声信号的重要特征,并且该特征受背景噪声类型和信噪比变化的影响小.在周期分解语音活动检测方法中,基频提取的准确性对最终检测性能有很大影响.针对此情况,提出了自相关、循环均值幅度差分和YIN三种基频提取算法相融合的方法.实验结果表明,在背景噪声为白噪声、汽车噪声、嘈杂人声以及信噪比0dB,5dB,10dB的情况下,该方法相对单一基频提取算法,可以有效提升基频提取与周期分解语音活动检测的准确性. 展开更多
关键词 语音活动检测 语音周期分解 似然比 基频估计
在线阅读 下载PDF
一种新的语音和噪声活动检测算法及其在手机双麦克风消噪系统中的应用 被引量:2
11
作者 章雒霏 张铭 李晨 《电子与信息学报》 EI CSCD 北大核心 2016年第8期2020-2026,共7页
针对现有双通道语音活动检测(Voice Activity Detection,VAD)算法依赖于固定阈值难以在多种噪声环境下准确地检测语音和噪声,应用于手机消噪系统会造成语音失真或噪声消除不好等问题,该文提出一种基于神经网络的VAD算法,该算法以分频带... 针对现有双通道语音活动检测(Voice Activity Detection,VAD)算法依赖于固定阈值难以在多种噪声环境下准确地检测语音和噪声,应用于手机消噪系统会造成语音失真或噪声消除不好等问题,该文提出一种基于神经网络的VAD算法,该算法以分频带能量差和归一化互通道相关为特征,采用神经网络对语音和噪声进行分类。在此基础上,将神经网络VAD与基于互通道信号功率比值的VAD相结合,提出一种新的适用于手机消噪系统的语音和噪声活动检测算法分别对语音和噪声进行检测,并以此进行噪声抑制处理,减少了消噪系统因VAD误判而造成的性能下降。实验结果表明,该处理方法在抑制背景噪声和减少语音失真等方面优于现有的消噪算法,对于方向性语音干扰也有很好的抑制效果。 展开更多
关键词 语音活动检测 语音增强 神经网络
在线阅读 下载PDF
基于自适应阈值活动语音检测和最小均方误差对数谱幅度估计的低信噪比降噪算法 被引量:7
12
作者 张皓然 王学渊 李小霞 《计算机应用》 CSCD 北大核心 2020年第6期1763-1768,共6页
针对低信噪比(SNR)环境下传统方法对声信号降噪的局限性,提出了一种联合自适应阈值活动语音检测(VAD)算法和最小均方误差对数谱幅度估计(MMSE-LSA)的实时降噪算法。首先,在VAD算法中通过基于能量概率最大值的概率统计来对背景噪声进行估... 针对低信噪比(SNR)环境下传统方法对声信号降噪的局限性,提出了一种联合自适应阈值活动语音检测(VAD)算法和最小均方误差对数谱幅度估计(MMSE-LSA)的实时降噪算法。首先,在VAD算法中通过基于能量概率最大值的概率统计来对背景噪声进行估计,对得到的背景噪声进行实时更新并保存;然后,将实时更新的背景噪声作为MMSE-LSA的参考噪声,并对噪声幅度谱进行自适应更新,最后进行降噪处理。通过在真实场景中对四类声信号进行实验,结果表明,该算法在保证对低SNR声信号的实时处理的情况下,相较于传统MMSE-LSA算法,降噪信号的SNR能够提高10~15 dB,且不存在信号过减的情况,可应用于实际工程。 展开更多
关键词 真实环境 自适应阈值 活动语音检测算法 实时最小均方误差对数谱幅度估计算法 实时背景 低信噪比
在线阅读 下载PDF
说话人日志中可靠静音模型语音活动检测方法
13
作者 杨登舟 徐嘉明 +1 位作者 刘加 夏善红 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2016年第1期151-157,共7页
为了解决传统语音活动检测(VAD)技术分离出的语音段掺杂静音以及帧间频繁跳动产生短语音碎片的问题,提出在说话人日志中能够高效稳定地完成语音活动检测的方法.该方法利用可靠静音模型对语音的区分度高这个特性,通过循环迭代收敛得到稳... 为了解决传统语音活动检测(VAD)技术分离出的语音段掺杂静音以及帧间频繁跳动产生短语音碎片的问题,提出在说话人日志中能够高效稳定地完成语音活动检测的方法.该方法利用可靠静音模型对语音的区分度高这个特性,通过循环迭代收敛得到稳定划分.建立静音和语音模型,通过帧间连续性原理进行不确定性解码得到帧类属信息,开展低能量短时间语音碎片后处理完成语音活动检测.在富标注说话人日志数据集上测试,实验结果表明,由于对静音模型的描述更加可靠,采用该方法可以减少帧间跳动,减少静音模型对语音的吸收误判,性能比基于子带熵顺序统计滤波(SE-OSF)方法提高明显. 展开更多
关键词 说话人日志 富标注 语音活动检测(vad) 高斯模型 维特比解码
在线阅读 下载PDF
基于图稀疏性的语音盲信噪比估计
14
作者 陈海贞 闫坤 +1 位作者 宁振杰 王对强 《计算机工程与设计》 北大核心 2025年第8期2170-2177,共8页
为了在噪声环境中实现准确的信噪比估计,提出了一种高效准确的盲信噪比估计方法,该方法将图信号分析方法用于语音盲信噪比估计。研究发现,若样本量有限,与噪声相比语音信号转换所得的图具有更低稀疏性。基于这一发现,利用语音活动检测... 为了在噪声环境中实现准确的信噪比估计,提出了一种高效准确的盲信噪比估计方法,该方法将图信号分析方法用于语音盲信噪比估计。研究发现,若样本量有限,与噪声相比语音信号转换所得的图具有更低稀疏性。基于这一发现,利用语音活动检测器获取语音活动区域,将区域内信号转换为图并计算其稀疏度,利用稀疏度与信噪比关系估计语音信号的信噪比。实验结果表明,与现有的方法相比,该算法能更准确地估计信噪比,尤其在信噪比为-14 dB到-4 dB环境下表现出优越性。 展开更多
关键词 盲信噪比估计 非平稳性 图信号分析方法 梅尔能量 语音活动检测 图构造 图稀疏性
在线阅读 下载PDF
一种自适应语音端点检测算法 被引量:6
15
作者 孙战先 储飞黄 王江 《计算机工程与应用》 CSCD 2014年第1期206-210,共5页
针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡... 针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡了音节之间的差异,放大了语音与噪声之间的差异,最后通过一个动态检测门限,实现了不同信噪比下的端点检测。 展开更多
关键词 语音活动检测(端点检测) 自适应 噪声评估 特征融合 VOICE Activity Detection(vad)
在线阅读 下载PDF
低信噪比环境下语音检测的邻域极值差分信号功率谱分维算法 被引量:1
16
作者 陈雪勤 俞一彪 赵鹤鸣 《应用科学学报》 CAS CSCD 北大核心 2013年第6期579-584,共6页
提出一种邻域极值差分信号功率谱的分形维值算法,并用于低信噪比环境下的语音活动检测.在时域信号邻域范围内作极值差分检索获得邻域极值差分信号,进一步根据差分信号功率谱估计的最小误差求解分维值.在安静环境下,对正常语音和耳语音... 提出一种邻域极值差分信号功率谱的分形维值算法,并用于低信噪比环境下的语音活动检测.在时域信号邻域范围内作极值差分检索获得邻域极值差分信号,进一步根据差分信号功率谱估计的最小误差求解分维值.在安静环境下,对正常语音和耳语音的语音信号活动检测(speech activity detection,SAD)性能与盒维相似,明显好于谱熵算法.多种噪声环境下的SAD检测结果显示,所提算法的误检率远低于谱熵算法,在除白噪声以外各种条件下的误检率均低于盒维算法,且计算量约为盒维算法的5%.实验表明,该算法在SAD检测和效率两方面具有良好的综合性能. 展开更多
关键词 语音活动检测 低信噪比 分形维 功率谱
在线阅读 下载PDF
基于GMM的声音活动检测方法 被引量:1
17
作者 陈奇川 蔡骏 林茜 《计算机应用与软件》 CSCD 2009年第2期60-62,75,共4页
为了提高声音活动检测的鲁棒性,提出了一种基于GMM模型的声音活动检测方法。此方法在频谱特征空间中建立背景噪音和语音的GMM模型,然后采用模型匹配的方法对被测信号进行区分。此方法自适应更新GMM模型的参数,使之可以适应环境的变化。... 为了提高声音活动检测的鲁棒性,提出了一种基于GMM模型的声音活动检测方法。此方法在频谱特征空间中建立背景噪音和语音的GMM模型,然后采用模型匹配的方法对被测信号进行区分。此方法自适应更新GMM模型的参数,使之可以适应环境的变化。实验结果显示该方法在噪音环境中比传统的声音活动检测方法具有更高的准确率。 展开更多
关键词 声音活动检测 特征空间 GMM模型 参数自适应 语音识别
在线阅读 下载PDF
利用语音VAD和DTX增强Abis接口传输能力的可能性探讨 被引量:1
18
作者 傅永根 陈慧剑 《南京邮电学院学报(自然科学版)》 2003年第1期38-42,共5页
提出了一种提高目前GSM系统中Abis接口线路传输能力的方法———利用语音通信的VAD和DTX进行话音的倍增复用,并对其原理、实现方法、传输性能和影响进行了较为深入的探讨。
关键词 移动通信 ABIS接口 语音活性检测 不连续传输 vad DTX GSM
在线阅读 下载PDF
语音增强与检测的多任务学习方法研究 被引量:6
19
作者 王师琦 曾庆宁 +2 位作者 龙超 熊松龄 祁潇潇 《计算机工程与应用》 CSCD 北大核心 2021年第20期197-202,共6页
在许多语音信号处理的实际应用中,都要求系统能够低延迟地实时处理多个任务,并且对噪声要有很强的鲁棒性。针对上述问题,提出了一种语音增强和语音活动检测(Voice Activity Detection,VAD)的多任务深度学习模型。该模型通过引入长短时记... 在许多语音信号处理的实际应用中,都要求系统能够低延迟地实时处理多个任务,并且对噪声要有很强的鲁棒性。针对上述问题,提出了一种语音增强和语音活动检测(Voice Activity Detection,VAD)的多任务深度学习模型。该模型通过引入长短时记忆(Long Short-Term Memory,LSTM)网络,构建了一个适合于实时在线处理的因果系统。基于语音增强和VAD的强相关性,该模型以硬参数共享的方式连接了两个任务的输出层,不仅减少了计算量,还通过多任务学习提高了任务的泛化能力。实验结果表明,相较串行处理两个任务的基线模型,多任务模型在语音增强结果非常相近、VAD结果更优的情况下,其速度快了44.2%,这对于深度学习模型的实际应用和部署将具有重要的意义。 展开更多
关键词 多任务学习 深度学习 语音增强 语音活动检测
在线阅读 下载PDF
一种基于声学分类的语音激活检测算法 被引量:2
20
作者 魏涛 顾涵铮 《合肥工业大学学报(自然科学版)》 CAS CSCD 2001年第2期222-225,共4页
文章涉及了语音编码中最新的一种编码方式——变速率语音编码。语音激活检测 (VAD)算法是其中的关键部分 ,直接影响语音质量和试听效果。文章通过分析国际电信联盟的 G.72 9B标准 ,提出了一种适用于三速率语音编码方式的VA D算法。该算... 文章涉及了语音编码中最新的一种编码方式——变速率语音编码。语音激活检测 (VAD)算法是其中的关键部分 ,直接影响语音质量和试听效果。文章通过分析国际电信联盟的 G.72 9B标准 ,提出了一种适用于三速率语音编码方式的VA D算法。该算法结合了声学分类 ,对噪声、清音和浊音加以区分 ,最后给出了仿真结果 。 展开更多
关键词 变速率语音编码 vad 语音激活检测 声学分类 噪声 清音 浊音 语音质量
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部