期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于双门限的语音端点检测算法改进
1
作者 郭子漾 李国勇 《计算机应用》 北大核心 2025年第S1期101-105,共5页
为了解决语音激活检测(VAD)中传统双门限算法在低信噪比(SNR)时准确率较低的问题,在近年双门限算法研究的基础上提出一种改进算法。首先,设置合适的帧长和帧移,对语音信号进行加窗分帧,并计算整条语音的短时能量和短时过零率(ZCR);其次... 为了解决语音激活检测(VAD)中传统双门限算法在低信噪比(SNR)时准确率较低的问题,在近年双门限算法研究的基础上提出一种改进算法。首先,设置合适的帧长和帧移,对语音信号进行加窗分帧,并计算整条语音的短时能量和短时过零率(ZCR);其次,利用语音信号的前置或结尾静音段的短时特性估计语音的噪声特性,以此设置算法的阈值,并改进增设的过渡和疑似辅音阈值;最后,比较计算结果和阈值,并使用改进后的判断方法确定语音段的起始和结束点位置。理论分析和实验仿真结果表明,与传统的双门限算法相比,改进算法在高SNR环境下性能相似,在低SNR环境下有较大提升。具体地,在SNR为15 dB、10 dB、5 dB和0 dB时,相较于传统双门限算法,改进算法的准确率、召回率和F1值有很大提高。可见,改进算法无论在高SNR还是低SNR环境下的VAD都有较好的效果。 展开更多
关键词 语音激活检测 双门限 动态阈值 短时能量 短时过零率
在线阅读 下载PDF
支持向量机在语音激活检测中的应用研究 被引量:15
2
作者 董恩清 赵鹤鸣 +1 位作者 周亚同 张晓娣 《通信学报》 EI CSCD 北大核心 2003年第3期70-77,共8页
提出将支持向量机(SVM)方法应用于语音激活检测(VAD),并验证SVM方法在VAD检测中的有效性。采用了快速训练支持向量机的序列最小最优化方法(SMO)进行训练。提出的基于SVM的VAD方法仍然采用G.729附件B(G.729B)中的VAD方法所采用的特征参... 提出将支持向量机(SVM)方法应用于语音激活检测(VAD),并验证SVM方法在VAD检测中的有效性。采用了快速训练支持向量机的序列最小最优化方法(SMO)进行训练。提出的基于SVM的VAD方法仍然采用G.729附件B(G.729B)中的VAD方法所采用的特征参数作为分类的特征参数。经过基于SVM的VAD方法与G.729B的VAD方法进行比较,表明SVM方法应用于VAD中是有效的。 展开更多
关键词 支持向量机 模式识别 统计学习理论 语音激活检测 语音编码
在线阅读 下载PDF
基于隐马尔可夫模型的语音激活检测算法 被引量:4
3
作者 李强 陈浩 陈丁当 《计算机应用》 CSCD 北大核心 2016年第11期3212-3216,共5页
针对现有基于隐马尔可夫模型(HMM)的语音激活检测(VAD)算法对噪声的跟踪性能不佳的问题,提出采用Baum-Welch算法对具有不同特性的噪声进行训练,并生成相应噪声模型,建立噪声库的方法。在语音激活检测时,根据待测语音背景噪声的不同,动... 针对现有基于隐马尔可夫模型(HMM)的语音激活检测(VAD)算法对噪声的跟踪性能不佳的问题,提出采用Baum-Welch算法对具有不同特性的噪声进行训练,并生成相应噪声模型,建立噪声库的方法。在语音激活检测时,根据待测语音背景噪声的不同,动态地匹配噪声库中的噪声模型;同时,为了适应语音信号的实时处理,降低了语音参数提取的复杂度,并对判决阈值提出改进,以保证语音信号帧间的相关性。在不同噪声环境下对改进算法进行性能测试并与自适应多速率编码(AMR)标准、国际电信联盟电信标准分局(ITU-T)的G.729B标准比较,测试结果表明,改进算法在实时语音信号处理中能够有效提高检测的准确率及噪声跟踪能力。 展开更多
关键词 隐马尔可夫模型 语音激活检测 Baum-Welch算法 噪声库 阈值
在线阅读 下载PDF
似然比测试语音激活检测算法研究 被引量:1
4
作者 雷建军 王坚 +1 位作者 刘刚 郭军 《计算机工程与应用》 CSCD 北大核心 2008年第36期34-36,41,共4页
基于似然比测试的语音激活检测算法基于假设检验原理,引入了对噪声的降噪处理,具有良好的噪声鲁棒性,算法高效且易于实现。各种改进算法针对语音模型、判决规则等核心问题进行了系统研究,检测性能得到了进一步提高。对此类算法进行了系... 基于似然比测试的语音激活检测算法基于假设检验原理,引入了对噪声的降噪处理,具有良好的噪声鲁棒性,算法高效且易于实现。各种改进算法针对语音模型、判决规则等核心问题进行了系统研究,检测性能得到了进一步提高。对此类算法进行了系统的论证,结合实验,分析比较了它们的性能差异和各自的优缺点,并指出了进一步的研究方向。 展开更多
关键词 语音激活检测 似然比测试 语音模型 判决规则
在线阅读 下载PDF
一种基于奇异谱的语音激活检测方法 被引量:1
5
作者 曹亮 张天骐 +1 位作者 周圣 胡然 《应用声学》 CSCD 北大核心 2013年第2期137-143,共7页
为了提高语音激活检测在低信噪比环境中的检测性能,提出了一种基于奇异谱的语音激活检测方法。首先用多窗口方法计算每一帧语音信号的相关矩阵;然后对相关矩阵进行奇异值分解;利用奇异值可以反映有用信号和噪声分布情况的特性,将每一帧... 为了提高语音激活检测在低信噪比环境中的检测性能,提出了一种基于奇异谱的语音激活检测方法。首先用多窗口方法计算每一帧语音信号的相关矩阵;然后对相关矩阵进行奇异值分解;利用奇异值可以反映有用信号和噪声分布情况的特性,将每一帧语音信号经过加权处理后的最大奇异值与自适应阈值进行比较进行语音激活检测。该方法原理简单,易于硬件实现,通过实验仿真表明,在低信噪比环境下,和基于对数能量方法相比,本文方法也能够很好的区分语音段和非语音段,有良好的检测性能。 展开更多
关键词 语音激活检测 Slepian数据窗 离散扁椭圆序列 相关矩阵 奇异值分解 自适应阈值
在线阅读 下载PDF
基于Teager能量算子的语音激活检测 被引量:3
6
作者 陈明义 黎华 《重庆工学院学报》 2007年第19期112-114,共3页
针对大多数语音激活检测(VAD)方法在低信噪比情况下性能急剧恶化的情况,提出了一种基于Teager能量算子(TEO)的语音激活检测方法.它能结合语音增强技术,应用Teager能量算子进行自适应门限判决.实验结果表明,在低信噪比的情况下,该方法能... 针对大多数语音激活检测(VAD)方法在低信噪比情况下性能急剧恶化的情况,提出了一种基于Teager能量算子(TEO)的语音激活检测方法.它能结合语音增强技术,应用Teager能量算子进行自适应门限判决.实验结果表明,在低信噪比的情况下,该方法能够随着环境自适应门限,具有较高的准确率和稳定性,简单有效. 展开更多
关键词 语音激活检测 TEAGER能量算子 自适应门限
在线阅读 下载PDF
一种具有鲁棒性的语音激活检测方法
7
作者 齐峰岩 鲍长春 《信号处理》 CSCD 北大核心 2005年第z1期172-175,共4页
本文提出了一种对于不同背景噪音具有鲁棒性的语音激活检测(VAD)算法.首先,该算法基于统计模型理论、线性预测原理以及自适应时变噪声参数估计方法,在时域和频域中共提取了四个特点不同的特征参数作为分类器的输入特征矢量,然后应用支... 本文提出了一种对于不同背景噪音具有鲁棒性的语音激活检测(VAD)算法.首先,该算法基于统计模型理论、线性预测原理以及自适应时变噪声参数估计方法,在时域和频域中共提取了四个特点不同的特征参数作为分类器的输入特征矢量,然后应用支持向量机(SVM)的方法,进行语音激活检测.最后,通过在不同噪音环境下的对比实验结果,验证了本文所提出的算法在中低信噪比情况下的检测性能要优于ITU G.729B中的VAD算法. 展开更多
关键词 语音编码 语音激活检测 支持向量机 统计信号处理
在线阅读 下载PDF
基于似然比测试的语音激活检测算法 被引量:5
8
作者 李燕诚 崔慧娟 唐昆 《计算机工程》 CAS CSCD 北大核心 2009年第10期214-216,共3页
针对低信噪比和噪声变化情况下语音激活检测算法性能下降的问题,提出一种新的参数更新和取值算法。该算法采用Laplacian-Gaussian混合模型对带噪语音频谱的概率分布进行建模,模型参数从带噪语音中估计得到,噪声功率参数通过跟踪语音的... 针对低信噪比和噪声变化情况下语音激活检测算法性能下降的问题,提出一种新的参数更新和取值算法。该算法采用Laplacian-Gaussian混合模型对带噪语音频谱的概率分布进行建模,模型参数从带噪语音中估计得到,噪声功率参数通过跟踪语音的音节间隙进行平滑。实验结果表明,该算法在-5dB信噪比情况下,可以达到95%以上的检测率,具有优越的跟踪性能。 展开更多
关键词 语音信号处理 语音激活检测 似然比测试 Laplacian-Gaussian混合模型 噪声跟踪
在线阅读 下载PDF
一种基于声学分类的语音激活检测算法 被引量:2
9
作者 魏涛 顾涵铮 《合肥工业大学学报(自然科学版)》 CAS CSCD 2001年第2期222-225,共4页
文章涉及了语音编码中最新的一种编码方式——变速率语音编码。语音激活检测 (VAD)算法是其中的关键部分 ,直接影响语音质量和试听效果。文章通过分析国际电信联盟的 G.72 9B标准 ,提出了一种适用于三速率语音编码方式的VA D算法。该算... 文章涉及了语音编码中最新的一种编码方式——变速率语音编码。语音激活检测 (VAD)算法是其中的关键部分 ,直接影响语音质量和试听效果。文章通过分析国际电信联盟的 G.72 9B标准 ,提出了一种适用于三速率语音编码方式的VA D算法。该算法结合了声学分类 ,对噪声、清音和浊音加以区分 ,最后给出了仿真结果 。 展开更多
关键词 变速率语音编码 vad 语音激活检测 声学分类 噪声 清音 浊音 语音质量
在线阅读 下载PDF
三阶累积量的语音激活检测方法 被引量:2
10
作者 刘福星 何选森 《计算机工程与应用》 CSCD 北大核心 2011年第17期137-139,共3页
在电子与通信系统中,传输信道的噪声都可以看作是加性的高斯随机过程,而高斯随机过程的三阶累积量为零,通信系统中传输的语音信号一般是非高斯信号,基于这个原理提出一种语音激活检测算法。在通信系统的接收端,对于被噪声污染了的语音信... 在电子与通信系统中,传输信道的噪声都可以看作是加性的高斯随机过程,而高斯随机过程的三阶累积量为零,通信系统中传输的语音信号一般是非高斯信号,基于这个原理提出一种语音激活检测算法。在通信系统的接收端,对于被噪声污染了的语音信号,通过计算接收信号的三阶累积量,得到语音信号的累积量,从而可以区分语音和噪声,达到检测出语音信号的目的。仿真结果表明,在通信系统低信噪比的环境下能有效地检测出语音信号。 展开更多
关键词 三阶累积量 语音激活检测 高斯噪声
在线阅读 下载PDF
基于竞争网络的语音激活检测研究 被引量:2
11
作者 柳燕 鲍长春 《信号处理》 CSCD 北大核心 2006年第1期57-60,共4页
本文提出了一种新的语音激活检测算法,这种方法基于竞争神经网络,主要应用了自组织特征映射网络并结合学习向量量化算法进行实现,并与其它神经网络算法进行了比较。该算法在多种噪声背景下具有较强的鲁棒性,仿真结果表明,这种基于竞争... 本文提出了一种新的语音激活检测算法,这种方法基于竞争神经网络,主要应用了自组织特征映射网络并结合学习向量量化算法进行实现,并与其它神经网络算法进行了比较。该算法在多种噪声背景下具有较强的鲁棒性,仿真结果表明,这种基于竞争神经网络的算法优于ITU—T G.729B建议的算法。 展开更多
关键词 语音激活检测 自组织特征映射网络 学习向量量化 竞争网络 神经网络
在线阅读 下载PDF
话者识别中结合模型和能量的语音激活检测算法 被引量:1
12
作者 章钊 郭武 《小型微型计算机系统》 CSCD 北大核心 2010年第9期1914-1917,共4页
语音激活检测是检测语音起始终止端点的一种算法,合适地选择语音来进行说话人模型的注册和测试对话者识别系统的性能有很大影响.本文将基于能量的语音激活检测算法与基于模型的算法相结合来检测语音,在N IST2006核心测试数据集上,采用... 语音激活检测是检测语音起始终止端点的一种算法,合适地选择语音来进行说话人模型的注册和测试对话者识别系统的性能有很大影响.本文将基于能量的语音激活检测算法与基于模型的算法相结合来检测语音,在N IST2006核心测试数据集上,采用本文算法的系统相对于传统基于能量的方法性能最多有19%的提升. 展开更多
关键词 语音激活检测 说话人识别 支持向量机 扰属性投影
在线阅读 下载PDF
一种自适应语音端点检测算法 被引量:6
13
作者 孙战先 储飞黄 王江 《计算机工程与应用》 CSCD 2014年第1期206-210,共5页
针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡... 针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡了音节之间的差异,放大了语音与噪声之间的差异,最后通过一个动态检测门限,实现了不同信噪比下的端点检测。 展开更多
关键词 语音活动检测(端点检测) 自适应 噪声评估 特征融合 VOICE Activity Detection(vad)
在线阅读 下载PDF
利用语音VAD和DTX增强Abis接口传输能力的可能性探讨 被引量:1
14
作者 傅永根 陈慧剑 《南京邮电学院学报(自然科学版)》 2003年第1期38-42,共5页
提出了一种提高目前GSM系统中Abis接口线路传输能力的方法———利用语音通信的VAD和DTX进行话音的倍增复用,并对其原理、实现方法、传输性能和影响进行了较为深入的探讨。
关键词 移动通信 ABIS接口 语音活性检测 不连续传输 vad DTX GSM
在线阅读 下载PDF
基于子带双特征的自适应保留似然比鲁棒语音检测算法 被引量:1
15
作者 何伟俊 贺前华 +1 位作者 吴俊峰 杨继臣 《电子与信息学报》 EI CSCD 北大核心 2016年第11期2879-2886,共8页
为了进一步提高低信噪比下语音激活检测(VAD)的准确率,该文提出一种基于子带双特征的自适应保留似然比鲁棒语音激活检测算法。算法采用子带归一化最大自相关函数与子带归一化平均过零率双重特征设置频率分量似然比的保留权值,同时利... 为了进一步提高低信噪比下语音激活检测(VAD)的准确率,该文提出一种基于子带双特征的自适应保留似然比鲁棒语音激活检测算法。算法采用子带归一化最大自相关函数与子带归一化平均过零率双重特征设置频率分量似然比的保留权值,同时利用已过去固定时长的VAD判决结果及对应的子带特征参数自适应地估计似然比的保留阈值。实验结果表明,此算法的VAD检测准确率相比原保留似然比算法在10 d B,0 d B和-10 d B平稳白噪声下分别提高了1.2%,7.2%和8.1%,在10 d B和0 d B非平稳Babble噪声下分别提高了1.6%和3.4%。当其被用于2.4 kbps低速率声码器系统时,合成语音的感知语音质量评价(PESQ)比原声码器系统在白噪声下提高了0.098~0.153,在Babble噪声下提高了0.157~0.186。 展开更多
关键词 语音激活检测 似然比 低信噪比 子带过零率
在线阅读 下载PDF
说话人日志中可靠静音模型语音活动检测方法
16
作者 杨登舟 徐嘉明 +1 位作者 刘加 夏善红 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2016年第1期151-157,共7页
为了解决传统语音活动检测(VAD)技术分离出的语音段掺杂静音以及帧间频繁跳动产生短语音碎片的问题,提出在说话人日志中能够高效稳定地完成语音活动检测的方法.该方法利用可靠静音模型对语音的区分度高这个特性,通过循环迭代收敛得到稳... 为了解决传统语音活动检测(VAD)技术分离出的语音段掺杂静音以及帧间频繁跳动产生短语音碎片的问题,提出在说话人日志中能够高效稳定地完成语音活动检测的方法.该方法利用可靠静音模型对语音的区分度高这个特性,通过循环迭代收敛得到稳定划分.建立静音和语音模型,通过帧间连续性原理进行不确定性解码得到帧类属信息,开展低能量短时间语音碎片后处理完成语音活动检测.在富标注说话人日志数据集上测试,实验结果表明,由于对静音模型的描述更加可靠,采用该方法可以减少帧间跳动,减少静音模型对语音的吸收误判,性能比基于子带熵顺序统计滤波(SE-OSF)方法提高明显. 展开更多
关键词 说话人日志 富标注 语音活动检测(vad) 高斯模型 维特比解码
在线阅读 下载PDF
基于谱熵的动态双门限语音端点检测算法 被引量:5
17
作者 赖春强 王钤 《兵工自动化》 2019年第1期39-41,共3页
针对通信设备语音通话控制的需求,通过综合分析语音端点检测主要方法及性能,提出一种基于谱熵语音端点检测算法。介绍语音端点检测算法,进行语音信号谱熵计算,通过建立背景噪声模型的方式动态调整谱熵值判别门限,实现语音端点检测功能... 针对通信设备语音通话控制的需求,通过综合分析语音端点检测主要方法及性能,提出一种基于谱熵语音端点检测算法。介绍语音端点检测算法,进行语音信号谱熵计算,通过建立背景噪声模型的方式动态调整谱熵值判别门限,实现语音端点检测功能。仿真结果表明:该算法不仅在低信噪比条件下具备较好的检测性能,而且在复杂背景噪声环境下具备良好的适应能力。 展开更多
关键词 语音端点检测 语音激活 谱熵
在线阅读 下载PDF
基于原始波残差网络的语音欺骗检测 被引量:2
18
作者 刘畅 魏为民 +1 位作者 栗风永 才智 《计算机工程与设计》 北大核心 2023年第3期829-835,共7页
针对传统检测方法在不同情境下仅提取语音单一特征可能会导致丢失语音中的重要信息的问题,提出一种基于原始波残差网络的语音欺骗检测方法。取代单一语音特征,直接在语音原始波形中提取帧级特征作为输入;基于参数化Sinc函数重点学习低... 针对传统检测方法在不同情境下仅提取语音单一特征可能会导致丢失语音中的重要信息的问题,提出一种基于原始波残差网络的语音欺骗检测方法。取代单一语音特征,直接在语音原始波形中提取帧级特征作为输入;基于参数化Sinc函数重点学习低频和高频截止频率,减少原始波建模参数数量;搭建残差网络模型作为后端分类器,改进激活函数并增加跳转连接模块以获得更好的泛化性能。实验数据集采用ASVspoof2019大赛官方数据集,实验结果表明,在逻辑攻击场景及物理攻击场景中,提出模型均相对基线系统具有更低的等错误率。 展开更多
关键词 语音欺骗检测 原始波 Sinc函数 建模参数 残差网络 激活函数 等错误率
在线阅读 下载PDF
垃圾网络电话检测技术研究 被引量:3
19
作者 李邵梅 郭云飞 陈福才 《计算机工程与应用》 CSCD 北大核心 2011年第6期11-14,共4页
为了对电信网中的垃圾网络电话(SPIT)进行有效的检测,解决该项技术应用中面临的检测精度和检测效率之间的矛盾,基于SPIT呼叫的典型特征,提出了一种粗过滤和精判别相结合的检测方法。基于语音激活检测(VAD)对疑似SPIT进行快速筛选,基于... 为了对电信网中的垃圾网络电话(SPIT)进行有效的检测,解决该项技术应用中面临的检测精度和检测效率之间的矛盾,基于SPIT呼叫的典型特征,提出了一种粗过滤和精判别相结合的检测方法。基于语音激活检测(VAD)对疑似SPIT进行快速筛选,基于支持向量机通过语音特征对SPIT进行精确识别。仿真实验结果表明,该方法计算代价小、检测效果好、实时性高,并且随着检测语音长度的增加,该方法的检测精度和实时倍率都有所增长。 展开更多
关键词 垃圾网络电话 语音激活检测 vad序列码 支持向量机
在线阅读 下载PDF
子带频谱分析的语音增强 被引量:4
20
作者 徐静波 于洪涛 冉崇森 《应用科学学报》 CAS CSCD 北大核心 2006年第3期232-235,共4页
提出一种有效的语音增强算法,该算法使用重叠相加FFT滤波器进行谱幅度估计,给出噪声估计的两个均值参数,此参数适用于任何噪声.而且进行噪声估计无需检测语音间隙,无需VAD的运算过程,克服了单信道噪声压缩算法的缺点.
关键词 FFT滤波器 噪声估计 谱幅度估计 语音激活检测
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部