期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
利用抗噪幂归一化倒谱系数的鸟类声音识别 被引量:18
1
作者 颜鑫 李应 《电子学报》 EI CAS CSCD 北大核心 2013年第2期295-300,共6页
针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪... 针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪的声音功率谱提取抗噪幂归一化倒谱系数(APNCC).最后,采用支持向量机(SVM)分别对提取的APNCC,幂归一化倒谱系数(PNCC)和Mel频率倒谱系数(MFCC)对34种鸟类声音进行不同环境和信噪比情况下的对比实验.实验表明,提取的APNCC具有较好的平均识别效果及较强的噪声鲁棒性,更适用于信噪比低于30dB环境下的鸟类声音识别. 展开更多
关键词 鸟类声音识别 非平稳声估计 多频带谱减法 抗噪幂归一化倒谱系数 MEL频率谱系
在线阅读 下载PDF
基于双通道特征的含噪声纹识别方法研究
2
作者 伍雄 陈为真 《计算机应用与软件》 北大核心 2025年第7期205-211,共7页
针对声纹识别在噪声环境下准确率不高的问题,提出一种基于双通道声纹特征(Dual-Channel Voiceprint Feature,DCVF)的含噪声纹识别方法。将处理后的语音信号分别通过梅尔滤波器组和伽马通滤波器组,得到梅尔频率倒谱系数特征、伽马通倒谱... 针对声纹识别在噪声环境下准确率不高的问题,提出一种基于双通道声纹特征(Dual-Channel Voiceprint Feature,DCVF)的含噪声纹识别方法。将处理后的语音信号分别通过梅尔滤波器组和伽马通滤波器组,得到梅尔频率倒谱系数特征、伽马通倒谱系数特征,结合它们的差分谱构成混合特征,融合成双通道声纹特征(DCVF)。实验结果表明:在纯净语音数据集中,双通道声纹特征可达到99.5%的识别率;在含噪语音数据集下,DCVF的识别效果有明显提升。 展开更多
关键词 声纹识别 梅尔频率谱系 伽马通谱系 特征融合
在线阅读 下载PDF
一种低信噪比环境下的语音端点检测算法 被引量:5
3
作者 卜玉婷 曾庆宁 郑展恒 《声学技术》 CSCD 北大核心 2020年第5期592-602,共11页
端点检测技术是语音信号处理的关键技术之一,为提高低信噪比环境下端点检测的准确率和稳健性,提出了一种非平稳噪声抑制和调制域谱减结合功率归一化倒谱距离的端点检测算法。该算法首先通过抑制非平稳噪声再采用调制域谱减消除残余噪声... 端点检测技术是语音信号处理的关键技术之一,为提高低信噪比环境下端点检测的准确率和稳健性,提出了一种非平稳噪声抑制和调制域谱减结合功率归一化倒谱距离的端点检测算法。该算法首先通过抑制非平稳噪声再采用调制域谱减消除残余噪声来提升信噪比,减少语音失真。然后再提取每帧信号的功率归一化倒谱系数,计算每帧信号与背景噪声的功率归一化倒谱距离。最后将该倒谱距离作为检测参数,采用双门限判决方法进行端点检测。实验结果表明,该端点检测算法对语音帧和噪声帧具有较好的区分性。此外,在低信噪比环境下,所提出的算法对于不同类型的噪声都具有较好的稳健性。 展开更多
关键词 低信 瞬态抑制 调制域 功率归一化谱系 谱距离 端点检测
在线阅读 下载PDF
PZT语音传感器及其信号特征研究
4
作者 孙宏元 苏锡才 《计算机工程与应用》 CSCD 北大核心 2003年第27期113-117,共5页
论文针对强噪音环境提出一种PZT振动拾音器作为语音识别的前端输入。在同步采样前提下,比较了其信号与麦克风信号在时、频域上抗噪声性能上的差异。为弥补部分语音信息的丢失,提出了一种混合倒谱系数作为语音识别的特征,并分析了其抗噪... 论文针对强噪音环境提出一种PZT振动拾音器作为语音识别的前端输入。在同步采样前提下,比较了其信号与麦克风信号在时、频域上抗噪声性能上的差异。为弥补部分语音信息的丢失,提出了一种混合倒谱系数作为语音识别的特征,并分析了其抗噪声性能。 展开更多
关键词 PZT拾音器 语音识别特征 混合谱系
在线阅读 下载PDF
基于改进PNCC和i-vector的说话人识别鲁棒性 被引量:3
5
作者 史小元 景新幸 +1 位作者 曾敏 杨海燕 《计算机工程与设计》 北大核心 2017年第4期1071-1075,共5页
针对传统的梅尔频率倒谱系数(MFCC)在说话人识别系统中鲁棒性不足的问题,提出一种基于改进幂率归一化倒谱系数(PNCC)特征算法和身份向量(i-vector)训练模型的方法。与传统的MFCC不同,PNCC利用长时帧估计背景噪声;在此基础上,通过多窗谱... 针对传统的梅尔频率倒谱系数(MFCC)在说话人识别系统中鲁棒性不足的问题,提出一种基于改进幂率归一化倒谱系数(PNCC)特征算法和身份向量(i-vector)训练模型的方法。与传统的MFCC不同,PNCC利用长时帧估计背景噪声;在此基础上,通过多窗谱估计、平滑幅度谱包络和均值方差归一化(MVA)等技术进一步提升其鲁棒性。以i-vector为基准模型,在TIMIT语音库上进行说话人识别实验,实验结果表明,在不同噪声、不同信噪比下,所提算法相比其它特征有最低的等错误率,鲁棒性最强,在信噪比低于10dB的噪声环境中具有更大优势。 展开更多
关键词 归一化谱系 身份向量 均值方差归一化 多窗谱估计 鲁棒性 说话人识别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部