期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于LPCC和能量熵的端点检测 被引量:6
1
作者 朱晓晶 侯旭初 +1 位作者 崔慧娟 唐昆 《电讯技术》 北大核心 2010年第6期41-45,共5页
为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法。首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率... 为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法。首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率的比较作出有声无声初判决;联合能量熵端点检测结果得到最终判决,最后通过Hangover机制最大限度的保护了语音。实验结果表明,此方法改善了能量熵端点检测法在babble噪声下的劣势,且在不同噪声环境下均优于G.729 Annex B的性能。 展开更多
关键词 语音信号处理 话音端点检测 谱熵 线性预测系数 倒谱系数 高斯混合模型
在线阅读 下载PDF
基于DLPCC和ELM的装甲车辆声识别 被引量:3
2
作者 樊新海 石文雷 张传清 《兵器装备工程学报》 CAS 北大核心 2018年第7期20-25,共6页
以常见的3种坦克和4种履带式装甲车为识别对象,提出了一种基于动态线性预测倒谱系数(DLPCC)和极限学习机(ELM)的装甲车辆声识别模型。该模型以DLPCC为特征,对不同工况下的装甲车辆噪声信号进行特征提取。根据噪声信号特征对ELM进行特征... 以常见的3种坦克和4种履带式装甲车为识别对象,提出了一种基于动态线性预测倒谱系数(DLPCC)和极限学习机(ELM)的装甲车辆声识别模型。该模型以DLPCC为特征,对不同工况下的装甲车辆噪声信号进行特征提取。根据噪声信号特征对ELM进行特征训练和识别,获得噪声识别模型。实验结果表明,DLPCC能更好地体现噪声特征,识别效果优于传统的LPCC。与传统的BP神经网络以及概率神经网络(PNN)相比,以极限学习机为分类器的识别模型具有用时短、准确率高的特点,识别率达到91%以上。 展开更多
关键词 动态线性预测倒谱系数 极限学习机 特征提取 声识别
在线阅读 下载PDF
试验环境水下声信号的特征提取方法 被引量:1
3
作者 王红滨 王永乐 +1 位作者 何鸣 薛垚 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第3期489-495,共7页
水下试验环境参数的反演是水声学研究领域的重要内容。而当前研究的关键是通过对水下声信号做特征提取从而获取参数信息。针对特征提取较难、模型很难拟合等问题。本文提出了一种试验环境水下声信号的特征提取方法。将水下声信号同时用... 水下试验环境参数的反演是水声学研究领域的重要内容。而当前研究的关键是通过对水下声信号做特征提取从而获取参数信息。针对特征提取较难、模型很难拟合等问题。本文提出了一种试验环境水下声信号的特征提取方法。将水下声信号同时用梅尔频谱倒谱系数及线性预测系数处理,两者运用特征加权组合方法得到新的特征矩阵;再应用映射插值算法对特征矩阵进行处理,获得适应神经网络输入的三通道矩阵。本文选取的网络模型为残差神经网络。利用实验室所录制的对河口水库数据集测试表明,本文提出的特征提取方法普遍优于仅利用梅尔频谱倒谱系数或线性预测系数的特征处理方法。利用单频矩形脉冲信号对环境进行深度5分类,准确率平均提升2%。利用线性调频信号对环境进行深度5分类,准确率平均提升2.03%。本文提出的特征提取方法对线性调频信号在深度分类任务下处理的结果要优于单频矩形脉冲信号处理的结果。 展开更多
关键词 环境反演 特征提取 梅尔频谱倒谱系数 线性预测系数 特征加权组合方法 残差神经网络 神经网络 水下声信号
在线阅读 下载PDF
基于GA/VQ的说话人辨认的研究与实现 被引量:3
4
作者 王金明 李恩波 《解放军理工大学学报(自然科学版)》 EI 2005年第3期214-218,共5页
为了改善在矢量量化说话人识别中,采用模板(码书)表征说话人,模板的质量对识别系统的性能。采用遗传算法改进模板的生成方式,构建了一种GA/VQ说话人辨认系统,给出了一种GA/VQ识别算法,通过遗传操作获得全局优化的说话人模板。实验证明,G... 为了改善在矢量量化说话人识别中,采用模板(码书)表征说话人,模板的质量对识别系统的性能。采用遗传算法改进模板的生成方式,构建了一种GA/VQ说话人辨认系统,给出了一种GA/VQ识别算法,通过遗传操作获得全局优化的说话人模板。实验证明,GA/VQ方法提高了码书的质量,比经典矢量量化识别系统识别率高。 展开更多
关键词 说话人辨认 GA 矢量量化 识别系统 说话人识别 生成方式 算法改进 识别算法 全局优化 遗传操作 实验证明 模板 识别率 码书 质量
在线阅读 下载PDF
基于SDCN算法的鲁棒性语音命令识别
5
作者 陶世焰 刘重庆 +1 位作者 何昕 顾樑 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第7期889-891,共3页
提出了一种基于 SDCN算法的鲁棒性语音命令识别 .依赖于信噪比的倒谱正常化 ( SDCN)算法直接在倒谱域根据输入语音帧的信噪比 ( SNR)来增加一补偿矢量 ,从而恢复未受污染的净语音信号 ,补偿矢量直接从训练环境和测试环境中记录的语音倒... 提出了一种基于 SDCN算法的鲁棒性语音命令识别 .依赖于信噪比的倒谱正常化 ( SDCN)算法直接在倒谱域根据输入语音帧的信噪比 ( SNR)来增加一补偿矢量 ,从而恢复未受污染的净语音信号 ,补偿矢量直接从训练环境和测试环境中记录的语音倒谱中逐帧比较得到 .该算法对退化的环境具有很强的鲁棒性 .实验结果证明 ,该算法简单。 展开更多
关键词 语言识别 语音命令识别 鲁棒性 SDCN算法
在线阅读 下载PDF
基于GMM模型和LPC-MFCC联合特征的声道谱转换研究 被引量:9
6
作者 曾歆 张雄伟 +2 位作者 孙蒙 苗晓孔 姚琨 《声学技术》 CSCD 北大核心 2020年第4期451-455,共5页
声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略... 声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略了不同声道特征参数之间可能存在的互补性。针对这一问题,研究了不同声道特征参数之间进行联合建模的方法,引入了一种由线性预测系数(LinearPredictionCoefficient,LPC)和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)联合构成的LPC-MFCC特征参数,提出了一种基于高斯混合模型(Gaussian Mixture Model, GMM)和LPC-MFCC联合特征参数的语音转换方法。为验证文中方法的有效性,仿真实验选取了基于GMM和LPC的语音转换方法进行对比,对多组实验数据进行主观和客观测试,结果表明,文中提出的语音转换方法可以获得相似度更高的转换语音。 展开更多
关键词 语音转换 声道谱转换 高斯混合模型 联合建模 线性预测系数-梅尔频率倒谱系数
在线阅读 下载PDF
Comparison of Khasi Speech Representations with Different Spectral Features and Hidden Markov States
7
作者 Bronson Syiem Sushanta Kabir Dutta +1 位作者 Juwesh Binong Lairenlakpam Joyprakash Singh 《Journal of Electronic Science and Technology》 CAS CSCD 2021年第2期155-162,共8页
In this paper,we present a comparison of Khasi speech representations with four different spectral features and novel extension towards the development of Khasi speech corpora.These four features include linear predic... In this paper,we present a comparison of Khasi speech representations with four different spectral features and novel extension towards the development of Khasi speech corpora.These four features include linear predictive coding(LPC),linear prediction cepstrum coefficient(LPCC),perceptual linear prediction(PLP),and Mel frequency cepstral coefficient(MFCC).The 10-hour speech data were used for training and 3-hour data for testing.For each spectral feature,different hidden Markov model(HMM)based recognizers with variations in HMM states and different Gaussian mixture models(GMMs)were built.The performance was evaluated by using the word error rate(WER).The experimental results show that MFCC provides a better representation for Khasi speech compared with the other three spectral features. 展开更多
关键词 Acoustic model(AM) Gaussian mixture model(GMM) hidden Markov model(HMM) language model(LM) linear predictive coding(LPC) linear prediction cepstral coefficient(lpcc) Mel frequency cepstral coefficient(MFCC) perceptual linear prediction(PLP)
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部