期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于贝叶斯通用背景模型的图像标注 被引量:9
1
作者 杨栋 周秀玲 郭平 《自动化学报》 EI CSCD 北大核心 2013年第10期1674-1680,共7页
在高斯图特征提取过程中,通用背景模型(Universal background model,UBM)方法常用于根据总体分布估计每一幅图像中特征点分布的高斯混合模型(Gaussian mixture model,GMM)参数.然而UBM估计的GMM权重参数中有很多接近零的数值,它们所对... 在高斯图特征提取过程中,通用背景模型(Universal background model,UBM)方法常用于根据总体分布估计每一幅图像中特征点分布的高斯混合模型(Gaussian mixture model,GMM)参数.然而UBM估计的GMM权重参数中有很多接近零的数值,它们所对应的高斯分量对分布估计贡献小却又都参与了计算,因此UBM的时间复杂度较高.为解决这个问题,本文提出Bayes UBM方法.通过引入受限的对称Dirichlet分布来描述GMM权重参数的先验分布,利用Bayes最大后验概率对GMM参数集进行估计.实验表明Bayes UBM方法不仅有效地降低了时间复杂度,而且提高了Corel数据集上的图像标注精度. 展开更多
关键词 图像标注 通用背景模型 高斯混合模型 贝叶斯估计
在线阅读 下载PDF
基于聚类和排序高斯混合模型的说话人确认
2
作者 余巍 李辉 《计算机工程》 CAS CSCD 北大核心 2011年第23期162-164,共3页
基于高斯混合模型(GMM)-通用背景模型(UBM)结构的说话人确认系统不能完全表现说话人的个性特征信息。为此,将聚类方法和排序高斯混合模型相结合,对每个高斯分量按照对应排序值顺序排列,并对UBM进行训练。基于NIST 06 8side-1side数据库... 基于高斯混合模型(GMM)-通用背景模型(UBM)结构的说话人确认系统不能完全表现说话人的个性特征信息。为此,将聚类方法和排序高斯混合模型相结合,对每个高斯分量按照对应排序值顺序排列,并对UBM进行训练。基于NIST 06 8side-1side数据库的实验结果表明,该方法能在基本保持系统识别性能的前提下,降低UBM的训练运算量。 展开更多
关键词 说话人确认 高斯混合模型 通用背景模型 聚类 排序高斯混合模型
在线阅读 下载PDF
一种改进的基于GMM-UBM的法庭自动说话人识别系统 被引量:4
3
作者 王华朋 杨军 +1 位作者 吴鸣 许勇 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2013年第6期800-805,共6页
对基于高斯混合模型(GMM)的法庭自动说话人识别系统进行改进.通过参考人群数据库降低了对嫌疑人语音样本数量的需求.以小规模背景人群数据库建立改进的基于高斯混合模型-通用背景模型(GMM-UBM)的法庭自动说话人识别系统.以固定电话信道... 对基于高斯混合模型(GMM)的法庭自动说话人识别系统进行改进.通过参考人群数据库降低了对嫌疑人语音样本数量的需求.以小规模背景人群数据库建立改进的基于高斯混合模型-通用背景模型(GMM-UBM)的法庭自动说话人识别系统.以固定电话信道和移动手机信道的数据库进行了系统的测试. 展开更多
关键词 似然比 法庭自动说话人识别 高斯混合模型-通用背景模型
在线阅读 下载PDF
自适应并行模型组合的鲁棒语音身份识别算法 被引量:6
4
作者 李聪 葛洪伟 《信号处理》 CSCD 北大核心 2018年第7期867-875,共9页
由于环境噪声的影响,实际应用中说话人识别系统性能会出现急剧下降。提出了一种基于高斯混合模型-通用背景模型和自适应并行模型组合的鲁棒性语音身份识别方法。自适应并行模型组合是一种噪声鲁棒性的特征补偿算法,能够有效减少训练环... 由于环境噪声的影响,实际应用中说话人识别系统性能会出现急剧下降。提出了一种基于高斯混合模型-通用背景模型和自适应并行模型组合的鲁棒性语音身份识别方法。自适应并行模型组合是一种噪声鲁棒性的特征补偿算法,能够有效减少训练环境与测试环境之间的不匹配现象,从而提高系统识别准确率和抗噪性能。首先,算法从测试语音中估计出噪声特征,然后用一个单高斯模型对噪声特征进行拟合得到噪声均值和协方差。最后,根据得出的噪声均值和协方差,调整训练好的高斯混合模型均值向量和协方差矩阵,使其尽可能地匹配测试环境。实验结果表明,该方法可以准确地重构干净语音的高斯混合模型参数,并且能够显著提高说话人识别的准确率,特别是在低信噪比情况下。 展开更多
关键词 说话人识别 特征补偿 并行模型组合 高斯混合模型-通用背景模型 噪声
在线阅读 下载PDF
SMFCC:一种新的语音信号特征提取方法 被引量:4
5
作者 汪海彬 余正涛 +1 位作者 毛存礼 郭剑毅 《计算机应用》 CSCD 北大核心 2016年第6期1735-1740,共6页
针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD... 针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD)方法的二维时频矩阵有效去噪性,并结合相关统计分析方法最终获得语音特征.采用TIMIT语音数据库,将所提的特征和现有特征进行对比实验.SMFCC特征的等错误率(EER)和最小检测代价(Min DCF)均小于线性预测倒谱系数(LPCC)、MFCC及其结合方法 LMFCC,比MFCC的EER和Min DCF08分别下降了3.6%与17.9%.实验结果表明所提方法能够有效去除语音信号中的噪声,提升局部分辨率. 展开更多
关键词 S变换 奇异值分解 基于S变换的美尔倒谱系数 高斯混合模型-通用背景模型 说话人识别
在线阅读 下载PDF
基于声纹识别的智能照明语音识别算法研究 被引量:10
6
作者 王建平 马兰兰 孙伟 《传感器与微系统》 CSCD 2020年第6期37-40,44,共5页
提出了一种基于声纹识别的智能照明语音识别算法。采用短时能量和短时平均过零率判别声控信号;采用基于高斯混合模型-通用背景模型(GMM-UBM)的方法判定声控人的身份;采用基于动态时间规整(DTW)的方法识别语义。通过建立多个身份人和多... 提出了一种基于声纹识别的智能照明语音识别算法。采用短时能量和短时平均过零率判别声控信号;采用基于高斯混合模型-通用背景模型(GMM-UBM)的方法判定声控人的身份;采用基于动态时间规整(DTW)的方法识别语义。通过建立多个身份人和多种声控命令的自适应实时语音训练样本库,采用对数似然分法和矢量累积距离法实现声控人身份认定与声控信号语义识别。仿真实验结果表明:该算法能快速准确判定与识别智能照明声控信号的身份和语义。 展开更多
关键词 声纹识别 智能照明 高斯混合模型-通用背景模型 动态时间规整
在线阅读 下载PDF
音源特征用于提高话者确认系统的鲁棒性 被引量:2
7
作者 吴礼福 姚志强 +1 位作者 戴蓓蒨 李辉 《中国科学技术大学学报》 CAS CSCD 北大核心 2006年第5期476-480,共5页
给出了一种采用音源特征信息提高以声道倒谱参数为特征的话者确认系统噪声鲁棒性的方法,提取了两类音源特征参数:短时(单帧)特征参数和较长时(多帧)特征参数,并分别构建了两个利用音源特征参数的与文本无关的话者确认辅助子系统.采用线... 给出了一种采用音源特征信息提高以声道倒谱参数为特征的话者确认系统噪声鲁棒性的方法,提取了两类音源特征参数:短时(单帧)特征参数和较长时(多帧)特征参数,并分别构建了两个利用音源特征参数的与文本无关的话者确认辅助子系统.采用线性加权对主、辅子系统的输出进行融合.在NIST’03数据库上100个男性话者的对比实验表明,音源特征参数具有良好的噪声鲁棒性,声道特征与音源特征具有较强的互补性,尤其是在较强的噪声背景下,利用音源特征可以有效地提高以声道倒谱参数为特征的确认系统的鲁棒性. 展开更多
关键词 音源特征 话者确认 噪声鲁棒性 高斯混合模型-背景模型
在线阅读 下载PDF
语种识别算法中GSV计算的定点仿真与实现 被引量:1
8
作者 张丽 杨镇西 吉立新 《计算机工程与设计》 CSCD 北大核心 2012年第2期679-683,共5页
基于GSV-SVM的语种识别方法是目前最为流行的语种识别方法之一,其采用基于通用背景模型GMM-UBM的GSV作为声学模型,支持向量机SVM作为区分模型。大量仿真测试结果表明,GSV在整个系统中占的运算量为80%左右,是算法硬件实现的瓶颈。鉴于此... 基于GSV-SVM的语种识别方法是目前最为流行的语种识别方法之一,其采用基于通用背景模型GMM-UBM的GSV作为声学模型,支持向量机SVM作为区分模型。大量仿真测试结果表明,GSV在整个系统中占的运算量为80%左右,是算法硬件实现的瓶颈。鉴于此,对基于GSV的硬件实现方法进行了研究,提出了一种快速GSV定点计算方法,其采用addlog运算简化对数似然函数的计算,完成了语种识别的高效定点实现。实验结果表明,该定点方法的识别率与浮点识别基本一致,满足应用要求。 展开更多
关键词 语种识别 高斯混合模型-通用背景模型 GMM超矢量 定点实现 addlog运算
在线阅读 下载PDF
基于SVM评分融合的分类短语音话者确认系统
9
作者 解焱陆 吴礼福 +1 位作者 戴蓓蒨 李辉 《数据采集与处理》 CSCD 北大核心 2005年第2期213-217,共5页
对于与文本无关短电话语音(小于30s)的话者确认,在特征参数空间上分类并分别建模的方法,会带来多个子系统输出融合的问题。为了得到最终的评分,同时反映出各个子系统之间的非线性关系以及贡献的不同。本文提出了使用支持向量机(Supportv... 对于与文本无关短电话语音(小于30s)的话者确认,在特征参数空间上分类并分别建模的方法,会带来多个子系统输出融合的问题。为了得到最终的评分,同时反映出各个子系统之间的非线性关系以及贡献的不同。本文提出了使用支持向量机(Supportvectormachine,SVM)进行后端评分融合的方法,对输出的两类评分矢量(目标话者和冒认话者)进行分类。在NIST′03数据库上的实验表明,在短语音情况下该方法比评分相加融合方法性能可以相对提高约11%,SVM不仅适用于多子系统的评分级的融合,对其他的多系统多信息的融合也行之有效。 展开更多
关键词 信息融合 支持向量机 高斯混合模型-背景模型 话者确认
在线阅读 下载PDF
基于自适应同源方差控制的法庭自动说话人识别
10
作者 王华朋 杨军 +1 位作者 吴鸣 许勇 《应用科学学报》 CAS CSCD 北大核心 2014年第6期582-587,共6页
提出了自动说话人识别系统得分到法庭证据强度量化值似然比的转换方法.为了更准确地评估嫌疑人的统计模型,提出了自适应同源方差控制算法,该算法能自适应地融合来自参考人群和嫌疑人的同源语音得分模型信息,降低了对嫌疑人数据量大小的... 提出了自动说话人识别系统得分到法庭证据强度量化值似然比的转换方法.为了更准确地评估嫌疑人的统计模型,提出了自适应同源方差控制算法,该算法能自适应地融合来自参考人群和嫌疑人的同源语音得分模型信息,降低了对嫌疑人数据量大小的需求.与基本识别系统相比的测试结果表明,使用该算法的识别系统不但具有更优良的识别性能和可靠性,而且提高了语音证据对判别结论的支持强度. 展开更多
关键词 法庭自动说话人识别 背景模型-高斯混合模型 似然比 自适应同源方差控制
在线阅读 下载PDF
非线性幂变换Gammachirp滤波器的鲁棒语音特征提取 被引量:3
11
作者 李聪 葛洪伟 《计算机科学与探索》 CSCD 北大核心 2019年第8期1351-1359,共9页
针对归一化功率倒谱系数(PNCC)在较低信噪比噪声环境下说话人识别鲁棒性不佳的问题,提出了非线性幂函数变换伽马啁啾频率倒谱系数(NPGFCC)的抗噪语音特征提取算法。相比PNCC,NPGFCC的不同之处在于其采用符合人耳听觉特性的归一化压缩Gam... 针对归一化功率倒谱系数(PNCC)在较低信噪比噪声环境下说话人识别鲁棒性不佳的问题,提出了非线性幂函数变换伽马啁啾频率倒谱系数(NPGFCC)的抗噪语音特征提取算法。相比PNCC,NPGFCC的不同之处在于其采用符合人耳听觉特性的归一化压缩Gammachirp滤波器组代替Gammatone滤波器组进行滤波,并在特征参数中融合了分段式非线性幂函数变换的方式。另外,算法中利用了均值方差归一化和时间序列滤波等技术的方法,进一步提高了其在噪声环境下的鲁棒性,并在改进的i-vector+PLDA模型下进行了测试。实验结果表明,相较于目前常用的一些说话人语音特征提取算法,在不同噪声和不同信噪比下,NPGFCC特征具有最佳抗噪性能,特别是在信噪比较低的情况下,与其他语音特征相比,NPGFCC特征具有更大的优势。 展开更多
关键词 特征提取 说话人识别 伽马啁啾滤波器 高斯混合模型-通用背景模型(gmm-ubm) 辨识向量(i-vector) 概率线性判别分析(PLDA)
在线阅读 下载PDF
家用机器人的说话人识别系统 被引量:1
12
作者 武宁 肖星星 冯瑞 《计算机工程》 CAS CSCD 2012年第2期207-209,212,共4页
现有说话人识别系统对环境噪声及说话人声音变迁等干扰的鲁棒性较差。为此,在改进和优化高斯混合-通用背景模型的基础上,根据家庭环境中的典型特征,设计并实现一种用于家用机器人的说话人识别系统。应用结果表明,该系统具有较好的识别... 现有说话人识别系统对环境噪声及说话人声音变迁等干扰的鲁棒性较差。为此,在改进和优化高斯混合-通用背景模型的基础上,根据家庭环境中的典型特征,设计并实现一种用于家用机器人的说话人识别系统。应用结果表明,该系统具有较好的识别性能和较高的鲁棒性,适用于声控门禁和语音签到等领域。 展开更多
关键词 说话人识别 家用机器人 梅尔频率倒谱系数 高斯混合模型 通用背景模型
在线阅读 下载PDF
基于特征相对贡献度对加权Mel倒谱的改进 被引量:7
13
作者 王家盛 郭其威 +1 位作者 吴松 马建敏 《声学技术》 CSCD 北大核心 2021年第3期408-414,共7页
在声纹识别系统的搭建过程中,提高识别率的一个重要做法是使语音信号中能够提取出的特征尽可能包含更多的说话人个性特征。为了探究特征参数各分量对识别系统性能的影响,文章基于高斯混合-通用背景模型(Gaussian Mixture Model-Universa... 在声纹识别系统的搭建过程中,提高识别率的一个重要做法是使语音信号中能够提取出的特征尽可能包含更多的说话人个性特征。为了探究特征参数各分量对识别系统性能的影响,文章基于高斯混合-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)基线系统,研究了在无噪环境中各维特征组合下的识别率,利用增减分量法定量计算出各维特征分量对识别率的相对贡献程度,并根据贡献度的强弱对各维特征分量进行合理加权,得到了贡献度拟合权重系数,将此系数用于改进梅尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征参数。仿真结果表明,对特征参数进行贡献度拟合权重系数加权后,声纹识别的正确率得到了提升。 展开更多
关键词 增减分量法 贡献度 梅尔(Mel)倒谱系数 高斯混合-通用背景模型(gmm-ubm)
在线阅读 下载PDF
基于耳蜗倒谱系数和Teager能量算子相位融合的说话人识别系统 被引量:4
14
作者 茅正冲 王俊俊 《南京理工大学学报》 EI CAS CSCD 北大核心 2018年第1期82-88,共7页
为了提高说话人识别系统的性能,该文在传统特征的基础上提出利用相位特征对听觉倒谱特征进行补偿的方法。该方法利用Teager能量算子(Teager energy operator,TEO)能够真实反映气流在通过声道系统呈现的涡流非线性作用的模型,再利用希尔... 为了提高说话人识别系统的性能,该文在传统特征的基础上提出利用相位特征对听觉倒谱特征进行补偿的方法。该方法利用Teager能量算子(Teager energy operator,TEO)能够真实反映气流在通过声道系统呈现的涡流非线性作用的模型,再利用希尔伯特变换从TEO导出分析信号的瞬时相位信息,结合耳蜗倒谱系数(Cochlear filter cepstral coefficients,CFCC)得到融合特征参数。实现了对特征参数的补偿,提高了说话人识别系统的识别率。使用NIST-2002说话者识别评估(Speakers recognition evaluation,SRE)数据库,在高斯混合模型-通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)的说话人识别系统上进行实验。实验结果表明TEO相位与CFCC的结合比单独CFCC更好,其识别精度比现有的CFCC特征和线性预测梅尔频率倒谱系数(Linear prediction Meyer frequency cepstral coefficient,LPMFCC)分别提高了8.32%和3.15%。这表明TEO相位包含与CFCC特征互补的信息,且具有较高的识别率。 展开更多
关键词 能量算子 耳蜗倒谱系数 高斯混合模型-通用背景模型 说话人识别
在线阅读 下载PDF
基于UBM降阶算法的高效说话人识别系统
15
作者 单振宇 杨莹春 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2009年第6期978-982,共5页
为了提高基于高斯混合模型-通用背景模型(GMM-UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决... 为了提高基于高斯混合模型-通用背景模型(GMM-UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM-UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了4.59%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM-UBM系统的运行效率. 展开更多
关键词 说话人识别 高斯混合模型 通用背景模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部