期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于对话语音的与文本无关的说话人确认系统的研究 被引量:4
1
作者 陈雁翔 戴蓓倩 +1 位作者 周曦 李辉 《中文信息学报》 CSCD 北大核心 2004年第2期36-43,共8页
本文建立了一个基于对话语音的与文本无关的说话人确认系统 ,它和传统的与文本无关的说话人确认系统的关键不同在于 ,训练及测试语音不再只包含一个人而都是对话语音 ,因此需要分割出属于不同说话人的语音段 ,以建立说话人模型和实现最... 本文建立了一个基于对话语音的与文本无关的说话人确认系统 ,它和传统的与文本无关的说话人确认系统的关键不同在于 ,训练及测试语音不再只包含一个人而都是对话语音 ,因此需要分割出属于不同说话人的语音段 ,以建立说话人模型和实现最终判决。文中详细介绍了高斯混合模型 -背景模型 (GMM UBM)这种说话人确认系统的框架 ,重点讨论了基于GLR(GeneralizedLikelihoodRatio)距离测度的无监督语音分割算法。最终阐述的输出评分的规整方法即ZNORM (ZeroNormalization)和持续时间修正 ,可以使确认系统的性能提高近 10 %。 展开更多
关键词 计算机应用 中文信息处理 对话语音 GLR距离测度 无监督语音分割 说话人确认系统 文本
在线阅读 下载PDF
似然得分归一化及其在与文本无关说话人确认中的应用
2
作者 邓浩江 杜利民 万洪杰 《电子与信息学报》 EI CSCD 北大核心 2005年第7期1025-1029,共5页
该文研究了似然得分归一化方法的原理,建立了基于自适应GMM模型的说话人确认系统,并将非特定人的背景模型与特定人的cohort模型相结合,提出了混合归一化的方法。在电话语音条件下,该文比较了不同得分归一化方法对确认系统性能的影响。... 该文研究了似然得分归一化方法的原理,建立了基于自适应GMM模型的说话人确认系统,并将非特定人的背景模型与特定人的cohort模型相结合,提出了混合归一化的方法。在电话语音条件下,该文比较了不同得分归一化方法对确认系统性能的影响。实验表明,在自适应GMM模型似然比得分的基础上,T-cohort与通用背景模型混合归一化能获得最佳识别效果。当错误拒绝率为5%时,该方法可以获得0.5%的错误接受率,远远低于采用通用背景模型归一化方法的2%。 展开更多
关键词 说话人确认 高斯混合模型 得分归一化 文本无关
在线阅读 下载PDF
优先度排序RBF神经网络在与文本无关说话人确认中的应用
3
作者 邓浩江 王守觉 杜利民 《电子与信息学报》 EI CSCD 北大核心 2003年第9期1153-1159,共7页
该文介绍了优先度排序径向基函数(PORBF)神经网络的结构与算法,并提出了将其应用于与文本无关说话人确认时的训练算法、似然度的计算方法以及识别规则。为了增强PORBF网络的泛化能力,该文用压缩矢量构造抑制样本集,提出了顺序选取、最... 该文介绍了优先度排序径向基函数(PORBF)神经网络的结构与算法,并提出了将其应用于与文本无关说话人确认时的训练算法、似然度的计算方法以及识别规则。为了增强PORBF网络的泛化能力,该文用压缩矢量构造抑制样本集,提出了顺序选取、最近邻选取和最远距离选取等3种选择抑制样本集中说话人的方法,并对PORBF神经元的输出进行了等比递减加权.在相同条件下的与文本无关说话人确认实验中,传统的矢量量化方法的等差错率可达10.56%,而基于PORBF网络的确认系统使用最近邻选择方法构造抑制样本集,其等差错率可达6.83%;性能提高很多。 展开更多
关键词 优先度排序 径向基函数 神经网络 说话人确认 文本无关 训练算法 语音处理
在线阅读 下载PDF
文本无关说话人确认中的一种新的评分规整方法 被引量:1
4
作者 陈继旭 刘明辉 +1 位作者 戴蓓蒨 李辉 《信号处理》 CSCD 北大核心 2006年第4期545-549,共5页
对于采用统一阈值的,基于高斯混合模型(GMM)的文本无关说话人确认系统,由于不同的话者模型的输出评分分布的不同,会影响到系统的确认性能,为此,需对输出评分进行规整。本文提出了一种新的评分规整方法-整体规整。整体规整同时考虑了不... 对于采用统一阈值的,基于高斯混合模型(GMM)的文本无关说话人确认系统,由于不同的话者模型的输出评分分布的不同,会影响到系统的确认性能,为此,需对输出评分进行规整。本文提出了一种新的评分规整方法-整体规整。整体规整同时考虑了不同测试语音和不同话者模型的差异,并在评分域做出调整,使得所有语音的输出评分具有相似的分布,从而使系统整体分类能力得以保证。在NIST’03电话语音库上进行的实验表明,采用了整体规整后的系统性能和传统的评分规整方法比较,有了明显提高。 展开更多
关键词 说话人确认 文本无关 评分规整 整体规整
在线阅读 下载PDF
基于高斯语音滤波的稳健文本无关说话人识别 被引量:5
5
作者 周静芳 陈一宁 +1 位作者 李科 刘加 《计算机工程》 EI CAS CSCD 北大核心 2005年第2期179-181,共3页
基于高斯模型,提出一种去除实际电话录音中噪音、静音等非语音信号的新方法。与传统的语音检测器方法相比,基于高斯语音滤波的方法在不同信道条件下都可以自动进行,更好地保留了与说话人身份有关的信息。实验结果表明,采用该方法的系统... 基于高斯模型,提出一种去除实际电话录音中噪音、静音等非语音信号的新方法。与传统的语音检测器方法相比,基于高斯语音滤波的方法在不同信道条件下都可以自动进行,更好地保留了与说话人身份有关的信息。实验结果表明,采用该方法的系统的等错误率比传统方法最多下降了21.2%。 展开更多
关键词 文本无关 说话人识别 语音信号 语音检测 滤波 信道 电话录音 高斯 实际 错误率
在线阅读 下载PDF
基于改进VQ算法的文本无关的说话人识别 被引量:7
6
作者 张庆芳 赵鹤鸣 《计算机工程与应用》 CSCD 北大核心 2006年第10期65-68,共4页
基于矢量量化的说话人识别,因其运算过程简单等特点,在文本无关的说话人识别领域有着广泛的应用。论文根据说话人识别中训练语音的特点并结合快速搜索算法,对矢量量化的码书形成算法进行了改进,提出了一种基于改进算法的与文本无关的说... 基于矢量量化的说话人识别,因其运算过程简单等特点,在文本无关的说话人识别领域有着广泛的应用。论文根据说话人识别中训练语音的特点并结合快速搜索算法,对矢量量化的码书形成算法进行了改进,提出了一种基于改进算法的与文本无关的说话人识别方法。经实验结果证明,论文的方法加快了码书的形成,减少了码书形成的计算量,改善了码本的性能,提高了说话人识别的识别率。 展开更多
关键词 说话人识别 文本无关 快速搜索 改进的LBG算法
在线阅读 下载PDF
基于GMM的普通话和四川方言独立文本的说话人确认 被引量:2
7
作者 赵靖 龚卫国 杨利平 《计算机应用》 CSCD 北大核心 2008年第3期792-794,共3页
针对训练和测试阶段中的语音数据类型(普通话和四川方言)的不匹配导致说话人确认系统性能下降很大的问题,提出了一种新的建立高斯混合模型(GMM)方法——普通话和四川方言按比例混合建立普通话和四川方言联合GMM的方法,并发现使系统针对... 针对训练和测试阶段中的语音数据类型(普通话和四川方言)的不匹配导致说话人确认系统性能下降很大的问题,提出了一种新的建立高斯混合模型(GMM)方法——普通话和四川方言按比例混合建立普通话和四川方言联合GMM的方法,并发现使系统针对普通话和四川方言不匹配导致的性能下降率至很低(2.79%)的比例。实验结果表明,该方法可以有效地加强测试阶段针对语种变化的鲁棒性,可以有效的减少普通话和四川方言在训练和测试阶段的不匹配造成的性能下降率。 展开更多
关键词 说话人确认 高斯混合模型 独立文本 双语种说话人确认
在线阅读 下载PDF
基于超音段韵律特征和GMM-UBM的文本无关的说话人识别 被引量:1
8
作者 许东星 戴蓓蒨 +1 位作者 刘青松 许敏强 《中国科学技术大学学报》 CAS CSCD 北大核心 2010年第2期157-162,共6页
提出一种采用超音段韵律特征和GMM-UBM模型结构的文本无关的说话人识别方法,用多尺度小波分析方法从短时倒谱参数MFCC和基频F0随时间变化的韵律中分别提取可用于文本无关说话人识别的超音段韵律特征参数PMFCC和PF0,并组成联合参数PMFCC... 提出一种采用超音段韵律特征和GMM-UBM模型结构的文本无关的说话人识别方法,用多尺度小波分析方法从短时倒谱参数MFCC和基频F0随时间变化的韵律中分别提取可用于文本无关说话人识别的超音段韵律特征参数PMFCC和PF0,并组成联合参数PMFCCF0.在NIST068side-1side复杂背景电话手机语音数据库上的说话人确认实验则表明,采用一阶小波分析方法提取的超音段韵律参数PMFCC的识别性能与短时MFCC相当,采用超音段韵律特征PMFCCF0的系统确认性能比采用短时MFCC系统有较大的提高.在微软数据库进行不同信噪比测试语音的说话人辨认实验表明,PMFCCF0有比短时MFCC更好的噪声鲁棒性. 展开更多
关键词 超音段韵律特征 GMM—UBM 文本无关 说话人识别
在线阅读 下载PDF
多特征组合多分类器的方法用于“文本无关”的说话人辨认(英文 ) 被引量:1
9
作者 王岚 陈珂 迟惠生 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 1998年第2期275-282,共8页
组合多分类器可以看作是一种用于获得较高识别效果的混合系统。重点探索了以不同特征作为输入的组合多分类器方法。实验结果表明:利用多特征组合多分类器的方法可以提高“文本无关”说话人辨认系统的识别率和可靠性。
关键词 文本无关 说话人辨认 组合多分类器 声音识别
在线阅读 下载PDF
基于ARVM的与文本无关的说话人识别算法
10
作者 邱政权 江太辉 《计算机工程与应用》 CSCD 北大核心 2004年第7期66-67,83,共3页
该文提出了一种新的与文本无关的说话人识别算法。这种算法使用了能处理说话人交叉变量的语音信号频谱变化的模型。使用了两种不同音质的语音,即″纯净音质″和″电话音质″来测试这一算法,得到了很好的实验结果。
关键词 文本无关 说话人识别 ARVM
在线阅读 下载PDF
基于修正Mel子带系数的文本无关的说话人识别
11
作者 张庆芳 赵鹤鸣 《计算机工程与应用》 CSCD 北大核心 2011年第1期12-14,共3页
与文本无关的说话人识别具有用户使用方便、可应用范围较宽等优点,是当前说话人识别技术的研究重点。对文本无关说话人识别系统中的特征参数提取进行了研究,通过对Mel子带系数进行修正,增强了说话人识别系统中说话人之间的频带差异,提... 与文本无关的说话人识别具有用户使用方便、可应用范围较宽等优点,是当前说话人识别技术的研究重点。对文本无关说话人识别系统中的特征参数提取进行了研究,通过对Mel子带系数进行修正,增强了说话人识别系统中说话人之间的频带差异,提高了特征空间中类别的可分性,得到了更能体现说话人个性特征的Mel子带系数,从而提高了说话人识别系统的平均正确识别率。 展开更多
关键词 说话人识别 文本无关 矢量量化 Mel子带
在线阅读 下载PDF
模糊相关性文本无关矢量量化说话人辨认研究
12
作者 唐建 何劲松 《系统仿真学报》 CAS CSCD 北大核心 2009年第14期4351-4355,4361,共6页
文本无关说话人识别的一个关键问题是寻求一种有效的说话人个性特征量。利用模糊向量内积理论,提出了一种新的物理量:连续特征矢量模糊相关度(CFVFC),以反映相邻特征矢量间的相关性,进而突出说话人的个性特征,并在此基础上研究了新的矢... 文本无关说话人识别的一个关键问题是寻求一种有效的说话人个性特征量。利用模糊向量内积理论,提出了一种新的物理量:连续特征矢量模糊相关度(CFVFC),以反映相邻特征矢量间的相关性,进而突出说话人的个性特征,并在此基础上研究了新的矢量量化(VQ)说话人识别方法。实验表明CFVFC是一种有效的识别信息,对于干净语音的说话人辨认,可以提高识别系统的识别率;在加噪声情况下,能增强识别系统的鲁棒性。 展开更多
关键词 说话人辨认 文本无关 矢量量化 说话人个性特征 连续特征矢量模糊相关度
在线阅读 下载PDF
基于群模型改进的说话人确认系统
13
作者 刘晓燕 傅鹂 周元 《计算机应用与软件》 CSCD 北大核心 2007年第11期150-151,203,共3页
在研究说话人识别系统时,分别从特征参数的选取和识别训练两种不同角度分析了加权特征向量和群模型在增强系统性能方面的可行性,并采用群模型与加权特征向量相结合的方式建立与文本无关的说话人确认系统。试验结果表明,含加权特征向量... 在研究说话人识别系统时,分别从特征参数的选取和识别训练两种不同角度分析了加权特征向量和群模型在增强系统性能方面的可行性,并采用群模型与加权特征向量相结合的方式建立与文本无关的说话人确认系统。试验结果表明,含加权特征向量的群模型比传统的矢量量化有更高的辨识率,而且错误拒绝率在一定的错误接受率下也有显著降低。 展开更多
关键词 说话人识别 群模型 加权特征向量 文本无关的说话人确认
在线阅读 下载PDF
声母发声特点参数的提取及其提高说话人确认鲁棒性的研究 被引量:2
14
作者 许东星 戴蓓蒨 +1 位作者 许敏强 刘青松 《信号处理》 CSCD 北大核心 2009年第9期1479-1483,共5页
本文针对语音信号中的声母语音更易受环境噪声污染而导致识别性能下降的情况,根据普通话声母发声位置特点,提出了一种对发声位置状态描述的发声特点参数(Articulatory Feature,简称AF),采用特征空间映射方法,由短时倒谱参数(MFCC)经MLP... 本文针对语音信号中的声母语音更易受环境噪声污染而导致识别性能下降的情况,根据普通话声母发声位置特点,提出了一种对发声位置状态描述的发声特点参数(Articulatory Feature,简称AF),采用特征空间映射方法,由短时倒谱参数(MFCC)经MLP特征映射网络映射获取,MLP特征映射网络则由语言学先验知识事先训练得到。AF参数具有良好的噪声鲁棒性,并与MFCC参数具有互补性,由MFCC和AF组成的联合特征参数(MFCC-AF)可使系统确认性能的鲁棒性有明显的改善。在微软数据库上的基于GMM-UBM模型的与文本无关的说话人确认实验表明,对于声母语音,采用MFCC-AF参数使系统的鲁棒性有明显的改善:在干净、25dB、20dB条件下,较只采用MFCC参数的系统的EER分别相对降低了5.4%,14.12%,20.27%。 展开更多
关键词 发声特点 多层感知器 文本无关 说话人确认
在线阅读 下载PDF
一种基于VQ的说话人确认的阈值设计方法 被引量:1
15
作者 陈明义 周昆湘 余伶俐 《计算机工程与应用》 CSCD 北大核心 2007年第13期117-119,共3页
基于矢量量化的说话人确认系统的阈值的选取是影响系统性能的重要因素之一,而传统的采用固定的经验值作为阈值的方法鲁棒性差,且需要进行大量的实验。提出了用训练语音得到的码本以及平均失真作为表征说话人的模型,并基于此模型对说话... 基于矢量量化的说话人确认系统的阈值的选取是影响系统性能的重要因素之一,而传统的采用固定的经验值作为阈值的方法鲁棒性差,且需要进行大量的实验。提出了用训练语音得到的码本以及平均失真作为表征说话人的模型,并基于此模型对说话人确认系统中阈值的确定提出了一种新的解决方法,实验结果表明由该方法得出的阈值比传统的经验值具有更好的鲁棒性,系统的识别率也有了显著的改善。 展开更多
关键词 说话人确认 矢量量化(VQ) 确认阈值 文本无关
在线阅读 下载PDF
用于文本无关的话者识别的超音段信息提取 被引量:1
16
作者 姚志强 吴礼福 +1 位作者 戴蓓蒨 周曦 《数据采集与处理》 CSCD 北大核心 2005年第4期376-380,共5页
提出一种可用于较少语音数据量的文本无关的超音段信息提取方法。通过对基音和能量的轨迹动态分段,提取超音段信息,并使用异方差线性区分分析(HLDA)进行参数优化,克服超音段信息提取对数据量大小的依赖,同时采用混合高斯-统一背景(GMM-U... 提出一种可用于较少语音数据量的文本无关的超音段信息提取方法。通过对基音和能量的轨迹动态分段,提取超音段信息,并使用异方差线性区分分析(HLDA)进行参数优化,克服超音段信息提取对数据量大小的依赖,同时采用混合高斯-统一背景(GMM-U BM)模型结构,建立文本无关话者识别系统。在N IST′01数据库上的实验表明,该系统性能优于基于短时帧的音源信息参数系统,更重要的是不需要大数据量的支持,且与基于短时帧倒谱参数的话者识别系统融合后,系统识别性能明显改善,等误识率相对下降10%。 展开更多
关键词 话者确认 超音段信息 基音 文本无关
在线阅读 下载PDF
基于长时平均频谱的“文本无关”话者识别 被引量:3
17
作者 王宏 向大威 《声学技术》 CSCD 2002年第1期59-62,共4页
文章以动窗离散傅立叶变换为基础获取说话人的长时平均频谱 (即短时频谱的长时平均 ) ,然后将长时平均频谱经过能量归一化和频率归一化后作为“文本无关”话者识别的语音特征。分析之前 ,语音样本经过频域预加权和时域汉明窗加权处理 ,... 文章以动窗离散傅立叶变换为基础获取说话人的长时平均频谱 (即短时频谱的长时平均 ) ,然后将长时平均频谱经过能量归一化和频率归一化后作为“文本无关”话者识别的语音特征。分析之前 ,语音样本经过频域预加权和时域汉明窗加权处理 ,并利用帧能量门限自动去除了样本中的寂静段。通过在小人群范围内对该方法的大量实验 ,得到很好的话者识别效果。另外 ,作为“文本无关”话者识别的一个重要辅助手段 ,文章还利用短时频谱分析给出了话者语音样本的窄带三维语图和宽带三维语图 ,它们能清晰地给出话者语音的时变频率特征。 展开更多
关键词 说话人识别 文本无关 长时平均频谱 三维语图 时变频率特征 语音识别 信号处理
在线阅读 下载PDF
文本有关的话者确认系统 被引量:1
18
作者 秦兵 陈惠鹏 +1 位作者 李光琪 刘松波 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2000年第4期16-18,共3页
通过分析当前话者识别系统中常用的一些特征 ,提出了新的特征向量组合 .试验表明 ,特征组合后能很好地区分话者 ;在建模的过程中 ,提出了矢量量化模型与隐含马尔柯夫模型的混合识别策略 ,使正识率有所提高 ;同时 ,对文本有关和文本无关... 通过分析当前话者识别系统中常用的一些特征 ,提出了新的特征向量组合 .试验表明 ,特征组合后能很好地区分话者 ;在建模的过程中 ,提出了矢量量化模型与隐含马尔柯夫模型的混合识别策略 ,使正识率有所提高 ;同时 ,对文本有关和文本无关作了对比试验 ,试验证明 ,选择 4~ 展开更多
关键词 说话人识别 文本有关 矢量量化 话者确认系统
在线阅读 下载PDF
基于韵律特征的SVM说话人确认 被引量:2
19
作者 黄肖忠 李辉 +1 位作者 许东星 郭伟 《计算机工程与应用》 CSCD 北大核心 2011年第15期148-151,224,共5页
提出了一种基于韵律特征和SVM的文本无关说话人确认系统。采用小波分析方法,从语音信号的MFCC、F0和能量轨迹中提取出超音段韵律特征,通过实验研究三者的韵律特征在特征层的最佳互补融合,得到信号的韵律特征PMFCCFE,用韵律特征的GMM均... 提出了一种基于韵律特征和SVM的文本无关说话人确认系统。采用小波分析方法,从语音信号的MFCC、F0和能量轨迹中提取出超音段韵律特征,通过实验研究三者的韵律特征在特征层的最佳互补融合,得到信号的韵律特征PMFCCFE,用韵律特征的GMM均值超矢量作为参数训练目标话者的SVM模型,以更有效地区分目标话者和冒认话者。在NIST068side-1side数据库的实验表明,以短时倒谱参数的GMM-UBM系统为基准,超音段韵律特征的GMM-SVM系统的EER相对下降了57.9,MinDCF相对下降了41.4。 展开更多
关键词 韵律特征 高斯混合模型(GMM)超矢量 支持向量机 文本无关说话人确认
在线阅读 下载PDF
基于粒子群优化-模糊聚类的说话人识别 被引量:8
20
作者 薛丽萍 尹俊勋 纪震 《深圳大学学报(理工版)》 CAS 北大核心 2008年第2期178-183,共6页
基于粒子群优化(particle swarm optim ization,PSO)提出一种说话人识别算法—三粒子模糊C均值聚类算法.利用3个子群体,每个子群体由规模较小的3个粒子构成,寻求最佳说话人模型.在每次迭代中每个子群体按先后顺序执行PSO算法中的速度更... 基于粒子群优化(particle swarm optim ization,PSO)提出一种说话人识别算法—三粒子模糊C均值聚类算法.利用3个子群体,每个子群体由规模较小的3个粒子构成,寻求最佳说话人模型.在每次迭代中每个子群体按先后顺序执行PSO算法中的速度更新、位置更新操作和标准FCM算法,对说话人的训练语音数据进行粒子群优化-模糊的软聚类分析,得到聚类中心的最优解,作为该说话人的语音模型.此算法可避免粒子陷入局部最优聚类中心,较准确地记录和估计每个聚类中心的最佳移动方向和历史路径,从而使聚类中心向全局最优解靠近.实验表明,本算法始终稳定地取得优于LBG算法、FCM算法和FRLVQ-FVQ算法的说话人识别性能,对初始聚类中心依赖度低,可有效降低误识率. 展开更多
关键词 说话人识别 文本无关 粒子群优化 模糊C均值聚类 三粒子群
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部