期刊文献+
共找到95篇文章
< 1 2 5 >
每页显示 20 50 100
I-vector聚类字典及注意力机制框架的说话人自适应 被引量:5
1
作者 黄俊 蒋兵 +2 位作者 李先刚 郭武生 戴礼荣 《小型微型计算机系统》 CSCD 北大核心 2019年第2期460-464,共5页
近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提取i-vector需要用到整句话的信息,并不能用于线上的自适应.因此,本文设计了一种基于i-vector聚类字典及注... 近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提取i-vector需要用到整句话的信息,并不能用于线上的自适应.因此,本文设计了一种基于i-vector聚类字典及注意力机制的自适应框架,测试时能够在不提取i-vector和不进行二遍解码的前提下快速实现线上自适应,并且该框架具有灵活性优和可扩展性好的优点,能够方便的用于其他类型的自适应,如地域自适应和性别自适应.在Switchboard任务上,实验结果表明我们提出的框架在不同的声学模型上相对于基线均有性能提升,并且通过说话人识别任务进一步证明了该方法的合理性. 展开更多
关键词 i-vector字典 注意力机制 说话人自适应 语音识别
在线阅读 下载PDF
基于DNN处理的鲁棒性I-Vector说话人识别算法 被引量:12
2
作者 王昕 张洪冉 《计算机工程与应用》 CSCD 北大核心 2018年第22期167-172,共6页
提出了一种将基于深度神经网络(Deep Neural Network,DNN)特征映射的回归分析模型应用到身份认证矢量(identity vector,i-vector)/概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA)说话人系统模型中的方法。DNN通过... 提出了一种将基于深度神经网络(Deep Neural Network,DNN)特征映射的回归分析模型应用到身份认证矢量(identity vector,i-vector)/概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA)说话人系统模型中的方法。DNN通过拟合含噪语音和纯净语音i-vector之间的非线性函数关系,得到纯净语音i-vector的近似表征,达到降低噪声对系统性能影响的目的。在TIMIT数据集上的实验验证了该方法的可行性和有效性。 展开更多
关键词 说话人识别 深度神经网络 i-vector
在线阅读 下载PDF
基于多特征I-Vector的说话人识别算法 被引量:2
3
作者 赵宏 岳鲁鹏 +1 位作者 常兆斌 王伟杰 《兰州理工大学学报》 CAS 北大核心 2021年第5期93-98,共6页
针对单一声学特征无法精准高效地辨识说话人身份的问题,提出了一种基于多特征I-Vector的说话人识别算法.该算法首先采集不同的声学特征并将其构成一个高维特征向量,然后通过主成分分析法有效地剔除高维特征向量的关联,确保各种特征之间... 针对单一声学特征无法精准高效地辨识说话人身份的问题,提出了一种基于多特征I-Vector的说话人识别算法.该算法首先采集不同的声学特征并将其构成一个高维特征向量,然后通过主成分分析法有效地剔除高维特征向量的关联,确保各种特征之间正交化,最后采用概率线性判别分析进行建模和打分,并在一定程度上降低空间维度.在TIMIT语料库上利用Kaldi进行实验,算法运行结果表明,该算法较当前流行的基于I-Vector的单一梅尔频率倒谱系数和感知线性预测系数的特征系统在等错误率上分别提高了8.18%和1.71%,在模型训练时间上分别减少了60.4%和47.5%,具有更好的识别效果和效率. 展开更多
关键词 说话人识别算法 多特征i-vector 主成分分析 概率线性判别分析 Kaldi
在线阅读 下载PDF
基于贝叶斯主成分分析的i-vector说话人确认方法 被引量:2
4
作者 肜娅峰 陈晨 +1 位作者 陈德运 何勇军 《电子学报》 EI CAS CSCD 北大核心 2021年第11期2186-2194,共9页
身份-矢量(identity-vector,i-vector)方法作为说话人确认领域中的主流方法之一,能够通过学习总变化空间来获取有效的低维说话人特征——i-vector特征.但是当开发集数据不充足时,会导致学习到的总变化空间模型误差较大;同时,还无法有效... 身份-矢量(identity-vector,i-vector)方法作为说话人确认领域中的主流方法之一,能够通过学习总变化空间来获取有效的低维说话人特征——i-vector特征.但是当开发集数据不充足时,会导致学习到的总变化空间模型误差较大;同时,还无法有效确认此时的总变化空间是否因为预先设置的维度过高而学到了冗余信息.为此,本文将贝叶斯主成分分析(Bayesian Principal Component Analysis,BPCA)引入总变化空间的学习过程中,利用其来为总变化空间引入更多的先验信息,从而对开发集数据中包含的信息进行补充,并在先验信息的约束下削弱总变化空间中无效维的影响.实验结果表明,当开发集数据不充足时,相比于传统的总变化空间学习方法,BPCA方法能够有效提升说话人确认系统的识别性能. 展开更多
关键词 说话人确认 身份-矢量(i-vector) 总变化空间 贝叶斯主成分分析
在线阅读 下载PDF
基于多特征i-vector的短语音说话人识别算法 被引量:7
5
作者 孙念 张毅 +1 位作者 林海波 黄超 《计算机应用》 CSCD 北大核心 2018年第10期2839-2843,共5页
当测试语音时长充足时,单一特征的信息量和区分性足够完成说话人识别任务,但是在测试语音很短的情况下,语音信号里缺乏充分的说话人信息,使得说话人识别性能急剧下降。针对短语音条件下的说话人信息不足的问题,提出一种基于多特征i-vec... 当测试语音时长充足时,单一特征的信息量和区分性足够完成说话人识别任务,但是在测试语音很短的情况下,语音信号里缺乏充分的说话人信息,使得说话人识别性能急剧下降。针对短语音条件下的说话人信息不足的问题,提出一种基于多特征i-vector的短语音说话人识别算法。该算法首先提取不同的声学特征向量组合成一个高维特征向量,然后利用主成分分析(PCA)去除高维特征向量的相关性,使特征之间正交化,最后采用线性判别分析(LDA)挑选出最具区分性的特征,并且在一定程度上降低空间维度,从而实现更好的说话人识别性能。结合TIMIT语料库进行实验,同一时长的短语音(2 s)条件下,所提算法比基于i-vector的单一的梅尔频率倒谱系数(MFCC)、线性预测倒谱系数(LPCC)、感知对数面积比系数(PLAR)特征系统在等错误率(EER)上分别有相对72. 16%、69. 47%和73. 62%的下降。不同时长的短语音条件下,所提算法比基于i-vector的单一特征系统在EER和检测代价函数(DCF)上大致都有50%的降低。基于以上两种实验的结果充分表明了所提算法在短语音说话人识别系统中可以充分提取说话人的个性信息,有利地提高说话人识别性能。 展开更多
关键词 说话人识别 i-vector 短语音 多特征 主成分分析 线性判别分析
在线阅读 下载PDF
基于总体变化子空间自适应的i-vector说话人识别系统研究 被引量:17
6
作者 栗志意 张卫强 +1 位作者 何亮 刘加 《自动化学报》 EI CSCD 北大核心 2014年第8期1836-1840,共5页
在说话人识别研究中,基于身份认证矢量(identity vector,i-vector)的子空间建模被证明是目前最前沿最有效的说话人建模技术,其中如何有效准确地估计总体变化子空间矩阵T成为影响系统性能好坏的关键问题.本文针对i-vector技术如何在新的... 在说话人识别研究中,基于身份认证矢量(identity vector,i-vector)的子空间建模被证明是目前最前沿最有效的说话人建模技术,其中如何有效准确地估计总体变化子空间矩阵T成为影响系统性能好坏的关键问题.本文针对i-vector技术如何在新的应用环境下进行总体变化子空间矩阵T的自适应估计问题进行了研究,并提出了两种行之有效的自适应估计算法.在由美国国家标准技术局(American National Institute of Standard and Technology,NIST)组织的2008年说话人识别核心评测数据库以及自行采集的测试数据库上的实验结果显示,不论采用测试集数据本身还是与测试集较匹配的开发集数据,通过本文所提的自适应算法来更新总体变化子空间矩阵均可以使更新后的子空间更有利于新测试数据下的低维子空间描述,在新的测试环境下都更有利于说话人分类.此外实验结果还表明基于多子空间拼接的子空间自适应方法性能明显优于迭代自适应方法,而且两者的结合可达到最优的识别性能,且此时利用开发集数据进行自适应可以接近其利用测试集数据进行自适应得到的最优性能. 展开更多
关键词 身份认证矢量 总体变化子空间 自适应 说话人识别
在线阅读 下载PDF
低资源条件下基于i-vector特征的LSTM递归神经网络语音识别系统 被引量:23
7
作者 黄光许 田垚 +2 位作者 康健 刘加 夏善红 《计算机应用研究》 CSCD 北大核心 2017年第2期392-396,共5页
在低资源条件下,由于带标注训练数据较少,搭建的语音识别系统性能往往不甚理想。针对此问题,首先在声学模型上研究了长短时记忆(LSTM)递归神经网络,通过对长序列进行建模来充分挖掘上下文信息,并且引入线性投影层减小模型参数;然后研究... 在低资源条件下,由于带标注训练数据较少,搭建的语音识别系统性能往往不甚理想。针对此问题,首先在声学模型上研究了长短时记忆(LSTM)递归神经网络,通过对长序列进行建模来充分挖掘上下文信息,并且引入线性投影层减小模型参数;然后研究了在特征空间中对说话人进行建模的技术,提取出能有效反映说话人和信道信息的身份认证矢量(i-vector);最后将上述研究结合构建了基于i-vector特征的LSTM递归神经网络系统。在Open KWS 2013标准数据集上进行实验,结果表明该技术相比于深度神经网络基线系统有相对10%的字节错误率降低。 展开更多
关键词 语音识别 长短时记忆神经网络 身份认证矢量
在线阅读 下载PDF
用说话人相似度i-vector的非负值矩阵分解说话人聚类 被引量:1
8
作者 哈尔肯别克.木哈西 钟珞 达瓦.伊德木草 《计算机应用与软件》 2017年第4期165-168,242,共5页
基于贝叶斯或者全贝叶斯准则的说话人自动聚类或者识别方法,主要采取重复换算全发话语音段的相似量度,再组合相似性较大的语音片段实现说话人的聚类。这种方法中如果发话语音片段数越多,组合计算时间就越长,系统实时性变差,而且各说话... 基于贝叶斯或者全贝叶斯准则的说话人自动聚类或者识别方法,主要采取重复换算全发话语音段的相似量度,再组合相似性较大的语音片段实现说话人的聚类。这种方法中如果发话语音片段数越多,组合计算时间就越长,系统实时性变差,而且各说话人模型用GMM方法建立,发话语音时间短暂时GMM的信赖性降低,最终影响说话人聚类精度。针对上述问题,提出引用i-vector说话人相似度的非负值矩阵分解的高精度快速说话人聚类方法。 展开更多
关键词 说话人分割及聚类 非负值矩阵分解 i-vector GMM 电话语音
在线阅读 下载PDF
基于i-vector局部加权线性判别分析的说话人识别 被引量:6
9
作者 王明合 唐振民 张二华 《仪器仪表学报》 EI CAS CSCD 北大核心 2015年第12期2842-2848,共7页
基于i-vector的说话人识别系统通常采用LDA来消除训练和测试语音之间信道失配,不能保证样本在待识别语音近邻区域内具有最佳的分离度,这就使得目标说话人和其近邻间的得分差异较小,进而导致识别准确性下降。针对该问题,提出基于i-vecto... 基于i-vector的说话人识别系统通常采用LDA来消除训练和测试语音之间信道失配,不能保证样本在待识别语音近邻区域内具有最佳的分离度,这就使得目标说话人和其近邻间的得分差异较小,进而导致识别准确性下降。针对该问题,提出基于i-vector局部加权线性判别分析的说话人识别方法(LWLDA)。在计算类内和类间散度时,增加待识别语音近邻样本权重。在此基础上,通过提高待识别语音近邻域局部类间的分辨能力,尽可能减少因信道差异而产生的识别错误。在不同语音库上的实验结果表明:LWLDA在复杂信道环境下能够保持良好的鲁棒性;在交叉信道条件下的识别准确率比LDA平均提高3.6%。 展开更多
关键词 语音处理 说话人识别 身份认证向量 局部加权线性判别分析
在线阅读 下载PDF
利用i-vectors构建区分性话者模型的话者确认 被引量:3
10
作者 方昕 李辉 刘青松 《小型微型计算机系统》 CSCD 北大核心 2014年第3期685-688,共4页
对于电话手机语音的文本无关话者确认,运用联合因子分析构建话者信息子空间与信道信息子空间来进行失配信道补偿取得了较好的效果.然而研究表明,信道信息子空间仍然包含了可以用来区分话者的信息.因此,本文运用一种既包含话者信息又包... 对于电话手机语音的文本无关话者确认,运用联合因子分析构建话者信息子空间与信道信息子空间来进行失配信道补偿取得了较好的效果.然而研究表明,信道信息子空间仍然包含了可以用来区分话者的信息.因此,本文运用一种既包含话者信息又包含信道信息的全变量信息子空间来提取i-vectors低维特征矢量,再运用类内协方差规整进行失配信道补偿,最后用补偿后的i-vectors特征矢量构建支持向量机话者模型.在NIST08数据库上实验表明,本文所构建系统的性能在等误识率和最小检测代价函数上有相对近70%的提高. 展开更多
关键词 话者确认 全变量信息子空间 类内协方差规整 支持向量机 i—vectors
在线阅读 下载PDF
基于i-vector说话人识别算法中训练时长研究 被引量:2
11
作者 马平 黄浩 +1 位作者 程露红 杨萌萌 《现代电子技术》 北大核心 2016年第14期1-3,8,共4页
为了进一步提升i-vector说话人识别模型的系统性能,探讨了基于i-vector的说话人识别系统中训练时长、男女比例和高斯混合度对系统识别性能的影响。针对训练时长、男女比例和高斯混合度设置了一组实验,结合目前最流行的语音识别工具Kald... 为了进一步提升i-vector说话人识别模型的系统性能,探讨了基于i-vector的说话人识别系统中训练时长、男女比例和高斯混合度对系统识别性能的影响。针对训练时长、男女比例和高斯混合度设置了一组实验,结合目前最流行的语音识别工具Kaldi进行验证,得出i-vector说话人识别算法的最佳参数,为以后的基于i-vector说话人识别算法研究提供数据依据。 展开更多
关键词 说话人识别 i.vector Kaldi 训练时长
在线阅读 下载PDF
说话人识别的不确定性i-vector分析 被引量:5
12
作者 屈召贵 鲁顺昌 《计算机工程与设计》 北大核心 2017年第6期1647-1650,共4页
针对噪声环境中说话人识别性能不稳定问题,提出一种基于不确定性前端因子分析的说话人识别方法。通过不确定性估计改进传统的i-vector特征抽取方式,实现在噪声环境中性能稳定的说话人识别。实验结果表明,该方法具有较高的说话人识别准确... 针对噪声环境中说话人识别性能不稳定问题,提出一种基于不确定性前端因子分析的说话人识别方法。通过不确定性估计改进传统的i-vector特征抽取方式,实现在噪声环境中性能稳定的说话人识别。实验结果表明,该方法具有较高的说话人识别准确率,是高鲁棒性的,可广泛用于语音识别任务。 展开更多
关键词 说话人识别 不确定性 鲁棒性 i-vector 前端因子分析
在线阅读 下载PDF
基于改进i-vector的说话人感知训练方法研究
13
作者 梁玉龙 屈丹 邱泽宇 《计算机工程》 CAS CSCD 北大核心 2018年第5期262-267,共6页
基于辨识向量(i-vector)的说话人感知训练方法使用MFCC作为输入特征对i-vector进行提取,但MFCC较差的特征鲁棒性会影响该训练方法的识别性能。为此,提出一种基于改进i-vector的说话人感知训练方法。设计基于SVD的低维特征提取方法,用其... 基于辨识向量(i-vector)的说话人感知训练方法使用MFCC作为输入特征对i-vector进行提取,但MFCC较差的特征鲁棒性会影响该训练方法的识别性能。为此,提出一种基于改进i-vector的说话人感知训练方法。设计基于SVD的低维特征提取方法,用其提取的特征替代MFCC对表征能力更优的i-vector进行提取。实验结果表明,在捷克语语料库中,相对于DNN-HMM语音识别系统与原始基于i-vector的说话人感知训练方法,该方法的识别性能分别提升了1.62%与1.52%,在WSJ语料库中,该方法识别性能分别提升了3.9%和1.48%。 展开更多
关键词 说话人感知训练 辨识向量 深度神经网络 奇异值矩阵分解 瓶颈特征
在线阅读 下载PDF
基于改进PNCC和i-vector的说话人识别鲁棒性 被引量:3
14
作者 史小元 景新幸 +1 位作者 曾敏 杨海燕 《计算机工程与设计》 北大核心 2017年第4期1071-1075,共5页
针对传统的梅尔频率倒谱系数(MFCC)在说话人识别系统中鲁棒性不足的问题,提出一种基于改进幂率归一化倒谱系数(PNCC)特征算法和身份向量(i-vector)训练模型的方法。与传统的MFCC不同,PNCC利用长时帧估计背景噪声;在此基础上,通过多窗谱... 针对传统的梅尔频率倒谱系数(MFCC)在说话人识别系统中鲁棒性不足的问题,提出一种基于改进幂率归一化倒谱系数(PNCC)特征算法和身份向量(i-vector)训练模型的方法。与传统的MFCC不同,PNCC利用长时帧估计背景噪声;在此基础上,通过多窗谱估计、平滑幅度谱包络和均值方差归一化(MVA)等技术进一步提升其鲁棒性。以i-vector为基准模型,在TIMIT语音库上进行说话人识别实验,实验结果表明,在不同噪声、不同信噪比下,所提算法相比其它特征有最低的等错误率,鲁棒性最强,在信噪比低于10dB的噪声环境中具有更大优势。 展开更多
关键词 幂率归一化倒谱系数 身份向量 均值方差归一化 多窗谱估计 鲁棒性 说话人识别
在线阅读 下载PDF
基于机器学习的磷灰石源岩识别方法 被引量:1
15
作者 刘嘉情 钟世华 +6 位作者 李三忠 戴黎明 索艳慧 郭广慧 牛警徽 薛梓萌 黄宇 《大地构造与成矿学》 北大核心 2025年第2期467-480,共14页
正确识别花岗岩成因类型一直是国内外地质学领域关注的焦点,对研究大陆壳的形成和演化过程以及认识金属矿床成因、指导找矿勘查等工作均具有重要意义。本次研究在汇编I型和S型花岗岩的磷灰石微量元素数据的基础上,借助两种有监督机器学... 正确识别花岗岩成因类型一直是国内外地质学领域关注的焦点,对研究大陆壳的形成和演化过程以及认识金属矿床成因、指导找矿勘查等工作均具有重要意义。本次研究在汇编I型和S型花岗岩的磷灰石微量元素数据的基础上,借助两种有监督机器学习算法——支持向量机与随机森林,建立了基于磷灰石微量元素特征区分I型和S型花岗岩的方法。研究选取磷灰石的La、Ce、Pr、Nd、Sm、Eu、Gd、Tb、Dy、Ho、Er、Tm、Yb、Lu、Sr、Y、δEu、Sr/Y、La/Yb共19种特征用于机器学习训练,获得的分类准确率均不低于0.99,证实运用磷灰石成分可以有效识别花岗岩类型。除此之外,基于准确率更高的支持向量机模型,提出了9种花岗岩成因类型二元判别图解,这些图解在识别I型和S型花岗岩时准确率均高于0.90。本研究不仅为花岗岩成因类型识别提供了新的途径,还为利用其他副矿物开展花岗岩成因研究提供了思路和方法参考。相关机器学习代码已上传至GitHub,地址为https://github.com/ShihuaZhong/Apatite2023MLcode。 展开更多
关键词 磷灰石 S型花岗岩 I型花岗岩 支持向量机 随机森林 机器学习
在线阅读 下载PDF
铜绿假单胞菌外膜蛋白Ⅰ载体疫苗构建及免疫效果研究
16
作者 张艳琪 胡基华 曲晓军 《安徽农业科学》 2025年第7期86-91,101,共7页
[目的]构建表达铜绿假单胞菌外膜蛋白I的重组乳酸乳球菌载体疫苗,评价构建的载体疫苗免疫效果,为研发可防治铜绿假单胞菌感染的疫苗奠定基础。[方法]根据GenBank中铜绿假单胞菌OprI基因序列设计引物,扩增、鉴定OprI基因,将OprI基因扩增... [目的]构建表达铜绿假单胞菌外膜蛋白I的重组乳酸乳球菌载体疫苗,评价构建的载体疫苗免疫效果,为研发可防治铜绿假单胞菌感染的疫苗奠定基础。[方法]根据GenBank中铜绿假单胞菌OprI基因序列设计引物,扩增、鉴定OprI基因,将OprI基因扩增产物与pMG36c质粒双酶切、连接,构建重组质粒pMG36c-OprI;对乳酸乳球菌MG1363菌株感受态细胞制备和电转化方法优化,将重组质粒电转化MG1363感受态细胞,酶切和PCR反应及测序鉴定转化情况,SDS-PAGE电泳检测OprI蛋白表达情况;采用灌胃、皮下注射和鼻腔喷雾接种小鼠方式评价载体疫苗安全性和异常毒性,采用免疫小鼠、攻毒试验评价免疫效果。[结果]重组载体疫苗构建成功;感受态细胞制备和电转化优化条件:细菌OD_(600)=0.5,复壮时间3 h,质粒添加量100 ng和转化电压2.5 kV时,转化效率可达到425 CFU/μg DNA;载体疫苗安全性、异常毒性试验合格;载体疫苗对小鼠的保护率为76.67%;免疫后,小鼠血清抗体IgG和IgE水平显著高于免疫前(P<0.01),载体疫苗免疫组水平显著高于MG1363菌株免疫组(P<0.01)。[结论]构建了安全、无异常毒性、免疫效果较好的表达铜绿假单胞菌外膜蛋白I的乳酸乳球菌重组载体疫苗,为有效防治铜绿假单胞菌感染提供了坚实的技术支撑。 展开更多
关键词 铜绿假单胞菌 外膜蛋白I 乳酸乳球菌 重组载体疫苗 免疫效果
在线阅读 下载PDF
基于磷灰石微量元素组成的机器学习方法判别花岗岩成因类型 被引量:2
17
作者 韩凤歌 冷成彪 +2 位作者 陈加杰 邹少浩 王大钊 《岩石学报》 北大核心 2025年第2期737-750,共14页
花岗岩在全球广泛分布,不同成因类型的花岗岩记录了不同的构造环境、源区岩石类型或深部岩浆过程等,因此正确识别花岗岩成因类型(I型、S型、A型花岗岩)具有重要意义。磷灰石作为花岗岩中最常见的一种副矿物,蕴含多种主微量元素,记录着... 花岗岩在全球广泛分布,不同成因类型的花岗岩记录了不同的构造环境、源区岩石类型或深部岩浆过程等,因此正确识别花岗岩成因类型(I型、S型、A型花岗岩)具有重要意义。磷灰石作为花岗岩中最常见的一种副矿物,蕴含多种主微量元素,记录着花岗岩的源区和岩浆物理化学特征,因此成为判别花岗岩成因类型的重要指标。本文收集了已发表的I型、S型和A型花岗岩的磷灰石微量元素数据,采用随机森林(Random Forest,RF)和支持向量机(Support Vector Machine,SVM)两种机器学习算法,利用其中的17种微量元素含量指标(Mn、Sr、Y、La、Ce、Pr、Nd、Sm、Eu、Gd、Tb、Dy、Ho、Er、Tm、Yb、Lu)和8种元素综合指标[(La/Nd)_(N)、(La/Yb)_(N)、(Gd/Yb)_(N)、Yb N、LREE、REE+Y、Eu/Eu^(*)、Sr/Y]建立了花岗岩的成因类型判别模型。结果表明随机森林(95.56%)和支持向量机(94.76%)的分类准确率均很高。发现Sr在区分I型和S型花岗岩方面最为重要,Ce和Mn在区分A型花岗岩方面最为重要,Eu对于区分S型及I/A型花岗岩方面较为重要。本文提出的机器学习模型便捷高效,可以快速地确定花岗岩的成因类型。 展开更多
关键词 随机森林 支持向量机 磷灰石 微量元素 I-S-A型花岗岩
在线阅读 下载PDF
基于概率球面判别分析的说话人识别信道补偿算法
18
作者 景维鹏 肖庆欣 罗辉 《计算机应用》 CSCD 北大核心 2024年第2期556-562,共7页
在说话人识别任务中,概率线性判别分析(PLDA)模型是目前常用的分类后端,但由于高斯PLDA模型分布假设不能准确拟合真实说话人特征分布,导致基于高斯分布假设长度归一化的信道补偿方法会破坏说话人特征类内分布的独立性,使得高斯PLDA不能... 在说话人识别任务中,概率线性判别分析(PLDA)模型是目前常用的分类后端,但由于高斯PLDA模型分布假设不能准确拟合真实说话人特征分布,导致基于高斯分布假设长度归一化的信道补偿方法会破坏说话人特征类内分布的独立性,使得高斯PLDA不能充分利用上游任务提取特征所包含的说话人信息,从而影响识别结果。针对这一问题,提出基于概率球面判别分析的信道补偿算法(CC-PSDA),通过引入冯·米塞斯-费希尔(VMF)分布假设的概率球面判别分析模型(PSDA)和特征变换方法代替高斯分布假设的概率线性判别分析方法,以避免信道补偿对说话人特征类内分布独立性的影响。首先,为了使说话人特征符合VMF分布先验假设拟合后端分类模型,在特征级利用非线性转换对说话人特征进行分布变换。之后,利用基于VMF分布假设的PLDA模型不会破坏说话人特征的类内分布结构的特点,将变换后的说话人特征定义到特定维度的超球面,最大化特征类间距离。所提算法通过期望最大化(EM)算法进行求解,最终完成分类任务。实验结果表明,改进算法在三个测试集上的识别等错误率相较于对比模型PSDA、高斯PLDA均最低。由此可见,所提模型可以有效区分说话人特征,提高识别性能。 展开更多
关键词 说话人识别 i-vector 概率球面判别分析 信道补偿 冯·米塞斯-费希尔分布 长度归一化
在线阅读 下载PDF
船舶永磁同步推进电机的优化I/f起动控制方法 被引量:2
19
作者 张翔 高岚 《舰船科学技术》 北大核心 2024年第4期109-115,共7页
为解决高转矩与高转动惯量的船舶推进电机在开环I/f控制中转速和转矩波动大、电机易失步、效率低的问题,提出一种I/f控制改进方法。通过建立转矩角观测器,调节给定电流矢量的幅值,使其跟随负载转矩变化,提高系统鲁棒性。同时,将电机运... 为解决高转矩与高转动惯量的船舶推进电机在开环I/f控制中转速和转矩波动大、电机易失步、效率低的问题,提出一种I/f控制改进方法。通过建立转矩角观测器,调节给定电流矢量的幅值,使其跟随负载转矩变化,提高系统鲁棒性。同时,将电机运行状态推进至接近最大转矩电流比状态,提高电机的运行效率;通过瞬时有功功率调节电流矢量的角速度,降低电磁转矩波动,加快电机的转速收敛过程。最后,在Matlab/Simulink中进行仿真实验,实验结果表明该方法可以显著提高推进电机运行效率和稳定性。 展开更多
关键词 永磁同步电机 I/f控制 瞬时有功功率 电流矢量与转子磁链夹角观测
在线阅读 下载PDF
基于概率修正PLDA的说话人识别系统 被引量:4
20
作者 李琳 万丽虹 +2 位作者 洪青阳 张君 李明 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2015年第8期692-696,共5页
为减弱注册语音与测试语音时长不一致对说话人识别性能的负面影响,提出一个概率修正PLDA建模方法.根据语音时长自适应改变传统PLDA模型中i-vector的概率分布函数,提高PLDA对每个说话人每段语音的时长表征能力,以增强说话人类别的区分度... 为减弱注册语音与测试语音时长不一致对说话人识别性能的负面影响,提出一个概率修正PLDA建模方法.根据语音时长自适应改变传统PLDA模型中i-vector的概率分布函数,提高PLDA对每个说话人每段语音的时长表征能力,以增强说话人类别的区分度.为验证基于概率修正PLDA模型的有效性,进行了NIST SRE10 corecore测试集在3种不同时长的评测实验,以及NIST 2014 i-vector machine learning challenge测试任务.结果表明,相较于传统的PLDA训练模型,通过语音时长的约束提高了说话人识别性能. 展开更多
关键词 高斯PLDA i-vector 语音时长 概率修正 说话人识别
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部