期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于最大似然线性回归矩阵的说话人识别算法研究
1
作者 钟山 何亮 +1 位作者 邓妍 刘加 《自动化学报》 EI CSCD 北大核心 2009年第5期546-550,共5页
研究了将自适应领域的最大似然线性回归(Maximum likelihood linear regression,MLLR)变换矩阵作为特征进行文本无关的说话人识别算法.本文引入了基于统一背景模型的MLLRSV-SVM说话人识别算法,并在此基础上进行高层音素聚类以进一步提... 研究了将自适应领域的最大似然线性回归(Maximum likelihood linear regression,MLLR)变换矩阵作为特征进行文本无关的说话人识别算法.本文引入了基于统一背景模型的MLLRSV-SVM说话人识别算法,并在此基础上进行高层音素聚类以进一步提高识别性能.在采用多种信道补偿技术后,在NISTSRE2006年1训练语段-1测试语段同信道和跨信道数据库上,基于MLLR特征的系统与其他最好的系统性能接近并有很强的互补性,经过简单线性融合可以极大提高识别性能. 展开更多
关键词 说话人识别 最大似然线性回归 支持向量机 信道补偿
在线阅读 下载PDF
基于最大似然线性回归的随机段模型说话人自适应研究
2
作者 晁浩 杨占磊 刘文举 《计算机工程与科学》 CSCD 北大核心 2014年第8期1604-1608,共5页
提出了一种随机段模型系统的说话人自适应方法。根据随机段模型的模型特性,将最大似然线性回归方法引入到随机段模型系统中。在"863-test"测试集上进行的汉语连续语音识别实验显示,在不同的解码速度下,说话人自适应后汉字错... 提出了一种随机段模型系统的说话人自适应方法。根据随机段模型的模型特性,将最大似然线性回归方法引入到随机段模型系统中。在"863-test"测试集上进行的汉语连续语音识别实验显示,在不同的解码速度下,说话人自适应后汉字错误率均有明显的下降。实验结果表明,最大似然线性回归方法在随机段模型系统中同样能取得较好的效果。 展开更多
关键词 语音识别 说话人自适应 最大似然线性回归 随机段模型
在线阅读 下载PDF
基于最大似然子带线性回归的鲁棒语音识别
3
作者 吕勇 吴镇扬 《信号处理》 CSCD 北大核心 2010年第1期74-79,共6页
在实际环境中,训练环境和测试环境的失配会导致语音识别系统的性能急剧恶化。模型自适应算法是减小环境失配影响的有效方法之一,它通过少量自适应数据将模型参数变换到识别环境。最大似然线性回归是一种常用的基于变换的模型自适应算法... 在实际环境中,训练环境和测试环境的失配会导致语音识别系统的性能急剧恶化。模型自适应算法是减小环境失配影响的有效方法之一,它通过少量自适应数据将模型参数变换到识别环境。最大似然线性回归是一种常用的基于变换的模型自适应算法,本文针对最大似然线性回归算法在数据较少时模型参数估计不准确的缺点,提出了基于最大似然子带线性回归的模型自适应算法。该算法将Mel滤波器组的全部通道划分为若干个子带,假设每个子带内多个通道的模型均值分量共享一个线性环境变换关系,以增加可用的数据。实验表明,本文算法可以较好地克服数据稀疏问题,只需要很少的数据即可取得较好的自适应效果,尤其适合于少量数据时的快速模型自适应。 展开更多
关键词 语音识别 模型自适应 最大似子带线性回归 隐马尔可夫模型
在线阅读 下载PDF
鉴别性最大后验概率线性回归说话人自适应研究 被引量:2
4
作者 齐耀辉 潘复平 +1 位作者 葛凤培 颜永红 《北京理工大学学报》 EI CAS CSCD 北大核心 2015年第9期946-950,共5页
为增强自适应后的声学模型的鉴别能力,提出了一种基于最大互信息(MMI)的鉴别性最大后验概率线性回归(MMI-DMAPLR)说话人自适应方法.将最大互信息准则和最大后验概率(MAP)准则相结合,设计了一个新的目标函数来估计基于线性变换的自适应... 为增强自适应后的声学模型的鉴别能力,提出了一种基于最大互信息(MMI)的鉴别性最大后验概率线性回归(MMI-DMAPLR)说话人自适应方法.将最大互信息准则和最大后验概率(MAP)准则相结合,设计了一个新的目标函数来估计基于线性变换的自适应方法中的变换参数,在最大后验概率估计中加入了鉴别性.大词汇量连续语音识别的实验结果表明,新方法在增强声学模型与测试数据的匹配性的同时,可以有效提高声学模型的鉴别能力,在少量自适应数据的情况下,其性能比最大后验概率线性回归(MAPLR)相对提高4.8%. 展开更多
关键词 最大似然线性回归 最大后验概率线性回归 最大互信息 说话人自适应
在线阅读 下载PDF
基于MAP+CMLLR的说话人识别中发声力度问题 被引量:1
5
作者 黄文娜 彭亚雄 贺松 《计算机应用》 CSCD 北大核心 2017年第3期906-910,共5页
为了改善发声力度对说话人识别系统性能的影响,在训练语音存在少量耳语、高喊语音数据的前提下,提出了使用最大后验概率(MAP)和约束最大似然线性回归(CMLLR)相结合的方法来更新说话人模型、投影转换说话人特征。其中,MAP自适应方法用于... 为了改善发声力度对说话人识别系统性能的影响,在训练语音存在少量耳语、高喊语音数据的前提下,提出了使用最大后验概率(MAP)和约束最大似然线性回归(CMLLR)相结合的方法来更新说话人模型、投影转换说话人特征。其中,MAP自适应方法用于对正常语音训练的说话人模型进行更新,而CMLLR特征空间投影方法则用来投影转换耳语、高喊测试语音的特征,从而改善训练语音与测试语音的失配问题。实验结果显示,采用MAP+CMLLR方法时,说话人识别系统等错误率(EER)明显降低,与基线系统、最大后验概率(MAP)自适应方法、最大似然线性回归(MLLR)模型投影方法和约束最大似然线性回归(CMLLR)特征空间投影方法相比,MAP+CMLLR方法的平均等错率分别降低了75.3%、3.5%、72%和70.9%。实验结果表明,所提出方法削弱了发声力度对说话人区分性的影响,使说话人识别系统对于发声力度变化更加鲁棒。 展开更多
关键词 说话人识别 发声力度 最大后验概率 最大似然线性回归 约束最大似然线性回归
在线阅读 下载PDF
基于自适应隐式半马尔可夫模型的设备健康诊断与寿命预测方法 被引量:18
6
作者 刘勤明 李亚琴 +1 位作者 吕文元 叶春明 《计算机集成制造系统》 EI CSCD 北大核心 2016年第9期2187-2194,共8页
针对设备健康诊断与寿命预测问题,提出一种基于自适应隐式半马尔可夫模型(AHSMM)结合多传感器信息的设备健康预测方法。提出了AHSMM的前向—后向算法、Viterbi算法和Baum-Welch算法,有效降低了模型的计算复杂性。利用最大似然线性回归... 针对设备健康诊断与寿命预测问题,提出一种基于自适应隐式半马尔可夫模型(AHSMM)结合多传感器信息的设备健康预测方法。提出了AHSMM的前向—后向算法、Viterbi算法和Baum-Welch算法,有效降低了模型的计算复杂性。利用最大似然线性回归训练对输出概率分布和驻留概率分布进行自适应训练,处理多传感器信息间的差异性,进行有效的多传感器信息融合,以更加准确地进行设备健康诊断与寿命预测。利用失效率理论建立了对设备剩余使用寿命进行预测的基本步骤。通过美国卡特彼勒公司液压泵的状态识别和健康预测实际案例对所提出的方法进行评价与验证,实验结果表明,基于AHSMM的设备健康诊断和性能衰退预测方法比传统的隐式半马尔可夫模型(HSMM)更有效。 展开更多
关键词 自适应隐式半马尔可夫模型 健康诊断 剩余有效寿命 最大似然线性回归 多传感器信息
在线阅读 下载PDF
基于音素解码的语种识别系统联合自适应算法研究 被引量:3
7
作者 邓妍 张卫强 刘加 《自动化学报》 EI CSCD 北大核心 2012年第4期652-658,共7页
针对真实环境下的语种识别,信道类型和通话内容等非语种方面因素的不同都会造成测试和训练条件的不匹配,从而影响系统的识别性能.本文以音素识别器后接向量空间模型(Phone recognizer followed by vectorspace model,PRVSM)为语种识别系... 针对真实环境下的语种识别,信道类型和通话内容等非语种方面因素的不同都会造成测试和训练条件的不匹配,从而影响系统的识别性能.本文以音素识别器后接向量空间模型(Phone recognizer followed by vectorspace model,PRVSM)为语种识别系统,引入联合自适应算法来解决系统中测试和训练条件的失配问题.研究了三种自适应方法用于系统的不同阶段:1)基于受约束的最大似然线性回归(Constr ained maximum likelihood linear regression,CMLLR)的声学模型自适应;2)基于全局N元文法的音位特征向量自适应;3)VSM模型中的支持向量机(Support vector machines,SVM)自适应.在综合采用多种自适应技术后,PRVSM系统的性能有了较大的提高,在NIST LRE 2009测试库上对于30s、10s和3s的测试段,基于不同音素识别器的PRVSM系统的等错误率(Equal errorrate,EER)分别相对降低了18%~23%、12%~20%以及5%~9%. 展开更多
关键词 语种识别 音素识别器后接向量空间模型 联合自适应 受约束的最大似然线性回归 支持向量机自适应
在线阅读 下载PDF
普通话发音错误自动检测技术 被引量:3
8
作者 张峰 黄超 戴礼荣 《中文信息学报》 CSCD 北大核心 2010年第2期110-115,共6页
统计语音识别框架是现在发音错误检测系统的主流框架,而声学模型则是统计语音识别的基础。该文一方面为了获得对于发音错误检测更好的声学模型,引入了说话人自适应训练(SAT)和选择性最大似然线性回归(SMLLR)技术;另一方面,由于字发音检... 统计语音识别框架是现在发音错误检测系统的主流框架,而声学模型则是统计语音识别的基础。该文一方面为了获得对于发音错误检测更好的声学模型,引入了说话人自适应训练(SAT)和选择性最大似然线性回归(SMLLR)技术;另一方面,由于字发音检错中存在严重的信息量不足问题和专家对于不同水平说话人的评价标注不一样,在后端上加入了话者得分归一化技术。在包含40个不同水平说话人的8 000个字的数据库上的实验结果表明,文中提出的方法有效的提高了系统性能,召回率为30%时,正确率从45.8%升到了53.6%,召回率为10%时,正确率从64.6%升到了79.9%。 展开更多
关键词 计算机应用 中文信息处理 发音错误自动检错 说话人自适应训练 选择性最大似然线性回归 话者归 一化
在线阅读 下载PDF
基于模型自适应的声效鲁棒性语音识别算法 被引量:1
9
作者 晁浩 宋成 +1 位作者 薛霄 刘志中 《计算机工程与应用》 CSCD 北大核心 2016年第2期156-160,204,共6页
针对声音效果变化引起的语音声学特性的改变,提出基于声学模型自适应的方法。分析了正常模式下训练的声学模型在识别其他声效模式下语音的表现;根据随机段模型的模型特性,将最大似然线性回归方法引入到随机段模型系统中,并利用自适应后... 针对声音效果变化引起的语音声学特性的改变,提出基于声学模型自适应的方法。分析了正常模式下训练的声学模型在识别其他声效模式下语音的表现;根据随机段模型的模型特性,将最大似然线性回归方法引入到随机段模型系统中,并利用自适应后的声学模型来识别对应的声效模式下的语音。在"863-test"测试集上进行的汉语连续语音识别实验显示,正常模式下训练的声学模型识别其他四种声效模式下的语音时,识别精度均有较大程度的下降;而自适应后的系统在识别对应的声效模式的语音时,识别精度有了明显的改观。表明了基于声学模型自适应的方法在解决语音识别中声音效果变化问题上的有效性。 展开更多
关键词 语音识别 声音效果 自适应 最大似然线性回归
在线阅读 下载PDF
使用无监督网络MLLR自适应改进算法的语音识别
10
作者 潘复平 赵庆卫 颜永红 《数据采集与处理》 CSCD 北大核心 2007年第1期8-13,共6页
介绍了一种基于词网的最大似然线性回归(Lattice-MLLR)无监督自适应算法,并进行了改进。Lattice-MLLR是根据解码得到的词网估计MLLR变换参数,词网的潜在误识率远小于识别结果,因此可以使参数估计更为准确。Lattice-MLLR的一个很大缺点... 介绍了一种基于词网的最大似然线性回归(Lattice-MLLR)无监督自适应算法,并进行了改进。Lattice-MLLR是根据解码得到的词网估计MLLR变换参数,词网的潜在误识率远小于识别结果,因此可以使参数估计更为准确。Lattice-MLLR的一个很大缺点是计算量极大,较难实用,对此本文提出了两个改进技术:(1)利用后验概率压缩词网;(2)利用单词的时间信息限制状态统计量的计算范围。实验测定Lattice-MLLR的误识率比传统MLLR相对下降了3.5%,改进技术使Lattice-MLLR计算量下降幅度超过了87.9%。 展开更多
关键词 语音识别 无监督自适应 最大似然线性回归 词网 后验概率
在线阅读 下载PDF
基于音频事件检测和分类的音频监控系统背景模型自适应方法研究 被引量:1
11
作者 张爱英 倪崇嘉 《计算机科学》 CSCD 北大核心 2016年第9期310-314,共5页
随着监控系统中音频传感器应用的与日俱增,音频事件检测与分类已成为一个重要的研究课题。音频系统所处的音频环境(不同场所、不同噪声)非常复杂,以致检测与分类音频事件异常困难。因此,进行背景模型自适应从而适应不断变化的音频环境... 随着监控系统中音频传感器应用的与日俱增,音频事件检测与分类已成为一个重要的研究课题。音频系统所处的音频环境(不同场所、不同噪声)非常复杂,以致检测与分类音频事件异常困难。因此,进行背景模型自适应从而适应不断变化的音频环境变得十分重要。提出了利用受限的最大似然线性回归方法对背景模型进行自适应。采用实际监控场景中的音频数据和模拟录制数据,研究了背景模型自适应方法以及如何有效地进行背景模型自适应。实验结果表明背景模型自适应可以提高目标声音事件的检测性能,减少系统误报。 展开更多
关键词 音频事件检测与分类 背景模型自适应 受限的最大似然线性回归 监控系统
在线阅读 下载PDF
基于数据生成的手语识别自适应方法
12
作者 周宇 陈熙霖 +2 位作者 赵德斌 姚鸿勋 高文 《高技术通讯》 EI CAS CSCD 北大核心 2009年第12期1258-1264,共7页
采用自适应技术来解决非特定人手语识别问题,提出了一种基于数据生成的手语识别自适应方法。首先,对非特定人模型的均值向量进行自动聚类,寻找聚类中心生成手语词码本,然后,根据此码本选择词根子集,该子集能覆盖手语词码本的所有码字,继... 采用自适应技术来解决非特定人手语识别问题,提出了一种基于数据生成的手语识别自适应方法。首先,对非特定人模型的均值向量进行自动聚类,寻找聚类中心生成手语词码本,然后,根据此码本选择词根子集,该子集能覆盖手语词码本的所有码字,继而,使用新用户的词根子集数据通过遗传算法生成其它词根的数据,最后,结合词根子集的真实数据和其它词根的生成数据,利用最大似然线性回归(MLLR)和最大后验概率(MAP)算法对非特定人模型进行自适应。实验结果表明,该方法既能够降低所需要的自适应数据量,又能够在非特定人模型基础上取得识别正确率的大幅提高。 展开更多
关键词 手语识别 自适应 最大似然线性回归(MLLR) 最大后验概率(MAP) 遗传算法
在线阅读 下载PDF
普通话发音检错系统中TANDEM方法的研究与实现
13
作者 龚澍 魏思 +1 位作者 胡国平 刘庆峰 《计算机应用与软件》 CSCD 2011年第7期233-236,共4页
语音识别中常用的HMM/GMM框架由于训练准则和算法的限制,对模式的辨识能力较差;另一种HMM/ANN框架虽具有极强的模式分类能力,但缺乏成熟有效的优化手段。将一种综合两者优点的TANDEM方法应用到普通话发音检错系统中,通过使用区分性训练... 语音识别中常用的HMM/GMM框架由于训练准则和算法的限制,对模式的辨识能力较差;另一种HMM/ANN框架虽具有极强的模式分类能力,但缺乏成熟有效的优化手段。将一种综合两者优点的TANDEM方法应用到普通话发音检错系统中,通过使用区分性训练的神经网络去估计音素级后验概率,经过一系列后续处理将原始MFCC特征转化为TANDEM特征,作为基于HMM统计模型的发音检错系统的输入,进而完成评测过程。实验结果证明,TANDEM方法使系统的检错性能有了较大的提升,结合MLLR等自适应方法的使用效果会更为明显。 展开更多
关键词 语音识别评测 发音检错 TANDEM 多层感知器 最大似然线性回归
在线阅读 下载PDF
MLLR和MAP在远场噪声混响下的语音识别研究 被引量:7
14
作者 娄英丹 徐静林 +1 位作者 黄丽霞 张雪英 《计算机工程与应用》 CSCD 北大核心 2020年第10期122-126,共5页
自适应技术可以用较少的数据来调整声学模型参数,从而达到较好的语音识别效果,它们大多用于自适应有口音的语音。将最大似然线性回归(Maximum Likelihood Linear Regression,MLLR)、最大后验概率(Maximum A Posteriori,MAP)自适应技术... 自适应技术可以用较少的数据来调整声学模型参数,从而达到较好的语音识别效果,它们大多用于自适应有口音的语音。将最大似然线性回归(Maximum Likelihood Linear Regression,MLLR)、最大后验概率(Maximum A Posteriori,MAP)自适应技术用在远场噪声混响环境下来分析其在此环境下的识别性能。实验结果表明,仿真条件下,在墙壁反射系数为0.6,各种噪声环境下MAP有最好的自适应性能,在信噪比(Signal-to-Noise Ratio,SNR)分别为5 dB、10 dB、15 dB时,MAP使远场连续语音词错率(Word Error Rate,WER)平均降低了1.51%、12.82%、2.95%。真实条件下,MAP使WER下降幅度最大达到了37.13%。进一步验证了MAP良好的渐进性,且当自适应句数为1 000时,用MAP声学模型自适应方法得到的远场噪声混响连续语音的识别词错率比自适应前平均降低了12.5%。 展开更多
关键词 最大似然线性回归(MLLR) 最大后验概率(MAP) 环境自适应 远场语音识别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部