期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
LVCSR系统中一种基于区分性和自适应瓶颈深度置信网络的特征提取方法 被引量:9
1
作者 陈雷 杨俊安 +1 位作者 王一 王龙 《信号处理》 CSCD 北大核心 2015年第3期290-298,共9页
大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升瓶颈深度置信网络的识别准确率,本文提出一种基于区分性和自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进... 大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升瓶颈深度置信网络的识别准确率,本文提出一种基于区分性和自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进行区分性训练,使网络的区分性更强、识别准确率更高,在此基础上引入说话人自适应技术对网络进行调整,提高系统的鲁棒性。本文利用提出的声学特征在多个噪声较强、主题风格较为随意的多个公共连续语音数据库上进行了测试,识别准确率取得了6.9!的提升。实验结果表明所提出的特征提取方法相对于传统方法的优越性。 展开更多
关键词 连续语音识别 瓶颈深度置信网络 区分性训练 说话人自适应
在线阅读 下载PDF
普通话发音错误自动检测技术 被引量:3
2
作者 张峰 黄超 戴礼荣 《中文信息学报》 CSCD 北大核心 2010年第2期110-115,共6页
统计语音识别框架是现在发音错误检测系统的主流框架,而声学模型则是统计语音识别的基础。该文一方面为了获得对于发音错误检测更好的声学模型,引入了说话人自适应训练(SAT)和选择性最大似然线性回归(SMLLR)技术;另一方面,由于字发音检... 统计语音识别框架是现在发音错误检测系统的主流框架,而声学模型则是统计语音识别的基础。该文一方面为了获得对于发音错误检测更好的声学模型,引入了说话人自适应训练(SAT)和选择性最大似然线性回归(SMLLR)技术;另一方面,由于字发音检错中存在严重的信息量不足问题和专家对于不同水平说话人的评价标注不一样,在后端上加入了话者得分归一化技术。在包含40个不同水平说话人的8 000个字的数据库上的实验结果表明,文中提出的方法有效的提高了系统性能,召回率为30%时,正确率从45.8%升到了53.6%,召回率为10%时,正确率从64.6%升到了79.9%。 展开更多
关键词 计算机应用 中文信息处理 发音错误自动检错 说话人自适应训练 选择性最大似然线性回归 话者归 一化
在线阅读 下载PDF
一种改进的音段声码器编码方法 被引量:2
3
作者 邓昊 李双田 成少锋 《信号处理》 CSCD 2003年第5期448-452,共5页
本文以一种定速率音段声码器采用的分段算法为基础,提出了一种以随机码本作为初始码本结合“联合分段量化法”的码本训练方法,改进了基音轨迹的表示方法,并验证了一种说话人自适应方法的效果。
关键词 音段声码器 分段算法 编码方法 甚速率语音编码算法 基音轨迹
在线阅读 下载PDF
应用MAP方差估计的话者自适应训练方法
4
作者 黄盈椿 王欢良 冯涛 《计算机工程》 EI CAS CSCD 北大核心 2006年第20期203-204,212,共3页
近年来话者自适应训练(SAT)方法日益受到重视。然而在实际中此方法通常因为部分方差的估计失误而导致识别性能下降。该文提出了一种应用最大后验概率(MAP)估计方差的全新SAT方法,它能够根据后验概率动态地调整模型的方差,从而解决上述... 近年来话者自适应训练(SAT)方法日益受到重视。然而在实际中此方法通常因为部分方差的估计失误而导致识别性能下降。该文提出了一种应用最大后验概率(MAP)估计方差的全新SAT方法,它能够根据后验概率动态地调整模型的方差,从而解决上述问题。在Switchboard数据库上的实验显示,新方法能够显著地提高识别性能,并且有效地提升系统的稳定性。 展开更多
关键词 语音识别 话者自适应 话者自适应训练 MAP
在线阅读 下载PDF
一种适用于远程电话音识别的自适应建模方法(英文)
5
作者 陈大为 吴朝晖 杨莹春 《广西师范大学学报(自然科学版)》 CAS 2003年第A01期185-190,共6页
在大多数的说话人识别系统中,需要首先建立一个说话人无关的模型,这种模型成为全局模型.然后在实际应用中,采取某种自适应的算法来修改此模型.采取这种说话人无关模型的一个不利之处在于性能会随着应用环境和训练环境差异的增大而大幅... 在大多数的说话人识别系统中,需要首先建立一个说话人无关的模型,这种模型成为全局模型.然后在实际应用中,采取某种自适应的算法来修改此模型.采取这种说话人无关模型的一个不利之处在于性能会随着应用环境和训练环境差异的增大而大幅度降低.为了修补这种差异,就需要较长的训练时间,使得这种方法不利于比较实时的应用,比如通过电话进行远程说话人识别,在这种情况中需要较快的响应速度.本文中提出了一个利用全局模型并能适用于远程说话人识别的方法.基本思路就是在进行识别时利用以前的模型,然后再系统空闲时采取了一个改进的自适应算法快速重建全局模型.试验结果证明了这种方法是可行的. 展开更多
关键词 说话人识别 自适应建模 训练
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部