期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
LVCSR系统中一种基于区分性和自适应瓶颈深度置信网络的特征提取方法
被引量:
9
1
作者
陈雷
杨俊安
+1 位作者
王一
王龙
《信号处理》
CSCD
北大核心
2015年第3期290-298,共9页
大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升瓶颈深度置信网络的识别准确率,本文提出一种基于区分性和自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进...
大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升瓶颈深度置信网络的识别准确率,本文提出一种基于区分性和自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进行区分性训练,使网络的区分性更强、识别准确率更高,在此基础上引入说话人自适应技术对网络进行调整,提高系统的鲁棒性。本文利用提出的声学特征在多个噪声较强、主题风格较为随意的多个公共连续语音数据库上进行了测试,识别准确率取得了6.9!的提升。实验结果表明所提出的特征提取方法相对于传统方法的优越性。
展开更多
关键词
连续语音识别
瓶颈深度置信网络
区分性训练
说话人自适应
在线阅读
下载PDF
职称材料
普通话发音错误自动检测技术
被引量:
3
2
作者
张峰
黄超
戴礼荣
《中文信息学报》
CSCD
北大核心
2010年第2期110-115,共6页
统计语音识别框架是现在发音错误检测系统的主流框架,而声学模型则是统计语音识别的基础。该文一方面为了获得对于发音错误检测更好的声学模型,引入了说话人自适应训练(SAT)和选择性最大似然线性回归(SMLLR)技术;另一方面,由于字发音检...
统计语音识别框架是现在发音错误检测系统的主流框架,而声学模型则是统计语音识别的基础。该文一方面为了获得对于发音错误检测更好的声学模型,引入了说话人自适应训练(SAT)和选择性最大似然线性回归(SMLLR)技术;另一方面,由于字发音检错中存在严重的信息量不足问题和专家对于不同水平说话人的评价标注不一样,在后端上加入了话者得分归一化技术。在包含40个不同水平说话人的8 000个字的数据库上的实验结果表明,文中提出的方法有效的提高了系统性能,召回率为30%时,正确率从45.8%升到了53.6%,召回率为10%时,正确率从64.6%升到了79.9%。
展开更多
关键词
计算机应用
中文信息处理
发音错误自动检错
说话人自适应训练
选择性最大似然线性回归
话者归
一化
在线阅读
下载PDF
职称材料
一种改进的音段声码器编码方法
被引量:
2
3
作者
邓昊
李双田
成少锋
《信号处理》
CSCD
2003年第5期448-452,共5页
本文以一种定速率音段声码器采用的分段算法为基础,提出了一种以随机码本作为初始码本结合“联合分段量化法”的码本训练方法,改进了基音轨迹的表示方法,并验证了一种说话人自适应方法的效果。
关键词
音段声码器
分段算法
编码方法
甚速率语音编码算法
基音轨迹
在线阅读
下载PDF
职称材料
应用MAP方差估计的话者自适应训练方法
4
作者
黄盈椿
王欢良
冯涛
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第20期203-204,212,共3页
近年来话者自适应训练(SAT)方法日益受到重视。然而在实际中此方法通常因为部分方差的估计失误而导致识别性能下降。该文提出了一种应用最大后验概率(MAP)估计方差的全新SAT方法,它能够根据后验概率动态地调整模型的方差,从而解决上述...
近年来话者自适应训练(SAT)方法日益受到重视。然而在实际中此方法通常因为部分方差的估计失误而导致识别性能下降。该文提出了一种应用最大后验概率(MAP)估计方差的全新SAT方法,它能够根据后验概率动态地调整模型的方差,从而解决上述问题。在Switchboard数据库上的实验显示,新方法能够显著地提高识别性能,并且有效地提升系统的稳定性。
展开更多
关键词
语音识别
话者自适应
话者自适应训练
MAP
在线阅读
下载PDF
职称材料
一种适用于远程电话音识别的自适应建模方法(英文)
5
作者
陈大为
吴朝晖
杨莹春
《广西师范大学学报(自然科学版)》
CAS
2003年第A01期185-190,共6页
在大多数的说话人识别系统中,需要首先建立一个说话人无关的模型,这种模型成为全局模型.然后在实际应用中,采取某种自适应的算法来修改此模型.采取这种说话人无关模型的一个不利之处在于性能会随着应用环境和训练环境差异的增大而大幅...
在大多数的说话人识别系统中,需要首先建立一个说话人无关的模型,这种模型成为全局模型.然后在实际应用中,采取某种自适应的算法来修改此模型.采取这种说话人无关模型的一个不利之处在于性能会随着应用环境和训练环境差异的增大而大幅度降低.为了修补这种差异,就需要较长的训练时间,使得这种方法不利于比较实时的应用,比如通过电话进行远程说话人识别,在这种情况中需要较快的响应速度.本文中提出了一个利用全局模型并能适用于远程说话人识别的方法.基本思路就是在进行识别时利用以前的模型,然后再系统空闲时采取了一个改进的自适应算法快速重建全局模型.试验结果证明了这种方法是可行的.
展开更多
关键词
说话人识别
自适应建模
训练
在线阅读
下载PDF
职称材料
题名
LVCSR系统中一种基于区分性和自适应瓶颈深度置信网络的特征提取方法
被引量:
9
1
作者
陈雷
杨俊安
王一
王龙
机构
电子工程学院
电子制约技术安徽省重点实验室
出处
《信号处理》
CSCD
北大核心
2015年第3期290-298,共9页
基金
国家自然科学基金(60872113)
文摘
大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升瓶颈深度置信网络的识别准确率,本文提出一种基于区分性和自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进行区分性训练,使网络的区分性更强、识别准确率更高,在此基础上引入说话人自适应技术对网络进行调整,提高系统的鲁棒性。本文利用提出的声学特征在多个噪声较强、主题风格较为随意的多个公共连续语音数据库上进行了测试,识别准确率取得了6.9!的提升。实验结果表明所提出的特征提取方法相对于传统方法的优越性。
关键词
连续语音识别
瓶颈深度置信网络
区分性训练
说话人自适应
Keywords
continuous speech recognition
bottleneck deep belief network
discriminative
training
speaker
adapt
ation
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
普通话发音错误自动检测技术
被引量:
3
2
作者
张峰
黄超
戴礼荣
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
微软亚洲研究院
出处
《中文信息学报》
CSCD
北大核心
2010年第2期110-115,共6页
文摘
统计语音识别框架是现在发音错误检测系统的主流框架,而声学模型则是统计语音识别的基础。该文一方面为了获得对于发音错误检测更好的声学模型,引入了说话人自适应训练(SAT)和选择性最大似然线性回归(SMLLR)技术;另一方面,由于字发音检错中存在严重的信息量不足问题和专家对于不同水平说话人的评价标注不一样,在后端上加入了话者得分归一化技术。在包含40个不同水平说话人的8 000个字的数据库上的实验结果表明,文中提出的方法有效的提高了系统性能,召回率为30%时,正确率从45.8%升到了53.6%,召回率为10%时,正确率从64.6%升到了79.9%。
关键词
计算机应用
中文信息处理
发音错误自动检错
说话人自适应训练
选择性最大似然线性回归
话者归
一化
Keywords
computer application
Chinese information processing
Automatic mispronunciation detection
speaker adaptive training (sat)
Selective Maximum Likelihood Linear Regression (SMLLR)
speaker
normalization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种改进的音段声码器编码方法
被引量:
2
3
作者
邓昊
李双田
成少锋
机构
中国科学院声学研究所
出处
《信号处理》
CSCD
2003年第5期448-452,共5页
基金
中国科学院声学研究所知识创新工程前瞻项目基金
文摘
本文以一种定速率音段声码器采用的分段算法为基础,提出了一种以随机码本作为初始码本结合“联合分段量化法”的码本训练方法,改进了基音轨迹的表示方法,并验证了一种说话人自适应方法的效果。
关键词
音段声码器
分段算法
编码方法
甚速率语音编码算法
基音轨迹
Keywords
very low-bit-rate speech coding
segment vocoder
codebook
training
method
speaker
adapt
ation
分类号
TN912.32 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
应用MAP方差估计的话者自适应训练方法
4
作者
黄盈椿
王欢良
冯涛
机构
中国科学院电子学研究所
哈尔滨工业大学计算机科学与技术学院
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第20期203-204,212,共3页
文摘
近年来话者自适应训练(SAT)方法日益受到重视。然而在实际中此方法通常因为部分方差的估计失误而导致识别性能下降。该文提出了一种应用最大后验概率(MAP)估计方差的全新SAT方法,它能够根据后验概率动态地调整模型的方差,从而解决上述问题。在Switchboard数据库上的实验显示,新方法能够显著地提高识别性能,并且有效地提升系统的稳定性。
关键词
语音识别
话者自适应
话者自适应训练
MAP
Keywords
Speech recognition
speaker
adapt
ation
speaker
adaptive
training
(sat
)
Maximum a postefiofi(MAP)
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
TN912.34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
一种适用于远程电话音识别的自适应建模方法(英文)
5
作者
陈大为
吴朝晖
杨莹春
机构
浙江大学计算机系统工程研究所浙大中正嵌入式与生物认证技术联合实验室
出处
《广西师范大学学报(自然科学版)》
CAS
2003年第A01期185-190,共6页
基金
National High Technology Research &Development Programme(863 )of P. R. China(2 0 0 1 AA41 80 )
Zhejiang Provincial Natural Science Foundation for Young Scientist of P. R. China(RC0 1 0 58)
文摘
在大多数的说话人识别系统中,需要首先建立一个说话人无关的模型,这种模型成为全局模型.然后在实际应用中,采取某种自适应的算法来修改此模型.采取这种说话人无关模型的一个不利之处在于性能会随着应用环境和训练环境差异的增大而大幅度降低.为了修补这种差异,就需要较长的训练时间,使得这种方法不利于比较实时的应用,比如通过电话进行远程说话人识别,在这种情况中需要较快的响应速度.本文中提出了一个利用全局模型并能适用于远程说话人识别的方法.基本思路就是在进行识别时利用以前的模型,然后再系统空闲时采取了一个改进的自适应算法快速重建全局模型.试验结果证明了这种方法是可行的.
关键词
说话人识别
自适应建模
训练
Keywords
speaker
verification
adaptive
background model design
training
分类号
TN912.34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
LVCSR系统中一种基于区分性和自适应瓶颈深度置信网络的特征提取方法
陈雷
杨俊安
王一
王龙
《信号处理》
CSCD
北大核心
2015
9
在线阅读
下载PDF
职称材料
2
普通话发音错误自动检测技术
张峰
黄超
戴礼荣
《中文信息学报》
CSCD
北大核心
2010
3
在线阅读
下载PDF
职称材料
3
一种改进的音段声码器编码方法
邓昊
李双田
成少锋
《信号处理》
CSCD
2003
2
在线阅读
下载PDF
职称材料
4
应用MAP方差估计的话者自适应训练方法
黄盈椿
王欢良
冯涛
《计算机工程》
EI
CAS
CSCD
北大核心
2006
0
在线阅读
下载PDF
职称材料
5
一种适用于远程电话音识别的自适应建模方法(英文)
陈大为
吴朝晖
杨莹春
《广西师范大学学报(自然科学版)》
CAS
2003
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部