期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向大语料库的语音合成方法研究 被引量:2
1
作者 于延锁 朱风云 +2 位作者 李先刚 刘翼 吴玺宏 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第5期791-796,共6页
针对几百小时粗标注大语料库,提出一种新颖的语音合成系统构建方法。首先,借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后,为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题... 针对几百小时粗标注大语料库,提出一种新颖的语音合成系统构建方法。首先,借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后,为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题,优化了传统的训练流程,在不损失声学模型准确性的前提下,显著提高了模型的训练速度。主观实验表明,与具有精标注的小语料库相比,引入粗标注的大语料库可以带来0.5分左右的MOS提升。 展开更多
关键词 语音数据筛选 声学模型训练 基于HMM的单元挑选与波形拼接
在线阅读 下载PDF
I-vector聚类字典及注意力机制框架的说话人自适应 被引量:5
2
作者 黄俊 蒋兵 +2 位作者 李先刚 郭武生 戴礼荣 《小型微型计算机系统》 CSCD 北大核心 2019年第2期460-464,共5页
近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提取i-vector需要用到整句话的信息,并不能用于线上的自适应.因此,本文设计了一种基于i-vector聚类字典及注... 近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提取i-vector需要用到整句话的信息,并不能用于线上的自适应.因此,本文设计了一种基于i-vector聚类字典及注意力机制的自适应框架,测试时能够在不提取i-vector和不进行二遍解码的前提下快速实现线上自适应,并且该框架具有灵活性优和可扩展性好的优点,能够方便的用于其他类型的自适应,如地域自适应和性别自适应.在Switchboard任务上,实验结果表明我们提出的框架在不同的声学模型上相对于基线均有性能提升,并且通过说话人识别任务进一步证明了该方法的合理性. 展开更多
关键词 i-vector字典 注意力机制 说话人自适应 语音识别
在线阅读 下载PDF
基于小样本学习的意图识别与槽位填充方法 被引量:2
3
作者 孙相会 苗德强 +5 位作者 窦辰晓 袁龙 马宝昌 邓勇 张露露 李先刚 《中文信息学报》 CSCD 北大核心 2023年第2期119-128,共10页
“意图识别”与“槽位填充”是智能人机交互中的两个核心任务,受到学术界和工业界的广泛关注。目前业界前沿主流的方法,在一些学术公开数据集上已取得了不错的效果。不过这些方法大多依赖于丰富的标注数据集来完成训练,而数据集需要经... “意图识别”与“槽位填充”是智能人机交互中的两个核心任务,受到学术界和工业界的广泛关注。目前业界前沿主流的方法,在一些学术公开数据集上已取得了不错的效果。不过这些方法大多依赖于丰富的标注数据集来完成训练,而数据集需要经过人工采集、标注等流程构造,且需满足其分布的均匀性。然而,真实业务场景下的数据却很难达到以上标准,往往面临小样本学习困难的难题,大多主流方法在小样本学习任务上的表现远不如其在大样本学习上的效果。针对此业界难点,该文提出一种基于半监督学习与迁移学习的“意图识别”与“槽位填充”的串联方法。该方法根据“意图识别”和“槽位填充”的各自任务特性,分别设计了针对性更强的小样本解决思路,即通过半监督学习的思想,在不需引入大量标注数据的情况下,利用无标签数据丰富、构造训练样本集,提高小样本意图识别的准确性;以及通过迁移学习的思想,将从大样本数据中学习到的先验知识迁移到小样本数据模型中,利用大样本数据与小样本数据间的公共知识,提高小样本槽位填充的精准度。该文所提出的方法通过实验对比被证实有效,且在2021年中国计算机学会大数据与计算智能大赛(CCF-BDCI)组委会与中国中文信息学会(CIPS)共同举办的全国信息检索挑战杯(CCIR Cup)的“智能人机交互自然语言理解”赛道取得了第一名的成绩。 展开更多
关键词 小样本学习 半监督 迁移学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部