期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向大语料库的语音合成方法研究
被引量:
2
1
作者
于延锁
朱风云
+2 位作者
李先刚
刘翼
吴玺宏
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2014年第5期791-796,共6页
针对几百小时粗标注大语料库,提出一种新颖的语音合成系统构建方法。首先,借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后,为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题...
针对几百小时粗标注大语料库,提出一种新颖的语音合成系统构建方法。首先,借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后,为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题,优化了传统的训练流程,在不损失声学模型准确性的前提下,显著提高了模型的训练速度。主观实验表明,与具有精标注的小语料库相比,引入粗标注的大语料库可以带来0.5分左右的MOS提升。
展开更多
关键词
语音数据筛选
声学模型训练
基于HMM的单元挑选与波形拼接
在线阅读
下载PDF
职称材料
I-vector聚类字典及注意力机制框架的说话人自适应
被引量:
5
2
作者
黄俊
蒋兵
+2 位作者
李先刚
郭武生
戴礼荣
《小型微型计算机系统》
CSCD
北大核心
2019年第2期460-464,共5页
近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提取i-vector需要用到整句话的信息,并不能用于线上的自适应.因此,本文设计了一种基于i-vector聚类字典及注...
近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提取i-vector需要用到整句话的信息,并不能用于线上的自适应.因此,本文设计了一种基于i-vector聚类字典及注意力机制的自适应框架,测试时能够在不提取i-vector和不进行二遍解码的前提下快速实现线上自适应,并且该框架具有灵活性优和可扩展性好的优点,能够方便的用于其他类型的自适应,如地域自适应和性别自适应.在Switchboard任务上,实验结果表明我们提出的框架在不同的声学模型上相对于基线均有性能提升,并且通过说话人识别任务进一步证明了该方法的合理性.
展开更多
关键词
i-vector字典
注意力机制
说话人自适应
语音识别
在线阅读
下载PDF
职称材料
基于小样本学习的意图识别与槽位填充方法
被引量:
2
3
作者
孙相会
苗德强
+5 位作者
窦辰晓
袁龙
马宝昌
邓勇
张露露
李先刚
《中文信息学报》
CSCD
北大核心
2023年第2期119-128,共10页
“意图识别”与“槽位填充”是智能人机交互中的两个核心任务,受到学术界和工业界的广泛关注。目前业界前沿主流的方法,在一些学术公开数据集上已取得了不错的效果。不过这些方法大多依赖于丰富的标注数据集来完成训练,而数据集需要经...
“意图识别”与“槽位填充”是智能人机交互中的两个核心任务,受到学术界和工业界的广泛关注。目前业界前沿主流的方法,在一些学术公开数据集上已取得了不错的效果。不过这些方法大多依赖于丰富的标注数据集来完成训练,而数据集需要经过人工采集、标注等流程构造,且需满足其分布的均匀性。然而,真实业务场景下的数据却很难达到以上标准,往往面临小样本学习困难的难题,大多主流方法在小样本学习任务上的表现远不如其在大样本学习上的效果。针对此业界难点,该文提出一种基于半监督学习与迁移学习的“意图识别”与“槽位填充”的串联方法。该方法根据“意图识别”和“槽位填充”的各自任务特性,分别设计了针对性更强的小样本解决思路,即通过半监督学习的思想,在不需引入大量标注数据的情况下,利用无标签数据丰富、构造训练样本集,提高小样本意图识别的准确性;以及通过迁移学习的思想,将从大样本数据中学习到的先验知识迁移到小样本数据模型中,利用大样本数据与小样本数据间的公共知识,提高小样本槽位填充的精准度。该文所提出的方法通过实验对比被证实有效,且在2021年中国计算机学会大数据与计算智能大赛(CCF-BDCI)组委会与中国中文信息学会(CIPS)共同举办的全国信息检索挑战杯(CCIR Cup)的“智能人机交互自然语言理解”赛道取得了第一名的成绩。
展开更多
关键词
小样本学习
半监督
迁移学习
在线阅读
下载PDF
职称材料
题名
面向大语料库的语音合成方法研究
被引量:
2
1
作者
于延锁
朱风云
李先刚
刘翼
吴玺宏
机构
北京大学言语听觉研究中心
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2014年第5期791-796,共6页
基金
国家自然科学基金(91120001
61121002)
+1 种基金
国家社会科学基金重大项目(12&ZD119)
国家重点基础研究发展计划(2013CB329304)资助
文摘
针对几百小时粗标注大语料库,提出一种新颖的语音合成系统构建方法。首先,借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后,为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题,优化了传统的训练流程,在不损失声学模型准确性的前提下,显著提高了模型的训练速度。主观实验表明,与具有精标注的小语料库相比,引入粗标注的大语料库可以带来0.5分左右的MOS提升。
关键词
语音数据筛选
声学模型训练
基于HMM的单元挑选与波形拼接
Keywords
speech data selection
acoustic model training
HMM-based unit selection and waveformconcatenation
分类号
TN912.3 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
I-vector聚类字典及注意力机制框架的说话人自适应
被引量:
5
2
作者
黄俊
蒋兵
李先刚
郭武生
戴礼荣
机构
中国科学技术大学语音与语言信息处理国家工程实验室
百度在线网络技术(北京)有限公司语音技术部
安徽广行贝尔数码科技有限责任公司
出处
《小型微型计算机系统》
CSCD
北大核心
2019年第2期460-464,共5页
基金
国家重点研发计划项目(2017YFB1002200)资助
文摘
近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提取i-vector需要用到整句话的信息,并不能用于线上的自适应.因此,本文设计了一种基于i-vector聚类字典及注意力机制的自适应框架,测试时能够在不提取i-vector和不进行二遍解码的前提下快速实现线上自适应,并且该框架具有灵活性优和可扩展性好的优点,能够方便的用于其他类型的自适应,如地域自适应和性别自适应.在Switchboard任务上,实验结果表明我们提出的框架在不同的声学模型上相对于基线均有性能提升,并且通过说话人识别任务进一步证明了该方法的合理性.
关键词
i-vector字典
注意力机制
说话人自适应
语音识别
Keywords
i-vector dictionary
attention mechanism
speaker adaptation
speech recognition
分类号
TN912.34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
基于小样本学习的意图识别与槽位填充方法
被引量:
2
3
作者
孙相会
苗德强
窦辰晓
袁龙
马宝昌
邓勇
张露露
李先刚
机构
贝壳找房人工智能技术中心
南京理工大学计算机科学与工程学院
出处
《中文信息学报》
CSCD
北大核心
2023年第2期119-128,共10页
基金
国家自然科学基金(61902184)
江苏省自然科学基金(BK20190453)。
文摘
“意图识别”与“槽位填充”是智能人机交互中的两个核心任务,受到学术界和工业界的广泛关注。目前业界前沿主流的方法,在一些学术公开数据集上已取得了不错的效果。不过这些方法大多依赖于丰富的标注数据集来完成训练,而数据集需要经过人工采集、标注等流程构造,且需满足其分布的均匀性。然而,真实业务场景下的数据却很难达到以上标准,往往面临小样本学习困难的难题,大多主流方法在小样本学习任务上的表现远不如其在大样本学习上的效果。针对此业界难点,该文提出一种基于半监督学习与迁移学习的“意图识别”与“槽位填充”的串联方法。该方法根据“意图识别”和“槽位填充”的各自任务特性,分别设计了针对性更强的小样本解决思路,即通过半监督学习的思想,在不需引入大量标注数据的情况下,利用无标签数据丰富、构造训练样本集,提高小样本意图识别的准确性;以及通过迁移学习的思想,将从大样本数据中学习到的先验知识迁移到小样本数据模型中,利用大样本数据与小样本数据间的公共知识,提高小样本槽位填充的精准度。该文所提出的方法通过实验对比被证实有效,且在2021年中国计算机学会大数据与计算智能大赛(CCF-BDCI)组委会与中国中文信息学会(CIPS)共同举办的全国信息检索挑战杯(CCIR Cup)的“智能人机交互自然语言理解”赛道取得了第一名的成绩。
关键词
小样本学习
半监督
迁移学习
Keywords
few-shot learning
semi-supervised learning
transfer learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向大语料库的语音合成方法研究
于延锁
朱风云
李先刚
刘翼
吴玺宏
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2014
2
在线阅读
下载PDF
职称材料
2
I-vector聚类字典及注意力机制框架的说话人自适应
黄俊
蒋兵
李先刚
郭武生
戴礼荣
《小型微型计算机系统》
CSCD
北大核心
2019
5
在线阅读
下载PDF
职称材料
3
基于小样本学习的意图识别与槽位填充方法
孙相会
苗德强
窦辰晓
袁龙
马宝昌
邓勇
张露露
李先刚
《中文信息学报》
CSCD
北大核心
2023
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部