期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
端到端语音到语音翻译的优化方法综述
1
作者
宗伟
赵悦
+1 位作者
李尹
徐晓娜
《计算机应用》
北大核心
2025年第5期1363-1371,共9页
语音到语音翻译(S2ST)是智能语音领域中新兴的研究方向,旨在将一种语言的语音准确翻译成另一种语言的语音。随着人们对跨语言交流需求的增加,S2ST受到广泛的关注,相关研究也不断涌现。传统的级联模型在S2ST过程中存在诸多问题,如错误传...
语音到语音翻译(S2ST)是智能语音领域中新兴的研究方向,旨在将一种语言的语音准确翻译成另一种语言的语音。随着人们对跨语言交流需求的增加,S2ST受到广泛的关注,相关研究也不断涌现。传统的级联模型在S2ST过程中存在诸多问题,如错误传播、推理延迟和无法翻译无文字系统的语言等,因此如何通过端到端模型实现直接S2ST成为当前研究的重点。在全面调查端到端S2ST的基础上,详细分析和归纳了端到端S2ST的各种模型,综述了已有的相关技术,将端到端S2ST面临的挑战总结为建模负担、数据稀缺和现实应用三类问题,并重点探讨了现有工作是如何解决这三类问题的。大语言模型(LLM)强大的理解和生成能力为S2ST提供了新的可能性,同时也带来了更多的挑战。因此,讨论了LLM在S2ST中的应用,并设想了未来可能的发展方向。
展开更多
关键词
端到
端
语音
到
语音
翻译
建模负担
数据稀缺
现实应用
语音
基石模型
在线阅读
下载PDF
职称材料
基于多层次预训练策略和多任务学习的端到端蒙汉语音翻译
2
作者
王宁宁
飞龙
张晖
《中文信息学报》
CSCD
北大核心
2024年第10期71-79,共9页
端到端语音翻译将源语言语音直接翻译为目标语言文本,其需要“源语言语音-目标语言文本”作为训练数据,然而这类数据极其稀缺,该文提出了一种多层次预训练策略和多任务学习相结合的训练方法,首先分别对语音识别和机器翻译模型的各个模...
端到端语音翻译将源语言语音直接翻译为目标语言文本,其需要“源语言语音-目标语言文本”作为训练数据,然而这类数据极其稀缺,该文提出了一种多层次预训练策略和多任务学习相结合的训练方法,首先分别对语音识别和机器翻译模型的各个模块进行多层次预训练,接着将语音识别和机器翻译模型连接起来构成语音翻译模型,然后使用迁移学习对预训练好的模型进行多步骤微调,在此过程中又运用多任务学习的方法,将语音识别作为语音翻译的一个辅助任务来组织训练,充分利用了已经存在的各种不同形式的数据来训练端到端模型,首次将端到端技术应用于资源受限条件下的蒙汉语音翻译,构建了首个翻译质量较高、实际可用的端到端蒙汉语音翻译系统。
展开更多
关键词
蒙古语
端到端语音翻译
预训练
多任务学习
在线阅读
下载PDF
职称材料
题名
端到端语音到语音翻译的优化方法综述
1
作者
宗伟
赵悦
李尹
徐晓娜
机构
民族语言智能分析与安全治理教育部重点实验室(中央民族大学)
中央民族大学信息工程学院
出处
《计算机应用》
北大核心
2025年第5期1363-1371,共9页
基金
国家自然科学基金资助项目(61976236)。
文摘
语音到语音翻译(S2ST)是智能语音领域中新兴的研究方向,旨在将一种语言的语音准确翻译成另一种语言的语音。随着人们对跨语言交流需求的增加,S2ST受到广泛的关注,相关研究也不断涌现。传统的级联模型在S2ST过程中存在诸多问题,如错误传播、推理延迟和无法翻译无文字系统的语言等,因此如何通过端到端模型实现直接S2ST成为当前研究的重点。在全面调查端到端S2ST的基础上,详细分析和归纳了端到端S2ST的各种模型,综述了已有的相关技术,将端到端S2ST面临的挑战总结为建模负担、数据稀缺和现实应用三类问题,并重点探讨了现有工作是如何解决这三类问题的。大语言模型(LLM)强大的理解和生成能力为S2ST提供了新的可能性,同时也带来了更多的挑战。因此,讨论了LLM在S2ST中的应用,并设想了未来可能的发展方向。
关键词
端到
端
语音
到
语音
翻译
建模负担
数据稀缺
现实应用
语音
基石模型
Keywords
end-to-end Speech-to-Speech Translation(S2ST)
modeling burden
data scarcity
real-world application
speech foundation model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于多层次预训练策略和多任务学习的端到端蒙汉语音翻译
2
作者
王宁宁
飞龙
张晖
机构
内蒙古大学计算机学院
出处
《中文信息学报》
CSCD
北大核心
2024年第10期71-79,共9页
基金
国家自然科学基金(62066033)
内蒙古自然科学基金杰出青年基金(2022JQ05)
+2 种基金
内蒙古自治区科技计划项目(2021GG0158)
呼和浩特市高校院所协同创新项目、内蒙古大学青年科技英才培育项目(21221505)
支持地方高校改革发展资金(学科建设)、内蒙古自治区一流学科科研专项项目(YLXKZX-ND-036)。
文摘
端到端语音翻译将源语言语音直接翻译为目标语言文本,其需要“源语言语音-目标语言文本”作为训练数据,然而这类数据极其稀缺,该文提出了一种多层次预训练策略和多任务学习相结合的训练方法,首先分别对语音识别和机器翻译模型的各个模块进行多层次预训练,接着将语音识别和机器翻译模型连接起来构成语音翻译模型,然后使用迁移学习对预训练好的模型进行多步骤微调,在此过程中又运用多任务学习的方法,将语音识别作为语音翻译的一个辅助任务来组织训练,充分利用了已经存在的各种不同形式的数据来训练端到端模型,首次将端到端技术应用于资源受限条件下的蒙汉语音翻译,构建了首个翻译质量较高、实际可用的端到端蒙汉语音翻译系统。
关键词
蒙古语
端到端语音翻译
预训练
多任务学习
Keywords
Mongolian
end-to-end speech translation
pre-training
multi-task learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
端到端语音到语音翻译的优化方法综述
宗伟
赵悦
李尹
徐晓娜
《计算机应用》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
基于多层次预训练策略和多任务学习的端到端蒙汉语音翻译
王宁宁
飞龙
张晖
《中文信息学报》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部