-
题名基于大数据分析的网络多语言及时翻译系统设计
被引量:8
- 1
-
-
作者
祁伟
牛欢
肖蕾
-
机构
广东技术师范大学
北京外国语大学
-
出处
《现代电子技术》
2021年第22期154-158,共5页
-
基金
广东省自然科学基金项目(2019A1515011376)
广东省科技厅项目(2016A040403122)。
-
文摘
由于网络多语言及时翻译系统受到字符串长度的影响,导致系统的翻译速度变慢且匹配率也比较低。为了提高网络多语言翻译系统在翻译速度和匹配率方面的性能,文中提出一种基于大数据分析的网络多语言及时翻译系统设计。将大数据分析应用到网络多语言及时翻译系统设计中,在大数据分析的基础上,通过网络多语言及时翻译服务器设计和网络多语言词法分析器设计,完成系统的硬件设计;采用特征提取算法实现网络多语言的语义特征的提取,结合设计网络多语言及时翻译算法,完成系统的软件设计。最终实现了网络多语言的及时翻译系统设计。进行仿真测试分析,测试结果表明,基于大数据分析的网络多语言及时翻译系统在翻译速度和匹配率方面性能均具有较好的提升。
-
关键词
网络多语言
及时翻译系统
大数据分析
语义特征提取
系统设计
仿真测试
-
Keywords
network multilingualism
instant translation system
big data analysis
semantic feature exaction
system design
simulation test
-
分类号
TN919-34
[电子电信—通信与信息系统]
-
-
题名基于多语言语音数据选择的资源稀缺蒙语语音识别研究
被引量:1
- 2
-
-
作者
张爱英
-
机构
山东财经大学数学与数量经济学院
-
出处
《计算机科学》
CSCD
北大核心
2018年第9期308-313,共6页
-
基金
国家自然科学基金(61305027)
山东省自然科学基金(ZR2011FQ024)
山东省高等学校科技计划项目(J17KB160)资助
-
文摘
利用多语言信息可以提高资源稀缺语言识别系统的性能。但是,在利用多语言信息提高资源稀缺目标语言识别系统的性能时,并不是所有语言的语音数据对资源稀缺目标语言语音识别系统的性能提高都有帮助。文中提出利用长短时记忆递归神经网络语言辨识方法选择多语言数据以提高资源稀缺目标语言识别系统的性能;选出更加有效的多语言数据用于训练多语言深度神经网络和深度Bottleneck神经网络。通过跨语言迁移学习获得的深度神经网络和通过深度Bottleneck神经网络获得的Bottleneck特征都对提高资源稀缺目标语言语音识别系统的性能有很大的帮助。与基线系统相比,在插值的Web语言模型解码条件下,所提系统的错误率分别有10.5%和11.4%的绝对减少。
-
关键词
数据选择
资源稀缺
多语言深度神经网络
深度Bottleneck神经网络
-
Keywords
Data selection
Low-resource
Multilingual deep neural network
Deep Bottleneck neural network
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名资源稀缺蒙语语音识别研究
被引量:1
- 3
-
-
作者
张爱英
倪崇嘉
-
机构
山东财经大学系统科学与信息处理研究所
-
出处
《计算机科学》
CSCD
北大核心
2017年第10期318-322,共5页
-
基金
国家自然科学基金(61305027)
山东省自然科学基金(ZR2011FQ024)
山东省高等学校科技计划(J17KB160)资助
-
文摘
随着语音识别技术的发展,资源稀缺语言的语音识别系统的研究吸引了更广泛的关注。以蒙语为目标识别语言,研究了在资源稀缺的情况下(如仅有10小时的带标注的语音)如何利用其他多语言信息提高识别系统的性能。借助基于多语言深度神经网络的跨语言迁移学习和基于多语言深度Bottleneck神经网络的抽取特征可以获得更具有区分度的声学模型。通过搜索引擎以及网络爬虫的定向抓取获得大量的网页数据,有助于获得文本数据,以增强语言模型的性能。融合多个不同识别结果以进一步提高识别精度。与基线系统相比,多种系统融合的识别绝对错误率减少12%。
-
关键词
资源稀缺
多语言深度神经网络
Web语言模型
-
Keywords
Low-resource,Mult i l ingual deep neural network, Web based language model
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-