期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
汉语-印尼语平行语料自动对齐方法研究
被引量:
6
1
作者
郑铿涛
林楠铠
+2 位作者
付颖雯
王连喜
蒋盛益
《广西师范大学学报(自然科学版)》
CAS
北大核心
2019年第1期89-97,共9页
双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。本文针对汉语-印尼语平行语料的自动对齐与可比语料的自动提取问题,提出了基于锚点和词典相结合的段落对...
双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。本文针对汉语-印尼语平行语料的自动对齐与可比语料的自动提取问题,提出了基于锚点和词典相结合的段落对齐方法,并在此基础上采用基于置信区间的长度模型实现句子对齐,同时,为了快速提高汉语-印尼语平行语料库的构建效率,还提出了基于跨语言文档相似度的可比语料提取方法。实验结果表明,本文提出的平行语料对齐方法和可比语料提取方法的准确率较传统方法有显著的提高,说明本文提出方法是有效的、可行的。
展开更多
关键词
平行语料
语料库构建
可比语料
段落对齐
句对齐
在线阅读
下载PDF
职称材料
题名
汉语-印尼语平行语料自动对齐方法研究
被引量:
6
1
作者
郑铿涛
林楠铠
付颖雯
王连喜
蒋盛益
机构
广东外语外贸大学
信息科学与技术学院
广州市
非
通用
语种
智能
处理
重点
实验室
(
广东外语外贸大学
)
出处
《广西师范大学学报(自然科学版)》
CAS
北大核心
2019年第1期89-97,共9页
基金
国家自然科学基金(61572145)
国家社会科学基金青年项目(17CTQ045)
+1 种基金
广东省教育厅基础研究重大项目及应用研究重大项目(2017KZDXM031)
2018年广东大学生科技创新培育专项资金(pdjhb0177)
文摘
双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。本文针对汉语-印尼语平行语料的自动对齐与可比语料的自动提取问题,提出了基于锚点和词典相结合的段落对齐方法,并在此基础上采用基于置信区间的长度模型实现句子对齐,同时,为了快速提高汉语-印尼语平行语料库的构建效率,还提出了基于跨语言文档相似度的可比语料提取方法。实验结果表明,本文提出的平行语料对齐方法和可比语料提取方法的准确率较传统方法有显著的提高,说明本文提出方法是有效的、可行的。
关键词
平行语料
语料库构建
可比语料
段落对齐
句对齐
Keywords
parallel corpus
corpus construction
comparable corpus
paragraph alignment
sentence alignment
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
汉语-印尼语平行语料自动对齐方法研究
郑铿涛
林楠铠
付颖雯
王连喜
蒋盛益
《广西师范大学学报(自然科学版)》
CAS
北大核心
2019
6
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部