期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于树到串模型强化的层次短语机器翻译解码方法
被引量:
5
1
作者
肖桐
朱靖波
《计算机学报》
EI
CSCD
北大核心
2016年第4期808-821,共14页
文中研究了利用树到串模型对层次短语模型进行强化的统计机器翻译解码方法.其基本框架是把层次短语模型作为基础模型,而把树到串模型作为层次短语模型的补充,增加翻译推导空间大小.文中重点研究了在该框架下的统计机器翻译解码技术,并...
文中研究了利用树到串模型对层次短语模型进行强化的统计机器翻译解码方法.其基本框架是把层次短语模型作为基础模型,而把树到串模型作为层次短语模型的补充,增加翻译推导空间大小.文中重点研究了在该框架下的统计机器翻译解码技术,并提出了多种解码策略,包括基于树的精确解码策略、基于树的模糊解码策略和基于串的解码策略.通过NIST汉英翻译任务上的实验结果显示,文中所研究的方法可以十分有效地提升基线层次短语系统的翻译性能,比如在newswire和web数据上分别提高了1.3和1.2个BLEU点.此外,文中分析了若干影响翻译性能的因素,并给出了对比实验结果.
展开更多
关键词
统计机器翻译
层次短语模型
树到串
模型
规则抽取
解码
社会媒体
社交网络
自然语言处理
机器翻译
在线阅读
下载PDF
职称材料
层次短语翻译模型的介词短语调序
被引量:
3
2
作者
冯洋
张冬冬
刘群
《中文信息学报》
CSCD
北大核心
2012年第1期31-36,共6页
在不同的语言中,句法成分的相对位置往往不同,介词短语表现尤为明显,因此正确的对介词短语进行调序对提高翻译质量至关重要。层次短语模型借助于形式语法规则,具有较强的处理长距离调序的能力,但是其并不对短语的句法成分进行区分,这会...
在不同的语言中,句法成分的相对位置往往不同,介词短语表现尤为明显,因此正确的对介词短语进行调序对提高翻译质量至关重要。层次短语模型借助于形式语法规则,具有较强的处理长距离调序的能力,但是其并不对短语的句法成分进行区分,这会导致规则的使用不当,从而引起翻译错误。该文在层次短语模型的基础上,针对介词短语进行处理。首先利用条件随机场模型识别出介词短语,然后抽取出带有介词短语的规则,构建一个新的同步上下文无关文法。解码的时候,在这个同步上下文无关文法定义的空间里搜索找到最优的译文。相对于层次短语模型,该方法在我们内部的英汉数据集上调高了0.8个BLEU百分点,在NIST 2008英汉翻译数据集上提高了0.5个BLEU百分点。
展开更多
关键词
统计机器翻译
层次短语模型
介词
短语
调序
条件随机场
在线阅读
下载PDF
职称材料
利用依存限制抽取长距离调序规则
3
作者
涂兆鹏
刘群
林守勋
《中文信息学报》
CSCD
北大核心
2011年第2期55-60,共6页
长距离调序是统计机器翻译领域的一个重要问题。层次短语模型提供了一个很好的解决方案,它使用层次短语规则可以很好地表示局部调序和长距离调序。但是,使用传统的算法抽取长距离层次规则将会导致规则表数量急剧增加,从而加大解码内存...
长距离调序是统计机器翻译领域的一个重要问题。层次短语模型提供了一个很好的解决方案,它使用层次短语规则可以很好地表示局部调序和长距离调序。但是,使用传统的算法抽取长距离层次规则将会导致规则表数量急剧增加,从而加大解码内存和时间消耗。为了解决这个问题,该文提出了一种利用依存限制抽取长距离调序规则的新方法。实验表明,该文的方法可以比基准系统高出0.74个BLEU点。
展开更多
关键词
统计机器翻译
层次短语模型
长距离调序
依存限制
在线阅读
下载PDF
职称材料
维吾尔语词尾对汉维统计机器翻译影响的研究
被引量:
8
4
作者
米莉万.雪合来提
麦热哈巴.艾力
+1 位作者
吐尔根.依布拉音
姜文斌
《计算机工程》
CAS
CSCD
2014年第3期224-227,共4页
维吾尔语属于阿尔泰语系,是典型的黏着语,构形词尾在维吾尔语中占很重要的地位,这与汉语差别很大。针对维吾尔语的形态特点,分析汉维统计机器翻译中维吾尔语构形词尾的作用,利用Cherio搭建一个基于层次短语的汉维统计机器翻译系统。使...
维吾尔语属于阿尔泰语系,是典型的黏着语,构形词尾在维吾尔语中占很重要的地位,这与汉语差别很大。针对维吾尔语的形态特点,分析汉维统计机器翻译中维吾尔语构形词尾的作用,利用Cherio搭建一个基于层次短语的汉维统计机器翻译系统。使用词级粒度、词干级粒度、词干词尾级粒度的汉维平行语料进行对比实验,探讨不同粒度对汉维统计机器翻译系统的影响。实验结果表明,该汉维统计机器翻译系统可以提高汉维统计翻译的质量,BLEU值达到0.1972。
展开更多
关键词
黏着语
词尾
统计机器翻译
层次
短语
翻译
模型
语言
模型
在线阅读
下载PDF
职称材料
题名
基于树到串模型强化的层次短语机器翻译解码方法
被引量:
5
1
作者
肖桐
朱靖波
机构
东北大学信息科学与工程学院
出处
《计算机学报》
EI
CSCD
北大核心
2016年第4期808-821,共14页
基金
国家自然科学基金(61300097
61272376
+1 种基金
61432013)
中国博士后科学基金(2013M530131)资助
文摘
文中研究了利用树到串模型对层次短语模型进行强化的统计机器翻译解码方法.其基本框架是把层次短语模型作为基础模型,而把树到串模型作为层次短语模型的补充,增加翻译推导空间大小.文中重点研究了在该框架下的统计机器翻译解码技术,并提出了多种解码策略,包括基于树的精确解码策略、基于树的模糊解码策略和基于串的解码策略.通过NIST汉英翻译任务上的实验结果显示,文中所研究的方法可以十分有效地提升基线层次短语系统的翻译性能,比如在newswire和web数据上分别提高了1.3和1.2个BLEU点.此外,文中分析了若干影响翻译性能的因素,并给出了对比实验结果.
关键词
统计机器翻译
层次短语模型
树到串
模型
规则抽取
解码
社会媒体
社交网络
自然语言处理
机器翻译
Keywords
statistical machine translation
hierarchical phrase-based model
tree-to-string model
rule extraction
decoding
social media
social networks
natural language processing
machine translation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
层次短语翻译模型的介词短语调序
被引量:
3
2
作者
冯洋
张冬冬
刘群
机构
中国科学院计算技术研究所智能信息处理重点实验室
微软亚洲研究院
出处
《中文信息学报》
CSCD
北大核心
2012年第1期31-36,共6页
文摘
在不同的语言中,句法成分的相对位置往往不同,介词短语表现尤为明显,因此正确的对介词短语进行调序对提高翻译质量至关重要。层次短语模型借助于形式语法规则,具有较强的处理长距离调序的能力,但是其并不对短语的句法成分进行区分,这会导致规则的使用不当,从而引起翻译错误。该文在层次短语模型的基础上,针对介词短语进行处理。首先利用条件随机场模型识别出介词短语,然后抽取出带有介词短语的规则,构建一个新的同步上下文无关文法。解码的时候,在这个同步上下文无关文法定义的空间里搜索找到最优的译文。相对于层次短语模型,该方法在我们内部的英汉数据集上调高了0.8个BLEU百分点,在NIST 2008英汉翻译数据集上提高了0.5个BLEU百分点。
关键词
统计机器翻译
层次短语模型
介词
短语
调序
条件随机场
Keywords
statistical machine translation
hierarchical phrase-based translation
prepositional phrase reordering
conditional random field
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
利用依存限制抽取长距离调序规则
3
作者
涂兆鹏
刘群
林守勋
机构
中国科学院计算技术研究所智能信息处理重点实验室
出处
《中文信息学报》
CSCD
北大核心
2011年第2期55-60,共6页
基金
国家自然科学基金重点资助项目(60736014
60873167)
国家自然科学基金青年基金资助项目(60903138)
文摘
长距离调序是统计机器翻译领域的一个重要问题。层次短语模型提供了一个很好的解决方案,它使用层次短语规则可以很好地表示局部调序和长距离调序。但是,使用传统的算法抽取长距离层次规则将会导致规则表数量急剧增加,从而加大解码内存和时间消耗。为了解决这个问题,该文提出了一种利用依存限制抽取长距离调序规则的新方法。实验表明,该文的方法可以比基准系统高出0.74个BLEU点。
关键词
统计机器翻译
层次短语模型
长距离调序
依存限制
Keywords
statistical machine translation
hierarchical phrase-based model
long distance reordering
dependency restriction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
维吾尔语词尾对汉维统计机器翻译影响的研究
被引量:
8
4
作者
米莉万.雪合来提
麦热哈巴.艾力
吐尔根.依布拉音
姜文斌
机构
新疆大学信息科学与工程学院
新疆大学多语种信息技术重点实验室
中国科学院计算技术研究所
乌鲁木齐市工商局
出处
《计算机工程》
CAS
CSCD
2014年第3期224-227,共4页
基金
国家自然科学基金资助项目(61063026)
国家自然科学基金资助重点项目(61032008)
+1 种基金
国家社会科学基金资助重点项目(10AYY006)
新疆多语种信息技术重点实验室开放基金资助项目
文摘
维吾尔语属于阿尔泰语系,是典型的黏着语,构形词尾在维吾尔语中占很重要的地位,这与汉语差别很大。针对维吾尔语的形态特点,分析汉维统计机器翻译中维吾尔语构形词尾的作用,利用Cherio搭建一个基于层次短语的汉维统计机器翻译系统。使用词级粒度、词干级粒度、词干词尾级粒度的汉维平行语料进行对比实验,探讨不同粒度对汉维统计机器翻译系统的影响。实验结果表明,该汉维统计机器翻译系统可以提高汉维统计翻译的质量,BLEU值达到0.1972。
关键词
黏着语
词尾
统计机器翻译
层次
短语
翻译
模型
语言
模型
Keywords
agglutinative language
suffix
statistical machine translation
hierarchical phrase-based translation model
language model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于树到串模型强化的层次短语机器翻译解码方法
肖桐
朱靖波
《计算机学报》
EI
CSCD
北大核心
2016
5
在线阅读
下载PDF
职称材料
2
层次短语翻译模型的介词短语调序
冯洋
张冬冬
刘群
《中文信息学报》
CSCD
北大核心
2012
3
在线阅读
下载PDF
职称材料
3
利用依存限制抽取长距离调序规则
涂兆鹏
刘群
林守勋
《中文信息学报》
CSCD
北大核心
2011
0
在线阅读
下载PDF
职称材料
4
维吾尔语词尾对汉维统计机器翻译影响的研究
米莉万.雪合来提
麦热哈巴.艾力
吐尔根.依布拉音
姜文斌
《计算机工程》
CAS
CSCD
2014
8
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部