-
题名基于多策略分析的复杂长句翻译处理算法
被引量:12
- 1
-
-
作者
黄河燕
陈肇雄
-
机构
中国科学院计算机语言信息工程研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2002年第3期1-7,共7页
-
基金
国家自然科学基金
杰出青年基金(6 992 5 10 2 )支持
-
文摘
在实用机器翻译系统的研究开发中 ,复杂长句的翻译处理是其面临的一个主要难题。本文提出一种多语种通用的基于多策略分析的复杂长句翻译处理算法 ,该算法通过基于实例模式匹配和规则分析相结合的方法 ,综合利用源语言句子中多种相关的语言特征 ,包括语法语义特征、句子长度、标点符号、功能词以及上下文语境条件等对复杂长句进行切分简化处理和译文的复合生成。另一方面 ,通过对不同语种设计相同的知识表示形式 。
-
关键词
复杂长句
翻译处理算法
机器翻译
多策略分析
长句切分简化处理
模式匹配
规则分析
-
Keywords
Machine Translation
hybrid strategy parsing approach
segmentation processing of complex long sentence
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
H085
[语言文字—语言学]
-
-
题名基于Bi-LSTM与CRF的泰语句子切分模型
被引量:5
- 2
-
-
作者
李自荐
迟呈英
战学刚
-
机构
辽宁科技大学计算机与软件工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第10期294-300,共7页
-
基金
国家自然科学基金(61672138)。
-
文摘
在自然语言处理领域中,对于泰语等东南亚语言的分句处理是一项具有挑战性的工作。将序列标注模型应用于句子切分任务,提出基于双向长短期记忆循环神经网络的句子边界自动识别模型。利用Glove词向量技术,将泰语句子中的词或字转换为不同维度的向量,进而将词或字向量组合成为句子向量输入模型进行训练。在此基础上,通过双向网络结构捕捉上下文信息以达到更好的句子切分效果。实验结果表明,该模型在泰语句子切分任务上表现出非常精准的识别效果。
-
关键词
自然语言处理
句子切分
深度学习
循环神经网络
长短期记忆网络
泰语
-
Keywords
Natural Language processing(NLP)
sentence segmentation
deep learning
Recurrent Neural Networks(RNN)
long Short-Term Memory(LSTM)network
Thai
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-