摘要
目前,大部分句法分析都忽略标点符号这一重要的句法特征或者只进行非常简单的处理。本文根据标点符号的句法结构特性,提出规则分层的方法,将标点融入汉语句法分析中。利用标点符号的分割作用,将长句分成一个个小的句子的序列,并对每个小的句子单元进行句法和结构分析,再根据已经抽取出来的类型规则进行二次句法分析,从而得到一个完整的句法分析树。实验表明,这种方法不但解决了部分长句无法正确得到句法树的难题,而且分析的歧义减小了,效率得到了提高。
So far, most Chinese syntactic parsing techniques neglect the punctuations or oversimplify their functions. However, it is actually very important information of syntactic characters. According to the features of punctuations in the syntactic structure, this paper proposes a new rule-layered approach. This method makes the punctuations into Chinese syntactic analysis and uses the punctuation role to split long sentences into small sequence sentences. Then each small unit is parsed syntactically and structurally. Finally, we extract the type rule to analyse and complete the parsing tree. Experiments show that this approach not only solves the problem that part of long sentences can not correctly obtain syntactic trees, but also reduces the ambiguities of parsing,and increases efficiency.
出处
《计算机工程与科学》
CSCD
北大核心
2009年第1期145-147,共3页
Computer Engineering & Science
基金
陕西省教育厅专项课题(06JK246)
作者简介
张小艳(1967-),女,陕西西安人,副教授,研究方向为网络集成与数据库技术、知识工程与智能系统、计算机教育技术等 通讯地址:710054陕西省西安市雁塔中路58号西安科技大学计算机学院;Tel:(029)85583722,13572897811;E-mail:zhangxy@xust.edu.cn
邵刚,硕士生,研究方向为网络集成与数据库技术、自然语言处理。