-
题名基于标点符号分割的汉语句法分析算法
被引量:7
- 1
-
-
作者
毛奇
连乐新
周文翠
袁春风
-
机构
南京大学计算机软件新技术国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2007年第2期29-34,共6页
-
基金
国家863高技术项目资助(2002AA117010-10)
十五攻关教育部科技基础条件平台建设项目资助
-
文摘
目前大部分句法解析器都忽略标点符号这一重要的句法特征或者只进行非常简单的处理。本文根据标点符号的句法结构特性,提出单独解析块的概念,并且根据标点符号在句子中的特有特征和位置关系,给出了基于决策树算法(Id3)单独解析块识别方法,将标点融入汉语句法分析中。本文所用的实验数据(包括训练集和测试集)均来自中文宾州树库5.0。对句长大于40个词的汉语长句单独进行了实验,句法分析精度和召回率分别提高1.59%和0.93%,同时时间开销降低了近2/3。实验结果表明,标点对汉语长句句法分析非常有利,系统性能获得了较大提高。
-
关键词
计算机应用
中文信息处理
句法解析器
单独解析块
决策树(Id3)
-
Keywords
computer application
Chinese information processing
syntactic parser
separate parsing phrase
decision tree algorithm Id3
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名一种改进Viterbi算法的应用研究
被引量:7
- 2
-
-
作者
李荣
郑家恒
-
机构
忻州师范学院计算机系
山西大学计算机与信息技术学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2007年第3期530-531,571,共3页
-
基金
山西省忻州师范学院科研基金项目(200623)
-
文摘
为降低现代汉语句法分析的难度,以北大和哈工大语料为基础,利用改进的Viterbi算法对汉语真实文本进行了短语识别研究。提出了在隐马尔可夫模型(HMM)框架下,训练阶段依据统计概率信息,以极大似然法获取HMM参数,识别阶段用一种改进的Viterbi算法进行动态规划,识别同层短语;在此基础上,运用逐层扫描算法和改进Viterbi算法相结合的方法来识别汉语嵌套短语。实验结果表明,识别正确率在封闭测试中可达93.52%,在开放测试中达到77.529%,证明该算法对短语识别问题具有良好的适应性和实用性。
-
关键词
隐马尔可夫模型
VITERBI算法
层次分析
短语识别
句法分析
-
Keywords
hidden markov model
viterbi algorithm
hierarchical analysis
phrase recognition
syntax parsing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名中文复杂名词短语依存句法分析
被引量:3
- 3
-
-
作者
陈永波
汤昂昂
姬东鸿
-
机构
武汉大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2015年第6期1617-1620,共4页
-
基金
国家自然科学基金资助项目(61173095)
国家自然科学基金重点项目(61133012)
-
文摘
针对中文复杂名词短语的依存句法分析进行了研究,提出简单边优先与SVM相结合的依存句法分析算法。算法的每一步迭代根据边的特征于每一对相邻子树之间的无向边中选择最优者,然后利用支持向量机根据边两端子树的特征确定该边的方向,即得到两棵子树的中心语之间的依存关系。实验证明对于复杂名词短语的依存句法分析,算法准确率比简单边优先算法有明显提高,且优于基于最大生成树算法的中文句法分析器;算法分析效率更高,时间复杂度为O(n2logn)。
-
关键词
中文复杂名词短语
依存句法分析
决策式算法
支持向量机
特征
-
Keywords
Chinese complex nominal phrase
dependency parsing
deterministic algorithm
SVM
feature
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名算符优先文法最左素短语的一种判断算法
- 4
-
-
作者
韩太鲁
-
机构
宁阳县保安煤矿
-
出处
《山东矿业学院学报》
CAS
1994年第1期88-91,共4页
-
文摘
算符优先分析法是分析算术表达式的有力工具,这种分析方法主要是寻找句型的最左素短语,本文给出算符优先文法最左素短语的一种判断算法。
-
关键词
运算优先文法
算符
短语分析算法
-
Keywords
operator precedence grammar
operators
precedence grammar
operator precedence parsing algorihm
parsing algorithm of the leftestelement phrase
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-