-
题名层级分类概率句法分析
被引量:11
- 1
-
-
作者
代印唐
吴承荣
马胜祥
钟亦平
-
机构
复旦大学计算机科学技术学院
-
出处
《软件学报》
EI
CSCD
北大核心
2011年第2期245-257,共13页
-
基金
上海市科委
上海市人力资源与社会保障局博士后科研资助计划(10R21421400)
上海市科委项目(075115008)
-
文摘
对已有的句法分析中引入知识的方法进行了归纳分析,认为多种句法分析方法都可被看作是基于特征标记的分类,然后分析了其中的欠分类和过分类问题.在此基础上,提出一种层级分类短语结构文法和一种层级分类概率句法分析方法(hierarchically classified probabilistic context-free grammar),并设计了一种通过对实例进行聚类来消除句法规则的分类歧义方法.还进一步将层级分类扩展到概率上下文相关句法分析方法,利用上下文相关性的层级分类来解决引入上下文相关时的数据稀疏性问题.通过上述一系列方法有效地克服了过分类与前分类之间的矛盾.
-
关键词
短语结构文法
概率句法分析
层级分类
-
Keywords
phrase structure grammar
probabilistic grammar parsing
hierarchical classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于GLR算法的新型概率句法分析器
- 2
-
-
作者
丁向民
徐斌
-
机构
盐城师范学院信息科学与技术学院
阿尔卡特.朗讯南京分公司
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第32期130-132,136,共4页
-
文摘
为了提高句法分析器的分歧能力和分析准确率,结合上下文无关概率模型PCFG和头驱动概率模型HDSM各自的优点,提出了一种新型的概率模型PCFG_HDSM,并基于GLR算法,实现了一个新型的汉语句法分析器。在词性标注阶段,通过对助词的详细标注使部分歧义在规则阶段就被去除掉,提高了系统消歧的能力。经过开放测试,准确率和回归率分别达到82.8%、74.7%,与其他分析器分析结果比较有了较大提高,证明新模型PCFG_HDSM确实提高了分析器的分歧能力。
-
关键词
GLR算法
上下文无关文法(PCFG)
头驱动的概率模型(HDSM)
概率句法分析
-
Keywords
GLR algorithm
Probabilistic Context-Free Grammar(PCFG)
Head-Driven Statistical Models (HDSM)
probabilistic syntactic analysis
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名一种有效的汉语概率句法分析算法
被引量:2
- 3
-
-
作者
陈晓辉
周源远
袁春风
武港山
-
机构
南京大学软件新技术国家重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2006年第1期141-143,156,共4页
-
基金
国家"863"重点攻关项目(2002AA117010-10)
国家"十五"攻关项目(2001BA101A06-01)
-
文摘
一种有效的汉语概率句法分析算法通过制定语法功能词表和包含语法功能词的概率上下文无关规则集进行句法分析。它以语法功能词为切入点,首先识别出所有包含语法功能词的短语,然后分析短语之间的组合关系,最终得到句法树。实验表明该算法能获得较高的准确率。
-
关键词
Chart算法
语法功能词
概率句法分析
-
Keywords
Chart Algorithm
Function Word
Probabilistic Syntactic Analysis
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名词汇化句法分析与子语类框架获取的互动方法
被引量:3
- 4
-
-
作者
冀铁亮
穗志方
-
机构
北京大学计算语言研究所
-
出处
《中文信息学报》
CSCD
北大核心
2007年第1期120-126,共7页
-
基金
国家自然科学基金资助项目(60503071
60372016)
北京市自然科学基金资助项目(4052019)
-
文摘
概率句法分析器(PCFG Parser)是基于概率规则集的上下文无关文法的句法分析器。规则集主要是针对词类和短语类。然而事实上,词性相同而词汇不同,其所常用的句法规则也通常不同。目前NLP研究的一个趋势和热点就是词汇化的句法分析。针对概率句法分析独立性假设中缺乏词汇化的缺陷,本文将谓语动词的子语类信息与概率句法分析结合起来,提出一种基于动词子语类信息的词汇化概率句法分析方法。论文建立了基于汉语动词子语类框架的统计句法分析模型,并且针对动词子语类框架难以获取的问题,提出一种词汇化概率句法分析与动词子语类框架获取的互动方法。实验利用这种互动的方法获取了汉语中十个常用高频动词的概率化子语类信息,并结合原有的概率句法分析器PCFG实现了一个基于动词子语类信息的概率句法分析器原型系统S-PCFG。实验证明了基于动词子语类信息的概率句法分析对自然语言句法分析的准确率和速度均有所提高。同时分析了新的概率句法分析器的不足之处,为进一步的改进提供条件。
-
关键词
计算机应用
中文信息处理
词汇化概率句法分析
子语类框架
词汇知识自动获取
-
Keywords
computer application
Chinese information processing
lexicalized probabilistic parsing
subcategorization frame acquisition
lexical knowledge acquisition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-