题名 面向移进—归约句法分析器的单模型系统整合算法
被引量:5
1
作者
马骥
朱慕华
肖桐
朱靖波
机构
东北大学自然语言处理实验室
出处
《中文信息学报》
CSCD
北大核心
2012年第3期9-15,共7页
文摘
该文提出了一种面向移进—归约句法分析器的单模型系统整合算法。在训练阶段,该方法通过调整训练数据的分布,来构建用于整合的多个移进—归约句法分析器。在解码阶段,该方法首先使用各个移进—归约句法分析器对待分析的句子进行句法分析,然后利用一个线性模型对各句法分析器输出的句法树进行评分,从中选出得分最高的句法树作为最终结果。该文中的实验是在宾州英文树库上进行的。实验结果表明,该文中的方法能够显著改善基准系统的性能。
关键词
句法 分析
系统整合
移进—归约句法分析器
Keywords
parsing
system combination
shift-reduce parser
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 向上学习方法改进移进-归约中文句法分析
被引量:2
2
作者
朱慕华
王会珍
朱靖波
机构
东北大学自然语言处理实验室
出处
《中文信息学报》
CSCD
北大核心
2015年第2期33-39,共7页
基金
国家自然科学基金(61073140
61100089)
+1 种基金
中央高校基本科研业务费专项资金(N110404012)
高等学校博士学科点专项科研基金(20100042110031)
文摘
基于移进-归约的句法分析系统具有线性的时间复杂度,因此在大规模句法分析任务中具有特别实际的意义。然而目前移进-归约句法分析系统的性能远低于领域内最好的句法分析器,例如,伯克利句法分析器。该文研究如何利用向上学习和无标注数据改进移进-归约句法分析系统,使之尽可能接近伯克利句法分析器的性能。我们首先应用伯克利句法分析器对大规模的无标注数据进行自动分析,然后利用得到的自动标注数据作为额外的训练数据改进词性标注系统和移进-归约句法分析器。实验结果表明,向上学习方法和无标注数据使移进-归约句法分析的性能提高了2.3%,达到82.4%。这个性能与伯克利句法分析器的性能可比。与此同时,该文最终得到的句法分析系统拥有明显的速度优势(7倍速度于伯克利句法分析器)。
关键词
中文句法 分析
移 进 -归约 分析
伯克利句法 分析器
向上学习
无标注数据
Keywords
Chinese syntactic parsing
shift-reduce parsing
Berkeley parser
uptraining
unlabeled data
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 改进LR算法的汉语层次化句法分析器设计
3
作者
皮乾东
邵玉斌
龙华
杨陈菊
机构
昆明理工大学信息工程与自动化学院
出处
《控制工程》
CSCD
北大核心
2021年第12期2318-2322,共5页
文摘
为改进传统的汉语句法分析算法,采用自顶向下、逆向扫描的分析方法,结合汉语语序的重要特性,提出了一种改进自左向右(left to right,LR)分析算法的汉语层次化句法分析器设计方法。该分析器仅基于当前经验得出十几条汉语语序特征,不断逆向扫描语句,结合上下文无关文法和汉语语序规则进行"移进-归约"处理,进而得到汉语层次化分析结果。采用北京大学标记的1998年1~6月份《人民日报》语料进行实验。实验结果显示,能够正确分解的语料达到49.98%,表明改进的分析算法对句法分析具有一定的成效,提高了分析的准确率。
关键词
句法 分析
LR算法
汉语语序
移 进 -归约
层次化
Keywords
Syntax analysis
LR algorithm
Chinese word order
shift-reduce
hierarchical
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于统计学习模型的句法分析方法综述
被引量:21
4
作者
吴伟成
周俊生
曲维光
机构
南京师范大学计算机科学与技术学院
南京大学计算机软件新技术国家重点实验室
出处
《中文信息学报》
CSCD
北大核心
2013年第3期9-19,共11页
基金
国家自然科学基金资助项目(61073119
61272221)
+2 种基金
江苏省社会科学基金资助项目(12YYA002)
江苏省自然科学基金资助项目(BK2010547)
南京大学计算机软件新技术国家重点实验室开放基金(KFKT2012B05)
文摘
句法分析是自然语言处理领域中重要的基础研究问题之一。近年来,基于统计学习模型的句法分析方法研究受到了广泛关注,多种模型与算法先后被提出。从采用的学习模型和算法类型着手,该文系统地对各种主流和前沿方法进行了归纳与分类,着重对各类模型和算法的思想进行了分析和对比,并对中文句法分析的研究现状进行了综述;最后,对句法分析下一步的研究方向与趋势进行了展望。
关键词
句法 分析
统计学习模型
生成式模型
判别式模型
移 进 -归约 决策
面向数据的句法 分析
Keywords
syntactic parsing~ statistical learning model~ generative modell discriminative model
shift-reduce
dataoriented parsing
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 汉语概念复合块的自动分析
被引量:2
5
作者
仵永栩
吕学强
周强
关晓炟
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
清华信息科学与技术国家实验室(筹)
出处
《中文信息学报》
CSCD
北大核心
2016年第2期1-11,共11页
基金
国家重点基础研究发展计划资助项目(2013CB329304)
国家自然科学基金(61373075
+2 种基金
61271304)
北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)
北京市优秀人才培养资助青年骨干项目(2014000020124G099)
文摘
为解决句法分析任务中的块边界识别和块内结构分析问题,该文基于概念复合块描述体系进行了块分析探索。通过概念复合块与以往的基本块和功能块描述体系的对比分析,深入挖掘了概念复合块自动分析的主要难点所在,提出了一种基于"移进-归约"模型的汉语概念复合块自动分析方法。在从清华句法树库TCT中自动提取的概念复合块标注库上,多层次、多角度对概念复合块自动分析性能进行了纵向与横向评估,初步实验结果证明了该分析方法对简单概念复合块分析的有效性,为后续进行更复杂的概念复合块的句法语义分析研究打下了很好的基础。
关键词
句法 分析
块识别
概念复合块
移 进 -归约 分析
Keywords
syntactic parsing
chunk recognition
concept compound chunk
shift-reduce parsing
分类号
TP391
[自动化与计算机技术—计算机应用技术]