-
题名面向文本信息处理的汉语句子和小句
被引量:11
- 1
-
-
作者
宋柔
葛诗利
尚英
卢达威
-
机构
广东外语外贸大学外语研究与服务协同创新中心
北京语言大学信息科学学院
-
出处
《中文信息学报》
CSCD
北大核心
2017年第2期18-24,35,共8页
-
基金
国家自然科学基金(61171129
61672175)
2016年国家语委重点项目(ZDI135-30)
-
文摘
小句和句子分别是篇章信息处理的基本单位和复合单位。但是汉语中,这两个概念至今未有公认的适用于语言信息处理的界定,这种状况阻碍了汉语信息处理的发展。该文将汉语的句子大致界定为自足的广义话题结构,把小句界定为基于广义话题结构的话题自足句,并提出了这样界定的语言学依据和认知依据。
-
关键词
汉语篇章处理
句子
小句
广义话题结构
话题自足句
-
Keywords
chinese text processing
sentence
clause
generalized topic structure
topic sufficient clause
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种混合型的汉语篇章结构自动分析方法
被引量:10
- 2
-
-
作者
张益民
陆汝占
沈李斌
-
机构
上海交通大学计算机科学与工程系
-
出处
《软件学报》
EI
CSCD
北大核心
2000年第11期1527-1533,共7页
-
基金
国家自然科学基金资助项目!(6 95 730 2 0)
-
文摘
提出一种混合型的汉语篇章结构自动分析方法 .此方法主要基于 RST( rhetorical structure theory)分析、主位模式分析等多种语言学方法 ,还利用了向量空间模型等统计方法 .提出并实现了一种确定性 RST分析算法 .与其他现有方法相比 ,此方法具有更大的适用范围和更高的处理精度 .
-
关键词
汉语篇章结构
自动分析
篇章处理
自然语言处理
-
Keywords
automatic Chinese discourse structure analysis
deterministic RST (rhetorical structure theory) analysis algorithm
rhetorical structure theory
vector space model
thematic progression analys
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名基于PDTB体系的隐式篇章关系识别
被引量:4
- 3
-
-
作者
李生
孔芳
周国栋
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2016年第4期81-89,共9页
-
基金
国家自然科学基金(61472264
61273320
+2 种基金
61333018
61331011)
国家863项目(2012AA011102)
-
文摘
识别隐式篇章关系是篇章分析领域中非常有挑战的一个任务。该文基于PDTB语料提出一个隐式篇章分析识别方法,使用传统的特征如动词,极性和句法推导规则等,系统分析了它们对隐式篇章分析的影响。我们利用全部标注数据构建多个分类器并使用加法规则融合分类结果,此外还通过前向特征选择算法确定各分类任务最优的特征集。实验结果表明该方法能显著提升隐式篇章分析的性能。
-
关键词
篇章处理
隐式篇章关系
宾州篇章树库
-
Keywords
discourse processing
implicit discourse relation
PDTB
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一个实验性的汉语篇章理解系统
被引量:3
- 4
-
-
作者
崔耀
陈永明
-
机构
中国科学院心理研究所
-
出处
《中文信息学报》
CSCD
1994年第3期24-34,共11页
-
文摘
本系统从世界现象的组成和人类的记忆结构特点出发,结合汉语的具体情况,从意义分析的角度将汉语的词汇分为描述性的词、过程性的词、辅助性的词三类。这三类词分别描述了世界现象中的事实、事件以及语言本身所具有的特性。在此基础上形成了汉语的篇章理解所依赖的知识表示和知识组织形式,即:以事实-事件网络为基本结构的记忆模型。通过这个模型建立了汉语篇章理解系统的知识库,以及与之相应的加工和管理机制。系统对汉语篇章的分析是以词为引导进行的。汉语的词直接对应于事实-事件网络中的节点和辅助词表中的词项。这些节点和词项综合了语法的、语义的、语用的知识,并且能根据处理的需要及时地为分析过程提供预期。本系统通过阅读,对自己的知识库进行动态的自我管理。在阅读了有关七种鸟类的汉语故事之后,系统能够学习到有关鸟类的一些新概念,并能回答相应的问题。
-
关键词
汉语理解系统
汉语篇章处理
-
Keywords
natural language understanding
knowledge representation
memory model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于PDTB的自动显式篇章分析器
被引量:1
- 5
-
-
作者
李生
孔芳
周国栋
-
机构
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2016年第2期18-25,共8页
-
基金
国家自然科学基金(61003153
61272257
+1 种基金
61273320)
国家863项目(2012AA011102)
-
文摘
自动篇章处理是自然语言处理中非常有挑战的一个任务,对自然语言处理的其他任务,如问答系统,自动文摘以及篇章生成都有重要的作用。近年来,大规模篇章语料PDTB的出现为篇章研究提供了一个公共的平台。该文在PDTB语料之上提出了一个完整的基于条件随机场模型的显式篇章分析平台,该平台包含连接词识别、篇章关系分类和关系论元提取三个子任务。给出了在PDTB上各模块的实验结果,并针对错误传播问题,给出了完整平台的性能及详细分析。
-
关键词
篇章处理
条件随机场
宾州篇章树库
-
Keywords
discourse processing
conditional random fields
PDTB
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-