-
题名基于主位-述位结构理论的英文作文连贯性建模研究
被引量:3
- 1
-
-
作者
徐凡
王明文
谢旭升
李茂西
万剑怡
-
机构
江西师范大学计算机信息工程学院
-
出处
《中文信息学报》
CSCD
北大核心
2016年第1期115-123,共9页
-
基金
国家自然科学基金(61402208.61462045,61562042)
江西省教育厅项目(GJJ150351)
-
文摘
该文在研究了有监督的基于实体和基于篇章关系网格的篇章连贯性模型的基础上,提出了一个无监督的基于主位-述位结构理论的篇章连贯性模型。该模型通过引入词语的词干、上下位、近义和复述等语义方面的信息来计算相邻句子中主位和述位的相似度,并利用此相似度值来描述篇章的连贯性。同时,该文提出了一种简单有效的基于篇章关系计数的连贯性模型,并采用线性组合方法将其与基于主位-述位结构理论的连贯性模型加以集成。上述模型在国际基准英文作文语料上进行试验,实验结果表明采用线性组合的连贯性模型后,作文连贯性检测准确率与目前基于实体和篇章关系网格的模型相比得到显著提升。
-
关键词
衔接性
连贯性
主位-述位结构理论
篇章关系
线性组合
-
Keywords
cohesion
coherence
theme-rheme structure theory
discourse relation
linear combination
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语篇章微观话题结构建模与语料库构建
被引量:9
- 2
-
-
作者
奚雪峰
褚晓敏
孙庆英
周国栋
-
机构
苏州大学计算机科学与技术学院
苏州科技大学计算机科学与工程系
苏州市虚拟现实智能交互及应用技术重点实验室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2017年第8期1833-1852,共20页
-
基金
国家自然科学基金项目(61331011
61673290
61472264)~~
-
文摘
篇章话题结构分析是自然语言理解的前沿基础,而大规模高质量的适用于汉语篇章分析的语料资源缺乏,严重制约了相关篇章话题计算模型的研究.针对上述问题,首先研究了汉语篇章话题结构的理论表示体系.分析了主述位理论、英语修辞结构理论和宾州篇章树库体系的优势,结合汉语复句句群理论以及汉语自身特点,提出了一种基于主述位理论的汉语篇章微观话题结构表示方式,并借助微观话题链构建了汉语篇章话题结构表示体系.随后,在此基础上,采用自顶向下、后向搜索的标注策略和人机结合的语料库标注方式,构建了基于篇章微观话题表示体系的汉语篇章话题结构语料库(Chinese discourse topic corpus,CDTC).CDTC共包含500个文档,对其进行了详细统计分析并展示了语料库的标注情况.与宾州篇章树库体系、广义话题结构理论的对比表明,所提篇章微观话题结构表示体系在理论上具有一定的优越性,并且符合汉语特点;一致性检验表明CDTC能够充分体现汉语篇章话题分析问题本身的难度,并能够为相关研究提供语料资源支持.
-
关键词
篇章话题结构
主位-述位理论
主位推进
话题链
语料库构建
-
Keywords
discourse topic structure
theme-rheme theory
thematic progression
topic chain
corpus construction
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-