-
题名自然语言处理中的篇章主次关系研究
被引量:24
- 1
-
-
作者
褚晓敏
朱巧明
周国栋
-
机构
苏州大学计算机科学与技术学院
苏州大学自然语言处理实验室
-
出处
《计算机学报》
EI
CSCD
北大核心
2017年第4期842-860,共19页
-
基金
国家自然科学基金(61272260)
教育部中国移动科研基金(MCM20150602)
江苏省科技计划(BK20151222)资助~~
-
文摘
篇章结构分析特别是篇章主次关系研究是自然语言处理领域的一个重要研究方向.篇章主次关系的分析,有助于理解篇章的结构和语义,并为自然语言处理的应用(例如自动文摘、主题抽取和问答系统等)提供有力的支持.然而,目前篇章主次关系分析却是篇章结构分析的一个瓶颈.已有研究一般将篇章主次关系分析看作篇章修辞结构分析中的一个辅助环节,忽略了其在篇章结构分析中的重要性.因此,文中将篇章主次关系提升到篇章结构分析的核心地位,将它从篇章修辞结构分析中分离出来作为一个独立的任务进行研究.首先,探讨了什么是篇章主次关系、如何判别篇章主次关系以及为什么要研究篇章主次关系;其次,分别从两个角度(微观、宏观)和三个方面(理论体系、语料资源和计算模型)详细阐述了篇章主次关系的研究现状;再次,分析了篇章主次关系研究存在的问题,并提出我们的基本研究思路;最后,归纳出篇章主次关系未来的一些研究方向.
-
关键词
自然语言处理
篇章结构分析
篇章主次关系
宏观主次关系
微观主次关系
社会媒体
-
Keywords
natural language processing
discourse structure analysis
discourse primary-secondary relationships
macro primary-secondary relationships
micro primary-secondary relationships
social media
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于主题相似度的宏观篇章主次关系识别方法
被引量:5
- 2
-
-
作者
蒋峰
褚晓敏
徐昇
李培峰
朱巧明
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息技术处理重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2018年第1期43-50,共8页
-
基金
国家自然科学基金(61773276
61472265
+1 种基金
61772354)
江苏省科技计划(BK20151222)
-
文摘
篇章分析是自然语言处理领域的一个重要任务。分析篇章主次关系有助于理解篇章的结构和语义,并为自然语言处理的应用提供有力的支持。该文在微观篇章主次关系识别研究的基础上,重点研究宏观篇章主次关系,提出了一种基于word2vec和LDA的主题相似度的宏观篇章主次关系识别模型。基于word2vec的主题相似度和基于LDA的主题相似度在不同维度上计算语义相似度,两者在语义层面形成互补,因而增强了模型识别宏观篇章主次关系的能力。该模型在宏观汉语篇章树库(MCDTB)上实验的F1值达到79.9%,正确率达到81.82%,相较基准系统分别提升了1.7%和1.81%。
-
关键词
宏观篇章主次关系
主题相似度
word2vec
LDA
-
Keywords
macro discourse-level primary and secondary relation
topic similarity
word2vec
LDA
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-