-
题名基于事件抽取的网络新闻多文档自动摘要
被引量:15
- 1
-
-
作者
韩永峰
许旭阳
李弼程
朱武斌
陈刚
-
机构
解放军信息工程大学信息工程学院
-
出处
《中文信息学报》
CSCD
北大核心
2012年第1期58-66,共9页
-
基金
国家社科重大基金项目(09&ZD014)
国家"863"计划资助项目(2007AA01Z439)
-
文摘
目前,有代表性的自动摘要方法是根据文本片段进行聚类,较传统方法避免了信息冗余,但网络新闻文本中有些文本片段和主题无关,影响了聚类的效果,导致最终生成的摘要不够简洁。为此,该文引入事件抽取技术,提出了一种基于事件抽取的网络新闻多文档自动摘要方法。该方法首先通过二元分类器辨析出文本中的事件和非事件;然后通过聚类将文档原来以段落或句子为单位的物理划分转化为以事件为单位的内容逻辑划分,最后通过主旨事件抽取、排序及润色,生成摘要。实验结果表明,该方法是有效的,显著提高了生成摘要的质量。
-
关键词
事件抽取
中文信息处理
分类
新闻文档
聚类
自动摘要
-
Keywords
event extraction
Chinese information processing
classification
news text
clustering
automatic summarization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于跨层级多视角特征的多语言事件探测
- 2
-
-
作者
张志远
张维彦
宋雨秋
阮彤
-
机构
华东理工大学信息工程与科学学院
-
出处
《计算机科学》
CSCD
北大核心
2024年第5期208-215,共8页
-
文摘
多语言事件探测任务的目标是将多种语言的新闻文档集合组织成不同的关键事件,其中每个事件可以包含不同语言的新闻文档。该任务有助于各种下游任务应用,如多语言知识图谱构建、事件推理、信息检索等。目前,多语言事件探测主要分为先翻译再事件探测与先单语言检测再跨多种语言对齐两种方法,前者依赖翻译的效果,后者需要为每种语言单独训练模型。为此,提出了一种名为基于跨层级多视角特征融合的多语言事件探测方法,端到端地进行多语言事件探测任务。该方法从不同层级利用文档的多视角特征,获得了高可靠性的多语言事件探测结果并提升了低资源语言事件探测的泛化性能。在9种语言混合的新闻数据集上进行的实验表明,所提方法的BCubed F1值提升了4.63%。
-
关键词
多语言预训练模型
多语言事件探测
新闻文档聚类
加权相似度
增量聚类
-
Keywords
Multilingual pre-training model
Multilingual event detection
News documents clustering
Weighted similarity
Incremental clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-