-
题名基于跨层级多视角特征的多语言事件探测
- 1
-
-
作者
张志远
张维彦
宋雨秋
阮彤
-
机构
华东理工大学信息工程与科学学院
-
出处
《计算机科学》
CSCD
北大核心
2024年第5期208-215,共8页
-
文摘
多语言事件探测任务的目标是将多种语言的新闻文档集合组织成不同的关键事件,其中每个事件可以包含不同语言的新闻文档。该任务有助于各种下游任务应用,如多语言知识图谱构建、事件推理、信息检索等。目前,多语言事件探测主要分为先翻译再事件探测与先单语言检测再跨多种语言对齐两种方法,前者依赖翻译的效果,后者需要为每种语言单独训练模型。为此,提出了一种名为基于跨层级多视角特征融合的多语言事件探测方法,端到端地进行多语言事件探测任务。该方法从不同层级利用文档的多视角特征,获得了高可靠性的多语言事件探测结果并提升了低资源语言事件探测的泛化性能。在9种语言混合的新闻数据集上进行的实验表明,所提方法的BCubed F1值提升了4.63%。
-
关键词
多语言预训练模型
多语言事件探测
新闻文档聚类
加权相似度
增量聚类
-
Keywords
Multilingual pre-training model
Multilingual event detection
News documents clustering
Weighted similarity
Incremental clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-