-
题名基于神经自回归分布估计的涉案新闻主题模型构建方法
被引量:5
- 1
-
-
作者
毛存礼
梁昊远
余正涛
郭军军
黄于欣
高盛祥
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2021年第2期89-98,共10页
-
基金
国家重点研发计划(2018YFC0830105,2018YFC0830101,2018YFC0830100)
云南省应用基础研究计划重点项目(2019FA023)
+2 种基金
云南省中青年学术和技术带头人后备人才项目(2019HB006)
云南省高新技术产业专项(201606)
云南省重大科技专项计划项目(202002AD080001)。
-
文摘
神经主题模型能有效获取文本的深层语义特征,但现有的神经主题模型忽略了外部知识对获取主题分布的帮助。因此,针对涉案主题分析任务,该文提出了一种基于神经自回归分布估计的涉案新闻主题模型构建方法。以案件要素作为外部知识对iDocNADEe模型进行了扩展,通过计算案件要素与主题词的相关度来构建注意力机制对iDocNADEe模型双向编码的隐状态进行加权,利用神经自回归算法计算加权后的主题词双向隐状态的自回归条件概率实现涉案新闻文本主题模型构建。实验结果表明,该文提出方法较基线模型困惑度降低了0.66%、主题连贯性提高了6.26%,并且在文档检索精确率方面也明显高于基线模型。
-
关键词
案件要素
iDocNADEe
注意力机制
神经自回归分布估计
涉案新闻
主题模型
-
Keywords
case elements
iDocNADEe
attention mechanism
neural autoregressive distribution estimator
news involved in the case
topic model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-