-
题名融合罪名分类的涉案新闻主题分析方法
- 1
-
-
作者
尹兆良
黄于欣
余正涛
王冠文
艾传鲜
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
国家计算机网络应急技术处理协调中心云南分中心
-
出处
《计算机工程》
北大核心
2025年第4期208-216,共9页
-
基金
国家自然科学基金(U21B2027,61972186,62266027,62266028)
云南省重大科技专项(202302AD080003,202202AD080003)
云南省基础研究项目(202301AT070393,202301AT070471)。
-
文摘
介绍涉案新闻主题分析的应用场景以及现有方法的不足之处。针对这些不足,提出一种融合罪名分类的主题分析模型BERT-ECTM。该模型利用法律文书中的罪名信息作为监督信号,与涉案新闻文本相融合作为主题分析模型的输入,以提高涉案新闻主题信息的准确性和涉案偏好。为了捕捉上下文语义特征,采用基于BERT编码的嵌入式主题分析方法,以提高主题分析的准确性和效果。此外,在模型训练时,针对边际分布求解难度较大、复杂程度高这一问题,结合变分推断的方法,用后验分布的近似分布来拟合其分布结果。实验结果表明,在特定的涉案新闻主题分析任务中,该模型的有效性和准确性相比于现有方法均有明显提升。
-
关键词
文本主题抽取
罪名分类
BERT-ECTM模型
涉案偏好
文本语义
语义特征编码
变分推断
-
Keywords
text topic extraction
crime classification
BERT-ECTM model
involved preferences
text semantics
semantic feature encoding
variegation inference
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-