-
题名面向行政执法案件文本的事件抽取研究
- 1
-
-
作者
屈潇雅
李兵
温立强
-
机构
对外经济贸易大学信息学院
北京大学软件与微电子学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第9期63-71,共9页
-
基金
科技部国家重点研发计划(2020YFC0833304)。
-
文摘
行政执法的智能化水平是国家治理能力现代化的体现,数据是智能化发展的重要依托。在行政执法领域,各行政机关存储大量以文本形式记录的历史案件,这种非结构化的数据价值密度较低、可利用性不强。利用事件抽取技术从行政执法案件文本中快速高效地抽取案件职权类型、案发时间、案发地点等结构化信息,可推动行政机关对历史案件信息的利用和智能化执法办案研究。收集整理某城市的真实案例数据,并通过人工标注构建一个行政执法领域的数据集,根据行政执法案件文本的无触发词、文档级、格式不固定等文本特征,提出结合基于Transformer的双向编码器表示(BERT)和基于条件随机场的双向长短期记忆网络(BiLSTM-CRF)模型的两阶段事件抽取方法,通过文本多分类和序列标注依次完成事件类型检测和事件论元抽取任务。实验结果表明,事件类型检测任务的F1值达到99.54%,事件论元抽取任务的F1值达到97.36%,实现了对案件信息的有效抽取。
-
关键词
行政执法案件
事件抽取
两阶段方法
基于Transformer的双向编码器表示模型
基于条件随机场的双向长短期记忆网络(BiLSTM-CRF)模型
-
Keywords
administrative law enforcement case
event extraction
two-stage method
Bidirectional Encoder Representations from Transformers(BERT)model
Bi-directional Long Short-Term Memory network with Conditional Random Field(BiLSTM-CRF)model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-