-
题名面向中文法律裁判文书的抽取式摘要算法
- 1
-
-
作者
温嘉宝
杨敏
-
机构
中国科学院深圳先进技术研究院
中国科学院大学
-
出处
《集成技术》
2024年第1期62-71,共10页
-
基金
深圳市基础研究重点项目(JCYJ20210324115614039)。
-
文摘
裁判文书自动摘要的目的在于让计算机能够自动选择、抽取和压缩法律文本中的重要信息,从而减轻法律从业者的工作量。目前,大多数基于预训练语言模型的摘要算法对输入文本的长度存在限制,因此无法对长文本进行有效摘要。为此,该文提出了一种新的抽取式摘要算法,利用预训练语言模型生成句子向量,并基于Transformer编码器结构融合包括句子向量、句子位置和句子长度在内的信息,完成句子摘要。实验结果显示,该算法能够有效处理长文本摘要任务。此外,在2020年中国法律智能技术评测(CAIL)摘要数据集上进行测试的结果表明,与基线模型相比,该模型在ROUGE-1、ROUGE-2和ROUGE-L指标上均有显著提升。
-
关键词
抽取式摘要模型
法律裁判文书
文本自动摘要
深度神经网络
-
Keywords
extractive summarization model
legal judgment documents
automatic text summarization
deep neural network
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-