-
题名面向借贷案件的相似案例匹配模型
被引量:3
- 1
-
-
作者
曹发鑫
孙媛媛
王治政
潘丁豪
林鸿飞
-
机构
大连理工大学计算机科学与技术学院
-
出处
《计算机工程》
CSCD
北大核心
2024年第1期306-312,共7页
-
基金
国家重点研发计划(2022YFC3301801)
中央高校基本科研业务费专项资金(DUT22ZD205)。
-
文摘
相似案例匹配任务是文本匹配在司法领域的具体应用之一,目的在于区分法律文书是否相似,对类案检索具有重要意义。与传统文本匹配任务相比,法律文本通常篇幅较长,同时相似案例匹配是针对相同案由案件的匹配,案情文本之间的差异较小,以往的文本匹配方法很难计算文本相似度。针对借贷案件文本匹配存在的问题,建立一种融合借贷案件关键要素的相似案例匹配模型。为了获取文本中更丰富的语义特征,构建正则表达式获得借贷案件的特定案件要素,如借款交付形式、借款人基本属性等,并与原有的案情文本相结合,联合学习法律文本与案件关键要素的语义特征。同时,利用共享权重的预训练模型分别对不同的文书进行编码,并且对预训练模型特定编码层的输出进行融合,得到更加丰富的语义信息。引入有监督对比学习框架,更好地利用样本信息,进一步提高相似案例匹配的性能。在CAIL2019-SCM数据集上的实验结果表明,与LFESM模型相比,该模型在测试集上的准确率提高了1.05个百分点。
-
关键词
相似案例匹配
孪生网络
对比学习
预训练模型
法律关键要素
-
Keywords
Similar Case Matching(SCM)
Siamese network
contrastive learning
pretrained model
key legal element
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合案件要素的相似案例匹配
被引量:2
- 2
-
-
作者
刘权
余正涛
高盛祥
何世柱
刘康
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
中国科学院自动化研究所
-
出处
《中文信息学报》
CSCD
北大核心
2022年第11期140-147,共8页
-
基金
国家重点研发计划(2018YFC0830101,2018YFC0830105,2018YFC0830100)
国家自然科学基金(61972186,61761026,61762056)
+3 种基金
云南省重大科技专项计划项目(202002AD080001-5)
云南省基础研究计划(202001AS070014,2018FB104)
云南省高新技术产业专项(201606)
云南省人培项目(KKSY201703005)。
-
文摘
相似案例匹配是智慧司法中的重要任务,其通过对比两篇案例的语义内容判别二者的相似程度,能够应用于类案检索、类案类判等。相对于普通文本,法律文书不仅篇幅更长,文本之间的区别也更微妙,传统深度匹配模型难以取得理想效果。为了解决上述问题,该文根据文书描写规律截取文书文本,并提出一种融合案件要素的方法来提高相似案件的匹配性能。具体来说,该文以民间借贷案件为应用场景,首先基于法律知识制定了6种民间借贷案件要素,利用正则表达式从法律文书中抽取案件要素,并形成词独热形式的案件要素表征;然后,对法律文本倒序截取,并通过BERT编码得到法律文本表征,解决法律文本的长距离依赖问题;接着使用线性网络融合法律文本表征与案件要素表征,并使用BiLSTM对融合的表征进行高维度化表示;最后通过孪生网络框架构建向量表征相似性矩阵,通过语义交互与向量池化进行最终的相似度判断。实验结果表明,该文模型能有效处理长文本并建模法律文本的细微差异,在CAIL2019-SCM公共数据集上优于基线模型。
-
关键词
相似案例匹配
案件要素
预训练语言模型
-
Keywords
case matching
case elements
pre-training language model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-