期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
法律案件要素识别混合专家大模型
1
作者 尹华 吴梓浩 +2 位作者 柳婷婷 张佳佳 高子千 《计算机科学与探索》 CSCD 北大核心 2024年第12期3260-3271,共12页
智能司法判决正向符合法律判案逻辑的方向转变。案件要素识别是近年来提出的一项基础任务。相比于前期的基于深度学习和机器阅读理解的识别方法,采用大模型的生成式要素识别方法具有进行复杂推理的潜力。但是,目前司法大模型在这类基础... 智能司法判决正向符合法律判案逻辑的方向转变。案件要素识别是近年来提出的一项基础任务。相比于前期的基于深度学习和机器阅读理解的识别方法,采用大模型的生成式要素识别方法具有进行复杂推理的潜力。但是,目前司法大模型在这类基础任务上的效果不佳。提出了一种对话式混合专家要素识别大模型。该模型针对案件特点设计了特定的Prompt,供ChatGLM3-6B-base大模型学习;通过全参微调该大模型获得基础要素识别能力,其权重供后续混合专家共享,降低大模型学习成本;针对不同案件类型场景和标签不平衡场景,在大模型的注意力层引入案件DoRA专家和标签DoRA专家模块,提高模型对任务的区分度;设计可学习门控实现标签专家选择。在CAIL2019和某省脱敏盗窃案件要素识别数据集上,对比了三类方法的九个基准模型,并进行模型消融实验。实验结果显示,提出的模型综合性能F1值高于最优模型性能5.9个百分点;在标签不平衡的CAIL2019数据集上,标签专家一定程度上能够减缓数据极度不平衡给模型带来的影响;同时,CAIL2019上训练的模型不再需要全参微调,通过案件专家和标签专家轻量级微调后,在某省盗窃案件中取得最佳效果,证明模型具有易扩展性。 展开更多
关键词 案件要素识别 大模型 混合参数高效专家 提示词
在线阅读 下载PDF
差异性案件要素增强的案件舆情时间线生成方法
2
作者 高盛祥 赵瑶 +1 位作者 余正涛 黄于欣 《小型微型计算机系统》 CSCD 北大核心 2022年第9期1902-1907,共6页
案件舆情时间线生成是将同一案件的舆情新闻按照时间顺序生成话题簇,对于用户了解案件的发展过程具有重要意义,本质可以看做一个时间约束下的无监督聚类任务.但是描述同一案件的舆情新闻可能存在许多相同的要素导致其在聚类空间中的表... 案件舆情时间线生成是将同一案件的舆情新闻按照时间顺序生成话题簇,对于用户了解案件的发展过程具有重要意义,本质可以看做一个时间约束下的无监督聚类任务.但是描述同一案件的舆情新闻可能存在许多相同的要素导致其在聚类空间中的表征出现重叠.为了生成更有区分度的文本表征,基于自编码框架,提出一种差异性案件要素增强的案件舆情时间线生成方法.首先构建涉案舆情时间线数据集并生成每条微博文本的差异性要素;然后将差异性要素、微博文本和案件时间作为BERT编码器的输入,基于自编码框架生成文本的低维特征向量;最后基于该特征向量和K-Means聚类的方法,使用软聚类生成案件舆情时间线.实验结果表明,在构造的涉案舆情时间线数据集上,提出的方法在ACC和NMI两个聚类指标上均有较大提升. 展开更多
关键词 案件舆情时间线 差异性案件要素 自编码 软聚类
在线阅读 下载PDF
基于案件要素指导的涉案舆情新闻文本摘要方法 被引量:9
3
作者 韩鹏宇 高盛祥 +2 位作者 余正涛 黄于欣 郭军军 《中文信息学报》 CSCD 北大核心 2020年第5期56-63,73,共9页
涉案舆情新闻文本摘要任务是从涉及特定案件的舆情新闻文本中,获取重要信息作为其简短摘要,因此对于相关人员快速掌控舆情态势具有重要作用。涉案舆情新闻文本摘要相比开放域文本摘要任务,通常涉及特定的案件要素,这些要素对摘要生成过... 涉案舆情新闻文本摘要任务是从涉及特定案件的舆情新闻文本中,获取重要信息作为其简短摘要,因此对于相关人员快速掌控舆情态势具有重要作用。涉案舆情新闻文本摘要相比开放域文本摘要任务,通常涉及特定的案件要素,这些要素对摘要生成过程有重要的指导作用。因此,该文结合深度学习框架,提出了一种融入案件要素的涉案舆情新闻文本摘要方法。首先构建涉案舆情新闻摘要数据集并定义相关案件要素,然后通过注意力机制将案件要素信息融入新闻文本的词、句子双层编码过程中,生成带有案件要素信息的新闻文本表征,最后利用多特征分类层对句子进行分类。为了验证算法有效性,在构造的涉案舆情新闻摘要数据集上进行实验。实验结果表明,该方法相比基准模型取得了更好的效果,具有有效性和先进性。 展开更多
关键词 涉案舆情摘要 案件要素 双层编码 多特征分类
在线阅读 下载PDF
基于预训练语言模型的案件要素识别方法 被引量:9
4
作者 刘海顺 王雷 +3 位作者 孙媛媛 陈彦光 张书晨 林鸿飞 《中文信息学报》 CSCD 北大核心 2021年第11期91-100,共10页
案件要素识别指将案件描述中重要事实描述自动抽取出来,并根据领域专家设计的要素体系进行分类,是智慧司法领域的重要研究内容。基于传统神经网络的文本编码难以提取深层次特征,基于阈值的多标签分类难以捕获标签间的依赖关系,因此该文... 案件要素识别指将案件描述中重要事实描述自动抽取出来,并根据领域专家设计的要素体系进行分类,是智慧司法领域的重要研究内容。基于传统神经网络的文本编码难以提取深层次特征,基于阈值的多标签分类难以捕获标签间的依赖关系,因此该文提出了基于预训练语言模型的多标签文本分类模型。该模型采用以Layer-attentive策略进行特征融合的语言模型作为编码器,使用基于LSTM的序列生成模型作为解码器。在"CAIL2019"数据集上进行实验,该方法比基于循环神经网络的算法在F_(1)值上平均可提升7.4%,在相同超参数设置下宏平均F_(1)值比基础语言模型(BERT)平均提升3.2%。 展开更多
关键词 案件要素识别 多标签文本分类 智慧司法
在线阅读 下载PDF
案件要素句子关联图卷积的案件舆情摘要方法 被引量:3
5
作者 韩鹏宇 余正涛 +2 位作者 高盛祥 黄于欣 郭军军 《软件学报》 EI CSCD 北大核心 2021年第12期3829-3838,共10页
案件舆情摘要是从涉及特定案件的新闻文本簇中,抽取能够概括其主题信息的几个句子作为摘要.案件舆情摘要可以看作特定领域的多文档摘要,与一般的摘要任务相比,可以通过一些贯穿于整个文本簇的案件要素来表征其主题信息.在文本簇中,由于... 案件舆情摘要是从涉及特定案件的新闻文本簇中,抽取能够概括其主题信息的几个句子作为摘要.案件舆情摘要可以看作特定领域的多文档摘要,与一般的摘要任务相比,可以通过一些贯穿于整个文本簇的案件要素来表征其主题信息.在文本簇中,由于句子与句子之间存在关联关系,案件要素与句子亦存在着不同程度的关联关系,这些关联关系对摘要句的抽取有着重要的作用.提出了基于案件要素句子关联图卷积的案件文本摘要方法,采用图的结构来对多文本簇进行建模,句子作为主节点,词和案件要素作为辅助节点来增强句子之间的关联关系,利用多种特征计算不同节点间的关联关系.然后,使用图卷积神经网络学习句子关联图,并对句子进行分类得到候选摘要句.最后,通过去重和排序得到案件舆情摘要.在收集到的案件舆情摘要数据集上进行实验,结果表明:提出的方法相比基准模型取得了更好的效果,引入要素及句子关联图对案件多文档摘要有很好的效果. 展开更多
关键词 案件舆情摘要 图卷积 案件要素 句子关联图
在线阅读 下载PDF
融合案件要素的相似案例匹配 被引量:2
6
作者 刘权 余正涛 +2 位作者 高盛祥 何世柱 刘康 《中文信息学报》 CSCD 北大核心 2022年第11期140-147,共8页
相似案例匹配是智慧司法中的重要任务,其通过对比两篇案例的语义内容判别二者的相似程度,能够应用于类案检索、类案类判等。相对于普通文本,法律文书不仅篇幅更长,文本之间的区别也更微妙,传统深度匹配模型难以取得理想效果。为了解决... 相似案例匹配是智慧司法中的重要任务,其通过对比两篇案例的语义内容判别二者的相似程度,能够应用于类案检索、类案类判等。相对于普通文本,法律文书不仅篇幅更长,文本之间的区别也更微妙,传统深度匹配模型难以取得理想效果。为了解决上述问题,该文根据文书描写规律截取文书文本,并提出一种融合案件要素的方法来提高相似案件的匹配性能。具体来说,该文以民间借贷案件为应用场景,首先基于法律知识制定了6种民间借贷案件要素,利用正则表达式从法律文书中抽取案件要素,并形成词独热形式的案件要素表征;然后,对法律文本倒序截取,并通过BERT编码得到法律文本表征,解决法律文本的长距离依赖问题;接着使用线性网络融合法律文本表征与案件要素表征,并使用BiLSTM对融合的表征进行高维度化表示;最后通过孪生网络框架构建向量表征相似性矩阵,通过语义交互与向量池化进行最终的相似度判断。实验结果表明,该文模型能有效处理长文本并建模法律文本的细微差异,在CAIL2019-SCM公共数据集上优于基线模型。 展开更多
关键词 相似案例匹配 案件要素 预训练语言模型
在线阅读 下载PDF
基于案件要素指导及深度聚类的新闻与案件相关性分析 被引量:1
7
作者 李云龙 余正涛 +2 位作者 高盛祥 郭军军 彭仁杰 《中文信息学报》 CSCD 北大核心 2021年第11期60-69,共10页
新闻与案件相关性分析是案件领域新闻舆情分析的基础,其可以转化为文本聚类问题。由于缺乏有效的监督信息,传统聚类方法易导致聚类发散,降低结果的准确性。针对案件和新闻文本的特点,该文提出了基于案件要素指导及深度聚类的新闻与案件... 新闻与案件相关性分析是案件领域新闻舆情分析的基础,其可以转化为文本聚类问题。由于缺乏有效的监督信息,传统聚类方法易导致聚类发散,降低结果的准确性。针对案件和新闻文本的特点,该文提出了基于案件要素指导及深度聚类的新闻与案件相关性分析方法。该方法首先抽取出重要的句子表征文本;然后利用案件要素对案件进行表征,用于初始化聚类中心,指导聚类的搜索过程;最后选用卷积自编码器获得文本表征,利用重构损失和聚类损失联合训练网络,使文本的表征更接近于案件,并将文本表征和聚类过程统一到同一框架中,交替更新自编码器参数及聚类模型参数,实现文本聚类。实验表明,该文的方法较基线方法在准确率上提高了4.61%。 展开更多
关键词 相关性分析 深度聚类 文本表征 案件要素
在线阅读 下载PDF
案件要素异构图的舆情新闻抽取式摘要 被引量:1
8
作者 李刚 余正涛 黄于欣 《计算机工程与应用》 CSCD 北大核心 2023年第4期112-119,共8页
案件舆情摘要是指从与司法案件相关的舆情信息中抽取与案件相关的句子作为摘要。在案件舆情文本中通常包含如涉案人员、案发地点等案件要素,这些案件要素对于摘要生成有着重要的指导意义。因此,针对案件舆情文本的特点,提出一种基于案... 案件舆情摘要是指从与司法案件相关的舆情信息中抽取与案件相关的句子作为摘要。在案件舆情文本中通常包含如涉案人员、案发地点等案件要素,这些案件要素对于摘要生成有着重要的指导意义。因此,针对案件舆情文本的特点,提出一种基于案件要素异构图的抽取式摘要模型。首先通过基于图注意力机制融入案件要素的方法,构建一个由句子节点、词节点和案件要素节点组成的异构图,来捕捉句子间的关联关系,最后对句子进行分类,生成摘要。在基于百度百科构建的案件舆情数据集上进行实验,结果表明,模型相比基于注意力机制融入案件要素的方法在ROUGE-L上取得14.22个百分点的提升。 展开更多
关键词 案件舆情摘要 案件要素 图注意力机制 异构图
在线阅读 下载PDF
基于机器阅读理解的案件要素识别方法 被引量:1
9
作者 窦文琦 陈艳平 +2 位作者 秦永彬 黄瑞章 刘丽娟 《计算机工程与设计》 北大核心 2023年第8期2475-2481,共7页
传统的案件要素识别方法忽略了案件要素标签的语义信息。由于在裁判文书中案件要素存在严重数据不均衡问题,导致模型难以学习小样本案件要素中的语义特征。针对以上问题,提出基于机器阅读理解的案件要素识别方法。使用案件要素标签信息... 传统的案件要素识别方法忽略了案件要素标签的语义信息。由于在裁判文书中案件要素存在严重数据不均衡问题,导致模型难以学习小样本案件要素中的语义特征。针对以上问题,提出基于机器阅读理解的案件要素识别方法。使用案件要素标签信息构建问题,指代所要识别的案件要素类型,将问题与文本拼接输入RoBERTa模型进行编码;通过双向注意力机制从两个方向出发为上下文和问题的交互提供补充信息;经过全连接网络预测案件要素是否存在;在词嵌入部分添加对抗扰动,提高模型的鲁棒性。该模型能够通过语言模型学习文本中的语义特征,有效避免了小样本案件要素中的语义特征稀疏问题。实验结果表明,该模型能有效提升数据集中小样本案件要素的识别性能。 展开更多
关键词 机器阅读理解 案件要素 识别 标签信息 预训练语言模型 小样本 裁判文书
在线阅读 下载PDF
基于案件要素的案件话题优化
10
作者 彭仁杰 余正涛 +3 位作者 高盛祥 李云龙 郭军军 赵培莲 《小型微型计算机系统》 CSCD 北大核心 2021年第12期2561-2566,共6页
话题模型已被广泛用于文本话题的发现.但是在案件话题领域,这些方法生成的话题与案件相关性不高,可解释性比较差,导致话题生成质量不高.为了解决这些问题,本文提出了基于案件要素指导下的话题优化方法:首先利用案件要素信息对话题模型... 话题模型已被广泛用于文本话题的发现.但是在案件话题领域,这些方法生成的话题与案件相关性不高,可解释性比较差,导致话题生成质量不高.为了解决这些问题,本文提出了基于案件要素指导下的话题优化方法:首先利用案件要素信息对话题模型进行改进,结合案件要素与BTM话题模型特征向量,将文档词与案件要素的相关性与BTM话题模型的话题分布结合,获得案件微博中与案件更相关的话题词,通过选取与案件相关的候选词来表征话题;最后再计算案件话题候选词与文本词之间的相关性和文档与案件要素的相似度,得到案件话题词集.通过对新浪微博数据集的对比实验及结果说明,能够显著改善案件话题的发现质量. 展开更多
关键词 话题模型 话题优化 案件要素 相似度计算
在线阅读 下载PDF
基于主题交互图的案件话题摘要 被引量:2
11
作者 黄于欣 余正涛 +2 位作者 郭军军 于志强 高凡雅 《软件学报》 EI CSCD 北大核心 2023年第4期1796-1810,共15页
从案件相关的话题评论中生成简短的话题描述对于快速了解案件舆情有着重要作用,其可以看做是基于用户评论的多文档摘要任务.然而用户评论中含有较多噪声且生成摘要所需的重要信息分散在不同的评论句中,直接基于序列模型容易生成错误或... 从案件相关的话题评论中生成简短的话题描述对于快速了解案件舆情有着重要作用,其可以看做是基于用户评论的多文档摘要任务.然而用户评论中含有较多噪声且生成摘要所需的重要信息分散在不同的评论句中,直接基于序列模型容易生成错误或不相关的摘要.为了缓解上述问题,提出一种基于主题交互图的案件话题摘要方法,将嘈杂的用户评论组织为主题交互图,利用图来表达不同用户评论之间的关联关系,从而过滤重要的用户评论信息.具体来说,首先从评论句中抽取案件要素,然后构造以案件要素为节点,包含案件要素的句子为内容的主题交互图;然后利用图Transformer网络生成图中节点的表征,最后生成简短的话题描述.在收集的案件话题摘要数据集上的实验结果表明,所提方法是一种有效的数据选择方法,能够生成连贯、事实正确的话题摘要. 展开更多
关键词 案件话题摘要 用户评论 主题交互图 案件要素 图Transformer网络
在线阅读 下载PDF
基于非对称孪生网络的新闻与案件相关性分析 被引量:2
12
作者 赵承鼎 郭军军 +3 位作者 余正涛 黄于欣 刘权 宋燃 《中文信息学报》 CSCD 北大核心 2020年第3期99-106,共8页
新闻与案件的相关性分析是法律领域新闻舆情分析的重要环节,可转化为新闻文本与案件文本的相似度计算任务。借助孪生网络计算文本相似度是一种有效途径,其对平衡样本具有良好的学习能力,但在新闻与案件的相关性计算中面临文本不平衡和... 新闻与案件的相关性分析是法律领域新闻舆情分析的重要环节,可转化为新闻文本与案件文本的相似度计算任务。借助孪生网络计算文本相似度是一种有效途径,其对平衡样本具有良好的学习能力,但在新闻与案件的相关性计算中面临文本不平衡和新闻文本冗余的问题,因此,该文提出了基于非对称孪生网络的新闻与案件相关性计算方法。通过计算文本中句子与标题的相似度选取与新闻标题最相关的句子表征文档,去除新闻文本中的冗余句子,利用非对称孪生网络建模,考虑到案件要素蕴含案件的关键语义信息,将案件要素作为监督信息融入到非对称孪生网络中对新闻文档和案件描述进行编码,解决新闻和案件在结构和语义上不平衡的问题,最终实现新闻与案件的相关性判断。实验表明该模型相比基线模型准确率提升了2.52%。 展开更多
关键词 非对称孪生网络 案件要素 相关性分析
在线阅读 下载PDF
融入标签信息的民间借贷案情要素识别方法
13
作者 左江涛 张恒滔 《现代电子技术》 2023年第21期76-81,共6页
民间借贷案情要素识别旨在通过对裁判文书的理解,将能够反映案件主要事实的要素按照属性体系提取出来。现有的要素识别主要基于序列标注方法进行,但民间借贷案情要素包含的部分隐式要素无法被标注。文中将其转化为多标签文本分类任务,... 民间借贷案情要素识别旨在通过对裁判文书的理解,将能够反映案件主要事实的要素按照属性体系提取出来。现有的要素识别主要基于序列标注方法进行,但民间借贷案情要素包含的部分隐式要素无法被标注。文中将其转化为多标签文本分类任务,通过“民事BERT”对标签属性、要素标签与裁判文书事实描述进行语义编码,基于前馈神经网络构建的融合模块将事实描述表示分别和预定义的十类要素属性表示进行特征融合,再利用标签注意力机制获得某一要素属性下不同要素标签的关注度,最后借助分类器分别识别每一类属性的要素。实验结果显示,该方法在验证集和测试集上的平均F1值较基线模型BERT均有提升。 展开更多
关键词 智慧司法 案件要素识别 多标签文本分类 民间借贷案件 自然语言处理 注意力
在线阅读 下载PDF
基于神经自回归分布估计的涉案新闻主题模型构建方法 被引量:5
14
作者 毛存礼 梁昊远 +3 位作者 余正涛 郭军军 黄于欣 高盛祥 《中文信息学报》 CSCD 北大核心 2021年第2期89-98,共10页
神经主题模型能有效获取文本的深层语义特征,但现有的神经主题模型忽略了外部知识对获取主题分布的帮助。因此,针对涉案主题分析任务,该文提出了一种基于神经自回归分布估计的涉案新闻主题模型构建方法。以案件要素作为外部知识对iDocNA... 神经主题模型能有效获取文本的深层语义特征,但现有的神经主题模型忽略了外部知识对获取主题分布的帮助。因此,针对涉案主题分析任务,该文提出了一种基于神经自回归分布估计的涉案新闻主题模型构建方法。以案件要素作为外部知识对iDocNADEe模型进行了扩展,通过计算案件要素与主题词的相关度来构建注意力机制对iDocNADEe模型双向编码的隐状态进行加权,利用神经自回归算法计算加权后的主题词双向隐状态的自回归条件概率实现涉案新闻文本主题模型构建。实验结果表明,该文提出方法较基线模型困惑度降低了0.66%、主题连贯性提高了6.26%,并且在文档检索精确率方面也明显高于基线模型。 展开更多
关键词 案件要素 iDocNADEe 注意力机制 神经自回归分布估计 涉案新闻 主题模型
在线阅读 下载PDF
基于深度条件依赖网络的裁判文书信息抽取
15
作者 翁洋 向迪 +2 位作者 郭晓冬 洪文兴 李鑫 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第6期1021-1029,共9页
裁判文书信息抽取旨在对裁判文书中包含的信息进行结构化处理,是法律人工智能研究的重要任务.目前的研究多是把裁判文书的信息抽取任务看成一个多标签文本分类任务,而没有考虑标签之间的依赖性.为此,提出了基于深度条件依赖网络的裁判... 裁判文书信息抽取旨在对裁判文书中包含的信息进行结构化处理,是法律人工智能研究的重要任务.目前的研究多是把裁判文书的信息抽取任务看成一个多标签文本分类任务,而没有考虑标签之间的依赖性.为此,提出了基于深度条件依赖网络的裁判文书信息抽取框架,用于裁判文书的案件要素信息抽取和争议焦点信息抽取.该框架由两部分组成,一是框架前端的特征提取网络用来挖掘裁判文书的文本特征,二是框架后端的标签关系网络来构建多个标签间的依赖性关系.在两个真实数据集上的实验结果表明,该模型在基线上都取得了显著且一致的改进,并且具有很好的扩展性,在该框架下可以获得多标签文本分类任务效果的提升. 展开更多
关键词 裁判文书 信息抽取 案件要素 争议焦点 依赖关系建模
在线阅读 下载PDF
从电子数据取证到电子数据侦查 被引量:2
16
作者 黄勇 李毅 +1 位作者 郭恒 汤伟 《计算机科学》 CSCD 北大核心 2016年第B12期119-126,共8页
从1999年美国出现第一款商用计算机取证工具并随后引入中国、2013年《刑事诉讼法》首次确立“电子数据”作为证据的法律地位至今,电子数据取证技术和产品已经在司法机关得到广泛应用。然而,电子数据取证以技术为先的理念极大地限制了... 从1999年美国出现第一款商用计算机取证工具并随后引入中国、2013年《刑事诉讼法》首次确立“电子数据”作为证据的法律地位至今,电子数据取证技术和产品已经在司法机关得到广泛应用。然而,电子数据取证以技术为先的理念极大地限制了其自身发展的空间。电子数据侦查是跨越电子数据取证局限性的一种全新理念:在刑事案件侦查全过程中,以发现和收集案件相关证据、查明犯罪事实、确定和查获犯罪嫌疑人为目标,围绕以案件要素构成的研判模型,从海量电子数据中挖掘线索和证据,直至案件侦破终结的一系列案件研判活动。依此理念提出满足公安机关和检察机关侦查业务需求的解决方案,将为电子数据在刑事案件侦查领域的应用开辟更广阔的空间。 展开更多
关键词 电子数据侦查 案件构成要素 案件研判模型 智能研判
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部