-
题名面向数据生产的跨计算引擎数据调度技术研究
- 1
-
-
作者
雷鸣
李丹
-
机构
中国司法大数据研究院有限公司
中国电子科学研究院
-
出处
《中国电子科学研究院学报》
2024年第6期570-577,共8页
-
文摘
随着数据处理任务的日渐复杂,传统的数据计算引擎面临着存储管理和计算资源调度的挑战。本文深入探讨了如何提升跨计算引擎数据资源调度的性能和降低其复杂性。研究聚焦于数据生产任务,通过结合实际应用场景,重点研究了数据资源在不同计算引擎间的存储和调度优化技术,提出了超级调度器设计、多维度细粒度资源分配以及基于任务优先级的资源调度等技术方案。实现不同计算任务在多个计算引擎间的高效协作,从而最大化计算资源的利用率和处理速度,为解决大规模数据生产中的资源调度问题提供了有效的技术方案。
-
关键词
数据调度
跨计算引擎
数据生产
任务调度器
-
Keywords
data scheduling
cross-computing engine
data production
task scheduler
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TN929.5
[电子电信—通信与信息系统]
-
-
题名基于司法裁判文本的法律要素抽取方法
- 2
-
-
作者
董玉红
卢鹏
陈静
郭新刚
陈震
-
机构
中国司法大数据研究院有限公司
-
出处
《中国电子科学研究院学报》
2024年第6期552-558,569,共8页
-
基金
国家重点研发计划(2021YFC3340103)。
-
文摘
随着全国法院信息化建设的不断发展,积累了大规模的司法裁判文书数据,如何从法律文书数据中抽取出准确的法律要素是保障法院信息化建设的重要前提。本研究主要基于盗窃罪案件法律文书数据,采用深度学习方法构建了BERT+BiLSTM+CRF融合语言模型以解决法律文书的关键要素抽取问题。利用BERT语言模型解决文本特征表示中的一词多义问题,使用BiLSTM神经网络充分学习上下文信息的特点,采用CRF机器学习方法提取全局最优标注序列,并搭建可视化界面提供案件要素提取服务。结果表明,从整体来看,通过数据增强后所构建的BERT+BiLSTM+CRF融合语言模型面向盗窃罪案件的综合评价指标F1_score值达到了90.6%;从单个要素的抽取结果来看,该模型面向盗窃罪案件的十个法律要素的综合评价指标的F1_score值均在81.8%以上;从最佳预测性能所分布的法律要素占比来看,该模型达到最优预测性能的法律要素量达到了50%,明显优于其他模型。这说明本研究所构建的BERT+BiLSTM+CRF融合语言模型可以有效解决法律文书的关键要素抽取问题,可为全国法院信息化建设提供一定的理论依据和有效技术支撑。
-
关键词
法律要素
抽取
裁判文本
BERT
BiLSTM
CRF
-
Keywords
legal elements
extract
judgment text
BERT
BiLSTM
CRF
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP319
[自动化与计算机技术—计算机软件与理论]
-
-
题名智慧法院中电子卷宗随案同步生成与深度应用的研究
被引量:2
- 3
-
-
作者
徐斌
许方舳
连晓燕
-
机构
中国司法大数据研究院有限公司
-
出处
《中国电子科学研究院学报》
北大核心
2022年第8期787-793,共7页
-
基金
国家重点研发计划资助项目(2019YFC0810802
2020YFC0832602)。
-
文摘
智慧法院正处于快速发展的重要阶段,电子卷宗是实现全流程无纸化、智能化办案的基础,是建设智慧法院的重中之重,全国各级法院高度重视电子卷宗随案同步生成和深度应用工作。随着OCR、自然语言处理等相关技术的发展,电子卷宗的应用效果越来越好,正逐渐取代纸质卷宗。文中面向电子卷宗在法院信息化领域的生成与应用,对电子卷宗的概念内涵及发展现状进行了概述,并重点阐述了电子卷宗系统的总体架构、关键技术和应用场景,为后续智慧法院电子卷宗的发展提出了新思路。
-
关键词
智慧法院
电子卷宗
深度应用
无纸化办案
-
Keywords
intellectual court
electronic dossier
in-depth application
paperless case handling
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
D926.2
[政治法律—法学]
-
-
题名基于神经网络的电子卷宗自动分类方法研究
被引量:3
- 4
-
-
作者
李盼
王玉
吴正午
-
机构
中国司法大数据研究院有限公司
上海交大慧谷通用技术有限公司
-
出处
《中国电子科学研究院学报》
北大核心
2021年第4期363-368,共6页
-
基金
国家重点研发计划资助项目(2018YFC0831600,2018YFC0831603)。
-
文摘
针对电子卷宗文档图像的自动化识别分类对上下文的逻辑结构考虑不充分的问题,提出一种基于神经网络的电子卷宗识别方法。首先,输入电子卷宗图像;然后,利用卷积神经网络识别图像的静态特征;第三,根据电子卷宗的关键要素及上下文关系,将这些静态特征按特定的版面结构转换为时序信号;第四,利用循环神经网络对时序信号进行处理,识别电子卷宗的动态特征;最后,通过对涵盖民事、刑事、行政三类案件类型的电子卷宗的自动识别实验对该方法进行验证。实验结果表明,电子卷宗的自动分类准确率达到95%以上。
-
关键词
电子卷宗
神经网络
分类
-
Keywords
electronic dossier
neural network
classification
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名虚拟现实法庭技术架构研究与应用
被引量:1
- 5
-
-
作者
宋婧
吴正午
韩权杰
-
机构
中国司法大数据研究院有限公司
-
出处
《中国电子科学研究院学报》
北大核心
2021年第8期820-826,共7页
-
基金
国家重点研发计划资助项目(2018YFC0832306)。
-
文摘
司法领域目前正处于技术改革的重要阶段,大数据、云计算、虚拟现实等现代科技正不断融入其中并得以应用。由于虚拟现实和增强现实技术具有互动性及沉浸性的特点,研究将虚拟技术应用于司法审判,并融入基于大数据的司法智能辅助功能,将极大地改变中国未来法庭审判的过程和模式。文中面向虚拟技术在司法领域的深度应用,重点阐述虚拟现实法庭的架构、关键技术和应用场景,为中国司法实践活动创新提供重要思路。
-
关键词
司法领域
虚拟庭审
智能辅助
司法实践
-
Keywords
judicial domain
virtual trial
intelligent auxiliary
judicial practice
-
分类号
P391.9
[天文地球—地球物理学]
-
-
题名基于深度学习的多维度证据要素关联关系抽取研究
被引量:1
- 6
-
-
作者
赵晋斌
王凯
李盼
-
机构
中国人民解放军
中经柏诚科技(北京)有限责任公司
中国司法大数据研究院有限公司
-
出处
《中国电子科学研究院学报》
北大核心
2021年第12期1251-1256,1263,共7页
-
基金
国家重点研发计划资助项目(2018YFC0830200,2018YFC0830202)。
-
文摘
随着社会法治化发展,法院受案数量呈爆发式增长,各证据要素之间关联较弱,影响法律审判效率。基于上述问题,提出一种基于深度学习的多维度证据要素关联关系抽取模型,设计基于BERT_BiGRU_CNN模型的证据要素关联关系抽取算法。本文以裁判文书为数据集,使用BERT训练所需字词向量,开展BERT、BERT_CNN、BERT_BiGRU以及BERT_BiGRU_CNN的对比研究,研究关系抽取技术在证据要素间的识别效果、研究表明,采用BERT_BiGRU_CNN算法在多要素证据关联关系之间的识别效果最好,且相比于其他模型,BERT_BiGRU_CNN的F1得分达到84.3%。
-
关键词
法律智能
关系抽取
裁判文书
信息抽取
-
Keywords
legal intelligence
relation extraction
judgment
information extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向类案检索的事理图谱构建方法研究
- 7
-
-
作者
崔衍
胡亚谦
段智峰
贾高峰
-
机构
中国司法大数据研究院有限公司
-
出处
《中国电子科学研究院学报》
北大核心
2023年第3期228-236,共9页
-
基金
国家重点研发计划(2021YFC3340100)。
-
文摘
围绕司法案件裁判文书中词语的语义信息关系以及事件的信息表现特征,针对法院类案检索系统通过关键词匹配无法准确获取案件信息特征的问题,提出了一个基于自然语言处理技术的案件事理图谱构建方法。该方法采用基于信息抽取的裁判文书预处理技术、分布式词表示的文书语义特征提取技术、语义句法技术以及聚类的图谱触发词拓展技术联合构建案件事理图谱,深度挖掘隐藏在司法裁判文书之下的案件信息特征,验证并实现了一个高效、可靠、可扩展的事理图谱的构建方法。
-
关键词
类案检索
事理图谱
依存句法
实体抽取
关系抽取
词语聚类
-
Keywords
case retrieval
rational map
dependency parsing
entity extraction
relation extraction
words clustering
-
分类号
TP319
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向科技文献的精准推荐引擎研究
- 8
-
-
作者
王淇
刘忠麟
向波
-
机构
中国司法大数据研究院有限公司
中国电子科技集团公司第十五研究所
-
出处
《中国电子科学研究院学报》
北大核心
2022年第10期983-990,共8页
-
文摘
随着科技领域数据的快速增长,研究人员对科研信息的获取需求已不仅限于传统的单一式阅读,如何使用当下流行的推荐技术挖掘用户特征和内容特征中丰富的隐含信息,实现海量科技信息的个性化精准发现,并打造复杂场景下的混合推荐已成为推荐系统研究领域的重要方向。文中面向科技文献领域的精准推荐引擎设计与应用,对精准推荐引擎的研究现状进行了概述,并阐述了精准推荐引擎系统的运行流程、技术架构、关键技术,为面向科技文献的精准推荐引擎的设计和工程实现提供重要参考。
-
关键词
推荐引擎
精准推荐
科技文献
特征挖掘
-
Keywords
recommendation engine
accurate recommendation
scientific literature
feature mining
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名基于XLNet的法律核心要素识别应用
- 9
-
-
作者
张棋
胡亚谦
赵耀
吉艳利
李建歧
洪通亮
-
机构
中国司法大数据研究院有限公司
-
出处
《信息技术与信息化》
2024年第9期46-49,共4页
-
基金
国家重点研发计划项目“司法知识推理与服务引擎构建技术”(2021YFC3340103)。
-
文摘
法律核心要素的精准识别,有助于提升案件判决的准确度及效率。然而,现有深度学习方法的准确率受限于案件信息的复杂度,通常无法有效提取事实描述中的上下文关系。对此,提出了将极长网络(extra-long network,XLNet)应用于法律核心要素识别。利用CAIL2019提供的要素识别任务数据集进行分案由训练和预测,分案由divorce、labor和loan下性能评估指标F1值分别达到71.79%、57.31%、72.79%,均为最佳,比第二名分别高4.8、20.4、10.0个百分点。实验结果表明,XLNet模型在法律核心要素的多标签二分类任务中具有良好表现。
-
关键词
要素识别
多标签分类
极长网络
-
分类号
D926
[政治法律—法学]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种适用于孔隙体积应变的有效应力方程
被引量:1
- 10
-
-
作者
毛小龙
刘月田
关文龙
任兴南
冯月丽
丁祖鹏
-
机构
中国石油大学石油工程教育部重点实验室
中国司法大数据研究院有限公司
中国石油勘探开发研究院
中海油研究总院责任有限公司
-
出处
《岩土力学》
EI
CAS
CSCD
北大核心
2019年第8期3004-3010,共7页
-
基金
国家自然科学基金(No.51374222)
国家重大专项(No.2016ZX05032005-002)
+1 种基金
国家重点基础研究发展计划项目(973计划)(No.2015CB250905)
中国石油重大科技专项(No.2017E-0405)~~
-
文摘
土力学奠基石Terzaghi有效应力原理被广泛应用于油藏孔隙和渗透率应力敏感研究中,然而其对于岩石孔隙体积应变的适用性存在争议。对颗粒不可压缩和颗粒可压缩的多孔介质分别进行了受力分析,推导了总体积、颗粒骨架、孔隙体积的有效应力表达式,与Biot、Skepmton有效应力方程对比,建立了适用于孔隙体积应变的新型有效应力方程,并进行了试验论证和应用举例。研究表明:在颗粒不可压缩多孔介质中,有效应力为超出平衡孔隙流压之外的颗粒间宏观等效应力;在颗粒可压缩变形多孔介质中,有效应力为其相同应变下的等效应力,有3种有效应力分别适用于总体积应变、颗粒体积应变、孔隙体积应变;新提出的孔隙体积有效应力方程与孔隙度、岩石总体积压缩系数、颗粒压缩系数、总应力和流压相关,4个理论计算式计算结果在3种多孔介质试验测试结果中的偏差均在5%以内;孔隙体积有效应力系数解决了如何定量增总应力来等效模拟储层降流压生产过程这一关键问题,3个压缩系数关系式理论计算准确方便。
-
关键词
有效应力方程
压缩系数
颗粒变形
孔隙体积应变
总体积应变
应力敏感
-
Keywords
effective stress equation
compressibility coefficient
grain deformation
pore volume strain
total volume strain
stress sensitive effect
-
分类号
TU451
[建筑科学—岩土工程]
-
-
题名基于规则推理和贝叶斯网络算法的多方证据关联分析
被引量:2
- 11
-
-
作者
赵晋斌
王凯
李盼
-
机构
中国人民解放军
中经柏诚科技(北京)有限责任公司
中国司法大数据研究院有限公司
-
出处
《中国电子科学研究院学报》
北大核心
2022年第5期508-514,共7页
-
基金
国家重点研发计划资助项(2018YFC0830200,2018YFC0830202)。
-
文摘
目前,中国司法数据存在数据价值密度低,关联性差等问题。从大量的冗杂司法数据中进行文本分类的高效处理,快速提取出有效信息,不仅能够有效地节约法院诉讼服务的人力及空间资源,同时能够为公众随时提供简单、安全、智慧、高效的诉讼智能服务。因此,文中设计出一种基于规则推理和贝叶斯网络算法的多方证据关联分析方法,从海量司法数据中删除噪音数据,进而完成对关键信息的抽取与证据要素识别。根据数据中当事人的诉讼材料,形成结构化的证据要素,通过多方证据关联模型中证据链条实验结果与真实证据链条相似度计算结果抽取出多方证据要素的关联关系,有效实现可信证据链条的深度挖掘。
-
关键词
司法数据
规则推理
贝叶斯网络算法
文本分类
-
Keywords
judicial data
rule reasoning
Bayesian network algorithm
text classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-