-
题名基于深度学习的远程监督关系抽取方法研究
- 1
-
-
作者
苏江文
-
机构
福建亿榕信息技术有限公司
-
出处
《电子设计工程》
2022年第2期106-109,114,共5页
-
文摘
为更好判定远程监督语句中的实体语义关系,实现对语言处理信息的准确提取,提出基于深度学习的远程监督关系抽取方法。借助远程监督方法,获取关系三元组中已存储的信息参量,再通过待学习数据标注的方式,完成远程监督关系的抽取数据集构建。在此基础上,设计监督执行框架,利用已定义的句子级别特征条件,实现对待抽取标签的学习处理,完成基于深度学习的远程监督关系抽取方法研究。实验结果表明,所提方法可同时调度的远程监督语句数值量更大,而所需的分辨等待时间却相对更短,可在有效判定远程监督语句中实体语义关系的同时,实现对语言处理信息的准确提取与分配。
-
关键词
深度学习
远程监督
关系抽取
数据标注
级别特征
实体语义关系
-
Keywords
deep learning
remote supervision
relation extraction
data annotation
grade characteristics
entity semantic relationship
-
分类号
TN914
[电子电信—通信与信息系统]
-
-
题名基于自然语言的云数据库非结构化数据提取
被引量:7
- 2
-
-
作者
侯本忠
张永强
尚颖
梁昕
刘甜甜
苏江文
-
机构
国家电网有限公司
国网北京市电力公司
国网福建省电力有限公司
国家电网有限公司大数据中心
福建亿榕信息技术有限公司
-
出处
《信息技术》
2023年第3期57-63,共7页
-
基金
国家电网公司总部数字化审计平台智能化相关技术研究科技项目(1300-201999440A-0-0-00)。
-
文摘
以非结构化数据高精度提取为目的,利用改进K-均值算法聚类云数据库非结构化数据,对分类后非结构化数据进行归一化预处理;通过基于自然语言语义的数据库目标检索模型,对预处理后的多种云数据库非结构化数据,按照用户需求实时提取。经测试:所提方法在不同数据集中,对多种类型的云数据库非结构化数据提取结果存在可信度,最大偏差为1个,偏差极小,在可接受范围内,可高精度提取云数据库非结构化数据。
-
关键词
自然语言
云数据库
非结构化
数据提取
聚类
-
Keywords
natural language
cloud database
unstructured
data extraction
clustering
-
分类号
TP3-
[自动化与计算机技术—计算机科学与技术]
-