期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种新的基于深度学习的重叠关系联合抽取模型
被引量:
5
1
作者
赵敏钧
赵亚伟
+1 位作者
赵雅捷
罗刚
《中国科学院大学学报(中英文)》
CSCD
北大核心
2022年第2期240-251,共12页
随着互联网技术的快速发展和移动设备的普及,我们每时每刻都被各种各样的信息包围着。如何从海量的数据中挖掘出具有价值的信息一直是国内外研究的热点。其中,关系抽取是信息抽取的一个重要子任务,目的是从文本中识别出实体之间的关系,...
随着互联网技术的快速发展和移动设备的普及,我们每时每刻都被各种各样的信息包围着。如何从海量的数据中挖掘出具有价值的信息一直是国内外研究的热点。其中,关系抽取是信息抽取的一个重要子任务,目的是从文本中识别出实体之间的关系,从而挖掘出文本中的结构化信息,即事实三元组。在文本中,实体重叠和关系重叠是非常普遍的现象,但是现有的联合抽取模型不能够有效地解决这类问题,因此提出一种新的联合抽取模型,将关系抽取任务看作由2个子任务实体识别和关系识别组成,并分别使用序列标注的方法和多分类方法进行识别。在联合抽取过程中,为充分挖掘文本语义信息,在模型的输入层添加词性(POS)和句法依存关系(Deprel)特征,同时为消除随着句子长度增加带来的长距离依赖问题,在模型中引入注意力机制。最后,论文在NYT数据集和WebNLG数据集上进行关系抽取实验,结果表明论文提出的模型能够有效地解决关系重叠的问题,并取得最佳抽取效果。
展开更多
关键词
关系
抽取
实体重叠
联合抽取模型
深度学习
在线阅读
下载PDF
职称材料
铝硅合金实体关系抽取数据集的构建方法
被引量:
5
2
作者
刘英莉
吴瑞刚
+1 位作者
么长慧
沈韬
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2022年第2期245-253,共9页
针对材料领域没有适合材料实体关系抽取技术研究工作的公开数据集这一问题,通过研究高硅铝合金喷射沉积文献提出铝硅合金实体关系抽取数据集的构建方法.在材料领域专家的指导下制定铝硅合金实体关系抽取数据集的构建标准,并根据构建标...
针对材料领域没有适合材料实体关系抽取技术研究工作的公开数据集这一问题,通过研究高硅铝合金喷射沉积文献提出铝硅合金实体关系抽取数据集的构建方法.在材料领域专家的指导下制定铝硅合金实体关系抽取数据集的构建标准,并根据构建标准对收集的数据进行实体标注和关系标注.在标注完成后,通过数据预处理生成铝硅合金实体关系抽取数据集.通过实体关系联合抽取模型进行实验,验证该数据集可以应用于实体关系抽取任务.与公开数据集相比,材料数据集句子的语义和语法更为复杂,长句更多,导致实体关系联合抽取模型在材料数据集上的表现略差.针对上述问题,在实体关系联合抽取模型上加入自注意力机制,使该模型整体的F1值提高了约5.8%.该数据集的构建方法具有普适性,可以通过该构建方法构建材料数据集.
展开更多
关键词
数据集
构建标准
数据标注
实体关系
联合抽取模型
自注意力机制
在线阅读
下载PDF
职称材料
基于迁移学习的化学键能数据自动抽取
被引量:
1
3
作者
庞娜
袁钺
薛秋红
《现代情报》
CSSCI
2023年第1期19-28,共10页
[目的/意义]在计算化学中,化学键能是重要的化学领域科学数据,目前化学键能数据抽取工作主要是由领域专家手动抽取,效率低下,大多数化学键能科学数据被湮没于海量文献中,无益于深入的、创新的科学数据分析。[方法/过程]为了解决该问题,...
[目的/意义]在计算化学中,化学键能是重要的化学领域科学数据,目前化学键能数据抽取工作主要是由领域专家手动抽取,效率低下,大多数化学键能科学数据被湮没于海量文献中,无益于深入的、创新的科学数据分析。[方法/过程]为了解决该问题,本研究以ChemBE化学键能语料为实验对象,设计在较少专家支持的情况下,使用迁移学习的方法在化学论文中自动抽取与化学键能相关的科学数据。本文提出了一种端到端的BERT-CRF模型,通过构建领域高频子词的方法来解决大量未登录词的问题,并在后续深度学习模型的训练中,将构建好的领域高频子词作为领域特征输入到深度学习模型中,实现了对论文中的化学键能科学数据自动、高效地抽取。[结果/结论]实验表明,端到端的BERT-CRF模型与需要专家构建规则的基线模型相比,取得了理想的实验结果,F1值达到了88.56%。本文通过构建领域高频子词来解决大量未登录词的问题,降低了对领域专家的要求,可以较为容易地、低成本地迁移到其他领域。本文的研究结果是情报分析技术在化学领域的实践,为化学键能的智能知识检索提供了重要支撑。
展开更多
关键词
迁移学习
化学键能
深度学习
自动
抽取
智能知识检索
领域高频子词
联合抽取模型
科学数据
文本挖掘
在线阅读
下载PDF
职称材料
基于BERT-WWM预训练的跨文档三元组提取
被引量:
2
4
作者
章振增
《计算机应用与软件》
北大核心
2023年第6期181-186,215,共7页
关于跨文档三元组(Subject Predicate Object,SPO)抽取任务,当前的研究主要基于句子级别的分析。然而很多场景下SPO元素可能分散于文档的各个位置,句子级别的抽取技术远远无法满足需求,因此提出一种Doc2SpSPO联合SPO抽取模型。该模型通...
关于跨文档三元组(Subject Predicate Object,SPO)抽取任务,当前的研究主要基于句子级别的分析。然而很多场景下SPO元素可能分散于文档的各个位置,句子级别的抽取技术远远无法满足需求,因此提出一种Doc2SpSPO联合SPO抽取模型。该模型通过Span候选集模型生成初始实体信息,基于BERT-WWM预训练模型得到上下文以及候选实体相关Embedding信息进行分类任务从而实现SPO的联合提取。实验结果表明,该模型实体识别可达到F1值44.4%、关系分类准确率66.9%的较好效果。
展开更多
关键词
跨文档三元组
抽取
BERT
Span规则
联合
实体关系
抽取
模型
在线阅读
下载PDF
职称材料
题名
一种新的基于深度学习的重叠关系联合抽取模型
被引量:
5
1
作者
赵敏钧
赵亚伟
赵雅捷
罗刚
机构
中国科学院大学工程科学学院
北京知因智慧科技有限公司AI实验室
出处
《中国科学院大学学报(中英文)》
CSCD
北大核心
2022年第2期240-251,共12页
基金
the National Natural Science Foundation of China(61872331)
University of Chinese Academy of Sciences。
文摘
随着互联网技术的快速发展和移动设备的普及,我们每时每刻都被各种各样的信息包围着。如何从海量的数据中挖掘出具有价值的信息一直是国内外研究的热点。其中,关系抽取是信息抽取的一个重要子任务,目的是从文本中识别出实体之间的关系,从而挖掘出文本中的结构化信息,即事实三元组。在文本中,实体重叠和关系重叠是非常普遍的现象,但是现有的联合抽取模型不能够有效地解决这类问题,因此提出一种新的联合抽取模型,将关系抽取任务看作由2个子任务实体识别和关系识别组成,并分别使用序列标注的方法和多分类方法进行识别。在联合抽取过程中,为充分挖掘文本语义信息,在模型的输入层添加词性(POS)和句法依存关系(Deprel)特征,同时为消除随着句子长度增加带来的长距离依赖问题,在模型中引入注意力机制。最后,论文在NYT数据集和WebNLG数据集上进行关系抽取实验,结果表明论文提出的模型能够有效地解决关系重叠的问题,并取得最佳抽取效果。
关键词
关系
抽取
实体重叠
联合抽取模型
深度学习
Keywords
relation extraction
entity overlapped
joint extraction model
deep learning
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
铝硅合金实体关系抽取数据集的构建方法
被引量:
5
2
作者
刘英莉
吴瑞刚
么长慧
沈韬
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省计算机技术应用重点实验室
出处
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2022年第2期245-253,共9页
基金
国家自然科学基金资助项目(52061020,61971208,51864027)
云南计算机技术应用重点实验室开放基金资助项目(2020103)。
文摘
针对材料领域没有适合材料实体关系抽取技术研究工作的公开数据集这一问题,通过研究高硅铝合金喷射沉积文献提出铝硅合金实体关系抽取数据集的构建方法.在材料领域专家的指导下制定铝硅合金实体关系抽取数据集的构建标准,并根据构建标准对收集的数据进行实体标注和关系标注.在标注完成后,通过数据预处理生成铝硅合金实体关系抽取数据集.通过实体关系联合抽取模型进行实验,验证该数据集可以应用于实体关系抽取任务.与公开数据集相比,材料数据集句子的语义和语法更为复杂,长句更多,导致实体关系联合抽取模型在材料数据集上的表现略差.针对上述问题,在实体关系联合抽取模型上加入自注意力机制,使该模型整体的F1值提高了约5.8%.该数据集的构建方法具有普适性,可以通过该构建方法构建材料数据集.
关键词
数据集
构建标准
数据标注
实体关系
联合抽取模型
自注意力机制
Keywords
dataset
construction standard
data annotation
entity relationship joint extraction model
self-attention mechanism
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于迁移学习的化学键能数据自动抽取
被引量:
1
3
作者
庞娜
袁钺
薛秋红
机构
北京大学信息管理系
中国科学院软件研究所
出处
《现代情报》
CSSCI
2023年第1期19-28,共10页
文摘
[目的/意义]在计算化学中,化学键能是重要的化学领域科学数据,目前化学键能数据抽取工作主要是由领域专家手动抽取,效率低下,大多数化学键能科学数据被湮没于海量文献中,无益于深入的、创新的科学数据分析。[方法/过程]为了解决该问题,本研究以ChemBE化学键能语料为实验对象,设计在较少专家支持的情况下,使用迁移学习的方法在化学论文中自动抽取与化学键能相关的科学数据。本文提出了一种端到端的BERT-CRF模型,通过构建领域高频子词的方法来解决大量未登录词的问题,并在后续深度学习模型的训练中,将构建好的领域高频子词作为领域特征输入到深度学习模型中,实现了对论文中的化学键能科学数据自动、高效地抽取。[结果/结论]实验表明,端到端的BERT-CRF模型与需要专家构建规则的基线模型相比,取得了理想的实验结果,F1值达到了88.56%。本文通过构建领域高频子词来解决大量未登录词的问题,降低了对领域专家的要求,可以较为容易地、低成本地迁移到其他领域。本文的研究结果是情报分析技术在化学领域的实践,为化学键能的智能知识检索提供了重要支撑。
关键词
迁移学习
化学键能
深度学习
自动
抽取
智能知识检索
领域高频子词
联合抽取模型
科学数据
文本挖掘
Keywords
transfer learning
chemicak bond energy
deep learning
automatical extraction
intelligent knowledge retrieval
domain high-frequency sub-words
joint extraction model
scientific data
text mining
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于BERT-WWM预训练的跨文档三元组提取
被引量:
2
4
作者
章振增
机构
南威软件股份有限公司
出处
《计算机应用与软件》
北大核心
2023年第6期181-186,215,共7页
文摘
关于跨文档三元组(Subject Predicate Object,SPO)抽取任务,当前的研究主要基于句子级别的分析。然而很多场景下SPO元素可能分散于文档的各个位置,句子级别的抽取技术远远无法满足需求,因此提出一种Doc2SpSPO联合SPO抽取模型。该模型通过Span候选集模型生成初始实体信息,基于BERT-WWM预训练模型得到上下文以及候选实体相关Embedding信息进行分类任务从而实现SPO的联合提取。实验结果表明,该模型实体识别可达到F1值44.4%、关系分类准确率66.9%的较好效果。
关键词
跨文档三元组
抽取
BERT
Span规则
联合
实体关系
抽取
模型
Keywords
Cross document SPO extraction
BERT
Span rule
Joint entity relationship extraction model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种新的基于深度学习的重叠关系联合抽取模型
赵敏钧
赵亚伟
赵雅捷
罗刚
《中国科学院大学学报(中英文)》
CSCD
北大核心
2022
5
在线阅读
下载PDF
职称材料
2
铝硅合金实体关系抽取数据集的构建方法
刘英莉
吴瑞刚
么长慧
沈韬
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2022
5
在线阅读
下载PDF
职称材料
3
基于迁移学习的化学键能数据自动抽取
庞娜
袁钺
薛秋红
《现代情报》
CSSCI
2023
1
在线阅读
下载PDF
职称材料
4
基于BERT-WWM预训练的跨文档三元组提取
章振增
《计算机应用与软件》
北大核心
2023
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部