期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
铝硅合金实体关系抽取数据集的构建方法 被引量:4
1
作者 刘英莉 吴瑞刚 +1 位作者 么长慧 沈韬 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第2期245-253,共9页
针对材料领域没有适合材料实体关系抽取技术研究工作的公开数据集这一问题,通过研究高硅铝合金喷射沉积文献提出铝硅合金实体关系抽取数据集的构建方法.在材料领域专家的指导下制定铝硅合金实体关系抽取数据集的构建标准,并根据构建标... 针对材料领域没有适合材料实体关系抽取技术研究工作的公开数据集这一问题,通过研究高硅铝合金喷射沉积文献提出铝硅合金实体关系抽取数据集的构建方法.在材料领域专家的指导下制定铝硅合金实体关系抽取数据集的构建标准,并根据构建标准对收集的数据进行实体标注和关系标注.在标注完成后,通过数据预处理生成铝硅合金实体关系抽取数据集.通过实体关系联合抽取模型进行实验,验证该数据集可以应用于实体关系抽取任务.与公开数据集相比,材料数据集句子的语义和语法更为复杂,长句更多,导致实体关系联合抽取模型在材料数据集上的表现略差.针对上述问题,在实体关系联合抽取模型上加入自注意力机制,使该模型整体的F1值提高了约5.8%.该数据集的构建方法具有普适性,可以通过该构建方法构建材料数据集. 展开更多
关键词 数据集 构建标准 数据标注 实体关系联合抽取模型 自注意力机制
在线阅读 下载PDF
基于迁移学习的化学键能数据自动抽取
2
作者 庞娜 袁钺 薛秋红 《现代情报》 CSSCI 2023年第1期19-28,共10页
[目的/意义]在计算化学中,化学键能是重要的化学领域科学数据,目前化学键能数据抽取工作主要是由领域专家手动抽取,效率低下,大多数化学键能科学数据被湮没于海量文献中,无益于深入的、创新的科学数据分析。[方法/过程]为了解决该问题,... [目的/意义]在计算化学中,化学键能是重要的化学领域科学数据,目前化学键能数据抽取工作主要是由领域专家手动抽取,效率低下,大多数化学键能科学数据被湮没于海量文献中,无益于深入的、创新的科学数据分析。[方法/过程]为了解决该问题,本研究以ChemBE化学键能语料为实验对象,设计在较少专家支持的情况下,使用迁移学习的方法在化学论文中自动抽取与化学键能相关的科学数据。本文提出了一种端到端的BERT-CRF模型,通过构建领域高频子词的方法来解决大量未登录词的问题,并在后续深度学习模型的训练中,将构建好的领域高频子词作为领域特征输入到深度学习模型中,实现了对论文中的化学键能科学数据自动、高效地抽取。[结果/结论]实验表明,端到端的BERT-CRF模型与需要专家构建规则的基线模型相比,取得了理想的实验结果,F1值达到了88.56%。本文通过构建领域高频子词来解决大量未登录词的问题,降低了对领域专家的要求,可以较为容易地、低成本地迁移到其他领域。本文的研究结果是情报分析技术在化学领域的实践,为化学键能的智能知识检索提供了重要支撑。 展开更多
关键词 迁移学习 化学键能 深度学习 自动抽取 智能知识检索 领域高频子词 联合抽取模型 科学数据 文本挖掘
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部