-
题名基于大语言模型增强的零样本知识抽取方法
- 1
-
-
作者
皮乾坤
卢记仓
祝涛杰
彭悦翎
-
机构
信息工程大学数据与目标工程学院
-
出处
《计算机科学》
北大核心
2025年第11期22-29,共8页
-
基金
河南省自然科学基金(222300420590)。
-
文摘
知识抽取任务旨在从复杂的信息资源中抽取出结构化的知识。然而,现有的知识抽取研究往往需要依赖大量人工标注数据,这导致了高成本消耗。对此,提出一种基于大语言模型增强的零样本知识抽取方法,旨在不依赖任何人工标注数据,利用大模型强大的语义推理能力,自动化地完成知识抽取任务,降低数据标注成本。具体而言,首先对测试集数据进行格式预处理,并基于此微调跨领域的通用大模型得到数据标注模型,利用该模型对相关文本进行标注,以获得相应的实体及属性推理信息。然后,为这些信息设置新的思维链提示范式,进一步微调特定领域的专业大模型得到知识抽取模型。此外,通过不断增加数据迭代训练,以提升模型性能。最后,利用大模型对测试集的属性信息进行增强,以提高知识抽取模型对文本的理解能力,进而增强知识抽取性能。在多个大模型上的基准测试实验结果进一步证明,提出的零样本知识抽取框架具有更加显著的性能提升。
-
关键词
大语言模型
零样本知识抽取
数据标注模型
思维链提示
知识抽取模型
-
Keywords
Large language model
Zero-shot knowledge extraction
Data annotation model
Chain of thought
Knowledge extraction model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-