-
题名面向房地产拍卖公告的长文本实体关系抽取方法
- 1
-
-
作者
韩郁
殷永峰
宋友
仵伟强
王宝会
-
机构
北京航空航天大学软件学院
渤海银行股份有限公司
-
出处
《中文信息学报》
北大核心
2025年第3期76-83,95,共9页
-
基金
河北省重点研发计划(21310101D)。
-
文摘
大多数实体关系联合抽取方法关注实体对在句子内反映的关系,忽略了长文本情景下存在的关系类型分布不均衡等问题。该文面向房地产拍卖公告,基于实体关系抽取思想,针对房地产拍卖公告实体长度较长、关系复杂的情况,设计了一种关系补充抽取机制,并结合全局指针网络和二部图匹配算法,最终形成了一个新的关系抽取模型LRCM,增强了模型对长实体和关系重叠三元组的抽取能力,减小了关系类型分布不均衡对关系抽取性能的影响。实验结果显示,该文方法优于其他主流的实体关系抽取方法,在构建的房地产拍卖数据集和WebNLG数据集上,F 1值分别达到了86.0%和92.7%。
-
关键词
实体关系联合抽取
长文本
房地产拍卖公告
关系补充抽取机制
-
Keywords
entity relationship extraction
long text
real estate auction announcements
relationship Complementary extraction mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-