-
题名基于机器阅读理解模型与众包验证的属性值抽取方法
被引量:1
- 1
-
-
作者
冯桫
刘井平
蒋海云
肖仰华
-
机构
复旦大学计算机科学技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第5期97-103,共7页
-
基金
上海市科技创新行动计划(19511120400)。
-
文摘
由于互联网语料的高噪音特性,传统的属性值抽取方法存在人工成本增加及训练集缺乏等问题。提出一种新的实体属性值抽取方法。利用机器阅读理解模型,从互联网语料中抽取出高质量的候选属性值,通过高效的众包验证机制调整各候选属性值的权重,得到最终抽取结果。实验结果表明,与OpenTag、QANET等模型相比,该机器阅读理解模型有效提升了候选属性值抽取的准确性,抽取准确率提升10%左右,同时通过众包验证方法,能够以较低的众包成本提高属性值抽取的整体性能。
-
关键词
属性值抽取
机器阅读理解模型
知识图谱
众包
序列标注
-
Keywords
attribute value extraction
machine reading comprehension model
knowledge graph
crowdsourcing
sequence labeling
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-