期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于知识图谱的Web信息抽取系统 被引量:16
1
作者 王辉 郁波 +1 位作者 洪宇 肖仰华 《计算机工程》 CAS CSCD 北大核心 2017年第6期118-124,共7页
为实现多领域海量网页信息的有效抽取,以中文知识图谱CN-DBpedia为基础设计Web信息抽取系统。基于知识图谱对网页数据项进行自动标注,建立具有容错能力的包装器归纳框架,从包含错误的标注集中归纳学习出正确的包装器。实验结果表明,该... 为实现多领域海量网页信息的有效抽取,以中文知识图谱CN-DBpedia为基础设计Web信息抽取系统。基于知识图谱对网页数据项进行自动标注,建立具有容错能力的包装器归纳框架,从包含错误的标注集中归纳学习出正确的包装器。实验结果表明,该系统的准确率和召回率均高于传统人工标注方法,可显著降低网页信息抽取过程中的人力成本,灵活运用于大规模、多领域的网页信息抽取任务。 展开更多
关键词 知识图谱 多领域 WEB信息抽取 网页自动标注 容错 包装器归纳框架
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部