摘要
讨论针对Web表格的信息抽取,分析并给出了表格信息抽取引擎的系统结构,以及实现该系统所涉及的关键技术和数据模型,为用户提供一种以Web表格为信息抽取对象的、支持抽取方式选择的Web表格信息抽取工具。
This paper discusses a key technique aiming at information extraction on Web tables. It also analyzes and gives out the system structure of information extraction engine on Web tables, the key technique and data model implementing the system. The paper will provide a kind of information extraction tool which aims at Web tables and supports the method selection of extracting.
出处
《计算机科学》
CSCD
北大核心
2006年第10期126-127,175,共3页
Computer Science
关键词
WEB表格
数据挖掘
信息抽取
二叉树模型
Web table, Data mining, Information extraction, Binary tree model