期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
从WEB文档中构造半结构化信息的抽取器 被引量:47
1
作者 黄豫清 戚广志 张福炎 《软件学报》 EI CSCD 北大核心 2000年第1期73-78,共6页
为了对 WEB上不规则的、动态的信息按照数据库的方式集成和查询 ,采用对象交换模型 (object ex-change model,简称 OEM)建立了 WEB信息模型 .为了将页面中各个部分表示为对应的 OEM对象 ,设计了半结构化信息的抽取算法 ,并给出测试结果 ... 为了对 WEB上不规则的、动态的信息按照数据库的方式集成和查询 ,采用对象交换模型 (object ex-change model,简称 OEM)建立了 WEB信息模型 .为了将页面中各个部分表示为对应的 OEM对象 ,设计了半结构化信息的抽取算法 ,并给出测试结果 .该方法可以抽取结构化和半结构化的信息 ,比现有的抽取方法通用性更强 . 展开更多
关键词 启发式规则 信息抽取器 WEB 文档
在线阅读 下载PDF
构造Web文档中半结构化信息的技术 被引量:4
2
作者 黄豫清 戚广智 张福炎 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2000年第3期230-234,共5页
为了对 Web上不规则的、动态的信息按照数据库的方式集成和查询 ,采用对象交换模型 (OEM)建立了Web上信息模型 .为了将页面中各个部分表示为对应的 OEM对象 ,设计了半结构化信息的抽取算法 ,并给出测试结果 .该方法可以抽取结构化和半... 为了对 Web上不规则的、动态的信息按照数据库的方式集成和查询 ,采用对象交换模型 (OEM)建立了Web上信息模型 .为了将页面中各个部分表示为对应的 OEM对象 ,设计了半结构化信息的抽取算法 ,并给出测试结果 .该方法可以抽取结构化和半结构化的信息 ,比现有的抽取方法通用性更强 . 展开更多
关键词 半结构化信息 WEB 文档 信息查询 数据库
在线阅读 下载PDF
基于约束的半结构化信息的抽取方法 被引量:2
3
作者 黄豫清 邹涛 《计算机应用与软件》 CSCD 北大核心 2002年第1期53-59,共7页
为了对WEB上不规则的动态信息按照数据库的方式集成和查询,本文采用对象交换模型(OEM)建立WEB上信息模型。为了将页面中各个部分表示为对应的OEM对象,本文(1)设计了半结构化信息的抽取算法;(2)定义了满足约束条件的数据抽取格式,并且设... 为了对WEB上不规则的动态信息按照数据库的方式集成和查询,本文采用对象交换模型(OEM)建立WEB上信息模型。为了将页面中各个部分表示为对应的OEM对象,本文(1)设计了半结构化信息的抽取算法;(2)定义了满足约束条件的数据抽取格式,并且设计了输出正确抽取格式的候选者算法;(3)给出测试结果。该方法可以抽取结构化和半结构化的信息,比现有的抽取方法通用性更强。 展开更多
关键词 数据抽取格式 oem模型 数据抽取格式约束 半结构化信息 数据库
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部