期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
针对模板生成网页的一种数据自动抽取方法(英文) 被引量:45
1
作者 杨少华 林海略 韩燕波 《软件学报》 EI CSCD 北大核心 2008年第2期209-223,共15页
当前,Web上的很多网页是动态生成的,网站根据请求从后台数据库中选取数据并嵌入到通用的模板中,例如电子商务网站的商品描述网页.研究如何从这类由模板生成的网页中检测出其背后的模板,并将嵌入的数据(例如商品名称、价格等等)自动地抽... 当前,Web上的很多网页是动态生成的,网站根据请求从后台数据库中选取数据并嵌入到通用的模板中,例如电子商务网站的商品描述网页.研究如何从这类由模板生成的网页中检测出其背后的模板,并将嵌入的数据(例如商品名称、价格等等)自动地抽取出来.给出了模板检测问题的形式化描述,并深入分析模板产生网页的结构特征.提出了一种新颖的模板检测方法,并利用检测出的模板自动地从实例网页中抽取数据.与其他已有方法相比,该方法能够适用于"列表页面"和"详细页面"两种类型的网页.在两个第三方的测试集上进行了实验,结果表明,该方法具有很高的抽取准确率. 展开更多
关键词 WEB 自动数据抽取 信息抽取 模板发现 Wrapper生成
在线阅读 下载PDF
基于本体智能搜索引擎的研究 被引量:8
2
作者 李宝敏 《情报杂志》 CSSCI 北大核心 2006年第10期60-62,共3页
分析了当前网上搜索引擎的现状及存在的问题,设计和实现了一个基于本体智能搜索引擎系统模型,讨论了该系统结构中各个功能模块的功能和相互之间的关系。利用本体规范用户查询语句的语义化、搜索信息的语义化,探讨了搜索引擎智能的相关... 分析了当前网上搜索引擎的现状及存在的问题,设计和实现了一个基于本体智能搜索引擎系统模型,讨论了该系统结构中各个功能模块的功能和相互之间的关系。利用本体规范用户查询语句的语义化、搜索信息的语义化,探讨了搜索引擎智能的相关技术以及它们在本体智能搜索引擎中的应用。 展开更多
关键词 本体 数据 智能代理 智能搜索引擎 数据自动抽取
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部