期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于序列比对的动态Web信息抽取算法
1
作者 赵刚 郭东伟 李丹 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2010年第3期421-426,共6页
基于对深网(DeepWeb)网页公共框架的定义,提出一种在信息抽取算法中增加公共框架检测阶段,采用序列比对算法提取公共框架的方法.与原始网页数据相比,去除公共框架的数据域信息对模板抽取更有利.基于真实网站的数据密集型网页集合,测试... 基于对深网(DeepWeb)网页公共框架的定义,提出一种在信息抽取算法中增加公共框架检测阶段,采用序列比对算法提取公共框架的方法.与原始网页数据相比,去除公共框架的数据域信息对模板抽取更有利.基于真实网站的数据密集型网页集合,测试和对比了序列比对算法中参数不同取值以及公共框架检测阶段在数据量和抽取准确率等方面对信息抽取算法的影响.实验结果表明了算法的有效性. 展开更多
关键词 WEB信息抽取 序列比对 公共框架检测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部