期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
新技术水平下Web数据自动采集与维护技术研究综述
在线阅读
下载PDF
职称材料
导出
摘要
由于互联网技术的飞速发展,Web信息急剧膨胀,传统搜索引擎注重查全率而查准率不足,导致Web信息搜索越来越困难。本文通过对Web数据自动采集与维护技术的分析,试图对用户身份验证、导航URL提取、翻页URL提取、页面属性字段的提取、数据去重等Deep Web数据集成关键技术做探索性的研究,对各种方案进行了尝试和比较,然后给出了最优的解决方案,为进一步的研究提供了基础。
作者
杨渊林
机构地区
内蒙古政府房产管理中心
出处
《消费电子》
2014年第14期208-208,共1页
Consumer Electronics Magazine
关键词
WEB
DEEP
WEB
数据自动采集
数据抽取
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
引文网络
相关文献
节点文献
二级参考文献
0
参考文献
2
共引文献
0
同被引文献
0
引证文献
0
二级引证文献
0
参考文献
2
1
崔少彬.主题搜索引擎的研究与实现[D].中国海洋大学,2007.
2
董晓常.
中国黄页网:开辟网络经济新天地[J]
.互联网周刊,2004(40):66-66.
被引量:1
1
张秋惠,谢延华.
一种主题型Web爬行器的设计和实现[J]
.漯河职业技术学院学报,2006,5(3):21-22.
被引量:1
2
王永康.
Azure云平台对Twitter推文关键字实时大数据分析[J]
.电脑编程技巧与维护,2015(12):68-72.
被引量:2
3
赵艳.
Android中bitmap引起内存溢出的解决方案的对比分析[J]
.科技传播,2013,5(24):228-229.
被引量:1
4
潘静,饶若楠.
基于Web数据挖掘的信息获取系统的研究及设计[J]
.计算机工程,2004,30(B12):136-138.
被引量:3
5
万勇.
数据库在分布式管理系统中的应用[J]
.电子技术与软件工程,2017(1):167-167.
被引量:2
6
胡浩,钱明伟.
基于XML中间平台4CP集成系统的研究[J]
.制造技术与机床,2010(3):127-130.
被引量:2
7
刘顺来.
基于聚类分析的Web信息搜索算法研究[J]
.电脑与电信,2007(6):53-56.
8
高翔,王敏.
模糊聚类算法在Web信息搜索中的应用[J]
.山东大学学报(理学版),2006,41(3):57-59.
9
胡启韬,袁志平,周忠海.
网络资源采集软件的设计及实现[J]
.电脑编程技巧与维护,2010(8):25-26.
10
何志鹏,蒋晓琴.
如何实现CAD电子文档的有效共享[J]
.CAD/CAM与制造业信息化,2013(2):65-66.
消费电子
2014年 第14期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部