一种并行Web信息采集系统模型被引量：1

Parallel system model of Web information retrieval

在线阅读下载PDF

导出

摘要根据国内外在信息采集领域的发展以及并行采集技术的研究,提出了一个基于多线程并行的W eb信息采集结构模型,该模型以线程并行的方式对W eb页面同时采集,实现了全面、高效并且灵活的信息搜集。 Based on the long-time accumulation in the field of Web crawling, and combining the current developing technologies on parallel Web crawling, this article put forward a structure design model of the parallel incremental Web crawler. In order to download Web pages paralleUy, we adopted means of multiple thread that can effectively improve information gathering performance.

作者杨天奇周晔

机构地区暨南大学计算机科学系

出处《计算机应用》 CSCD 北大核心 2007年第1期225-227,共3页 journal of Computer Applications

基金广东省自然科学基金资助项目(5006102)

关键词并行Web 信息采集搜索引擎 parallel Web information gathering search engine

分类号 N393 [自然科学总论]

作者简介杨天奇（1961-），男，江西南昌人，副教授．博士，主要研究方向：人工智能、数据挖掘、入侵检测（y_tq@163．com）；周晔（1980-），男，湖南长沙人，硕士研究生，主要研究方向：入侵检测．

引文网络
相关文献

参考文献4

1AGGARWAL C,Al-GARAWI F,YU P.Intelligent crawling on the world wide Web with arbitrary predicates[A].Proceedings of the 10th International WWW Conference[C].2001.378-382.
2SELBERG E,ETZIONI O.Multi-service search and comparison using the MetaCrawler[A].Proceedings of 4th World Wide Web Conference[C].1995.168-171.
3TOPI H,WENDY L.Searching the Web:operator assistance required[J].Information Processing and Management Volume,2005,41(2):47-52.
4CAN F,NURAY R.Automatic performance evaluation of Web search engines[J].Information Processing and Management Volume,2004,40(3):23-26.

同被引文献2

1吕淑萍,朱兵.网络信息资源采集内容的甄选——国家图书馆“专题存档”的实践[J].国家图书馆学刊,2004,13(2):30-33. 被引量：14
2朱华.浅谈网络信息资源采集技术[J].国家图书馆学刊,2004,13(2):38-40. 被引量：29

引证文献1

1蔡焰.网络信息资源自动采集探讨[J].江西图书馆学刊,2009,39(2):94-95. 被引量：2

二级引证文献2

1陈天文.网络Web信息资源自动采集入库的实现[J].图书馆学刊,2010,32(10):100-102. 被引量：2
2曾昭江.网站数据采集原理及防范策略[J].福建电脑,2011,27(4):52-53. 被引量：2

1陈克明,谭其繁.如何培养学生探究学习能力[J].科学咨询,2010(18):12-12.
2冯宗德.开展科学体验活动培养学生科学素养[J].科学咨询,2008(8):19-19. 被引量：2
3叶弘.在数学教学中应用探究式教学的意义[J].大连教育学院学报,2009,25(2):93-94. 被引量：5
4施杰.浅谈探究活动在数学课中的应用[J].中国教育技术装备,2012(22):82-82.
5《科技信息》理事会服务简报[J].科技信息,2003,0(2):49-50.
6高敏芬.数学网络资源库的建设[J].实验室科学,2004,7(1):65-67.
7杜阳.浅析Ajax技术在Web开发中的应用[J].中国新技术新产品,2010(23). 被引量：1
8李晓婷,张磊,沈建京.基于LSA的Web信息采集和统计服务[J].计算机工程,2008,34(15):83-84.
9张琳,胡颂平.网络环境下开展化学探究性实验的研究[J].教育信息技术,2009(3):38-40.
10袁娲,刘杰.基于Web的新型WAP网关服务器研究[J].北京工商大学学报（自然科学版）,2005,23(2):63-65. 被引量：4

计算机应用

2007年第1期

浏览历史

内容加载中请稍等...

一种并行Web信息采集系统模型被引量：1

参考文献4

同被引文献2

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种并行Web信息采集系统模型 被引量：1

参考文献4

同被引文献2

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种并行Web信息采集系统模型被引量：1