期刊文献+

一种并行Web信息采集系统模型 被引量:1

Parallel system model of Web information retrieval
在线阅读 下载PDF
导出
摘要 根据国内外在信息采集领域的发展以及并行采集技术的研究,提出了一个基于多线程并行的W eb信息采集结构模型,该模型以线程并行的方式对W eb页面同时采集,实现了全面、高效并且灵活的信息搜集。 Based on the long-time accumulation in the field of Web crawling, and combining the current developing technologies on parallel Web crawling, this article put forward a structure design model of the parallel incremental Web crawler. In order to download Web pages paralleUy, we adopted means of multiple thread that can effectively improve information gathering performance.
作者 杨天奇 周晔
出处 《计算机应用》 CSCD 北大核心 2007年第1期225-227,共3页 journal of Computer Applications
基金 广东省自然科学基金资助项目(5006102)
关键词 并行Web 信息采集 搜索引擎 parallel Web information gathering search engine
作者简介 杨天奇(1961-),男,江西南昌人,副教授.博士,主要研究方向:人工智能、数据挖掘、入侵检测(y_tq@163.com); 周晔(1980-),男,湖南长沙人,硕士研究生,主要研究方向:入侵检测.
  • 相关文献

参考文献4

  • 1AGGARWAL C,Al-GARAWI F,YU P.Intelligent crawling on the world wide Web with arbitrary predicates[A].Proceedings of the 10th International WWW Conference[C].2001.378-382.
  • 2SELBERG E,ETZIONI O.Multi-service search and comparison using the MetaCrawler[A].Proceedings of 4th World Wide Web Conference[C].1995.168-171.
  • 3TOPI H,WENDY L.Searching the Web:operator assistance required[J].Information Processing and Management Volume,2005,41(2):47-52.
  • 4CAN F,NURAY R.Automatic performance evaluation of Web search engines[J].Information Processing and Management Volume,2004,40(3):23-26.

同被引文献2

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部