期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种新的主题网络爬虫爬行策略 被引量:15
1
作者 宋海洋 刘晓然 钱海俊 《计算机应用与软件》 CSCD 2011年第11期264-267,293,共5页
为了解决传统主题网络爬虫准确度低或者爬行速度慢的问题,提出一种新的主题网络爬虫爬行策略,主要针对"二次爬行"过程进行改进。在传统的主题网络爬虫流程中增加一份"经验树",将基于内容分析和基于链接分析两种不... 为了解决传统主题网络爬虫准确度低或者爬行速度慢的问题,提出一种新的主题网络爬虫爬行策略,主要针对"二次爬行"过程进行改进。在传统的主题网络爬虫流程中增加一份"经验树",将基于内容分析和基于链接分析两种不同的相关度分析算法相结合,并且可以保存爬虫爬行过程中所得到的"经验",实现对后续爬行的指导。实验结果表明通过改进后的策略实现的主题网络爬虫在性能上有较大提升。 展开更多
关键词 主题网络爬虫 爬行策略 二次爬行 相关度分析
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部