期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于度排序的P2P IPTV分布式爬虫系统设计与实现 被引量:1
1
作者 王海舟 陈兴蜀 +1 位作者 王文贤 吴小松 《四川大学学报(工程科学版)》 EI CSCD 北大核心 2014年第3期109-115,共7页
为了开发一款面向P2P网络电视主动测量研究的高性能爬虫系统,提出了一种基于节点度排序的节点信息爬行算法。该算法首先使用类似广度优先遍历的策略对网络电视覆盖网进行节点信息的初始爬行,然后对爬行结果获得的节点列表进行基于节点... 为了开发一款面向P2P网络电视主动测量研究的高性能爬虫系统,提出了一种基于节点度排序的节点信息爬行算法。该算法首先使用类似广度优先遍历的策略对网络电视覆盖网进行节点信息的初始爬行,然后对爬行结果获得的节点列表进行基于节点度大小的排序,最后将排序后的结果作为输入提供给分布式爬虫以实施节点信息的实时采集。实验结果表明,基于度排序的分布式爬虫系统相比现有的其他爬虫具有更快的爬行速度,该爬虫可以在30 s左右完成对一个拥有7 200左右用户规模的流行节目的爬行,为采集准确的PPTV节点信息快照并实施主动测量研究提供了解决方案。 展开更多
关键词 P2P技术 度排序 分布式架构 爬虫系统 PPTV网络电视
在线阅读 下载PDF
基于爬虫系统的省级公共图书馆微信平台运用调查 被引量:4
2
作者 谢辉 《图书馆论坛》 CSSCI 北大核心 2018年第3期117-124,共8页
文章利用Python语言建立微信公众号爬虫系统.结合试验数据,从宏观和实例角度探讨省级公共图书馆微信公众号现状以及存在的问题.研究表明:省级公共图书馆微信公众平台平均推送文章数量差异较大,人力资源分配不均衡,微信公众平台的服务... 文章利用Python语言建立微信公众号爬虫系统.结合试验数据,从宏观和实例角度探讨省级公共图书馆微信公众号现状以及存在的问题.研究表明:省级公共图书馆微信公众平台平均推送文章数量差异较大,人力资源分配不均衡,微信公众平台的服务水平和质量存在较大差异.根据调研情况,提出改进省级公共图书馆微信公众平台的建议. 展开更多
关键词 省级公共图书馆 微信公众号 爬虫调查系统 WCI
在线阅读 下载PDF
舆情监测系统设计 被引量:6
3
作者 张昕 孙江辉 《现代电子技术》 北大核心 2015年第11期98-102,共5页
为了及时调控和遏制校园内突发的不良网络舆情事件的蔓延,引入最近几年针对网络舆情监测过程中的方法及思路,以加强网络信息的监测管理工作为目的,结合信息采集和舆情监测指标研究,设计了一套校园网舆情监测系统。该校园网舆情监测系统... 为了及时调控和遏制校园内突发的不良网络舆情事件的蔓延,引入最近几年针对网络舆情监测过程中的方法及思路,以加强网络信息的监测管理工作为目的,结合信息采集和舆情监测指标研究,设计了一套校园网舆情监测系统。该校园网舆情监测系统实现了信息采集模块功能及部分分析模块功能,达到了采集信息的效果,对舆情完成了初步分析。 展开更多
关键词 校园网舆情 爬虫系统 模块设计 监测系统
在线阅读 下载PDF
面向用户的本体爬虫研究与设计
4
作者 张素智 李宝燕 樊得强 《郑州轻工业学院学报(自然科学版)》 CAS 2010年第6期62-66,共5页
针对传统搜索引擎不能满足用户个性化、专业化需求的缺点,提出了一种面向用户和领域本体的搜索策略,设计了一个面向用户的本体爬虫系统.该系统采用改进的获取领域相关信息的检索策略来获取信息,并且在爬虫内部设计了用户定义的优先队列... 针对传统搜索引擎不能满足用户个性化、专业化需求的缺点,提出了一种面向用户和领域本体的搜索策略,设计了一个面向用户的本体爬虫系统.该系统采用改进的获取领域相关信息的检索策略来获取信息,并且在爬虫内部设计了用户定义的优先队列.实验证明,该系统提高了页面查询的精确率和召回率. 展开更多
关键词 本体爬虫系统 个性化采集技术 优先队列
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部