-
题名基于URL类型和网页链接变化的信息采集更新算法
被引量:1
- 1
-
-
作者
陈晓志
董守斌
张凌
张元丰
-
机构
华南理工大学计算机科学与工程学院
-
出处
《郑州大学学报(理学版)》
CAS
2007年第2期60-64,共5页
-
基金
国家自然科学基金资助项目
编号90412015
-
文摘
通过观察网站呈现网页的规律及网页本身的结构特点,提出基于URL类型及网页链接变化规律的入口页面识别算法,优先抓取入口页面.在实际应用中,取得了较好的更新效果.
-
关键词
入口页面
网页更新
增量采集
-
Keywords
entry page
page refreshment
incremental crawler
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种网络论坛有害信息监测系统的构建与应用
- 2
-
-
作者
王守银
-
机构
武警指挥学院训练部指挥实验中心
-
出处
《信息网络安全》
2013年第10期147-149,共3页
-
文摘
为有效遏制利用计算机网络论坛传播低俗信息、恶意炒作等非法活动,为网络监测与监管工作提供有力技术支持,文章在参考相关文献基础上,按照数据采集、数据过滤、数据分析处理以及系统响应的流程模式,对构建网上有害信息监测系统进行了初步实践。首先,文章给出了监测系统的软件架构、功能设计方案,阐述了系统实现中涉及到的网上分布式信息采集和数据挖掘等关键技术。然后,说明了系统的运行流程。最后给出了系统的部分监测结果,对实现效果进行了验证。
-
关键词
论坛有害信息
监测系统
论坛插件
增量采集
运行流程
-
Keywords
Web forum harmful information
monitor and control system
Web forums addin
incrementcollection
operation process
-
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
-