-
题名Web网页信息变化的时间局部性规律及其验证
被引量:8
- 1
-
-
作者
孟涛
闫宏飞
王继民
-
机构
北京大学计算机科学技术系网络与分布式系统实验室
-
出处
《情报学报》
CSSCI
北大核心
2005年第4期398-406,共9页
-
基金
国家自然科学基金,国家重点基础研究发展计划(973计划),高等学校博士学科点专项科研项目
-
文摘
掌握Web网页信息变化的时间规律可以更有针对性的指导搜索引擎等Web应用系统更有效地进行搜集.本文旨在研究中国范围内Web网页变化的时间规律,针对网页变化的频率和间隔两项指标,随机选取数百万网页作为样本,设计试验在一个月内对上述两项指标进行考察.从结论中,我们发现网页变化的若干规律,并发现其中可能存在时间局部性规律.因此,我们引入了堆栈距离模型,在针对Web网页的变化特性和具体实验方法对其修正之后,再次设计实验对网页变化的时间局部性规律进行考察.结果表明,网页的变化存在明显的时间局部性.最后,介绍了这种时间局部性规律在网页搜集中的实际应用.
-
关键词
WEB网页
时间局部性
堆栈距离模型
变化次数
变化间隔
时间规律
局部性
信息
验证
应用系统
-
Keywords
web documents, temporal locality, stack distance model, change frequencies, change intervals, crawlers.
-
分类号
TP393.092
[自动化与计算机技术—计算机应用技术]
TU714
[建筑科学—建筑技术科学]
-