题名 基于用户行为分析的搜索引擎自动性能评价
被引量:23
1
作者
刘奕群
岑荣伟
张敏
茹立云
马少平
机构
清华大学计算机科学与技术系智能技术与系统国家重点实验室清华信息科学与技术国家实验室(筹)
搜狐公司研发中心
出处
《软件学报》
EI
CSCD
北大核心
2008年第11期3023-3032,共10页
基金
Supported by the National Natural Science Foundation of China under Grant Nos.60621062,60503064,60736044(国家自然科学基金)
the National Basic Research Program of China under Grant No.2004CB318108(国家重点基础研究发展计划(973))
the National High-Tech Research and Development Plan of China under Grant No.2006AA01Z141(国家高技术研究发展计划(863))
文摘
基于用户行为分析的思路,提出了一种自动进行搜索引擎性能评价的方法.此方法能够基于对用户的查询和点击行为的分析自动生成导航类查询测试集合,并对查询对应的标准答案实现自动标注.基于中文商业搜索引擎日志的实验结果表明,此方法能够与人工标注的评价取得基本一致的评价效果,同时大大减少了评价所需的人力资源,并加快了评价反馈周期.
关键词
网络信息检索
性能评价
用户行为分析
Keywords
Web information retrieval
performance evaluation
user behavior analysis
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 基于用户兴趣分析的网页生命周期建模
被引量:5
2
作者
王勇
刘奕群
张敏
马少平
茹立云
机构
智能技术与系统国家重点实验室
搜狐公司研发中心
出处
《中文信息学报》
CSCD
北大核心
2008年第2期76-80,共5页
基金
国家973重点基础研究资助项目(2004CB318108)
国家自然科学基金资助项目(60621062,60503064,60736044)
国家863高科技计划资助项目(2006AA01Z141)
文摘
网页在其生命周期内的活跃程度会随时间发生变化。有的网页只在特定的阶段有价值,此后就会过时。从用户的角度对网页的生命周期进行分析可以提高网络爬虫和搜索引擎的性能,改善网络广告的效果。利用一台代理服务器收集的网页访问量信息,我们对网页的生命周期进行了研究,给出了用户兴趣演变的模型。这个模型有助于更好地理解网络的组织与运行机理。
关键词
计算机应用
中文信息处理
用户行为分析
网页生命周期
网络日志挖掘
Keywords
computer application
Chinese information processing
user behavior analysis
web page lifetime
weblog mining
分类号
TP391
[自动化与计算机技术—计算机应用技术]