-
题名基于用户搜索行为的query-doc关联挖掘
被引量:6
- 1
-
-
作者
朱亮
陆静雅
左万利
-
机构
吉林大学计算机科学与技术学院
吉林大学符号计算与知识工程教育部重点实验室
-
出处
《自动化学报》
EI
CSCD
北大核心
2014年第8期1654-1666,共13页
-
基金
国家自然科学基金(60973040
61300148)
+1 种基金
中国博士后基金(2012M510879)
吉林省重点科技攻关项目(20130206051GX)资助~~
-
文摘
query和doc之间的关联关系是搜索引擎期望获取的一类有价值的信息.query和doc间准确的关联分析不仅可以帮助搜索结果排序,也在query和doc之间的桥接中起到重要作用,以实现相关query和doc之间的信息传递,有利于更深入的query理解和doc理解,并在此基础上开展相关应用.本文提出了一种基于用户搜索行为的query和doc关联关系挖掘算法,该方法首先对用户搜索点击日志中的数据进行整理与分析,构建query与doc间的二部图,再通过采用马尔可夫随机游走模型对二部图数据进行建模,挖掘二部图中的点击数据和session数据,最终挖掘出点击日志中用户没有点击到的doc数据,从而预测出query和doc间的隐含关联关系,同时也可以利用该算法得到query和query潜在的关联关系.基于以上理论基础,我们实现了一套完整的日志挖掘系统,通过大量的实验对比,该系统在各方面均取得了优异的表现,其中对检索结果相关性的性能提升可以达到71.23%,这充分表明,本文所提出的理论和算法能够很好地解决query和doc之间的隐含关系挖掘问题,为提高搜索结果的召回率、实现查询推荐和检索结果聚类奠定了良好的前提基础.
-
关键词
关联关系
搜索行为
马尔可夫随机游走
查询推荐
检索结果聚类
-
Keywords
Association relation, search behavior, Markov random walk model, query recommendation, clustering ofretrieved results
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-