-
题名基于主题与用户偏好分析的查询推荐研究
被引量:10
- 1
-
-
作者
陆伟
张晓娟
-
机构
武汉大学信息资源研究中心信息检索与知识挖掘研究所
-
出处
《情报学报》
CSSCI
北大核心
2012年第12期1252-1258,共7页
-
基金
本文系教育部人文社科基地重大项目“面向细粒度的网络信息检索模型及框架构建研究”(项目编号:10JJD630014)和国家自然科学基金面上项目“基于语言模型的通用实体检索建模及框架实现研究”(项目编号:71173164)的研究成果之一.
-
文摘
查询日志分析作为近年来常用的查询推荐方法,常采用基于词共现的上下文来生成查询推荐。本文利用AOL日志,在词上下文分析基础之上,采用主题分析,再结合用户偏好,进行查询推荐建模,实验结果表明:采用主题分析可以显著提升查询推荐的精确度,进一步考虑用户偏好后,推荐效果又有了进一步的提升。
-
关键词
查询
查询推荐
查询替换
查询主题
用户偏好
-
Keywords
query, query recommendation, query substitution, query topic, user personalization
-
分类号
F713.36
[经济管理—产业经济]
-
-
题名一种基于Hadoop的多表链接策略
被引量:2
- 2
-
-
作者
徐剑
陈群
王卓
李战怀
-
机构
西北工业大学计算机学院
-
出处
《现代电子技术》
2014年第6期90-94,共5页
-
基金
国家自然科学基金重点项目(61033007)
国家"973"重点基础发展规划基金资助项目(2012CB316203)
-
文摘
Hadoop系统在处理多表链接问题时,每轮都会将大量的中间结果写入本地磁盘,从而严重降低了系统的处理效率。为解决该问题,提出一种"替换-查询"方法,该方法通过对链接表建立索引,将预输出的元组集替换为索引信息输出到中间结果,以索引的形式参与多表链接,以此减少中间结果的I/O代价。运用缓冲池、二次排序和多线程技术对索引信息进行优化管理,加快索引查询速度。最后在TPC-H数据集上,设计了与原Hadoop的对比实验,结果表明该方法可减少35.5%的存储空间,提高12.9%的运行效率。
-
关键词
多表链接
替换-查询
索引
缓冲池
二次排序
-
Keywords
multi-table connection
replace-query
index
buffer pool
secondary sorting
-
分类号
TN911-34
[电子电信—通信与信息系统]
TP311
[自动化与计算机技术—计算机软件与理论]
-