期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
并行Fp-growth算法在搜索引擎中的应用 被引量:2
1
作者 黄剑 李明奇 郭文强 《计算机科学》 CSCD 北大核心 2015年第S1期459-461 483,483,共4页
针对用户历史检索过程产生的Web日志文件,研究其查询词和点击链接是否为频繁集,以及在分布式条件下频繁集挖掘的效率问题。基于Hadoop框架,设计了并行Fp-growth算法,对搜索引擎Web日志进行挖掘。仿真实验结果显示,满足支持度的查询词和... 针对用户历史检索过程产生的Web日志文件,研究其查询词和点击链接是否为频繁集,以及在分布式条件下频繁集挖掘的效率问题。基于Hadoop框架,设计了并行Fp-growth算法,对搜索引擎Web日志进行挖掘。仿真实验结果显示,满足支持度的查询词和点击链接频繁集在Web日志中普遍存在。随着Hadoop节点数的增加,并行Fpgrowth算法性能将得到大幅提高。由此,频繁集挖掘效率得到明显提高,且数据量越大,效率提升越明显。 展开更多
关键词 日志文件 频繁集 hadoop fp-growth
在线阅读 下载PDF
基于SQL的频繁项目集的研究 被引量:4
2
作者 王涛伟 胡锡伟 柴本成 《计算机工程与设计》 CSCD 北大核心 2006年第23期4494-4497,共4页
Apriori算法是关联规则中挖掘频繁项目集的典型算法。在Apriori算法的基础上,利用关系数据库管理系统的强大功能和SQL语言操作简单,效率高的特点,提出了基于SQL的Apriori算法。该算法实现简单快速,可有效缩小扫描数据库的大小。将该算... Apriori算法是关联规则中挖掘频繁项目集的典型算法。在Apriori算法的基础上,利用关系数据库管理系统的强大功能和SQL语言操作简单,效率高的特点,提出了基于SQL的Apriori算法。该算法实现简单快速,可有效缩小扫描数据库的大小。将该算法应用于经过数据预处理的Web日志文件数据库,实验结果显示该算法是有效的。 展开更多
关键词 数据挖掘 关联规则 频繁项目集 SQL 数据预处理 Web日志文件
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部