期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于MapReduce的增量式数据集的相似性连接 被引量:2
1
作者 徐媛媛 陈华辉 《计算机应用研究》 CSCD 北大核心 2014年第11期3369-3374,3384,共7页
相似性连接,即利用相似函数度量数据之间的相似程度,满足条件后进行连接操作。MapReduce框架下已存在很多相似性连接算法,但仍然存在一些不足,如大量的索引加大时间、空间的开销;现有算法不能有效地完成增量式数据集的相似性连接等。针... 相似性连接,即利用相似函数度量数据之间的相似程度,满足条件后进行连接操作。MapReduce框架下已存在很多相似性连接算法,但仍然存在一些不足,如大量的索引加大时间、空间的开销;现有算法不能有效地完成增量式数据集的相似性连接等。针对海量增量式数据集进行了研究,采用抽样技术得到有效中枢,形成更为合理的分区,建立分区索引和分配原则,完成新增数据的相似性连接操作。实验证明,该算法能够有效地解决海量增量式数据集的相似性连接问题,验证了分区索引的建立,可以提高新增数据的相似性连接操作的效率。 展开更多
关键词 海量增量式数据集 划分 相似性连接 MAPREDUCE
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部