-
题名基于数据关联性聚类的数据布局算法
被引量:2
- 1
-
-
作者
董微
闻育
-
机构
中国计量学院计算机应用技术系
-
出处
《计算机工程与应用》
CSCD
2014年第3期117-120,共4页
-
文摘
现代信息系统的突出特征是基于海量数据的分布式应用集群。优化海量数据的存储布局,以提升存储资源的利用率和应用执行的速度,是一个重要研究课题。由于数据与数据之间存在关联性,只考虑负载均衡的布局算法缺乏实用性,需要进一步考虑数据与数据的关联性以提高应用执行速度。建立了数据和数据的关联矩阵,基于关联矩阵进行聚类,再将数据分配到各个数据中心中,计算执行应用时的数据迁移量,并与一致hash算法进行了比较,结果表明数据迁移量大大低于一致hash算法。
-
关键词
数据布局
聚类
一致hash
数据关联性
-
Keywords
data placement
clustering
consistent hash
data dependence
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-