-
题名基于改进CURE算法的不确定性移动用户数据聚类
被引量:8
- 1
-
-
作者
高长元
王海晶
王京
-
机构
哈尔滨理工大学管理学院
哈尔滨理工大学高新技术产业发展研究中心
-
出处
《计算机工程与科学》
CSCD
北大核心
2016年第4期768-774,共7页
-
基金
国家自然科学基金(71272191
71072085)
+1 种基金
黑龙江省自然科学基金(G201301)
黑龙江省高等学校哲学社会科学创新团队建设计划(TD201203)
-
文摘
随着云计算、大数据以及移动互联网的发展,移动终端用户数据呈现出数据量大、噪声大、动态性及不确定性增强的趋势,影响了移动用户数据聚类准确率与效率。针对上述问题,提出了一种改进的层次聚类算法CURE。该算法将原有算法中抽样处理数据的方式用Map Reduce函数实现并行化处理,同时结合区间数的概念,将移动用户数据用一个区间表示,计算其区间距离来适应移动用户数据的不确定性特点,从而提高聚类效率与准确率。最后利用MIT Reality项目数据集进行仿真,仿真结果表明了该方法的有效性及可行性,为移动用户数据的进一步利用及用户的个性化推荐提供支持。
-
关键词
CURE
不确定性数据
移动用户数据
Map
REDUCE
-
Keywords
clustering using representatives(CURE)
uncertain data
mobile end-user data
Map Reduce
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-