-
题名基于分治法的高维大数据集模糊聚类算法
被引量:5
- 1
-
-
作者
王宝文
阎俊梅
刘文远
石岩
-
机构
燕山大学信息学院
日本九州东海大学工程学院信息系统工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第24期60-62,共3页
-
基金
国家科技部高新技术计划资金资助项目(2005EJ000017)
河北省科技研究与发展计划基金资助项目(02547015D)
河北省普通高等学校博士科研资金资助项目(B2002118)
-
文摘
将高维的大数据集随机分成若干个子集,对每个子集聚类采用一种基于遗传算法的高维数据模糊聚类方法。该方法引入了一个模糊非相似矩阵来表示高维样本之间的非相似程度,并将高维样本随机初始化到二维平面,利用遗传算法迭代优化二维样本的坐标值,实现二维样本之间的欧氏距离向样本间的模糊非相似度的趋近。将得到的最优的二维样本用模糊C-均值聚类(FCM)算法聚类,克服了聚类有效性对高维样本空间分布的依赖。实验仿真表明,该算法有较好的聚类效果,且极大地提高了聚类的速度。
-
关键词
模糊聚类
分治法
遗传算法
模糊非相似矩阵
大数据集
高维
-
Keywords
fuzzy clustering
distributed method
genetic algorithm
fuzzy dissimilar matrix
large data sets
high dimension
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于遗传算法的高维数据模糊聚类
被引量:2
- 2
-
-
作者
王宝文
阎俊梅
刘文远
石岩
-
机构
燕山大学信息学院
日本九州东海大学工程学院信息系统工程系
-
出处
《计算机工程与应用》
CSCD
北大核心
2007年第16期191-192,221,共3页
-
基金
国家科技部高新技术计划项目(No.2005EJ000017)
河北省科技研究与发展计划(02547015D)
河北省普通高等学校博士科研资助基金(No.2002B2002118)
-
文摘
提出了一种基于遗传算法的高维数据模糊聚类方法。引入了一个模糊非相似矩阵来表示高维样本之间的非相似程度,并将高维样本初始化到二维平面。利用遗传算法进行迭代优化二维样本的坐标值,实现二维样本之间的欧氏距离向样本间的模糊非相似度的趋近,使高维样本映射到二维平面。最后将得到的最优的二维样本利用模糊C-均值聚类(FCM)算法聚类,克服了聚类有效性对高维样本空间分布的依赖。实验仿真表明利用该方法有较好的聚类效果,且比用FCM算法直接聚类收敛速度快。
-
关键词
模糊聚类
模糊非相似矩阵
遗传算法
高维数据
-
Keywords
fuzzy clustering
fuzzy dissimilar matrix
genetic algorithm
high dimensional datas
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-