-
题名聚类分析中类数估计方法的实验比较
被引量:24
- 1
-
-
作者
王开军
李健
张军英
过立新
-
机构
西安电子科技大学计算机学院
西北政法大学网络信息中心
西安邮电学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第9期198-199,202,共3页
-
基金
国家自然科学基金资助项目(60574039,60371044)
-
文摘
在基因表达数据的探索性聚类分析中,聚类个数的确定是决定聚类质量的关键因素。许多聚类有效性评价指标和方法可用于PAM聚类算法。该文讨论适合于PAM算法的7种常用评价指标和方法,采用4种不同聚类结构特征的基因表达数据对它们的性能进行实验比较。结果表明,系统演化方法和稳定性方法估计聚类个数的性能最好,正确率分别为100%与90%。
-
关键词
聚类有效性
聚类个数估计
聚类分析
基因表达数据
-
Keywords
cluster validation
clusters number estimation
cluster analysis
gene expression data
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名半监督的仿射传播聚类
被引量:29
- 2
-
-
作者
王开军
李健
张军英
涂重阳
-
机构
西安电子科技大学计算机学院
西北政法大学网络信息中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第23期197-198,201,共3页
-
基金
国家自然科学基金资助项目(60574039
60371044)
-
文摘
仿射传播聚类算法快速、有效,可以解决大数据集的聚类问题,但当数据的聚类结构比较松散时,聚类准确性不高。该文提出了半监督的仿射传播聚类算法,在迭代过程中嵌入了有效性指标以监督和引导算法向最优聚类结果的方向运行。实验结果表明,该方法对于聚类结构比较紧密和松散的数据集,均可以给出较为准确的聚类结果。
-
关键词
仿射传播聚类
半监督聚类
大数据集的聚类算法
-
Keywords
affinity propagation clustering
semi-supervised clustering
cluster algorithm for large data sets
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-