把向量作为空间中的物体展开相似度的评估,分析了向量间各维差值与形状差异的间的近似关系,提出了基于形状相似距离的K-means算法。在三个UCI(University of California,Irvine)标准数据集上的聚类结果表明,对于有关形状信息的数据,基...把向量作为空间中的物体展开相似度的评估,分析了向量间各维差值与形状差异的间的近似关系,提出了基于形状相似距离的K-means算法。在三个UCI(University of California,Irvine)标准数据集上的聚类结果表明,对于有关形状信息的数据,基于形状相似距离的K-means算法比采用传统距离的K-means算法,聚类准确度显著提高。展开更多
提出了一种基于网格距离的融合式聚类算法(Agglomerative Clustering algorithm based on Grid Distance,ACGD)。为规模不同的数据集分别设计了初始球状网格和初始矩形网格,并以此作为合并过程的起点。基于随机映射思想设计了网格之间...提出了一种基于网格距离的融合式聚类算法(Agglomerative Clustering algorithm based on Grid Distance,ACGD)。为规模不同的数据集分别设计了初始球状网格和初始矩形网格,并以此作为合并过程的起点。基于随机映射思想设计了网格之间的距离定义并以此完成聚类任务。ACGD的参数以自适应学习策略确定。真实数据集上的实验表明,ACGD具有良好聚类效果,具有比同类算法更高的效率和算法鲁棒性。展开更多
文摘把向量作为空间中的物体展开相似度的评估,分析了向量间各维差值与形状差异的间的近似关系,提出了基于形状相似距离的K-means算法。在三个UCI(University of California,Irvine)标准数据集上的聚类结果表明,对于有关形状信息的数据,基于形状相似距离的K-means算法比采用传统距离的K-means算法,聚类准确度显著提高。
文摘提出了一种基于网格距离的融合式聚类算法(Agglomerative Clustering algorithm based on Grid Distance,ACGD)。为规模不同的数据集分别设计了初始球状网格和初始矩形网格,并以此作为合并过程的起点。基于随机映射思想设计了网格之间的距离定义并以此完成聚类任务。ACGD的参数以自适应学习策略确定。真实数据集上的实验表明,ACGD具有良好聚类效果,具有比同类算法更高的效率和算法鲁棒性。