深度聚类在高维较大数据集中应用广泛,得益于神经网络强大的数据特征提取能力,但目前的深度聚类特征提取一般集中在神经网络的中间层,忽略了浅层特征的有用信息.为解决上述问题,提出一种基于神经网络多层特征提取的集成聚类算法(Deep En...深度聚类在高维较大数据集中应用广泛,得益于神经网络强大的数据特征提取能力,但目前的深度聚类特征提取一般集中在神经网络的中间层,忽略了浅层特征的有用信息.为解决上述问题,提出一种基于神经网络多层特征提取的集成聚类算法(Deep Ensemble Clustering Based on Multi-Level Features,DCMLF),使用三个只有卷积层数不同而其他参数相同的网络结构提取同一个输入的不同层次特征,并进行集成聚类.通过不同层次特征组合实验验证浅层特征对聚类结果的影响,并证明该算法同经典的传统聚类算法以及经典的深度聚类算法相比,聚类性能有所提升.展开更多
密度峰值聚类算法(Density peaks clustering,DPC)是一种基于密度的新型聚类算法。该算法的优点十分显著:所需参数较少,没有迭代过程,能自适应获得聚类数目并识别任意形状的簇类。该算法也有一些问题亟待解决:(1)在决策图上人工选择聚...密度峰值聚类算法(Density peaks clustering,DPC)是一种基于密度的新型聚类算法。该算法的优点十分显著:所需参数较少,没有迭代过程,能自适应获得聚类数目并识别任意形状的簇类。该算法也有一些问题亟待解决:(1)在决策图上人工选择聚类中心,产生聚类误差;(2)在密度不同的流形数据集上聚类效果不佳。针对这些不足,该文提出一种基于电子分层模型和凝聚策略的密度峰值聚类算法(Density peaks clustering based on electronic shells model and merging strategy,EMDPC)。其利用电子分层模型计算每个数据点的局部密度,更易识别出低密度簇;通过子簇凝聚策略自适应识别簇类数目,降低了人工选取聚类中心时误差发生的概率;并且子簇凝聚策略能较好地解决DPC在密度不均匀的流形数据上聚类效果不佳的问题。实验分析表明基于电子分层模型和凝聚策略的密度峰值聚类算法具有较高的精度和较好的聚类性能,其结果优于其他先进的聚类算法。展开更多
文摘深度聚类在高维较大数据集中应用广泛,得益于神经网络强大的数据特征提取能力,但目前的深度聚类特征提取一般集中在神经网络的中间层,忽略了浅层特征的有用信息.为解决上述问题,提出一种基于神经网络多层特征提取的集成聚类算法(Deep Ensemble Clustering Based on Multi-Level Features,DCMLF),使用三个只有卷积层数不同而其他参数相同的网络结构提取同一个输入的不同层次特征,并进行集成聚类.通过不同层次特征组合实验验证浅层特征对聚类结果的影响,并证明该算法同经典的传统聚类算法以及经典的深度聚类算法相比,聚类性能有所提升.
文摘密度峰值聚类算法(Density peaks clustering,DPC)是一种基于密度的新型聚类算法。该算法的优点十分显著:所需参数较少,没有迭代过程,能自适应获得聚类数目并识别任意形状的簇类。该算法也有一些问题亟待解决:(1)在决策图上人工选择聚类中心,产生聚类误差;(2)在密度不同的流形数据集上聚类效果不佳。针对这些不足,该文提出一种基于电子分层模型和凝聚策略的密度峰值聚类算法(Density peaks clustering based on electronic shells model and merging strategy,EMDPC)。其利用电子分层模型计算每个数据点的局部密度,更易识别出低密度簇;通过子簇凝聚策略自适应识别簇类数目,降低了人工选取聚类中心时误差发生的概率;并且子簇凝聚策略能较好地解决DPC在密度不均匀的流形数据上聚类效果不佳的问题。实验分析表明基于电子分层模型和凝聚策略的密度峰值聚类算法具有较高的精度和较好的聚类性能,其结果优于其他先进的聚类算法。