文摘半监督聚类集成旨在利用成对约束提升聚类集成的精度,但在高维空间的聚类效果却显著降低,另外,当只有少量的成对约束可以利用时,聚类性能很难提升.针对这些问题,提出一种新颖的半监督聚类集成算法WSCEC(Weighted Semi-supervised Clustering Ensemble Algorithm Based on Extended Constraint Projection).首先,利用多种聚类算法对数据的特征空间进行聚类,再使用随机子空间进行降维,以减少冗余特征的影响;其次,根据每对约束的k个最近或最远的样本以及约束间的传递关系来扩展原有的约束集,通过约束投影技术将原始数据空间投影到低维空间以满足尽可能多的约束;最后,设计了一个聚类解的加权策略,为每一个聚类解分配一个适当的权重以降低低质量聚类解的影响.在多个数据集上的实验结果证明了提出算法的有效性.