-
题名基于改进张量链分解的多聚类算法
- 1
-
-
作者
张宏俊
张泽宇
张颖娇
叶昊
潘高军
-
机构
中国通信服务股份有限公司
南京邮电大学物联网学院
曼彻斯特大学人工智能学院
南京邮电大学现代邮政学院
华为技术有限公司南京研究所
北京外企德科人力资源服务上海有限公司
浙江省通信产业服务有限公司
-
出处
《电信科学》
北大核心
2025年第6期103-120,共18页
-
基金
国家自然科学基金资助项目(No.61972208,No.62102194,No.62272239)
江苏省研究生科研与实践创新计划项目(No.KYCX22_1027,No.SJCX24_0339,No.SJCX24_0346)
南京邮电大学大学生创新训练计划项目(No.XZD2019116,No.XYB2019331)。
-
文摘
随着大数据时代的到来,高阶数据的有效表示和分析成为一项重大挑战。基于此,聚焦于张量分解技术在多聚类算法中的应用,特别是针对大型多源异构数据集的处理,深入研究并改进了张量链(tensor train,TT)分解方法,通过引入新的优化策略,显著提高了其在多聚类任务中的性能。创新主要体现在两个方面:一是提出了一种新的张量分解框架,该框架通过优化目标函数,有效降低了存储成本并提高了计算效率;二是将改进的张量分解技术应用于3种主要的多聚类算法中,包括自加权多视图聚类(self-weighted multi-view clustering,SwMC)、潜在多视图子空间聚类(latent multi-view subspace clustering,LMSC)和具有完整性感知相似性的多视图子空间聚类(multi-view subspace clustering with intactness-aware similarity,MSC IAS),显著提升了聚类的准确性和效率。为了验证方法的有效性,在7个真实的数据集上进行了全面的实验评估,包括准确性(accuracy,ACC)、归一化互信息(normalized mutual information,NMI)和纯度等3个指标。实验结果表明,所提出的方法在提取有意义的模式和提高聚类性能方面具有显著优势。
-
关键词
张量
多聚类算法
张量分解
多源异构数据
主成分分析
-
Keywords
tensor
multi-clustering algorithm
tensor decomposition
multi-source heterogeneous data
principal component analysis
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-