-
题名基于公平感知的缺失多视图聚类
被引量:1
- 1
-
-
作者
江梦平
刘美玲
王前前
高全学
张向东
-
机构
西安电子科技大学通信工程学院
-
出处
《信号处理》
北大核心
2025年第2期241-252,共12页
-
文摘
缺失多视图聚类是一种处理多源数据的方法,它能够在数据中发现一致和互补的信息,并将数据分成不同的簇。这种方法可以有效解决复杂环境下的无监督多源数据分析问题,因此受到了广泛关注。然而,现有的缺失多视图聚类算法存在一些问题。它们往往忽视了数据中的一些差异,这些差异源于特殊群体的敏感属性。这会导致算法对这些特殊群体产生偏见,从而引发聚类的不公平问题。此外,经过修复之后的缺失样本,缺乏样本的独特性。针对以上问题,本文提出了一种基于公平感知的缺失多视图聚类方法,以缓解无监督聚类任务对特殊群体的不公平对待,同时解决了多视图数据一致性融合和缺失数据恢复问题。首先分别为每一个视图训练一个自动编解码器,利用信息论对经过编码器得到的多视图嵌入特征进行一致性融合,同时训练一个生成网络以恢复缺失视图数据,在使用嵌入特征进行聚类时,约束各簇中特殊群体的分布,使得各簇中特殊群体分布与整个数据集中的分布接近以保证算法的公平性。实验在3个常用多视图数据集上与最新的5种缺失多视图聚类方法进行了比较,在Bank数据集上缺失率为0.5时,相比于性能第2的方法,标准化互信息(Normalized Mutual Information,NMI)值提高了0.82%,公平值(Balance)提高了3.03%;在Credit Card数据集上缺失率为0时,相比于性能第2的方法,NMI值提高了3.53%,Balance值提高了5.62%。同时也在Credit Card数据集中进行了可视化实验以验证聚类算法的性能和公平性,消融实验证明了提出的多视图一致性融合和缺失视图恢复机制的有效性。本文所提出的方法考虑了缺失多视图场景下无监督聚类算法的公平性问题,在保证算法聚类性能的前提下提高了无监督聚类任务的公平性。
-
关键词
无监督学习
公平性机器学习
缺失多视图聚类
多视图一致性学习
缺失视图恢复
信息论
-
Keywords
unsupervised learning
fair machine learning
incomplete multi-view clustering
multi-view consistency learning
missing view recovery
information theory
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
TP274
[自动化与计算机技术—检测技术与自动化装置]
-