-
题名结合度量融合和地标表示的自编码谱聚类算法
被引量:2
- 1
-
-
作者
张敏
周治平
-
机构
江南大学物联网工程学院
江南大学物联网技术应用教育部工程研究中心
-
出处
《智能系统学报》
CSCD
北大核心
2020年第4期687-696,共10页
-
文摘
针对大多数现有谱聚类算法处理大规模数据集时面临聚类精度低、大规模相似度矩阵存储开销大的问题,提出一种结合度量融合和地标表示的自编码谱聚类算法。引入相对质量概念进行节点评估,选取最具代表性的点作为地标点,通过稀疏表示近似获得图相似度矩阵,以降低存储开销。同时考虑到近邻样本的几何分布和拓扑分布的信息,融合欧氏距离与Kendall Tau距离来度量地标点与其他样本之间的相似度,提高聚类精度;以栈式自编码器取代拉普拉斯矩阵特征分解,将所获得的相似度矩阵作为自编码器的输入,通过联合学习嵌入表示和聚类来进一步提高聚类精度。在5个大规模数据集上的实验验证了本文算法的有效性。
-
关键词
大规模数据集
度量融合
地标表示
相对质量
稀疏表示
栈式自编码器
联合学习
嵌入表示
-
Keywords
large-scale datasets
metric fusion
landmark representation
relative mass
sparse representation
stacked autoencoder
joint learning
embedded representation
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于地标表示的联合谱嵌入和谱旋转的谱聚类算法
- 2
-
-
作者
李鹏
刘力军
黄永东
-
机构
大连民族大学理学院
-
出处
《计算机科学》
CSCD
北大核心
2021年第S01期220-225,共6页
-
基金
国家自然科学基金(61002039,61572018,11761001)。
-
文摘
经典的谱聚类算法包含两个步骤。(1)谱嵌入过程:求解Laplacian矩阵的特征值分解,得到分类指示矩阵的连续松弛解。(2)后处理过程:对谱嵌入连续松弛矩阵应用k-means或者谱旋转,得到最终的二值指示矩阵。由于有用信息的丢失,这种单独求解步骤不能保证最佳聚类结果。同时,谱聚类算法在处理大规模数据集时,存在聚类精度低、数据相似度矩阵存储开销大和Laplacian矩阵特征值分解计算复杂度高的问题。已有的联合谱聚类算法使用标准正交矩阵逼近非标准正交簇指示矩阵,这会导致较大的逼近误差。为了克服这一缺点,提出用一个改进的标准正交簇指示矩阵代替非正交指示矩阵,得到一个新的联合谱嵌入和谱旋转的谱聚类算法。因为两个标准正交矩阵更容易最小化,所以提出的算法可以取得更好的性能。进一步通过地标点方法对原始数据集进行稀疏特征表示,提出一种基于地标表示的联合谱嵌入和谱旋转算法(LJSESR),解决了大规模数据谱聚类的高效求解问题。实验结果表明,提出的LJSESR算法具有可行性和有效性。
-
关键词
谱聚类
谱旋转
谱嵌入
地标表示
联合谱聚类
-
Keywords
Spectral clustering
Spectral rotation
Spectral embedding
Landmark representation
Joint spectral clustering
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-