摘要
基于潜在空间学习的多视图聚类研究得到了较大发展,但其通常忽略了原始数据中冗余信息的存在可能会带来不理想的聚类结果。为解决这个问题,提出一种潜在表示学习框架下的低冗余多视图聚类算法。基于k-means的方法,直接从各视图数据学习其低维表示,由于该低维表示的各个特征相互正交,学习到的低维表示通常含有较少的冗余信息。基于潜在空间的假设,各视图的低维表示可由同一个潜在表示投影得到。将两者结合,就能得到一个具有低冗余信息的统一的潜在表示。设计了一个优化算法来求解目标问题,在多个公开数据集上的实验表明了该算法的有效性。
Multi-view clustering algorithms based on latent representation learning have gained enormous development.However,they usually neglect the redundant information in the original data,which may cause degraded clustering results.To address this issue,this paper proposes a new algorithm named multi-view clustering based on latent representation learning and low redundancy(LRLLR).First,based on k-means,a new low-dimensional representation can be learnt from each view.It follows from orthogonality that the new representations usually contain low redundant information.Second,we assume that the low-dimensional representation of each view can be projected by a shared latent representation.By combining the two parts into a unified framework,our model can produce a latent representation with low redundancy.Finally,an optimization algorithm is proposed to solve the target problem.Extensive experiments on several benchmark datasets demonstrate the effectiveness of our algorithm compared with other state-of-the-art algorithms.
作者
袁林
杨小飞
邢志伟
万青
YUAN Lin;YANG Xiaofei;XING Zhiwei;WAN Qing(School of Science,Xi'an Polytechnic Lniversity,Xi'an 710600,P.R.China)
出处
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2023年第1期49-59,共11页
Journal of Chongqing University of Posts and Telecommunications(Natural Science Edition)
基金
国家自然科学基金(61976130,12101478)
陕西省重点研发计划项目(2018KW-021)
陕西省自然科学基金(2022KRM170)。
关键词
多视图
聚类
K-MEANS
潜在表示
冗余信息
multi-view
clustering
k-means
latent representation
redundant information
作者简介
袁林(1998-),男,陕西宝鸡人,硕士研究生,主要研究方向为机器学习。E-mail:linnauy1998@163.com;通讯作者:杨小飞(1982-),男,河南洛阳人,副教授,博士,中国人工智能学会会员,主要研究方向为机器学习.E-mail:yangxiaofei 2002@163.com;邢志伟(1980-),男,河南平顶山人,讲师,博士,主要研究方向为机器学习和数据挖掘。E-mail:xzw.xing@gmail.com;万青(1986-),女,陕西西安人,博士,中国人工智能学会会员,主要研究方向为粗糙集、形式概念分析与粒计算。E-mail:wqysbe@163.com。