摘要
现有的非负矩阵分解方法既忽略数据的非局部结构,又难以有效应对噪声和野值点。为了解决上述问题,提出一种新的用于聚类的鲁棒结构正则化非负矩阵分解算法。所提出的算法分别构建一个近邻图和一个最大熵图描述数据的局部结构和非局部结构,并使用L2,1范数代价函数尝试解决噪声问题,从而学习到鲁棒具有判别力的表征。给出一个最优的迭代算法求解两个非负因子,该优化算法的收敛性已被理论和实验证明。在七个图像数据集上的聚类实验结果表明,所提出的算法在无噪声和有噪声情况下聚类均优于其他主流方法。
Most existing NMF methods not only ignore the non-local structure of data, but also are difficult to deal with noise and outliers effectively. To address these issues, this paper proposed a novel robust structure regularized nonnegative matrix factorization(RSNMF) algorithm for clustering. The proposed RSNMF constructed a nearest neighbor graph and a maximum entropy graph to respect local and non-local structures of the data, respectively. Moreover, the L2,1-norm-based cost function tries to address noise and outliers. Therefore, RSNMF could learn robust compact and discriminative representations. This paper presented an optimal iterative algorithm to solve two nonnegative factors. The convergence of such an optimization scheme has been proved theoretically and empirically. Experimental clustering results on seven image datasets show that the proposed algorithm is superior to the state-of-the-art methods in both noiseless and noisy situations.
作者
董文婷
尹学松
余节约
王毅刚
Dong Wenting;Yin Xuesong;Yu Jieyue;Wang Yigang(Dept.of Digital Media Technology,Hangzhou Dianzi University,Hangzhou 310018,China)
出处
《计算机应用研究》
CSCD
北大核心
2023年第3期794-799,共6页
Application Research of Computers
基金
浙江省公益技术应用研究项目(LGG22F020032)
浙江省重点研发计划重点专项项目(2021C03137)。
关键词
非负矩阵分解
最大熵图
L2
1范数
聚类
nonnegative matrix factorization
maximum entropy graph
L2
1 norm
clustering
作者简介
董文婷(1996-),女,江苏连云港人,硕士研究生,主要研究方向为机器学习、数据挖掘;通信作者:尹学松(1975-),男,安徽六安人,教授,博士,主要研究方向为机器学习、数据挖掘、图像处理(yinxs@hdu.edu.cn);余节约(1969-),男,山东菏泽人,教授,硕导,博士,主要研究方向为色彩管理与印刷过程数字化;王毅刚(1971-),男,河南洛阳人,教授,博导,博士,主要研究方向为计算机图形学、计算机图像处理、虚拟现实技术.