一些经典降维算法并不是最优的降维策略,它们不再适用于流形式且大尺度的Web文本数据,因此提出了一种加权的增量式有监督的降维算法,称为加权的增量式极大边界准则(Weighted Incremental Maximum Margin Criterion,WIMMC)。WIMMC通过加...一些经典降维算法并不是最优的降维策略,它们不再适用于流形式且大尺度的Web文本数据,因此提出了一种加权的增量式有监督的降维算法,称为加权的增量式极大边界准则(Weighted Incremental Maximum Margin Criterion,WIMMC)。WIMMC通过加权得到比传统算法更好的结果,而且可以增量地有监督地处理大尺度的Web文本数据。给出了算法的收敛性证明和一些实验,并从实验结果可以看出,通过WIMMC降维之后的分类效果比其他降维算法更有效。展开更多
文摘一些经典降维算法并不是最优的降维策略,它们不再适用于流形式且大尺度的Web文本数据,因此提出了一种加权的增量式有监督的降维算法,称为加权的增量式极大边界准则(Weighted Incremental Maximum Margin Criterion,WIMMC)。WIMMC通过加权得到比传统算法更好的结果,而且可以增量地有监督地处理大尺度的Web文本数据。给出了算法的收敛性证明和一些实验,并从实验结果可以看出,通过WIMMC降维之后的分类效果比其他降维算法更有效。
文摘局部保持投影(Locality preserving projections,LPP)算法只保持了目标在投影后的邻域局部信息,为了更好地刻画数据的流形结构,引入了类内和类间局部散度矩阵,给出了一种基于有效且稳定的大间距准则(Maximum margin criterion,MMC)的不相关保局投影分析方法,该方法在最大化散度矩阵迹差时,引入尺度因子α,对类内和类间局部散度矩阵进行加权,以便找到更适合分类的子空间并且可避免小样本问题;更重要的是,大间距准则下提取的判别特征集一般情况下是统计相关的,造成了特征信息的冗余,因此,通过增加一个不相关约束条件,利用推导出的公式提取不相关判别特征集,这样做,对正确识别更为有利.在Yale人脸库、PIE人脸库和MNIST手写数字库上的测试结果表明,本文方法有效且稳定,与LPP、LDA(Linear discriminant analysis)和LPMIP(Locality-preserved maximum information projection)方法等相比,具有更高的正确识别率。
文摘线性拉普拉斯判别准则(Linear Laplacian discrimination,LLD)作为一种非线性特征提取方法得到了较为成功的运用.然而通过分析得知在具体使用LLD方法的过程中还会面临小样本以及如何确定原始样本空间类型的问题.因此,本文引入语境距离度量并结合最大间距判别准则的基本原理提出一种基于语境距离度量的拉普拉斯最大间距判别准则(Contextual-distance metric based Laplacian maximum margin criterion,CLMMC).该准则不但在一定程度上避免小样本问题,而且由于语境距离度量更关注输入样本簇内在的本质结构而不是原始样本空间的类型,从而降低了该准则对特定样本空间的依赖程度.同时通过引入计算语境距离度量的新算法并结合QR分解的基本原理,使得CLMMC在处理高维矢量模式数据时更具适应性和效率.并从理论上讨论CLMMC准则具有的基本性质以及与LLD准则的内在联系.实验证明CLMMC准则具有上述优势.