摘要
针对文本自动分类问题,提出了一种基于LSA降维的KNN改进算法.通过对文本特征向量运用LSA理论进行降维处理,可以有效提高KNN算法的运行效率,提高分类精度.实验证明,改进的KNN算法具有很好的性能.
Aimed at the problem of document automatic classification,an algorithm is proposed based on LSA and KNN.It advances the KNN algorithm's efficiency and classifier's precision by using LSA to reduce dimensionality of text feature matrix.The experiment result shows that it has good performance.
出处
《东北师大学报(自然科学版)》
CAS
CSCD
北大核心
2007年第2期33-36,共4页
Journal of Northeast Normal University(Natural Science Edition)
基金
国家"十五"科技攻关计划项目(2004BA721A05)
关键词
潜在语义分析
KNN
文本分类
降维
latent semantic analysis
KNN
text categorization
reduce dimensionality
作者简介
李良俊(1967-),男,博士研究生,副教授,主要从事数据挖掘、神经网络研究;
张斌(1964-),男,教授,博士研究生导师,主要从事语义Web,网格技术和数据挖掘等研究.