摘要
使用Logistic回归模型进行中文文本分类,通过实验,比较和分析了不同的中文文本特征、不同的特征数目、不同文档集合的情况下,基于Logistic回归模型的分类器的性能。并将其与线性SVM文本分类器进行了比较,结果显示它的分类性能与线性SVM方法相当,表明这种方法应用于文本分类的有效性。
In this paper,Logistic regression model is used for Chinese text categorization.The categorization performance of this method is analyzed using different approaches for text feautre generation,different dimension of features and different documents set.Moreover,its classification performance is compared to linear SVM classifier in experiments.The experiments results show that its perfromance is comparable with linear SVM classifier.It's a promising method for text categorization.
出处
《计算机工程与应用》
CSCD
北大核心
2009年第14期152-154,共3页
Computer Engineering and Applications
基金
国家自然科学基金No.60772073
河北省自然科学基金No.F2006001020
河北省教育厅科研基金No.2005347
河北大学科研基金No.Y2004045~~
作者简介
李新福(1970-),男,博士,副教授,主要研究方向为智能图文处理;E-mail: mc_lxf@ 126.com
赵蕾蕾(1982-),女,硕士生,主要研究方向为中文信息处理;
何海斌(1978-),男,助教,主要研究方向中文信息处理;
李芳(1980-),女,硕士生,主要研究方向为中文信息处理。