-
题名不同程度的监督机制在自动文本分类中的应用
被引量:1
- 1
-
-
作者
丁磊
钱云涛
-
机构
浙江大学计算机学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2004年第6期65-68,共4页
-
文摘
自动文本分类技术涉及信息检索、模式识别及机器学习等领域。本文以监督的程度为线索 ,综述了分属全监督 ,非监督以及半监督学习策略的若干方法—NBC(Na veBayesClassifier) ,FCM (FuzzyC Means) ,SOM (Self OrganizingMap) ,ssFCM (semi supervisedFuzzyC Means)和gSOM(guidedSelf OrganizingMap) ,并应用于文本分类中。其中 ,gSOM是我们在SOM基础上发展得到的半监督形式。并以Reuters 2 15 78为语料 ,研究了监督程度对分类效果的影响 ,从而提出了对实际文本分类工作的建议。
-
关键词
监督机制
自动文本分类技术
信息检索
模式识别
机器学习
半监督学习
非监督学习
-
Keywords
Text categorization Supervised learning Unsupervised learning Semi-supervised learning
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-