-
题名一种基于群体智能的Web文档聚类算法
被引量:41
- 1
-
-
作者
吴斌
傅伟鹏
郑毅
刘少辉
史忠植
-
机构
中国科学院计算技术研究所智能信息处理开放重点实验室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2002年第11期1429-1435,共7页
-
基金
国家自然科学基金项目 ( 6 0 0 730 19
90 10 40 2 1)
北京市自然科学基金重点项目 ( 4 0 110 0 3)资助
-
文摘
将群体智能聚类模型运用于文档聚类 ,提出了一种基于群体智能的 Web文档聚类算法 .首先运用向量空间模型表示 Web文档信息 ,采用常规方法如消除无用词和特征词条约简法则得到文本特征集 ,然后将文档向量随机分布到一个平面上 ,运用基于群体智能的聚类方法进行文档聚类 ,最后从平面上采用递归算法收集聚类结果 .为了改善算法的实用性 ,将原算法与 k均值算法相结合提出一种混合聚类算法 .通过实验比较 ,结果表明基于群体智能的 Web文档聚类算法具有较好的聚类特性 ,它能将与一个主题相关的 Web文档较完全而准确地聚成一类 .
-
关键词
群体智能
WEB
文档聚类算法
自组织聚类
群体相似度
互联网
信息检索
-
Keywords
swarm intelligence, document clustering, self-organizing clustering, swarm similarity
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
G354.4
[文化科学—情报学]
-