-
题名基于粒计算Web文档聚类
被引量:1
- 1
-
-
作者
赵小龙
张步群
丁为民
-
机构
安徽省巢湖学院计算机系
-
出处
《计算机工程与应用》
CSCD
北大核心
2008年第13期141-143,167,共4页
-
基金
四川省重大基础研究项目子课题基金(No.04JY029-001-4)
-
文摘
提出了一种基于粒计算Web文档聚类(WDCGrc)方法。该方法通过TF-IDF法则计算文档词条的权值,采取设定文档阈值和平均权值相结合的方法实行降维,抽取出每篇文档的主干词;建立了文档的主干词和二进制粒之间的转换,提出了基于粒计算提取文档间的关联规则算法来获取文档间的频繁项集,由频繁项集形成初始聚类,使用优化算法对初始聚类进行优化,得到最终聚类结果。实验结果表明,该方法切实有效,聚类质量较好。
-
关键词
粒计算
聚类
关联规则
WEB文档
-
Keywords
granular computing
clustering
association rules
Web documents
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-