-
题名基于特征项权重自动分解的文本聚类
被引量:5
- 1
-
-
作者
余永红
柏文阳
-
机构
安徽财经大学信息工程学院
南京大学计算机软件新技术国家重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第11期25-27,共3页
-
基金
国家"863"计划基金资助项目(2007AA01Z448)
安徽省高校省级自然科学研究基金资助重点项目(KJ2010A003)
-
文摘
提出一种自动文本聚类方法,应用遗传算法进行全局和快速的文本特征项选择以实现降维处理,引入概率匿名思想,根据文本中不同特征项权重的组合,基于动态规划设计一个优化的多项式时间聚类算法,将文本集划分成适当个数的分区,并对每个分区进行聚类,从而形成初始聚类,采用相同方法对所有初始聚类进行再聚类,形成最终的文本聚类。实验结果表明,该方法既能实现文本特征项的有效选择,又能较好地改善文本聚类效果和性能。
-
关键词
文本聚类
遗传算法
特征项选择
特征项权重分解
-
Keywords
text clustering
Genetic Algorithm(GA)
feature item selection
feature item weight partition
-
分类号
N945
[自然科学总论—系统科学]
-