期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于语义内积空间模型的文本聚类算法 被引量:45
1
作者 彭京 杨冬青 +2 位作者 唐世渭 付艳 蒋汉奎 《计算机学报》 EI CSCD 北大核心 2007年第8期1354-1363,共10页
现有数据聚类方法在处理文本数据,尤其是短文本数据时,由于没有考虑词之间潜在存在的相似情况,因此导致聚类效果不理想.文中针对文本数据高维度和稀疏空间的特点,提出了一种基于语义内积空间模型的文本聚类算法.算法首先利用内积空间的... 现有数据聚类方法在处理文本数据,尤其是短文本数据时,由于没有考虑词之间潜在存在的相似情况,因此导致聚类效果不理想.文中针对文本数据高维度和稀疏空间的特点,提出了一种基于语义内积空间模型的文本聚类算法.算法首先利用内积空间的定义建立了针对中文概念、词和文本的相似度度量方法,然后从理论上进行了分析.最后通过一个两阶段处理过程,即向下分裂和向上聚合,完成文本数据的聚类.该方法成功用于中文短文本数据的聚类.实验表明相对于传统方法,文中提供的方法聚类质量更好. 展开更多
关键词 内积空间 文本聚类 概念相似度 相似计算 数据挖掘
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部