期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
结合文本信息量和聚类的文本裁剪算法 被引量:2
1
作者 谢攀 邓珍荣 朱益立 《计算机工程与设计》 北大核心 2018年第3期880-884,共5页
针对KNN文本分类时间效率低的缺点,提出一种结合文本信息量和聚类的文本裁剪算法。考虑到训练文本中存在类别相关性弱的文本,计算每条文本包含的信息量并排序,对向量空间模型利用聚类删除噪声文本,结合文本的重要性在各类别中筛选出代... 针对KNN文本分类时间效率低的缺点,提出一种结合文本信息量和聚类的文本裁剪算法。考虑到训练文本中存在类别相关性弱的文本,计算每条文本包含的信息量并排序,对向量空间模型利用聚类删除噪声文本,结合文本的重要性在各类别中筛选出代表文本构建新的样本空间,在新样本空间上进行分类。实验结果表明,该方法能合理有效地裁剪文本集,提高分类效率。 展开更多
关键词 文本分类 最邻近 文本信息量 聚类 样本裁剪
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部