期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
结合文本信息量和聚类的文本裁剪算法
被引量:
2
1
作者
谢攀
邓珍荣
朱益立
《计算机工程与设计》
北大核心
2018年第3期880-884,共5页
针对KNN文本分类时间效率低的缺点,提出一种结合文本信息量和聚类的文本裁剪算法。考虑到训练文本中存在类别相关性弱的文本,计算每条文本包含的信息量并排序,对向量空间模型利用聚类删除噪声文本,结合文本的重要性在各类别中筛选出代...
针对KNN文本分类时间效率低的缺点,提出一种结合文本信息量和聚类的文本裁剪算法。考虑到训练文本中存在类别相关性弱的文本,计算每条文本包含的信息量并排序,对向量空间模型利用聚类删除噪声文本,结合文本的重要性在各类别中筛选出代表文本构建新的样本空间,在新样本空间上进行分类。实验结果表明,该方法能合理有效地裁剪文本集,提高分类效率。
展开更多
关键词
文本
分类
最邻近
文本信息量
聚类
样本裁剪
在线阅读
下载PDF
职称材料
题名
结合文本信息量和聚类的文本裁剪算法
被引量:
2
1
作者
谢攀
邓珍荣
朱益立
机构
桂林电子科技大学计算机与信息安全学院
桂林电子科技大学广西可信软件重点实验室
出处
《计算机工程与设计》
北大核心
2018年第3期880-884,共5页
基金
广西科技攻关计划基金项目(桂科攻1598019-6)
桂林市科技攻关计划基金项目(2016010406-4)
桂林电子科技大学研究生教育创新计划基金项目(2016YJCX65)
文摘
针对KNN文本分类时间效率低的缺点,提出一种结合文本信息量和聚类的文本裁剪算法。考虑到训练文本中存在类别相关性弱的文本,计算每条文本包含的信息量并排序,对向量空间模型利用聚类删除噪声文本,结合文本的重要性在各类别中筛选出代表文本构建新的样本空间,在新样本空间上进行分类。实验结果表明,该方法能合理有效地裁剪文本集,提高分类效率。
关键词
文本
分类
最邻近
文本信息量
聚类
样本裁剪
Keywords
text categorization
KNN
te x t in fo rma t io n
clu s te r
te x t reducing
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
结合文本信息量和聚类的文本裁剪算法
谢攀
邓珍荣
朱益立
《计算机工程与设计》
北大核心
2018
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部