期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于向量空间模型的多层次文本分类方法
被引量:
75
1
作者
刘少辉
董明楷
+2 位作者
张海俊
李蓉
史忠植
《中文信息学报》
CSCD
北大核心
2002年第3期8-14,26,共8页
本文研究和改进了经典的向量空间模型 (VSM )的词语权重计算方法 ,并在此基础上提出了一种基于向量空间模型的多层次文本分类方法。也就是把各类按照一定的层次关系组织成树状结构 ,并将一个类中的所有训练文档合并为一个类文档 ,在提...
本文研究和改进了经典的向量空间模型 (VSM )的词语权重计算方法 ,并在此基础上提出了一种基于向量空间模型的多层次文本分类方法。也就是把各类按照一定的层次关系组织成树状结构 ,并将一个类中的所有训练文档合并为一个类文档 ,在提取各类模型时只在同层同一结点下的类文档之间进行比较 ;而对文档进行自动分类时 ,首先从根结点开始找到对应的大类 ,然后递归往下直到找到对应的叶子子类。实验和实际系统表明 。
展开更多
关键词
多层次文本分类方法
向量空间模型
信息增益
特征提取
词语权重
层次
关系
文档
分类
在线阅读
下载PDF
职称材料
题名
一种基于向量空间模型的多层次文本分类方法
被引量:
75
1
作者
刘少辉
董明楷
张海俊
李蓉
史忠植
机构
中国科学院计算技术研究所智能信息处理重点实验室
出处
《中文信息学报》
CSCD
北大核心
2002年第3期8-14,26,共8页
基金
国家自然科学基金 (6 0 1730 17)
北京自然科学基金 (40 110 0 3)支持
文摘
本文研究和改进了经典的向量空间模型 (VSM )的词语权重计算方法 ,并在此基础上提出了一种基于向量空间模型的多层次文本分类方法。也就是把各类按照一定的层次关系组织成树状结构 ,并将一个类中的所有训练文档合并为一个类文档 ,在提取各类模型时只在同层同一结点下的类文档之间进行比较 ;而对文档进行自动分类时 ,首先从根结点开始找到对应的大类 ,然后递归往下直到找到对应的叶子子类。实验和实际系统表明 。
关键词
多层次文本分类方法
向量空间模型
信息增益
特征提取
词语权重
层次
关系
文档
分类
Keywords
Text Classification
Vector Space Model
Information Gain
Feature Selection
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种基于向量空间模型的多层次文本分类方法
刘少辉
董明楷
张海俊
李蓉
史忠植
《中文信息学报》
CSCD
北大核心
2002
75
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部