题名 智能文本分类系统的研究与设计
被引量:10
1
作者
杨清
杨岳湘
瞿国平
机构
国防科技大学计算机学院
出处
《计算机应用研究》
CSCD
1999年第10期15-17,共3页
基金
国防科技大学的定题检索系统资助
文摘
本文介绍了基于实例学习建立自动文本分类器的方法.通过对文本自动分类的原理的剖析。介绍了文本自动分类系统建立的基本过程,同时详细地说明和比较了文档表示、功能选择以及机器学习方法以及相关算法。
关键词
机器学习
分类 器
文本分类系统
人工智能
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于层次分析法的中文文本分类系统评价
被引量:1
2
作者
张成宝
王志玲
机构
山东理工大学
出处
《情报杂志》
CSSCI
北大核心
2007年第10期33-35,共3页
文摘
利用层次分析法(AHP)的原理和方法,探讨了中文文本分类系统影响因素的评价问题。首先,提出了影响文本分类系统性能的指标体系,建立了文本分类系统评价的层次结构模型;其次,根据专家调查的结果,构建比较判断矩阵;最后,利用AHP专用软件Expert Choice计算各层次评价指标的权重,并对结果进行了分析说明。
关键词
文本分类系统
影响因素
层次分析法
EXPERT
CHOICE
分类号
O225
[理学—运筹学与控制论]
题名 基于本体的异构文本分类系统
被引量:4
3
作者
赵国涛
何钦铭
机构
浙江大学计算机学院
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第21期123-125,共3页
文摘
提出了一个基于本体的异构文本分类系统,使用结构本体很好地消除了文本文档的结构上的差异,并将领域本体引入到分类系统中,使得分类更加准确、高效,分类的规则更易理解。在使用COSA算法提取有效概念的同时,也大大地减少了关键术语的数量,节省了运算开销。
关键词
本体
异构文本分类系统
知识工程
机器学习
规则
Keywords
is reduced enormously. Key words Ontology
Knowledge engineering
Machine learning
Text categorization
Rule
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 基于向量空间模型的文本自动分类系统的研究与实现
被引量:294
4
作者
庞剑锋
卜东波
白硕
机构
中国科学院计算技术研究所
出处
《计算机应用研究》
CSCD
北大核心
2001年第9期23-26,共4页
文摘
随着网络信息的迅猛发展 ,信息处理已经成为人们获取有用信息不可缺少的工具。文本自动分类系统是信息处理的重要研究方向 ,它是指在给定的分类体系下 ,根据文本的内容自动判别文本类别的过程。对文本分类中所涉及的关键技术 ,包括向量空间模型、特征提取、机器学习方法等进行了研究和探讨 ,并且提出了基于向量空间模型的文本分类系统的结构 。
关键词
中文信息处理
向量空间模型
文本 自动分类 系统
人工智能
计算机
Keywords
Text categorization
Chinese information processing
Vector space model
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
题名 一个基于向量空间模型的中文文本自动分类系统
被引量:45
5
作者
朱华宇
孙正兴
张福炎
机构
南京大学计算机软件新技术国家重点实验室
南京大学多媒体技术研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2001年第2期15-17,63,共4页
基金
国家自然科学基金项目!(69903006)
江苏省"九五"重点科技攻关项目!(BE96017)
教育部高等学校骨干教师资助计划项目!(教技司[2
文摘
介绍了一个基于向量空间模型的中文文本自动分类系统,重点阐述了特征提取、空间降维、层次分类和分类器训练等技术的实现方法。实践表明:该系统对文本分类具有较高的平均查全率和平均精度。
关键词
中文文本 自动分类 系统
向量空间模型
自然语言处理
Keywords
Text categorization;Chinese text;Vector space model;Feature extraction
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
题名 对小样本集进行分类技术研究
被引量:2
6
作者
杨传耀
张文德
机构
福州大学信息学院
福州大学图书馆
出处
《情报学报》
CSSCI
北大核心
2004年第2期142-146,共5页
基金
福建省教育厅科研项目,福建省科技厅科研项目
文摘
随着网络信息的迅猛发展,信息处理已经成为人们获取有用信息不可缺少的工具,文本自动分类系统是信息处理的重要研究方向.本文介绍了当今世界上较先进的"变换支持向量机"(TSVM,transductive support vectormachines)技术,它与普通的"支持向量机"(SVM)相比,TSVM方法所需的样本量大大降低,它能有效地对小样本数据集进行分类,同时重点分析了实现它的关键技术、算法及其实现过程.
关键词
信息处理
文本 自动分类 系统
“变换支持向量机”
TSVM
小样本集
分类号
G254.1
[文化科学—图书馆学]
G202
[文化科学—传播学]