期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于序列的文本自动分类算法 被引量:35
1
作者 解冲锋 李 星 《软件学报》 EI CSCD 北大核心 2002年第4期783-789,共7页
提出了一种基于序列的文本自动分类算法.该算法利用了文本中两个层次的语义相关性:句子(子模式)之间的相关性和句子内代表特定含义的关键词(概念节点)之间的相关性,这样就实现了对关键词的动态加权.对于不含有关键词的子模式,采用Ma... 提出了一种基于序列的文本自动分类算法.该算法利用了文本中两个层次的语义相关性:句子(子模式)之间的相关性和句子内代表特定含义的关键词(概念节点)之间的相关性,这样就实现了对关键词的动态加权.对于不含有关键词的子模式,采用Markov模型来对其信号幅度进行估计,从而生成一个待分类文本的特征序列.在中文文本分类实验中,可以达到83%的BEP值.此外,该算法在实际系统中容易实现. 展开更多
关键词 序列 概念节点 相关值 文本自动分类算法 自然语言处理 计算机
在线阅读 下载PDF
基于模糊综合评判的文本自动分类算法 被引量:1
2
作者 陈勤 张国煊 王小华 《计算机应用与软件》 CSCD 北大核心 2001年第9期56-59,共4页
文本分类在文献检索、信息过滤、数据组织、信息管理等领域中应用十分广泛。本文给出了一种基于模糊综合评判的文本自动分类算法,该算法以文本分词技术作为基础,以类间词频方差作为评判因素的选择依据,通过预定义类中关键词的词频均值... 文本分类在文献检索、信息过滤、数据组织、信息管理等领域中应用十分广泛。本文给出了一种基于模糊综合评判的文本自动分类算法,该算法以文本分词技术作为基础,以类间词频方差作为评判因素的选择依据,通过预定义类中关键词的词频均值高低构造评判矩阵,以最大隶属度作为评判原则。文中详细描述了算法的理论依据、评判因数的选择、评判矩阵的构造及分类算法。实验结果表明本文提出的分类算法具有相当的应用价值。 展开更多
关键词 文本自动分类算法 模糊综合评判 信息处理
在线阅读 下载PDF
一种模仿人类的自动文本分类算法 被引量:5
3
作者 王树梅 戴保存 +1 位作者 黄河燕 陈肇雄 《计算机科学》 CSCD 北大核心 2003年第3期44-45,53,共3页
An algorithm of text classification is given that imitates human's in this paper. On one hand, the algorithmenhances weight of theme when feature vector is processed, because of the assumption that the title of a ... An algorithm of text classification is given that imitates human's in this paper. On one hand, the algorithmenhances weight of theme when feature vector is processed, because of the assumption that the title of a document canproject its content. On the other hand,a weight parameter o vector is designed to simulate human's skimming andskipping behavior for calculating method of a document cluster center, and a weight of the feature that there are morepositive examples than negative ones is enhanced . The experiment shows that the algorithm greatly improves the per-formance of a text classification system. 展开更多
关键词 自动文本分类算法 文本信息处理 文档分类 自然语言处理 INTERNET
在线阅读 下载PDF
基于关联规则的中文文本分类算法的改进 被引量:6
4
作者 张玉芳 杨柯 熊忠阳 《郑州大学学报(理学版)》 CAS 2007年第2期114-117,共4页
随着中文电子刊物和Web文档数量的飞速增加,中文文本自动分类工作变得日益重要.将文档视为事务,将关键词视为项,文本预处理时提出特征权重阈值,用构造的分类器对未知文档分类时,采用了CDD(Class Differen-tiate Degree)改进算法,对基于... 随着中文电子刊物和Web文档数量的飞速增加,中文文本自动分类工作变得日益重要.将文档视为事务,将关键词视为项,文本预处理时提出特征权重阈值,用构造的分类器对未知文档分类时,采用了CDD(Class Differen-tiate Degree)改进算法,对基于关联规则挖掘的中文文本自动分类方法进行了改进.实验结果表明,该算法能较快地获得可理解的规则并且具有较好的宏平均和微平均值. 展开更多
关键词 关联规则挖掘 中文文本 文本自动分类算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部