检索结果-维普期刊中文期刊服务平台

基于χ~2统计量的kNN文本分类算法被引量：13: 1; 作者印鉴谭焕云《小型微型计算机系统》 CSCD 北大核心 2007年第6期1094-1097,共4页; 随着Internet上文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.由于χ2统计量能很好地体现词和类别之间的相关性,因此成为特征选择中常用的评估函数.本文分析了χ2统计量在特征选择和分类决策阶段的性质,提出了一... 展开更多; 关键词文本分类特征选择 KNN ^Χ^2统计量; 在线阅读下载PDF 职称材料

基于χ~2统计量的不良文本过滤特征选择方法被引量：1: 2; 作者管江红《现代电子技术》北大核心 2019年第21期182-186,共5页; 针对现有以χ^2统计量为基础的特征选择方法在不良文本过滤过程中效果欠佳的问题,利用双层分类对特征选择方法进行改良,提出一种不良文本过滤特征选择方法。首先通过改良逆文档频率来区分特征项在所属类别类内与其他类别之间的分布差别... 展开更多; 关键词特征选择 ^χ^2统计量双层分类不良文本过滤特征项分布评估指标; 在线阅读下载PDF 职称材料

基于模糊决策树的文本分类规则抽取被引量：13: 3; 作者王煜王正欧《计算机应用》 CSCD 北大核心 2005年第7期1634-1637,共4页; 提出一种合并分枝的模糊决策树文本分类方法对相似文本类进行分类,并可抽取出分类精度较高的模糊分类规则。首先研究改进了的χ2统计量,并根据改进的χ2统计量对文本的特征词条进行聚合,有效地降低了文本向量空间的维数。然后使用一种... 展开更多; 关键词相似文本分类规则抽取 ^χ^2统计量模糊决策树; 在线阅读下载PDF 职称材料