期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
文本分类中训练集相关数量指标的影响研究 被引量:6
1
作者 李湘东 曹环 黄莉 《计算机应用研究》 CSCD 北大核心 2014年第11期3324-3327,3332,共5页
针对训练集对分类性能的影响,从训练集的文本数、类别数以及特征项数这三项数量指标出发进行研究。使用多因素方差分析方法及多种语料库定量探讨该三项数量指标对分类性能的影响规律。结果发现特征项数对分类性能的影响在不同的文本数... 针对训练集对分类性能的影响,从训练集的文本数、类别数以及特征项数这三项数量指标出发进行研究。使用多因素方差分析方法及多种语料库定量探讨该三项数量指标对分类性能的影响规律。结果发现特征项数对分类性能的影响在不同的文本数和类别数时是不同的,分类性能受训练集的这三项指标的交互影响,通过对训练集的这三项指标进行优化,提出了从分类算法、特征项选择法以外提高分类性能的途径。在真实数据上的实验结果表明,该方法可有效提高分类性能。 展开更多
关键词 训练集优化 文本分类 多因素方差分析 语料库 相关数量指标
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部