-
题名文本分类中结合评估函数的TEF-WA权值调整技术
被引量:26
- 1
-
-
作者
唐焕玲
孙建涛
陆玉昌
-
机构
烟台职业学院计算机与信息工程系
清华大学计算机科学与技术系 北京
清华大学计算机科学与技术系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2005年第1期47-53,共7页
-
基金
国家自然科学基金重大项目(79990584)国家"九七三"重点基础研究发展规划基金项目(G1998030414)
-
文摘
文本自动分类面临的难题之一是如何从高维的特征空间中选取对文本分类有效的特征,以适应文本分类算法并提高分类精度.针对这一问题,在分析比较特征选择和权值调整对文本分类精度和效率的影响后,提出了一种结合评估函数的TEF-WA权重调整技术,设计了一种新的权重函数,将特征评估函数蕴含到权值函数,按照特征对文本分类的辨别能力调整其在分类器中的贡献.实验结果证明了TEF-WA权值调整技术在提高分类精度和降低算法的时间复杂度方面都是有效的.
-
关键词
向量空间模型(VSM)
特征选择
权重调整
特征评估函数
文本分类
-
Keywords
vector space model
feature selection
weight adjustment techniques
feature evaluation function
text categorization
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基尼指数在文本特征选择中的应用研究
被引量:5
- 2
-
-
作者
林永民
朱卫东
-
机构
河北理工大学经济管理学院
北京交通大学计算机与信息技术学院
-
出处
《计算机应用》
CSCD
北大核心
2007年第10期2584-2586,2590,共4页
-
文摘
使用基尼指数原理进行了文本特征选择的研究,构造了基于基尼指数的适合于文本特征选择的评估函数。结合fkNN和SVM两种不同的分类方法,在两个不同的语料集上,与其他著名的文本特征选择方法进行比较和分析实验,结果显示它的性能与现有的特征选择方法不相上下,但在算法时间复杂上获得了良好的性能。
-
关键词
文本分类
特征选择
基尼指数
特征评估函数
-
Keywords
text categorization
feature selection
Gini-Index
feature selection function
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
-