期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于Parzen窗条件互信息计算的特征选择方法 被引量:4
1
作者 贺邓超 张宏军 +1 位作者 郝文宁 张睿 《计算机应用研究》 CSCD 北大核心 2015年第5期1387-1389,1398,共4页
为解决连续值特征条件互信息计算困难和对多值特征偏倚的问题,提出了一种基于Parzen窗条件互信息计算的特征选择方法。该方法通过Parzen窗估计出连续值特征的概率密度函数,进而方便准确地计算出条件互信息;同时在评价准则中引入特征离... 为解决连续值特征条件互信息计算困难和对多值特征偏倚的问题,提出了一种基于Parzen窗条件互信息计算的特征选择方法。该方法通过Parzen窗估计出连续值特征的概率密度函数,进而方便准确地计算出条件互信息;同时在评价准则中引入特征离散度作为惩罚因子,克服了条件互信息计算对于多值特征的偏倚,实现了对连续型数据的特征选择。实验证明,该方法能够达到与现有方法相当甚至更好的效果,是一种有效的特征选择方法。 展开更多
关键词 特征选择 PARZEN窗 条件互信息 特征离散度
在线阅读 下载PDF
分布权值调节概率标准差的文本分类方法 被引量:2
2
作者 焦庆争 蔚承建 《计算机应用》 CSCD 北大核心 2009年第12期3303-3306,共4页
针对文本分类问题,基于特征分布评估权值调节特征概率标准差设计了一种无须特征选择的高效的线性文本分类器。该算法的基本思路是使用特征概率标准差量化特征在文档类中的离散度,并作为特征的基础权重,同时以后验概率的Beta分布函数为基... 针对文本分类问题,基于特征分布评估权值调节特征概率标准差设计了一种无须特征选择的高效的线性文本分类器。该算法的基本思路是使用特征概率标准差量化特征在文档类中的离散度,并作为特征的基础权重,同时以后验概率的Beta分布函数为基础,运用概率确定性密度函数,评估特征在类别中的分布信息得到特征分布权值,将其调节基础权重得到特征权重,实现了线性文本分类器。在20Newsgroup、复旦中文分类语料、Reuters-21578三个语料集进行了比较实验,实验结果表明,新算法分类性能相对传统算法优势显著,且稳定、高效、实用,适于大规模文本分类任务。 展开更多
关键词 文本分类 特征概率标准差 特征离散度 特征分布 Beta概率密函数 自然语言处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部