期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
网页自动分类中特征权重计算方法的改进 被引量:2
1
作者 谭金波 杨晓江 李艺 《情报学报》 CSSCI 北大核心 2008年第1期56-61,共6页
目前,在网页分类中,对HTML主要结构特征进行加权的常用方法是绝对数值加权方法。这种方法的缺点是加权系数为定值,其对长文本和短文本所起的作用不同,使得结构特征对正文的影响随着正文长度的增加而削弱。针对该缺点,本文提出了一... 目前,在网页分类中,对HTML主要结构特征进行加权的常用方法是绝对数值加权方法。这种方法的缺点是加权系数为定值,其对长文本和短文本所起的作用不同,使得结构特征对正文的影响随着正文长度的增加而削弱。针对该缺点,本文提出了一种改进型加权方法,即相对数值加权方法。通过网页层次分类的实验,比较了这两种方法对单个标签域以及多个标签域结合的分类性能。实验结果表明,相对数值加权方法能有效提高分类的精确度,并且效果优于绝对数值加权方法。 展开更多
关键词 网页分类 层次分类 特征项 权重算法 相对数值加权
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部