期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于Bagging-SVM集成分类器的网页作弊检测
1
作者 唐寿洪 朱焱 杨凡 《计算机科学》 CSCD 北大核心 2015年第1期239-243,共5页
网页作弊不仅造成信息检索质量下降,而且给互联网的安全也带来了极大的挑战。提出了一种基于Bagging-SVM集成分类器的网页作弊检测方法。在预处理阶段,首先采用K-means方法解决数据集的不平衡问题,然后采用CFS特征选择方法筛选出最优特... 网页作弊不仅造成信息检索质量下降,而且给互联网的安全也带来了极大的挑战。提出了一种基于Bagging-SVM集成分类器的网页作弊检测方法。在预处理阶段,首先采用K-means方法解决数据集的不平衡问题,然后采用CFS特征选择方法筛选出最优特征子集,最后对特征子集进行信息熵离散化处理。在分类器训练阶段,通过Bagging方法构建多个训练集并分别对每个训练集进行SVM学习来产生弱分类器。在检测阶段,通过多个弱分类器投票决定测试样本所属类别。在数据集WEBSPAM-UK2006上的实验结果表明,在使用特征数量较少的情况下,本检测方法可以获得非常好的检测效果。 展开更多
关键词 网页作弊 集成分类器 特征选择 信息熵 弱分类器
在线阅读 下载PDF
基于检索相关度拓展的网页排名技术:IR-REL
2
作者 许颖 廖乐健 《情报杂志》 CSSCI 北大核心 2006年第4期92-94,共3页
SEO SPAM和飞速发展的网页规模要求更优的网页排名技术,在研究链接分析技术PageRank及互信息模型后,提出了检索相关度算法(IR-REL),构建相关词链表计算网页的布尔权重。该排名同时将权威度和相关度作为影响因子,可提高检索相关度,降低... SEO SPAM和飞速发展的网页规模要求更优的网页排名技术,在研究链接分析技术PageRank及互信息模型后,提出了检索相关度算法(IR-REL),构建相关词链表计算网页的布尔权重。该排名同时将权威度和相关度作为影响因子,可提高检索相关度,降低关键词作弊影响。文章给出了具体的排名策略、实验数据和系统模型。 展开更多
关键词 网页排名优化作弊 IR-REL算法 网页排名 PAGERANK
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部