期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于链接相似度和作弊系数的Spam网页识别算法
1
作者 陆钊 李石君 《计算机工程与科学》 CSCD 北大核心 2015年第10期1983-1988,共6页
Spam网页主要通过链接作弊手段达到提高搜索排名而获利的目的,根据链接作弊的特征,引入链接相似度和作弊系数两个指标来判定网页作弊的可能性。借鉴BadRank算法思想,从Spam网页种子集合通过迭代计算链接相似度和作弊系数,并根据与种子... Spam网页主要通过链接作弊手段达到提高搜索排名而获利的目的,根据链接作弊的特征,引入链接相似度和作弊系数两个指标来判定网页作弊的可能性。借鉴BadRank算法思想,从Spam网页种子集合通过迭代计算链接相似度和作弊系数,并根据与种子集合的链接指向关系设置权重,将待判定的网页进行度量。最后选取Anti-Trust Rank等算法作对比实验,结果验证了本文算法在准确率和适应性方面优于对比算法。 展开更多
关键词 Spam网页 作弊 链接相似度 作弊系数 权重系数
在线阅读 下载PDF
基于链接和内容的BLCT主题爬行算法研究 被引量:1
2
作者 王宏艳 《计算机应用研究》 CSCD 北大核心 2011年第2期495-497,528,共4页
为了高效地获取与主题相关的资源,就垂直搜索引擎展开了研究。首先,在现有的PageRank算法基础上,提出一种改进的PageRank算法来测量网页的链接相似度;其次,从单个网页考虑,利用每个网页的url、title和正文,给出基于内容的相似度的计算方... 为了高效地获取与主题相关的资源,就垂直搜索引擎展开了研究。首先,在现有的PageRank算法基础上,提出一种改进的PageRank算法来测量网页的链接相似度;其次,从单个网页考虑,利用每个网页的url、title和正文,给出基于内容的相似度的计算方法;最后结合内容相似度和链接相似度,提出了一种基于链接和内容的BLCT主题爬行算法。实验结果表明,该算法在平均收获率和目标召回率上有显著提高,爬行的网页主题相关性也提高了。 展开更多
关键词 垂直搜索引擎 PAGERANK算法 主题爬行 链接相似度 内容相似
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部