-
题名基于Web结构挖掘的搜索引擎作弊检测方法
被引量:4
- 1
-
-
作者
冉丽
何毅舟
许龙飞
-
机构
暨南大学计算机科学系
暨南大学网络中心
-
出处
《计算机应用》
CSCD
北大核心
2004年第10期158-160,共3页
-
基金
广东省科技计划项目(2003C101037)
广东省自然科学基金重点项目(010421)
-
文摘
搜索引擎作弊行为从搜索引擎优化中演变而来,却对网络发展带来负面影响。通过构造站内站外精简模型用于判断几类作弊行为,得出PageRank改进算法中惩罚因子的公式和其中三个函数的特征,展望了搜索引擎作弊检测方法的发展前景。
-
关键词
WEB结构挖掘
搜索引擎作弊
精简模型
PAGERANK
-
Keywords
Web structure mining
search engine spam
reduced model
pagerank
-
分类号
TP393.07
[自动化与计算机技术—计算机应用技术]
-
-
题名一种抵抗链接作弊的PageRank改进算法
被引量:6
- 2
-
-
作者
贺志明
王丽宏
张刚
程学旗
-
机构
中国科学院计算技术研究所
国家计算机网络与信息安全管理中心
-
出处
《中文信息学报》
CSCD
北大核心
2012年第5期101-106,共6页
-
基金
国家自然科学基金资助项目(61170230
60903139
+3 种基金
60873243
60933005)
国家863计划重点资助项目(2010AA012502
2010AA012503)
-
文摘
大量的基于链接的搜索引擎作弊方法对传统PageRank算法造成了巨大的影响,例如,链接农场、交换链接、黄金链、财富链等使得网页的PageRank值失去了公正性和权威性。该文在分析多种作弊方法对传统PageRank算法所造成的不利影响的基础上,提出了一种可以抵抗链接作弊的三阶段PageRank算法-TSPageRank算法,该文对TSPageRank算法的原理进行了详细分析,并通过实验证明TSPageRank算法比传统的PageRank算法在效果上提高了59.4%,能够有效地提升重要网页的PageRank值,并降低作弊网页的PageRank值。
-
关键词
搜索引擎作弊
PAGERANK算法
链接农场
-
Keywords
search engine spaml PageRank algorithml link farm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-