-
题名基于Web链接分析的HITS算法研究与改进
被引量:6
- 1
-
-
作者
喻金平
朱桂祥
梅宏标
-
机构
江西理工大学工程研究院
江西理工大学信息工程学院
江西理工大学应用科学学院
-
出处
《计算机工程与应用》
CSCD
2013年第21期42-45,共4页
-
基金
江西省教育厅自然科学基金项目(No.GJJ12346)
-
文摘
垂直搜索引擎的主题搜索策略有基于内容评价的搜索策略和基于Web链接分析的搜索策略,其中HITS算法是一种经典的基于Web链接分析的搜索策略,其主要的缺点是容易发生主题漂移。为了最大程度地避免主题漂移,提出了一种结合网页文本分析和扩散速率改进的F-HITS算法。实验结果表明,这些改进不仅节省了系统的开销,并且提高了页面搜索的准确率。
-
关键词
垂直搜索
搜索策略
扩散速率
文本分析
超链接分析主题搜索(hits)
-
Keywords
vertical search
search strategy
diffusion rate
text analysis
Hyperlink-lnduced Topic Search(hits)
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名面向垂直搜索引擎的主题提取算法
被引量:9
- 2
-
-
作者
吕林涛
陈丽萍
周红芳
-
机构
西安理工大学计算机科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第15期44-46,共3页
-
基金
陕西省自然科学基础研究计划基金资助项目(2007F52)
-
文摘
针对HITS算法对所有链接分配相等权重导致产生主题漂移的问题,提出基于计算链接价值度及Web页面语义主题相似度对链接分配合理权重的HITS改进算法,突出链接重要度的差异。实验表明,该算法的主题相关度提高了13%~42%,且较好地避免了主题漂移问题,增强了采集信息的准确性,对垂直搜索引擎的研究有重要的理论和实际应用价值。
-
关键词
hits算法
垂直搜索引擎
超链接
主题漂移
-
Keywords
hits algorithm
vertical search engine
hyperlink
topic drift
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名PH-MaxFlow算法发现Web社区
被引量:1
- 3
-
-
作者
郭希娟
刘静
-
机构
燕山大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第5期113-116,共4页
-
文摘
HITS是一种经典的利用链接技术计算网页权威值和中心值的算法,它能够快速发现主题相关网页,其缺点是会发生"主题偏移"现象,首先提出PHITS算法,在一定程度上抑制了这种现象的发生。运用该方法提取权威值高的页面,作为PH-MaxFlow算法的种子节点,使得发现的Web社区更精确。同时提出了一种有效的评价Web社区的标准,用这个标准对原始最大流算法和提出的PH-MaxFlow算法进行比较,从而得出PH-MaxFlow算法发现的Web社区与主题更相关。
-
关键词
WEB社区
基于超链接分析的主题搜索算法
最大流算法
-
Keywords
Web communities
Hyperlink-Induced Topic Search(hits) algorithm
maximum flow algorithm
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-