期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
分布式搜索中节点索引量大小估计算法 被引量:1
1
作者 吴晟 李星 《计算机应用》 CSCD 北大核心 2008年第9期2345-2348,共4页
分布式搜索是解决对深层网络搜索的有效方案,各节点的索引量大小是分布式搜索引擎描述选择节点的重要参数。为了解决在非合作环境中估算节点索引量大小的问题,提出并实现了基于高频词汇再采样的高频再采样算法和基于文档捕获概率不同假... 分布式搜索是解决对深层网络搜索的有效方案,各节点的索引量大小是分布式搜索引擎描述选择节点的重要参数。为了解决在非合作环境中估算节点索引量大小的问题,提出并实现了基于高频词汇再采样的高频再采样算法和基于文档捕获概率不同假设的异概捕获算法。高频再采样算法在随机采样后基于样本集中的高频词汇进行再采样;而异概捕获算法则利用Logistic函数和条件似然方法估算节点的索引量大小。通过真实网络数据的实验结果表明,这些算法优于已有的采样-再采样与捕获-再捕获算法。 展开更多
关键词 分布式捷索 索引量估计 采样-再采样 捕获-捕获
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部