期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于余弦向量法的Web数据并行抓掘系统
被引量:
2
1
作者
徐文杰
陈庆奎
《计算机工程》
CAS
CSCD
北大核心
2009年第7期64-67,共4页
为了提高Web海量数据的抓掘效率,引入并行机群抓掘机制。为使机群中每个计算节点的能力得到充分发挥,应用向量度量技术解决抓取任务和计算节点能力匹配的问题。对抓取任务向量、计算节点向量进行定义,提出余弦向量匹配算法,描述相关并...
为了提高Web海量数据的抓掘效率,引入并行机群抓掘机制。为使机群中每个计算节点的能力得到充分发挥,应用向量度量技术解决抓取任务和计算节点能力匹配的问题。对抓取任务向量、计算节点向量进行定义,提出余弦向量匹配算法,描述相关并行算法。理论分析和实验表明,基于余弦向量匹配算法的挖掘任务分配模型具有良好的分配适应性和负载平衡性。
展开更多
关键词
并行抓取
余弦向量法
计算机机群
在线阅读
下载PDF
职称材料
题名
基于余弦向量法的Web数据并行抓掘系统
被引量:
2
1
作者
徐文杰
陈庆奎
机构
上海理工大学计算机与电气工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第7期64-67,共4页
基金
国家自然科学基金资助项目(60573108)
上海教委发展基金资助项目(06QZ002
+2 种基金
07ZZ92)
上海教委科研创新基金资助重点项目(08ZZ76)
上海市重点学科建设基金资助项目(S30501)
文摘
为了提高Web海量数据的抓掘效率,引入并行机群抓掘机制。为使机群中每个计算节点的能力得到充分发挥,应用向量度量技术解决抓取任务和计算节点能力匹配的问题。对抓取任务向量、计算节点向量进行定义,提出余弦向量匹配算法,描述相关并行算法。理论分析和实验表明,基于余弦向量匹配算法的挖掘任务分配模型具有良好的分配适应性和负载平衡性。
关键词
并行抓取
余弦向量法
计算机机群
Keywords
parallel crawling
cosine vector
computer cluster
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于余弦向量法的Web数据并行抓掘系统
徐文杰
陈庆奎
《计算机工程》
CAS
CSCD
北大核心
2009
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部