期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Context Graphs的主题爬虫的研究与实现
被引量:
3
1
作者
陈星
《计算机工程与设计》
CSCD
北大核心
2011年第3期914-917,共4页
为了解决传统主题爬虫对主题网页搜索效率偏低的问题,分析了基于网络拓扑结构建模的Context Graphs的爬行策略。考虑了以往ContextGraphs方法存在的不足,即没有区分网页不同部分文本的重要程度,通过将锚文字、页面标题和页面内容做综合...
为了解决传统主题爬虫对主题网页搜索效率偏低的问题,分析了基于网络拓扑结构建模的Context Graphs的爬行策略。考虑了以往ContextGraphs方法存在的不足,即没有区分网页不同部分文本的重要程度,通过将锚文字、页面标题和页面内容做综合考虑,对原算法进行了改进。将改进前后的算法进行实验对比,实验结果表明,在提高主题爬行质量方面,改进后的算法达到了更好的效果。
展开更多
关键词
主题爬虫
CONTEXT
graphs模型
层次建模
链接分析
内容分析
在线阅读
下载PDF
职称材料
基于词频差异特征选取的Context Graph算法改进
被引量:
1
2
作者
张永
吴崇正
《计算机工程与应用》
CSCD
2014年第10期141-146,共6页
为了解决传统主题爬虫效率偏低的问题,在分析了启发式网络爬虫搜索算法Context Graph的基础上,提出了一种改进的Context Graph爬虫搜索策略。该策略利用基于词频差异的特征选取方法和改进后的TF-IDF公式对原算法进行了改进,综合考虑了...
为了解决传统主题爬虫效率偏低的问题,在分析了启发式网络爬虫搜索算法Context Graph的基础上,提出了一种改进的Context Graph爬虫搜索策略。该策略利用基于词频差异的特征选取方法和改进后的TF-IDF公式对原算法进行了改进,综合考虑了网页不同部分的文本信息对特征选取的影响,及特征词的类间权重和类中权重,以提高特征选取和评价的质量。实验结果表明,与既定传统方法进行实验对照,改进后的策略效率更高。
展开更多
关键词
主题爬虫
CONTEXT
graph
模型
搜索策略
特征选取
在线阅读
下载PDF
职称材料
题名
基于Context Graphs的主题爬虫的研究与实现
被引量:
3
1
作者
陈星
机构
中国科学院软件研究所
中国科学院研究生院
出处
《计算机工程与设计》
CSCD
北大核心
2011年第3期914-917,共4页
文摘
为了解决传统主题爬虫对主题网页搜索效率偏低的问题,分析了基于网络拓扑结构建模的Context Graphs的爬行策略。考虑了以往ContextGraphs方法存在的不足,即没有区分网页不同部分文本的重要程度,通过将锚文字、页面标题和页面内容做综合考虑,对原算法进行了改进。将改进前后的算法进行实验对比,实验结果表明,在提高主题爬行质量方面,改进后的算法达到了更好的效果。
关键词
主题爬虫
CONTEXT
graphs模型
层次建模
链接分析
内容分析
Keywords
focused crawler
Context
graphs
hierarchical modeling
hyperlink analysis
content analysis
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于词频差异特征选取的Context Graph算法改进
被引量:
1
2
作者
张永
吴崇正
机构
兰州理工大学计算机与通信学院
出处
《计算机工程与应用》
CSCD
2014年第10期141-146,共6页
文摘
为了解决传统主题爬虫效率偏低的问题,在分析了启发式网络爬虫搜索算法Context Graph的基础上,提出了一种改进的Context Graph爬虫搜索策略。该策略利用基于词频差异的特征选取方法和改进后的TF-IDF公式对原算法进行了改进,综合考虑了网页不同部分的文本信息对特征选取的影响,及特征词的类间权重和类中权重,以提高特征选取和评价的质量。实验结果表明,与既定传统方法进行实验对照,改进后的策略效率更高。
关键词
主题爬虫
CONTEXT
graph
模型
搜索策略
特征选取
Keywords
TF-IDF
focused crawler
Context
graph
search strategy
feature selection
TF-IDF
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Context Graphs的主题爬虫的研究与实现
陈星
《计算机工程与设计》
CSCD
北大核心
2011
3
在线阅读
下载PDF
职称材料
2
基于词频差异特征选取的Context Graph算法改进
张永
吴崇正
《计算机工程与应用》
CSCD
2014
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部