期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Nutch爬虫的电商交易价格统计研究 被引量:3
1
作者 阳黎明 苏理云 《重庆理工大学学报(自然科学)》 CAS 2017年第1期152-157,共6页
将电商交易数据纳入价格指数架构是目前统计工作关注的焦点。应用大数据技术,将Nutch爬虫搭建在分布式集群上,构建分布式网络数据抓取系统,同时结合最新的AP聚类算法对数据进行预处理,然后对网上数据进行价格指数建模,进行价格指数试算... 将电商交易数据纳入价格指数架构是目前统计工作关注的焦点。应用大数据技术,将Nutch爬虫搭建在分布式集群上,构建分布式网络数据抓取系统,同时结合最新的AP聚类算法对数据进行预处理,然后对网上数据进行价格指数建模,进行价格指数试算。试算结果表明:基于分布式集群下的Nutch网络爬虫技术较好地完成了网络交易数据抓取任务。因此,计算的网上交易数据价格指数可较好地反映市场价格变化趋势。 展开更多
关键词 电商交易数据 分布式集群 NUTCH 价格指数
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部