摘要
本文参照官方CPI的制度方法,设计了一种基于网络爬虫技术的价格指数计算模型。通过模型试算值与官方数据的比较,以及对原始数据的特征挖掘,发现该种模型具有时效性强和灵敏度高的特点。
In recent years,some domestic and foreign institutions have been conducting research on using big data in compiling online price indexes. This paper designs a model of compiling price index based on the 'web scraping' technology by referring to the official CPI methodology. By comparing results of this model with official CPI data, and analyzing characteristics of raw data, we find out that the model has the advantages of strong timeliness and high sensitivity.
出处
《统计研究》
CSSCI
北大核心
2014年第10期74-80,共7页
Statistical Research
关键词
价格指数
网络爬虫
聚类分析
幂律分布
Price Index
Web scraping
Cluster Analysis
Power-Law Distribution
作者简介
孙易冰,男,34岁,江苏常州人,2006年毕业于海军工程大学,获管理学硕士学位,现为国家统计局城市社会经济调查司流通消费价格处主任科员。研究方向为大数据技术、价格统计分析。
赵子东,男,37岁,吉林长春人,2010年毕业于首都师范大学,获教育学硕士学位,现为北京市统计局消费价格处副主任科员。研究方向为价格统计分析。
刘洪波,男,28岁,安徽颍上人,2010年毕业于北京师范大学,获经济学硕士学位,现为国家统计局城市社会经济调查司流通消费价格处主任科员。研究方向为价格统计分析。