-
题名缺失数据插补处理方法的比较研究
被引量:43
- 1
-
-
作者
庞新生
-
机构
北京林业大学经管院
-
出处
《统计与决策》
CSSCI
北大核心
2012年第24期18-22,共5页
-
基金
教育部人文社会科学研究青年基金项目(09YJC910002)
中央高校基本科研业务费专项资金资助(RW2010-4)
-
文摘
文章将抽样调查中由于项目无回答所形成的缺失数据作为研究着眼点,从矩阵运算的角度分析了此类缺失数据带来的危害,在此基础上,对缺失数据插补处理方法的基本问题进行了讨论,分析了各种单一插补方法特点及局限性,并介绍了简单随机抽样、分层随机抽样条件下缺失数据多重插补的抽样推断方法,在此基础上,对常用的单一插补和多重插补方法进行了比较,并对简单随机抽样、分层随机抽样条件下缺失数据单一插补与多重插补方法的效率进行了实证研究与比较。
-
关键词
缺失数据
单一插补
多重插补
分层随机抽样
简单随机抽样
-
分类号
O212
[理学—概率论与数理统计]
-
-
题名缺失数据的处理方法及其发展趋势
被引量:96
- 2
-
-
作者
邓建新
单路宝
贺德强
唐锐
-
机构
广西大学广西制造系统与先进制造技术重点实验室
广西大学机械工程学院
-
出处
《统计与决策》
CSSCI
北大核心
2019年第23期28-34,共7页
-
基金
国家自然科学基金资助项目(71562002
51965006)
+4 种基金
广西自然科学基金资助项目(2018GXNSFAA050111)
广西制造系统与先进制造技术重点实验室项目(16-380-12S011
17-259-05S006)
广西高等教育本科教学改革工程项目(2017JGA126)
广西研究生教育创新计划项目(YCSW2019035)
-
文摘
文章介绍了数据缺失的现象、概念、出现的领域以及产生的原因,总结了数据缺失机制和数据缺失模式;综述了目前缺失数据常用的处理方法:加权法、删除法、统计学插补法以及机器学习插补法,并综合比较了各种方法的适用范围和优缺点;最后提出了针对高维数据的缺失处理、复合缺失数据特征的处理、新领域的缺失数据处理将是未来缺失数据处理方法的研究方向。
-
关键词
缺失数据
处理方法
单一插补
多重插补
方法比较
-
Keywords
missing data
processing methods
single interpolation
multiple interpolation
method comparison
-
分类号
O212
[理学—概率论与数理统计]
-
-
题名缺失数据处理中相关问题的探讨
被引量:20
- 3
-
-
作者
庞新生
-
机构
北京林业大学经济管理学院
-
出处
《统计与信息论坛》
2004年第5期29-32,共4页
-
文摘
文章就缺失数据处理中涉及到的相关问题做了初步探讨,并在比较单一插补法与多重插补法的基础上,举例说明多重插补法处理缺失数据的基本程序。
-
关键词
缺失数据
单一插补
多重插补
-
分类号
C811
[社会学—统计学]
-