题名 常用多重插补法的插补重数选择
被引量:13
1
作者
孙玲莉
董世杰
杨贵军
机构
天津财经大学统计学院
内蒙古财经大学统计与数学学院
出处
《统计与决策》
CSSCI
北大核心
2019年第23期5-10,共6页
基金
国家自然科学基金资助项目(11471239)
全国统计科学研究计划重点项目(2017LZ25)
天津财经大学研究生科研资助计划项目(2017TCB04)
文摘
社会经济调查领域普遍存在无回答现象。目前处理无回答的常用方法是多重插补法。文章重点研究常用的六种多重插补法:PMM多重插补法、DA多重插补法、EMB多重插补法、普通线性回归多重插补法、贝叶斯线性回归多重插补法和自助线性回归多重插补法。首先,比较六种多重插补法理论性质。其次,重点模拟研究三种线性回归多重插补法对回归模型系数估计的影响。最后,对比分析六种多重插补法的应用条件,给出使用不同多重插补法的插补重数建议。
关键词
无回答
多重插 补 法
无回答机制
插补重数
Keywords
non-response
multiple imputation
non-response mechanisms
imputation multiplicity
分类号
O211
[理学—概率论与数理统计]
F224.0
[经济管理—国民经济]
题名 响应倾向得分匹配插补法
被引量:4
2
作者
杨贵军
孙玲莉
李璐
机构
天津财经大学中国经济统计研究中心
出处
《统计与信息论坛》
CSSCI
北大核心
2018年第8期3-11,共9页
基金
国家自然科学基金项目<劣者淘汰两阶段自适应临床试验的设计和分析>(11471239)
全国统计科学研究重点项目<大数据背景下住户调查理论与应用研究>(2017LZ25)
天津财经大学研究生院科研资助计划项目<大数据背景下住户调查的非抽样误差研究>(2017TCB04)
文摘
倾向得分匹配插补法是处理无回答的常用方法,该方法对无回答与回答的样本量差异较为敏感。提出响应倾向得分匹配插补法,建立回答单元响应变量观测值秩变换的响应倾向得分模型,匹配无回答单元和回答单元的响应倾向得分,选择响应倾向得分相近的回答单元作为无回答单元的插补值。模拟研究表明,响应倾向得分匹配插补法的插补效果优于原倾向得分匹配插补法、最近邻插补法和回归插补法。在完全随机无回答机制和随机无回答机制下,随着插补重数增加,采用响应倾向得分匹配插补法的回归系数估计量的偏差绝对值和均方误差呈递增趋势。在实际应用中,插补重数选择不宜过高,建议插补重数为5。针对Sparrows数据集的分析结果显示,采用响应倾向得分匹配插补法处理无回答,能够较好估计回归模型系数。响应倾向得分匹配插补法有效改进原倾向得分匹配插补法,提高了统计分析结果的可靠性。
关键词
响应倾向得分匹配插 补 法
插补重数
无回答率
无回答机制
Keywords
response propensity score matching imputation
imputation multiplicity
non responserate
non response mechanism
分类号
F224
[经济管理—国民经济]
O212.1
[理学—概率论与数理统计]
题名 基于DA插补法的线性回归模型系数估计值的模拟研究
被引量:5
3
作者
杨贵军
骆新珍
机构
天津财经大学中国经济统计研究中心
出处
《统计与信息论坛》
CSSCI
2014年第3期3-8,共6页
基金
国家社会科学基金重大项目<国家统计数据质量管理研究>(09&ZD040)
教育部留学回国人员科研启动基金项目<两阶段设计的若干问题研究>
文摘
Data Augmentation(DA)插补法是最常用的MCMC多重插补法之一。利用模拟方法研究基于DA插补法的线性回归模型的系数估计值,分析估计值的统计性质受无回答机制、无回答率和插补重数的影响。模拟结果显示:在完全随机无回答机制下,选择较小插补重数常常会得到较好的回归系数估计值;在随机无回答机制下,随着无回答率增大而选择更大插补重数往往会得到更好的回归系数估计值;在非随机无回答机制下,选择更大插补重数并不一定总会得到更好的回归系数估计值。
关键词
DA多重插 补 法
无回答机制
无回答率
插补重数
Keywords
data augmentation multiple imputation
non-response mechanism
non-response rate
number of imputation
分类号
F224.0
[经济管理—国民经济]
O212.2
[理学—概率论与数理统计]