-
题名响应倾向得分匹配插补法
被引量:4
- 1
-
-
作者
杨贵军
孙玲莉
李璐
-
机构
天津财经大学中国经济统计研究中心
-
出处
《统计与信息论坛》
CSSCI
北大核心
2018年第8期3-11,共9页
-
基金
国家自然科学基金项目<劣者淘汰两阶段自适应临床试验的设计和分析>(11471239)
全国统计科学研究重点项目<大数据背景下住户调查理论与应用研究>(2017LZ25)
天津财经大学研究生院科研资助计划项目<大数据背景下住户调查的非抽样误差研究>(2017TCB04)
-
文摘
倾向得分匹配插补法是处理无回答的常用方法,该方法对无回答与回答的样本量差异较为敏感。提出响应倾向得分匹配插补法,建立回答单元响应变量观测值秩变换的响应倾向得分模型,匹配无回答单元和回答单元的响应倾向得分,选择响应倾向得分相近的回答单元作为无回答单元的插补值。模拟研究表明,响应倾向得分匹配插补法的插补效果优于原倾向得分匹配插补法、最近邻插补法和回归插补法。在完全随机无回答机制和随机无回答机制下,随着插补重数增加,采用响应倾向得分匹配插补法的回归系数估计量的偏差绝对值和均方误差呈递增趋势。在实际应用中,插补重数选择不宜过高,建议插补重数为5。针对Sparrows数据集的分析结果显示,采用响应倾向得分匹配插补法处理无回答,能够较好估计回归模型系数。响应倾向得分匹配插补法有效改进原倾向得分匹配插补法,提高了统计分析结果的可靠性。
-
关键词
响应倾向得分匹配插补法
插补重数
无回答率
无回答机制
-
Keywords
response propensity score matching imputation
imputation multiplicity
non responserate
non response mechanism
-
分类号
F224
[经济管理—国民经济]
O212.1
[理学—概率论与数理统计]
-
-
题名基于少数类过采样的倾向得分匹配插补法
被引量:4
- 2
-
-
作者
杨贵军
杜飞
孙玲莉
-
机构
天津财经大学统计学院
天津财经大学中国经济统计研究中心
-
出处
《统计与信息论坛》
CSSCI
北大核心
2021年第1期3-12,共10页
-
基金
国家社会科学基金重点项目“基于大数据的人口统计调查方法与应用研究”(20ATJ008)
国家社会科学基金青年项目“轮换样本校准估计方法在中国住户调查中的应用研究”(20CTJ009)
+1 种基金
天津市2019年度哲学社会科学规划重点课题“大数据背景下多目标抽样设计的理论和应用”(TJTJ19-001)
国家自然科学基金面上项目“劣者淘汰两阶段自适应临床试验的设计和分析”(11471239)。
-
文摘
无回答在大数据应用中频繁发生。通常,实际数据的无回答率较低,在这样的情况下,采用倾向得分模型对无回答单元与回答单元进行匹配,易导致倾向得分匹配插补法的插补效果显著下降。为此,将合成少数类过采样算法的思想融入到倾向得分匹配插补法中,提出基于少数类过采样的倾向得分匹配插补法。利用统计模拟与实证研究,在不同无回答率、插补重数和误差分布情形下,演示新插补法的统计性质和应用效果。统计模拟显示,新插补法具有明显高于倾向得分匹配插补法的精度,统计性质受无回答率、插补重数和误差分布的影响小。实证结果显示,新插补法在实际数据中具有较好的应用性。基于少数类过采样的倾向得分匹配插补法提供了处理无回答问题的新思路,并具有较好的扩展性。
-
关键词
倾向得分匹配插补法
合成少数类过采样算法
无回答率
无回答机制
-
Keywords
propensity score matching imputation
synthetic minority over-sampling technique algorithm
non-response rate
non-response mechanism
-
分类号
F224.0
[经济管理—国民经济]
O212.2
[理学—概率论与数理统计]
-