题名 调查问卷选项无回答率的SAS程序实现
被引量:1
1
作者
孙玉环
机构
北京大学中国社会科学调查中心
东北财经大学统计学院
出处
《统计与决策》
CSSCI
北大核心
2012年第5期70-73,共4页
基金
国家自然科学基金面上资助项目(71171004)
中国博士后科学基金面上资助项目(20110490216)
文摘
综合性社会调查项目中,选项无回答率的高低,是评价问卷调查数据质量、问卷题目难易程度以及访问员调查工作质量的重要标准。文章基于选项无回答率的一般计算公式,给出了计算问卷中选项的平均无回答率和选项在全部问卷上的平均无回答率两个SAS实现程序,并归纳了程序的编写思路和技巧。
关键词
综合性社会调查项目
选项无回答率
SAS程序
分类号
C81
[社会学—统计学]
题名 响应倾向得分匹配插补法
被引量:4
2
作者
杨贵军
孙玲莉
李璐
机构
天津财经大学中国经济统计研究中心
出处
《统计与信息论坛》
CSSCI
北大核心
2018年第8期3-11,共9页
基金
国家自然科学基金项目<劣者淘汰两阶段自适应临床试验的设计和分析>(11471239)
全国统计科学研究重点项目<大数据背景下住户调查理论与应用研究>(2017LZ25)
天津财经大学研究生院科研资助计划项目<大数据背景下住户调查的非抽样误差研究>(2017TCB04)
文摘
倾向得分匹配插补法是处理无回答的常用方法,该方法对无回答与回答的样本量差异较为敏感。提出响应倾向得分匹配插补法,建立回答单元响应变量观测值秩变换的响应倾向得分模型,匹配无回答单元和回答单元的响应倾向得分,选择响应倾向得分相近的回答单元作为无回答单元的插补值。模拟研究表明,响应倾向得分匹配插补法的插补效果优于原倾向得分匹配插补法、最近邻插补法和回归插补法。在完全随机无回答机制和随机无回答机制下,随着插补重数增加,采用响应倾向得分匹配插补法的回归系数估计量的偏差绝对值和均方误差呈递增趋势。在实际应用中,插补重数选择不宜过高,建议插补重数为5。针对Sparrows数据集的分析结果显示,采用响应倾向得分匹配插补法处理无回答,能够较好估计回归模型系数。响应倾向得分匹配插补法有效改进原倾向得分匹配插补法,提高了统计分析结果的可靠性。
关键词
响应倾向得分匹配插补法
插补重数
无回答率
无回答 机制
Keywords
response propensity score matching imputation
imputation multiplicity
non responserate
non response mechanism
分类号
F224
[经济管理—国民经济]
O212.1
[理学—概率论与数理统计]
题名 小域估计在问卷分割中的应用研究
被引量:4
3
作者
王小宁
机构
中国传媒大学数据科学与智能媒体学院
出处
《统计与信息论坛》
CSSCI
北大核心
2021年第9期3-10,共8页
基金
全国统计科学研究重点项目“大型抽样调查样本整合及其有效性研究”(2020LZ27)
中国传媒大学中央高校基本科研业务费专项资金“基于主动学习的文本情感分类方法研究”(CUC200F08)。
文摘
问卷分割设计在设计上能够通过减少问卷长度来减少调查时间,从而提高问卷回答率和提升调查效率,近年来成为国内外政府部门和调研机构用来提升调查数据质量的一种方法。在涉及对样本数据的估计中,通过问卷分割得到的样本在某些域上往往存在样本量很少的情况,采用小域估计方法对问卷分割设计得到的样本进行参数估计,通过理论推导和模拟研究表明,使用小域估计方法对分割问卷得到的数据进行参数估计,从偏差、相对偏差、估计的均方误差和相对有效性等衡量指标上优于多重插补法得到的估计结果,能显著提高统计调查的精度。但是,当研究的目标变量间存在较强的相关关系时,就需要进一步优化该方法从而得到更精确的估计。
关键词
问卷分割
小域估计
估计效率
无回答率
Keywords
split questionnaire design
small area estimation
estimated efficiency
non response rate
分类号
C811
[社会学—统计学]
题名 基于DA插补法的线性回归模型系数估计值的模拟研究
被引量:5
4
作者
杨贵军
骆新珍
机构
天津财经大学中国经济统计研究中心
出处
《统计与信息论坛》
CSSCI
2014年第3期3-8,共6页
基金
国家社会科学基金重大项目<国家统计数据质量管理研究>(09&ZD040)
教育部留学回国人员科研启动基金项目<两阶段设计的若干问题研究>
文摘
Data Augmentation(DA)插补法是最常用的MCMC多重插补法之一。利用模拟方法研究基于DA插补法的线性回归模型的系数估计值,分析估计值的统计性质受无回答机制、无回答率和插补重数的影响。模拟结果显示:在完全随机无回答机制下,选择较小插补重数常常会得到较好的回归系数估计值;在随机无回答机制下,随着无回答率增大而选择更大插补重数往往会得到更好的回归系数估计值;在非随机无回答机制下,选择更大插补重数并不一定总会得到更好的回归系数估计值。
关键词
DA多重插补法
无回答 机制
无回答率
插补重数
Keywords
data augmentation multiple imputation
non-response mechanism
non-response rate
number of imputation
分类号
F224.0
[经济管理—国民经济]
O212.2
[理学—概率论与数理统计]
题名 基于少数类过采样的倾向得分匹配插补法
被引量:4
5
作者
杨贵军
杜飞
孙玲莉
机构
天津财经大学统计学院
天津财经大学中国经济统计研究中心
出处
《统计与信息论坛》
CSSCI
北大核心
2021年第1期3-12,共10页
基金
国家社会科学基金重点项目“基于大数据的人口统计调查方法与应用研究”(20ATJ008)
国家社会科学基金青年项目“轮换样本校准估计方法在中国住户调查中的应用研究”(20CTJ009)
+1 种基金
天津市2019年度哲学社会科学规划重点课题“大数据背景下多目标抽样设计的理论和应用”(TJTJ19-001)
国家自然科学基金面上项目“劣者淘汰两阶段自适应临床试验的设计和分析”(11471239)。
文摘
无回答在大数据应用中频繁发生。通常,实际数据的无回答率较低,在这样的情况下,采用倾向得分模型对无回答单元与回答单元进行匹配,易导致倾向得分匹配插补法的插补效果显著下降。为此,将合成少数类过采样算法的思想融入到倾向得分匹配插补法中,提出基于少数类过采样的倾向得分匹配插补法。利用统计模拟与实证研究,在不同无回答率、插补重数和误差分布情形下,演示新插补法的统计性质和应用效果。统计模拟显示,新插补法具有明显高于倾向得分匹配插补法的精度,统计性质受无回答率、插补重数和误差分布的影响小。实证结果显示,新插补法在实际数据中具有较好的应用性。基于少数类过采样的倾向得分匹配插补法提供了处理无回答问题的新思路,并具有较好的扩展性。
关键词
倾向得分匹配插补法
合成少数类过采样算法
无回答率
无回答 机制
Keywords
propensity score matching imputation
synthetic minority over-sampling technique algorithm
non-response rate
non-response mechanism
分类号
F224.0
[经济管理—国民经济]
O212.2
[理学—概率论与数理统计]