高维非概率样本数据的神经网络推断方法研究被引量：1

Neural network inference method of non-probability sampleswith high-dimensional data

在线阅读下载PDF

导出

摘要大数据与网络调查的发展促进了非概率抽样的发展,大多数网络调查样本属于非概率样本,同时可能出现协变量较多,甚至是高维的数据,在这种情况下如何基于非概率样本对总体进行推断,成为当下的一个热点问题.针对该问题,考虑到神经网络的降维特点,提出根据非概率样本构建BP神经网络来推断总体的方法.结合非概率样本与参考样本,考虑BP神经网络所具有的正向传播和反向传播相结合的特点,通过训练神经网络调节内部参数,构建BP神经网络模型,估计倾向得分,从而得到总体的估计.模拟与实证分析结果表明基于神经网络的总体估计的偏差、方差、均方误差均小于基于Logistic倾向得分模型的总体估计,提出的方法估计效果较好. The development of big data and web surveys has promoted the development of non-probability samples.Most of the web survey samples are non-probability samples,and a large number of covariates or even high-dimensional data are available at the same time.In this case,how to infer the population based on non-probability samples becomes a hot issue at present.To solve this problem,considering the dimensionality reduction characteristics of neural network,an inference method of constructing BP neural network based on non-probability samples was proposed.Combining non-probability samples and reference samples,and considering the characteristic of forward propagation and back propagation of BP neural network,the BP neural network model was constructed to estimate propensity scores for obtaining the population estimator via adjusting the internal parameters.Simulation and empirical analysis show that the bias,variance,and mean square error of the population estimator based on neural network are smaller than those of the population estimator based on the logistic propensity score model,and the proposed method has better performance.

作者刘展李若菡潘莹丽 LIU Zhan;LI Ruohan;PAN Yingli(School of Mathematics and Statistics,Hubei University,Wuhan 430062,China)

机构地区湖北大学数学与统计学学院

出处《湖北大学学报（自然科学版）》 CAS 2023年第5期684-694,共11页 Journal of Hubei University：Natural Science

基金国家社会科学基金一般项目(18BTJ022)资助。

关键词高维数据非概率样本 BP神经网络倾向得分 high-dimensional data non-probability sample BP neural network propensity score

分类号 O212 [理学—概率论与数理统计]

作者简介刘展(1981),女,博士,教授,研究方向为抽样推断、大数据分析、缺失数据,E-mail:eleen_20040109@163.com;通信作者:潘莹丽,博士,副教授,研究方向为生存分析、大数据分析方法、抽样推断,E-mail:panyingli220@163.com。

引文网络
相关文献

参考文献9

1刘展,潘莹丽.大数据背景下网络调查样本的建模推断问题研究——以广义Boosted模型的倾向得分推断为例[J].统计研究,2019,36(9):93-103. 被引量：14
2刘展,潘莹丽,涂朝凤,张梦.基于倾向得分的伪权数构造与混合样本推断[J].统计与决策,2021(2):20-24. 被引量：6
3刘展,金勇进.基于贝叶斯伪设计与组合样本的候选者数据库网络调查的推断研究[J].系统科学与数学,2019,39(6):990-1000. 被引量：4
4刘展,潘莹丽.基于超总体伪设计与组合样本的候选者数据库网络调查的推断研究[J].应用概率统计,2019,35(3):221-232. 被引量：5
5刘展.基于倾向得分多层模型的非概率抽样统计推断[J].统计与决策,2018,0(23):11-15. 被引量：7
6刘展,金勇进.网络访问固定样本调查的统计推断研究[J].统计与信息论坛,2017,32(2):3-10. 被引量：17
7金勇进,刘展.大数据背景下非概率抽样的统计推断问题[J].统计研究,2016,33(3):11-17. 被引量：40
8刘展,金勇进.基于倾向得分匹配与加权调整的非概率抽样统计推断方法研究[J].统计与决策,2016,32(21):4-8. 被引量：5
9刘展.自选式网络调查的统计推断研究[J].暨南学报（哲学社会科学版）,2015,37(9):106-111. 被引量：5

二级参考文献38

1Bethlehem J. G. , Applied Survey Methods : A Statistical Perspective, Wiley Press, 2009.
2Keusch F. , "Why Do People Participate in Web Surveys? Applying Survey Participation Theory to Intemet Survey Data Collection", Manage- merit Review Quarterly, No. 1,2015.
3Couper M. P. , "Web Surveys : A Review of Issues and Approaches", The Public Opinion Quarterly, Vol. 64, No. 4,2000, pp. 464 - 494.
4Grandeolas U. , Rettie R. , Marusenko K. , "Web Survey Bias : Sample or Mode Effect?", Journal of Marketing Management, Vol. 19,2003 pp. 5-6, 541 -561.
5Svensson J. Web panel surveys--can they be designed and used in a scientifically sound way? [ C ]. 59th World Statistics Congress, 2013.
6Rivers D. Sample matching--representative sampling from internet panels[ J]. Polimetrix White Paper Series, 2006.
7Vavreck L, Rivers D. The 2006 cooperative congressional election study [ J]. Journal of Elections, Public Opinion & Parties, 2008,18 (4) :35 -66.
8Baker R, Brick J M, Bates N A, et al. Summary report of the AAPOR task force on nonprobability sampling [ J ]. Journal of Survey Statistics and Methodology, 2013, 1 (2) : 90 -143.
9Terhanian G, Bremer J. A smarter way to select respondents for surveys? [ J]. International Journal of Market Research, 2012, 54 (6) :751 -780.
10Kogan S M, Wejnert C, Chen Y F, et al. Respondent-driven sampling with hard-to-reach emerging adults: an introduction and case study with rural African Americans[ J]. Journal of Adolescent Research, 2011, 26(1 ): 30-60.

共引文献67

1贺建风,李宏煜.大数据背景下基于社交网络的聚类随机游走抽样算法研究[J].统计研究,2021(4):131-144. 被引量：10
2刘展,潘莹丽,涂朝凤,张梦.基于倾向得分的伪权数构造与混合样本推断[J].统计与决策,2021(2):20-24. 被引量：6
3王超,于天龙.关于财政管理信息化生命力的思考[J].吉林广播电视大学学报,2023(4):103-106.
4马荣昌.大数据对金融统计的影响分析[J].现代经济信息,2021(29):173-174.
5朱钰,王恬.网络数据环境下动态抽样框的构建及其应用[J].统计与决策,2019,35(2):5-8. 被引量：3
6程开明,宋艺旋.大数据还需要抽样吗[J].中国统计,2017,32(11):10-13. 被引量：7
7肖海燕.非概率抽样样本容量的确定问题[J].山西大同大学学报（自然科学版）,2018,34(1):29-31. 被引量：4
8董海军,耿宇.移动互联网+问卷的应用特点与发展[J].晋阳学刊,2018(3):104-110. 被引量：8
9陈光慧,刘建平.构建新时代现代化统计调查体系的问题研究[J].统计研究,2018,35(6):11-17. 被引量：11
10胡桂华,薛婷.中国户籍登记系统覆盖评估研究[J].统计与信息论坛,2018,33(7):34-46. 被引量：7

同被引文献18

1刘展,潘莹丽,涂朝凤,张梦.基于倾向得分的伪权数构造与混合样本推断[J].统计与决策,2021(2):20-24. 被引量：6
2马志华,陈光慧.基于局部多项式回归的模型校准抽样估计研究[J].数理统计与管理,2016,35(1):47-56. 被引量：12
3刘展,金勇进.网络访问固定样本调查的统计推断研究[J].统计与信息论坛,2017,32(2):3-10. 被引量：17
4毕画,伍业锋.混合类型辅助变量下模型校准抽样估计研究[J].统计研究,2017,34(9):120-128. 被引量：2
5刘展.基于倾向得分广义线性模型的非概率抽样统计推断研究[J].数学的实践与认识,2018,48(16):175-184. 被引量：10
6贺建风,陈茜儒,陈飞.完全辅助信息下非参数模型校准估计方法研究[J].统计与信息论坛,2020,35(11):23-32. 被引量：5
7侯兰宝,邓严林.基于校准的伪权数构造与混合样本推断[J].统计与决策,2021(12):5-9. 被引量：2
8王俊,刘展.概率-非概率混合样本的统计推断问题研究[J].数理统计与管理,2021,40(6):1069-1079. 被引量：5
9金勇进,刘晓宇.线上、线下调查数据的融合问题——以基于伪设计的校准为例[J].统计研究,2022,39(1):122-131. 被引量：6
10金勇进,刘晓宇.权数对基于模型推断的影响分析[J].统计与信息论坛,2022,37(3):3-13. 被引量：10

引证文献1

1王小宁,孙敏,邹梦文.基于Adaptive LASSO模型辅助校准的非概率样本与概率样本融合研究[J].调研世界,2025(9):84-96.

1陈迪,李鑫.人口老龄化背景下养老机构运营现状的调查报告[J].中文科技期刊数据库(全文版)社会科学,2021(7):071-072.
2罗阳奇,沈靖然,潘俊强,郑智文,刘新吾,贾丰丰,李俊杰,邵玉姿,原韬雄,张云河,王者.防控近视需要多方努力[J].法制与社会,2023(12):57-64.
3丁海涛,徐金鹏.基于虚拟仿真技术的中职工业机器人专业课程教学研究[J].教师,2023(19):126-128. 被引量：3
4李仁钟,陈忠源,林云,方伟国.智能化碳排放预测的研究[J].福建电脑,2023,39(9):51-55.
5李莹.卓越幼儿园教师的典型特征“画像”——基于15名教师访谈的质性分析[J].邢台学院学报,2023,38(2):134-141. 被引量：2
6关伟,林镇明.加速度计自旋修正系数标定方案分析[J].现代防御技术,2023,51(4):104-109.
7畅倩,邓悦,赵敏娟.生产环节外包能否助力中国粮食安全?——来自粮食主产区的证据[J].华中农业大学学报（社会科学版）,2023(4):11-24. 被引量：7
8王亚琪,刘雅菲,葛龙.兰州市493名男男性行为大学生艾滋病知识和性行为调查[J].实用预防医学,2023,30(5):604-607. 被引量：7
9黎健荣,王丽荣,杨放,李艳,罗玉兰,潘丝媛,徐慧芳,林鹏.美沙酮维持治疗门诊抗-HCV阳性者参加直接抗病毒药物治疗意愿及相关因素分析[J].中国艾滋病性病,2023,29(4):424-428. 被引量：3
10刘展,王典妮,潘莹丽,彭璐.非概率样本与概率样本的融合推断新方法[J].统计与决策,2023(8):5-11. 被引量：1

湖北大学学报（自然科学版）

2023年第5期

浏览历史

内容加载中请稍等...

高维非概率样本数据的神经网络推断方法研究被引量：1

参考文献9

二级参考文献38

共引文献67

同被引文献18

引证文献1

相关作者

相关机构

相关主题

浏览历史

高维非概率样本数据的神经网络推断方法研究 被引量：1

参考文献9

二级参考文献38

共引文献67

同被引文献18

引证文献1

相关作者

相关机构

相关主题

浏览历史

高维非概率样本数据的神经网络推断方法研究被引量：1