-
题名基于BP神经网络的伪设计样本融合研究
- 1
-
-
作者
王小宁
王佳琪
-
机构
中国传媒大学数据科学与智能媒体学院
北京师范大学统计学院
-
出处
《统计研究》
CSSCI
北大核心
2024年第11期152-160,共9页
-
基金
全国统计科学研究重点项目“大型抽样调查样本整合及其有效性研究”(2020LZ27)
中国传媒大学中央高校基本科研业务费专项“基于图神经网络模型的多源社会媒体数据整合方法研究”(CUC230B022)。
-
文摘
由于实施简单、样本收集快速,非概率抽样已经成为获取数据的重要方式之一,但非概率样本代表性往往无法得到验证,样本无法多次利用,从而造成了数据资源浪费的问题。融合概率样本及非概率样本进行统计推断可以进一步提升估计的精度,减少数据资源的浪费。由此,本文采用伪设计样本融合思路,提出基于BP神经网络的伪设计样本融合方法,创新性地将BP神经网络引入非概率样本权重构造中,并采用最短距离法对倾向得分生成的初始权重进行二次校准。实验结果显示,本文提出的方法可以获得更高精度的估计结果,在协变量维数较高的情况下仍能保持良好的估计精度。本文不仅为网络时代下海量的高维样本融合分析提供了一个切实的方法,并且为概率样本与非概率样本融合领域的研究提供了一种新的思路。
-
关键词
多源样本融合
BP神经网络
倾向得分
权重构造
-
Keywords
Multi-source Data Integration
BP Neural Network
Propensity Score
Weight Construction
-
分类号
C811
[社会学—统计学]
-