-
题名存在中介效应的高斯混合模型的子群选择
- 1
-
-
作者
李姝雅
王文武
王明秋
-
机构
曲阜师范大学统计与数据科学学院
-
出处
《统计研究》
北大核心
2025年第6期149-160,共12页
-
基金
国家自然科学基金面上项目“大数据背景下几类统计模型的稳健子抽样”(12271294)
国家自然科学基金面上项目“断点回归中模型识别、效应估计和大数据统计学习”(12071248)
+1 种基金
山东省自然科学基金面上项目“超高维非对称数据的稳健统计推断”(ZR2024MA089)
山东省自然科学基金面上项目“因果中介分析中的模型探索和理论研究”(ZR2024MA058)。
-
文摘
随着因果中介分析的应用越来越广泛,当高斯混合模型中存在中介效应时,子群数量的选择问题已成为研究热点之一。本文提出一种新的惩罚似然方法来估计有中介效应的高斯混合模型。对于存在中介效应的高斯混合模型,分别利用Lasso和SCAD方法对混合概率进行惩罚,构造惩罚对数似然函数,然后提出改进的EM算法,分两步进行迭代对构造的惩罚对数似然函数求最大值点。使用贝叶斯信息准则函数来选择最优调整参数λ,其对应的子群数量和参数估计即为最优估计。本文给出子群数量估计的渐近性质,并通过模拟验证Lasso和SCAD方法能准确地选择子群数量并进行参数估计。同时,本文将两种方法与畸形贝叶斯信息准则(SBIC)方法进行比较,结果表明SCAD方法在三种方法中正确选择子群数量的比例最高,参数估计的效果也最好。应用本文提出的方法分析规范衰老表观遗传学研究(NAS)的DNA甲基化数据集,结果表明SCAD方法在三种方法中得出的结果最合理,胞嘧啶–磷酸–鸟嘌呤(Cp G)位点的中介效应存在异质性。
-
关键词
Lasso
SCAD
高斯混合模型
因果中介
-
Keywords
Lasso
SCAD
Gaussian Mixture Model
Causal Mediation
-
分类号
C81
[社会学—统计学]
-