期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
贝叶斯时空分位回归模型及其对北京市PM2.5浓度的研究 被引量:9
1
作者 梅波 田茂再 《统计研究》 CSSCI 北大核心 2016年第12期91-100,共10页
本文基于时空模型和非对称拉普拉斯分布提出一种新的时空分位回归模型。本文主要将空间域利用薄板回归样条展开,结合混合模型与样条之间的关系,得到分层贝叶斯分位回归模型。利用MCMC算法得到参数的后验分布,并对模型中系数的空间域进... 本文基于时空模型和非对称拉普拉斯分布提出一种新的时空分位回归模型。本文主要将空间域利用薄板回归样条展开,结合混合模型与样条之间的关系,得到分层贝叶斯分位回归模型。利用MCMC算法得到参数的后验分布,并对模型中系数的空间域进行预测。本文同时融合降秩近似的方法,简化了计算复杂度。区别于已有时空分位模型,本文考虑了协变量对因变量影响的空间分布特征,并非直接对时间或空间效应整体进行建模,有利于深入研究协变量与因变量之间的空间结构关系。数值模拟结果表明,预测的空间域与真实的空间域十分接近,并在不同分位水平下,有效地估计了协变量影响的空间效应差异。最后将该模型应用于北京市PM2.5浓度的研究,分析气象因素对PM2.5浓度影响的空间分布特征。 展开更多
关键词 时空模型 薄板回归样条 非对称拉普拉斯分布 MCMC 分位回归
在线阅读 下载PDF
缺失数据下的逆概率多重加权分位回归估计及其应用 被引量:7
2
作者 邰凌楠 王春雨 田茂再 《统计研究》 CSSCI 北大核心 2018年第9期115-128,共14页
数据缺失问题普遍存在于应用研究中。在随机缺失机制假定下,本文从模型推断角度出发,针对线性缺失分位回归模型,提出一种新的有效估计方法——逆概率多重加权(IPMW)估计。该方法是在逆概率加权(IPW)估计的基础上,结合倾向得分匹配及模... 数据缺失问题普遍存在于应用研究中。在随机缺失机制假定下,本文从模型推断角度出发,针对线性缺失分位回归模型,提出一种新的有效估计方法——逆概率多重加权(IPMW)估计。该方法是在逆概率加权(IPW)估计的基础上,结合倾向得分匹配及模型平均思想,经过多次估计,加权确定最终参数估计结果。该方法适用于响应变量是独立同分布或独立非同分布的情形,并适用于绝大多数数据缺失场景。经过理论推导及模拟研究发现,IPMW估计量在继承IPW估计量的优势上具有更稳健的性质。最后,将该方法应用于含有缺失数据的微观调查数据中,研究了经济较发达的准一线城市中等收入群体消费水平的影响因素,对比两种估计方法的估计结果,发现逆概率多重加权估计量的标准偏差更小,估计结果更稳健。 展开更多
关键词 线性分位回归 倾向得分 逆概率多重加权 随机缺失机制 模型平均
在线阅读 下载PDF
函数型变量倾斜分位回归模型及其应用 被引量:4
3
作者 田茂再 梅波 《统计研究》 CSSCI 北大核心 2019年第8期114-128,共15页
本文考虑函数型数据的结构特征,针对两类函数型变量分位回归模型(函数型因变量对标量自变量和函数型因变量对函数型自变量),基于函数型倾斜分位曲线的定义构建新型函数型倾斜分位回归模型。对于第二类模型,本文分别考虑样条基函数对模... 本文考虑函数型数据的结构特征,针对两类函数型变量分位回归模型(函数型因变量对标量自变量和函数型因变量对函数型自变量),基于函数型倾斜分位曲线的定义构建新型函数型倾斜分位回归模型。对于第二类模型,本文分别考虑样条基函数对模型系数展开和函数型主成分基函数对函数型自变量展开,得到倾斜分位回归模型的基本形式。参数估计采用成分梯度Boosting算法最小化加权非对称损失函数,提高计算效率。在理论上证明了倾斜分位回归模型的系数估计量均服从渐近正态分布。模拟和实证研究结果显示,倾斜分位回归模型比已有的逐点分位回归模型具有更好的拟合效果。根据积分均方预测误差准则,本文提出的模型有一致较好的预测能力。 展开更多
关键词 函数型数据 函数型主成分 倾斜分位回归 积分均分预测误差 渐近分布 多发性硬化症
在线阅读 下载PDF
样本选择参数分位回归模型及其在工资分布分解中的应用
4
作者 邰凌楠 钱曼玲 田茂再 《统计研究》 CSSCI 北大核心 2020年第1期62-73,共12页
在工资差距分解问题中,研究者经常会遇到样本选择偏差问题,直接忽略会导致最终估计结果产生严重偏差,同时在众多工资差距分解方法中,相比于均值分解,分布分解方法更受研究者青睐。针对参数分位回归,本文首次提出可加形式与非可加形式的... 在工资差距分解问题中,研究者经常会遇到样本选择偏差问题,直接忽略会导致最终估计结果产生严重偏差,同时在众多工资差距分解方法中,相比于均值分解,分布分解方法更受研究者青睐。针对参数分位回归,本文首次提出可加形式与非可加形式的样本选择参数分位回归(SSPQR)模型,并基于这两类样本选择参数分位回归模型给出修正样本选择偏差后的参数分位回归工资差距分布分解方法。运用上述方法及已有的工资分布分解方法,借助CHNS2015年度城镇数据,本文研究了我国城镇男女工资差距及差距分解问题,得出以下结论:①男女工资差距主要来源是性别歧视问题;②经过样本选择偏差修正后,实际的工资差距更大,歧视问题更严重;③男女工资差距程度在不同分位点上结果不同,换句话说,我们不能简单地仅从平均水平来判断工资差距程度;④与其他已有方法计算结果比较发现,SSPQR计算的工资差距程度更大。 展开更多
关键词 样本选择偏差 参数分位回归 工资差距 分布分解
在线阅读 下载PDF
零膨胀计数数据的联合建模及变量选择 被引量:6
5
作者 胡亚南 田茂再 《统计研究》 CSSCI 北大核心 2019年第1期104-114,共11页
零膨胀计数数据破坏了泊松分布的方差-均值关系,可由取值服从泊松分布的数据和取值为零(退化分布)的数据各占一定比例所构成的混合分布所解释。本文基于自适应弹性网技术,研究了零膨胀计数数据的联合建模及变量选择问题。对于零膨胀泊... 零膨胀计数数据破坏了泊松分布的方差-均值关系,可由取值服从泊松分布的数据和取值为零(退化分布)的数据各占一定比例所构成的混合分布所解释。本文基于自适应弹性网技术,研究了零膨胀计数数据的联合建模及变量选择问题。对于零膨胀泊松分布,引入潜变量,构造出零膨胀泊松模型的完全似然,由零膨胀部分和泊松部分两项组成。考虑到协变量可能存在共线性和稀疏性,通过对似然函数加自适应弹性网惩罚得到目标函数,然后利用EM算法得到回归系数的稀疏估计量,并用贝叶斯信息准则BIC来确定最优调节参数。本文也给出了估计量的大样本性质的理论证明和模拟研究,最后把所提出的方法应用到实际问题中。 展开更多
关键词 零膨胀泊松模型 变量选择 联合建模
在线阅读 下载PDF
异质性大数据的分布式估计 被引量:4
6
作者 郭婧璇 徐慧超 +1 位作者 祝婉晴 田茂再 《统计研究》 CSSCI 北大核心 2020年第10期104-114,共11页
随着物联网技术的进步,大数据给网络带宽和计算机存储能力带来巨大挑战,传统的集中式数据处理难以实现,客观上促进了分布式统计学习的发展。在无迭代算法研究中,Zhang等(2013)证明了当数据集个数s=O(■)时,基于局部经验风险最小化的分治... 随着物联网技术的进步,大数据给网络带宽和计算机存储能力带来巨大挑战,传统的集中式数据处理难以实现,客观上促进了分布式统计学习的发展。在无迭代算法研究中,Zhang等(2013)证明了当数据集个数s=O(■)时,基于局部经验风险最小化的分治(DC)简单平均估计量具有O(N-1)均方误差收敛速度,Huang和Huo(2019)在M估计框架下进一步提出分布式一步估计量,但上述方法均未考虑海量数据可能存在的异质性对分治估计效果的影响。本文在线性模型框架下提出海量异质数据的分治一步加权估计,证明了估计量的渐近性质并考虑了异质性检验问题。将本文提出的方法应用于美国医疗保险实际数据分析,结果表明该方法能更好地拟合数据的线性趋势且显著提高了计算效率。 展开更多
关键词 分治策略 一步估计 海量数据 异质性 医疗保险
在线阅读 下载PDF
零膨胀计数数据函数型部分变系数模型 被引量:1
7
作者 王芝皓 刘艳霞 +1 位作者 田茂再 陈小昆 《统计研究》 CSSCI 北大核心 2021年第7期127-139,共13页
在实际数据分析中经常会遇到零膨胀计数数据作为响应变量与函数型随机变量和随机向量作为预测变量相关联。本文考虑函数型部分变系数零膨胀模型(FPVCZIM),模型中无穷维的斜率函数用函数型主成分基逼近,系数函数用B-样条进行拟合。通过E... 在实际数据分析中经常会遇到零膨胀计数数据作为响应变量与函数型随机变量和随机向量作为预测变量相关联。本文考虑函数型部分变系数零膨胀模型(FPVCZIM),模型中无穷维的斜率函数用函数型主成分基逼近,系数函数用B-样条进行拟合。通过EM算法得到估计量,讨论其理论性质,在一些正则条件下获得了斜率函数和系数函数估计量的收敛速度。有限样本的Monte Carlo模拟研究和真实数据分析被用来解释本文提出的方法。 展开更多
关键词 函数型数据分析 变系数零膨胀模型 函数型零膨胀模型 B-样条 Karhunen-Loève表示
在线阅读 下载PDF
基于随机化适应性Lasso的高维变量选择 被引量:3
8
作者 闫懋博 田茂再 《统计研究》 CSSCI 北大核心 2021年第1期147-160,共14页
Lasso等惩罚变量选择方法选入模型的变量数受到样本量限制。文献中已有研究变量系数显著性的方法舍弃了未选入模型的变量含有的信息。本文在变量数大于样本量即p>n的高维情况下,使用随机化bootstrap方法获得变量权重,在计算适应性La... Lasso等惩罚变量选择方法选入模型的变量数受到样本量限制。文献中已有研究变量系数显著性的方法舍弃了未选入模型的变量含有的信息。本文在变量数大于样本量即p>n的高维情况下,使用随机化bootstrap方法获得变量权重,在计算适应性Lasso时构建选择事件的条件分布并剔除系数不显著的变量,以得到最终估计结果。本文的创新点在于提出的方法突破了适应性Lasso可选变量数的限制,当观测数据含有大量干扰变量时能够有效地识别出真实变量与干扰变量。与现有的惩罚变量选择方法相比,多种情境下的模拟研究展示了所提方法在上述两个问题中的优越性。实证研究中对NCI-60癌症细胞系数据进行了分析,结果较以往文献有明显改善。 展开更多
关键词 随机化适应性Lasso 高维变量选择 选择性推断
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部