期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于异质性数据的Logit变量选择模型研究 被引量:5
1
作者 斯介生 李扬 谢邦昌 《统计研究》 CSSCI 北大核心 2017年第12期110-118,共9页
在大数据时代,数据的异质性和变量的稀疏性是不可回避的两大问题。本文针对上述问题构建了异质性Logit变量选择模型。研究显示,在不同的异质性条件下,本文的方法可以明显区分有效变量和冗余变量。而且,通过Gmeans等评价指标可知该模型... 在大数据时代,数据的异质性和变量的稀疏性是不可回避的两大问题。本文针对上述问题构建了异质性Logit变量选择模型。研究显示,在不同的异质性条件下,本文的方法可以明显区分有效变量和冗余变量。而且,通过Gmeans等评价指标可知该模型具有很好的预测效果。在对上市公司财务预警分析的应用研究中,本文方法得到了具有解释意义的结果,说明该方法具有一定的实证价值。 展开更多
关键词 异质性 变量选择 财务预警
在线阅读 下载PDF
大数据下Leverage重要性抽样方法的稳健改进 被引量:8
2
作者 秦磊 熊巍 田茂再 《统计研究》 CSSCI 北大核心 2016年第8期101-105,共5页
大数据以其巨大的样本容量或超高的变量维度使得直接计算变得不再可能,如何有效地抽取一个合适的计算样本是值得思考的问题。本文借鉴Leverage重要性抽样的思想,提出了两种稳健的改进抽样算法,不仅有效地抽取了代表性高的计算样本进行... 大数据以其巨大的样本容量或超高的变量维度使得直接计算变得不再可能,如何有效地抽取一个合适的计算样本是值得思考的问题。本文借鉴Leverage重要性抽样的思想,提出了两种稳健的改进抽样算法,不仅有效地抽取了代表性高的计算样本进行回归估计,还规避了方差大和异质性导致协方差矩阵估计不准的问题。模拟数据的分析显示,相比于Ma(2015)的方法,本文提出的方法具有更为优良的估计结果。 展开更多
关键词 大数据 重要性抽样 异质性问题 协方差矩阵
在线阅读 下载PDF
异质性数据下广义线性模型的Maximin似然比估计及应用 被引量:3
3
作者 秦磊 夏传信 施建军 《统计研究》 CSSCI 北大核心 2018年第6期109-116,共8页
针对具有多个来源的异质性数据,文献中通常提出复杂程度较高的模型用于描述每个数据子总体的特征,而本文着眼于刻画不同数据子总体的共性进而建立一个简单的模型。在参数估计方面,本文借鉴了普通线性模型的Maximin估计思想,提出了适用... 针对具有多个来源的异质性数据,文献中通常提出复杂程度较高的模型用于描述每个数据子总体的特征,而本文着眼于刻画不同数据子总体的共性进而建立一个简单的模型。在参数估计方面,本文借鉴了普通线性模型的Maximin估计思想,提出了适用于广义线性模型的Maximin似然比估计方法及稀疏结构下的惩罚估计。该方法通过最大化所有子总体中似然比统计量的最小值,构建了一个简单而保守的模型,以减少数据来源较多而呈现的复杂性。本文所提方法适用于因变量服从正态分布、两点分布、泊松分布等指数族分布的情形,丰富了前人的研究成果,具有更好的实践意义。模拟分析显示,相比于经典的估计方法,Maximin似然比估计方法不仅能够有效地探寻子总体的共性,而且具有较高的样本外预测精度。本文的方法也适用于政府统计和经济统计中具有异质性的大型数据集。 展开更多
关键词 异质性 指数族分布 Maximin似然比估计 惩罚估计
在线阅读 下载PDF
谷歌流感趋势的成功与失误 被引量:15
4
作者 秦磊 谢邦昌 《统计研究》 CSSCI 北大核心 2016年第2期107-110,共4页
大数据时代下机遇与挑战并存,如何基于传统方法去处理大数据引人深思。本文以谷歌流感趋势(GFT)为案例,介绍了大数据在疾病疫情监测方面的主要技术及相关成果,阐述了大数据在使用中的关键问题,并结合复杂的统计学工具给出了一些改进措... 大数据时代下机遇与挑战并存,如何基于传统方法去处理大数据引人深思。本文以谷歌流感趋势(GFT)为案例,介绍了大数据在疾病疫情监测方面的主要技术及相关成果,阐述了大数据在使用中的关键问题,并结合复杂的统计学工具给出了一些改进措施。谷歌流感趋势的成功取决于相关关系的应用,其失误却来源于模型的构造、因果关系和相关关系的冲突等问题。谷歌流感趋势案例的分析与启示对政府今后在大数据解决方案中有重要的理论和实践意义。 展开更多
关键词 谷歌流感趋势 大数据 小数据 降维 回归预测
在线阅读 下载PDF
重复测量诊断试验的ROC曲线广义线性混合效应模型 被引量:17
5
作者 马春桃 熊巍 田茂再 《中国卫生统计》 CSCD 北大核心 2017年第1期2-6,共5页
目的针对重复测量诊断数据,为同时考虑协变量对诊断试验准确性评价的影响,度量重复测量数据间的相关性,本文探索新的ROC曲线的建模方法。方法通过广义线性混合效应模型对ROC曲线进行模拟,并采用贝叶斯参数估计方法,利用Win BUGS软件予... 目的针对重复测量诊断数据,为同时考虑协变量对诊断试验准确性评价的影响,度量重复测量数据间的相关性,本文探索新的ROC曲线的建模方法。方法通过广义线性混合效应模型对ROC曲线进行模拟,并采用贝叶斯参数估计方法,利用Win BUGS软件予以实现,进而计算不同协变量取值下的ROC曲线下面积(AUC)以对诊断试验结果进行评价。结果实例数据分析结果表明,基于广义线性混合效应模型的ROC曲线建模方法可以有效地刻画重复测量诊断试验数据,给出更有解释意义的回归参数,提供临床分析的参考依据。结论基于广义线性混合效应的ROC曲线模型在解决重复测量诊断试验的准确度评价问题起着至关重要的作用。 展开更多
关键词 ROC曲线 混合效应 贝叶斯 重复测量 诊断试验
在线阅读 下载PDF
最优分位水平及其衍生应用 被引量:1
6
作者 熊巍 田茂再 《高校应用数学学报(A辑)》 北大核心 2019年第1期25-43,共19页
分位数回归方法由于其具有稳健性,不仅能够全面刻画响应变量的条件分布,还能提供更有现实意义的回归参数,已经逐渐成为各个领域统计分析的强有力的工具.但在许多实际应用中,人们不仅想要探寻不同水平下(即不同分位数)响应变量与解释变... 分位数回归方法由于其具有稳健性,不仅能够全面刻画响应变量的条件分布,还能提供更有现实意义的回归参数,已经逐渐成为各个领域统计分析的强有力的工具.但在许多实际应用中,人们不仅想要探寻不同水平下(即不同分位数)响应变量与解释变量之间的关系,更希望找到一个最优水平,也即最优分位数,使其上的回归结果最真实可靠,最好地反映总体情况.文中提出一种新的回归方法一最优分位回归方法,给出此类问题一个完美的解决方案.该方法的灵感主要来源于稀疏函数的定义,可以证实与传统均值回归相比最优分位回归方法更具优势:(1)稳健性.不受误差分布的限制;(2)有效性.回归结果蕴含信息更丰富;(3)灵活性.对任意模型及数据均适用.文中的模拟结果也对以上三条性质给予极大的支持.最后食品消费数据的分析结果表明当考虑食品消费与人均收入的关系时,中下等收入人群的消费模式为社会的主流模式. 展开更多
关键词 稀疏函数 最优分位 分位数回归 稳健性
在线阅读 下载PDF
商业银行小微企业业务制约与破解 被引量:4
7
作者 周科 《金融监管研究》 2017年第2期33-50,共18页
商业银行小微企业业务面临瓶颈和挑战。对于银行的目标取向和小微企业的特性需求存在的差异,是应该施加行政化惩罚措施还是采取市场化激励引导,在方法论上存在分歧。本文在分析银行定位和影响面后认为,银行的容忍度较低,从事的业务要求... 商业银行小微企业业务面临瓶颈和挑战。对于银行的目标取向和小微企业的特性需求存在的差异,是应该施加行政化惩罚措施还是采取市场化激励引导,在方法论上存在分歧。本文在分析银行定位和影响面后认为,银行的容忍度较低,从事的业务要求风险可控;而小微企业整体风险程度高、不良影响显著且内部差异性大。这使得银行定位与目标企业客群的特性出现错位。此外,银行贷款的收益未必能匹配成本,业务却易受内审外查和质疑,银行机构和个人的主观能动性有待激发。为了促进商业银行小微企业业务有序发展,需要各方共同努力化解上述矛盾。为此,应从打造金融分层体系、培育良性外部环境、树立成本收益原则等方面着手,建立以风险管理为本的长效发展机制。 展开更多
关键词 商业银行 小微金融贷款 融资难融资贵
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部