-
题名数字化、广义统计与数族协同
被引量:4
- 1
-
-
作者
赵彦云
-
机构
中国人民大学应用统计科学研究中心、统计学院
-
出处
《统计研究》
CSSCI
北大核心
2020年第5期117-128,共12页
-
基金
中国人民大学科研基金重大项目“互联网统计学”(17XNLG09)。
-
文摘
互联网技术革命已经收敛到数据资源、数据生产要素、数据资产,正在通过新科学、新技术、新产业推动人类社会的巨大进步。本文针对互联网技术革命作用的基本架构做出系统研究,提出数字化、全面量化、广义统计、数族协同一系列关键领域的分析研究,追求解析互联网技术革命的重大发展趋势、重要途径和主要科学手段,以及走向智能化的设施支撑和社会生态系统平台的优化及演化作用,特别阐述统计学科在互联网技术革命中基础地位和巨大发展空间,为统计实践工作和战略定位提供理论依据。
-
关键词
互联网数字化
全面量化
广义统计
数族协同
-
Keywords
Internet Digitization
Comprehensive Quantification
Generalized Statistics
Digital Synergism
-
分类号
C829.29
[社会学—统计学]
-
-
题名基于混合成对惩罚的多个数据集效应异质性分析
- 2
-
-
作者
孙怡帆
姚一枝
于雪
-
机构
中国人民大学应用统计科学研究中心、统计学院、未来区块链与隐私计算高精尖创新中心
中国人民大学应用统计科学研究中心、统计学院
-
出处
《统计研究》
CSSCI
北大核心
2024年第9期150-160,共11页
-
基金
中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目“高维数据效应异质性挖掘的方法、理论与应用”(23XNL014)。
-
文摘
大数据通常是由主体或来源各异的多个数据集融合而成,因此同一个自变量对因变量的影响在不同数据集间可能存在差异,即效应异质性。从数据中挖掘出潜在的效应异质性已成为大数据分析的重要目标之一。基于融合惩罚和成对惩罚的整合分析方法是目前较为主流的两类效应异质性分析方法,但前者高度依赖模型系数的排序,而后者则计算量较大。为此,本文提出基于混合成对惩罚的新型整合分析方法。相比基于融合惩罚的整合分析方法,新方法对模型系数排序的敏感度大大降低。相比基于成对惩罚的整合分析方法,新方法减少了大量的冗余惩罚项,在降低计算量的同时提高了结果准确性。大量的模拟实验和黑色素瘤的致病基因识别应用研究均展示了新方法在识别效应异质性方面的优势。
-
关键词
大数据
效应异质性
混合成对惩罚
整合分析
-
Keywords
Big Data
Effect Heterogeneity
Hybrid Pairwise Penalty
Integrative Analysis
-
分类号
O212
[理学—概率论与数理统计]
-
-
题名基于切片逆回归的稳健降维方法
被引量:3
- 3
-
-
作者
李向杰
吴燕燕
张景肖
-
机构
中国人民大学
拜耳医药保健有限公司
中国人民大学应用统计科学研究中心、统计学院
-
出处
《统计研究》
CSSCI
北大核心
2018年第7期115-124,共10页
-
基金
中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)“超高维数据降维问题的理论与应用研究”(18XNI010)项目成果.
-
文摘
经典的充分降维方法对解释变量存在异常值或者当其是厚尾分布时效果较差,为此,经过对充分降维理论中加权与累积切片的分析研究,本文提出了一种将两者有机结合的稳健降维方法——累积加权切片逆回归法(CWSIR)。该方法对自变量存在异常值以及小样本情况下表现比较稳健,并且有效避免了对切片数目的选择。数值模拟结果显示CWSIR要优于传统的切片逆回归(SIR)、累积切片估计(CUME)、基于等高线的切片逆回归估计(CPSIR)、加权典则相关估计(WCANCOR)、切片逆中位数估计(SIME)、加权逆回归估计(WIRE)等方法。最后,通过对某视频网站真实数据的分析也验证了CWSIR的有效性。
-
关键词
充分降维
切面逆回归
加权
累积切片估计
-
Keywords
Sufficient Dimension Reduction
Sliced Inverse Regression
Weighting
Cumulative Sliced Estimation
-
分类号
O212
[理学—概率论与数理统计]
-