期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
特征样本重复抽样建模方法和应用研究 被引量:6
1
作者 李宝瑜 刘雪晨 刘洋 《统计研究》 CSSCI 北大核心 2016年第10期93-99,共7页
本文在传统统计回归方法的基础上,构建了一种新的特征样本重复抽样回归(FSR)建模方法。该方法是依据变量特征采用机器抽样方法重复抽样,形成多个特征样本,然后对多个样本进行参数估计,形成参数的抽样分布;最后依据抽样分布,在多个优化... 本文在传统统计回归方法的基础上,构建了一种新的特征样本重复抽样回归(FSR)建模方法。该方法是依据变量特征采用机器抽样方法重复抽样,形成多个特征样本,然后对多个样本进行参数估计,形成参数的抽样分布;最后依据抽样分布,在多个优化目标要求下建立最优化模型。FSR方法能够作为社会科学研究中一种通用的建模方法。 展开更多
关键词 特征样本 重复抽样 小样本建模 模型优化
在线阅读 下载PDF
有限样本条件下重复抽样建模方法研究 被引量:2
2
作者 高艳平 王晶 《统计与决策》 CSSCI 北大核心 2019年第8期22-25,共4页
文章从数学及模拟仿真的角度证明特征样本重复抽样回归方法(FSR)的优越性。从数学角度证明了对于连续型变量,FSR中抽样方法可充分利用非原采样点的数据分布信息,从而提高估计精度;由FSR方法得到的统计量变异系数大小与抽样次数m成反比... 文章从数学及模拟仿真的角度证明特征样本重复抽样回归方法(FSR)的优越性。从数学角度证明了对于连续型变量,FSR中抽样方法可充分利用非原采样点的数据分布信息,从而提高估计精度;由FSR方法得到的统计量变异系数大小与抽样次数m成反比。通过对小样本参数估计的传统回归、Bayes Bootstrap和特征样本重复抽样方法的仿真模拟比较,验证了上述结论。 展开更多
关键词 有限样本 特征样本重复抽样回归 先验分布
在线阅读 下载PDF
不重复抽样下总体比例的估计 被引量:2
3
作者 管宇 《统计与决策》 CSSCI 北大核心 2011年第12期16-17,共2页
文章研究了不重复抽样下总体比例的三种置信区间的范围概率。运算结果显示,目前各类有关抽样技术文献中普遍介绍的置信区间及其连续修正区间都不够理想。文章推荐了一种新的置信区间,它的范围概率比较集中分布在置信水平附近,最坏情形... 文章研究了不重复抽样下总体比例的三种置信区间的范围概率。运算结果显示,目前各类有关抽样技术文献中普遍介绍的置信区间及其连续修正区间都不够理想。文章推荐了一种新的置信区间,它的范围概率比较集中分布在置信水平附近,最坏情形的范围概率与置信水平相差0.1左右,远胜于前面两个常见置信区间。 展开更多
关键词 总体比例 重复抽样 置信区间
在线阅读 下载PDF
群随机试验重复横断面抽样的费用效益设计 被引量:1
4
作者 刘沛 孙宁生 +1 位作者 王灿楠 杨向东 《中国卫生统计》 CSCD 北大核心 2000年第6期328-330,共3页
目的 在满足需探查的最小干预效益及检验把握度的条件下 ,给出群随机试验重复横断面抽样的费用效益设计方法。方法 利用条件极值———拉格朗日乘法导出可使研究费用最少时的每组群数J ,每群个体数K。结果 获得了以保证检验把握度为... 目的 在满足需探查的最小干预效益及检验把握度的条件下 ,给出群随机试验重复横断面抽样的费用效益设计方法。方法 利用条件极值———拉格朗日乘法导出可使研究费用最少时的每组群数J ,每群个体数K。结果 获得了以保证检验把握度为条件 ,以费用最小为目标的最优化设计方案 ,同时给出了在固定J或K时的研究费用计算方法。结论 这一结果为涉及大量观察对象的社区干预研究提供了费用效益设计的定量分析方法。 展开更多
关键词 群随机试验 重复横断面抽样 费用效益设计
在线阅读 下载PDF
一种基于综合不放回抽样的随机森林算法改进 被引量:15
5
作者 李慧 李正 佘堃 《计算机工程与科学》 CSCD 北大核心 2015年第7期1233-1238,共6页
数据挖掘是大数据服务计算的一个重要方法,对于优化服务计算有重要意义。作为一种典型的数据挖掘方法,随机森林有着较高的正确率,因而得到广泛的应用。为了更加准确高效地处理服务计算中的大数据问题,进一步提升随机森林的正确率和... 数据挖掘是大数据服务计算的一个重要方法,对于优化服务计算有重要意义。作为一种典型的数据挖掘方法,随机森林有着较高的正确率,因而得到广泛的应用。为了更加准确高效地处理服务计算中的大数据问题,进一步提升随机森林的正确率和效率,成为一项极其重要的研究。通过改变训练集的样本量和样本抽样方法,对平衡样本集和不平衡样本集进行分析,发现通过上述两个改进后,在优化区间内,平衡样本集泛化误差会减小12%~20%;单项改变抽样方法,可以使算法时间缩短,提升效率达10%~40%;对不平衡数据,也能够明显提升效率。理论和实验均证明,基于综合不放回抽样的随机森林算法改进能够提升平衡样本的正确率,使得该数据挖掘方法更适用于服务计算中的大数据分析和处理。 展开更多
关键词 随机森林 平衡数据 不平衡数据 重复抽样
在线阅读 下载PDF
不等概率抽样若干问题探讨 被引量:2
6
作者 李金昌 《统计研究》 CSSCI 北大核心 1999年第S1期139-141,共3页
随着抽样调查在我国应用领域的不断扩展,不等概率抽样方法的应用也将越来越普遍。本文拟就其有关问题作一探讨。一、不等概率抽样的估计量及其方差不等概率抽样是指当总体中的个体有大小差异、而所要调查的标志又与其有密切的正相关关... 随着抽样调查在我国应用领域的不断扩展,不等概率抽样方法的应用也将越来越普遍。本文拟就其有关问题作一探讨。一、不等概率抽样的估计量及其方差不等概率抽样是指当总体中的个体有大小差异、而所要调查的标志又与其有密切的正相关关系时,按个体大小赋予不同的被抽中概... 展开更多
关键词 不等概率抽样 估计量 辅助标志 概率分布 总体总量 若干问题 调查标志 抽样问题 重复抽样 正相关关系
在线阅读 下载PDF
抽样调查在我厂质量检查中的运用
7
作者 董武钧 张合双 《管理现代化》 1986年第1期27-29,21,共4页
抽样调查是在遵守随机原则的条件下,用样本指标的数值推断总体指标的数值的一种非全面的统计调查方法.所谓随机原则就是说在抽选具体单位时,不掺杂调查者的主观判断,而是使总体中每个单位都有同等的机会被抽到.抽样调查是一种科学的,方... 抽样调查是在遵守随机原则的条件下,用样本指标的数值推断总体指标的数值的一种非全面的统计调查方法.所谓随机原则就是说在抽选具体单位时,不掺杂调查者的主观判断,而是使总体中每个单位都有同等的机会被抽到.抽样调查是一种科学的,方便的调查方法,它比全面调查可以节省大量的人力,物力、财力和时间,而且抽样误差还可以用人为的方法进行调整和控制.例如我厂轴承产品质量的检查工作,要用全面调查的方法对几千万套轴承逐套检查,实际上办不到,只能用抽样调查的方法。 展开更多
关键词 抽样调查 抽样误差 轴承 随机原则 统计调查方法 全面调查 样本单位 抽样成数 重复抽样 行调整
在线阅读 下载PDF
规定允许误差与规定抽样误差的区别探讨——兼与徐前同志商榷
8
作者 何云清 《统计与决策》 1985年第4期25-26,共2页
查阅一些《社会经济统计学原理》和抽样调查方法的专著,在阐述必要抽样数目的计算方法时,都是从允许误差(Δ)的公式推导出计算必要抽样数目(n)的公式。以成数简单随机重复抽样为例(下同),必要抽样数目的计算公式是:
关键词 允许误差 概率度 抽样误差 抽样 经济统计学原理 计算方法 抽样调查方法 计算公式 重复抽样 公式推导
在线阅读 下载PDF
中国基尼系数警戒线的一个估计 被引量:73
9
作者 徐映梅 张学新 《统计研究》 CSSCI 北大核心 2011年第1期80-83,共4页
本文基于1978-2007年我国居民收入分配的分组数据测算了多个基尼系数,采用参数和非参数多种方法估计了基尼系数的分布服从渐近正态分布,最后基于大样本渐近特征给出了我国基尼系数警戒水平的估计值。
关键词 基尼系数 分布检验 重复抽样自助法 警戒水平
在线阅读 下载PDF
汉字系统直接构件模型的建立 被引量:4
10
作者 李勇 周晓文 《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第6期554-557,共4页
对于一个汉字系统中的文字集合,构成该集合所有文字的直接构件反映汉字系统的某些结构特征.基于对汉字拆分数据的研究,提出了一个直接构件模型,用于描述汉字集合中的文字数与直接构件数之间的关系.借助于大数定律、重复抽样方法和非线... 对于一个汉字系统中的文字集合,构成该集合所有文字的直接构件反映汉字系统的某些结构特征.基于对汉字拆分数据的研究,提出了一个直接构件模型,用于描述汉字集合中的文字数与直接构件数之间的关系.借助于大数定律、重复抽样方法和非线性回归方法,分别建立了金文、小篆、汉隶和宋楷几个具有代表性的、不同时代的汉字系统直接构件关系模型. 展开更多
关键词 大数定律 重复抽样 非线性回归模型 汉字直接构件
在线阅读 下载PDF
市场调查与预测期末复习
11
作者 杨军毅 《现代远程教育研究》 1999年第9期55-61,共7页
市场调查与预测这门课程,主教材共12章,分成四个部分,同学们在复习过程中,必须注重基本理论和基本方法的掌握。下面,我们分章对本课程的重点同题进行提示。第一章绪论本章主要论述了市场的一般意义及本课程的研究对象。同学们应结合其... 市场调查与预测这门课程,主教材共12章,分成四个部分,同学们在复习过程中,必须注重基本理论和基本方法的掌握。下面,我们分章对本课程的重点同题进行提示。第一章绪论本章主要论述了市场的一般意义及本课程的研究对象。同学们应结合其它课程,掌握市场、企业的含义,了解市场调查与预测的主体与客体,及其研究的内容。 展开更多
关键词 市场调查 市场预测 预测期 调查对象 预测目标 抽样误差 预测方法 课程 重复抽样 移动平均法
在线阅读 下载PDF
市场调查与预测期末复习重点
12
作者 杨军毅 《现代远程教育研究》 1997年第12期87-96,共10页
市场调查与预测这门课程,主教材共12章,分成四个部分,同学们在复习过程中。必须注重基本理论和基本方法的掌握。下面,我们分章对本课程的重点问题进行提示。第一章绪论本章主要论述了市场的一般意义及本课程的研究对象。同学们应结合其... 市场调查与预测这门课程,主教材共12章,分成四个部分,同学们在复习过程中。必须注重基本理论和基本方法的掌握。下面,我们分章对本课程的重点问题进行提示。第一章绪论本章主要论述了市场的一般意义及本课程的研究对象。同学们应结合其它课程,掌握市场、企业的含义。了解市场调查与预测的主体与客体。及其研究的内容。第二章市场调查概述1 市场调查的含义、作用及基本要求市场调查是人们按照既定的目的。通过一定的组织程序,采用科学的方法,对商品或劳务的供销情况进行全面的或局部的了解,搜集市场信息。 展开更多
关键词 市场调查 抽样误差 市场预测 调查对象 简单随机抽样 移动平均法 预测结果 预测期 指数平滑法 重复抽样
在线阅读 下载PDF
基于不平衡数据集的机器学习算法研究 被引量:6
13
作者 刘洋 《统计与决策》 CSSCI 北大核心 2019年第12期19-21,共3页
在应用机器学习构建数据模型的过程中,经常会面临类不平衡性的问题,在许多研究中,降低数据集的不平衡性多采用欠抽样法来进行处理,再应用C4.5、NB、LR、RF、KNN等机器学习算法进行数据建模。实验结果往往表明,欠抽样法得到的模型准确度... 在应用机器学习构建数据模型的过程中,经常会面临类不平衡性的问题,在许多研究中,降低数据集的不平衡性多采用欠抽样法来进行处理,再应用C4.5、NB、LR、RF、KNN等机器学习算法进行数据建模。实验结果往往表明,欠抽样法得到的模型准确度并不尽如人意,原因是这种方法是在牺牲负样本的预测精度前提下来提高整体精度的,因此,文章试图在尽量不减少原数据集中有用信息丢失的前提下采用重复抽样法进行数据处理可以有效弥补欠抽样法所带来的信息损失,进而提高模型精度。 展开更多
关键词 不平衡数据集 机器学习 抽样 重复抽样
在线阅读 下载PDF
统计公式的转化与比较
14
作者 李德水 《统计与决策》 北大核心 1996年第2期18-19,共2页
统计公式的转化与比较李德水在统计的教学及研讨中最常见的转化是定义式和计算式的转化。如平均指标中的算术平均数与调和平均数H的定义基本公式可认为是一样的。即:为具体说明此问题,不妨设总体单位为某企业每一职工,总体为某企业... 统计公式的转化与比较李德水在统计的教学及研讨中最常见的转化是定义式和计算式的转化。如平均指标中的算术平均数与调和平均数H的定义基本公式可认为是一样的。即:为具体说明此问题,不妨设总体单位为某企业每一职工,总体为某企业全体职工,工资为数量标志,工贸总额... 展开更多
关键词 统计公式 抽样平均误差 重复抽样 调和平均数指数 算术平均数 计算公式 定义式 广播电视大学 随机抽取 样本容量
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部