期刊文献+
共找到131篇文章
< 1 2 7 >
每页显示 20 50 100
Bootstrap抽样下基于贝叶斯估计的地震人员死亡评估研究
1
作者 赵煜 魏毛毛 +2 位作者 孙艳萍 史一彤 陈文凯 《地震研究》 北大核心 2025年第1期132-140,共9页
选取1950-2022年中国内地地区历史震例数据信息,以极震区烈度、发震时间及人口密度为主要影响因素,建立三级场景,运用Bootstrap抽样方法对各场景下的历史震例进行扩充,进而采用贝叶斯估计给出不同场景下地震人员死亡变化分布函数,再根... 选取1950-2022年中国内地地区历史震例数据信息,以极震区烈度、发震时间及人口密度为主要影响因素,建立三级场景,运用Bootstrap抽样方法对各场景下的历史震例进行扩充,进而采用贝叶斯估计给出不同场景下地震人员死亡变化分布函数,再根据实际情况对此分布函数进行截断分析,以明确地震人员死亡的不确定性变化范围及死亡率区间概率值,最后随机选取历史地震灾害事件验证模型精度。结果表明:①各场景的死亡率均值及95%死亡率区间基本符合在极震区烈度相等并且人口密度条件下夜间死亡率大于白天死亡率的规律;②模型估计死亡人数区间能够较好覆盖实际上报的死亡人数。 展开更多
关键词 地震 人员死亡 bootstrap抽样 贝叶斯估计 死亡率
在线阅读 下载PDF
规模以下工业调查的分层二重抽样方法研究
2
作者 沈文静 杨贵军 邸梦婷 《统计与信息论坛》 北大核心 2025年第7期3-16,共14页
规模以下工业调查所提供的经营活动指标对于工业统计至关重要。国家现行方案依据最新经济普查数据构建双重抽样框,从中抽取固定样本连续调查多年,以构造非经济普查年规模以下工业经营活动指标的HT估计量。目前,规模以下工业单位流动性... 规模以下工业调查所提供的经营活动指标对于工业统计至关重要。国家现行方案依据最新经济普查数据构建双重抽样框,从中抽取固定样本连续调查多年,以构造非经济普查年规模以下工业经营活动指标的HT估计量。目前,规模以下工业单位流动性高且变动频繁,将直接影响固定样本对非经济普查年目标总体的代表性。因此,提出在非经济普查年,采用基于双重抽样框的分层二重抽样方法。每年度先抽取一个大样本用于估计规模以下工业总体的新增率、消亡率以及规模大小。再利用一个较小的第二重样本进行实际调查,并结合由第一重样本所得数据优化的抽样权数,最终给出规模以下工业总体总量估计。推导其抽样偏差和方差,构造基于刀切法的方差估计量。针对非经济普查年规模以下工业营业收入总额的估计,验证了新方法相较于现行固定样本HT估计量的精度更高。该研究有助于提高非经济普查年规模以下工业调查经营活动指标估计的可靠性,并为相关调查方案设计提供理论依据。 展开更多
关键词 非经济普查年 规模以下工业调查 分层二抽样 抽样方差 抽样 HT估计量
在线阅读 下载PDF
经验似然重抽样下回归模型的Bootstrap逼近(英文) 被引量:1
3
作者 石坚 《应用概率统计》 CSCD 北大核心 1997年第1期37-44,共8页
本文提出用经验似然重抽样来bootstrap逼近线性回归模型中的学生化最小二乘估计.我们证明了该方法具有一般s-2项Edgeworth展开,它是二阶相合的而且比经典的方法损失更小.
关键词 经验似然抽样 回归模型 bootstrap逼近
在线阅读 下载PDF
重尾时间序列环境下持久性变点的稳健检验
4
作者 白学 金浩 +1 位作者 杨云锋 苏梦琳 《应用概率统计》 北大核心 2025年第1期116-135,共20页
本文通过构造基于M估计的Ratio双侧检验统计量,研究了方差无穷重尾序列持久性变点检验.证明了在原假设下统计量的渐近分布是布朗运动的泛函,与尾指数无关,并得到备择假设下统计量的相合性.利用Bootstrap抽样方法逼近原假设下统计量的渐... 本文通过构造基于M估计的Ratio双侧检验统计量,研究了方差无穷重尾序列持久性变点检验.证明了在原假设下统计量的渐近分布是布朗运动的泛函,与尾指数无关,并得到备择假设下统计量的相合性.利用Bootstrap抽样方法逼近原假设下统计量的渐近分布以获取精确的临界值.数值模拟结果表明基于M估计的Ratio检验具有良好的经验水平,没有出现显著的扭曲,且相比基于最小二乘估计的检验明显的提高了经验势,尤其是在观察序列尾部特征越厚的情况下.最后通过一组黄金ETF波动率指数数据进一步验证了本文所提方法的有效性和可行性. 展开更多
关键词 持久性变点 尾序列 M估计 Ratio双侧检验 bootstrap
在线阅读 下载PDF
基于样本权重的不平衡数据欠抽样方法 被引量:44
5
作者 熊冰妍 王国胤 邓维斌 《计算机研究与发展》 EI CSCD 北大核心 2016年第11期2613-2622,共10页
现实世界中广泛存在不平衡数据,其分类问题是数据挖掘和机器学习的一个研究热点.欠抽样是处理不平衡数据集的一种常用方法,其主要思想是选取多数类样本中的一个子集,使数据集的样本分布达到平衡,但其容易忽略多数类中部分有用信息.为此... 现实世界中广泛存在不平衡数据,其分类问题是数据挖掘和机器学习的一个研究热点.欠抽样是处理不平衡数据集的一种常用方法,其主要思想是选取多数类样本中的一个子集,使数据集的样本分布达到平衡,但其容易忽略多数类中部分有用信息.为此提出了一种基于样本权重的欠抽样方法KAcBag(K-means AdaCost bagging),该方法引入了样本权重来反映样本所处的区域,首先根据各类样本的数量初始化各样本权重,并通过多次聚类对各个样本的权重进行修改,权重小的多数类样本即处于多数类的中心区域;然后按权重大小对多数类样本进行欠抽样,使位于中心区域的样本较容易被抽中,并与所有少数类样本组成bagging成员分类器的训练数据,得到若干个决策树子分类器;最后根据各子分类器的正确率进行加权投票生成预测模型.对19组UCI数据集和某电信运营商客户换机数据进行了测试实验,实验结果表明:KAcBag方法使抽样所得的样本具有较强的代表性,能有效提高少数类的分类性能并缩小问题规模. 展开更多
关键词 不平衡数据 抽样 样本权 聚类 集成学习
在线阅读 下载PDF
数据挖掘方法应用于调查数据的抽样权重问题——基于放回比例抽样的再抽样方法 被引量:4
6
作者 谢佳斌 金勇进 谢邦昌 《统计研究》 CSSCI 北大核心 2009年第4期101-104,共4页
在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题。本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现"事后"自加权设计。实现"事后"自加权设计后的子样本可忽略... 在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题。本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现"事后"自加权设计。实现"事后"自加权设计后的子样本可忽略掉样本权数,直接采用常规的图示方法和数据挖掘算法进行分析。随后,基于2007中国公民科学素质调查贵州省数据,通过模拟分析讨论了PPWWR再抽样子样本的样本量问题,发现max(n,5%N)是一个比较合适的样本量。这一结论可能为其他大型复杂抽样调查数据的数据挖掘实施问题提供借鉴。 展开更多
关键词 调查数据 抽样 数据挖掘 PPWWR再抽样
在线阅读 下载PDF
重抽样优化的快速随机抽样一致性算法 被引量:12
7
作者 肖春宝 冯大政 冯祥卫 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2016年第4期607-614,共8页
为了快速、准确地对含有高比例外点的数据进行模型参数估计,提出一种重抽样优化的快速RANSAC算法.首先在模型检验之前增设预检验,并采用一种基于样条曲线的损失函数来评价模型的质量;然后通过反复重抽样和模型检验来优化内点集;再依据... 为了快速、准确地对含有高比例外点的数据进行模型参数估计,提出一种重抽样优化的快速RANSAC算法.首先在模型检验之前增设预检验,并采用一种基于样条曲线的损失函数来评价模型的质量;然后通过反复重抽样和模型检验来优化内点集;再依据双阈值对内点集进行渐近提纯;最后利用最优内点集来计算模型的参数.特征匹配和基础矩阵估计的实验结果表明,该算法具有较高的精度和效率;当外点比例高于50%时,运行速度比传统算法提高大于2个数量级. 展开更多
关键词 参数估计 随机抽样-致性 抽样优化 模型预检验 损失函数
在线阅读 下载PDF
舍选抽样与采样重要性重抽样算法的比较 被引量:6
8
作者 王丙参 魏艳华 孙永辉 《统计与决策》 CSSCI 北大核心 2014年第21期9-13,共5页
文章比较研究了舍选法和重要性重抽样(SIR)算法生成随机数的理论基础,给出了二者的区别与联系,特别讨论了压挤舍选抽样和自适应舍选抽样,并给出了包络函数和重要性抽样函数的选择标准,探讨二者对随机数生成速度和质量的影响。
关键词 舍选法 要性抽样 接受概率 包络函数
在线阅读 下载PDF
基于三阶段Bootstrap EBM的异质性合作社效率评价研究:重庆例证 被引量:4
9
作者 杨丹 黄凤 刘自敏 《东北师大学报(哲学社会科学版)》 CSSCI 北大核心 2015年第6期73-81,共9页
基于对传统DEA模型距离函数特征、决策单元异质性及评价结果稳健性等方面的缺陷,构建三阶段Bootstrap EBM方法。利用重庆市合作社调查的随机抽样调查数据,分析了合作社所处的外部环境变量对各类投入值的不同影响,对比分析了基于EBM距离... 基于对传统DEA模型距离函数特征、决策单元异质性及评价结果稳健性等方面的缺陷,构建三阶段Bootstrap EBM方法。利用重庆市合作社调查的随机抽样调查数据,分析了合作社所处的外部环境变量对各类投入值的不同影响,对比分析了基于EBM距离函数的环境变量调整前后评价效率以及Bootstrap EBM调整前后的效率值及其置信区间的差异,并对比分析了不同类型合作社的效率值差异,最后基于更为准确与客观的效率评价值,有针对性地提出准确衡量及提高合作社效率的政策建议。 展开更多
关键词 异质性 合作社 EBM距离函数 三阶段DEA后一个 bootstrap抽样 置信区间
在线阅读 下载PDF
融合过抽样和欠抽样的不平衡数据重抽样方法 被引量:15
10
作者 吴磊 房斌 +2 位作者 刁丽萍 陈静 谢娜娜 《计算机工程与应用》 CSCD 2013年第21期172-176,185,共6页
在机器学习领域的研究当中,分类器的性能会受到许多方面的影响,其中训练数据的不平衡对分类器的影响尤为严重。训练数据的不平衡也就是指在提供的训练数据集中,一类的样本总数远多于另一类的样本总数。常用的不平衡数据的处理方法有很多... 在机器学习领域的研究当中,分类器的性能会受到许多方面的影响,其中训练数据的不平衡对分类器的影响尤为严重。训练数据的不平衡也就是指在提供的训练数据集中,一类的样本总数远多于另一类的样本总数。常用的不平衡数据的处理方法有很多,只探讨利用重抽样方法对不平衡数据进行预处理来提高分类效果的方法。数据抽样算法有很多,但可以归为两大类:过抽样和欠抽样。针对二分类问题提出了四种融合过抽样和欠抽样算法的重抽样方法:BSM+Tomek、BSM+ENN、CBOS+Tomek和CBOS+ENN,并且与另外十种经典的重抽样算法做了大量的对比实验,实验证明提出的四种预处理算法在多种评价指标下提高了不平衡数据的分类效果。 展开更多
关键词 不平衡数据 抽样 基于聚类的过抽样算法(CBOS) 基于边界值的虚拟少数类向上采样算法(BSM) 可选择最 近邻算法(ENN) Tomek LINKS 预处理
在线阅读 下载PDF
基于Bootstrap抽样的多元过程能力指数估计 被引量:3
11
作者 田志友 田澎 王浣尘 《管理工程学报》 CSSCI 2006年第2期74-77,共4页
过程能力指数主要用于定量描述加工过程满足技术规格要求的能力,目前普遍使用的能力指数如Cp、Cpk、Cpm等主要针对单一质量特性,关于多元质量特性的过程能力指数尚未得到很好地解决。本文首先对多元过程能力指数的发展情况做一总结,指... 过程能力指数主要用于定量描述加工过程满足技术规格要求的能力,目前普遍使用的能力指数如Cp、Cpk、Cpm等主要针对单一质量特性,关于多元质量特性的过程能力指数尚未得到很好地解决。本文首先对多元过程能力指数的发展情况做一总结,指出现存的若干问题,然后在单变量过程服从正态分布的假设下,利用单一质量特性加工过程的差异系数,对单变量过程能力指数进行加权处理,得到多元过程能力指数的计算公式。然后基于Bootstrap抽样技术,对多元过程能力指数的统计分布进行仿真处理,获得了多元能力指数的经验分布及其大致的置信区间,从而为有效进行多元质量特性加工过程分析提供了概率依据。最后以某曲轴加工过程为例给出了应用案例。 展开更多
关键词 多元过程能力指数 差异系数 置信区间 bootstrap抽样
在线阅读 下载PDF
Bootstrap方法在渔业捕捞分层抽样调查中的应用分析 被引量:1
12
作者 张寒野 沈振华 +3 位作者 杨建忠 曹萍 谢营梁 陈恩友 《海洋渔业》 CSCD 北大核心 2014年第1期57-62,共6页
应用Bootstrap方法,对太湖捕捞渔业抽样调查参数估计进行研究,探讨分层抽样调查在捕捞产量统计中的应用。随机抽样模拟的结果表明,有放回的Bootstrap方法适用于抽样比例较小的分层抽样调查。对于总体分布未知且样本量容量有限的情况下... 应用Bootstrap方法,对太湖捕捞渔业抽样调查参数估计进行研究,探讨分层抽样调查在捕捞产量统计中的应用。随机抽样模拟的结果表明,有放回的Bootstrap方法适用于抽样比例较小的分层抽样调查。对于总体分布未知且样本量容量有限的情况下分层抽样调查的方差估计,重权Bootstrap方法相比其它方法具有明显的优势,适合用于渔业抽样调查工作。 展开更多
关键词 bootstrap 分层抽样 渔业统计
在线阅读 下载PDF
关于利用重要抽样法控制蒙特卡罗方差的比较 被引量:2
13
作者 王丙参 魏艳华 孙永辉 《统计与决策》 CSSCI 北大核心 2015年第9期78-81,共4页
给出了利用重要性抽样控制M-C方差的方法及其评价标准——有效样本大小,从理论上证明了其合理性,比较研究了重要性抽样函数对方差的影响并给出了改进方法,与采样重要重抽样相比,重要抽样算法抽样相对复杂些,但估计精度远远高于采样重要... 给出了利用重要性抽样控制M-C方差的方法及其评价标准——有效样本大小,从理论上证明了其合理性,比较研究了重要性抽样函数对方差的影响并给出了改进方法,与采样重要重抽样相比,重要抽样算法抽样相对复杂些,但估计精度远远高于采样重要重抽样,最后结合实例验证了前面结论,模拟结果显示,重要性抽样有效、可靠,特别适合模拟小概率事件。 展开更多
关键词 蒙特卡罗方差 要性抽样 采样抽样 有效样本大小
在线阅读 下载PDF
基于Bootstrap方法的重尾相依序列均值变点Ratio检验 被引量:3
14
作者 金浩 高奎 张思 《统计与决策》 CSSCI 北大核心 2019年第23期11-16,共6页
文章提出了一个改进的Ratio统计量来检测方差无穷重尾相依序列中可能存在的均值变点。基于广义泛函中心极限定理,在原假设下得到统计量的渐近分布,并在备择假设下证明了该检验的一致性。针对重尾指数未知且难以估计的特点,应用Bootstra... 文章提出了一个改进的Ratio统计量来检测方差无穷重尾相依序列中可能存在的均值变点。基于广义泛函中心极限定理,在原假设下得到统计量的渐近分布,并在备择假设下证明了该检验的一致性。针对重尾指数未知且难以估计的特点,应用Bootstrap重抽样方法确定了统计量渐近分布的临界值。数值模拟结果表明:Ratio检验不仅能很好地控制经验水平,而且相比已有的均值变点检验方法,经验势也有较·明显的提高. 展开更多
关键词 尾序列 均值变点 Ratio统计量 bootstrap 渐近分布
在线阅读 下载PDF
Bootstrap再抽样方法的SAS程序设计 被引量:1
15
作者 闫宇翔 王洪源 孙尚拱 《中国卫生统计》 CSCD 北大核心 2003年第5期320-320,共1页
关键词 bootstrap抽样方法 SAS程序 设计 医学统计
在线阅读 下载PDF
重尾扰动下近非平稳自回归模型的Bootstrap推断 被引量:1
16
作者 傅可昂 李杰 黄炜 《高校应用数学学报(A辑)》 CSCD 北大核心 2012年第3期274-282,共9页
考虑近非平稳一阶自回归模型,X_t=θ_nX_t-1+υ_t,其中θ_n=1-γ/n,γ为一固定常数,{υ_t}为一重尾随机扰动项,对θ_n及其最小二乘估计θ_n,采用bootstrap再抽样方法逼近θ_n-θ_n的分布,并证明了该再抽样方法的渐近有效性。
关键词 近非平稳 自回归 bootstrap抽样
在线阅读 下载PDF
基于样本数据重抽样的时序数据预报方法 被引量:3
17
作者 郝善勇 刘玉树 《北京理工大学学报》 EI CAS CSCD 2000年第5期581-584,共4页
研究时序数据预报和提高预报精度的方法 .提出一种新的利用误差项对时序数据样本进行 Boot Strap重抽样的方法 .该方法采用神经网络技术建立时序数据预报模型 ,并通过重抽样技术提高预报精度 .通过 Boot Strap算法与 BP算法的预报偏差... 研究时序数据预报和提高预报精度的方法 .提出一种新的利用误差项对时序数据样本进行 Boot Strap重抽样的方法 .该方法采用神经网络技术建立时序数据预报模型 ,并通过重抽样技术提高预报精度 .通过 Boot Strap算法与 BP算法的预报偏差平方和比较说明 Boot Strap算法提高了预报精度 .将提出的重抽样技术引入时序数据预测中 ,可提高神经网络的预测精度 。 展开更多
关键词 时序数据预报 抽样 神经网络 样本数据
在线阅读 下载PDF
Bootstrap方法在复杂抽样中的应用 被引量:4
18
作者 郑京平 《统计研究》 1987年第1期55-60,共6页
一、Bootstrap方法简介Bootstrap方法是美国统计学家Bradley·Efron在1979年提出的一种处理非参数统计推断问题的方法。它的一般提法是:已知来自总体(Y,(?),F)的简单随机样本Y<sub>n</sub>=(y<sub>1</sub... 一、Bootstrap方法简介Bootstrap方法是美国统计学家Bradley·Efron在1979年提出的一种处理非参数统计推断问题的方法。它的一般提法是:已知来自总体(Y,(?),F)的简单随机样本Y<sub>n</sub>=(y<sub>1</sub>,y<sub>2</sub>,…,Y<sub>n</sub>),其中F是一未知的分布函数。设R(Y<sub>n</sub>,F)是我们感兴趣的样本函数,我们欲得到R(Y<sub>n</sub>,f)的某些信息,如:R(Y<sub>n</sub>,F)的分布函数、E<sub>F</sub>R、Var<sub>F</sub>R或P<sub>F</sub>(R【2)等等;下标F表示在分布函数F下求期望、方差或概率。所谓Bootstrap方法,就是用样本Y<sub>n</sub>构造出F的极大似然估计(?)<sub>n</sub>(一般就用样本Y<sub>n</sub>的经验分布函数F<sub>n</sub>来近似);然后,从F<sub>n</sub>中抽出大小为n的简单随机样本Y<sub>n</sub><sup>*</sup>=(Y<sub>1</sub><sup>*</sup>,Y<sub>2</sub><sup>*</sup>, 展开更多
关键词 bootstrap方法 复杂抽样 估计量 bootstrap估计 简单随机样本 方差估计 经验分布函数 概率抽样 蒙特卡洛 总体均值
在线阅读 下载PDF
一种基于B样条曲面的深度图像重抽样方法 被引量:1
19
作者 李松涛 张长水 +2 位作者 荣钢 边肇祺 Zhao Dong ming 《计算机学报》 EI CSCD 北大核心 2000年第11期1166-1170,共5页
针对深度图像处理中由于等角测距造成的几何失真 ,根据非等网格深度数据的数值特点 ,文中提出了一种基于 B样条曲面的深度图像重抽样方法 ,并且与其它一些三维插值方法进行了精度比较 .该文利用真实深度图像进行了重抽样实验 ,结果表明 ... 针对深度图像处理中由于等角测距造成的几何失真 ,根据非等网格深度数据的数值特点 ,文中提出了一种基于 B样条曲面的深度图像重抽样方法 ,并且与其它一些三维插值方法进行了精度比较 .该文利用真实深度图像进行了重抽样实验 ,结果表明 ,基于 B样条曲面的重抽样方法有效地克服了原始图像数据中存在的几何失真以及测量噪声 ,为后续的三维表面处理提供了更为精确的三维网格深度数据 . 展开更多
关键词 深度图像 B样条曲面 深度图像抽样 图像处理
在线阅读 下载PDF
面向网络入侵检测的FHNN重抽样方法 被引量:1
20
作者 赵月爱 陈俊杰 吕伟 《计算机工程》 CAS CSCD 北大核心 2011年第8期135-136,139,共3页
为提高网络入侵检测系统的检测效率、降低数据的不平衡程度,在分析现有重抽样方法的基础上,根据网络入侵检测数据集的特点,提出快速分层最近邻(FHNN)重抽样方法,并在KDD’99数据集上进行实验验证。结果显示,该方法可以较好地删除噪声数... 为提高网络入侵检测系统的检测效率、降低数据的不平衡程度,在分析现有重抽样方法的基础上,根据网络入侵检测数据集的特点,提出快速分层最近邻(FHNN)重抽样方法,并在KDD’99数据集上进行实验验证。结果显示,该方法可以较好地删除噪声数据和冗余信息,减小数据的不平衡度和样本总量,而且运行速度快,适用于海量数据中的各类攻击检测。 展开更多
关键词 抽样方法 非平衡数据 网络入侵检测 NCL算法 ADABOOST算法
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部