期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
偏倚抽样问题的选择性评论及其在现代统计学中的应用
1
作者 秦进 《应用概率统计》 CSCD 北大核心 2024年第2期229-263,共35页
偏倚抽样是一个普遍存在的问题,跨越各个学科领域,影响着计量经济学、流行病学、医学、调查研究,以及最近的机器学习和人工智能(AI)等领域.当选择用于分析或研究的数据点引入系统性偏倚时,这种无处不在的挑战可能会影响研究结果的准确... 偏倚抽样是一个普遍存在的问题,跨越各个学科领域,影响着计量经济学、流行病学、医学、调查研究,以及最近的机器学习和人工智能(AI)等领域.当选择用于分析或研究的数据点引入系统性偏倚时,这种无处不在的挑战可能会影响研究结果的准确性和可靠性.本文的目标是全面介绍与偏倚抽样问题相关的基础概念和推理方法.此外,我们还旨在建立偏倚抽样问题与机器学习中关于分布转移问题的最新讨论之间的联系.我们还将深入探讨偏倚抽样的最新进展,特别是在转移学习和预测置信区间的符合推理方面.我们的最终目标是以一种对研究生易于理解的方式呈现这些材料,使他们能够在自己的研究工作中识别偏倚抽样问题的应用.我们怀着深深的敬意和感激之情,将本文献给已故的茆诗松教授,他多年来的指导和智慧对我们至关重要. 展开更多
关键词 偏倚抽样问题 因果推断 符合预测区间 分布转移 迁移学习 茆诗松教授的追忆
在线阅读 下载PDF
密度相关的数据流偏倚抽样
2
作者 杨宜东 孙志挥 《应用科学学报》 CAS CSCD 北大核心 2006年第2期203-207,共5页
利用数据空间动态网格划分的方法,对数据流空间的数据分布密度情况进行模拟,并在此基础上提出了一种基于密度的偏倚抽样方法.为验证该抽样方法的有效性,将其应用到数据流中的聚类挖掘,实验结果表明该算法具有良好的适用性和有效性.
关键词 数据流 偏倚抽样 聚类
在线阅读 下载PDF
基于密度偏倚抽样的局部距离异常检测方法 被引量:18
3
作者 付培国 胡晓惠 《软件学报》 EI CSCD 北大核心 2017年第10期2625-2639,共15页
异常检测是数据挖掘的重要研究领域,当前基于距离或者最近邻概念的异常数据检测方法,在进行海量高维数据异常检测时,存在运算时间过长的问题.许多改进的异常检测方法虽然提高了算法运算效率,然而检测效果欠佳.基于此,提出一种基于密度... 异常检测是数据挖掘的重要研究领域,当前基于距离或者最近邻概念的异常数据检测方法,在进行海量高维数据异常检测时,存在运算时间过长的问题.许多改进的异常检测方法虽然提高了算法运算效率,然而检测效果欠佳.基于此,提出一种基于密度偏倚抽样的局部距离异常检测算法,首先利用基于密度偏倚的概率抽样方法对所需检测的数据集合进行概率抽样,之后对抽样数据利用基于局部距离的局部异常检测方法,对抽样集合进行局部异常系数计算,得到的异常系数既是抽样数据的局部异常系数,又是数据集的近似全局异常系数.然后对得到的每个数据点的局部异常系数进行排序,异常系数值越大的数据点越可能是异常点.实验结果表明,与已有的算法相比,该算法具有更高的检测精确度和更少的运算时间,并且该算法对各种维度和数据规模的数据都具有很好的检测效果,可扩展性强. 展开更多
关键词 异常检测 局部异常系数 局部距离 密度偏倚抽样 SLDOF算法
在线阅读 下载PDF
基于正向蒙特卡罗计算的自动源偏倚方法在屏蔽计算中的应用
4
作者 邱有恒 史涛 《原子能科学技术》 EI CAS CSCD 北大核心 2019年第7期1209-1213,共5页
反应堆屏蔽计算是粒子输运数值计算的难点问题之一。由于仅有少量处于堆芯外围组件的高能中子能到达屏蔽层外,如果对源粒子采用无偏抽样,大量的计算时间用于模拟无用的源粒子,计算效率很低。偏倚抽样是提升蒙特卡罗模拟计算效率的重要途... 反应堆屏蔽计算是粒子输运数值计算的难点问题之一。由于仅有少量处于堆芯外围组件的高能中子能到达屏蔽层外,如果对源粒子采用无偏抽样,大量的计算时间用于模拟无用的源粒子,计算效率很低。偏倚抽样是提升蒙特卡罗模拟计算效率的重要途径,包含源偏倚、输运偏倚和碰撞偏倚等。 MCNP 程序的权窗发生器可为输运偏倚和碰撞偏倚提供参数,但不包含源偏倚。本文利用正向蒙特卡罗计算权窗发生器产生的重要性函数,生成源偏倚参数以及与之匹配的权窗系数,在屏蔽计算中取得了很好的效果。本文的方法与MCNP的权窗功能完全兼容,使用方便。 展开更多
关键词 深穿透 屏蔽计算 偏倚抽样 权窗
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部