期刊文献+
共找到516篇文章
< 1 2 26 >
每页显示 20 50 100
基于高斯混合模型双向聚类重采样和随机森林构建DLBCL早期复发预测模型 被引量:1
1
作者 王俊霞 张岩波 +9 位作者 余红梅 曹红艳 周洁 乔宇 张高源 于凯 王雪嫚 郭玉娇 赵志强 罗艳虹 《中国卫生统计》 北大核心 2025年第1期7-11,17,共6页
目的应用一种可以同时解决少数类和多数类类间和类内不平衡问题的类别不平衡处理方法,并将其与随机森林(random forest,RF)分类器结合实现对弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)患者早期复发的预测,为DLBLC患者的... 目的应用一种可以同时解决少数类和多数类类间和类内不平衡问题的类别不平衡处理方法,并将其与随机森林(random forest,RF)分类器结合实现对弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)患者早期复发的预测,为DLBLC患者的治疗提供参考。方法首先使用一种基于高斯混合模型双向聚类重采样的类别不平衡处理方法(Gaussian mixture model,GMM-GMM)处理数据,并与随机过采样(random over sampling,ROS)、合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)、Borderline-1 SMOTE、Borderline-2 SMOTE、GMM上采样、GMM下采样、SMOTE+RUS、SMOTE+GMM和GMM+RUS进行比较,然后以RF作为分类器验证10种类别不平衡方法的性能,之后为验证RF的性能,在处理后的数据集上使用logistic回归和决策树(decision tree,DT)作为对照,最后从区分度和校准度两方面对模型进行评价。结果在本文所有模型中,采用GMM-GMM的RF模型取得了相对最优的分类性能(accuracy=0.79,AUC=0.87,sensitivity=0.71,specificity=0.87,G-means=0.79,MSE=0.21)。结论GMM-GMM优于其他传统的重采样方法,结合RF用于DLBCL患者早期复发的预测取得了相对较好的分类结果,可以很好地实现对DLBCL患者早期复发的预测。 展开更多
关键词 类别不平衡 高斯混合模型聚类重采样 随机森林 复发预测 弥漫大B细胞淋巴瘤
在线阅读 下载PDF
一种基于KNN和随机仿射的边界样本合成过采样方法 被引量:1
2
作者 冷强奎 孙薛梓 孟祥福 《智能系统学报》 北大核心 2025年第2期329-343,共15页
过采样是处理不平衡数据分类问题的有效策略。本文提出了一种基于K近邻(K-nearest neighbor,KNN)和随机仿射的边界样本合成过采样方法,用于改进现有过采样方法的种子样本选择阶段和合成样本生成阶段。首先,引入三近邻理论,建立样本间有... 过采样是处理不平衡数据分类问题的有效策略。本文提出了一种基于K近邻(K-nearest neighbor,KNN)和随机仿射的边界样本合成过采样方法,用于改进现有过采样方法的种子样本选择阶段和合成样本生成阶段。首先,引入三近邻理论,建立样本间有效的内在近邻关系,并去除数据集中的噪声,以降低后续分类器的过拟合风险。其次,准确识别那些难以学习且包含丰富信息的少数类边界样本,并将其用作采样种子。最后,利用局部随机仿射代替线性插值机制,在原始数据的近似流形中均匀地生成合成样本。相比于传统过采样方法,本文方法能更充分挖掘数据集中的重要边界信息,从而为分类器提供更多辅助以改善其分类性能。在18个基准数据集上,与8种经典采样方法(结合4种不同分类器)进行了大量对比实验。结果表明,本文所提方法获得了更高的F1分数和几何均值(G-mean),可以更为有效地解决不平衡数据分类问题。此外,统计分析也证实该方法具有更高的弗里德曼排名(Friedman ranking)。 展开更多
关键词 K近邻 线性插值 边界样本 自然分布 过采样 三近邻理论 随机仿射变换 不平衡分类
在线阅读 下载PDF
基于混合采样和随机森林的重过载配变识别
3
作者 李金富 姚雪梅 +2 位作者 李发春 吉云海 胡文俊 《农村电气化》 2025年第9期25-30,共6页
受节假日、人员返乡、季节等特殊时段和配网规划、运行因素的影响,配电变压器重过载较难准确预测。针对电网实际数据采集过程中正常运行和重过载配电变压器样本比例不平衡问题导致机器学习算法无法有效辨识重过载样本,提出一种基于混合... 受节假日、人员返乡、季节等特殊时段和配网规划、运行因素的影响,配电变压器重过载较难准确预测。针对电网实际数据采集过程中正常运行和重过载配电变压器样本比例不平衡问题导致机器学习算法无法有效辨识重过载样本,提出一种基于混合采样和随机森林的重过载配变辨识方法。首先,对正常运行样本进行聚类分层欠采样,对重过载配变样本进行SMOTETomek采样,缩小样本分布差距。其次,使用采样后的数据集训练随机森林模型。实验结果证明,混合采样能提高分类算法的性能。 展开更多
关键词 配电变压器 重过载 聚类分层欠采样 SMOTETomek采样 随机森林
在线阅读 下载PDF
基于双采样随机森林的临滑阶段的预测算法:以湖北黄石5号铁矿石治理地块为例 被引量:2
4
作者 郭明娟 徐哈宁 +3 位作者 肖慧 范凌峰 胡佳超 游丝露 《科学技术与工程》 北大核心 2024年第14期5733-5741,共9页
针对碎石土边坡监测过程中滑坡稳定变形期与临滑阶段监测数据量严重不匹配,导致临滑阶段数据量偏小,从而产生的非平衡数据集造成预判不准确的问题,提出了一种基于DST随机森林的碎石土边坡临滑阶段地表位移的预测算法。首先,采用过采样... 针对碎石土边坡监测过程中滑坡稳定变形期与临滑阶段监测数据量严重不匹配,导致临滑阶段数据量偏小,从而产生的非平衡数据集造成预判不准确的问题,提出了一种基于DST随机森林的碎石土边坡临滑阶段地表位移的预测算法。首先,采用过采样和欠采样相结合的双采样技术(double sampling technique,DST)对地表位移中的非平衡数据集进行采集,然后,通过随机森林预测算法有放回的随机抽样进行预测,最后,通过实验得出预测结果。结果表明:DST随机森林预测算法相比于普通随机森林预测算法预测误差率降低到3.39%,证明双采样技术(DST)采集临滑阶段非平衡数据集的必要性。 展开更多
关键词 碎石土边坡 临滑阶段 地表位移 随机森林 非平衡数据集 采样技术
在线阅读 下载PDF
基于降方差采样策略的随机重构法 被引量:1
5
作者 赵光耀 杨明磊 钱锋 《化工学报》 EI CSCD 北大核心 2024年第5期1939-1950,共12页
在随机重构法的采样过程中,每个结构特征需要的采样数量是不相等且变化的。为了将拉丁超立方采样用于降低随机重构模型的方差,基于随机重构法采样过程的特征和拉丁超立方采样原理,提出了适用于随机重构法的新型拉丁超立方采样方法,探究... 在随机重构法的采样过程中,每个结构特征需要的采样数量是不相等且变化的。为了将拉丁超立方采样用于降低随机重构模型的方差,基于随机重构法采样过程的特征和拉丁超立方采样原理,提出了适用于随机重构法的新型拉丁超立方采样方法,探究了在多种分子数量设定情况下应用该方法对随机重构模型的方差和精度的影响。结果表明,应用该方法能够显著降低随机重构模型的方差,提高模型的精度,在分子数量为1000~50000范围内,新模型的标准差相较传统模型降低了71.36%~74.53%,目标函数值降低了1.69%~13.82%。综合模型精度和模拟过程的运算开销,选择4000~6000作为新模型最优的分子数量设定。 展开更多
关键词 随机重构法 新型拉丁超立方采样 方差 模拟 Monte Carlo模拟
在线阅读 下载PDF
基于集成重要性采样的随机梯度下降算法
6
作者 张浩 鲁淑霞 《南京理工大学学报》 CAS CSCD 北大核心 2024年第3期342-350,共9页
许多机器学习和深度学习问题都可以使用随机梯度优化算法求解,目前流行的算法大多通过均匀采样从样本集中抽取样本计算梯度估计。然而,随机采样的梯度估计会带来较大的方差,这个方差会随着优化的进行而累积,降低算法收敛速度。为缓解这... 许多机器学习和深度学习问题都可以使用随机梯度优化算法求解,目前流行的算法大多通过均匀采样从样本集中抽取样本计算梯度估计。然而,随机采样的梯度估计会带来较大的方差,这个方差会随着优化的进行而累积,降低算法收敛速度。为缓解这一现象,可以为每个样本赋予不同的采样概率。该文基于集成学习的思想,提出了一种新的选取非均匀采样分布的算法。算法的主要目的是选取一个采样器权重,使梯度估计的方差尽可能小。所提算法由多个简单采样器组成,采样权重为每个简单采样器分配贡献权重,从而得到最终的采样分布。集成重要性采样算法可以和以往的随机梯度优化方法任意结合,该文给出了使用集成重要性采样的随机梯度下降算法。在试验中,可以直观地看到算法起效的原因。在真实数据集中,展示了所提算法减小方差的效果,与其他算法相比具有一定优势。 展开更多
关键词 集成学习 重要性采样 采样 随机梯度下降 方差减少
在线阅读 下载PDF
基于优化负样本采样策略的梯度提升决策树与随机森林的汶川同震滑坡易发性评价 被引量:28
7
作者 郭衍昊 窦杰 +3 位作者 向子林 马豪 董傲男 罗万祺 《地质科技通报》 CAS CSCD 北大核心 2024年第3期251-265,共15页
强震诱发的滑坡具有数量多、分布广、规模大等特点,严重威胁人民生命财产安全。滑坡易发性评价能够快速预测灾害空间分布,对于减轻震后灾害的危险性具有重要意义。在同震滑坡易发性评价研究中,如何选取滑坡负样本并通过耦合机器学习模... 强震诱发的滑坡具有数量多、分布广、规模大等特点,严重威胁人民生命财产安全。滑坡易发性评价能够快速预测灾害空间分布,对于减轻震后灾害的危险性具有重要意义。在同震滑坡易发性评价研究中,如何选取滑坡负样本并通过耦合机器学习模型提高评价精度的对比研究仍需进一步研究。以山区汶川地震诱发的滑坡为研究区,首先选取地形地貌、地质环境、地震参数等10个滑坡评价因子,分析滑坡空间分布规律;其次因子共线性分析检验数据冗余,接下来采用频率比法(FR)选取极低、低易发区滑坡负样本点的采样策略;最后采用基于决策树演化改进的梯度提升决策树(GBDT)、随机森林(RF)和耦合模型(FR-GBD与FR-RF),开展了基于机器学习的同震滑坡易发性区划并进行精度评价。研究结果表明:①滑坡空间分布受到多层级因子控制;②模型预测精度为:FR-RF(AUC=0.943)>FR-GBDT(AUC=0.926)>RF(AUC=0.901)>GBDT(AUC=0.856);③在低易发区选择滑坡负样本可以明显提高易发性精度。研究成果可为滑坡易发性中负样本的选择和评价模型构建提供参考同时也为震后滑坡的防灾减灾提供理论支持。 展开更多
关键词 随机森林(RF) 梯度提升决策树(GBDT) 机器学习 频率比法(FR) 采样策略 同震滑坡 滑坡易发性区划
在线阅读 下载PDF
局部平均随机过程随机场采样定理
8
作者 张硕 《工程数学学报》 CSCD 北大核心 2024年第1期88-110,共23页
随机信号采样定理的相关研究几十年来一直是采样定理主流方向之一,在理论和实际应用两方面都受到信息领域和数学领域的广泛关注。近年来,采样理论在随机过程和随机场的局部平均采样方面得出了一系列研究成果。首先,分析了采样定理在应... 随机信号采样定理的相关研究几十年来一直是采样定理主流方向之一,在理论和实际应用两方面都受到信息领域和数学领域的广泛关注。近年来,采样理论在随机过程和随机场的局部平均采样方面得出了一系列研究成果。首先,分析了采样定理在应用中的缺陷和局限性。其次,对近几年在随机过程、高维随机过程、随机场、时空随机场局部平均采样定理方面的发展和相关结论做了系统介绍。最后,对基于混合范数的时空随机场采样逼近、采样形式、信号形式、范数形式等问题进行了展望。结果表明:局部平均的采样方式提高了采样的精度和逼近效果,随机场局部平均采样理论在海浪参数反演和海洋污染监测方面有重要应用。特别是基于混合范数的时空随机场采样理论的研究不仅具有重要的理论价值,而且对于工程领域也有应用价值。 展开更多
关键词 随机过 采样定理 局部平均采样 随机 时空随机
在线阅读 下载PDF
整数上离散高斯采样算法实现中的安全参数估计
9
作者 沈静 杨欣 杜育松 《工程数学学报》 北大核心 2025年第5期918-934,共17页
整数上的离散高斯采样是实现基于格的密码(格密码)体制的基础构建之一。一般可采用Knuth-Yao采样或逆采样方法来设计采样算法。由于这类算法实现的是对近似离散高斯分布的采样,一个关键问题是先要计算近似分布和理想分布之间的Rény... 整数上的离散高斯采样是实现基于格的密码(格密码)体制的基础构建之一。一般可采用Knuth-Yao采样或逆采样方法来设计采样算法。由于这类算法实现的是对近似离散高斯分布的采样,一个关键问题是先要计算近似分布和理想分布之间的Rényi散度,并确定出尾切界和概率精度,从而平衡采样效率和格密码体制的安全性。然而,Rényi散度又依赖尾切界和概率精度,计算时需要进行参数预设,并反复检查散度值是否达到安全性上界。通过对整数上离散高斯分布的Rényi散度进一步的理论分析,提出使用估计公式直接计算得到尾切界和概率精度的方式,并分别给出尾切界和概率精度估计公式。使用估计公式不需要进行预设,也无需使用高精度浮点运算,只需要输入关键参数并计算一次即可确定出合适的尾切界和概率精度,极大简化了尾切界和概率精度的确定过程,有助于离散高斯采样算法的实现。公式估计结果和达到安全性要求的最小结果之间的比较表明,对于取值在2到50之间的参数σ,使用估计公式获得的尾切界与达到安全性要求的最小尾切界之差不超过1.0,使用估计公式获得的概率精度与达到安全性要求的最小精度之差在5比特内,估计效果优良。 展开更多
关键词 格密码 随机数生成 离散高斯采样 采样 Knuth-Yao采样 Rényi散度
在线阅读 下载PDF
基于SMOTE辅助分区误差控制的随机森林土壤重金属含量预测模型 被引量:1
10
作者 陈敏 董泽馨 +3 位作者 秦莉 张晨晨 张彦儒 孙思佳 《农业资源与环境学报》 北大核心 2025年第3期580-591,共12页
土壤中重金属空间分布的准确预测是制定科学合理的土地利用规划以及构建有效风险管理措施的关键环节。本研究旨在探索一种结合合成少数类过采样技术(SMOTE)和分区误差控制混合策略的随机森林(RF)模型,利用长株潭(长沙市、株洲市和湘潭市... 土壤中重金属空间分布的准确预测是制定科学合理的土地利用规划以及构建有效风险管理措施的关键环节。本研究旨在探索一种结合合成少数类过采样技术(SMOTE)和分区误差控制混合策略的随机森林(RF)模型,利用长株潭(长沙市、株洲市和湘潭市)区域8种重金属元素(As、Cd、Cr、Cu、Hg、Ni、Pb和Zn)及29项环境辅助变量数据,开展区域土壤重金属空间预测精度比较研究。将本研究构建的模型与全区及分区随机森林建模方法进行了比较分析,同时,也与三种经典地统计学方法——普通克里金(OK)、协同克里金(CK)和反距离加权法(IDW)进行了对比。结果表明:相较于全区建模方法,本研究构建的模型在预测Cd、Cr、Hg、Ni、Pb和Zn 6种重金属含量的R^(2)值提升了15.87%~35.39%;与分区建模方法相比,所有8种重金属的预测精度也有了显著提高,R^(2)值的增幅为3.03%~66.86%。与地统计学方法比较,本模型在Cd、Cr、Hg、Pb和Zn 5种重金属预测中表现出优越性,与OK、CK和IDW法相比,R^(2)值分别提升了2.45%~13.80%、15.09%~89.95%、1.57%~102.91%。本研究探索的混合策略模型显著提高了长株潭区域土壤中8种重金属元素的预测准确度,表明SMOTE技术和分区误差控制策略的结合应用在环境科学领域内有巨大潜力。该模型不仅在预测精度上超越了传统模型和方法,还为环境监测和管理提供了一种有效的新工具。 展开更多
关键词 土壤重金属预测 随机森林 SMOTE过采样 普通克里金 协同克里金 反距离加权
在线阅读 下载PDF
基于交易采样子图的以太坊钓鱼检测方法
11
作者 雷帮春 孟坤 +1 位作者 宋登科 陈大兴 《计算机工程与设计》 北大核心 2025年第3期690-697,共8页
以太坊提供了图灵完备的去中心网络应用开发和部署环境,所充斥的钓鱼诈骗类应用已成为以太坊的最大安全威胁。为提高以太坊钓鱼检测的效率问题,提出一种基于交易采样子图网络的以太坊钓鱼检测方法。构建目标地址的原始交易子图;设计分... 以太坊提供了图灵完备的去中心网络应用开发和部署环境,所充斥的钓鱼诈骗类应用已成为以太坊的最大安全威胁。为提高以太坊钓鱼检测的效率问题,提出一种基于交易采样子图网络的以太坊钓鱼检测方法。构建目标地址的原始交易子图;设计分层网络采样方法和时序映射机制构建它的4种交易采样子图并提取图特征;利用去重特征融合来消除冗余,输出融合特征来训练随机森林分类器。实验验证了该方法的合理性和有效性,获得了较高的F1值。 展开更多
关键词 以太坊 钓鱼检测方法 交易采样子图网络 网络采样方法 图特征方法 去重特征融合 随机森林分类器
在线阅读 下载PDF
基于压缩采样匹配追踪的电网数据重构方法研究
12
作者 甘杉 余芸 +1 位作者 萧展辉 邹文景 《电测与仪表》 北大核心 2025年第8期100-104,共5页
新型的电力系统使用物联网架构对电力系统进行新的架构部署,这是传统电网向新型能源互联网发展的关键技术。如何对现今的电网中产生的海量数据进行实时、高效、低成本的数据传输,是近年来学者们关注的重点和难点问题之一。为解决电网数... 新型的电力系统使用物联网架构对电力系统进行新的架构部署,这是传统电网向新型能源互联网发展的关键技术。如何对现今的电网中产生的海量数据进行实时、高效、低成本的数据传输,是近年来学者们关注的重点和难点问题之一。为解决电网数据传输过程中存在着的传输成本和传输速率的矛盾问题,论文研究了一种基于压缩采样匹配追踪(compressed sampling matching pursuit,CoSaMP)技术的低成本高效电力数据传输方法,先将电网原始数据进行随机采样压缩,再对压缩后的数据进行传输,最后通过重构算法对传输后的压缩数据进行还原。使用仿真算例通过对论文方法进行了验证,并将论文方法与传统的数据重构算法进行了比较,仿真实验结果表明在允许的误差范围内,所提出的CoSaMP算法下重构信号能够还原初始信号,提高了电网数据传输的有效性。 展开更多
关键词 电网 数据重构 压缩采样匹配追踪 随机采样
在线阅读 下载PDF
土壤制图中多等级代表性采样与分层随机采样的对比研究 被引量:13
13
作者 杨琳 朱阿兴 +1 位作者 张淑杰 安艺明 《土壤学报》 CAS CSCD 北大核心 2015年第1期28-37,共10页
采样设计是土壤地理研究中备受关注的重要问题。本文以区域尺度土壤属性制图为例,将多等级代表性采样与经典采样中的分层随机采样进行对比研究。以安徽宣城研究区的表层砂粒含量为目标要素,采集数量均为59个的两套样点,设计不同数量(46... 采样设计是土壤地理研究中备受关注的重要问题。本文以区域尺度土壤属性制图为例,将多等级代表性采样与经典采样中的分层随机采样进行对比研究。以安徽宣城研究区的表层砂粒含量为目标要素,采集数量均为59个的两套样点,设计不同数量(46、58和59)的样点分组,采用两种制图方法进行制图并利用独立验证点进行评价。结果表明:1)无论是采用多元线性回归方法还是基于环境相似度的制图方法,在同等样点数量下,利用代表性样点所得土壤图精度均高于利用随机样点所得精度,并且利用少量代表性样点(46个)所得土壤图精度也高于利用多量随机样点(59个)所得精度;2)随着代表性较低样点的增加,土壤制图精度基本有一个提高的趋势,而采用随机样点所得土壤图的精度波动较大。因此,可认为多等级代表性采样方法是一种可用于区域尺度土壤调查的有效采样方法,且比分层随机采样高效、稳定。 展开更多
关键词 土壤制图 土壤采样 多等级代表性采样 分层随机采样 区域尺度
在线阅读 下载PDF
基于压缩传感理论的随机等效采样信号的重构 被引量:24
14
作者 赵贻玖 戴志坚 王厚军 《仪器仪表学报》 EI CAS CSCD 北大核心 2011年第2期247-251,共5页
随机等效采样技术通过对周期信号进行多次随机时间间隔取样,以时间间隔为序排列采样数据,形成具有较高等效采样率的波形。然而,由于时间间隔的非均匀性,很难采集到足够的有效信号重构原始波形。为了克服这种信息不足引起的重构误差,提... 随机等效采样技术通过对周期信号进行多次随机时间间隔取样,以时间间隔为序排列采样数据,形成具有较高等效采样率的波形。然而,由于时间间隔的非均匀性,很难采集到足够的有效信号重构原始波形。为了克服这种信息不足引起的重构误差,提出了一种基于压缩传感理论的随机等效采样信号重构方法,构造了随机等效采样测量矩阵。该方法能够对周期信号以低于信号奈奎斯特频率的采样率进行随机采样,通过最优化问题从有限的采样值中重构原始信号。最后通过实验对该方法的可行性进行了验证。 展开更多
关键词 随机等效采样 稀疏性 随机投影 压缩传感
在线阅读 下载PDF
二次采样随机共振的工程应用研究 被引量:18
15
作者 冷永刚 王太勇 +1 位作者 郭焱 许俊艳 《中国机械工程》 EI CAS CSCD 北大核心 2004年第20期1847-1852,共6页
研究了小参数随机共振 (SR)理论的克莱默斯 (Kramers)逃逸速率和罗伦兹 (Lorentzian)分布的噪声频谱特性 ,得出了只有在噪声能量集中的低频区域才能产生随机共振的论点。在此基础上 ,通过二次采样频率变换思想 ,成功地将小参数随机共振... 研究了小参数随机共振 (SR)理论的克莱默斯 (Kramers)逃逸速率和罗伦兹 (Lorentzian)分布的噪声频谱特性 ,得出了只有在噪声能量集中的低频区域才能产生随机共振的论点。在此基础上 ,通过二次采样频率变换思想 ,成功地将小参数随机共振扩展应用到大参数的随机共振 ,从而实现了从强噪声中检测出弱信号的目的。大参数随机共振谱特性及其信噪比的进一步定量分析表明 ,提高采样频率可把弱信号移入噪声能量集中的低频区域 ,有利于产生可辨识的随机共振谱峰。 展开更多
关键词 二次采样随机共振 噪声 频谱 弱信号检测
在线阅读 下载PDF
概率引导的随机采样一致性算法 被引量:13
16
作者 刘坤 葛俊锋 +1 位作者 罗予频 杨士元 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2009年第5期657-662,共6页
为了提高随机采样一致性算法的计算效率,提出一种概率引导的随机采样一致性算法.根据采样模型在原始数据上的检验结果调整每个样本点的采样概率,使得正确样本和正确模型被采样的概率得到提高.在首次获得正确模型之后,样本采样与模型更... 为了提高随机采样一致性算法的计算效率,提出一种概率引导的随机采样一致性算法.根据采样模型在原始数据上的检验结果调整每个样本点的采样概率,使得正确样本和正确模型被采样的概率得到提高.在首次获得正确模型之后,样本采样与模型更新构成了一个正反馈环节,经过若干次迭代后,正确样本被采样的概率远超过错误样本被采样的概率.理论分析和实验数据表明,该算法收敛需要的迭代次数较少,有效地提高了随机采样一致性算法的效率. 展开更多
关键词 随机采样一致性 鲁棒性 模型估计 概率 基础矩阵
在线阅读 下载PDF
处理不平衡数据的聚类欠采样加权随机森林算法 被引量:14
17
作者 王磊 刘雨 +1 位作者 刘志中 齐俊艳 《计算机应用研究》 CSCD 北大核心 2021年第5期1398-1402,共5页
针对现有欠采样处理算法中存在样本缺少代表性、分类性能差等问题,提出了一种基于聚类欠采样的加权随机森林算法(weighted random forest algorithm based on clustering under-sampling,CUS-WRF)。利用K-means算法对多数类样本聚类,引... 针对现有欠采样处理算法中存在样本缺少代表性、分类性能差等问题,提出了一种基于聚类欠采样的加权随机森林算法(weighted random forest algorithm based on clustering under-sampling,CUS-WRF)。利用K-means算法对多数类样本聚类,引入欧氏距离作为欠采样时分配样本个数的权重依据,使采样后的多数类样本与少数类样本形成一个平衡的样本集,以CART决策树为基分类器,加权随机森林为整体框架,同时将测试样本的准确率作为每棵树的权值来完成对结果的最终投票,有效提高了整体分类性能。选择八组KEEL数据集进行实验,结果表明,与其余四种基于随机森林的不平衡数据处理算法相比,CUS-WRF算法的分类性能及稳定性更具优势。 展开更多
关键词 随机森林 不平衡数据集 采样 K-MEANS 欧氏距离
在线阅读 下载PDF
基于随机采样一致性算法的平面匹配方法 被引量:12
18
作者 周波 杨剑 王东平 《计算机应用》 CSCD 北大核心 2011年第4期1053-1056,共4页
针对传统的平面图像标定点匹配算法计算量大、准确性不高等问题,提出一种基于随机采样一致性(RANSAC)算法的快速高精度的平面图像标定点匹配方法。该方法首先基于双圆锥曲线模型,借助于椭圆边缘点附近的梯度信息求取椭圆的切线,由切线... 针对传统的平面图像标定点匹配算法计算量大、准确性不高等问题,提出一种基于随机采样一致性(RANSAC)算法的快速高精度的平面图像标定点匹配方法。该方法首先基于双圆锥曲线模型,借助于椭圆边缘点附近的梯度信息求取椭圆的切线,由切线集合拟合出椭圆参数,并利用这些参数计算出椭圆圆心,即图像上的标志点;然后用RANSAC随机采样算法对标定板上的点和图像上的点进行匹配。实验验证该方法实现起来简单并且有较高的准确率。 展开更多
关键词 平面测量 标定点 随机采样一致性算法 匹配
在线阅读 下载PDF
基于重要性采样的随机Hough变换圆检测算法 被引量:26
19
作者 付琰 卢荣胜 +2 位作者 夏瑞雪 王成顺 李琪 《电子测量技术》 2012年第5期45-48,82,共5页
提出了一种新的基于重要性采样的随机Hough变换圆检测算法,利用基于圆的几何特性的边界点搜索策略提高采样效率,通过指定重要性采样技术中的目标分布,计算采样参数权重,使得圆识别更加容易和精确;利用基于聚类技术的峰值检测方法,实现... 提出了一种新的基于重要性采样的随机Hough变换圆检测算法,利用基于圆的几何特性的边界点搜索策略提高采样效率,通过指定重要性采样技术中的目标分布,计算采样参数权重,使得圆识别更加容易和精确;利用基于聚类技术的峰值检测方法,实现多个圆的同时检测。通过将本文提出的新算法与现有的其他两种算法进行实验对比,表明该新算法在检测精度、检测速度、识别可靠性、抗噪能力等方面都有显著性提高。 展开更多
关键词 圆检测 随机HOUGH变换 重要性采样 峰值检测
在线阅读 下载PDF
基于拉丁超立方采样技术的半不变量法随机潮流计算 被引量:35
20
作者 黄煜 徐青山 +1 位作者 卞海红 刘建坤 《电力自动化设备》 EI CSCD 北大核心 2016年第11期112-119,共8页
新能源发电的兴起加剧了电力系统运行中的不确定性和关联性,传统潮流计算方法无法适应新环境下电网分析和评估的要求。提出一种可考虑输入变量相关性的基于拉丁超立方采样技术的半不变量法随机潮流计算方法。该算法综合了模拟法精度高... 新能源发电的兴起加剧了电力系统运行中的不确定性和关联性,传统潮流计算方法无法适应新环境下电网分析和评估的要求。提出一种可考虑输入变量相关性的基于拉丁超立方采样技术的半不变量法随机潮流计算方法。该算法综合了模拟法精度高、适用性广和半不变量法计算速度快的优点,采用分段线性化潮流模型减小截断误差,并通过Cholesky分解解决了半不变量法只能处理独立变量的难题。对IEEE 30和IEEE 118节点系统的测试验证了所提方法的准确性、快速性和实用性。 展开更多
关键词 拉丁超立方采样 相关性 半不变量法 分段线性化 CHOLESKY分解 随机潮流
在线阅读 下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部