期刊文献+
共找到298篇文章
< 1 2 15 >
每页显示 20 50 100
Risk assessment of rockburst using SMOTE oversampling and integration algorithms under GBDT framework 被引量:1
1
作者 WANG Jia-chuang DONG Long-jun 《Journal of Central South University》 SCIE EI CAS CSCD 2024年第8期2891-2915,共25页
Rockburst is a common geological disaster in underground engineering,which seriously threatens the safety of personnel,equipment and property.Utilizing machine learning models to evaluate risk of rockburst is graduall... Rockburst is a common geological disaster in underground engineering,which seriously threatens the safety of personnel,equipment and property.Utilizing machine learning models to evaluate risk of rockburst is gradually becoming a trend.In this study,the integrated algorithms under Gradient Boosting Decision Tree(GBDT)framework were used to evaluate and classify rockburst intensity.First,a total of 301 rock burst data samples were obtained from a case database,and the data were preprocessed using synthetic minority over-sampling technique(SMOTE).Then,the rockburst evaluation models including GBDT,eXtreme Gradient Boosting(XGBoost),Light Gradient Boosting Machine(LightGBM),and Categorical Features Gradient Boosting(CatBoost)were established,and the optimal hyperparameters of the models were obtained through random search grid and five-fold cross-validation.Afterwards,use the optimal hyperparameter configuration to fit the evaluation models,and analyze these models using test set.In order to evaluate the performance,metrics including accuracy,precision,recall,and F1-score were selected to analyze and compare with other machine learning models.Finally,the trained models were used to conduct rock burst risk assessment on rock samples from a mine in Shanxi Province,China,and providing theoretical guidance for the mine's safe production work.The models under the GBDT framework perform well in the evaluation of rockburst levels,and the proposed methods can provide a reliable reference for rockburst risk level analysis and safety management. 展开更多
关键词 rockburst evaluation SMOTE oversampling random search grid K-fold cross-validation confusion matrix
在线阅读 下载PDF
Using deep learning to detect small targets in infrared oversampling images 被引量:15
2
作者 LIN Liangkui WANG Shaoyou TANG Zhongxing 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2018年第5期947-952,共6页
According to the oversampling imaging characteristics, an infrared small target detection method based on deep learning is proposed. A 7-layer deep convolutional neural network(CNN) is designed to automatically extrac... According to the oversampling imaging characteristics, an infrared small target detection method based on deep learning is proposed. A 7-layer deep convolutional neural network(CNN) is designed to automatically extract small target features and suppress clutters in an end-to-end manner. The input of CNN is an original oversampling image while the output is a cluttersuppressed feature map. The CNN contains only convolution and non-linear operations, and the resolution of the output feature map is the same as that of the input image. The L1-norm loss function is used, and a mass of training data is generated to train the network effectively. Results show that compared with several baseline methods, the proposed method improves the signal clutter ratio gain and background suppression factor by 3–4 orders of magnitude, and has more powerful target detection performance. 展开更多
关键词 infrared small target detection oversampling deep learning convolutional neural network(CNN)
在线阅读 下载PDF
High-resolution algorithm based on temporal-spatial extrapolation 被引量:3
3
作者 Xueya Yang Baixiao Chen Feilin Qi 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2010年第1期9-15,共7页
To enhance the resolution of parameter estimation with limited samples received by a short passive array, an iterative nonparametric algorithm for estimating the frequencies and direction-of-arrivals (DOAs) of signa... To enhance the resolution of parameter estimation with limited samples received by a short passive array, an iterative nonparametric algorithm for estimating the frequencies and direction-of-arrivals (DOAs) of signals is proposed. The cost function is constructed using 12-norm Gaussian entropy combined with an additional constraint, 12-norm constraint or linear constraint. By minimizing the cost functions in the temporal and the spatial dimensions using corresponding iteration algorithms respectively, the sparse discrete Fourier transforms (DFTs) of temporal and spatial samples are obtained to represent the extrapolated sequences with much larger sizes than the original samples. Then frequency and angle estimates are obtained by performing the traditional simple methods on the extrapolated sequences. It is shown that the proposed algorithm offers increased resolution and significantly reduced sidelobes compared with the periodogram and beamforming based methods. And it achieves high precision compared with the high-resolution method with lower computational burden. Some numerical simulations and real data processing results are presented to verify the effectiveness of the method. 展开更多
关键词 temporal-spatial extrapolation frequency estimation DIRECTION-OF-ARRIVAL discrete Fourier transform.
在线阅读 下载PDF
Temporal-spatial cross-correlation analysis of non-stationary near-surface wind speed time series 被引量:3
4
作者 ZENG Ming LI Jing-hai +1 位作者 MENG Qing-hao ZHANG Xiao-nei 《Journal of Central South University》 SCIE EI CAS CSCD 2017年第3期692-698,共7页
Temporal-spatial cross-correlation analysis of non-stationary wind speed time series plays a crucial role in wind field reconstruction as well as in wind pattern recognition.Firstly,the near-surface wind speed time se... Temporal-spatial cross-correlation analysis of non-stationary wind speed time series plays a crucial role in wind field reconstruction as well as in wind pattern recognition.Firstly,the near-surface wind speed time series recorded at different locations are studied using the detrended fluctuation analysis(DFA),and the corresponding scaling exponents are larger than 1.This indicates that all these wind speed time series have non-stationary characteristics.Secondly,concerning this special feature( i.e.,non-stationarity)of wind signals,a cross-correlation analysis method,namely detrended cross-correlation analysis(DCCA) coefficient,is employed to evaluate the temporal-spatial cross-correlations between non-stationary time series of different anemometer pairs.Finally,experiments on ten wind speed data synchronously collected by the ten anemometers with equidistant arrangement illustrate that the method of DCCA cross-correlation coefficient can accurately analyze full-scale temporal-spatial cross-correlation between non-stationary time series and also can easily identify the seasonal component,while three traditional cross-correlation techniques(i.e.,Pearson coefficient,cross-correlation function,and DCCA method) cannot give us these information directly. 展开更多
关键词 temporal-spatial cross-correlation near-surface wind speed time series detrended cross-correlation analysis (DCCA) cross-correlation coefficient Pearson coefficient cross-correlation function
在线阅读 下载PDF
Three-stage approach for dynamic traffic temporal-spatial model
5
作者 陆化普 孙智源 屈闻聪 《Journal of Central South University》 SCIE EI CAS CSCD 2016年第10期2728-2734,共7页
In order to describe the characteristics of dynamic traffic flow and improve the robustness of its multiple applications, a dynamic traffic temporal-spatial model(DTTS) is established. With consideration of the tempor... In order to describe the characteristics of dynamic traffic flow and improve the robustness of its multiple applications, a dynamic traffic temporal-spatial model(DTTS) is established. With consideration of the temporal correlation, spatial correlation and historical correlation, a basic DTTS model is built. And a three-stage approach is put forward for the simplification and calibration of the basic DTTS model. Through critical sections pre-selection and critical time pre-selection, the first stage reduces the variable number of the basic DTTS model. In the second stage, variable coefficient calibration is implemented based on basic model simplification and stepwise regression analysis. Aimed at dynamic noise estimation, the characteristics of noise are summarized and an extreme learning machine is presented in the third stage. A case study based on a real-world road network in Beijing, China, is carried out to test the efficiency and applicability of proposed DTTS model and the three-stage approach. 展开更多
关键词 dynamic traffic flow temporal-spatial model big-data driven
在线阅读 下载PDF
基于边界信息的自适应过采样算法
6
作者 杜睿山 靳明洋 +1 位作者 孟令东 宋健辉 《郑州大学学报(理学版)》 CAS 北大核心 2025年第1期23-30,共8页
针对人工少数类过采样(synthetic minority over-sampling technique,SMOTE)算法存在样本合成区域狭小,容易将少数类泛化到多数类及引入噪声的问题,提出一种基于噪声过滤、边界点自适应采样的过采样算法。首先,该算法使用K近邻算法进行... 针对人工少数类过采样(synthetic minority over-sampling technique,SMOTE)算法存在样本合成区域狭小,容易将少数类泛化到多数类及引入噪声的问题,提出一种基于噪声过滤、边界点自适应采样的过采样算法。首先,该算法使用K近邻算法进行噪声过滤,接着确定边界点并在边界点中寻找合适的点作为根样本点,并以其K近邻点中与其同类且欧氏距离最远的点作为候选样本点。然后,根据根样本点所携带的边界信息确定该点所合成的样本数量,并根据根样本点和候选样本点生成一个N维球体作为样本的合成区间。最后,对合成样本进行判断以确定其是否满足条件。通过实验证明,该算法生成的样本质量要优于SMOTE及其常见变种算法。 展开更多
关键词 SMOTE KNN 过采样算法 数据不均衡 ISMOTE
在线阅读 下载PDF
样本不平衡条件下煤矿突水水源识别——以谢桥煤矿为例
7
作者 王彦彬 闫晓杉 《安全与环境学报》 北大核心 2025年第7期2553-2561,共9页
为了有效识别煤矿突水水源,以保障煤矿安全生产,使用合成少数类过采样技术(Synthetic Minority Oversampling Technique, SMOTE)补充少数类样本,继而采用支持向量机(Support Vector Machine, SVM)模型对突水水源进行识别。试验选取96条... 为了有效识别煤矿突水水源,以保障煤矿安全生产,使用合成少数类过采样技术(Synthetic Minority Oversampling Technique, SMOTE)补充少数类样本,继而采用支持向量机(Support Vector Machine, SVM)模型对突水水源进行识别。试验选取96条谢桥煤矿水化学数据进行分析,首先对样本数据进行标准化处理和主成分分析(Principal Component Analysis, PCA),将数据集划分为训练集和测试集,对训练集中少数类样本采用SMOTE法生成新的样本,然后采用改进混沌哈里斯鹰优化(Chaos Harris Hawks Optimization, CHHO)算法结合十折交叉验证优化支持向量机惩罚因子C和径向基函数(Radial Basis Function, RBF)核的参数γ,根据优化结果建立突水水源识别模型,对测试集中突水水源进行识别。将该方法与朴素贝叶斯、随机森林所得结果进行比较,结果显示,采用本方法对测试集识别结果准确性优于其他两种方法,表明该方法在突水水源识别上具有良好的实用性和有效性。 展开更多
关键词 安全工程 突水水源识别 主成分分析 合成少数类过采样技术 混沌哈里斯鹰优化算法 支持向量机
在线阅读 下载PDF
应用探测检测一体化设计的天基红外运动目标增强方法
8
作者 金挺 孙晓峰 +1 位作者 高宏霞 刘晓磊 《航天器工程》 北大核心 2025年第2期52-58,共7页
针对天基广域探测系统复杂背景下红外运动目标稳定探测的问题,提出一种应用探测检测一体化设计的红外运动目标增强方法。利用双向过采样探测方式,每次扫描探测均可实现对运动小目标90%以上能量收集;在检测过程中,通过相邻扫描图像帧的... 针对天基广域探测系统复杂背景下红外运动目标稳定探测的问题,提出一种应用探测检测一体化设计的红外运动目标增强方法。利用双向过采样探测方式,每次扫描探测均可实现对运动小目标90%以上能量收集;在检测过程中,通过相邻扫描图像帧的配准与差分计算,进行强背景杂波抑制,背景杂波强度平均可降低90%以上;结合双向过采样探测传递模型,采用全变分约束构建去噪复原模型,进行目标增强与噪声抑制一体化处理,在实现目标能量集中度提升的同时抑制噪声,差分图像中目标信噪比可进一步提升优于2.5倍。试验结果表明:通过探测检测一体化设计,可以有效实现红外运动目标增强,提升对红外运动目标的探测能力。 展开更多
关键词 天基红外运动目标 探测检测 目标增强 双向过采样
在线阅读 下载PDF
一种基于KNN和随机仿射的边界样本合成过采样方法 被引量:1
9
作者 冷强奎 孙薛梓 孟祥福 《智能系统学报》 北大核心 2025年第2期329-343,共15页
过采样是处理不平衡数据分类问题的有效策略。本文提出了一种基于K近邻(K-nearest neighbor,KNN)和随机仿射的边界样本合成过采样方法,用于改进现有过采样方法的种子样本选择阶段和合成样本生成阶段。首先,引入三近邻理论,建立样本间有... 过采样是处理不平衡数据分类问题的有效策略。本文提出了一种基于K近邻(K-nearest neighbor,KNN)和随机仿射的边界样本合成过采样方法,用于改进现有过采样方法的种子样本选择阶段和合成样本生成阶段。首先,引入三近邻理论,建立样本间有效的内在近邻关系,并去除数据集中的噪声,以降低后续分类器的过拟合风险。其次,准确识别那些难以学习且包含丰富信息的少数类边界样本,并将其用作采样种子。最后,利用局部随机仿射代替线性插值机制,在原始数据的近似流形中均匀地生成合成样本。相比于传统过采样方法,本文方法能更充分挖掘数据集中的重要边界信息,从而为分类器提供更多辅助以改善其分类性能。在18个基准数据集上,与8种经典采样方法(结合4种不同分类器)进行了大量对比实验。结果表明,本文所提方法获得了更高的F1分数和几何均值(G-mean),可以更为有效地解决不平衡数据分类问题。此外,统计分析也证实该方法具有更高的弗里德曼排名(Friedman ranking)。 展开更多
关键词 K近邻 线性插值 边界样本 自然分布 过采样 三近邻理论 随机仿射变换 不平衡分类
在线阅读 下载PDF
基于高斯混合模型双向聚类重采样和随机森林构建DLBCL早期复发预测模型
10
作者 王俊霞 张岩波 +9 位作者 余红梅 曹红艳 周洁 乔宇 张高源 于凯 王雪嫚 郭玉娇 赵志强 罗艳虹 《中国卫生统计》 北大核心 2025年第1期7-11,17,共6页
目的应用一种可以同时解决少数类和多数类类间和类内不平衡问题的类别不平衡处理方法,并将其与随机森林(random forest,RF)分类器结合实现对弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)患者早期复发的预测,为DLBLC患者的... 目的应用一种可以同时解决少数类和多数类类间和类内不平衡问题的类别不平衡处理方法,并将其与随机森林(random forest,RF)分类器结合实现对弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)患者早期复发的预测,为DLBLC患者的治疗提供参考。方法首先使用一种基于高斯混合模型双向聚类重采样的类别不平衡处理方法(Gaussian mixture model,GMM-GMM)处理数据,并与随机过采样(random over sampling,ROS)、合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)、Borderline-1 SMOTE、Borderline-2 SMOTE、GMM上采样、GMM下采样、SMOTE+RUS、SMOTE+GMM和GMM+RUS进行比较,然后以RF作为分类器验证10种类别不平衡方法的性能,之后为验证RF的性能,在处理后的数据集上使用logistic回归和决策树(decision tree,DT)作为对照,最后从区分度和校准度两方面对模型进行评价。结果在本文所有模型中,采用GMM-GMM的RF模型取得了相对最优的分类性能(accuracy=0.79,AUC=0.87,sensitivity=0.71,specificity=0.87,G-means=0.79,MSE=0.21)。结论GMM-GMM优于其他传统的重采样方法,结合RF用于DLBCL患者早期复发的预测取得了相对较好的分类结果,可以很好地实现对DLBCL患者早期复发的预测。 展开更多
关键词 类别不平衡 高斯混合模型聚类重采样 随机森林 复发预测 弥漫大B细胞淋巴瘤
在线阅读 下载PDF
基于超球体密度聚类的自适应不均衡数据过采样算法
11
作者 陶新民 李俊轩 +3 位作者 郭心悦 史丽航 徐安南 张艳萍 《电子与信息学报》 北大核心 2025年第7期2347-2360,共14页
不平衡数据分类是机器学习中的常见问题,过采样是解决方案之一。但现有过采样方法在处理复杂不均衡数据集时容易引入噪声样本导致类重叠,且无法有效解决低密度、小析取等子概念引起的类内不平衡问题。为此,该文提出一种基于超球体密度... 不平衡数据分类是机器学习中的常见问题,过采样是解决方案之一。但现有过采样方法在处理复杂不均衡数据集时容易引入噪声样本导致类重叠,且无法有效解决低密度、小析取等子概念引起的类内不平衡问题。为此,该文提出一种基于超球体密度聚类的自适应过采样算法(DCHO),该算法通过计算少数类样本密度动态确定聚类中心,构建超球体并将超球体内少数类样本归入相应簇,再按照不均衡比调整超球体半径。同时,根据超球体内样本局部密度和半径大小自适应分配过采样权重,进而解决类内不平衡问题。为防止类重叠,过采样过程均在每个超球体内部进行。此外,为进一步增强少数类边界以及探索未知区域,该文还构建一种新的边界偏好随机过采样策略。实验结果表明,所提算法在避免类重叠的同时,强化了低密度子概念的表达,有效解决了类间与类内不平衡问题。 展开更多
关键词 不均衡数据集 分类 过采样 类内不平衡 超球体
在线阅读 下载PDF
基于SMOTE策略的数据不完整时滑坡易发性评价
12
作者 孟金浩 孙奔博 +1 位作者 王娟 黄承芳 《人民黄河》 北大核心 2025年第7期50-58,共9页
滑坡易发性评价是地质灾害防治的重要基础,但滑坡样本数据常存在缺失或不完整的情况,导致机器学习模型难以进行准确可靠的易发性建模。基于随机森林(RF)和人工神经网络(ANN)模型,探讨了不同缺失比例(10%~50%)和区域性缺失条件下,滑坡易... 滑坡易发性评价是地质灾害防治的重要基础,但滑坡样本数据常存在缺失或不完整的情况,导致机器学习模型难以进行准确可靠的易发性建模。基于随机森林(RF)和人工神经网络(ANN)模型,探讨了不同缺失比例(10%~50%)和区域性缺失条件下,滑坡易发性评价结果的精度变化及易发性分区特征。通过合成少数过采样技术(SMOTE)扩充样本后,进行预测结果对比分析来验证样本扩充的有效性。结果表明:随着样本缺失比例的增大,模型精度逐渐下降,但下降幅度有限,RF与ANN模型在较高等级以上易发区的预测面积最大分别缩小7.0%与5.5%;区域性缺失条件下,精度差异较大,RF与ANN模型在较高等级以上易发区的预测面积最大分别缩小11.1%与11.2%。扩充样本后,精度随扩充比例的增大略有下降。当扩充50%样本时,RF与ANN模型在较高易发区预测面积分别缩小14.0%与19.5%。基于SMOTE策略生成的滑坡样本可用于滑坡数据缺失地区易发性评价建模。 展开更多
关键词 滑坡易发性 不完整滑坡数据 随机森林 神经网络 合成少数过采样 黄河上游
在线阅读 下载PDF
融合nmODE的术后肺部并发症预测模型
13
作者 熊立鹏 徐修远 +2 位作者 牛颢 陈楠 章毅 《智能系统学报》 北大核心 2025年第1期198-205,共8页
为了准确预测病人肺部手术后并发症的发生,提出了一种融合神经记忆常微分方程(neural memory ordinary differential equation,nmODE)的并发症预测模型。首先,利用极限梯度提升(extreme gradient boosting,XGBoost)树结构对数据进行编码... 为了准确预测病人肺部手术后并发症的发生,提出了一种融合神经记忆常微分方程(neural memory ordinary differential equation,nmODE)的并发症预测模型。首先,利用极限梯度提升(extreme gradient boosting,XGBoost)树结构对数据进行编码,并提取其特征重要性。然后,使用长短时记忆神经网络对数据的相关特征依赖性进行分析,并提取处理后的特征。最后,利用nmODE的记忆和学习能力,对提取的特征进行深入分析,并得出最终的预测结果。通过实验评估,在肺部术后并发症数据集中,证明了提出模型的效果优于现有模型,同时可以为预测肺部手术后并发症的发生提供更准确的结果。 展开更多
关键词 疾病预测 异构表格数据 神经记忆常微分方程 极限梯度提升 长短时记忆神经网络 合成少数过采样技术 类别不平衡 病人预后
在线阅读 下载PDF
基于GAN-FCNN数据增强的特种车辆声品质预测研究
14
作者 钱堃 杜习康 +5 位作者 王言夫 段继英 刘珂 谭璟 沈政华 赵剑 《汽车工程》 北大核心 2025年第8期1596-1606,共11页
针对特种车辆声品质预测时,面临采集噪声样本成本较高、样本处理后只能获得少量样本集、缺乏充足的噪声样本,从而影响各类预测模型训练时的模型精度问题,本文建立GAN-FCNN网络,使用4层全连接层构建生成器与判别器进行对抗训练,生成伪样... 针对特种车辆声品质预测时,面临采集噪声样本成本较高、样本处理后只能获得少量样本集、缺乏充足的噪声样本,从而影响各类预测模型训练时的模型精度问题,本文建立GAN-FCNN网络,使用4层全连接层构建生成器与判别器进行对抗训练,生成伪样本集。将增强样本集分别带入到LASSO线性回归模型和RF、BP及其PSO优化模型进行回归预测,通过验证,模型预测精度与性能均得到提升。相比于传统的过采样算法,GAN-FCNN网络有更高的准确率,更适用于特种车辆声品质预测模型建立时进行样本扩充。 展开更多
关键词 数据增强 特种车辆 声品质 对抗神经网络 过采样
在线阅读 下载PDF
基于确定性过采样的不平衡航空通信信号调制识别
15
作者 李浩然 王艺然 +1 位作者 白静 肖竹 《空军工程大学学报》 北大核心 2025年第3期18-25,共8页
针对航空通信中,复杂电磁环境下的调制信号分类任务数据不平衡以及少数类信号样本的缺乏导致分类器的性能下降的问题,提出了一种基于确定性过采样技术的不平衡航空通信调制信号分类方法。该方法通过合成少数类信号样本,平衡数据集,从而... 针对航空通信中,复杂电磁环境下的调制信号分类任务数据不平衡以及少数类信号样本的缺乏导致分类器的性能下降的问题,提出了一种基于确定性过采样技术的不平衡航空通信调制信号分类方法。该方法通过合成少数类信号样本,平衡数据集,从而减少数据不平衡对分类器的负面影响。基于RadioML 2016.10a数据集,选择11种调制方式,在-8 dB、-4 dB、0 dB、4 dB、8 dB信噪比下构建了4种不平衡场景进行验证。实验结果表明,相较于不平衡数据集,文中所提方法在MsmcNet、ResNet50和DenseNet1213种网络模型上,分类准确率分别提高了2.78%、0.92%、3.45%。与传统的SMOTE方法相比,所提方法在处理多类不平衡问题上表现出更好的分类性能。该方法能够有效提高调制信号分类任务中的准确率,尤其是在复杂电磁环境下的航空通信场景中。 展开更多
关键词 信号调制分类 多类不平衡信号 过采样 确定性合成 数据分布
在线阅读 下载PDF
基于凝聚式层次聚类的微调筛选过采样方法
16
作者 谷铮 陈学斌 +1 位作者 张宏扬 李雨欣 《计算机应用》 北大核心 2025年第7期2138-2144,共7页
针对不平衡数据集分类效果差的问题,提出一种基于凝聚式层次聚类(AHC)的微调筛选过采样方法,该方法可适用于不平衡数据的多分类情况。首先,在不平衡数据集的聚类过程中应用AHC算法,分别聚类多数类与少数类,从而在考虑类别间关系的同时... 针对不平衡数据集分类效果差的问题,提出一种基于凝聚式层次聚类(AHC)的微调筛选过采样方法,该方法可适用于不平衡数据的多分类情况。首先,在不平衡数据集的聚类过程中应用AHC算法,分别聚类多数类与少数类,从而在考虑类别间关系的同时有效避免类重叠问题;其次,为了平衡数据集并保留原始数据的特征,设计一种微调过采样算法;再次,为了提升生成样本的分类准确率,提出一种基于倾向评分匹配的标签倾向评估与筛选方法;最后,通过实验对所提出的方法进行验证,并将该方法与MDO(Mahalanobis Distance-based Over-sampling technique)、AND-SMOTE(Automatic Neighborhood size Determination method for Synthetic Minority Over-sampling TEchnique)和K-means SMOTE这3种方法进行比较。实验结果表明,在Abalone、Contraceptive和Yeast等6个不同的数据集上,所提方法展现出了良好的性能,验证了它的有效性。 展开更多
关键词 不平衡数据 多分类 过采样 凝聚式层次聚类 标签倾向评估
在线阅读 下载PDF
基于SMOTE辅助分区误差控制的随机森林土壤重金属含量预测模型
17
作者 陈敏 董泽馨 +3 位作者 秦莉 张晨晨 张彦儒 孙思佳 《农业资源与环境学报》 北大核心 2025年第3期580-591,共12页
土壤中重金属空间分布的准确预测是制定科学合理的土地利用规划以及构建有效风险管理措施的关键环节。本研究旨在探索一种结合合成少数类过采样技术(SMOTE)和分区误差控制混合策略的随机森林(RF)模型,利用长株潭(长沙市、株洲市和湘潭市... 土壤中重金属空间分布的准确预测是制定科学合理的土地利用规划以及构建有效风险管理措施的关键环节。本研究旨在探索一种结合合成少数类过采样技术(SMOTE)和分区误差控制混合策略的随机森林(RF)模型,利用长株潭(长沙市、株洲市和湘潭市)区域8种重金属元素(As、Cd、Cr、Cu、Hg、Ni、Pb和Zn)及29项环境辅助变量数据,开展区域土壤重金属空间预测精度比较研究。将本研究构建的模型与全区及分区随机森林建模方法进行了比较分析,同时,也与三种经典地统计学方法——普通克里金(OK)、协同克里金(CK)和反距离加权法(IDW)进行了对比。结果表明:相较于全区建模方法,本研究构建的模型在预测Cd、Cr、Hg、Ni、Pb和Zn 6种重金属含量的R^(2)值提升了15.87%~35.39%;与分区建模方法相比,所有8种重金属的预测精度也有了显著提高,R^(2)值的增幅为3.03%~66.86%。与地统计学方法比较,本模型在Cd、Cr、Hg、Pb和Zn 5种重金属预测中表现出优越性,与OK、CK和IDW法相比,R^(2)值分别提升了2.45%~13.80%、15.09%~89.95%、1.57%~102.91%。本研究探索的混合策略模型显著提高了长株潭区域土壤中8种重金属元素的预测准确度,表明SMOTE技术和分区误差控制策略的结合应用在环境科学领域内有巨大潜力。该模型不仅在预测精度上超越了传统模型和方法,还为环境监测和管理提供了一种有效的新工具。 展开更多
关键词 土壤重金属预测 随机森林 SMOTE过采样 普通克里金 协同克里金 反距离加权
在线阅读 下载PDF
基于高倍过采样与加窗插值FFT的电力谐波分析 被引量:5
18
作者 张鸿博 熊军华 蔡晓峰 《电力系统保护与控制》 EI CSCD 北大核心 2024年第5期105-115,共11页
为提高谐波分析精度,分析了信号加窗引起的信噪比损失以及AD转换产生的量化误差,阐述了过采样技术提高信噪比的原理。在此基础上,提出了基于高倍过采样和加窗插值快速傅里叶变换(fast Fourier transform, FFT)的谐波分析方法。该方法充... 为提高谐波分析精度,分析了信号加窗引起的信噪比损失以及AD转换产生的量化误差,阐述了过采样技术提高信噪比的原理。在此基础上,提出了基于高倍过采样和加窗插值快速傅里叶变换(fast Fourier transform, FFT)的谐波分析方法。该方法充分利用AD转换器的潜力,以尽量高的采样速率进行AD采样,同时通过均值滤波避免高倍过采样引起的采样数据量激增问题。详细研究了所提谐波分析方法对信号中谐波分量幅值和相位的影响,并给出了简洁实用的谐波幅值和相位校正方法。仿真表明,所提方法可在不增加系统成本的前提下改善加窗插值FFT的抗噪声能力,提高谐波分析精度。 展开更多
关键词 插值FFT 窗函数 谐波分析 量化误差 过采样 校正
在线阅读 下载PDF
面向不平衡图像数据的对抗自编码器过采样算法 被引量:2
19
作者 职为梅 常智 +1 位作者 卢俊华 耿正乾 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第11期4208-4218,共11页
许多适用于低维数据的传统不平衡学习算法在图像数据上的效果并不理想。基于生成对抗网络(GAN)的过采样算法虽然可以生成高质量图像,但在类不平衡情况下容易产生模式崩溃问题。基于自编码器(AE)的过采样算法容易训练,但生成的图像质量... 许多适用于低维数据的传统不平衡学习算法在图像数据上的效果并不理想。基于生成对抗网络(GAN)的过采样算法虽然可以生成高质量图像,但在类不平衡情况下容易产生模式崩溃问题。基于自编码器(AE)的过采样算法容易训练,但生成的图像质量较低。为进一步提高过采样算法在不平衡图像中生成样本的质量和训练的稳定性,该文基于生成对抗网络和自编码器的思想提出一种融合自编码器和生成对抗网络的过采样算法(BAEGAN)。首先在自编码器中引入一个条件嵌入层,使用预训练的条件自编码器初始化GAN以稳定模型训练;然后改进判别器的输出结构,引入一种融合焦点损失和梯度惩罚的损失函数以减轻类不平衡的影响;最后从潜在向量的分布映射中使用合成少数类过采样技术(SMOTE)来生成高质量的图像。在4个图像数据集上的实验结果表明该算法在生成图像质量和过采样后的分类性能上优于具有辅助分类器的条件生成对抗网络(ACGAN)、平衡生成对抗网络(BAGAN)等过采样算法,能有效解决图像数据中的类不平衡问题。 展开更多
关键词 不平衡图像数据 过采样 生成对抗网络 对抗自编码器 合成少数类过采样技术
在线阅读 下载PDF
一种基于数据分布的不平衡数据过采样方法 被引量:1
20
作者 陈丽萍 王洪海 何舒平 《安徽大学学报(自然科学版)》 CAS 北大核心 2024年第5期26-36,共11页
针对现有不平衡数据过采样方法生成重叠样本、潜在价值不高样本以及过拟合等问题,提出了一种基于数据分布的过采样方法.该方法首先将少数类样本划分成不同子簇,根据样本的空间分布位置识别噪声样本和少数类边界样本,并删除噪声样本;进... 针对现有不平衡数据过采样方法生成重叠样本、潜在价值不高样本以及过拟合等问题,提出了一种基于数据分布的过采样方法.该方法首先将少数类样本划分成不同子簇,根据样本的空间分布位置识别噪声样本和少数类边界样本,并删除噪声样本;进而将对分类边界决策影响大的少数类边界样本作为种子样本,并结合种子样本所在子簇的稀疏因子及其识别的难易程度确定采样权重;最后在种子样本所在的子簇中生成新样本.为了验证所设计采样方法的有效性,分别使用AdaBoost(adaptive boosting)和SVM(support vector machine)算法对12个数据集进行分类实验,结果表明,与传统的过采样算法相比,所设计的过采样方法在保证了整体分类性能下,提高了不平衡数据中对少数类的分类效果. 展开更多
关键词 不平衡数据 数据分布 过采样 稀疏因子 重叠样本
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部