-
题名基于SMOTE平衡数据的极端随机树岩性识别
被引量:1
- 1
-
-
作者
曹志民
张丽
郑兵
韩建
-
机构
东北石油大学三亚海洋油气研究院
东北石油大学物理与电子工程学院
海南科技职业大学虚拟现实技术与系统海南省工程研究中心
-
出处
《吉林大学学报(地球科学版)》
北大核心
2025年第4期1372-1386,共15页
-
基金
海南省科技专项(ZDYF2022GXJS220,ZDYF2022GXJS222)。
-
文摘
在油气勘探和地质工程中,精确的岩性识别对于资源评估和开采具有重要意义。由于地质数据的固有复杂性及岩性样本的不平衡问题,传统方法在岩性识别中面临诸多挑战。本文提出一种合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)结合极端随机树进行岩性识别的方法。首先,通过SMOTE增强少数类样本的表征,提高训练数据的平衡性;其次,利用极端随机树的高效性和强泛化能力构建岩性分类模型。实验结果表明:极端随机树的识别准确率为85.54%,相比其他机器学习方法梯度提升决策树(gradient boosting decision tree,GBDT)、极端梯度提升(extreme gradient boosting,XGBoost)、轻量级梯度提升机(light gradient boosting machine,LightGBM)和随机森林分别提高了5.58%、2.55%、2.35%和2.08%;SMOTE采样后,降低了样本不平衡引起的预测偏差,各模型中少数岩性类别的整体识别精度显著提高,提升了各模型的整体性能,极端随机树性能最优,识别准确率提升到86.62%,相比GBDT、XGBoost、LightGBM和随机森林分别提高了4.71%、2.56%、1.55%和2.02%,验证了SMOTE结合极端随机树的有效性。
-
关键词
岩性识别
机器学习
随机森林
极端随机树
平衡数据
-
Keywords
lithology identification
machine learning
random forest
extra trees
data balancing
-
分类号
P631.8
[天文地球—地质矿产勘探]
-