期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
基于Shapley additive explanations(SHAP)分析乳腺X线检查假阴性乳腺癌的特征 被引量:4
1
作者 杨蔚 张宁妹 +1 位作者 张朝林 尹清云 《中国医学计算机成像杂志》 CSCD 北大核心 2023年第3期271-276,共6页
目的:基于Shapley additive explanations(SHAP)分析乳腺X线摄影(MG)检查假阴性乳腺癌的特征。方法:回顾性收集我院2018年1月—2022年5月首诊乳腺癌患者,评估临床病理和影像学表现。通过logistic回归分析确定MG假阴性乳腺癌的独立危险... 目的:基于Shapley additive explanations(SHAP)分析乳腺X线摄影(MG)检查假阴性乳腺癌的特征。方法:回顾性收集我院2018年1月—2022年5月首诊乳腺癌患者,评估临床病理和影像学表现。通过logistic回归分析确定MG假阴性乳腺癌的独立危险因素。应用SHAP分析各独立危险因素的贡献价值。结果:1505个病灶纳入研究,MG假阴性乳腺癌373个。较小的病灶、致密或不均匀致密的MG密度、无可疑钙化、非肿块样强化(NME)、原位癌和腋窝淋巴结阴性与MG假阴性乳腺癌独立相关,上述参数构建的联合模型具有良好的预测效能(AUC=0.871)。根据SHAP分析,病灶大小、MG密度和病灶MRI强化类型是导致MG假阴性的主要因素;钙化状态、病理类型和腋窝淋巴结状态是重要补充。结论:MG假阴性乳腺癌具有一定的特征,此类患者需补充乳腺MRI检查以提高癌灶的检出率。 展开更多
关键词 乳腺肿瘤 X线摄影 磁共振成像 假阴性 shap
在线阅读 下载PDF
基于CatBoost和SHAP的高级别自动驾驶车辆非预期停车冲突风险预测
2
作者 刘擎超 王瑞海 +2 位作者 蔡英凤 王海 陈龙 《汽车安全与节能学报》 北大核心 2025年第1期170-180,共11页
针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,... 针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,构建了冲突风险预测模型。结果表明,接管次数在城市中心、住宅区和郊区分别为161次、227次和164次,最高单路段接管次数分别为11次、11次和16次;模型预测精度达93%以上。SHAP分析显示,前后车辆间相对速度和相对位置对冲突风险的影响显著。研究结果对提升自动驾驶车辆的可靠性和安全性具有重要意义。 展开更多
关键词 冲突风险 交通排放 高级别自动驾驶 CatBoost算法 shap解释模型
在线阅读 下载PDF
基于SHAP的可解释机器学习的滑坡易发性评价模型 被引量:6
3
作者 崔婷婷 安雪莲 +2 位作者 孙德亮 陈东升 朱有晨 《成都理工大学学报(自然科学版)》 北大核心 2025年第1期153-172,共20页
机器学习在构建滑坡易发性评价模型中因其训练复杂且预测结果难以解释而发展受限。通过SHAP(SHapley Additive exPlanations)结合机器学习模型揭示各影响因子对滑坡发育的影响,增强模型可信度与可解释性。以三峡库区忠县为研究区,通过... 机器学习在构建滑坡易发性评价模型中因其训练复杂且预测结果难以解释而发展受限。通过SHAP(SHapley Additive exPlanations)结合机器学习模型揭示各影响因子对滑坡发育的影响,增强模型可信度与可解释性。以三峡库区忠县为研究区,通过随机森林、XGBoost(eXtreme Gradient Boosting)以及深度随机森林机器学习算法结合贝叶斯优化算法分别构建滑坡易发性评价模型;利用混淆矩阵及受试者工作特征曲线开展评价精度验证;基于4种分级方法得到滑坡易发性区划图;通过SHAP分析影响滑坡发育的主导因子。结果表明,优化后的XGBoost模型受试者工作特征曲线下面积(AUC)值(0.817)高于随机森林的AUC值(0.803)和深度随机森林的AUC值(0.806);不同分级方式下的易发性区划图分布差异很大,其中基于相等间隔法和XGBoost模型的分级效果相对更好,极高-高易发区主要集中在研究区的东南部和东北部,特别是长江及其支流两岸。SHAP图揭示各主导因子不同特征值对滑坡发育有明显差异,高程和距河流距离是研究区滑坡发育的主要影响因子,对滑坡发育贡献显著。本研究的XGBoost模型具有较高的预测精度,模型可解释性强,为滑坡灾害的精准防治提供科学依据。 展开更多
关键词 XGBoost 深度随机森林 shap 三峡库区 滑坡易发性评价
在线阅读 下载PDF
基于随机森林与SHAP算法的致密砂岩气暂堵效果的影响因素分析
4
作者 黄浩 车恒达 +3 位作者 孔祥伟 辛富斌 向九洲 吉俊杰 《科学技术与工程》 北大核心 2025年第26期11135-11143,共9页
为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂... 为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂堵效果量化模型和公式、暂堵效果算法模型验证,发现暂堵效果量化值与产气贡献率正相关,P=0.037,证明暂堵效果量化模型和公式的准确性高;又因暂堵效果算法模型中,训练集与测试集的MSE、MAE、R^(2)相差微小,证明该模型的泛化能力较强且准确性高。在暂堵效果算法模型的基础之上,开展暂堵效果的影响因素分析,结果表明:总段数、渗透率、暂堵球数量、簇间距和砂比这5个因素对于暂堵效果的影响占比最大。进一步分析单影响因素,发现随总段数增加,暂堵效果增加的规律只适用于直井,对水平井不适用;随渗透率增加,暂堵效果变差;暂堵球数量<50个、簇间距>20 m、砂比介于18%~20%,暂堵效果均可达到正向增长。研究结果可为苏里格等气田现场暂堵作业设计提供借鉴和参考。 展开更多
关键词 苏里格气田 致密砂岩气 暂堵效果 随机森林 shap(shapley additive explanations)值 模型解释
在线阅读 下载PDF
基于无人机图像和SHAP特征筛选的小麦田间产量预测方法研究
5
作者 朱志畅 葛焱 +4 位作者 臧晶荣 李庆 金时超 徐焕良 翟肇裕 《麦类作物学报》 北大核心 2025年第2期264-274,共11页
为了探寻适宜的小麦产量预测模型并提高其精度,从冬小麦灌浆期的无人机多光谱和RGB图像中提取了14种光谱参数和28种形态参数作为特征变量,利用线性回归、随机森林、神经网络等10种机器学习方法构建小麦田间产量预测模型,并比较了模型间... 为了探寻适宜的小麦产量预测模型并提高其精度,从冬小麦灌浆期的无人机多光谱和RGB图像中提取了14种光谱参数和28种形态参数作为特征变量,利用线性回归、随机森林、神经网络等10种机器学习方法构建小麦田间产量预测模型,并比较了模型间预测能力的差异;同时,引入机器学习事后可解释性方法SHAP对输入的特征变量进行重要性分析和筛选,了解其提高模型预测能力的效果。结果表明:(1)10种机器学习模型中,误差逆传播神经网络BPNN的产量预测表现最好(r^(2)=0.826,RMSE=0.094 t·hm^(-2));(2)根据SHAP确定的特征变量重要性排序,花青素反射指数ARI和三维冠层体积Volume对于预测结果的影响最大,占全部特征重要性总和的45.48%;(3)经过SHAP特征筛选后,确定了在BPNN产量预测模型上表现最优的9个特征变量,其预测结果r^(2)为0.865,RMSE为0.075 t·hm^(-2),比使用全特征的BPNN和事前Pearson相关性分析方法在预测精度上均有提升。因此,在优选产量预测模型基础上,可采用SHAP机制对特征变量的重要性进行筛选和分析,以此进一步提高田间小麦产量预测精度。 展开更多
关键词 小麦 无人机图像 机器学习 shap加性解释方法 产量预测
在线阅读 下载PDF
基于RF-SHAP多因素耦合的隧道动态光环境视觉功效响应机制
6
作者 周浩 何世永 +2 位作者 孙远义 侯泽玉 张悦 《隧道建设(中英文)》 北大核心 2025年第10期1881-1893,共13页
隧道不同区段的光环境差异会使驾驶人视场环境发生变化,引起驾驶人信息感知错误,威胁行车安全,且视场对比度的动态变化易诱发视觉疲劳与感知能力降低。为揭示隧道动态光环境中视场对比度及其梯度变化对驾驶人视觉功效的影响机制,通过多... 隧道不同区段的光环境差异会使驾驶人视场环境发生变化,引起驾驶人信息感知错误,威胁行车安全,且视场对比度的动态变化易诱发视觉疲劳与感知能力降低。为揭示隧道动态光环境中视场对比度及其梯度变化对驾驶人视觉功效的影响机制,通过多因素控制试验(目标位置、颜色、亮度、视场对比度耦合控制),构建“视场对比度动态梯度-视觉功效响应”耦合分析框架,并创新引入RF-SHAP(random forest-Shapley additive explanation)可解释机器学习算法解析多参数非线性作用。结果表明:1)视场对比度存在拐点效应,入口段视场对比度为0.2~0.4时可缩短反应时间20.5%,视场对比度由0.4提升到0.6时仅缩短反应时间2.3%。2)亮度与视场对比度存在强交互效应,中间段背景亮度提升至8.75 cd/m^(2)时可补偿低视场对比度视觉信号,目标识别成功率达70%(较背景亮度为4.50 cd/m^(2)时提升30%)。3)视野边缘(30°位置)环境敏感性高于中心区(5°位置),低视场对比度(0.2)与高亮度(6000 cd/m^(2))在视野边缘(30°位置)叠加时,反应时间最大增幅达53.1%。4)暖色调目标(红色)较冷色(蓝色)识别效率提升14.2%,尤其在低视场对比度(0.1)时色差影响最显著。5)RF-SHAP模型揭示了视场对比度与亮度为视觉功效主导因子,且存在U形影响曲线,验证了动态光环境参数阈值的工程适用性。 展开更多
关键词 隧道照明 动态光环境 视场对比度 视觉功效 随机森林 shap
在线阅读 下载PDF
基于HA-RF-SHAP的露天煤矿粉尘浓度预测模型 被引量:6
7
作者 金磊 杨晓伟 +4 位作者 张浩 杜勇志 李新鹏 戴春田 周伟 《西安科技大学学报》 CAS 北大核心 2024年第1期74-83,共10页
为了有效预测和控制煤矿粉尘浓度,保障煤矿工人健康及环境安全,以宝日希勒露天煤矿现场粉尘监测数据为基础,使用随机森林对粉尘浓度进行预测,提出了4种启发式智能优化算法优化随机森林超参数的方法,通过RMSE、MAE和皮尔逊相关系数R对模... 为了有效预测和控制煤矿粉尘浓度,保障煤矿工人健康及环境安全,以宝日希勒露天煤矿现场粉尘监测数据为基础,使用随机森林对粉尘浓度进行预测,提出了4种启发式智能优化算法优化随机森林超参数的方法,通过RMSE、MAE和皮尔逊相关系数R对模型进行评价,采用SHAP可解释模型分析影响露天煤矿粉尘浓度的因素。结果表明:PM2.5、PM10、TSP的最优模型分别为GWO-RF、WOA-RF和HHO-RF;超参数调整使模型整体RMSE指标提升约为1~3,MAE提升约为1~2.5,R提升约4%~6%;PM2.5的预测表现最好,训练集与测试集共同作用时,R为0.9463,MAE为3.059,RMSE为4.919,其次是PM10、TSP;单因素作用时,湿度对于该矿粉尘浓度影响最大,双因素同时影响下湿度和气压对粉尘浓度变化影响最大。研究提供了一个有效的粉尘浓度预测方法,可准确预测粉尘浓度并确定粉尘最影响因素,对矿山粉尘管控具有重要参考价值。 展开更多
关键词 露天煤矿 粉尘浓度预测 启发式算法 shap 模型可解释性
在线阅读 下载PDF
土石方开挖钻孔效率预测可解释超级学习器集成学习模型
8
作者 王晓玲 胡亦宁 +3 位作者 张君 衣传宝 张捷 李希稷 《天津大学学报(自然科学与工程技术版)》 北大核心 2025年第4期331-342,共12页
动态预测钻孔效率并探究不同因素对钻孔效率的影响程度,对土石方开挖进度分析和风险管理具有重要意义.然而,现有土石方钻孔效率分析大都依赖人工经验,少数机器学习模型无法解释不同因素对钻孔效率的影响程度.针对上述问题,本研究提出土... 动态预测钻孔效率并探究不同因素对钻孔效率的影响程度,对土石方开挖进度分析和风险管理具有重要意义.然而,现有土石方钻孔效率分析大都依赖人工经验,少数机器学习模型无法解释不同因素对钻孔效率的影响程度.针对上述问题,本研究提出土石方开挖钻孔效率预测可解释超级学习器(SL)集成学习模型.通过强化学习中的Q学习改进猎人猎物优化算法局部搜索过程与全局信息进行交互的能力,提出Q学习改进的猎人猎物优化(QIHPO)算法对SL的n_estimators、learning_rate、max_depth等超参数进行优化,进而利用SL能够通过具有互补特征的异构基学习器捕捉样本特征差异性的优势,建立基于QIHPO优化的超级学习器土石方开挖钻孔效率预测QIHPO-SL模型,以揭示地质、作业、环境和机械特性等众多因素与钻孔效率的复杂非线性映射关系.进一步将QIHPO-SL集成学习算法与可解释机器学习框架下的沙普利加性解释(SHAP)理论相结合,挖掘影响钻孔效率的关键特征,并解释不同因素对钻孔效率的影响程度.案例分析表明:QIHPO-SL具有较高的预测精度,相较于QIHPO-XGB、QIHPO-RF和SL等基准模型,本文所提方法的预测精度分别提高了12.94%、12.02%和1.58%,且SHAP理论提高了模型的可解释性和预测结果的可信度,为钻孔效率预测及致因分析提供了新思路和新途径. 展开更多
关键词 钻孔效率 沙普利加性解释 超级学习器 强化学习
在线阅读 下载PDF
基于不同机器学习方法构建非心脏手术老年患者术后谵妄预测模型
9
作者 石金云 陈荣 +2 位作者 李文媛 纪木火 李青 《临床麻醉学杂志》 北大核心 2025年第3期240-245,共6页
目的采用不同机器学习方法构建非心脏手术老年患者术后谵妄(POD)的预测模型其性能。方法收集2022年4月至2024年4月行非心脏手术的905例老年患者围术期资料,包括人口学特征、既往合并症、术前认知功能评估、实验室检查结果、麻醉记录单等... 目的采用不同机器学习方法构建非心脏手术老年患者术后谵妄(POD)的预测模型其性能。方法收集2022年4月至2024年4月行非心脏手术的905例老年患者围术期资料,包括人口学特征、既往合并症、术前认知功能评估、实验室检查结果、麻醉记录单等共102个变量。采用单因素分析初步筛选危险因素,将有统计学差异(P<0.05)的变量纳入最小绝对收缩与选择算子(LASSO)筛选特征变量,应用随机森林(RF)、支持向量机(SVM)、自适应增强算法(Adaboost)和神经网络(NN)4种机器学习方法构建POD预测模型,采用受试者工作特征曲线下面积(AUROC)、精确度-召回率(PR)曲线的平均精度(AP)、Brier评分等对模型进行综合评估,引入Shapley加性解释(SHAP)对最优机器学习模型进行可解释化分析。结果有155例(17%)患者发生POD,经LASSO回归分析后,确定10个特征变量用于构建机器学习模型。4种机器学习模型中,RF的AUROC最高为0.90(95%CI 0.86~0.93),AP为0.8,Brier评分为0.086。SHAP模型解释性分析显示,对POD贡献度最高的是手术时间。结论在应用4种机器学习方法构建的非心脏手术老年患者POD预测模型中,RF的预测效能最佳。 展开更多
关键词 非心脏外科手术 术后谵妄 机器学习 预测模型 shapley加性解释
在线阅读 下载PDF
基于集成因子优选算法的面板堆石坝变形预测模型
10
作者 郑好 李登华 丁勇 《排灌机械工程学报》 北大核心 2025年第2期178-186,共9页
面板堆石坝变形主要受外部荷载和内部材料蠕变影响,而影响因子过多会造成特征冗余,引起预测精度过拟合问题;因子过少导致信息表达不全,造成预测效果差,模型泛化能力不足等问题.因此构建涵盖面广,可解释性强的因子集并从中优选格外重要.... 面板堆石坝变形主要受外部荷载和内部材料蠕变影响,而影响因子过多会造成特征冗余,引起预测精度过拟合问题;因子过少导致信息表达不全,造成预测效果差,模型泛化能力不足等问题.因此构建涵盖面广,可解释性强的因子集并从中优选格外重要.针对上述问题,文中提出基于集成因子优选算法的面板堆石坝变形预测模型,使用ReliefF与沙普利加性解释(SHAP)算法通过权重集成获得因子贡献值排序,再分析因子累计贡献率差量阈值剔除非关键因子,获得关键因子.以新疆某混凝土面板堆石坝为例,以特征缩减率FRR、归一化平均绝对百分比误差nMAPE、平均绝对误差MAE、均方误差MSE以及决定系数R^(2)为评价指标,试验结果表明文中提出的算法面对不同的预测模型都可准确地获得最佳因子,有效地提升了预测精度.相对于传统因子优选算法适应性更强,预测能力提升最显著,解决了影响因子冗余或者欠缺带来的预测能力较低的问题,提高了模型的泛化能力,为大坝安全监测研究提供了行之有效的因子优选方法. 展开更多
关键词 大坝安全监测 因子优选 shap理论 贡献度排序
在线阅读 下载PDF
基于多模态超声及病理参数的可解释性机器学习模型预测T1~T2期乳腺癌腋窝淋巴结转移负荷
11
作者 张宇 汪珺莉 +2 位作者 范莉芳 陈国仙 强邦红 《中国医学计算机成像杂志》 北大核心 2025年第4期484-490,共7页
目的:研究利用多模态超声成像和病理参数构建的可解释性机器学习模型在预测T1~T2期乳腺癌患者的腋窝淋巴结(ALN)转移负荷中的临床效用。方法:回顾性分析芜湖市第二人民医院经术后病理证实的260例乳腺癌患者的临床、超声及病理资料。根据... 目的:研究利用多模态超声成像和病理参数构建的可解释性机器学习模型在预测T1~T2期乳腺癌患者的腋窝淋巴结(ALN)转移负荷中的临床效用。方法:回顾性分析芜湖市第二人民医院经术后病理证实的260例乳腺癌患者的临床、超声及病理资料。根据ALN转移负荷状态分为轻度负荷组(0~2个转移淋巴结)及重度负荷组(≥3个转移淋巴结),按6︰4将患者随机分为训练组(n=156)与验证组(n=104)。单因素和多因素logistic回归分析用于甄别T1~T2期乳腺癌患者ALN转移的独立预测因子。利用逻辑回归(LR)、决策树(DT)、随机森林(RF)、支持向量机(SVM)等4种不同机器学习(ML)算法分别构建预测模型,使用受试者工作特征(ROC)曲线下面积(AUC)评估其性能,并通过Shapley加性解释(SHAP)可视化各特征贡献。结果:单因素与多因素logistic回归分析显示自动乳腺全容积成像(ABVS)冠状面汇聚征、超声淋巴结阳性及脉管侵犯是预测T1~T2期乳腺癌ALN转移负荷的独立危险因子。训练组和验证组ML模型的AUC在0.765到0.937之间。其中,SVM模型在验证组中显示出最高的预测性能,其AUC值达到0.937,作为本研究的输出模型,SHAP显示脉管侵犯是ALN转移负荷最重要的危险因子。结论:结合多模态超声与病理参数的可解释性ML模型,可为T1~T2期乳腺癌患者提供更精确的ALN转移负荷评估。特别是SVM模型在验证组中表现突出,显示出其在提升临床决策中的潜在应用价值。 展开更多
关键词 多模态超声 机器学习 乳腺癌 shapley加性解释
在线阅读 下载PDF
驾驶性主客观综合评价方法在起步工况下的应用
12
作者 吴飞 孙现魁 王鹏程 《华南理工大学学报(自然科学版)》 北大核心 2025年第6期66-76,共11页
为提高驾驶性评价方法的准确性与可靠性,提出一种融合极限梯度提升算法、麻雀搜索算法与沙普利解释算法的主客观综合评价方法。该研究以车辆起步工况为目标,定义车辆起步工况下的9项客观评价指标,完善驾驶性起步工况的评价体系;提出以... 为提高驾驶性评价方法的准确性与可靠性,提出一种融合极限梯度提升算法、麻雀搜索算法与沙普利解释算法的主客观综合评价方法。该研究以车辆起步工况为目标,定义车辆起步工况下的9项客观评价指标,完善驾驶性起步工况的评价体系;提出以极限梯度提升算法双向映射客观评价指标值与主观评分,为避免驾驶性评价模型陷入局部最优解,采用麻雀搜索算法对极限梯度提升算法的核心超参数进行快速寻优,使得驾驶性评价模型在数据集扩充后具有自主迭代能力;最后利用沙普利解释算法对映射模型进行特征归因,量化客观评价指标对驾驶性评价的影响权重,构建兼具预测准确性、稳定性与可解释性的驾驶性综合评价模型。应用该方法,结合国内外主流驾驶性综合评价进行多次道路试验,对比分析结果表明:所提出的驾驶性评价模型的平均绝对误差、均方根误差和决定系数均优于BP神经网络、随机森林与极限学习机等主流驾驶性评价算法,映射准确性相较于其他方法明显提升,且该驾驶性综合评价方法具有一定的可解释性,对驾驶性评价中的主客观综合评价具有参考意义。 展开更多
关键词 驾驶性 起步工况 评价方法 极限梯度提升算法 沙普利解释算法
在线阅读 下载PDF
基于多信息融合的INFO-VMD-CNN的齿轮箱故障诊断方法
13
作者 吴胜利 郑子润 邢文婷 《振动与冲击》 北大核心 2025年第13期309-316,共8页
针对齿轮箱振动信号复杂多变,导致现有的齿轮箱故障诊断方法诊断精度不高、较弱故障特征容易被噪声淹没等问题,提出了一种基于向量加权平均优化算法(weighted mean of vectors,INFO)、变分模态分解(variational mode decomposition,VMD... 针对齿轮箱振动信号复杂多变,导致现有的齿轮箱故障诊断方法诊断精度不高、较弱故障特征容易被噪声淹没等问题,提出了一种基于向量加权平均优化算法(weighted mean of vectors,INFO)、变分模态分解(variational mode decomposition,VMD)和卷积神经网络(convolutional neural network,CNN)的齿轮故障诊断方法。该方法首先采用熵权法将不同位置的振动传感器信号信息进行融合,利用INFO对VMD算法中参数进行优化,并设计一个复合评价指标作为参数优化的评价标准,使用奇异峭度差分谱的方法对敏感分量进行重构;其次,从重构的信号中提取时域、频域特征并输入到CNN模型中进行分类;最后通过Shap(Shapley additive explanations)值法对模型输入特征的重要性进行排序,分析不同特征组合对模型分类和特定故障识别的影响。在东南大学行星齿轮数据集上进行验证,结果表明,利用所提特征组合进行故障诊断,CNN模型故障诊断准确率为98.24%,高于其他特征组合,为行星齿轮箱的故障诊断提供了一组有效的特征指标。 展开更多
关键词 行星齿轮箱故障诊断 向量加权平均算法(INFO) 奇异峭度差分谱 卷积神经网络(CNN) 评价指标 shap值法
在线阅读 下载PDF
基于深度学习的重质馏分油分子层次组成预测模型 被引量:1
14
作者 袁壮 王源 +6 位作者 杨哲 徐伟 周鑫 赵辉 陈小博 杨朝合 林扬 《石油学报(石油加工)》 北大核心 2025年第2期362-370,共9页
随着工业大数据时代的到来,基于深度学习建立的原油分子组成预测模型具有适用范围广、构建快捷、准确性高等优点。然而,石油馏分分子层次信息标签获取困难,难以满足深度学习模型训练需求。为解决上述问题,基于商业流程模拟软件Aspen HY... 随着工业大数据时代的到来,基于深度学习建立的原油分子组成预测模型具有适用范围广、构建快捷、准确性高等优点。然而,石油馏分分子层次信息标签获取困难,难以满足深度学习模型训练需求。为解决上述问题,基于商业流程模拟软件Aspen HYSYS与GC-MS×MS全二维气相色谱-飞行时间质谱联用仪提出了一种创新方法,建立足够规模的训练数据库。采用深度神经网络(DNN)建立了重质馏分油分子层次结构组成预测模型,该模型以炼油厂易测得的油品物理化学性质为输入,分子层次结构信息为输出,针对某炼油厂的催化裂化原料油进行分子组成预测,通过SHAP(SHapley Additive exPlanation)方法对模型进行可解释分析。结果表明,基于深度学习的重质馏分油分子组成预测模型能够准确地预测油品分子层次结构信息,目标装置原料分子组成预测平均相对误差小于8%。该模型不仅可对其他炼化装置的原料油性质进行软测量,也可为石油分子层次模型的开发提供准确的重油原料分子信息模型。 展开更多
关键词 重质馏分油 分子组成 深度学习 shapley additive explanation(shap)解释 分子管理
在线阅读 下载PDF
预测改性双基推进剂燃速的机器学习建模 被引量:1
15
作者 陈少臣 郭建雄 +4 位作者 熊思璇 刘哲人 王晓晨 马煜 代志龙 《固体火箭技术》 北大核心 2025年第1期124-132,共9页
为高效评估改性双基(CMDB)推进剂配方的燃速,使用机器学习(ML)方法建立CMDB推进剂配方的燃速预测模型。首先,对含有137个样本的CMDB推进剂配方-燃速数据集进行相关性分析以确定ML模型的17个输入特征,随后使用该数据集训练、优化与评估6... 为高效评估改性双基(CMDB)推进剂配方的燃速,使用机器学习(ML)方法建立CMDB推进剂配方的燃速预测模型。首先,对含有137个样本的CMDB推进剂配方-燃速数据集进行相关性分析以确定ML模型的17个输入特征,随后使用该数据集训练、优化与评估6个ML模型,包括岭回归(RR)、随机森林、梯度提升树(GBDT)、极端梯度提升(XGB)、支持向量机(SVM)和人工神经网络(ANN);然后,采用置换特征重要度与沙普利加性(SHAP)解释方法计算预测精确度最高的黑盒模型的特征重要度,并使用SHAP寻找特征与燃速之间的关系;最后,计算白盒模型RR的权重系数,以获取其特征重要度、特征与燃速的关系,并与前一个模型的结果进行对比。结果表明,GBDT、XGB、SVM和ANN模型的决定系数(R^(2))均超过了0.99,其预测值的残差和相对百分误差主要分布在-1~1 mm·s^(-1)、-10%~10%。通过解释SVM(R^(2)排名第一)与RR模型,发现两个模型都为燃速抑制剂、Al、催化剂的质量分数和工作压强赋予了很高的特征重要度,会显著影响燃速。此外,增加燃速抑制剂等组分的质量分数会降低燃速,而增加Al、催化剂等组分的质量分数与工作压强则会提升燃速。 展开更多
关键词 CMDB推进剂 燃速 机器学习 置换特征重要度 沙普利加性解释
在线阅读 下载PDF
基于可解释机器学习的河套平原盐碱农田土壤水分和有机质含量估算
16
作者 丁启东 黄华雨 +3 位作者 张俊华 杨凌彬 贾科利 郝凤霞 《水土保持通报》 北大核心 2025年第4期184-197,共14页
[目的]针对传统方法在盐碱化农田土壤水分(SMC)和有机质含量(SOMC)监测中存在效率低下的问题,探索高光谱数据结合可解释机器学习的估算方法,以期为河套平原盐碱化土壤信息快速获取和土壤质量评价提供理论依据。[方法]以地面高光谱反射... [目的]针对传统方法在盐碱化农田土壤水分(SMC)和有机质含量(SOMC)监测中存在效率低下的问题,探索高光谱数据结合可解释机器学习的估算方法,以期为河套平原盐碱化土壤信息快速获取和土壤质量评价提供理论依据。[方法]以地面高光谱反射率及实测SMC和SOMC为数据源,对光谱数据采用分数阶微分(FOD)变换并构建光谱指数,基于偏最小二乘回归(PLSR)、支持向量机(SVM)和随机森林(RF)算法建模,并引入夏普利加性解释(SHAP)方法解析变量对模型预测结果的相对贡献,提升模型的解释性。[结果]①经1.25阶微分变换后构建的光谱指数与SMC和SOMC间相关性最强,其中,广义差异指数(GDI)和最优光谱指数(OSI)与SMC和SOMC间相关系数最大,分别为0.5054和0.6825。②RF模型对SMC和SOMC的估算精度远高于PLSR和SVM;SMC和SOMC-RF模型验证集(R^(2))、均方根误差(RMSE)和相对分析误差(RPD)分别为0.734,3.28,2.07及0.870,1.53,2.43。③SHAP分析发现,氮平面域指数(NPDI)和比值指数(RI)分别在SMC和SOMC的建模估算中贡献度最大,且NPDI,OSI和差值指数(DI)对SMC的建模贡献度累计达到68.58%;RI,GDI和NPDI对SOMC的建模贡献度累计达到61.86%。[结论]FOD联合光谱指数在高光谱数据的有效利用中具有明显优势,RF模型在土壤属性估算中展现了较高的精度和鲁棒性,SHAP分析有效揭示了不同变量对目标变量的贡献度。NPDI,RI,OSI和DI等光谱指数在盐碱化农田SMC和SOMC的建模估算中贡献显著。 展开更多
关键词 高光谱 土壤盐碱化 机器学习 夏普利加性解释 数字土壤制图
在线阅读 下载PDF
机器学习模型预测机器人辅助肾部分切除术后肾功能减退
17
作者 李静 王林峰 +8 位作者 张高杰 黄勇 高英英 孙蕊 曹扬 李秋辰 何浩 魏子凌 刘佳渝 《重庆医科大学学报》 北大核心 2025年第4期457-462,共6页
目的:探讨多种机器学习模型预测机器人辅助肾部分切除术(robot-assisted partial nephrectomy,RAPN)后肾功能减退的效能,为临床风险分层提供依据。方法:回顾性纳入2019年1月至2023年12月重庆医科大学附属第一医院泌尿外科733例肾细胞癌(... 目的:探讨多种机器学习模型预测机器人辅助肾部分切除术(robot-assisted partial nephrectomy,RAPN)后肾功能减退的效能,为临床风险分层提供依据。方法:回顾性纳入2019年1月至2023年12月重庆医科大学附属第一医院泌尿外科733例肾细胞癌(renal cell carcinoma,RCC)行RAPN患者的临床数据,整合人口学特征、实验室指标及围手术期参数,构建7种机器学习模型,采用Shapley加性解释(Shapley additive explanations,SHAP)方法解析关键预测因子,并通过受试者工作特征曲线下面积(receiver operating characteristic curve area under the curve,ROC-AUC)评估模型性能。结果:随机森林模型预测效能最优(AUC=0.84)。SHAP分析显示,中性粒细胞/淋巴细胞比值、肿瘤直径、凝血酶原时间国际标准化比值、白细胞计数及术中出血量等因素对术后肾功能减退有明显影响。结论:本研究为临床提供了一种潜在的预测工具,可帮助识别高风险患者并优化术后管理策略。 展开更多
关键词 机器人辅助肾部分切除术 肾功能减退 机器学习模型 shap分析 预测模型 术后管理
在线阅读 下载PDF
基于机器学习构建全髋置换术患者术后谵妄风险的预测模型
18
作者 王小锋 蔡宁 +2 位作者 王建彭 杨芳芳 王秋锋 《临床麻醉学杂志》 北大核心 2025年第10期1021-1027,共7页
目的 基于Shapley加性解释(SHAP)和机器学习(ML)模型构建预测全髋置换术(THA)患者术后谵妄(POD)风险预测模型并开发在线应用程序。方法 选择2023年1月至2024年11月行THA的患者277例,男76例,女201例,年龄≥65岁,BMI 18.5~30.0 kg/m^(2),... 目的 基于Shapley加性解释(SHAP)和机器学习(ML)模型构建预测全髋置换术(THA)患者术后谵妄(POD)风险预测模型并开发在线应用程序。方法 选择2023年1月至2024年11月行THA的患者277例,男76例,女201例,年龄≥65岁,BMI 18.5~30.0 kg/m^(2),ASAⅠ—Ⅲ级。通过Boruta算法筛选THA患者发生POD的风险因素。基于风险因素构建、训练和比较6种ML模型,使用受试者工作特征(ROC)曲线和校准曲线评估6种ML模型,筛选最佳预测性能模型。使用SHAP值对ML模型进行解释和可视化,并使用Shiny等R包开发预测THA患者POD风险的在线应用程序。结果 有65例(23.8%)患者发生POD。Boruta算法筛选出麻醉时间、C-反应蛋白(CRP)浓度、年龄、顺式阿曲库铵用量、七氟醚用量、术中失血量、手术时间以及白蛋白(Alb)浓度是THA患者发生POD的风险因素。6种ML算法中,ROC曲线和校准曲线证实极端梯度提升(XGBoost)模型预测POD风险性能最高。基于SHAP值附加解释和可视化XGBoost模型能以极高准确度预测POD风险。在线应用程序网址https://mldynamic.shinyapps.io/PD-web/。结论 麻醉时间、CRP浓度、年龄、顺式阿曲库铵用量、七氟醚用量、术中失血量、手术时间以及Alb浓度是THA患者发生POD的风险因素。基于SHAP值解释的XGBoost模型有极高的预测性能,基于此开发的在线应用程序能帮助使用者快捷计算THA患者POD风险,优化治疗方案。 展开更多
关键词 全髋置换术 术后谵妄 机器学习 Boruta算法 shapley加性解释
在线阅读 下载PDF
胸部微创手术患者术后慢性疼痛的危险因素
19
作者 樊纪彩 朱贵芹 +1 位作者 刘岳鹏 岳冬梅 《临床麻醉学杂志》 北大核心 2025年第9期940-946,共7页
目的分析胸部微创手术患者术后慢性疼痛发生的独立危险因素。方法本研究为巢式病例-对照研究,纳入胸部微创手术患者158例,男77例,女81例,年龄50~74岁,BMI 18.5~30.0 kg/m^(2),ASAⅠ—Ⅲ级。收集患者一般资料以及围术期可能对术后疼痛产... 目的分析胸部微创手术患者术后慢性疼痛发生的独立危险因素。方法本研究为巢式病例-对照研究,纳入胸部微创手术患者158例,男77例,女81例,年龄50~74岁,BMI 18.5~30.0 kg/m^(2),ASAⅠ—Ⅲ级。收集患者一般资料以及围术期可能对术后疼痛产生影响的资料,尤其是围术期急性疼痛相关资料。采用Boruta算法进行变量筛选,采用多因素Logistic回归分析相关独立危险因素,采用受试者工作特征曲线下面积(AUROC)分析围术期急性疼痛指标预测术后慢性疼痛的效能,采用XGboost+Shapley加性解释(SHAP)分析方法结合限制性立方样条回归具体描述术后动肩疼痛与术后慢性疼痛的相关性。结果Boruta法筛选出与术后慢性疼痛相关的指标为术后动肩疼痛、术后疼痛轨迹、术后咳嗽疼痛、经肋缝合、手术入路、背阔肌保留和瘢痕长度。多因素Logistic回归分析显示,术后动肩疼痛(OR=1.69,95%CI 1.32~2.17)和经肋缝合(OR=0.28,95%CI 0.09~0.91)与术后慢性疼痛相关。术后动肩疼痛与术后慢性疼痛相关且在各种围术期急性疼痛指标中具有最大的AUROC为0.714(95%CI 0.678~0.749)。SHAP分析显示术后动肩疼痛评分3分以上才会导致术后慢性疼痛的发生,且术后动肩疼痛评分3分以上对术后慢性疼痛贡献的线性回归拟合显示β值为0.291(95%CI 0.242~0.341),同时,SHAP交互作用分析显示在导致术后慢性疼痛方面,术后动肩疼痛与瘢痕长度和手术入路之间可能有弱协同作用(0.1<交互值<0.5)。结论各种围术期急性疼痛指标中,动肩疼痛评分3分以上是胸部微创手术后慢性疼痛的良好预测指标。 展开更多
关键词 胸部微创手术 术后慢性疼痛 围术期急性疼痛 独立危险因素 shapley加性解释分析
在线阅读 下载PDF
基于机器学习的铜电解精炼电积过程电压及出液铜离子浓度预测模型研究
20
作者 闫哲祯 卢金成 +3 位作者 程寒 廖嘉琪 徐夫元 段宁 《有色金属(冶炼部分)》 北大核心 2025年第9期13-24,共12页
电积是目前最为常用的铜电解液净化工艺,其出口铜离子浓度波动大、人工调控难度高,易造成后续硫化单元处理负荷剧增及铜砷共沉淀产废量增大,而传统预测模型存在不可解释、稳态限制、低泛化能力等缺陷。为此,构建了企业电积生产过程电压... 电积是目前最为常用的铜电解液净化工艺,其出口铜离子浓度波动大、人工调控难度高,易造成后续硫化单元处理负荷剧增及铜砷共沉淀产废量增大,而传统预测模型存在不可解释、稳态限制、低泛化能力等缺陷。为此,构建了企业电积生产过程电压及出液铜离子浓度准确预测的多参数模型。通过对比研究10种机器学习模型,发现GBR在电压预测中表现最优(决定系数R^(2)=0.79,均方误差MSE=1.25),XGBoost对出液铜离子浓度的预测准确度最高(R^(2)=0.87,MSE=5.58)。SHAP解释性分析表明,电流和时间分别是影响电压和出液铜离子浓度变化的主控因素。模型决策机制与电化学原理及质量守恒定律一致,突破了传统模型对非线性关系的表征局限,为异常工况的预警诊断、关键参数动态优化控制及减少污染物产生提供依据。 展开更多
关键词 铜电积 机器学习 Gradient Boosting Regression(GBR) eXtreme Gradient Boosting(XGBoost) 解释性分析 shapley additive explanations(shap)
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部