期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
基于Shapley additive explanations(SHAP)分析乳腺X线检查假阴性乳腺癌的特征 被引量:4
1
作者 杨蔚 张宁妹 +1 位作者 张朝林 尹清云 《中国医学计算机成像杂志》 CSCD 北大核心 2023年第3期271-276,共6页
目的:基于Shapley additive explanations(SHAP)分析乳腺X线摄影(MG)检查假阴性乳腺癌的特征。方法:回顾性收集我院2018年1月—2022年5月首诊乳腺癌患者,评估临床病理和影像学表现。通过logistic回归分析确定MG假阴性乳腺癌的独立危险... 目的:基于Shapley additive explanations(SHAP)分析乳腺X线摄影(MG)检查假阴性乳腺癌的特征。方法:回顾性收集我院2018年1月—2022年5月首诊乳腺癌患者,评估临床病理和影像学表现。通过logistic回归分析确定MG假阴性乳腺癌的独立危险因素。应用SHAP分析各独立危险因素的贡献价值。结果:1505个病灶纳入研究,MG假阴性乳腺癌373个。较小的病灶、致密或不均匀致密的MG密度、无可疑钙化、非肿块样强化(NME)、原位癌和腋窝淋巴结阴性与MG假阴性乳腺癌独立相关,上述参数构建的联合模型具有良好的预测效能(AUC=0.871)。根据SHAP分析,病灶大小、MG密度和病灶MRI强化类型是导致MG假阴性的主要因素;钙化状态、病理类型和腋窝淋巴结状态是重要补充。结论:MG假阴性乳腺癌具有一定的特征,此类患者需补充乳腺MRI检查以提高癌灶的检出率。 展开更多
关键词 乳腺肿瘤 X线摄影 磁共振成像 假阴性 shap
在线阅读 下载PDF
基于CatBoost和SHAP的高级别自动驾驶车辆非预期停车冲突风险预测
2
作者 刘擎超 王瑞海 +2 位作者 蔡英凤 王海 陈龙 《汽车安全与节能学报》 北大核心 2025年第1期170-180,共11页
针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,... 针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,构建了冲突风险预测模型。结果表明,接管次数在城市中心、住宅区和郊区分别为161次、227次和164次,最高单路段接管次数分别为11次、11次和16次;模型预测精度达93%以上。SHAP分析显示,前后车辆间相对速度和相对位置对冲突风险的影响显著。研究结果对提升自动驾驶车辆的可靠性和安全性具有重要意义。 展开更多
关键词 冲突风险 交通排放 高级别自动驾驶 CatBoost算法 shap解释模型
在线阅读 下载PDF
基于SHAP的可解释机器学习的滑坡易发性评价模型 被引量:3
3
作者 崔婷婷 安雪莲 +2 位作者 孙德亮 陈东升 朱有晨 《成都理工大学学报(自然科学版)》 北大核心 2025年第1期153-172,共20页
机器学习在构建滑坡易发性评价模型中因其训练复杂且预测结果难以解释而发展受限。通过SHAP(SHapley Additive exPlanations)结合机器学习模型揭示各影响因子对滑坡发育的影响,增强模型可信度与可解释性。以三峡库区忠县为研究区,通过... 机器学习在构建滑坡易发性评价模型中因其训练复杂且预测结果难以解释而发展受限。通过SHAP(SHapley Additive exPlanations)结合机器学习模型揭示各影响因子对滑坡发育的影响,增强模型可信度与可解释性。以三峡库区忠县为研究区,通过随机森林、XGBoost(eXtreme Gradient Boosting)以及深度随机森林机器学习算法结合贝叶斯优化算法分别构建滑坡易发性评价模型;利用混淆矩阵及受试者工作特征曲线开展评价精度验证;基于4种分级方法得到滑坡易发性区划图;通过SHAP分析影响滑坡发育的主导因子。结果表明,优化后的XGBoost模型受试者工作特征曲线下面积(AUC)值(0.817)高于随机森林的AUC值(0.803)和深度随机森林的AUC值(0.806);不同分级方式下的易发性区划图分布差异很大,其中基于相等间隔法和XGBoost模型的分级效果相对更好,极高-高易发区主要集中在研究区的东南部和东北部,特别是长江及其支流两岸。SHAP图揭示各主导因子不同特征值对滑坡发育有明显差异,高程和距河流距离是研究区滑坡发育的主要影响因子,对滑坡发育贡献显著。本研究的XGBoost模型具有较高的预测精度,模型可解释性强,为滑坡灾害的精准防治提供科学依据。 展开更多
关键词 XGBoost 深度随机森林 shap 三峡库区 滑坡易发性评价
在线阅读 下载PDF
基于无人机图像和SHAP特征筛选的小麦田间产量预测方法研究
4
作者 朱志畅 葛焱 +4 位作者 臧晶荣 李庆 金时超 徐焕良 翟肇裕 《麦类作物学报》 北大核心 2025年第2期264-274,共11页
为了探寻适宜的小麦产量预测模型并提高其精度,从冬小麦灌浆期的无人机多光谱和RGB图像中提取了14种光谱参数和28种形态参数作为特征变量,利用线性回归、随机森林、神经网络等10种机器学习方法构建小麦田间产量预测模型,并比较了模型间... 为了探寻适宜的小麦产量预测模型并提高其精度,从冬小麦灌浆期的无人机多光谱和RGB图像中提取了14种光谱参数和28种形态参数作为特征变量,利用线性回归、随机森林、神经网络等10种机器学习方法构建小麦田间产量预测模型,并比较了模型间预测能力的差异;同时,引入机器学习事后可解释性方法SHAP对输入的特征变量进行重要性分析和筛选,了解其提高模型预测能力的效果。结果表明:(1)10种机器学习模型中,误差逆传播神经网络BPNN的产量预测表现最好(r^(2)=0.826,RMSE=0.094 t·hm^(-2));(2)根据SHAP确定的特征变量重要性排序,花青素反射指数ARI和三维冠层体积Volume对于预测结果的影响最大,占全部特征重要性总和的45.48%;(3)经过SHAP特征筛选后,确定了在BPNN产量预测模型上表现最优的9个特征变量,其预测结果r^(2)为0.865,RMSE为0.075 t·hm^(-2),比使用全特征的BPNN和事前Pearson相关性分析方法在预测精度上均有提升。因此,在优选产量预测模型基础上,可采用SHAP机制对特征变量的重要性进行筛选和分析,以此进一步提高田间小麦产量预测精度。 展开更多
关键词 小麦 无人机图像 机器学习 shap加性解释方法 产量预测
在线阅读 下载PDF
基于HA-RF-SHAP的露天煤矿粉尘浓度预测模型 被引量:6
5
作者 金磊 杨晓伟 +4 位作者 张浩 杜勇志 李新鹏 戴春田 周伟 《西安科技大学学报》 CAS 北大核心 2024年第1期74-83,共10页
为了有效预测和控制煤矿粉尘浓度,保障煤矿工人健康及环境安全,以宝日希勒露天煤矿现场粉尘监测数据为基础,使用随机森林对粉尘浓度进行预测,提出了4种启发式智能优化算法优化随机森林超参数的方法,通过RMSE、MAE和皮尔逊相关系数R对模... 为了有效预测和控制煤矿粉尘浓度,保障煤矿工人健康及环境安全,以宝日希勒露天煤矿现场粉尘监测数据为基础,使用随机森林对粉尘浓度进行预测,提出了4种启发式智能优化算法优化随机森林超参数的方法,通过RMSE、MAE和皮尔逊相关系数R对模型进行评价,采用SHAP可解释模型分析影响露天煤矿粉尘浓度的因素。结果表明:PM2.5、PM10、TSP的最优模型分别为GWO-RF、WOA-RF和HHO-RF;超参数调整使模型整体RMSE指标提升约为1~3,MAE提升约为1~2.5,R提升约4%~6%;PM2.5的预测表现最好,训练集与测试集共同作用时,R为0.9463,MAE为3.059,RMSE为4.919,其次是PM10、TSP;单因素作用时,湿度对于该矿粉尘浓度影响最大,双因素同时影响下湿度和气压对粉尘浓度变化影响最大。研究提供了一个有效的粉尘浓度预测方法,可准确预测粉尘浓度并确定粉尘最影响因素,对矿山粉尘管控具有重要参考价值。 展开更多
关键词 露天煤矿 粉尘浓度预测 启发式算法 shap 模型可解释性
在线阅读 下载PDF
土石方开挖钻孔效率预测可解释超级学习器集成学习模型
6
作者 王晓玲 胡亦宁 +3 位作者 张君 衣传宝 张捷 李希稷 《天津大学学报(自然科学与工程技术版)》 北大核心 2025年第4期331-342,共12页
动态预测钻孔效率并探究不同因素对钻孔效率的影响程度,对土石方开挖进度分析和风险管理具有重要意义.然而,现有土石方钻孔效率分析大都依赖人工经验,少数机器学习模型无法解释不同因素对钻孔效率的影响程度.针对上述问题,本研究提出土... 动态预测钻孔效率并探究不同因素对钻孔效率的影响程度,对土石方开挖进度分析和风险管理具有重要意义.然而,现有土石方钻孔效率分析大都依赖人工经验,少数机器学习模型无法解释不同因素对钻孔效率的影响程度.针对上述问题,本研究提出土石方开挖钻孔效率预测可解释超级学习器(SL)集成学习模型.通过强化学习中的Q学习改进猎人猎物优化算法局部搜索过程与全局信息进行交互的能力,提出Q学习改进的猎人猎物优化(QIHPO)算法对SL的n_estimators、learning_rate、max_depth等超参数进行优化,进而利用SL能够通过具有互补特征的异构基学习器捕捉样本特征差异性的优势,建立基于QIHPO优化的超级学习器土石方开挖钻孔效率预测QIHPO-SL模型,以揭示地质、作业、环境和机械特性等众多因素与钻孔效率的复杂非线性映射关系.进一步将QIHPO-SL集成学习算法与可解释机器学习框架下的沙普利加性解释(SHAP)理论相结合,挖掘影响钻孔效率的关键特征,并解释不同因素对钻孔效率的影响程度.案例分析表明:QIHPO-SL具有较高的预测精度,相较于QIHPO-XGB、QIHPO-RF和SL等基准模型,本文所提方法的预测精度分别提高了12.94%、12.02%和1.58%,且SHAP理论提高了模型的可解释性和预测结果的可信度,为钻孔效率预测及致因分析提供了新思路和新途径. 展开更多
关键词 钻孔效率 沙普利加性解释 超级学习器 强化学习
在线阅读 下载PDF
基于不同机器学习方法构建非心脏手术老年患者术后谵妄预测模型
7
作者 石金云 陈荣 +2 位作者 李文媛 纪木火 李青 《临床麻醉学杂志》 北大核心 2025年第3期240-245,共6页
目的采用不同机器学习方法构建非心脏手术老年患者术后谵妄(POD)的预测模型其性能。方法收集2022年4月至2024年4月行非心脏手术的905例老年患者围术期资料,包括人口学特征、既往合并症、术前认知功能评估、实验室检查结果、麻醉记录单等... 目的采用不同机器学习方法构建非心脏手术老年患者术后谵妄(POD)的预测模型其性能。方法收集2022年4月至2024年4月行非心脏手术的905例老年患者围术期资料,包括人口学特征、既往合并症、术前认知功能评估、实验室检查结果、麻醉记录单等共102个变量。采用单因素分析初步筛选危险因素,将有统计学差异(P<0.05)的变量纳入最小绝对收缩与选择算子(LASSO)筛选特征变量,应用随机森林(RF)、支持向量机(SVM)、自适应增强算法(Adaboost)和神经网络(NN)4种机器学习方法构建POD预测模型,采用受试者工作特征曲线下面积(AUROC)、精确度-召回率(PR)曲线的平均精度(AP)、Brier评分等对模型进行综合评估,引入Shapley加性解释(SHAP)对最优机器学习模型进行可解释化分析。结果有155例(17%)患者发生POD,经LASSO回归分析后,确定10个特征变量用于构建机器学习模型。4种机器学习模型中,RF的AUROC最高为0.90(95%CI 0.86~0.93),AP为0.8,Brier评分为0.086。SHAP模型解释性分析显示,对POD贡献度最高的是手术时间。结论在应用4种机器学习方法构建的非心脏手术老年患者POD预测模型中,RF的预测效能最佳。 展开更多
关键词 非心脏外科手术 术后谵妄 机器学习 预测模型 shapley加性解释
在线阅读 下载PDF
基于集成因子优选算法的面板堆石坝变形预测模型
8
作者 郑好 李登华 丁勇 《排灌机械工程学报》 北大核心 2025年第2期178-186,共9页
面板堆石坝变形主要受外部荷载和内部材料蠕变影响,而影响因子过多会造成特征冗余,引起预测精度过拟合问题;因子过少导致信息表达不全,造成预测效果差,模型泛化能力不足等问题.因此构建涵盖面广,可解释性强的因子集并从中优选格外重要.... 面板堆石坝变形主要受外部荷载和内部材料蠕变影响,而影响因子过多会造成特征冗余,引起预测精度过拟合问题;因子过少导致信息表达不全,造成预测效果差,模型泛化能力不足等问题.因此构建涵盖面广,可解释性强的因子集并从中优选格外重要.针对上述问题,文中提出基于集成因子优选算法的面板堆石坝变形预测模型,使用ReliefF与沙普利加性解释(SHAP)算法通过权重集成获得因子贡献值排序,再分析因子累计贡献率差量阈值剔除非关键因子,获得关键因子.以新疆某混凝土面板堆石坝为例,以特征缩减率FRR、归一化平均绝对百分比误差nMAPE、平均绝对误差MAE、均方误差MSE以及决定系数R^(2)为评价指标,试验结果表明文中提出的算法面对不同的预测模型都可准确地获得最佳因子,有效地提升了预测精度.相对于传统因子优选算法适应性更强,预测能力提升最显著,解决了影响因子冗余或者欠缺带来的预测能力较低的问题,提高了模型的泛化能力,为大坝安全监测研究提供了行之有效的因子优选方法. 展开更多
关键词 大坝安全监测 因子优选 shap理论 贡献度排序
在线阅读 下载PDF
驾驶性主客观综合评价方法在起步工况下的应用
9
作者 吴飞 孙现魁 王鹏程 《华南理工大学学报(自然科学版)》 北大核心 2025年第6期66-76,共11页
为提高驾驶性评价方法的准确性与可靠性,提出一种融合极限梯度提升算法、麻雀搜索算法与沙普利解释算法的主客观综合评价方法。该研究以车辆起步工况为目标,定义车辆起步工况下的9项客观评价指标,完善驾驶性起步工况的评价体系;提出以... 为提高驾驶性评价方法的准确性与可靠性,提出一种融合极限梯度提升算法、麻雀搜索算法与沙普利解释算法的主客观综合评价方法。该研究以车辆起步工况为目标,定义车辆起步工况下的9项客观评价指标,完善驾驶性起步工况的评价体系;提出以极限梯度提升算法双向映射客观评价指标值与主观评分,为避免驾驶性评价模型陷入局部最优解,采用麻雀搜索算法对极限梯度提升算法的核心超参数进行快速寻优,使得驾驶性评价模型在数据集扩充后具有自主迭代能力;最后利用沙普利解释算法对映射模型进行特征归因,量化客观评价指标对驾驶性评价的影响权重,构建兼具预测准确性、稳定性与可解释性的驾驶性综合评价模型。应用该方法,结合国内外主流驾驶性综合评价进行多次道路试验,对比分析结果表明:所提出的驾驶性评价模型的平均绝对误差、均方根误差和决定系数均优于BP神经网络、随机森林与极限学习机等主流驾驶性评价算法,映射准确性相较于其他方法明显提升,且该驾驶性综合评价方法具有一定的可解释性,对驾驶性评价中的主客观综合评价具有参考意义。 展开更多
关键词 驾驶性 起步工况 评价方法 极限梯度提升算法 沙普利解释算法
在线阅读 下载PDF
基于多信息融合的INFO-VMD-CNN的齿轮箱故障诊断方法
10
作者 吴胜利 郑子润 邢文婷 《振动与冲击》 北大核心 2025年第13期309-316,共8页
针对齿轮箱振动信号复杂多变,导致现有的齿轮箱故障诊断方法诊断精度不高、较弱故障特征容易被噪声淹没等问题,提出了一种基于向量加权平均优化算法(weighted mean of vectors,INFO)、变分模态分解(variational mode decomposition,VMD... 针对齿轮箱振动信号复杂多变,导致现有的齿轮箱故障诊断方法诊断精度不高、较弱故障特征容易被噪声淹没等问题,提出了一种基于向量加权平均优化算法(weighted mean of vectors,INFO)、变分模态分解(variational mode decomposition,VMD)和卷积神经网络(convolutional neural network,CNN)的齿轮故障诊断方法。该方法首先采用熵权法将不同位置的振动传感器信号信息进行融合,利用INFO对VMD算法中参数进行优化,并设计一个复合评价指标作为参数优化的评价标准,使用奇异峭度差分谱的方法对敏感分量进行重构;其次,从重构的信号中提取时域、频域特征并输入到CNN模型中进行分类;最后通过Shap(Shapley additive explanations)值法对模型输入特征的重要性进行排序,分析不同特征组合对模型分类和特定故障识别的影响。在东南大学行星齿轮数据集上进行验证,结果表明,利用所提特征组合进行故障诊断,CNN模型故障诊断准确率为98.24%,高于其他特征组合,为行星齿轮箱的故障诊断提供了一组有效的特征指标。 展开更多
关键词 行星齿轮箱故障诊断 向量加权平均算法(INFO) 奇异峭度差分谱 卷积神经网络(CNN) 评价指标 shap值法
在线阅读 下载PDF
基于深度学习的重质馏分油分子层次组成预测模型 被引量:1
11
作者 袁壮 王源 +6 位作者 杨哲 徐伟 周鑫 赵辉 陈小博 杨朝合 林扬 《石油学报(石油加工)》 北大核心 2025年第2期362-370,共9页
随着工业大数据时代的到来,基于深度学习建立的原油分子组成预测模型具有适用范围广、构建快捷、准确性高等优点。然而,石油馏分分子层次信息标签获取困难,难以满足深度学习模型训练需求。为解决上述问题,基于商业流程模拟软件Aspen HY... 随着工业大数据时代的到来,基于深度学习建立的原油分子组成预测模型具有适用范围广、构建快捷、准确性高等优点。然而,石油馏分分子层次信息标签获取困难,难以满足深度学习模型训练需求。为解决上述问题,基于商业流程模拟软件Aspen HYSYS与GC-MS×MS全二维气相色谱-飞行时间质谱联用仪提出了一种创新方法,建立足够规模的训练数据库。采用深度神经网络(DNN)建立了重质馏分油分子层次结构组成预测模型,该模型以炼油厂易测得的油品物理化学性质为输入,分子层次结构信息为输出,针对某炼油厂的催化裂化原料油进行分子组成预测,通过SHAP(SHapley Additive exPlanation)方法对模型进行可解释分析。结果表明,基于深度学习的重质馏分油分子组成预测模型能够准确地预测油品分子层次结构信息,目标装置原料分子组成预测平均相对误差小于8%。该模型不仅可对其他炼化装置的原料油性质进行软测量,也可为石油分子层次模型的开发提供准确的重油原料分子信息模型。 展开更多
关键词 重质馏分油 分子组成 深度学习 shapley additive explanation(shap)解释 分子管理
在线阅读 下载PDF
预测改性双基推进剂燃速的机器学习建模 被引量:1
12
作者 陈少臣 郭建雄 +4 位作者 熊思璇 刘哲人 王晓晨 马煜 代志龙 《固体火箭技术》 北大核心 2025年第1期124-132,共9页
为高效评估改性双基(CMDB)推进剂配方的燃速,使用机器学习(ML)方法建立CMDB推进剂配方的燃速预测模型。首先,对含有137个样本的CMDB推进剂配方-燃速数据集进行相关性分析以确定ML模型的17个输入特征,随后使用该数据集训练、优化与评估6... 为高效评估改性双基(CMDB)推进剂配方的燃速,使用机器学习(ML)方法建立CMDB推进剂配方的燃速预测模型。首先,对含有137个样本的CMDB推进剂配方-燃速数据集进行相关性分析以确定ML模型的17个输入特征,随后使用该数据集训练、优化与评估6个ML模型,包括岭回归(RR)、随机森林、梯度提升树(GBDT)、极端梯度提升(XGB)、支持向量机(SVM)和人工神经网络(ANN);然后,采用置换特征重要度与沙普利加性(SHAP)解释方法计算预测精确度最高的黑盒模型的特征重要度,并使用SHAP寻找特征与燃速之间的关系;最后,计算白盒模型RR的权重系数,以获取其特征重要度、特征与燃速的关系,并与前一个模型的结果进行对比。结果表明,GBDT、XGB、SVM和ANN模型的决定系数(R^(2))均超过了0.99,其预测值的残差和相对百分误差主要分布在-1~1 mm·s^(-1)、-10%~10%。通过解释SVM(R^(2)排名第一)与RR模型,发现两个模型都为燃速抑制剂、Al、催化剂的质量分数和工作压强赋予了很高的特征重要度,会显著影响燃速。此外,增加燃速抑制剂等组分的质量分数会降低燃速,而增加Al、催化剂等组分的质量分数与工作压强则会提升燃速。 展开更多
关键词 CMDB推进剂 燃速 机器学习 置换特征重要度 沙普利加性解释
在线阅读 下载PDF
机器学习模型预测机器人辅助肾部分切除术后肾功能减退
13
作者 李静 王林峰 +8 位作者 张高杰 黄勇 高英英 孙蕊 曹扬 李秋辰 何浩 魏子凌 刘佳渝 《重庆医科大学学报》 北大核心 2025年第4期457-462,共6页
目的:探讨多种机器学习模型预测机器人辅助肾部分切除术(robot-assisted partial nephrectomy,RAPN)后肾功能减退的效能,为临床风险分层提供依据。方法:回顾性纳入2019年1月至2023年12月重庆医科大学附属第一医院泌尿外科733例肾细胞癌(... 目的:探讨多种机器学习模型预测机器人辅助肾部分切除术(robot-assisted partial nephrectomy,RAPN)后肾功能减退的效能,为临床风险分层提供依据。方法:回顾性纳入2019年1月至2023年12月重庆医科大学附属第一医院泌尿外科733例肾细胞癌(renal cell carcinoma,RCC)行RAPN患者的临床数据,整合人口学特征、实验室指标及围手术期参数,构建7种机器学习模型,采用Shapley加性解释(Shapley additive explanations,SHAP)方法解析关键预测因子,并通过受试者工作特征曲线下面积(receiver operating characteristic curve area under the curve,ROC-AUC)评估模型性能。结果:随机森林模型预测效能最优(AUC=0.84)。SHAP分析显示,中性粒细胞/淋巴细胞比值、肿瘤直径、凝血酶原时间国际标准化比值、白细胞计数及术中出血量等因素对术后肾功能减退有明显影响。结论:本研究为临床提供了一种潜在的预测工具,可帮助识别高风险患者并优化术后管理策略。 展开更多
关键词 机器人辅助肾部分切除术 肾功能减退 机器学习模型 shap分析 预测模型 术后管理
在线阅读 下载PDF
基于机器学习的铜电解精炼电积过程电压及出液铜离子浓度预测模型研究
14
作者 闫哲祯 卢金成 +3 位作者 程寒 廖嘉琪 徐夫元 段宁 《有色金属(冶炼部分)》 北大核心 2025年第9期13-24,共12页
电积是目前最为常用的铜电解液净化工艺,其出口铜离子浓度波动大、人工调控难度高,易造成后续硫化单元处理负荷剧增及铜砷共沉淀产废量增大,而传统预测模型存在不可解释、稳态限制、低泛化能力等缺陷。为此,构建了企业电积生产过程电压... 电积是目前最为常用的铜电解液净化工艺,其出口铜离子浓度波动大、人工调控难度高,易造成后续硫化单元处理负荷剧增及铜砷共沉淀产废量增大,而传统预测模型存在不可解释、稳态限制、低泛化能力等缺陷。为此,构建了企业电积生产过程电压及出液铜离子浓度准确预测的多参数模型。通过对比研究10种机器学习模型,发现GBR在电压预测中表现最优(决定系数R^(2)=0.79,均方误差MSE=1.25),XGBoost对出液铜离子浓度的预测准确度最高(R^(2)=0.87,MSE=5.58)。SHAP解释性分析表明,电流和时间分别是影响电压和出液铜离子浓度变化的主控因素。模型决策机制与电化学原理及质量守恒定律一致,突破了传统模型对非线性关系的表征局限,为异常工况的预警诊断、关键参数动态优化控制及减少污染物产生提供依据。 展开更多
关键词 铜电积 机器学习 Gradient Boosting Regression(GBR) eXtreme Gradient Boosting(XGBoost) 解释性分析 shapley additive explanations(shap)
在线阅读 下载PDF
基于机器学习研究乳酸菌发酵石榴汁的风味品质差异形成机制
15
作者 邹文惠 潘飞 +1 位作者 易俊洁 周林燕 《食品工业科技》 北大核心 2025年第15期36-48,共13页
本研究选取90款发酵石榴汁(Fermented pomegranate juice,FPJ)中加权偏好得分最高(Highest weighted preferences score,HWPS)和最低(Lowest weighted preferences score,LWPS)的样品,分析其活菌数、糖和酸、色泽属性等指标,并进一步利... 本研究选取90款发酵石榴汁(Fermented pomegranate juice,FPJ)中加权偏好得分最高(Highest weighted preferences score,HWPS)和最低(Lowest weighted preferences score,LWPS)的样品,分析其活菌数、糖和酸、色泽属性等指标,并进一步利用顶空固相微萃取-气相色谱-质谱(Headspace solid phase micro-extraction gas chromatography-mass spectrometry,HS-SPME-GC-MS)结合机器学习(Machine learning,ML)预测影响感官偏好的关键挥发性风味化合物。经对比分析发现,HWPS的活菌数更高表明消费者更偏好活菌数高的FPJ,而2种FPJs的色泽属性和抗氧化物质并无显著差异。在2种FPJs中共鉴定出33种挥发性风味化合物,HWPS中酸类、醇类等物质分别比LWPS高37.74%和32.90%,消费者更偏好风味化合物丰富的产品。利用ML筛选出19种关键差异挥发性风味化合物,随后通过随机森林(Random forest,RF)和自适应增强(Adaptive boosting,AdaBoost)算法建立了HWPS和LWPS的二分类模型,RF算法具有较高的预测精确度和准确性。通过Shapley可加性特征解释(Shapley Additive exPlanations,SHAP)分析得出乙酸、癸酸、肉豆蔻酸异丙酯等前9种挥发性风味化合物是影响HWPS和LWPS得分差异的关键风味化合物,其中乙酸和癸酸有利于积极的感官偏好,而肉豆蔻酸异丙酯有负面的感官影响。KEGG通路分析得到丙酮酸代谢和硫代谢途径是影响挥发性风味化合物差异的主要代谢途径。本论文利用ML结合SHAP分析预测影响感官偏好的关键挥发性风味化合物,可以为食品行业利用人工智能辅助开发具有典型发酵风味和符合消费者感官偏好的FPJs奠定理论基础。 展开更多
关键词 石榴 突尼斯 发酵 机器学习 shapley 可加性特征解释 挥发性风味化合物 本文网刊:
在线阅读 下载PDF
基于深度神经网络的布鲁氏菌病风险预测模型的构建和验证
16
作者 刘思远 宋彪 +5 位作者 刘桂枝 王君 薛兰 苏杰 王宏利 沈欣 《中山大学学报(医学科学版)》 北大核心 2025年第4期700-707,共8页
【目的】采用深度神经网络算法构建布鲁氏菌病预测模型,提升布鲁氏菌病的早期发现效能。【方法】纳入2023年呼市职业病防治院收治的202例布鲁氏菌病患者与319例非布鲁氏菌病患者的临床资料,从中提取性别、年龄、血常规指标及临床诊断等... 【目的】采用深度神经网络算法构建布鲁氏菌病预测模型,提升布鲁氏菌病的早期发现效能。【方法】纳入2023年呼市职业病防治院收治的202例布鲁氏菌病患者与319例非布鲁氏菌病患者的临床资料,从中提取性别、年龄、血常规指标及临床诊断等数据进行分析。通过深度神经网络算法构建布鲁氏菌病预测模型,并通过十折交叉验证进行模型优化。模型性能评估指标包括灵敏度、假阴性率、特异度、假阳性率、准确率、阳性预测值、阴性预测值、F1分数、受试者工作特征曲线下面积(AUC)。经评估筛选出的最优模型,借助沙普利可加性解释(SHAP)方法进行解释,明确模型的决策逻辑与各特征的影响机制。【结果】数据可视化分析显示,布病组与非布病组数据差异不明显。经十折交叉验证筛选出最优模型展现出良好性能,灵敏度为85.3%、特异度为92.1%、准确率为89.5%、AUC为96.6%,95%CI(0.937,0.977)。SHAP方法解释模型发现年龄、血小板计数、血小板平均体积、嗜碱性粒细胞比例、红细胞分布宽度和绝对嗜碱细胞数,对布病发生具有显著影响。【结论】本研究构建的深度神经网络预测模型性能良好,能为布病早期诊断与防控提供可靠支持。同时,明确布病相关显著影响特征有助于进一步认识疾病发病机制,该模型未来有望在临床广泛推广。 展开更多
关键词 布鲁氏菌病 深度神经网络 血常规指标 沙普利可加性解释方法 风险预测模型
在线阅读 下载PDF
基于反向传播神经网络分析的田菁胶添加对萨拉米发酵香肠品质的影响
17
作者 卢慧 宋艾颖 +4 位作者 凌峰 蔡玉玲 黄启亮 刘云国 康大成 《食品科学》 北大核心 2025年第13期54-62,共9页
旨在探讨基于反向传播神经网络(backpropagation-artificial?neural?network,BP-ANN)分析田菁胶添加对萨拉米发酵香肠品质的影响。本研究设计4个处理组:空白对照组(CK)、接种复合发酵剂处理组(CG)、添加田菁胶处理组(SE)和添加田菁胶与... 旨在探讨基于反向传播神经网络(backpropagation-artificial?neural?network,BP-ANN)分析田菁胶添加对萨拉米发酵香肠品质的影响。本研究设计4个处理组:空白对照组(CK)、接种复合发酵剂处理组(CG)、添加田菁胶处理组(SE)和添加田菁胶与接种复合发酵剂处理组(SE-CG)。通过测定发酵香肠的pH值、水分活度(aw)、色差、质构特性、感官评定和电子鼻等指标,系统评估田菁胶添加对萨拉米发酵香肠品质的影响。研究表明,田菁胶与发酵剂共同添加时可快速降低产品pH值和aw值,有利于萨拉米香肠的最终品质的形成;与CK和CG组相比,添加田菁胶可显著改善SE-CG组的a^(*)值(4.64±0.38)和硬度((60.95±1.48)N)。此外,电子鼻分析表明,田菁胶结合发酵剂可显著增加产品中含硫化合物、醇类以及芳香族化合物的浓度。BP-ANN模型被用于对香肠品质进行分类和预测,结果显示模型的准确率达到96%,具有较高的分类精度和预测能力。此外,通过沙普利加和解释方法用于BP-ANN模型解释,揭示了不同品质指标对模型预测的重要性,发现其中电子鼻传感器S12信号、硬度和咀嚼性等特征对模型预测贡献较大。 展开更多
关键词 萨拉米发酵香肠 田菁胶 反向传播神经网络 品质分析 沙普利加和解释方法
在线阅读 下载PDF
基于XGBoost-SHAP的钢管混凝土柱轴向承载力预测模型 被引量:8
18
作者 陈曦泽 贾俊峰 +2 位作者 白玉磊 郭彤 杜修力 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第6期1061-1070,共10页
为了可靠、准确地预测钢管混凝土(CFST)柱的轴向承载力,建立和解释集成机器学习的CFST柱轴向承载力预测模型.使用马氏距离评估CFST柱数据库质量,通过极限梯度提升(XGBoost)算法建立CFST柱轴向承载力预测模型,使用K折交叉验证(K-Fold CV... 为了可靠、准确地预测钢管混凝土(CFST)柱的轴向承载力,建立和解释集成机器学习的CFST柱轴向承载力预测模型.使用马氏距离评估CFST柱数据库质量,通过极限梯度提升(XGBoost)算法建立CFST柱轴向承载力预测模型,使用K折交叉验证(K-Fold CV)和树结构概率密度估计(TPE)算法寻找模型的最优超参数组合.采用不同评价指标将优化后XGBoost模型的预测值与已有方法和未优化XGBoost模型的计算值比较.使用SHAP方法给出XGBoost模型预测结果的整体和局部的解释.结果表明,经过超参数调整优化的XGBoost模型的性能超越了相关规范和经验公式的性能,且SHAP方法能够有效地解释XGBoost模型的输出. 展开更多
关键词 钢管混凝土(CFST)柱 轴向承载力 极限梯度提升(XGBoost) 超参数优化 shap 可解释性
在线阅读 下载PDF
页岩油水平井产量影响因素分析及压裂参数优化决策 被引量:1
19
作者 刘巍 曹小朋 +2 位作者 胡慧芳 程紫燕 卜亚辉 《油气藏评价与开发》 CSCD 北大核心 2024年第5期764-770,778,共8页
济阳坳陷页岩在沙三下亚段和沙四上亚段等主要产层获得重大突破,但开发时间短,存在单井产量差异较大,产量主控因素尚不明确的问题,深入分析页岩油水平井高产主控因素、优化确定合理压裂工艺参数仍是目前研究的重点。为明确各因素对水平... 济阳坳陷页岩在沙三下亚段和沙四上亚段等主要产层获得重大突破,但开发时间短,存在单井产量差异较大,产量主控因素尚不明确的问题,深入分析页岩油水平井高产主控因素、优化确定合理压裂工艺参数仍是目前研究的重点。为明确各因素对水平井产量的影响,基于矿场实际数据开展因素关联性分析和规律挖掘。利用灰色关联分析方法及主成分分析方法定量计算页岩油水平井生产90 d、180 d和270 d的平均日产油量与压裂液用量、加砂量等影响因素之间的相关性,并在此基础上建立页岩油产能预测模型,结合SHAP算法对压裂参数进行优化分析。结果表明:压裂液用量、加砂量和破裂事件数是影响产量的主要工程参数,灰质含量、总有机碳含量和页岩孔隙性是影响产量的主要地质参数;随着生产时间的延长,地质因素对产量的影响逐渐增强,工程因素对产量的影响逐渐减弱;压裂参数优化分析确定了40~45 m压裂段长,2700 m3单段压裂液用量,180 m3单段加砂量为最佳压裂施工参数,为页岩油水平井的开发决策和压裂设计提供了新的技术思路。 展开更多
关键词 水平井产量 影响因素分析 灰色关联分析 shap算法 页岩油
在线阅读 下载PDF
基于并行异构图和序列注意力机制的中文实体关系抽取模型 被引量:1
20
作者 毛典辉 李学博 +2 位作者 刘峻岭 张登辉 颜文婧 《计算机应用》 CSCD 北大核心 2024年第7期2018-2025,共8页
近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之... 近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之一。针对中文文本中的重叠三元组问题,提出了一种混合神经网络实体关系联合抽取(HNNERJE)模型。HNNERJE模型以并行方式融合序列注意力机制和异构图注意力机制,并结合门控融合策略构建了深度集成框架。该模型不仅可以同时捕获中文文本的语序信息和实体关联信息,还能够自适应地调整主客体标记器的输出,从而有效解决重叠三元组问题。另外,通过引入对抗训练算法提高模型对未见样本和噪声的适应能力。运用SHAP(SHapley Additive exPlanations)方法对HNNERJE模型进行解释分析,基于模型的识别结果解析它在抽取实体和关系时所依据的关键特征。HNNERJE模型在NYT、WebNLG、CMeIE和DuIE数据集上的F1值分别达到了92.17%、93.42%、47.40%和67.98%。实验结果表明:HNNERJE模型可以将非结构化的文本数据转化为结构化的知识表示,有效提取其中蕴含的有价值信息。 展开更多
关键词 实体关系抽取 异构图 注意力机制 对抗训练 shap方法
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部