期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
基于CatBoost和SHAP的高级别自动驾驶车辆非预期停车冲突风险预测
1
作者 刘擎超 王瑞海 +2 位作者 蔡英凤 王海 陈龙 《汽车安全与节能学报》 北大核心 2025年第1期170-180,共11页
针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,... 针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,构建了冲突风险预测模型。结果表明,接管次数在城市中心、住宅区和郊区分别为161次、227次和164次,最高单路段接管次数分别为11次、11次和16次;模型预测精度达93%以上。SHAP分析显示,前后车辆间相对速度和相对位置对冲突风险的影响显著。研究结果对提升自动驾驶车辆的可靠性和安全性具有重要意义。 展开更多
关键词 冲突风险 交通排放 高级别自动驾驶 CatBoost算法 shap解释模型
在线阅读 下载PDF
基于随机森林与SHAP算法的致密砂岩气暂堵效果的影响因素分析
2
作者 黄浩 车恒达 +3 位作者 孔祥伟 辛富斌 向九洲 吉俊杰 《科学技术与工程》 北大核心 2025年第26期11135-11143,共9页
为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂... 为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂堵效果量化模型和公式、暂堵效果算法模型验证,发现暂堵效果量化值与产气贡献率正相关,P=0.037,证明暂堵效果量化模型和公式的准确性高;又因暂堵效果算法模型中,训练集与测试集的MSE、MAE、R^(2)相差微小,证明该模型的泛化能力较强且准确性高。在暂堵效果算法模型的基础之上,开展暂堵效果的影响因素分析,结果表明:总段数、渗透率、暂堵球数量、簇间距和砂比这5个因素对于暂堵效果的影响占比最大。进一步分析单影响因素,发现随总段数增加,暂堵效果增加的规律只适用于直井,对水平井不适用;随渗透率增加,暂堵效果变差;暂堵球数量<50个、簇间距>20 m、砂比介于18%~20%,暂堵效果均可达到正向增长。研究结果可为苏里格等气田现场暂堵作业设计提供借鉴和参考。 展开更多
关键词 苏里格气田 致密砂岩气 暂堵效果 随机森林 shap(shapley additive explanations)值 模型解释
在线阅读 下载PDF
基于RF-SHAP多因素耦合的隧道动态光环境视觉功效响应机制
3
作者 周浩 何世永 +2 位作者 孙远义 侯泽玉 张悦 《隧道建设(中英文)》 北大核心 2025年第10期1881-1893,共13页
隧道不同区段的光环境差异会使驾驶人视场环境发生变化,引起驾驶人信息感知错误,威胁行车安全,且视场对比度的动态变化易诱发视觉疲劳与感知能力降低。为揭示隧道动态光环境中视场对比度及其梯度变化对驾驶人视觉功效的影响机制,通过多... 隧道不同区段的光环境差异会使驾驶人视场环境发生变化,引起驾驶人信息感知错误,威胁行车安全,且视场对比度的动态变化易诱发视觉疲劳与感知能力降低。为揭示隧道动态光环境中视场对比度及其梯度变化对驾驶人视觉功效的影响机制,通过多因素控制试验(目标位置、颜色、亮度、视场对比度耦合控制),构建“视场对比度动态梯度-视觉功效响应”耦合分析框架,并创新引入RF-SHAP(random forest-Shapley additive explanation)可解释机器学习算法解析多参数非线性作用。结果表明:1)视场对比度存在拐点效应,入口段视场对比度为0.2~0.4时可缩短反应时间20.5%,视场对比度由0.4提升到0.6时仅缩短反应时间2.3%。2)亮度与视场对比度存在强交互效应,中间段背景亮度提升至8.75 cd/m^(2)时可补偿低视场对比度视觉信号,目标识别成功率达70%(较背景亮度为4.50 cd/m^(2)时提升30%)。3)视野边缘(30°位置)环境敏感性高于中心区(5°位置),低视场对比度(0.2)与高亮度(6000 cd/m^(2))在视野边缘(30°位置)叠加时,反应时间最大增幅达53.1%。4)暖色调目标(红色)较冷色(蓝色)识别效率提升14.2%,尤其在低视场对比度(0.1)时色差影响最显著。5)RF-SHAP模型揭示了视场对比度与亮度为视觉功效主导因子,且存在U形影响曲线,验证了动态光环境参数阈值的工程适用性。 展开更多
关键词 隧道照明 动态光环境 视场对比度 视觉功效 随机森林 shap
在线阅读 下载PDF
土石方开挖钻孔效率预测可解释超级学习器集成学习模型
4
作者 王晓玲 胡亦宁 +3 位作者 张君 衣传宝 张捷 李希稷 《天津大学学报(自然科学与工程技术版)》 北大核心 2025年第4期331-342,共12页
动态预测钻孔效率并探究不同因素对钻孔效率的影响程度,对土石方开挖进度分析和风险管理具有重要意义.然而,现有土石方钻孔效率分析大都依赖人工经验,少数机器学习模型无法解释不同因素对钻孔效率的影响程度.针对上述问题,本研究提出土... 动态预测钻孔效率并探究不同因素对钻孔效率的影响程度,对土石方开挖进度分析和风险管理具有重要意义.然而,现有土石方钻孔效率分析大都依赖人工经验,少数机器学习模型无法解释不同因素对钻孔效率的影响程度.针对上述问题,本研究提出土石方开挖钻孔效率预测可解释超级学习器(SL)集成学习模型.通过强化学习中的Q学习改进猎人猎物优化算法局部搜索过程与全局信息进行交互的能力,提出Q学习改进的猎人猎物优化(QIHPO)算法对SL的n_estimators、learning_rate、max_depth等超参数进行优化,进而利用SL能够通过具有互补特征的异构基学习器捕捉样本特征差异性的优势,建立基于QIHPO优化的超级学习器土石方开挖钻孔效率预测QIHPO-SL模型,以揭示地质、作业、环境和机械特性等众多因素与钻孔效率的复杂非线性映射关系.进一步将QIHPO-SL集成学习算法与可解释机器学习框架下的沙普利加性解释(SHAP)理论相结合,挖掘影响钻孔效率的关键特征,并解释不同因素对钻孔效率的影响程度.案例分析表明:QIHPO-SL具有较高的预测精度,相较于QIHPO-XGB、QIHPO-RF和SL等基准模型,本文所提方法的预测精度分别提高了12.94%、12.02%和1.58%,且SHAP理论提高了模型的可解释性和预测结果的可信度,为钻孔效率预测及致因分析提供了新思路和新途径. 展开更多
关键词 钻孔效率 沙普利加性解释 超级学习器 强化学习
在线阅读 下载PDF
基于深度学习的重质馏分油分子层次组成预测模型 被引量:1
5
作者 袁壮 王源 +6 位作者 杨哲 徐伟 周鑫 赵辉 陈小博 杨朝合 林扬 《石油学报(石油加工)》 北大核心 2025年第2期362-370,共9页
随着工业大数据时代的到来,基于深度学习建立的原油分子组成预测模型具有适用范围广、构建快捷、准确性高等优点。然而,石油馏分分子层次信息标签获取困难,难以满足深度学习模型训练需求。为解决上述问题,基于商业流程模拟软件Aspen HY... 随着工业大数据时代的到来,基于深度学习建立的原油分子组成预测模型具有适用范围广、构建快捷、准确性高等优点。然而,石油馏分分子层次信息标签获取困难,难以满足深度学习模型训练需求。为解决上述问题,基于商业流程模拟软件Aspen HYSYS与GC-MS×MS全二维气相色谱-飞行时间质谱联用仪提出了一种创新方法,建立足够规模的训练数据库。采用深度神经网络(DNN)建立了重质馏分油分子层次结构组成预测模型,该模型以炼油厂易测得的油品物理化学性质为输入,分子层次结构信息为输出,针对某炼油厂的催化裂化原料油进行分子组成预测,通过SHAP(SHapley Additive exPlanation)方法对模型进行可解释分析。结果表明,基于深度学习的重质馏分油分子组成预测模型能够准确地预测油品分子层次结构信息,目标装置原料分子组成预测平均相对误差小于8%。该模型不仅可对其他炼化装置的原料油性质进行软测量,也可为石油分子层次模型的开发提供准确的重油原料分子信息模型。 展开更多
关键词 重质馏分油 分子组成 深度学习 shapley additive explanation(shap)解释 分子管理
在线阅读 下载PDF
基于可解释机器学习的河套平原盐碱农田土壤水分和有机质含量估算
6
作者 丁启东 黄华雨 +3 位作者 张俊华 杨凌彬 贾科利 郝凤霞 《水土保持通报》 北大核心 2025年第4期184-197,共14页
[目的]针对传统方法在盐碱化农田土壤水分(SMC)和有机质含量(SOMC)监测中存在效率低下的问题,探索高光谱数据结合可解释机器学习的估算方法,以期为河套平原盐碱化土壤信息快速获取和土壤质量评价提供理论依据。[方法]以地面高光谱反射... [目的]针对传统方法在盐碱化农田土壤水分(SMC)和有机质含量(SOMC)监测中存在效率低下的问题,探索高光谱数据结合可解释机器学习的估算方法,以期为河套平原盐碱化土壤信息快速获取和土壤质量评价提供理论依据。[方法]以地面高光谱反射率及实测SMC和SOMC为数据源,对光谱数据采用分数阶微分(FOD)变换并构建光谱指数,基于偏最小二乘回归(PLSR)、支持向量机(SVM)和随机森林(RF)算法建模,并引入夏普利加性解释(SHAP)方法解析变量对模型预测结果的相对贡献,提升模型的解释性。[结果]①经1.25阶微分变换后构建的光谱指数与SMC和SOMC间相关性最强,其中,广义差异指数(GDI)和最优光谱指数(OSI)与SMC和SOMC间相关系数最大,分别为0.5054和0.6825。②RF模型对SMC和SOMC的估算精度远高于PLSR和SVM;SMC和SOMC-RF模型验证集(R^(2))、均方根误差(RMSE)和相对分析误差(RPD)分别为0.734,3.28,2.07及0.870,1.53,2.43。③SHAP分析发现,氮平面域指数(NPDI)和比值指数(RI)分别在SMC和SOMC的建模估算中贡献度最大,且NPDI,OSI和差值指数(DI)对SMC的建模贡献度累计达到68.58%;RI,GDI和NPDI对SOMC的建模贡献度累计达到61.86%。[结论]FOD联合光谱指数在高光谱数据的有效利用中具有明显优势,RF模型在土壤属性估算中展现了较高的精度和鲁棒性,SHAP分析有效揭示了不同变量对目标变量的贡献度。NPDI,RI,OSI和DI等光谱指数在盐碱化农田SMC和SOMC的建模估算中贡献显著。 展开更多
关键词 高光谱 土壤盐碱化 机器学习 夏普利加性解释 数字土壤制图
在线阅读 下载PDF
基于机器学习的铜电解精炼电积过程电压及出液铜离子浓度预测模型研究
7
作者 闫哲祯 卢金成 +3 位作者 程寒 廖嘉琪 徐夫元 段宁 《有色金属(冶炼部分)》 北大核心 2025年第9期13-24,共12页
电积是目前最为常用的铜电解液净化工艺,其出口铜离子浓度波动大、人工调控难度高,易造成后续硫化单元处理负荷剧增及铜砷共沉淀产废量增大,而传统预测模型存在不可解释、稳态限制、低泛化能力等缺陷。为此,构建了企业电积生产过程电压... 电积是目前最为常用的铜电解液净化工艺,其出口铜离子浓度波动大、人工调控难度高,易造成后续硫化单元处理负荷剧增及铜砷共沉淀产废量增大,而传统预测模型存在不可解释、稳态限制、低泛化能力等缺陷。为此,构建了企业电积生产过程电压及出液铜离子浓度准确预测的多参数模型。通过对比研究10种机器学习模型,发现GBR在电压预测中表现最优(决定系数R^(2)=0.79,均方误差MSE=1.25),XGBoost对出液铜离子浓度的预测准确度最高(R^(2)=0.87,MSE=5.58)。SHAP解释性分析表明,电流和时间分别是影响电压和出液铜离子浓度变化的主控因素。模型决策机制与电化学原理及质量守恒定律一致,突破了传统模型对非线性关系的表征局限,为异常工况的预警诊断、关键参数动态优化控制及减少污染物产生提供依据。 展开更多
关键词 铜电积 机器学习 Gradient Boosting Regression(GBR) eXtreme Gradient Boosting(XGBoost) 解释性分析 shapley additive explanations(shap)
在线阅读 下载PDF
基于机器学习研究乳酸菌发酵石榴汁的风味品质差异形成机制
8
作者 邹文惠 潘飞 +1 位作者 易俊洁 周林燕 《食品工业科技》 北大核心 2025年第15期36-48,共13页
本研究选取90款发酵石榴汁(Fermented pomegranate juice,FPJ)中加权偏好得分最高(Highest weighted preferences score,HWPS)和最低(Lowest weighted preferences score,LWPS)的样品,分析其活菌数、糖和酸、色泽属性等指标,并进一步利... 本研究选取90款发酵石榴汁(Fermented pomegranate juice,FPJ)中加权偏好得分最高(Highest weighted preferences score,HWPS)和最低(Lowest weighted preferences score,LWPS)的样品,分析其活菌数、糖和酸、色泽属性等指标,并进一步利用顶空固相微萃取-气相色谱-质谱(Headspace solid phase micro-extraction gas chromatography-mass spectrometry,HS-SPME-GC-MS)结合机器学习(Machine learning,ML)预测影响感官偏好的关键挥发性风味化合物。经对比分析发现,HWPS的活菌数更高表明消费者更偏好活菌数高的FPJ,而2种FPJs的色泽属性和抗氧化物质并无显著差异。在2种FPJs中共鉴定出33种挥发性风味化合物,HWPS中酸类、醇类等物质分别比LWPS高37.74%和32.90%,消费者更偏好风味化合物丰富的产品。利用ML筛选出19种关键差异挥发性风味化合物,随后通过随机森林(Random forest,RF)和自适应增强(Adaptive boosting,AdaBoost)算法建立了HWPS和LWPS的二分类模型,RF算法具有较高的预测精确度和准确性。通过Shapley可加性特征解释(Shapley Additive exPlanations,SHAP)分析得出乙酸、癸酸、肉豆蔻酸异丙酯等前9种挥发性风味化合物是影响HWPS和LWPS得分差异的关键风味化合物,其中乙酸和癸酸有利于积极的感官偏好,而肉豆蔻酸异丙酯有负面的感官影响。KEGG通路分析得到丙酮酸代谢和硫代谢途径是影响挥发性风味化合物差异的主要代谢途径。本论文利用ML结合SHAP分析预测影响感官偏好的关键挥发性风味化合物,可以为食品行业利用人工智能辅助开发具有典型发酵风味和符合消费者感官偏好的FPJs奠定理论基础。 展开更多
关键词 石榴 突尼斯 发酵 机器学习 shapley可加性特征解释 挥发性风味化合物
在线阅读 下载PDF
基于深度神经网络的布鲁氏菌病风险预测模型的构建和验证
9
作者 刘思远 宋彪 +5 位作者 刘桂枝 王君 薛兰 苏杰 王宏利 沈欣 《中山大学学报(医学科学版)》 北大核心 2025年第4期700-707,共8页
【目的】采用深度神经网络算法构建布鲁氏菌病预测模型,提升布鲁氏菌病的早期发现效能。【方法】纳入2023年呼市职业病防治院收治的202例布鲁氏菌病患者与319例非布鲁氏菌病患者的临床资料,从中提取性别、年龄、血常规指标及临床诊断等... 【目的】采用深度神经网络算法构建布鲁氏菌病预测模型,提升布鲁氏菌病的早期发现效能。【方法】纳入2023年呼市职业病防治院收治的202例布鲁氏菌病患者与319例非布鲁氏菌病患者的临床资料,从中提取性别、年龄、血常规指标及临床诊断等数据进行分析。通过深度神经网络算法构建布鲁氏菌病预测模型,并通过十折交叉验证进行模型优化。模型性能评估指标包括灵敏度、假阴性率、特异度、假阳性率、准确率、阳性预测值、阴性预测值、F1分数、受试者工作特征曲线下面积(AUC)。经评估筛选出的最优模型,借助沙普利可加性解释(SHAP)方法进行解释,明确模型的决策逻辑与各特征的影响机制。【结果】数据可视化分析显示,布病组与非布病组数据差异不明显。经十折交叉验证筛选出最优模型展现出良好性能,灵敏度为85.3%、特异度为92.1%、准确率为89.5%、AUC为96.6%,95%CI(0.937,0.977)。SHAP方法解释模型发现年龄、血小板计数、血小板平均体积、嗜碱性粒细胞比例、红细胞分布宽度和绝对嗜碱细胞数,对布病发生具有显著影响。【结论】本研究构建的深度神经网络预测模型性能良好,能为布病早期诊断与防控提供可靠支持。同时,明确布病相关显著影响特征有助于进一步认识疾病发病机制,该模型未来有望在临床广泛推广。 展开更多
关键词 布鲁氏菌病 深度神经网络 血常规指标 沙普利可加性解释方法 风险预测模型
在线阅读 下载PDF
改进贝叶斯优化与集成学习短期负荷预测模型
10
作者 顼佳宇 王晓冰 +3 位作者 李冰 王媛 雍明月 邵晨 《电力系统及其自动化学报》 北大核心 2025年第9期34-44,共11页
针对电力系统短期负荷预测的问题,提出基于改进贝叶斯优化和集成学习的预测模型。首先,采用岭回归、套索回归、随机森林和Huber回归作为基学习器,以待测负荷之前时段的负荷数据作为自变量,独立地预测待测负荷值;其次,构建基于极致梯度... 针对电力系统短期负荷预测的问题,提出基于改进贝叶斯优化和集成学习的预测模型。首先,采用岭回归、套索回归、随机森林和Huber回归作为基学习器,以待测负荷之前时段的负荷数据作为自变量,独立地预测待测负荷值;其次,构建基于极致梯度提升的元学习器,以基学习器的预测值作为自变量,进一步提升待测负荷值的预测精度;然后,使用基于Hyperband改进的贝叶斯优化算法和5折交叉验证进行参数优化;最后,利用沙普利加和解释值分析各个基学习器对元学习器的重要性,以及各个输入特征对集成学习模型的重要性。仿真及实际算例验证表明,该方法相较于单一模型具有更好的预测精度和稳定性,且与神经网络模型相比,所提模型在不损失预测精度的情况下提高了预测可解释性。 展开更多
关键词 电力系统 短期负荷预测 贝叶斯优化 集成学习 极致梯度提升 沙普利加和解释值
在线阅读 下载PDF
基于XGBoost-SHAP的钢管混凝土柱轴向承载力预测模型 被引量:11
11
作者 陈曦泽 贾俊峰 +2 位作者 白玉磊 郭彤 杜修力 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第6期1061-1070,共10页
为了可靠、准确地预测钢管混凝土(CFST)柱的轴向承载力,建立和解释集成机器学习的CFST柱轴向承载力预测模型.使用马氏距离评估CFST柱数据库质量,通过极限梯度提升(XGBoost)算法建立CFST柱轴向承载力预测模型,使用K折交叉验证(K-Fold CV... 为了可靠、准确地预测钢管混凝土(CFST)柱的轴向承载力,建立和解释集成机器学习的CFST柱轴向承载力预测模型.使用马氏距离评估CFST柱数据库质量,通过极限梯度提升(XGBoost)算法建立CFST柱轴向承载力预测模型,使用K折交叉验证(K-Fold CV)和树结构概率密度估计(TPE)算法寻找模型的最优超参数组合.采用不同评价指标将优化后XGBoost模型的预测值与已有方法和未优化XGBoost模型的计算值比较.使用SHAP方法给出XGBoost模型预测结果的整体和局部的解释.结果表明,经过超参数调整优化的XGBoost模型的性能超越了相关规范和经验公式的性能,且SHAP方法能够有效地解释XGBoost模型的输出. 展开更多
关键词 钢管混凝土(CFST)柱 轴向承载力 极限梯度提升(XGBoost) 超参数优化 shap 可解释性
在线阅读 下载PDF
页岩油水平井产量影响因素分析及压裂参数优化决策 被引量:2
12
作者 刘巍 曹小朋 +2 位作者 胡慧芳 程紫燕 卜亚辉 《油气藏评价与开发》 CSCD 北大核心 2024年第5期764-770,778,共8页
济阳坳陷页岩在沙三下亚段和沙四上亚段等主要产层获得重大突破,但开发时间短,存在单井产量差异较大,产量主控因素尚不明确的问题,深入分析页岩油水平井高产主控因素、优化确定合理压裂工艺参数仍是目前研究的重点。为明确各因素对水平... 济阳坳陷页岩在沙三下亚段和沙四上亚段等主要产层获得重大突破,但开发时间短,存在单井产量差异较大,产量主控因素尚不明确的问题,深入分析页岩油水平井高产主控因素、优化确定合理压裂工艺参数仍是目前研究的重点。为明确各因素对水平井产量的影响,基于矿场实际数据开展因素关联性分析和规律挖掘。利用灰色关联分析方法及主成分分析方法定量计算页岩油水平井生产90 d、180 d和270 d的平均日产油量与压裂液用量、加砂量等影响因素之间的相关性,并在此基础上建立页岩油产能预测模型,结合SHAP算法对压裂参数进行优化分析。结果表明:压裂液用量、加砂量和破裂事件数是影响产量的主要工程参数,灰质含量、总有机碳含量和页岩孔隙性是影响产量的主要地质参数;随着生产时间的延长,地质因素对产量的影响逐渐增强,工程因素对产量的影响逐渐减弱;压裂参数优化分析确定了40~45 m压裂段长,2700 m3单段压裂液用量,180 m3单段加砂量为最佳压裂施工参数,为页岩油水平井的开发决策和压裂设计提供了新的技术思路。 展开更多
关键词 水平井产量 影响因素分析 灰色关联分析 shap算法 页岩油
在线阅读 下载PDF
基于并行异构图和序列注意力机制的中文实体关系抽取模型 被引量:1
13
作者 毛典辉 李学博 +2 位作者 刘峻岭 张登辉 颜文婧 《计算机应用》 CSCD 北大核心 2024年第7期2018-2025,共8页
近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之... 近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之一。针对中文文本中的重叠三元组问题,提出了一种混合神经网络实体关系联合抽取(HNNERJE)模型。HNNERJE模型以并行方式融合序列注意力机制和异构图注意力机制,并结合门控融合策略构建了深度集成框架。该模型不仅可以同时捕获中文文本的语序信息和实体关联信息,还能够自适应地调整主客体标记器的输出,从而有效解决重叠三元组问题。另外,通过引入对抗训练算法提高模型对未见样本和噪声的适应能力。运用SHAP(SHapley Additive exPlanations)方法对HNNERJE模型进行解释分析,基于模型的识别结果解析它在抽取实体和关系时所依据的关键特征。HNNERJE模型在NYT、WebNLG、CMeIE和DuIE数据集上的F1值分别达到了92.17%、93.42%、47.40%和67.98%。实验结果表明:HNNERJE模型可以将非结构化的文本数据转化为结构化的知识表示,有效提取其中蕴含的有价值信息。 展开更多
关键词 实体关系抽取 异构图 注意力机制 对抗训练 shap方法
在线阅读 下载PDF
基于CatBoost-MOEAD的大直径泥水盾构姿态多目标预测与优化
14
作者 吴贤国 刘俊 +1 位作者 王静怡 覃亚伟 《中国安全科学学报》 CAS CSCD 北大核心 2024年第10期50-57,共8页
为避免盾构掘进过程中出现蛇形、轴线偏离等姿态异常问题影响施工安全,提出一种结合类别提升(CatBoost)算法和基于分解的多目标优化算法(MOEAD)的大直径泥水盾构姿态控制方法;构建一个盾构姿态预测模型,该模型包含19个输入参数和6个输... 为避免盾构掘进过程中出现蛇形、轴线偏离等姿态异常问题影响施工安全,提出一种结合类别提升(CatBoost)算法和基于分解的多目标优化算法(MOEAD)的大直径泥水盾构姿态控制方法;构建一个盾构姿态预测模型,该模型包含19个输入参数和6个输出参数,利用CatBoost算法构建输入参数与输出参数之间的非线性映射关系;采用沙普利加性解释法(SHAP)分析输入参数对盾构姿态的影响;结合多目标优化算法构建CatBoost-MOEAD盾构姿态多目标优化模型,将所提模型运用到武汉长江大直径泥水盾构隧道工程中,分析验证所提方法的适用性和有效性。结果表明:CatBoost预测模型能够高效地预测大直径泥水盾构的姿态,其中6个盾构姿态目标的决定系数范围为0.931~0.974,均方根误差范围为0.030~0.880,误差范围为0.039~1.057;对盾构姿态影响较大的施工参数中推进组推力对盾构姿态的影响最为显著;通过研发的CatBoost-MOEAD盾构姿态多目标优化方法,盾构姿态的优化效果显著,优化率可达38.86%。 展开更多
关键词 类别提升(CatBoost) 基于分解的多目标优化算法(MOEAD) 大直径泥水盾构 盾构姿态 多目标优化 沙普利加性解释法(shap)
在线阅读 下载PDF
山区公路交叉口驾驶避险决策行为特性分析
15
作者 秦雅琴 包丽馨 +2 位作者 陈亮 勾钰 王锦锐 《安全与环境学报》 CAS CSCD 北大核心 2024年第6期2295-2304,共10页
为研究驾驶特征指标与驾驶避险行为决策的关联规则以提升驾驶安全,将驾驶避险决策行为划分为纵向“停车避险”和横向“转向避险”,并运用驾驶模拟系统构建12种山区公路交叉口交通冲突虚拟场景,招募38名驾驶人进行试验,采集车辆特征和驾... 为研究驾驶特征指标与驾驶避险行为决策的关联规则以提升驾驶安全,将驾驶避险决策行为划分为纵向“停车避险”和横向“转向避险”,并运用驾驶模拟系统构建12种山区公路交叉口交通冲突虚拟场景,招募38名驾驶人进行试验,采集车辆特征和驾驶人扫视、眨眼、注视等眼动特征数据。基于随机森林构建驾驶避险决策行为模型,然后引入沙普利加和解释(SHapley Additive exPlanation, SHAP)框架进一步分析车辆、眼动特征与驾驶避险行为之间的非线性关系。结果表明:模型对纵、横向避险行为预测的准确率分别为84.77%、94.70%;纵向速度标准差、扫视持续时间标准差、轨迹偏差标准差、侧向速度标准差与驾驶避险决策行为存在明显关联,如纵向速度标准差过大(约大于10 km/h),纵向“停车避险”可能性明显增加。 展开更多
关键词 安全工程 驾驶避险 决策行为 驾驶模拟 分类预测 沙普利加和解释(shap)
在线阅读 下载PDF
基于神经网络模型可解释性的降水预报
16
作者 樊仲欣 王妍 王若曈 《热带气象学报》 CSCD 北大核心 2024年第6期1030-1044,共15页
为提高局地精细化预报的准确性和可靠性,提出了一种基于核函数KernelExplainer和可解释性“夏普值”(SHAP值)聚类分析的神经网络降水预报技术。该方法首先通过正态化分布变换解决神经网络的输出抖动问题,然后使用KernelExplainer估计由... 为提高局地精细化预报的准确性和可靠性,提出了一种基于核函数KernelExplainer和可解释性“夏普值”(SHAP值)聚类分析的神经网络降水预报技术。该方法首先通过正态化分布变换解决神经网络的输出抖动问题,然后使用KernelExplainer估计由卷积(CNN)层、长短期记忆(LSTM)网络、全连接层构建的深度学习神经网络模型,并获取气象要素参数m和时间步长参数tl对于预测结果的贡献值SHAP,最后通过聚类分析SHAP值,在每次滚动预报中动态调整模型的m和tl参数,从而提高了无降水和强降水事件的预报效果。使用该方法基于2018年1月—2023年12月的观测和数值预报模式数据建立了南京信息工程大学大气观测基地的降水预报模型。实验证明,该方法相对于固定参数的深度学习神经网络模型、多层卷积长短期记忆网络(多层ConvLSTM)、模拟集合卷积神经网络(AnEn-CNN)和数值预报模式,降水平均绝对误差减少8%、7%、11%和19%。 展开更多
关键词 卷积 长短期记忆 ReLU激活函数 KernelExplainer shap 降水预报
在线阅读 下载PDF
基于校准窗口集成与耦合市场特征的可解释双层日前电价预测 被引量:7
17
作者 刘慧鑫 沈晓东 +3 位作者 魏泽涛 刘友波 刘俊勇 白元宝 《中国电机工程学报》 EI CSCD 北大核心 2024年第4期1272-1285,I0003,共15页
随着电力市场之间耦合程度不断加深,只局限于单个市场内部的传统特征集不足以支撑高精度预测的需求。而且模型预测性能对校准窗口的选择敏感,而传统电价预测仅使用一个固定时间长度的数据集,同时预测模型的“黑盒”结构导致预测结果在... 随着电力市场之间耦合程度不断加深,只局限于单个市场内部的传统特征集不足以支撑高精度预测的需求。而且模型预测性能对校准窗口的选择敏感,而传统电价预测仅使用一个固定时间长度的数据集,同时预测模型的“黑盒”结构导致预测结果在工程应用中可信度偏低。针对上述问题,该文提出一种考虑校准窗口集成与耦合市场特征的可解释双层日前电价预测框架。内层框架为基于改进自适应噪声完备集合经验模态分解(improved complete ensemble empirical mode decomposition,ICEEMDAN)的择优预测,首先分解原始电价序列,然后应用Lasso估计回归(lassoestimated autoregressive,LEAR)、长期和短期时间序列网络(long-term and short-term time-series networks,LSTNet)、卷积神经网络-长短记忆神经网络(convolutionalneuralnetworks-longshort termmemory,CNN-LSTM)、移动平均(autoregressive integrated moving average,ARIMA)和核极限学习机(kernel extreme learning machines,KELM)模型预测子序列并选择最优预测算法。外层框架为基于贝叶斯模型平均(bayes modelaveraging,BMA)的校准窗口集成预测,针对每个不同校准窗口长度数据集下的预测分配权重并集成得到预测电价。最后,通过可解释方法沙普利加性解释模型(shapley additiveexplanations,SHAP)分析耦合市场特征如何影响预测电价。该文通过北欧电力市场数据集的算例分析证明了所提算法的优越性和校准窗口集成方案的有效性。 展开更多
关键词 校准窗口集成 耦合市场特征 双层预测框架 改进自适应噪声完备集合经验模态分解(ICEEMDAN) 贝叶斯模型平均(BMA) 沙普利加性解释模型(shap)
在线阅读 下载PDF
基于卷积神经网络的液化预测模型及可解释性分析 被引量:3
18
作者 龙潇 孙锐 郑桐 《岩土力学》 EI CAS CSCD 北大核心 2024年第9期2741-2753,共13页
常规液化判别方法通常是半经验方法,存在人为因素干扰,成功率及均衡性不佳。现有的机器学习方法缺乏足够的样本支撑,存在一定的局限性。通过整合液化数据集,选取修正标准贯击数、细粒含量、土层深度、地下水位深度、总上覆应力、有效上... 常规液化判别方法通常是半经验方法,存在人为因素干扰,成功率及均衡性不佳。现有的机器学习方法缺乏足够的样本支撑,存在一定的局限性。通过整合液化数据集,选取修正标准贯击数、细粒含量、土层深度、地下水位深度、总上覆应力、有效上覆应力、门槛加速度、循环剪应力比、剪切波速、震级与地表峰值加速度11个液化特征建立卷积神经网络(convolutional neural network,简称CNN)模型。引入边界合成少数过采样技术消除不平衡数据集的影响。将CNN模型与随机森林模型、逻辑回归模型、支持向量机模型、极致梯度提升模型和规范方法进行对比,并结合沙普利加性解释(SHapley Additive exPlanations,简称SHAP)分析输入特征对预测结果的影响趋势。结果表明,CNN模型准确率达92.58%,各项指标均优于其他4种机器学习模型和规范方法。对SHAP结果分析可知,修正标贯击数小于15的土层液化概率较高,循环剪应力比CSR小于0.25的土层更不易液化。各因素的影响规律均符合现有认知,预测模型合理可靠。 展开更多
关键词 机器学习 液化预测 卷积神经网络 边界合成少数过采样技术 沙普利加性解释(shap)
在线阅读 下载PDF
基于LightGBM-Informer的盾构隧道管片上浮长时间序列预测模型 被引量:5
19
作者 真嘉捷 赖丰文 +2 位作者 黄明 李爽 许凯 《岩土力学》 EI CAS CSCD 北大核心 2024年第12期3791-3801,共11页
基于机器学习预测施工期盾构刀盘前方管片上浮值,有助于及时调整盾构控制参数以缓解管片上浮病害。然而,已有模型在长时间序列预测问题上的性能不佳,难以精确预测盾构刀盘前方多环管片上浮值。通过考虑盾构控制、姿态参数及地层信息的影... 基于机器学习预测施工期盾构刀盘前方管片上浮值,有助于及时调整盾构控制参数以缓解管片上浮病害。然而,已有模型在长时间序列预测问题上的性能不佳,难以精确预测盾构刀盘前方多环管片上浮值。通过考虑盾构控制、姿态参数及地层信息的影响,结合Boruta算法,确定模型输入特征;利用小波变换滤波器、完备自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)方法消除时间序列数据噪声,构建了一种基于LightBGM-Informer的盾构隧道施工期管片上浮预测模型。通过南京和厦门地区某地铁盾构隧道监测数据,验证了所提模型的准确性和适用性。结果表明,所提模型预测精度较循环神经网络(recurrent neural network,RNN)、长短时记忆网络(long short-term memory,LSTM)、门控循环单元(gated recurrent unit,GRU)、Transformer等模型有所提升,且在地质条件不同的数据集上具有良好的泛化性;随着预测序列长度的增加,该模型的性能优势更突出,可准确预测盾构刀盘前方1~2环未施工管片的上浮值。基于沙普利加和解释(Shapley additive explanations,SHAP)方法的特征重要性分析指出,土舱压力及盾头、盾尾垂直位移对管片上浮影响显著。所提模型可为复杂环境下富水地层盾构隧道管片施工智能化控制提供理论指导。 展开更多
关键词 盾构隧道 管片上浮 长时间序列预测问题 Informer模型 shap方法
在线阅读 下载PDF
滇东喀斯特断陷盆地土壤有机碳空间分布特征及其关键影响因子 被引量:1
20
作者 李建付 黄志霖 +4 位作者 和成忠 姜昕 宋琳 刘佳鑫 陈利顶 《生态环境学报》 CSCD 北大核心 2024年第9期1339-1352,共14页
滇东喀斯特地区作为典型的生态脆弱区,土地石漠化和水土流失严重、景观空间异质性高,这些因素强烈影响着土壤性质和碳循环过程,为评估该地区土壤有机碳储量动态变化带来巨大困难。通过探究喀斯特地区土壤有机碳空间分布特征及其关键影... 滇东喀斯特地区作为典型的生态脆弱区,土地石漠化和水土流失严重、景观空间异质性高,这些因素强烈影响着土壤性质和碳循环过程,为评估该地区土壤有机碳储量动态变化带来巨大困难。通过探究喀斯特地区土壤有机碳空间分布特征及其关键影响因素,进而提升喀斯特土壤碳汇能力,对实现碳中和目标以及减缓全球气候变暖具有重要意义。基于滇东喀斯特地区典型区域土壤调查数据,利用地统计学方法、随机森林模型(RF)和SHAP解释方法(SHAP),分析了土壤有机碳空间分布特征和关键影响因子及其影响效应。结果表明,1)研究区表层土壤有机碳质量分数为1.45-56.0g·kg^(-1),变异系数为46.7%,空间变异较大。2)不同土地利用类型、土壤类型之间土壤有机碳含量差异显著(p<0.010),随着海拔上升,表层土壤有机碳含量呈现先下降后上升的趋势。3)土壤有机碳空间分布具有中等程度的空间自相关性(块金系数:48.4%),空间变异主要由总氮、总磷、降水量、海拔和pH主导,土壤氮、磷等关键因子解释了土壤有机碳88.5%的空间变异。4)关键影响因子对土壤有机碳的影响存在阈值或峰值效应。当总氮超过阈值点1.75g·kg^(-1)后,其对土壤有机碳的影响由负转正;总磷对土壤有机碳的正向贡献在1.50g·kg^(-1)左右时达到峰值,侧面证明了过度施磷肥并不能起到增加土壤肥力的作用,而可能会造成资源浪费和土地生态污染问题;海拔对土壤有机碳的正向贡献在1750 m左右时达到最大值;pH对土壤有机碳的正向贡献在4.45左右达到峰值。研究表明需要考虑关键因子的阈值或峰值效应,以便了解土壤有机碳积累的潜在过程。 展开更多
关键词 喀斯特断陷盆地 土壤有机碳 空间变异 随机森林模型 shap
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部