期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
利用LIME对脓毒症预测模型进行可解释性分析 被引量:8
1
作者 黄艺龙 秦小林 +2 位作者 陈芋文 张力戈 易斌 《计算机应用》 CSCD 北大核心 2021年第S01期332-335,共4页
针对机器学习应用于脓毒症预测存在预测准确率低和可解释性不足的问题,提出了利用LIME对基于机器学习的脓毒症预测模型进行可解释性分析。模型由预测和解释两部分组成:预测部分使用XGBoost和线性回归(LR),首先通过XGBoost进行特征提取,... 针对机器学习应用于脓毒症预测存在预测准确率低和可解释性不足的问题,提出了利用LIME对基于机器学习的脓毒症预测模型进行可解释性分析。模型由预测和解释两部分组成:预测部分使用XGBoost和线性回归(LR),首先通过XGBoost进行特征提取,再利用LR对提取到的特征进行分类;解释部分使用LIME模型提取出关键的预测指标对模型进行解释。实验结果表明,通过XGBoost+LR模型进行脓毒症预测的准确率为99%,受试者工作特征曲线下面积(AUROC)为0.984,优于单独使用XGBoost(准确率:95%,AUROC:0.953)和LR(准确率:53%,AUROC:0.556)或者LGBM(准确率:90%,AUROC:0.974),同时通过LIME能有效地提取出前10个最重要的指标,对脓毒症预测模型进行可解释性分析,提高了模型的可信度。 展开更多
关键词 脓毒症 机器学习 XGBoost 模型可解释性 LIME
在线阅读 下载PDF
一种即时软件缺陷预测模型及其可解释性研究 被引量:4
2
作者 陈丽琼 王璨 宋士龙 《小型微型计算机系统》 CSCD 北大核心 2022年第4期865-871,共7页
即时软件缺陷预测是保障软件安全与质量相统一的必要途径,在软件工程领域受到越来越多的关注.然而,现有数据集存在特征冗余和特征相关性低的情况,极大影响了即时软件缺陷预测模型的分类性能和稳定性.此外,分析缺陷数据特征对模型的影响... 即时软件缺陷预测是保障软件安全与质量相统一的必要途径,在软件工程领域受到越来越多的关注.然而,现有数据集存在特征冗余和特征相关性低的情况,极大影响了即时软件缺陷预测模型的分类性能和稳定性.此外,分析缺陷数据特征对模型的影响尤为重要,但如今对软件缺陷预测模型进行解释性研究较少.针对这些问题,文章基于6个开源项目的227417个代码级变更的大规模实证研究,创新性地选择了SHAP+SMOTEENN+XGBoost(SHAP-SEBoost)构建即时软件缺陷预测模型.首先通过SHAP(SHapley Additive exPlanation)模型可解释器分析初始数据集特征,并根据分析结果对数据集进行相应的特征选择与组合.然后,利用SMOTEENN对类不平衡的缺陷数据进行正负样本均衡化,使用集成学习算法XGBoost对实验数据进行预测建模.最后,使用SHAP对本文模型进行可解释性分析.实验结果表明SHAP-SEBoost有效地提高了分类性能,与基线模型以及近年优秀模型相比AUC平均提高11.6%,F1平均提升33.5%. 展开更多
关键词 即时软件缺陷预测 模型可解释性 特征工程 集成学习
在线阅读 下载PDF
一种基于Transformer架构的多层级自动睡眠分期模型
3
作者 金峥 贾克斌 《电子学报》 北大核心 2025年第2期545-557,共13页
睡眠是人体保持健康的重要生理过程,基于多导睡眠图(PolySomnoGraphy,PSG)的睡眠分期是诊疗睡眠疾病和评估睡眠质量的重要依据.人工睡眠分期法在处理大规模PSG数据时存在耗时久、效率低的问题,采用深度学习模型有效表征PSG的自动睡眠分... 睡眠是人体保持健康的重要生理过程,基于多导睡眠图(PolySomnoGraphy,PSG)的睡眠分期是诊疗睡眠疾病和评估睡眠质量的重要依据.人工睡眠分期法在处理大规模PSG数据时存在耗时久、效率低的问题,采用深度学习模型有效表征PSG的自动睡眠分期法显现出广阔的研究前景.针对现有模型未充分考虑PSG片段内波形信息、通道间相关性信息、片段间睡眠转换信息的问题,本文提出一种基于Transformer架构的多层级睡眠分期网络模型(Hierarchical transFormer sleep staging model,HierFormer),采用Transformer编码器有效提取片段内波形特征、通道相关性特征、片段间转换特征,并结合注意力机制综合提升模型对于PSG片段内、通道间、片段间三种视角信号特性的可解释性.基于睡眠集-欧洲数据格式(sleep-European Data Format,sleep-EDF)扩展睡眠数据集开展的实验结果表明:本文模型利用更少的参数量取得优于多种现有基线模型的分期性能,分类准确率、宏平均精确率、宏平均召回率、宏平均F1分数、科恩卡帕系数分别可达到0.807、0.784、0.735、0.750和0.721.通过在三种视角下不同特征编码方式的性能对比和注意力分数的可视化,本文进一步证明了所提模型良好的编码能力和可解释性.本研究旨在为睡眠分期领域的深度学习应用提供新途径和新技术,从而辅助医生提升睡眠疾病诊疗效率. 展开更多
关键词 多导睡眠图(PSG) 自动睡眠分期 深度神经网络 Transformer架构 注意力机制 模型可解释性
在线阅读 下载PDF
基于HA-RF-SHAP的露天煤矿粉尘浓度预测模型 被引量:6
4
作者 金磊 杨晓伟 +4 位作者 张浩 杜勇志 李新鹏 戴春田 周伟 《西安科技大学学报》 CAS 北大核心 2024年第1期74-83,共10页
为了有效预测和控制煤矿粉尘浓度,保障煤矿工人健康及环境安全,以宝日希勒露天煤矿现场粉尘监测数据为基础,使用随机森林对粉尘浓度进行预测,提出了4种启发式智能优化算法优化随机森林超参数的方法,通过RMSE、MAE和皮尔逊相关系数R对模... 为了有效预测和控制煤矿粉尘浓度,保障煤矿工人健康及环境安全,以宝日希勒露天煤矿现场粉尘监测数据为基础,使用随机森林对粉尘浓度进行预测,提出了4种启发式智能优化算法优化随机森林超参数的方法,通过RMSE、MAE和皮尔逊相关系数R对模型进行评价,采用SHAP可解释模型分析影响露天煤矿粉尘浓度的因素。结果表明:PM2.5、PM10、TSP的最优模型分别为GWO-RF、WOA-RF和HHO-RF;超参数调整使模型整体RMSE指标提升约为1~3,MAE提升约为1~2.5,R提升约4%~6%;PM2.5的预测表现最好,训练集与测试集共同作用时,R为0.9463,MAE为3.059,RMSE为4.919,其次是PM10、TSP;单因素作用时,湿度对于该矿粉尘浓度影响最大,双因素同时影响下湿度和气压对粉尘浓度变化影响最大。研究提供了一个有效的粉尘浓度预测方法,可准确预测粉尘浓度并确定粉尘最影响因素,对矿山粉尘管控具有重要参考价值。 展开更多
关键词 露天煤矿 粉尘浓度预测 启发式算法 SHAP 模型可解释性
在线阅读 下载PDF
基于可解释图神经网络模型的社交媒体谣言识别研究 被引量:5
5
作者 汪子航 言鹏韦 蒋卓人 《情报学报》 CSSCI CSCD 北大核心 2023年第11期1369-1381,共13页
随着社交媒体数据规模的增长与数据形式的复杂化,社交媒体谣言识别研究面临新的挑战。一方面,谣言传播网络中的复杂结构特征难以被充分挖掘;另一方面,亟须探索基于深度神经网络的谣言识别模型的可解释性。本文设计和实现了具备可解释性... 随着社交媒体数据规模的增长与数据形式的复杂化,社交媒体谣言识别研究面临新的挑战。一方面,谣言传播网络中的复杂结构特征难以被充分挖掘;另一方面,亟须探索基于深度神经网络的谣言识别模型的可解释性。本文设计和实现了具备可解释性的图神经网络模型应用于谣言识别任务。具体而言,本文在运用残差图卷积神经网络模型进行谣言识别的基础上,进一步训练基于掩码学习的图神经网络解释器,不仅将谣言传播网络结构特征纳入识别模型,而且从传播网络结构和传播节点属性两个视角对图神经网络模型自动生成解释。本文基于新浪微博(中文)和推特(英文)来源的两个网络谣言数据集进行实验,并从全局与个案两个层面进行解释性分析。研究结果显示,本文提出的图神经网络模型可以有效利用谣言传播网络结构特征,在谣言识别任务中的表现超过了一系列对照组模型。结合图神经网络解释器生成的解释可以发现,在较大规模的谣言传播树中,长传播链条是谣言的关键网络拓扑结构;在规模较小的谣言传播树中,文本特征是关键的节点属性。 展开更多
关键词 社交网络 谣言识别 图神经网络 模型可解释性
在线阅读 下载PDF
基于数字钻探与多尺度模型融合的隧道岩体完整性自动解译技术研究及应用 被引量:3
6
作者 梁铭 彭浩 +6 位作者 解威威 韩玉 宋冠先 朱孟龙 黄能豪 周邦鸿 卢振龙 《岩土工程学报》 EI CAS CSCD 北大核心 2024年第2期396-405,共10页
在多岩性与多指标钻探数据收集的基础上,综合考虑解译精度与预报效果,借助机器学习工具,提出一种基于数字钻探与多尺度模型融合的隧道岩体完整性自动解译技术。首先,对原始钻探数据有针对性的进行降噪与等距分割(0.5,1,2 m)等预处理,形... 在多岩性与多指标钻探数据收集的基础上,综合考虑解译精度与预报效果,借助机器学习工具,提出一种基于数字钻探与多尺度模型融合的隧道岩体完整性自动解译技术。首先,对原始钻探数据有针对性的进行降噪与等距分割(0.5,1,2 m)等预处理,形成多尺度、高质量机器学习数据集;然后,进行模型参数自动寻优、训练、评估与可解释性等操作,验证模型的准确性与可靠性;最后,采用加权平均的方法进行多尺度模型解译结果的融合,以增强该技术的工程实用效果。为方便实际工程应用,以上述技术为核心开发轻量化数字钻探智能解译平台,经多条灰岩与砂岩隧道应用结果表明:对比地质雷达与常规钻探解译,多尺度模型融合解译在解译效率、预测效果等方面总体表现优异,可为隧道施工的开挖与支护提供可靠的岩体完整性信息。 展开更多
关键词 隧道工程 超前钻探预报 岩体质量评价 机器学习 模型可解释性
在线阅读 下载PDF
基于EA-BiLSTM-SCSO的多步逐小时参考作物蒸腾量预测方法 被引量:1
7
作者 谢伟明 张钟莉莉 +3 位作者 陶建平 曲明山 魏一博 张石锐 《节水灌溉》 北大核心 2025年第3期57-63,70,共8页
在农业水资源管理领域,参考作物蒸腾量的精确预测对灌溉水高效利用至关重要。当前逐日预测方法未能充分利用日内动态变化信息,限制了预测准确性。为解决该问题,研究提出了一种基于外部注意力机制(EA)的双向长短时记忆网络(BiLSTM)模型,... 在农业水资源管理领域,参考作物蒸腾量的精确预测对灌溉水高效利用至关重要。当前逐日预测方法未能充分利用日内动态变化信息,限制了预测准确性。为解决该问题,研究提出了一种基于外部注意力机制(EA)的双向长短时记忆网络(BiLSTM)模型,使用沙猫群算法(SCSO)优化模型超参数,实现逐小时参考作物蒸腾量预测。首先利用SCSO方法对EA-BiLSTM模型进行优化,优化后的算法在70个epoch后收敛,平均R^(2)升至0.750;进而通过特征相关性分析,将模型输入的特征数据由10个减少为历史ET0、太阳辐射、空气温度、空气湿度和最大风速5个。以北京市昌平区的国家精准农业研究示范基地大田种植区ET0预测为例进行了方法验证,在对未来第7小时的预测中,R^(2)从0.619提高到0.644,获得了更好的预测效果;最后通过对模型可解释性分析证实,历史ET0对预测的贡献最高,贡献率达到了0.043,其次是空气湿度和总辐射。与DT(决策树)、Lasso(最小绝对收缩和选择算法)、LMP(多层感知机)、CNN(卷积神经网络)等预测方法的对比结果表明,采用EA-BiLSTM-SCSO的预测结果在MAE和MSE指标上均获得了最低的误差值,在R^(2)指标上,EA-BiLSTM-SCSO模型平均达到0.722较CNN模型提升了12.6%。研究验证了深度学习与特征工程在提高作物参考蒸腾量逐小时预测精度方面的优势。该方法在智慧灌溉中用于估算作物的水分需求,能够实现对未来灌溉的精准预测,从而制定合理的灌溉计划,提高灌溉水利用效率,进行有效的灌溉用水调度。 展开更多
关键词 BiLSTM 外部注意力机制 沙猫群优化算法 逐小时参考作物蒸腾量预测 模型可解释性
在线阅读 下载PDF
一种改进的可解释SAR图像识别网络 被引量:2
8
作者 李鹏 冯存前 胡晓伟 《空军工程大学学报》 CSCD 北大核心 2023年第4期49-55,共7页
SAR-BagNet模型是一种应用于合成孔径雷达(SAR)图像识别的可解释深度学习模型。为了使SAR-BagNet模型在具有可解释性的同时具有较高的识别精度,以SAR-BagNet模型为基础,在模型框架中加入了空间注意力和坐标注意力机制,并在MSTAR实测数... SAR-BagNet模型是一种应用于合成孔径雷达(SAR)图像识别的可解释深度学习模型。为了使SAR-BagNet模型在具有可解释性的同时具有较高的识别精度,以SAR-BagNet模型为基础,在模型框架中加入了空间注意力和坐标注意力机制,并在MSTAR实测数据集上进行了实验。实验结果表明,空间注意力和坐标注意力机制增强了SAR-BagNet模型的全局信息获取能力,能够在不降低其可解释性的基础上,有效提高模型的识别精度和决策合理性。 展开更多
关键词 深度学习 SAR图像识别 模型可解释性 注意力机制
在线阅读 下载PDF
基于学习的源代码漏洞检测研究与进展 被引量:8
9
作者 苏小红 郑伟宁 +3 位作者 蒋远 魏宏巍 万佳元 魏子越 《计算机学报》 EI CSCD 北大核心 2024年第2期337-374,共38页
源代码漏洞自动检测是源代码漏洞修复的前提和基础,对于保障软件安全具有重要意义.传统的方法通常是基于安全专家人工制定的规则检测漏洞,但是人工制定规则的难度较大,且可检测的漏洞类型依赖于安全专家预定义的规则.近年来,人工智能技... 源代码漏洞自动检测是源代码漏洞修复的前提和基础,对于保障软件安全具有重要意义.传统的方法通常是基于安全专家人工制定的规则检测漏洞,但是人工制定规则的难度较大,且可检测的漏洞类型依赖于安全专家预定义的规则.近年来,人工智能技术的快速发展为实现基于学习的源代码漏洞自动检测提供了机遇.基于学习的漏洞检测方法是指使用基于机器学习或深度学习技术来进行漏洞检测的方法,其中基于深度学习的漏洞检测方法由于能够自动提取代码中漏洞相关的语法和语义特征,避免特征工程,在漏洞检测领域表现出了巨大的潜力,并成为近年来的研究热点.本文主要回顾和总结了现有的基于学习的源代码漏洞检测技术,对其研究和进展进行了系统的分析和综述,重点对漏洞数据挖掘与数据集构建、面向漏洞检测任务的程序表示方法、基于机器学习和深度学习的源代码漏洞检测方法、源代码漏洞检测的可解释方法、细粒度的源代码漏洞检测方法等五个方面的研究工作进行了系统的分析和总结.在此基础上,给出了一种结合层次化语义感知、多粒度漏洞分类和辅助漏洞理解的漏洞检测参考框架.最后对基于学习的源代码漏洞检测技术的未来研究方向进行了展望. 展开更多
关键词 软件安全 源代码漏洞检测 漏洞数据挖掘 漏洞特征提取 代码表示学习 深度学习 模型可解释性 漏洞检测
在线阅读 下载PDF
基于文本引导下的多模态医学图像分析算法 被引量:3
10
作者 樊琳 龚勋 郑岑洋 《电子学报》 EI CAS CSCD 北大核心 2024年第7期2341-2355,共15页
结合胃镜超声和白光内镜可以更准确地识别胃肠道间质瘤.但是现有的多模态方法往往仅关注于图像特征,忽略了诊断文本信息中所包含的语义信息对于精确理解和诊断医学图像的重要性.为此,本文提出一种新的基于文本引导下的多模态医学图像分... 结合胃镜超声和白光内镜可以更准确地识别胃肠道间质瘤.但是现有的多模态方法往往仅关注于图像特征,忽略了诊断文本信息中所包含的语义信息对于精确理解和诊断医学图像的重要性.为此,本文提出一种新的基于文本引导下的多模态医学图像分析算法框架(Text-guided Multi-modal Medical image analysis framework,TMM-Net).TMM-Net使用多阶段的诊断文本来引导模型学习,以提取图像中的关键诊断信息特征,然后通过交叉模态注意力机制促进多模态特征之间的交互.值得注意的是,TMM-Net通过预测病变属性来模拟临床诊断过程,从而增强了可解释性.验证实验在两个中心包含10 025个模态数据对的数据集上进行.结果表明,该方法相比目前最优的GISTs诊断方法精度提升7.7%,同时获得了最高的(Area Under the Curve,AUC)值:0.927,其可解释性可以更好地适合临床需求. 展开更多
关键词 多模态融合 模型可解释性 图像-文本匹配 胃肠道间质瘤 胃镜超声 白光内镜
在线阅读 下载PDF
基于机器学习的非心肺转流冠状动脉旁路移植术相关急性肾损伤的预测模型 被引量:2
11
作者 曾智贺 张铁铮 +3 位作者 刁玉刚 宋沛 衣卓 李林 《临床麻醉学杂志》 CAS CSCD 北大核心 2023年第5期453-460,共8页
目的建立基于机器学习的非心肺转流冠状动脉旁路移植术相关的急性肾损伤(OPCABG-AKI)可解释性机器学习预测模型。方法回顾性收集2018—2021年行OPCABG的1110例患者的临床资料。建立并比较8种机器学习模型,采用Python的SHAP模型解释包对... 目的建立基于机器学习的非心肺转流冠状动脉旁路移植术相关的急性肾损伤(OPCABG-AKI)可解释性机器学习预测模型。方法回顾性收集2018—2021年行OPCABG的1110例患者的临床资料。建立并比较8种机器学习模型,采用Python的SHAP模型解释包对预测性能最佳的黑箱模型进行解释性分析。将特征参数SHAP绝对值的平均值定义为该参数的重要性并进行排序;以SHAP值为依据确定各特征参数与OPCABG-AKI的关系;对主要风险因素进行单个特征量化分析;对模型中具有代表性的真阳性及真阴性样本进行独立的解释性分析。结果共有405例(36.5%)患者发生AKI。在8种机器学习模型中,随机森林(RF)预测模型性能最优,针对阳性样本的受试者工作特征曲线(ROC)下面积(AUC)为0.90(95%CI 0.86~0.94)。SHAP模型解释性分析结果显示术中尿量对RF模型的贡献最大,其次为诱导期循环变异系数、术中右美托咪定用量、术中舒芬太尼用量、术中低血压时间、术前血清肌酐基线、APACHEⅡ分数和年龄等。结论以随机森林集成学习算法构建模型可较好地预测OPCABG-AKI,模型中术中尿量等指标与OPCABG-AKI关系密切。 展开更多
关键词 非心肺转流冠状动脉旁路移植术 急性肾损伤 机器学习 可解释性模型
在线阅读 下载PDF
基于DP-FS-BP预测框架和SHAP算法的数据资产价值评估指标贡献率 被引量:2
12
作者 周翠平 李少波 +3 位作者 张仪宗 袁攀亮 廖子豪 张星星 《科学技术与工程》 北大核心 2024年第33期14317-14329,共13页
数据资产价值评估对数据要素化发展具有战略意义,为理清数据资产价值评估指标的贡献率,平衡机器学习模型的准确性及可解释性。提出一种结合数据预处理技术和特征选择工程预测框架(data preprocessing-feature selection-back propagatio... 数据资产价值评估对数据要素化发展具有战略意义,为理清数据资产价值评估指标的贡献率,平衡机器学习模型的准确性及可解释性。提出一种结合数据预处理技术和特征选择工程预测框架(data preprocessing-feature selection-back propagation neural network, DP-FS-BP),并运用SHAP(Shapley additive explanations)算法对预测模型指标贡献进行解释。以优易数据网采集的交易块数据为例,首先运用数据预处理和特征选择对数据进行清洗与指标选择,其次将处理后的数据与原始数据在线性回归、支持向量机(support vector machine, SVM)、决策树、k-最近邻(k-nearest neighbors, KNN)、随机森林、XGBoost和DP-FS-BP模型上对比相关系数拟合优度R^(2)、均方根误差(root mean squared error, RMSE)、平均绝对误差(mean absolute error, MAE)的值,结果表明,DP-FS-BP模型获得最理想的预测结果,在预测精度上比其他模型有着显著优势;SHAP算法对BP神经网络模型进行解释。结果表明科研技术和数据样本量的SHAP值的平均绝对值分别为209.25和191.24,位居第一和第二。通过将特征对输出的贡献率可视化,为建立相应的数据资产价值评价指标体系提供决策依据。 展开更多
关键词 数据预处理 特征选择 模型可解释性 BP神经网络 贡献率
在线阅读 下载PDF
基于CNN的阿尔茨海默病与行为异常型额颞叶痴呆的分类 被引量:1
13
作者 俞元琳 杨剑 +1 位作者 王志江 王华丽 《计算机应用与软件》 北大核心 2024年第2期195-201,共7页
提出一种基于改进的一维卷积神经网络(1D-ICNN)的阿尔茨海默病与异常型额颞叶痴呆诊断模型,对卷积层的输出进行下采样的最大池化操作和特征压缩的全局平均池化操作。该模型在47例阿尔茨海默病和39例行为异常型额颞叶痴呆患者脑结构磁共... 提出一种基于改进的一维卷积神经网络(1D-ICNN)的阿尔茨海默病与异常型额颞叶痴呆诊断模型,对卷积层的输出进行下采样的最大池化操作和特征压缩的全局平均池化操作。该模型在47例阿尔茨海默病和39例行为异常型额颞叶痴呆患者脑结构磁共振数据上的分类精度为86.63%,优于传统机器学习模型和一般深度学习模型。此外,采用SHAP可解释方法对模型的预测结果进行解释,并对解释结果进行可视化。 展开更多
关键词 卷积神经网络 疾病分类 模型可解释性
在线阅读 下载PDF
基于灰狼优化支持向量机回归与SHAP值的锡冶炼能耗预测 被引量:6
14
作者 马朝君 彭巨擘 +4 位作者 袁海滨 郑光发 么长慧 章夏冰 冯早 《有色金属(冶炼部分)》 CAS 北大核心 2024年第2期1-7,共7页
锡冶炼过程综合能源消耗占整个锡生产过程90%,存在很大节能潜力。针对锡冶炼过程综合能耗机理模型难以建立、导致预测准确度不高的问题,提出灰狼优化的支持向量机回归(GWO-SVR)模型用于锡冶炼过程综合能耗的预测,并以某锡冶炼厂为例,将... 锡冶炼过程综合能源消耗占整个锡生产过程90%,存在很大节能潜力。针对锡冶炼过程综合能耗机理模型难以建立、导致预测准确度不高的问题,提出灰狼优化的支持向量机回归(GWO-SVR)模型用于锡冶炼过程综合能耗的预测,并以某锡冶炼厂为例,将所提模型与SVR、RF(随机森林)、BP(反向传播神经网络)、LR(线性回归)模型进行比较。结果表明,GWO-SVR模型可获得最理想的预测结果,在预测精度上相比于其他机器学习算法有着巨大优势。此外,使用SHAP值从全局解释和单样本解释两个方面解释所建立的GWO-SVR模型,可视化特征对输出的贡献,增加了GWO-SVR的可解释性,并以此制定可靠的节能策略。 展开更多
关键词 锡冶炼预测模型 模型可解释性 支持向量机回归 灰狼优化算法
在线阅读 下载PDF
用于蒸汽裂解产物成分预测的集成迁移学习框架
15
作者 郑可欣 江雨欣 +7 位作者 毕可鑫 赵祺铭 陈少臣 王冰冰 任俊宇 吉旭 邱彤 戴一阳 《化工进展》 EI CAS CSCD 北大核心 2024年第5期2880-2889,共10页
回顾了蒸汽裂解过程建模的方法,阐述了工业实际情况中面临的数据匮乏问题。面对石油化工行业大量的小数据集建模需求,充分利用历史生产数据,提出了一种集成迁移学习框架。首先,利用充足的数据在特定工况下建立了基本的深度学习模型。然... 回顾了蒸汽裂解过程建模的方法,阐述了工业实际情况中面临的数据匮乏问题。面对石油化工行业大量的小数据集建模需求,充分利用历史生产数据,提出了一种集成迁移学习框架。首先,利用充足的数据在特定工况下建立了基本的深度学习模型。然后,利用小数据集将迁移学习技术应用于新的工况,源域的专家知识通过基于参数的方法转移到目标领域。最后,引入集成学习来整合获得的迁移学习模型,从而提高性能。在几个实际案例上进行实践,研究了该模型框架的性能。为了更好地理解模型,还进一步实施了层可迁移性分析和SHapley Additive exPlanation(SHAP)特征重要性分析。结果说明该方法训练出的模型具有良好的准确性、稳定性、计算效率和可解释性,可以满足工业需求。 展开更多
关键词 模型 迁移学习 集成学习 算法 模型可解释性 石油 预测 神经网络
在线阅读 下载PDF
基于改进自注意力机制和表示学习的分层文档分类方法
16
作者 廖兴滨 钱杨舸 +1 位作者 王乾垒 秦小林 《计算机科学》 CSCD 北大核心 2024年第2期238-244,共7页
文档分类的一项基本工作是研究如何高效地表示输入特征,句子和文档向量表示也可以辅助自然语言处理的下游任务,如文本情感分析和数据泄露预防等。特征表示也逐渐成为文档分类问题的性能瓶颈和模型可解释性的关键之一。针对现有分层模型... 文档分类的一项基本工作是研究如何高效地表示输入特征,句子和文档向量表示也可以辅助自然语言处理的下游任务,如文本情感分析和数据泄露预防等。特征表示也逐渐成为文档分类问题的性能瓶颈和模型可解释性的关键之一。针对现有分层模型面临的大量重复计算以及可解释性缺乏的问题,提出了一种分层文档分类模型,并研究了句子和文档表示方法对文档分类问题的性能影响。所提模型集成了使用改进自注意力机制融合输入特征向量的句子编码器和文档编码器,形成了一个层次结构,以实现对文档级数据的分层处理,在简化计算的同时增强了模型的可解释性。与仅使用预训练语言模型的特殊标记向量作为句子表示的模型相比,所提模型在5个公开文档分类数据集上实现了平均4%的性能提升,比使用词向量矩阵的注意力输出均值的模型提高了2%。 展开更多
关键词 句子表示 文档表示 注意力机制 文档分类 模型可解释性
在线阅读 下载PDF
结合语法信息的BG-CNN用于方面级情感分类 被引量:3
17
作者 郑诚 魏素华 曹源 《计算机工程与应用》 CSCD 北大核心 2022年第5期148-155,共8页
方面级别的情感分析(ABSA)旨在确定句子中特定目标的情感倾向。大部分现有方法仅使用语义层面信息,不能很好地利用不同方面词的意见术语来达到精确的情感分类,且模型不具有可解释性。语法层面信息中词性信息和以特定方面术语为根节点的... 方面级别的情感分析(ABSA)旨在确定句子中特定目标的情感倾向。大部分现有方法仅使用语义层面信息,不能很好地利用不同方面词的意见术语来达到精确的情感分类,且模型不具有可解释性。语法层面信息中词性信息和以特定方面术语为根节点的句法结构依存树可以用于捕获句子中特定方面的意见术语。提出了结合词性信息且具有模型可解释性的BG-CNN,并引入依存树作为辅助信息用于细粒度文本情感分析。提出了增强损失函数用于模型的训练。在三个经典数据集上进行验证,实验结果表明了该模型和增强损失函数的有效性。 展开更多
关键词 方面级情感分析 依存树 语法层面 模型可解释性
在线阅读 下载PDF
基于依存句法的图像描述文本生成 被引量:3
18
作者 毕健旗 刘茂福 +1 位作者 胡慧君 代建华 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2021年第3期431-440,共10页
现有图像描述文本生成模型能够应用词性序列和句法树使生成的文本更符合语法规则,但文本多为简单句,在语言模型促进深度学习模型的可解释性方面研究甚少。将依存句法信息融合到深度学习模型以监督图像描述文本生成的同时,可使深度学习... 现有图像描述文本生成模型能够应用词性序列和句法树使生成的文本更符合语法规则,但文本多为简单句,在语言模型促进深度学习模型的可解释性方面研究甚少。将依存句法信息融合到深度学习模型以监督图像描述文本生成的同时,可使深度学习模型更具可解释性。图像结构注意力机制基于依存句法和图像视觉信息,用于计算图像区域间关系并得到图像区域关系特征;融合图像区域关系特征和图像区域特征,与文本词向量通过长短期记忆网络(LSTM),用于生成图像描述文本。在测试阶段,通过测试图像与训练图像集的内容关键词,计算2幅图像的内容重合度,间接提取与测试图像对应的依存句法模板;模型基于依存句法模板,生成多样的图像描述文本。实验结果验证了模型在改善图像描述文本多样性和句法复杂度方面的能力,表明模型中的依存句法信息增强了深度学习模型的可解释性。 展开更多
关键词 图像描述文本生成 依存句法 图像结构注意力 内容重合度 深度模型可解释性
在线阅读 下载PDF
基于加权残差聚类的建筑负荷预测区间估计 被引量:8
19
作者 章超波 刘永政 +3 位作者 李宏波 赵阳 张丽珠 王子豪 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第5期930-937,共8页
提出基于加权残差聚类的建筑负荷预测区间估计方法,旨在对建筑负荷预测模型的不确定性进行定量评估.使用Shapley additive explanations方法量化负荷预测模型的每个输入对输出的贡献程度.基于得到的贡献程度对模型输入进行加权聚类,获... 提出基于加权残差聚类的建筑负荷预测区间估计方法,旨在对建筑负荷预测模型的不确定性进行定量评估.使用Shapley additive explanations方法量化负荷预测模型的每个输入对输出的贡献程度.基于得到的贡献程度对模型输入进行加权聚类,获得不同聚类簇中的模型历史残差分布.根据不同聚类簇中的残差分布估计模型的预测区间.在深圳某办公建筑1 a的冷负荷数据集上进行验证.结果表明,与传统不对输入进行加权的方法相比,该方法可以显著提高预测区间的估计精度.期望得到的预测区间与该方法得到的预测区间的平均覆盖误差为1.87%,而传统方法的平均覆盖误差为2.27%.该方法可以用于估计任何数据驱动的建筑负荷预测模型的不确定性,从而为优化控制和故障诊断提供更可靠的负荷预测模型. 展开更多
关键词 建筑负荷预测 区间估计 数据驱动模型 模型可解释性 残差聚类
在线阅读 下载PDF
基于通道加权的多模态特征融合用于EEG疲劳驾驶检测
20
作者 程文鑫 闫光辉 +2 位作者 常文文 吴佰靖 黄亚宁 《浙江大学学报(工学版)》 2025年第9期1775-1783,1802,共10页
针对疲劳驾驶检测方法泛化能力差、特征提取模式单一、模型不可解释等问题,提出多模态特征融合模型nsNMF-PCNN-GRU-MSA,通过分析驾驶员脑电图(EEG)信号实现疲劳程度的检测.在网络浅层设计通道加权模块,引入非平滑非负矩阵分解(nsNMF)算... 针对疲劳驾驶检测方法泛化能力差、特征提取模式单一、模型不可解释等问题,提出多模态特征融合模型nsNMF-PCNN-GRU-MSA,通过分析驾驶员脑电图(EEG)信号实现疲劳程度的检测.在网络浅层设计通道加权模块,引入非平滑非负矩阵分解(nsNMF)算法计算电极通道的贡献度;在网络中层设计多模态特征融合模块,引入格拉姆角场成像方法将一维EEG数据映射成二维图像,并采用PCNN-GRU并行方式融合不同模态的时空特征;在网络深层融合多头自注意力机制(MSA),完成疲劳驾驶状态分类任务.实验结果表明,该模型在数据集SEED-VIG和SAD的混合样本上的疲劳检测准确率分别为93.37%、90.78%,单个被试数据准确率最低分别为86.60%、85.59%,高于近年先进模型.将特征激活值映射到大脑拓扑图上的分析方法不仅提高了模型的可解释性,而且为疲劳驾驶检测提供了新视角. 展开更多
关键词 EEG 疲劳驾驶检测 nsNMF 格拉姆角场 多模态特征融合 模型可解释性
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部