-
题名带特征选择的综合因果多目标反事实解释方法
- 1
-
-
作者
刘金平
汤浩楠
李兴旺
徐鹏飞
袁晟玮
-
机构
湖南师范大学信息科学与工程学院
-
出处
《电子学报》
北大核心
2025年第6期1805-1814,共10页
-
基金
国家自然科学基金(No.62371187)。
-
文摘
随着复杂机器学习模型应用扩展,各行业对模型可解释性的需求剧增.反事实解释是重要的事后可解释方法,但传统方法常将多目标合并为单目标优化,导致权重分配困难且难以调和目标冲突,也因忽略因果关系使生成的反事实样本不现实.此外,现有方法在高维、冗余、噪声数据下存在计算效率低、预测精度下降及全局解释不足等问题.为此,本文提出综合因果多目标反事实解释方法(Comprehensive Causal multi-objective counterfactual Explanation with Feature Selection,CCE-FS).该方法首先基于最大互信息系数筛选关键特征以提升预测精度和全局解释力,然后将反事实搜索转化为多目标优化问题,有效平衡多目标关系.同时引入领域因果关系约束,确保反事实样本现实合理.CCE-FS还提供可视化特征效应分析,增强用户理解并揭示模型偏见.Statlog数据集实验表明,CCE-FS通过特征选择显著提高了反事实样本的有效性、正常性、稀疏度,并使连续特征接近度提升46.3%.在Adult-Income和COMPAS数据集上的验证进一步证明,CCE-FS在因果一致性、数据分布合理性和连续特征邻近度方面均优于现有方法,展现了更强的解释与应用潜力.
-
关键词
反事实解释
多目标优化
特征选择
因果关系
最大互信息系数
可视化特征效应
-
Keywords
counterfactual explanations
multi-objective optimization
feature selection
causal relationship
maxi⁃mal information coefficient
visualization of feature effects
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名面向数据库配置优化的反事实解释方法
被引量:1
- 2
-
-
作者
朱霄
邵心玥
张岩
王宏志
-
机构
哈尔滨工业大学计算学部
-
出处
《软件学报》
EI
CSCD
北大核心
2024年第9期4469-4492,共24页
-
基金
国家自然科学基金(62232005)
四川省科技计划(2020YFSY0069)。
-
文摘
数据库性能受数据库配置参数的影响,参数设置的好坏会直接反映到数据库性能表现上,因此,数据库调参方法的优劣至关重要.然而,传统的数据库调参方法存在诸多局限性,例如无法充分利用历史调参数据、浪费时间人力资源等.而反事实解释方法是一种对原数据进行少量修改,从而将原预测改变为期望预测的方法,其起到的是建议的作用.这种作用可以用于数据库配置优化,即对数据库配置进行少量修改,从而使得数据库的性能表现得到优化.因此,提出面向数据库配置优化的反事实解释方法,对于在特定负载条件下性能表现不佳的数据库,所提方法可以对数据库配置进行修改,生成相应的数据库配置反事实,从而优化数据库性能.进行两种实验,分别用于评估反事实解释方法的优劣以及验证其优化数据库的效果,实验结果表明:综合各个评估指标,提出的反事实解释方法要优于其他的经典反事实解释方法,并且生成的反事实能够确实有效地提高数据库性能.
-
关键词
反事实解释
数据库配置优化
数据库智能化
神经网络
-
Keywords
counterfactual interpretation
database configuration optimization
AI for DB
neural network
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于特征加权的反事实解释方法:以信贷风控场景为例
- 3
-
-
作者
王宝财
吴国伟
-
机构
大连理工大学软件学院
-
出处
《计算机科学》
CSCD
北大核心
2024年第12期259-268,共10页
-
文摘
机器学习技术在金融领域的应用越来越多,为用户提供可解释的机器学习方法已成为一个重要的研究课题。近年来,反事实解释引起了广泛关注,它通过提供扰动向量来改变分类器得到的预测结果,从而提高机器学习模型的可解释性。但现有方法存在生成的反事实用例缺乏可行性和可操作性的问题。文中提出了一种新的反事实解释框架,通过引入特征变量代价权重矩阵的概念,考虑不同特征变量改变的难易程度,使得反事实结果更符合实际情况并更具可行性。同时,通过专家预定义特征变量代价权重矩阵的方式,提出了一种计算特征变量代价权重的可行方法,并允许用户根据实际情况进行个性化调整。定义的目标函数综合考虑了特征加权距离、稀疏性和接近性3个指标,确保了反事实结果的可行性、简洁性和接近原始样本集的性质。采用遗传算法来求解问题,进而生成最佳的行动方案。通过对真实数据集进行实验,证实了所提方法相比现有的反事实方法能够生成可行性和可操作性更强的反事实用例。
-
关键词
机器学习
可解释性
反事实解释
权重矩阵
遗传算法
-
Keywords
Machine learning
Interpretability
Counterfactual explanation
Weight matrix
Genetic algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名生成链接树:一种高数据真实性的反事实解释生成方法
被引量:2
- 4
-
-
作者
王明
武文芳
王大玲
冯时
张一飞
-
机构
东北大学计算机科学与工程学院
-
出处
《计算机科学》
CSCD
北大核心
2022年第9期33-40,共8页
-
基金
国家自然科学基金(62172086,61872074)。
-
文摘
超大的数据规模及结构复杂的深度模型在互联网数据的处理与应用方面表现出了优异的性能,但降低了人工智能(Artificial Intelligence, AI)系统的可解释性。反事实解释(Counterfactual Explanations, CE)作为可解释性领域研究中一种特殊的解释方法,受到了很多研究者的关注。反事实解释除了作为解释外,也可以被视为一种生成的数据。从应用角度出发,文中提出了一种生成具有高数据真实性反事实解释的方法,称为生成链接树(Generative Link Tree, GLT),采用分治策略与局部贪心策略,依据训练数据中出现的案例生成反事实解释。文中对反事实解释的生成方法进行了总结并选取了其中热门的数据集来验证GLT方法。此外,提出“数据真实性(Data Fidelity, DF)”的指标,用于评估反事实解释作为数据的有效性和潜在应用能力。与基线方法相比,GLT生成的反事实解释数据的真实性明显高于基线模型所生成的反事实解释。
-
关键词
可解释性
填充式
反事实解释
数据真实性
-
Keywords
Interpretability
Filling type
Counterfactual explanations
Data fidelity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名卫星在轨故障预防策略优化方法
- 5
-
-
作者
陈思雅
龙洗
范俊
金光
-
机构
国防科技大学系统工程学院
国防科技大学空天科学学院
-
出处
《宇航学报》
北大核心
2025年第4期698-711,共14页
-
文摘
针对目前数据驱动的卫星在轨状态检测方法无法为后续决策提供信息的问题,提出了一种卫星在轨故障预防策略优化方法,给出建议采取的行动以预防故障。将行动视为因果推理中的干预,首先在多元传递熵的基础上,构建了卫星遥测参数的结构因果模型(SCM),SCM可以对干预后的卫星状态进行预测;为了制定效果最佳、成本最小的干预措施,提出了一种基于随机搜索-自适应粒子群的最佳干预措施制定方法。在真实的卫星姿态控制系统遥测数据集上进行了卫星状态预测与故障预防策略制定的实验。实验结果表明,相比于当前先进方法,提出的卫星状态预测模型的均方误差平均降低36.6%,平均绝对误差平均降低31.4%,故障预防策略的成本平均降低53.34%。实验证明了提出方法的有效性,为卫星故障预防策略的制定提供了一种新思路。
-
关键词
结构因果模型(SCM)
卫星故障预防
遥测数据
因果推理
反事实解释
-
Keywords
Structural causal model(SCM)
Satellite fault prevention
Telemetry data
Causal inference
Counterfactual explanations
-
分类号
V11
[航空宇航科学与技术—人机与环境工程]
-