-
题名基于规则集成的可解释机器学习算法及应用
被引量:4
- 1
-
-
作者
闵继源
鲁统宇
任婷婷
陈汝昊
-
机构
中国计量大学经济与管理学院
东南大学网络空间安全学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2024年第6期1476-1490,共15页
-
基金
国家自然科学基金面上项目(72071186)
国家市场监督管理总局科技计划项目(2023MK232)。
-
文摘
机器学习算法因其良好的预测性能已经取得了巨大的成功,但在对模型可解释性有着较高需求的领域,其适用性受到了限制。针对机器学习算法缺乏可解释性的缺点,基于规则集成思想提出一种新的可解释机器学习算法,称之为集成树惩罚逻辑规则回归,它能以较小的结构复杂度实现与集成树算法相当的预测性能,并且保留了逻辑回归的解释效果。首先,从随机森林、XGBoost等集成树中提取分枝,并将其转换为逻辑规则。其次,对规则集进行剪枝和去重处理,以得到精简的规则集。最后,将规则作为变量融入逻辑回归中,并以Lasso算法进行复杂度控制。以企业风险预警作为实例,与多种机器学习算法进行实验对比,结果表明此算法不仅能很好地继承集成树的违约判别能力,在各个分类指标上均超越了大多数机器学习算法,而且可以通过规则给出企业风险指标的阈值,便于企业进行风险管理。进一步地,根据此算法制作企业信用评分,验证了它的广泛适用性,得到的评分符合客观规律且具有区分度,然后通过三个公开数据集验证了模型预测性能的稳健性。
-
关键词
可解释机器学习
规则学习
非线性回归
集成树
风险预警
-
Keywords
interpretable machine learning
rule learning
nonlinear regression
ensemble trees
risk early warning
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
F830.5
[经济管理—金融学]
-