-
题名面向可解释性的软件缺陷预测主动学习方法
被引量:1
- 1
-
-
作者
王越
李勇
张文静
-
机构
新疆师范大学计算机科学技术学院
南京航空航天大学高安全系统的软件开发与验证技术工信部重点实验室
-
出处
《现代电子技术》
北大核心
2024年第20期101-108,共8页
-
基金
新疆维吾尔自治区自然科学基金项目(2022D01A225)
新疆维吾尔自治区重点研发计划项目(2022B01007-1)。
-
文摘
针对软件缺陷预测中数据标注代价较高及深度学习模型缺乏可解释性的问题,提出一种面向可解释性的软件缺陷预测主动学习方法。首先,基于主动学习技术,通过样本选择策略从目标项目中筛选出不确定性高的样本进行专家标注,并将这些标注样本放入源项目中以训练预测器。其次,利用领域知识对选定样本进行扰动,构建局部数据集,并通过线性模型在该数据集上模拟数据选择策略的行为,以实现模型的可解释性。实验结果显示:该方法在数据标注方面的指标性能要优于传统的主动学习基准方法;同时,在可解释性方面,该方法的RMSE指标也均低于LIME、全局代理模型以及RuleFit,能较好地解释“黑盒”模型。该方法不仅可以有效提高软件缺陷数据的标注效率,还可以实现模型的可解释性。
-
关键词
软件缺陷预测
主动学习
可解释性
数据标注
数据选择策略
深度学习
-
Keywords
software defect prediction
active learning
interpretability
data annotation
data selection strategy
deep learning
-
分类号
TN919-34
[电子电信—通信与信息系统]
-