期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
SZZ误标变更对移动APP即时缺陷预测性能和解释的影响
1
作者 李志强 马睿 +3 位作者 张洪宇 荆晓远 任杰 刘金会 《软件学报》 北大核心 2025年第10期4558-4589,共32页
近年来,SZZ作为一种识别引入缺陷的变更算法,被广泛应用于即时软件缺陷预测技术中.先前的研究表明,SZZ算法在对数据进行标注时会存在误标问题,这将影响数据集的质量,进而影响预测模型的性能.因此,研究人员对SZZ算法进行了改进,并提出多... 近年来,SZZ作为一种识别引入缺陷的变更算法,被广泛应用于即时软件缺陷预测技术中.先前的研究表明,SZZ算法在对数据进行标注时会存在误标问题,这将影响数据集的质量,进而影响预测模型的性能.因此,研究人员对SZZ算法进行了改进,并提出多个SZZ变体.然而,目前尚未有文献研究数据标注质量对移动APP即时缺陷预测性能和解释的影响.为探究SZZ错误标注的变更对移动APP即时软件缺陷预测模型的影响,对4种SZZ算法进行广泛而深入的实证研究.首先,选取GitHub库中17个大型移动APP项目,借助PyDriller工具抽取软件度量元.其次,采用B-SZZ(原始SZZ版本)、AG-SZZ、MA-SZZ和RA-SZZ这4种算法标注数据.然后,根据时间序列划分数据,利用随机森林、朴素贝叶斯和逻辑回归分类器分别建立即时缺陷预测模型.最后,使用AUC、MCC、G-mean传统指标和F-measure@20%、IFA工作量感知指标评估模型性能,并使用SKESD和SHAP算法对结果进行统计显著性检验与可解释性分析.通过对比4种SZZ算法的标注性能,研究发现:(1)数据的标注质量符合SZZ变体之间的递进关系;(2)B-SZZ、AG-SZZ和MA-SZZ错误标注的变更会造成AUC、MCC得分不同程度的下降,但不会造成G-mean得分下降;(3)B-SZZ会造成F-measure@20%得分下降,而在代码审查时,B-SZZ、AG-SZZ和MA-SZZ不会导致审查工作量的增加;(4)在模型解释方面,不同SZZ算法会影响预测过程中贡献程度排名前3的度量元,并且la度量元对预测结果有重要影响. 展开更多
关键词 即时软件缺陷预测 移动APP SZZ算法 挖掘软件存储库 可解释性 工作量感知 实证软件工程
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部