期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
SZZ误标变更对移动APP即时缺陷预测性能和解释的影响
1
作者
李志强
马睿
+3 位作者
张洪宇
荆晓远
任杰
刘金会
《软件学报》
北大核心
2025年第10期4558-4589,共32页
近年来,SZZ作为一种识别引入缺陷的变更算法,被广泛应用于即时软件缺陷预测技术中.先前的研究表明,SZZ算法在对数据进行标注时会存在误标问题,这将影响数据集的质量,进而影响预测模型的性能.因此,研究人员对SZZ算法进行了改进,并提出多...
近年来,SZZ作为一种识别引入缺陷的变更算法,被广泛应用于即时软件缺陷预测技术中.先前的研究表明,SZZ算法在对数据进行标注时会存在误标问题,这将影响数据集的质量,进而影响预测模型的性能.因此,研究人员对SZZ算法进行了改进,并提出多个SZZ变体.然而,目前尚未有文献研究数据标注质量对移动APP即时缺陷预测性能和解释的影响.为探究SZZ错误标注的变更对移动APP即时软件缺陷预测模型的影响,对4种SZZ算法进行广泛而深入的实证研究.首先,选取GitHub库中17个大型移动APP项目,借助PyDriller工具抽取软件度量元.其次,采用B-SZZ(原始SZZ版本)、AG-SZZ、MA-SZZ和RA-SZZ这4种算法标注数据.然后,根据时间序列划分数据,利用随机森林、朴素贝叶斯和逻辑回归分类器分别建立即时缺陷预测模型.最后,使用AUC、MCC、G-mean传统指标和F-measure@20%、IFA工作量感知指标评估模型性能,并使用SKESD和SHAP算法对结果进行统计显著性检验与可解释性分析.通过对比4种SZZ算法的标注性能,研究发现:(1)数据的标注质量符合SZZ变体之间的递进关系;(2)B-SZZ、AG-SZZ和MA-SZZ错误标注的变更会造成AUC、MCC得分不同程度的下降,但不会造成G-mean得分下降;(3)B-SZZ会造成F-measure@20%得分下降,而在代码审查时,B-SZZ、AG-SZZ和MA-SZZ不会导致审查工作量的增加;(4)在模型解释方面,不同SZZ算法会影响预测过程中贡献程度排名前3的度量元,并且la度量元对预测结果有重要影响.
展开更多
关键词
即时
软件
缺陷预测
移动APP
SZZ算法
挖掘软件存储库
可解释性
工作量感知
实证
软件
工程
在线阅读
下载PDF
职称材料
题名
SZZ误标变更对移动APP即时缺陷预测性能和解释的影响
1
作者
李志强
马睿
张洪宇
荆晓远
任杰
刘金会
机构
陕西师范大学计算机科学学院
重庆大学大数据与软件学院
武汉大学计算机学院
广东石油化工学院计算机学院
西北工业大学网络空间安全学院
出处
《软件学报》
北大核心
2025年第10期4558-4589,共32页
基金
国家自然科学基金(61902228,62176069,U23A20302)
陕西省自然科学基础研究计划(2024JC-YBMS-497)
陕西省重点研发计划(2023-YBGY-265)。
文摘
近年来,SZZ作为一种识别引入缺陷的变更算法,被广泛应用于即时软件缺陷预测技术中.先前的研究表明,SZZ算法在对数据进行标注时会存在误标问题,这将影响数据集的质量,进而影响预测模型的性能.因此,研究人员对SZZ算法进行了改进,并提出多个SZZ变体.然而,目前尚未有文献研究数据标注质量对移动APP即时缺陷预测性能和解释的影响.为探究SZZ错误标注的变更对移动APP即时软件缺陷预测模型的影响,对4种SZZ算法进行广泛而深入的实证研究.首先,选取GitHub库中17个大型移动APP项目,借助PyDriller工具抽取软件度量元.其次,采用B-SZZ(原始SZZ版本)、AG-SZZ、MA-SZZ和RA-SZZ这4种算法标注数据.然后,根据时间序列划分数据,利用随机森林、朴素贝叶斯和逻辑回归分类器分别建立即时缺陷预测模型.最后,使用AUC、MCC、G-mean传统指标和F-measure@20%、IFA工作量感知指标评估模型性能,并使用SKESD和SHAP算法对结果进行统计显著性检验与可解释性分析.通过对比4种SZZ算法的标注性能,研究发现:(1)数据的标注质量符合SZZ变体之间的递进关系;(2)B-SZZ、AG-SZZ和MA-SZZ错误标注的变更会造成AUC、MCC得分不同程度的下降,但不会造成G-mean得分下降;(3)B-SZZ会造成F-measure@20%得分下降,而在代码审查时,B-SZZ、AG-SZZ和MA-SZZ不会导致审查工作量的增加;(4)在模型解释方面,不同SZZ算法会影响预测过程中贡献程度排名前3的度量元,并且la度量元对预测结果有重要影响.
关键词
即时
软件
缺陷预测
移动APP
SZZ算法
挖掘软件存储库
可解释性
工作量感知
实证
软件
工程
Keywords
just-in-time software defect prediction
mobile APP
SZZ method
mining software repository
interpretability
effort aware
empirical software engineering
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
SZZ误标变更对移动APP即时缺陷预测性能和解释的影响
李志强
马睿
张洪宇
荆晓远
任杰
刘金会
《软件学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部