-
题名基于分层数据筛选的跨项目缺陷预测方法
被引量:2
- 1
-
-
作者
赵宇
祝义
于巧
陈小颖
-
机构
江苏师范大学计算机科学与技术学院
南京航空航天大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第20期279-286,共8页
-
基金
国家自然科学基金青年项目(61902161)
江苏省高等学校自然科学研究面上项目(18KJB520016)
+3 种基金
江苏省博士后基金(1501055B)
徐州市应用基础研究计划(KC19004)
江苏师范大学自然科学研究基金-博士学位教师科研支持项目(17XLR001)
江苏师范大学研究生科研创新项目(KYCX20_2384)。
-
文摘
跨项目缺陷预测旨在解决传统的项目内缺陷预测的历史数据缺失,新项目初期缺乏训练数据等实际问题。然而,在跨项目缺陷预测中,不同项目之间以及实例之间的数据分布差异降低了其预测性能。针对这一问题,提出了基于分层数据筛选的跨项目缺陷预测方法。该方法将训练数据的筛选过程分为项目层筛选和实例层筛选,从源数据集中选出与目标项目数据分布最接近的候选项目集,在候选项目集中选出与目标项目中实例相似度较高的训练数据集,最后在训练数据集上训练朴素贝叶斯模型。在PROMISE数据集进行实验对比。结果表明,与项目内缺陷预测比较,提出的分层数据筛选方法优于项目内缺陷预测,并且有效降低了训练数据和目标项目数据之间的差异性。
-
关键词
跨项目缺陷预测
分层数据筛选
朴素贝叶斯模型
-
Keywords
cross-project defect prediction
hierarchical data screening
Naive Bayes model
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-