-
题名基于实例过滤与迁移的跨项目缺陷预测方法
被引量:1
- 1
-
-
作者
范贵生
刁旭炀
虞慧群
陈丽琼
-
机构
华东理工大学计算机科学与工程系
上海市计算机软件评测重点实验室
上海应用技术大学计算机科学与信息工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第8期197-202,209,共7页
-
基金
国家自然科学基金(61702334,61772200)
上海市浦江人才资助计划(17PJ1401900)
+1 种基金
上海市自然科学基金(17ZR1406900,17ZR1429700)
华东理工大学教育科研基金(ZH1726108)。
-
文摘
在跨项目软件缺陷预测中,人工采集标注的原始数据集通常包含噪声数据,并且源项目与目标项目之间的数据存在较大的分布差异性。针对该问题,提出一种两阶段跨项目缺陷预测方法CLNI-KMM。在实例过滤阶段,基于CLNI算法过滤噪声实例。在实例迁移阶段,采用KMM算法调整源项目中实例的训练权重,并结合目标项目中的少量标注实例建立软件缺陷预测模型。实验结果表明,与经典的跨项目软件缺陷预测方法TCA、TNB和NNFilter相比,CLNI-KMM方法预测性能较优,并且具有较强的稳定性。
-
关键词
跨项目缺陷预测
噪声数据
分布差异
实例过滤
实例迁移
-
Keywords
cross-project defect prediction(cpdp)
noisy data
distribution difference
instance filtering
instance transfer
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名结合特征对齐与实例迁移的跨项目缺陷预测
- 2
-
-
作者
李莉
赵鑫
石可欣
苏仁嘉
任振康
-
机构
东北林业大学计算机与控制工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2023年第10期3091-3099,共9页
-
基金
黑龙江省教育科学规划课题(GJB1421251)。
-
文摘
为解决跨项目缺陷预测中源项目和目标项目分布差异较大的问题,提出了一种基于特征对齐和实例迁移的两阶段缺陷预测方法(FAIT)。首先,在特征对齐阶段,根据边缘概率分布进行特征的边缘分布对齐;然后,基于源项目和目标项目构建条件分布映射矩阵完成条件分布对齐;最后,在实例迁移阶段,通过改进了权重调整策略的TrAdaBoost方法构建跨项目缺陷预测模型。以F 1作为评价指标,当目标项目有标签实例比例为20%时,FAIT性能最佳,且两过程特征对齐优于单一过程特征对齐。此外,FAIT的预测性能在AEEEM和NASA数据集上分别提高了10.69%、15.04%。FAIT在一定程度上解决了源项目与目标项目的分布差异,能够取得较好的缺陷预测性能。
-
关键词
跨项目缺陷预测
特征对齐
最大均值差异
实例迁移
TrAdaBoost
-
Keywords
cross-project defect prediction(cpdp)
feature alignment
maximum mean discrepancy
instance transfer
TrAdaBoost
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-
-
题名跨项目缺陷预测中训练数据选择方法
被引量:3
- 3
-
-
作者
王星
何鹏
陈丹
曾诚
-
机构
湖北大学计算机与信息工程学院
湖北省教育信息化工程技术研究中心(湖北大学)
-
出处
《计算机应用》
CSCD
北大核心
2016年第11期3165-3169,3187,共6页
-
基金
国家973计划项目(2014CB340401)
国家自然科学基金资助项目(61273216
+4 种基金
61272111
61202048
61202032)
湖北省知识创新专项项目(2016CFB309)
武汉市青年科技晨光计划项目(2014070404010232)~~
-
文摘
跨项目缺陷预测(CPDP)利用来自其他项目的缺陷数据预测目标项目的缺陷情况,为解决以往缺陷预测方法面临的训练数据受限问题提供了一个新的视角。训练数据的质量将直接影响跨项目缺陷预测模型的性能,因此,需尽可能选择与目标项目更相似的数据用于模型的训练。利用PROMISE提供的34个公开数据集,从训练数据选择方面,分析了四种典型的相似性度量方法对跨项目预测结果的影响以及各种方法之间的差异。研究结果表明:使用不同的相似性度量方法选出的训练数据质量不同,其中余弦相似性与相关系数两种方法效果更好,且最大改进比例达到6.7%;同时,根据目标项目的缺陷率,发现余弦相似性更适合于缺陷率高于0.25的项目。
-
关键词
软件质量保证
缺陷预测
跨项目缺陷预测
相似性度量
数据选择
-
Keywords
software quality assurance
defect prediction
cross-project defect prediction (cpdp)
similarity measure
data selection
-
分类号
TP310
[自动化与计算机技术—计算机软件与理论]
-