-
题名使用EBIC的软件故障特征选择方法
- 1
-
-
作者
涂吉屏
钱晔
王炜
范道远
张涵宇
-
机构
云南大学软件学院
云南省软件工程重点实验室
云南农业大学大数据学院(信息工程学院)
-
出处
《计算机科学与探索》
CSCD
北大核心
2020年第2期215-235,共21页
-
基金
国家自然科学基金No.61462092~~
-
文摘
软件故障预测中若采用大量度量指标建立预测模型,可能因其中含有无关特征使预测模型性能受到不良影响,故障预测中的特征选择步骤选取一定维度的部分故障数据建立预测模型来提高模型性能,以达到压缩特征维度,提高模型预测精度,降低预测模型复杂度,节约计算资源的目的。传统特征排序方法仅评估单个特征对类标的影响,建立的预测模型有效性较低;特征子集选择方法需搜索所有特征子集,耗费计算资源且所选特征维数较高。针对以上问题,提出一种基于拓展贝叶斯信息准则的特征选择方法(EBIC-FS),该方法对数据进行线性回归,并计算出残差平方和较小且数据维数较少的特征模型。在公开数据集M&R及Promise上进行实验,结果表明该方法能有效压缩特征维度,且预测模型性能与5种基线方法相比有较大提升。
-
关键词
软件故障预测
特征选择
拓展贝叶斯信息准则
最佳特征子集
-
Keywords
software defect prediction
feature selection
extended Bayesian information criterion
best feature subset
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-