软件缺陷预测通过学习软件缺陷历史数据建立缺陷预测模型,是开发可信软件的重要手段。现有的研究在学习不平衡软件缺陷数据时,确定合理的误分类代价是一个难以解决的问题。在代价敏感朴素贝叶斯方法的基础上拓展,提出一种动态调整模型...软件缺陷预测通过学习软件缺陷历史数据建立缺陷预测模型,是开发可信软件的重要手段。现有的研究在学习不平衡软件缺陷数据时,确定合理的误分类代价是一个难以解决的问题。在代价敏感朴素贝叶斯方法的基础上拓展,提出一种动态调整模型参数的半监督学习方法——CSNB-EM(EM based Cost-Sensitive Naive Bayes)。该方法通过交叉验证搜索适合训练数据集的最优误分类代价,将搜索到的误分类代价用于建立分类模型,利用未标记数据迭代修正模型参数。方法利用未标记数据提高模型性能,同时克服了传统的软件缺陷预测中确定误分类代价的困难。基于AUC与GeoM评测指标在MDP软件缺陷数据集的5个项目上进行比较实验。实验结果表明,CSNB-EM与CS-NB、CS-NN等现有的代价敏感软件缺陷预测方法相比,其预测性能有明显提高。展开更多
在现实生活中的很多应用里,对不同类别的样本错误地分类往往会造成不同程度的损失,这些损失可以用非均衡代价来刻画.代价敏感学习的目标就是最小化总体代价.提出了一种新的代价敏感分类方法——代价敏感大间隔分布学习机(cost-sensitive...在现实生活中的很多应用里,对不同类别的样本错误地分类往往会造成不同程度的损失,这些损失可以用非均衡代价来刻画.代价敏感学习的目标就是最小化总体代价.提出了一种新的代价敏感分类方法——代价敏感大间隔分布学习机(cost-sensitive large margin distribution machine,CS-LDM).与传统的大间隔学习方法试图最大化"最小间隔"不同,CS-LDM在最小化总体代价的同时致力于对"间隔分布"进行优化,并通过对偶坐标下降方法优化目标函数,以有效地进行代价敏感学习.实验结果表明,CS-LDM的性能显著优于代价敏感支持向量机CS-SVM,平均总体代价下降了24%.展开更多
文摘软件缺陷预测通过学习软件缺陷历史数据建立缺陷预测模型,是开发可信软件的重要手段。现有的研究在学习不平衡软件缺陷数据时,确定合理的误分类代价是一个难以解决的问题。在代价敏感朴素贝叶斯方法的基础上拓展,提出一种动态调整模型参数的半监督学习方法——CSNB-EM(EM based Cost-Sensitive Naive Bayes)。该方法通过交叉验证搜索适合训练数据集的最优误分类代价,将搜索到的误分类代价用于建立分类模型,利用未标记数据迭代修正模型参数。方法利用未标记数据提高模型性能,同时克服了传统的软件缺陷预测中确定误分类代价的困难。基于AUC与GeoM评测指标在MDP软件缺陷数据集的5个项目上进行比较实验。实验结果表明,CSNB-EM与CS-NB、CS-NN等现有的代价敏感软件缺陷预测方法相比,其预测性能有明显提高。
文摘在现实生活中的很多应用里,对不同类别的样本错误地分类往往会造成不同程度的损失,这些损失可以用非均衡代价来刻画.代价敏感学习的目标就是最小化总体代价.提出了一种新的代价敏感分类方法——代价敏感大间隔分布学习机(cost-sensitive large margin distribution machine,CS-LDM).与传统的大间隔学习方法试图最大化"最小间隔"不同,CS-LDM在最小化总体代价的同时致力于对"间隔分布"进行优化,并通过对偶坐标下降方法优化目标函数,以有效地进行代价敏感学习.实验结果表明,CS-LDM的性能显著优于代价敏感支持向量机CS-SVM,平均总体代价下降了24%.
基金supported by the National Science Fund for Distinguished Young Scholars of China(61025015)the National Natural Science Foundation of China(60874069)+1 种基金the High-tech Research and Development Programof China(2009AA04Z137)the Outstanding Doctoral Thesis Project of Central South University~~