- 
                题名面向软件缺陷报告的提取方法
                    被引量:1
            
- 1
- 
                
            
- 
                
                            作者
                                林涛
                                高建华
                                伏雪
                                马燕
                                林艳
                
            
- 
                    机构
                    
                            上海师范大学计算机科学与工程系
                            奥克兰大学信息系统系
                    
                
- 
                出处
                
                
                    《计算机科学》
                    
                            CSCD
                            北大核心
                    
                2016年第6期179-183,共5页
            
- 
                        基金
                        
                                    国家自然科学基金(61073163
                                    61373004)
                                    上海市企业自主创新专项资金项目(沪CXY-2013-88)资助
                        
                    
- 
                    文摘
                        软件工程中的软件缺陷报告数量在快速增长,开发者们越来越困惑于大量的缺陷报告。因此,为了达到缺陷修复和软件复用等目的,有必要研究软件缺陷报告的提取方法。提出一种提取方法,该方法首先合并缺陷报告中的同义词,然后建立空间向量模型,使用词频反文档频率以及信息增益等文本挖掘的方法来收集软件缺陷报告中单词的特征,同时设计算法来确定句子复杂度以选择长句,最后将贝叶斯分类器引入该领域。该方法可以提高缺陷报告提取的命中率,降低虚警率。实验证明,基于文本挖掘和贝叶斯分类器的软件缺陷报告提取方法在接受者工作特征曲线面积(0.71)、F-score(0.80)和Kappa值(0.75)方面有良好效果。
                        
                    
            
- 
                    关键词
                    
                            软件缺陷报告管理
                            文本挖掘
                            贝叶斯分类器
                            软件缺陷报告特征
                            空间向量模型
                            句子复杂度
                    
                
- 
                    Keywords
                    
                            Bug report management, Text mining, Bayes classifier, Bug report feature, Vector space model, Sentence complexity
                    
                
- 
                    分类号
                    
                            
                                
                                    TP311.5
[自动化与计算机技术—计算机软件与理论]                                
                            
                    
                
-