-
题名基于大语言模型的模糊测试研究综述
- 1
-
-
作者
李岩
杨文章
张翼
薛吟兴
-
机构
中国科学技术大学软件学院
中国科学技术大学计算机科学与技术学院
中国科学技术大学苏州高等研究院
-
出处
《软件学报》
北大核心
2025年第6期2404-2431,共28页
-
基金
国家自然科学基金(61972373)。
-
文摘
模糊测试是一种自动化的软件测试方法,通过向目标软件系统输入大量自动生成的测试数据,以发现系统潜在的安全漏洞、软件缺陷或异常行为.然而,传统模糊测试技术受限于自动化程度低、测试效率低、代码覆盖率低等因素,无法应对现代的大型软件系统.近年来,大语言模型的迅猛发展不仅为自然语言处理领域带来重大突破,也为模糊测试领域带来了新的自动化方案.因此,为了更好地提升模糊测试技术的效果,现有的工作提出了多种结合大语言模型的模糊测试方法,涵盖了测试输入生成、缺陷检测、后模糊处理等模块.但是现有工作缺乏对基于大语言模型的模糊测试技术的系统性调研和梳理讨论,为了填补上述综述方面的空白,对现有的基于大语言模型的模糊测试技术的研究发展现状进行全面的分析和总结.主要内容包括:(1)概述模糊测试的整体流程和模糊测试研究中常用的大语言模型相关技术;(2)讨论大模型时代之前的基于深度学习的模糊测试方法的局限性;(3)分析大语言模型在模糊测试方法中不同环节的应用方式;(4)探讨大语言模型技术在模糊测试中的主要挑战和今后可能的发展方向.
-
关键词
大语言模型
模糊测试
测试输入生成
缺陷检测
后模糊处理
-
Keywords
large language model(LLM)
fuzzing
test input generation
defect detection
post-fuzzing
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-