-
题名融合滑动窗口和哈希函数的代码漏洞检测模型
被引量:11
- 1
-
-
作者
许健
陈平华
熊建斌
-
机构
广东工业大学计算机学院
广东技术师范大学自动化学院
-
出处
《计算机应用研究》
CSCD
北大核心
2021年第8期2394-2400,共7页
-
基金
广东省科技计划资助项目(2020B1010010010,2019B101001021)
广东省自然科学基金资助项目(2019A1515010700)。
-
文摘
针对传统漏洞检测分类需要定义人工特征以及相似度匹配算法不能检测非克隆漏洞、现有深度学习漏洞检测的方法特征维度过大以及只针对函数调用的问题,提出一种融合滑动窗口和哈希函数的深度学习方法,对源代码进行静态漏洞检测分类。首先抽取源代码的方法体,形成正负样本集,对样本集中的每个样本构建抽象语法树,根据语法树中的节点类型替换程序员自定义的变量名以及方法名,并以先序遍历的方式序列化抽象语法树;然后对抽象语法树节点中的节点信息进行分词,为每个词分配一个独立的节点编号;其次对树节点进行进一步的拆分,形成词序列,基于滑动窗口与哈希函数训练出相应的漏洞检测分类模型。最后,在SARD数据集中选取CWE190整数上溢和CWE191整数下溢两类漏洞进行实验,该模型在CWE190、CWE191中的分类准确率和召回率分别达到97.4%、94.2%和97.6%、95.1%。实验结果表明,提出方法能够检测到代码中的安全漏洞类型,并且在分类准确率和召回率上优于现有的方法。
-
关键词
静态代码漏洞检测
深度学习
滑动窗口
哈希函数
分类模型
-
Keywords
static code vulnerability detection
deep learning
sliding window
hash function
classification model
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-