基于小样本学习的源码漏洞检测被引量：2

Source Code Vulnerability Detection Based on Few-shot Learning

在线阅读下载PDF

导出

摘要源码漏洞检测是发现及定位关键系统威胁的重要手段.目前,将深度学习技术应用于源码漏洞检测已经成为研究热点.然而,由于源码漏洞样本缺失,有限的数据条件资源导致现有的源码漏洞检测方法在小样本场景下效果不佳.提出了一种基于小样本学习的源码漏洞检测方法,其目标在于为有限样本量的源码漏洞检测场景提供解决方案.该方法由4个关键部分组成:源码切片和编码、基于元学习的数据集处理、基于动态路由算法的漏洞类向量生成和基于神经张量网络的漏洞类向量匹配.该方法和卷积神经网络、原型网络、关系网络进行了对比,实验结果表明,该方法在准确率方面优于其他的方法,可以有效应对源码漏洞样本稀疏问题.在2-way 5-shot和2-way 10-shot的情况下,该方法分别达到93.92%和95.08%的准确率. Source code vulnerability detection is an important means to discover and localize threats to critical systems.At present,the application of deep learning techniques to source generation vulnerability detection has become a research hotspot.However,due to the lack of source code vulnerability samples,limited data condition resources lead to the poor effect of existing source code vulnerability detection methods in small sample scenarios.In this paper,we propose a source code vulnerability detection method based on few-shot learning,which aims to provide a solution for source code vulnerability detection scenarios with limited sample size.The method in this paper consists of four key components:source code slicing and encoding,meta-learning based dataset processing,vulnerability class vector generation based on dynamic routing algorithms,and vulnerability class vector matching based on neural tensor networks.This paper’s method is compared with convolutional neural network,prototype network,and relational network,and the experimental results show that this paper’s method outperforms the others in terms of accuracy,and can effectively cope with the problem of sparse vulnerability samples in source code.In the case of 2-way 5-shot and 2-way 10-shot,this paper’s method achieves 93.92%and 95.08%accuracy,respectively.

作者陈洪森方勇郝城凌杨运涛张棋 Chen Hongsen;Fang Yong;Hao Chengling;Yang Yuntao;Zhang Qi(School of Cyber Science and Engineering,Sichuan University,Chengdu 610207;Chengdu Internet Information Center,Chengdu 610041)

机构地区四川大学网络空间安全学院成都市互联网信息中心

出处《信息安全研究》 CSCD 北大核心 2024年第5期440-445,共6页 Journal of Information Security Research

关键词小样本学习漏洞检测归纳网络代码切片元学习 few-shot learning vulnerability detection induction network code slicing meta-learning

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

作者简介陈洪森,硕士.主要研究方向为漏洞检测.modengxian@protonmail.com;方勇,博士,教授,博士生导师.主要研究方向为网络对抗技术.yfang@scu.edu.cn;郝城凌,硕士.主要研究方向为入侵检测、图神经网络.1612170458@qq.com;杨运涛,硕士.主要研究方向为图神经网络、APT溯源检测.ttmonica111@163.com;通信作者:张棋,硕士.主要研究方向为网络数据安全政策、数据安全管理.sczhangxqi@126.com。

引文网络
相关文献

参考文献4

1刘宝旭,李昊,孙钰杰,董放明,孙天琦,陈潇.智能化漏洞挖掘与网络空间威胁发现综述[J].信息安全研究,2023,9(10):932-939. 被引量：6
2赵凯琳,靳小龙,王元卓.小样本学习研究综述[J].软件学报,2021,32(2):349-369. 被引量：204
3李凡长,刘洋,吴鹏翔,董方,蔡奇,王哲.元学习研究综述[J].计算机学报,2021,44(2):422-446. 被引量：89
4刘嘉勇,韩家璇,黄诚.源代码漏洞静态分析技术[J].信息安全学报,2022,7(4):100-113. 被引量：4

二级参考文献43

1张庆林,王永明.元学习能力及其培养[J].中国教育学刊,1996(3):34-37. 被引量：49
2朱方年,马野.拔除股动脉鞘管手法压迫与应用血管闭合装置的局部并发症小样本比较[J].现代中西医结合杂志,2010,19(14):1748-1748. 被引量：2
3陈武锦.半监督学习研究综述[J].电脑知识与技术,2011,7(6):3887-3889. 被引量：4
4杨军,刘妍丽.基于图像的单样本人脸识别研究进展[J].西华大学学报（自然科学版）,2014,33(4):1-5. 被引量：8
5邹权臣,张涛,吴润浦,马金鑫,李美聪,陈晨,侯长玉.从自动化到智能化:软件漏洞挖掘技术进展[J].清华大学学报（自然科学版）,2018,58(12):1079-1094. 被引量：43
6沈媛媛,严严,王菡子.有监督的距离度量学习算法研究进展[J].自动化学报,2014,40(12):2673-2686. 被引量：25
7刘建伟,刘媛,罗雄麟.半监督学习方法[J].计算机学报,2015,38(8):1592-1617. 被引量：138
8王蕾,李丰,李炼,冯晓兵.污点分析技术的原理和实践应用[J].软件学报,2017,28(4):860-882. 被引量：50
9王雪,马铁民,杨涛,宋平,谢秋菊,陈争光.基于近红外光谱的灌浆期玉米籽粒水分小样本定量分析[J].农业工程学报,2018,34(13):203-210. 被引量：15
10叶志斌,严波.符号执行研究综述[J].计算机科学,2018,45(B06):28-35. 被引量：19

共引文献277

1徐惠灵,尚政国,董胜波,苏琪雅.面向深度神经网络应用的小样本学习技术研究[J].南京航空航天大学学报,2022,54(S01):80-86.
2尤庆丽,李国勇.基于孪生网络的离线手写签名鉴别算法[J].计算机应用,2023,43(S01):45-48. 被引量：1
3郭军成,万刚,胡欣杰,王帅,严发宝.基于少样本的太阳射电爆发事件检测研究[J].计算机科学,2022,49(S02):597-603.
4张烈平,李智浩,唐玉良.基于迁移学习的轻量化YOLOv2口罩佩戴检测方法[J].电子测量技术,2022,45(10):112-117. 被引量：10
5郝志英,袁得嵛.基于迁移学习的小样本血腥暴力图片识别算法研究[J].中国人民公安大学学报（自然科学版）,2024,30(1):58-65. 被引量：1
6祝钧桃,姚光乐,张葛祥,李军,杨强,王胜,叶绍泽.深度神经网络的小样本学习综述[J].计算机工程与应用,2021,57(7):22-33. 被引量：35
7余本功,汲浩敏.基于多粒度建模的半监督文本分类方法研究[J].现代情报,2021,41(6):42-53. 被引量：4
8刘畅,阿布都克力木·阿布力孜,姚登峰,哈里旦木·阿布都克里木.维吾尔语形态分析研究综述[J].计算机工程与应用,2021,57(15):42-61. 被引量：3
9梁俊宇,杨洋,李怡雪,舒杰.基于迁移学习的电能替代节能量在线估计方法[J].电力建设,2021,42(8):29-37. 被引量：2
10熊金波,毕仁万,田有亮,刘西蒙,马建峰.移动群智感知安全与隐私:模型、进展与趋势[J].计算机学报,2021,44(9):1949-1966. 被引量：29

同被引文献9

1程道雷,肖美华,刘欣倩,梅映天,李伟.运用SPIN对开放授权协议OAuth 2.0的分析与验证[J].计算机工程与科学,2015,37(11):2121-2127. 被引量：4
2魏成坤,刘向东,石兆军.OAuth2.0协议的安全性形式化分析[J].计算机工程与设计,2016,37(7):1746-1751. 被引量：7
3陈传涛,潘丽敏,龚俊,马勇,罗森林.基于抽象语法树压缩编码的漏洞检测方法[J].信息安全研究,2022,8(1):35-42. 被引量：4
4王庆德,吕欣,王慧钧,刘海洋,秦天雄.数据安全治理的行业实践研究[J].信息安全研究,2022,8(4):333-339. 被引量：14
5李懿,田玉玲.远程医疗信息系统中的三因素匿名认证协议[J].计算机工程与应用,2023,59(10):280-287. 被引量：4
6胡雨涛,王溯远,吴月明,邹德清,李文科,金海.基于图神经网络的切片级漏洞检测及解释方法[J].软件学报,2023,34(6):2543-2561. 被引量：25
7苏小红,郑伟宁,蒋远,魏宏巍,万佳元,魏子越.基于学习的源代码漏洞检测研究与进展[J].计算机学报,2024,47(2):337-374. 被引量：10
8师自通,师智斌,刘冬明,雷海卫,龚晓元.多头注意力机制的图同构网络智能合约源码漏洞检测[J].计算机工程与应用,2024,60(7):258-265. 被引量：2
9邹德清,姬煜,胡雨涛,刘启霄,郑直.基于深度学习的漏洞检测研究综述[J].网络空间安全科学学报,2023,1(1):47-58. 被引量：1

引证文献2

1曾宇恒,王娟,朱倪宏,秦书晨.基于神经网络的代码漏洞检测研究进展与趋势[J].智能安全,2025,4(1):77-91.
2严海星.基于ASLan++的OAuth2.0协议授权码模型形式化建模与分析[J].计算机工程与应用,2025,61(18):309-316.

1尚志武,钱仕淇.基于改进孪生胶囊网络的小样本轴承故障诊断[J].轴承,2024(3):84-91. 被引量：1
2张婷,王登武.基于空洞分层注意力胶囊网络的X射线焊缝缺陷识别方法[J].宇航计测技术,2024,44(2):45-51. 被引量：4
32024年针对性解决白发、毛发稀疏问题的护发指南[J].健康与美容,2024(1):80-95.
4黄德玲,童夏龙,杨皓栋.融合图注意力网络和注意力因子分解机的服务推荐方法[J].重庆邮电大学学报（自然科学版）,2024,36(2):357-366. 被引量：2

信息安全研究

2024年第5期

浏览历史

内容加载中请稍等...

基于小样本学习的源码漏洞检测被引量：2

参考文献4

二级参考文献43

共引文献277

同被引文献9

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于小样本学习的源码漏洞检测 被引量：2

参考文献4

二级参考文献43

共引文献277

同被引文献9

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于小样本学习的源码漏洞检测被引量：2