基于Transformer-GCN的源代码漏洞检测方法

Source code vulnerability detection method based on Transformer-GCN

在线阅读下载PDF

导出

摘要针对现有的基于深度学习的源代码漏洞检测方法存在目标代码语法和语义缺失严重以及神经网络模型对目标代码图点(边)权重分配不合理等问题,提出一种基于代码属性图(CPG)与自适应图卷积网络(AT-GCN)的源代码漏洞检测方法 VulATGCN。该方法使用CPG对源代码进行表征,结合CodeBERT进行节点向量化,并通过图中心性分析提取深层次结构特征,从而多维度地捕捉代码的语法和语义信息。之后,结合Transformer自注意力机制善于捕捉长距离依赖关系和图卷积网络(GCN)善于捕捉局部特征的优势设计AT-GCN模型,从而实现对不同重要性区域特征的融合学习和精确提取。在真实漏洞数据集Big-Vul和SARD上的实验结果表明,所提方法 VulATGCN的平均F1分数达到了82.9%,相较于VulSniper、VulMPFF和MGVD等基于深度学习的漏洞检测方法提高了10.4%~132.9%,平均提高约52.9%。 The existing deep learning-based methods for source code vulnerability detection often suffer from severe loss of syntax and semantics in target code,and neural network models allocating weights to the graph nodes(edges)in target code unreasonably.To address these issues,a method named VulATGCN for detecting source code vulnerabilities was proposed on the basis of Code Property Graph(CPG)and Adaptive Transformer-Graph Convolutional Network(AT-GCN).In the method,CPG was used to represent source code,CodeBERT was combined for node vectorization,and graph centrality analysis was employed to extract deep structural features,thereby capturing the code’s syntax and semantic information in multi-dimensional way.After that,AT-GCN model was designed by integrating strengths of Transformer-based self-attention mechanism,which excels at capturing long-range dependencies,and Graph Convolutional Network(GCN),which is proficient at capturing local features,thereby realizing fusion learning and precise extraction of features from regions with different importance.Experimental results on real vulnerability datasets Big-Vul and SARD show that the proposed method VulATGCN achieves an average F1 score of 82.9%,which is 10.4%to 132.9%higher than deep learning-based vulnerability detection methods such as VulSniper,VulMPFF,and MGVD,with an average increase of approximately 52.9%.

作者梁辰王奕森魏强杜江 LIANG Chen;WANG Yisen;WEI Qiang;DU Jiang(School of Cyberspace Security,Information Engineering University,Zhengzhou Henan 450001,China)

机构地区信息工程大学网络空间安全学院

出处《计算机应用》北大核心 2025年第7期2296-2303,共8页 journal of Computer Applications

基金河南省重点研发专项(221111210300)。

关键词源代码漏洞检测代码属性图图神经网络中心性分析自注意力机制 code vulnerability detection Code Property Graph(CPG) Graph Neural Network(GNN) centrality analysis self-attention mechanism

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

作者简介梁辰(2000-),男,安徽合肥人,硕士研究生,主要研究方向:软件成分分析;通信作者:王奕森(1990-),男,河南沈丘人,副教授,博士,主要研究方向:网络安全,电子邮箱:851067568@qq.com;魏强(1979-),男,江西南昌人,教授,博士,主要研究方向:软件安全、工业控制系统安全;杜江(1990-),男,河南郑州人,博士研究生,主要研究方向:二进制代码相似性。

引文网络
相关文献

参考文献1

1胡雨涛,王溯远,吴月明,邹德清,李文科,金海.基于图神经网络的切片级漏洞检测及解释方法[J].软件学报,2023,34(6):2543-2561. 被引量：28

二级参考文献5

1李珍,邹德清,王泽丽,金海.面向源代码的软件漏洞静态检测综述[J].网络与信息安全学报,2019,5(1):1-14. 被引量：25
2陈肇炫,邹德清,李珍,金海.基于抽象语法树的智能化漏洞检测系统[J].信息安全学报,2020,5(4):1-13. 被引量：12
3段旭,吴敬征,罗天悦,杨牧天,武延军.基于代码属性图及注意力双向LSTM的漏洞挖掘方法[J].软件学报,2020,31(11):3404-3420. 被引量：42
4吴博,梁循,张树森,徐睿.图神经网络前沿进展与应用[J].计算机学报,2022,45(1):35-68. 被引量：100
5王剑,匡洪宇,李瑞林,苏云飞.基于CNN-GAP可解释性模型的软件源码漏洞检测方法[J].电子与信息学报,2022,44(7):2568-2575. 被引量：30

共引文献27

1张学军,张奉鹤,盖继扬,杜晓刚,周文杰,蔡特立,赵博.mVulSniffer:一种多类型源代码漏洞检测方法[J].通信学报,2023,44(9):149-160. 被引量：4
2胡艳丽,周乐明,黄中秀,黄仕鑫,李小松.基于图神经网络改进宫颈癌筛查系统与宫颈细胞DNA定量在高危型HPV阳性患者中的比较[J].重庆医科大学学报,2023,48(12):1501-1506. 被引量：2
3李妍,羌卫中,李珍,邹德清,金海.基于程序过程间语义优化的深度学习漏洞检测方法[J].网络与信息安全学报,2023,9(6):86-101. 被引量：2
4况博裕,张兆博,杨善权,苏铓,付安民.HMFuzzer:一种基于人机协同的物联网设备固件漏洞挖掘方案[J].计算机学报,2024,47(3):703-716. 被引量：7
5李姝.基于改进网络爬虫技术的高性能计算机程序切片级漏洞检测方法[J].信息技术与信息化,2024(4):200-203. 被引量：2
6邹德清,姬煜,胡雨涛,刘启霄,郑直.基于深度学习的漏洞检测研究综述[J].网络空间安全科学学报,2023,1(1):47-58. 被引量：1
7徐立祥,许巍,陈恩红,罗斌,唐远炎.KENN:线性结构熵的图核神经网络[J].软件学报,2024,35(5):2430-2445. 被引量：2
8郭春霞.基于权限验证图的Web访问控制漏洞检测方法[J].自动化与仪器仪表,2024(6):252-256. 被引量：1
9周玲玲,鲁雪纯.基于深度学习的软件漏洞挖掘方法[J].信息记录材料,2024,25(9):159-161.
10王禹韬,钱建华,薛金凯.数据泄露的途径及检测工具开发思路[J].江苏通信,2024,40(5):114-117.

1赵波,彭君茹,王一琁.基于威胁传播的网络安全态势评估方法[J].信息网络安全,2025(6):843-858.
2王思娜,储大可.基于网络药理学和分子对接探讨当归补血汤治疗系统性红斑狼疮的活性成分及作用机制[J].医药前沿,2025,15(19):1-6.
3樊金龙,陈涛,张谦,周硕文.基于复杂网络的数据资产研究发展分析及在建筑领域应用[J].建筑科学,2025,41(3):162-172.
4李涛,黄维祎.学科交叉视角下美国公共行政学热点研究——基于2014—2023年美国主流高校博士学位论文选题的数据[J].新文科教育研究,2025(2):121-140.
5王小龙,王暖臣,穆歌,阎晓培,李新津.基于数据增强的作战体系命名实体识别研究[J].舰船电子工程,2025,45(5):23-27.
6崔云裳,张群,许媛媛.我国医药卫生期刊撤稿全流程规范问题分析及应对策略[J].编辑学报,2025,37(3):290-295.
7袁赛男.从新质生产力看当前国际传播面临的风险及其应对[J].对外传播,2025(7):32-35.
8范立尧.系统性变革视域下广电媒体融合发展的路径创新与实践探索[J].视听界,2025(4):20-24. 被引量：1
9汪川.低利率政策:日本经验与启示[J].中国外汇,2025(12):18-21.
10李柯,王东煌,罗帆.民用无人机事故致因文本挖掘和社会网络分析[J].安全与环境学报,2025,25(7):2709-2716.

计算机应用

2025年第7期

浏览历史

内容加载中请稍等...

基于Transformer-GCN的源代码漏洞检测方法

参考文献1

二级参考文献5

共引文献27

相关作者

相关机构

相关主题

浏览历史