-
题名融合全局图拓扑与多尺度掩码卷积的漏洞检测方法
- 1
-
-
作者
黄安博
曲海成
姜庆玲
-
机构
辽宁工程技术大学软件学院
铁岭师范高等专科学校理学院
-
出处
《计算机科学与探索》
北大核心
2025年第11期3072-3082,共11页
-
基金
国家自然科学基金面上项目(42271409)
辽宁省教育厅基本科研项目(JYTMS20230804)。
-
文摘
基于序列的深度学习方法在建模源代码的结构特征方面存在不足,而图神经网络(GNN)虽然可以通过聚合邻居节点信息丰富当前节点表征,但无法有效获取图的全局特征信息,且难以捕获图节点间长距离依赖。为克服上述问题,提出了一种融合全局图拓扑与多尺度掩码卷积的门控漏洞检测方法(GTMC-VD)。在该方法中,利用开源工具(Joern)将源代码转换为代码属性图(CPG),采用词嵌入模型(Word2Vec)对图中节点进行嵌入以获得图中节点的初始表示,设计并实现了图全局拓扑编码器。该编码器利用图卷积网络(GCN)的输出作为节点重要性评分,利用该评分对图结构进行简化,并对邻接矩阵和节点特征进行更新,通过层次化的策略实现逐层优化并采用不同池化层获取多尺度的拓扑信息,最终聚合以获取图的全局特征。之后采用两个不同尺度的卷积核捕捉节点之间的依赖关系,同时针对变长图数据引入掩码机制,避免因填充节点带来的噪声干扰,实现了多尺度掩码卷积模块。最终,引入门控机制,自适应融合两个模块的输出结果,并得到模型最终检测结果。在两个公开数据集上的大量实验表明,所提方法有效解决了上述两个问题,并在准确率、精确率、召回率和F1分数指标上相比于基准模型(Devign)分别提高了6.69、4.43、13.63和8.17个百分点。总之,GTMC-VD有效获取了图的全局特征,且缓解了基于GCN模型无法捕捉长距离依赖的问题,为漏洞检测任务提供了一种更为鲁棒且高效的解决方案。
-
关键词
漏洞检测
图神经网络
图拓扑
多尺度卷积
掩码机制
-
Keywords
vulnerability detection
graph neural networks
graph topology
multi-scale convolution
mask mechanism
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-