-
题名基于二进制相似性分析的重现型漏洞检测方法综述
- 1
-
-
作者
王泰彦
李彦霖
于璐
潘祖烈
-
机构
国防科技大学电子对抗学院
安徽省网络空间安全态势感知与评估重点实验室
-
出处
《信息对抗技术》
2025年第2期18-43,共26页
-
基金
国家重点研发计划项目(2021YFB3100500)。
-
文摘
在软件研发中,复用开源组件与代码模板已经成为主流,这大大降低了开发成本,但若对含有漏洞的代码进行复用,则会导致软件系统中出现重现型漏洞。随着代码复用愈发广泛,其带来的安全问题受到更多的关注,而现有商业软件如IoT固件程序等大多不公开源码与文档,因此需要在二进制层面进行安全研究与检测。近年来,研究人员将二进制相似性分析技术应用至漏洞检测领域,通过识别软件系统中是否存在已知漏洞的二进制代码,实现了对重现型漏洞的高效检测。为此,围绕重现型漏洞检测技术,首先梳理了现有基于二进制相似性分析的方法,并对相关技术进行系统分类与介绍,主要包括基于二进制本身信息进行分析的研究,以及结合相关源码/补丁辅助分析的研究;其次,对现有研究的实验评估数据集、可用工具与基线方法等进行分析总结;最后,在已有研究的基础上,对现存关键技术问题与未来研究方向进行总结与展望。
-
关键词
代码复用
二进制相似性分析
重现型漏洞
漏洞检测
-
Keywords
code reuse
binary similarity analysis
recurring vulnerability
vulnerability detection
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于角度边界的二进制函数对比学习模型
- 2
-
-
作者
孙瑞锦
郭世泽
黎维
詹达之
王军
潘志松
-
机构
陆军工程大学指挥控制工程学院
国家计算机网络与信息安全管理中心
陆军装甲兵学院
[
-
出处
《陆军工程大学学报》
2024年第4期42-50,共9页
-
基金
国家自然科学基金(62076251)。
-
文摘
现有代码相似性检测模型主要关注编码器的构建,对深度学习的损失函数研究较少。针对二进制函数嵌入向量评估被忽略的问题,提出了一种基于角度边界的二进制代码对比学习模型(angular marginbased binary code contrastive learning framework,AngCLF)。通过优化对比学习的目标函数,提高了模型的准确性并加快了收敛速度。分析了模型产生效果的原因,并引入多个评估二进制代码向量空间的指标。通过实验验证了AngCLF的准确性,发现其在准确性上超越了包括jTrans模型在内的6个模型,并且收敛速度更快,对齐度和均匀性等指标也有明显优势。
-
关键词
对比学习
角度边界
嵌入学习
二进制代码相似性检测
-
Keywords
contrastive learning
angular margin
embedding learning
binary code similarity detection(bcsd)
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名基于神经机器翻译的二进制函数相似性检测方法
被引量:5
- 3
-
-
作者
陈斌
刘胜利
胡安祥
杨启超
-
机构
数字工程与先进计算国家重点实验室
-
出处
《信息工程大学学报》
2021年第6期675-682,共8页
-
基金
国家重点研发计划资助项目(2019QY1300)
科技委基础加强资助项目(2019-JCJQ-ZD-113)。
-
文摘
二进制函数相似性检测是检测软件中已知安全漏洞的一种重要手段,随着物联网设备急剧增长,越来越多的软件被编译到不同指令集架构的平台上运行,因此基于二进制的跨平台相似性检测方法更具通用性。针对目前基于深度神经网络的跨平台相似性检测方法只能在基本块粒度进行相似性比对的不足,基于神经机器翻译的思想,提出一个通用的跨指令集架构的二进制函数相似性检测框架BFS,在函数粒度上通过无监督学习的方法自动捕获二进制函数的语义信息,生成二进制函数的嵌入向量。实验结果表明,BFS的P@10评价指标在88.0%以上,相较于现有方法提升了10.6百分点,并且能够有效检测出路由器固件中的已知真实漏洞。充分说明BFS检测框架在对二进制函数进行嵌入时,不仅能够保留较多原始语义信息,同时能够消除不同指令集架构以及编译优化选项的影响。
-
关键词
二进制代码
相似性检测
跨平台
漏洞搜索
神经机器翻译
-
Keywords
binary code
similarity detection
cross-platform
bug search
neural machine translation
-
分类号
TP315
[自动化与计算机技术—计算机软件与理论]
-