-
题名基于可攻击空间假设的陷阱式集成对抗防御网络
被引量:1
- 1
-
-
作者
孙家泽
温苏雷
郑炜
陈翔
-
机构
西安邮电大学计算机学院
陕西省网络数据分析与智能处理重点实验室(西安邮电大学)
西安市大数据与智能计算重点实验室(西安邮电大学)
西北工业大学软件学院
南通大学信息科学技术学院
-
出处
《软件学报》
EI
CSCD
北大核心
2024年第4期1861-1884,共24页
-
基金
国家自然科学基金(61876138,62272387,62141208)
国家重点研发计划(2020YFC0833105Z1)
+2 种基金
西安市重点产业链人工智能核心技术攻关项目(2022JH-RGZN-0028)
陕西省重点研发计划(2023-YBGY-030)
西安邮电大学创新基金(CXJJZL2021007)。
-
文摘
如今,深度神经网络在各个领域取得了广泛的应用.然而研究表明,深度神经网络容易受到对抗样本的攻击,严重威胁着深度神经网络的应用和发展.现有的对抗防御方法大多需要以牺牲部分原始分类精度为代价,且强依赖于已有生成的对抗样本所提供的信息,无法兼顾防御的效力与效率.因此基于流形学习,从特征空间的角度提出可攻击空间对抗样本成因假设,并据此提出一种陷阱式集成对抗防御网络Trap-Net. Trap-Net在原始模型的基础上向训练数据添加陷阱类数据,使用陷阱式平滑损失函数建立目标数据类别与陷阱数据类别间的诱导关系以生成陷阱式网络.针对原始分类精度损失问题,利用集成学习的方式集成多个陷阱式网络以在不损失原始分类精度的同时,扩大陷阱类标签于特征空间所定义的靶标可攻击空间.最终, Trap-Net通过探测输入数据是否命中靶标可攻击空间以判断数据是否为对抗样本.基于MNIST、K-MNIST、F-MNIST、CIFAR-10和CIFAR-100数据集的实验表明, Trap-Net可在不损失干净样本分类精确度的同时具有很强的对抗样本防御泛化性,且实验结果验证可攻击空间对抗成因假设.在低扰动的白盒攻击场景中, Trap-Net对对抗样本的探测率高达85%以上.在高扰动的白盒攻击和黑盒攻击场景中, Trap-Net对对抗样本的探测率几乎高达100%.与其他探测式对抗防御方法相比, Trap-Net对白盒和黑盒对抗攻击皆有很强的防御效力.为对抗环境下深度神经网络提供一种高效的鲁棒性优化方法.
-
关键词
深度神经网络
对抗样本
集成学习
对抗防御
鲁棒性优化
-
Keywords
deep neural network(DNN)
adversarial example
ensemble learning
adversarial defense
robustness optimization
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-