-
题名基于生成式对抗网络的通用性对抗扰动生成方法
被引量:3
- 1
-
-
作者
刘恒
吴德鑫
徐剑
-
机构
东北大学软件学院
-
出处
《信息网络安全》
CSCD
北大核心
2020年第5期57-64,共8页
-
基金
国家自然科学基金[61872069]
中央高校基本科研业务费[N2017012]。
-
文摘
深度神经网络在图像分类应用中具有很高的准确率,然而,当在原始图像中添加微小的对抗扰动后,深度神经网络的分类准确率会显著下降。研究表明,对于一个分类器和数据集存在一种通用性对抗扰动,其可对大部分原始图像产生攻击效果。文章设计了一种通过生成式对抗网络来制作通用性对抗扰动的方法。通过生成式对抗网络的训练,生成器可制作出通用性对抗扰动,将该扰动添加到原始图像中制作对抗样本,从而达到攻击的目的。文章在CIFAR-10数据集上进行了无目标攻击、目标攻击和迁移性攻击实验。实验表明,生成式对抗网络生成的通用性对抗扰动可在较低范数约束下达到89%的攻击成功率,且利用训练后的生成器可在短时间内制作出大量的对抗样本,利于深度神经网络的鲁棒性研究。
-
关键词
深度神经网络
通用性对抗扰动
生成式对抗网络
-
Keywords
deep neural network
universal adversarial perturbation
generative adversarial network
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-