-
题名特征感知变换自编码器防御模型偏斜式投毒攻击
- 1
-
-
作者
罗文华
杨立圣
张鹏
-
机构
中国刑事警察学院公安信息技术与情报学院
-
出处
《小型微型计算机系统》
北大核心
2025年第8期2033-2040,共8页
-
基金
国家重点研发计划项目(2021YFC3301801)资助。
-
文摘
流量分类模型更新易受数据投毒攻击,现有模型偏斜式投毒攻击防御方法聚焦特征固定的图像分类任务,面对特征复杂的流量分类问题适用性有限.针对上述问题,设计少特征攻击的投影梯度下降法,生成对抗样本进行偏斜式投毒攻击;提出特征感知变换自编码器的模型偏斜式投毒防御方法,在自编码器训练阶段引入特征感知噪声扰动,以限制扰动范围并增强自编码器对抗样本噪声过滤能力.通过构建流量数据变换自编码器重构并消除对抗样本的对抗性,利用变换后的样本数据与原始数据进行预测差异性判定,实现对抗样本判别过滤.实验结果表明,该方法能够有效识别新增训练样本中的对抗样本,降低偏斜式数据投毒攻击对流量分类模型的负面影响.
-
关键词
数据投毒攻击
流量分类模型
对抗样本
自编码器
-
Keywords
data poisoning attack
traffic classification model
adversarial sample
autoencoder
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名基于样本分布特征的数据投毒防御
被引量:3
- 2
-
-
作者
杨立圣
罗文华
-
机构
中国刑事警察学院公安信息技术与情报学院
-
出处
《计算机应用研究》
CSCD
北大核心
2023年第9期2845-2850,共6页
-
基金
国家重点研发计划资助项目(2018YFC0830600)
中国刑事警察学院研究生创新能力提升项目(2022YCZD05)。
-
文摘
流量分类模型在更新过程中易受数据污染的干扰而降低模型性能,现有基于数据清洗的防御方法需依赖专家经验和人工筛选,且无法有效应对利用未知分布样本构造的投毒攻击。针对上述问题,受分布外检测和判别主动学习的启发,设计一种基于样本分布特征的数据投毒防御方法,通过二分类判别器筛选每轮新增样本中的已知及未知分布样本。对于新增的已知分布样本,通过模型预测与标注结果一致率评估新增样本的数据质量,决定是否进行模型更新;对于新增的未知分布样本,则利用基于标注正确率的少样本抽检评估样本可用性。实验结果表明,该方法在抵御数据投毒攻击的同时可以保证模型准确率,并有效识别利用未知分布样本构造的数据投毒攻击。
-
关键词
AI安全
流量分类模型
数据投毒攻击
样本分布特征
-
Keywords
AI security
traffic classification model
data poisoning attack
sample distribution characteristics
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-