期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于局部梯度平滑的解释鲁棒性对抗训练方法 被引量:1
1
作者 陈自刚 潘鼎 +3 位作者 冷涛 朱海华 陈龙 周由胜 《计算机科学》 北大核心 2025年第2期374-379,共6页
深度学习可解释性在发展的同时,也面临着安全性方面的巨大挑战。模型对输入数据的解释结果存在被恶意操纵攻击的风险,此攻击严重限制了可解释性技术的应用场景并阻碍了人类对模型的探索与认知。针对此问题,提出一种使用模型梯度作为相... 深度学习可解释性在发展的同时,也面临着安全性方面的巨大挑战。模型对输入数据的解释结果存在被恶意操纵攻击的风险,此攻击严重限制了可解释性技术的应用场景并阻碍了人类对模型的探索与认知。针对此问题,提出一种使用模型梯度作为相似性约束的解释鲁棒性对抗训练方法。首先,沿解释方向采样生成对抗训练数据;其次,结合训练过程中样本的梯度信息来计算采样数据解释之间的多种相似性指标,用以对模型正则化,平滑模型的曲率;最后,为验证所提出的解释鲁棒性对抗训练方法的有效性,在多个数据集和解释方法上进行验证,实验结果表明,所提方法在防御对抗解释样本上具有显著效果。 展开更多
关键词 深度学习 可解释性 对抗攻击 对抗训练 对抗样本
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部