-
题名面向中文的多层次扰动定位文本对抗样本生成方法
- 1
-
-
作者
侯彦
车蕾
李慧
-
机构
北京信息科技大学信息管理学院
中关村智用人工智能研究院
-
出处
《计算机工程》
北大核心
2025年第7期232-243,共12页
-
基金
非遗数字化与多源信息融合福建省高校工程研究中心2023年度开放基金项目(G3-KF2301)。
-
文摘
为提升中文领域黑盒攻击下生成对抗样本过程中扰动定位精度,并解决现有方法在词重要度评估中忽视上下文关联度和语义密度的问题,提出一种具有多层次扰动定位能力的中文文本对抗样本生成方法(MDLM)。首先,通过整合多源异构深度学习模型,构建一套融合不同特征提取能力的多层次判定模型;其次,在词重要度评估上新增3种评估函数,从多个维度评估词的重要度;最后,通过多层次判定模型与评估函数共同作用实现对原始文本扰动点的精准定位。在文本对抗样本生成策略上,MDLM融合了繁体字、拼音、多音词、同音词等多种文本替换策略,旨在确保攻击成功率的同时,提升生成对抗样本的多样性。实验结果显示,MDLM在多个数据集上针对多个目标模型进行攻击时扰动效果显著,最高攻击扰动率达到了43.5%,进一步增强了对抗样本的攻击能力。同时,针对多层次扰动定位能力的消融实验结果显示,将评估函数与判定模型进行多层次组合可以显著提高生成对抗样本的攻击效果。
-
关键词
黑盒攻击
扰动定位
判定模型
词重要度评估
对抗样本生成
-
Keywords
black-box attack
perturbation localization
decision model
word importance assessment
adversarial sample generation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-