期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
DLSF:基于双重语义过滤的文本对抗攻击方法
1
作者
熊熙
丁广政
+1 位作者
王娟
张帅
《计算机科学》
北大核心
2025年第10期423-432,共10页
在商业应用领域,基于深度学习的文本模型发挥着关键作用,但其亦被揭示易受对抗性样本的影响,例如通过在评论中夹杂混肴词汇以使模型做出错误响应。好的文本攻击算法不仅可以评估该类模型的鲁棒性,还能够检测现有防御方法的有效性,从而...
在商业应用领域,基于深度学习的文本模型发挥着关键作用,但其亦被揭示易受对抗性样本的影响,例如通过在评论中夹杂混肴词汇以使模型做出错误响应。好的文本攻击算法不仅可以评估该类模型的鲁棒性,还能够检测现有防御方法的有效性,从而降低对抗性样本带来的潜在危害。鉴于目前黑盒环境下生成对抗文本的方法普遍存在对抗文本质量不高且攻击效率低下的问题,提出了一种基于单词替换的双重语义过滤(Dual-level Semantic Filtering,DLSF)攻击算法。其综合了目前存在的候选词集合获取方法,并有效避免了集合中不相关单词的干扰,丰富了候选词的类别和数量。在迭代搜索过程中采用双重过滤的束搜索策略,减少模型访问次数的同时,也能保证获取到最优的对抗文本。在文本分类和自然语言推理任务上的实验结果显示,该方法在提升对抗文本质量的同时,显著提高了攻击效率。具体来说,在IMDB数据集上的攻击成功率高达99.7%,语义相似度达到0.975,而模型访问次数仅为TAMPERS的17%。此外,目标模型在经过对抗样本进行对抗增强训练后,在MR数据集上的攻击成功率从92.9%降至65.4%,进一步验证了DLSF有效提升了文本模型的鲁棒性。
展开更多
关键词
文本对抗攻击
黑盒攻击
束搜索
鲁棒性
文本模型
在线阅读
下载PDF
职称材料
TextSwindler:面向硬标签黑盒文本的对抗攻击算法
被引量:
1
2
作者
熊熙
刘钊荣
+1 位作者
张帅
余艳
《中文信息学报》
CSCD
北大核心
2024年第12期18-29,共12页
在自然语言处理领域,黑盒硬标签对抗攻击算法受到文本离散性、不可微性以及仅能获取模型决策结果的限制,难以同时兼顾攻击效果与攻击效率。该文提出一种基于单词替换的黑盒硬标签文本对抗攻击算法TextSwindler。首先全局随机初始化对抗...
在自然语言处理领域,黑盒硬标签对抗攻击算法受到文本离散性、不可微性以及仅能获取模型决策结果的限制,难以同时兼顾攻击效果与攻击效率。该文提出一种基于单词替换的黑盒硬标签文本对抗攻击算法TextSwindler。首先全局随机初始化对抗样本。接着在迭代优化阶段,分别采用基于词嵌入空间搜索邻近样本,以及基于回溯控制的扰动优化,以减少生成的对抗样本的扰动。最后基于简单交换规则搜索最优单词,提高生成的对抗样本的语义相似度。在8个数据集和3种深度学习模型上的实验结果表明,TextSwindler方法在保证生成样本质量的同时,可以降低43.6%的查询次数。
展开更多
关键词
对抗样本
黑盒
硬标签
在线阅读
下载PDF
职称材料
题名
DLSF:基于双重语义过滤的文本对抗攻击方法
1
作者
熊熙
丁广政
王娟
张帅
机构
成都信息工程大学网络空间
安全
学院
(
芯
谷
产业
学院
)
先进
密码
技术
与系统安全
四川省
重点
实验室
(
芯
谷
产业
学院
)
先进
微处理器
技术
国家工程研究中心(工业控制与
安全
分中心)
北京理工大学信息与电子
学院
出处
《计算机科学》
北大核心
2025年第10期423-432,共10页
基金
四川省科技计划项目(2024NSFSC2043,2024NSFSC1744,2024NSFSC1185)
教育部人文社会科学研究基金(22YJAZH120)。
文摘
在商业应用领域,基于深度学习的文本模型发挥着关键作用,但其亦被揭示易受对抗性样本的影响,例如通过在评论中夹杂混肴词汇以使模型做出错误响应。好的文本攻击算法不仅可以评估该类模型的鲁棒性,还能够检测现有防御方法的有效性,从而降低对抗性样本带来的潜在危害。鉴于目前黑盒环境下生成对抗文本的方法普遍存在对抗文本质量不高且攻击效率低下的问题,提出了一种基于单词替换的双重语义过滤(Dual-level Semantic Filtering,DLSF)攻击算法。其综合了目前存在的候选词集合获取方法,并有效避免了集合中不相关单词的干扰,丰富了候选词的类别和数量。在迭代搜索过程中采用双重过滤的束搜索策略,减少模型访问次数的同时,也能保证获取到最优的对抗文本。在文本分类和自然语言推理任务上的实验结果显示,该方法在提升对抗文本质量的同时,显著提高了攻击效率。具体来说,在IMDB数据集上的攻击成功率高达99.7%,语义相似度达到0.975,而模型访问次数仅为TAMPERS的17%。此外,目标模型在经过对抗样本进行对抗增强训练后,在MR数据集上的攻击成功率从92.9%降至65.4%,进一步验证了DLSF有效提升了文本模型的鲁棒性。
关键词
文本对抗攻击
黑盒攻击
束搜索
鲁棒性
文本模型
Keywords
Textual adversarial attack
Black-box attack
Beam search
Robustness
Text model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
TextSwindler:面向硬标签黑盒文本的对抗攻击算法
被引量:
1
2
作者
熊熙
刘钊荣
张帅
余艳
机构
成都信息工程大学网络空间
安全
学院
(
芯
谷
产业
学院
)
先进
密码
技术
与系统安全
四川省
重点
实验室
(
芯
谷
产业
学院
)
先进
微处理器
技术
国家工程研究中心(工业控制与
安全
分中心)
北京理工大学信息与电子
学院
出处
《中文信息学报》
CSCD
北大核心
2024年第12期18-29,共12页
基金
国家自然科学基金(81901389)
四川省科技计划项目(2023YFS0290,24NSFSC1744,24NSFSC1185)
教育部人文社会科学研究基金(22YJAZH120)。
文摘
在自然语言处理领域,黑盒硬标签对抗攻击算法受到文本离散性、不可微性以及仅能获取模型决策结果的限制,难以同时兼顾攻击效果与攻击效率。该文提出一种基于单词替换的黑盒硬标签文本对抗攻击算法TextSwindler。首先全局随机初始化对抗样本。接着在迭代优化阶段,分别采用基于词嵌入空间搜索邻近样本,以及基于回溯控制的扰动优化,以减少生成的对抗样本的扰动。最后基于简单交换规则搜索最优单词,提高生成的对抗样本的语义相似度。在8个数据集和3种深度学习模型上的实验结果表明,TextSwindler方法在保证生成样本质量的同时,可以降低43.6%的查询次数。
关键词
对抗样本
黑盒
硬标签
Keywords
adversarial sample
black box
hard label
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
DLSF:基于双重语义过滤的文本对抗攻击方法
熊熙
丁广政
王娟
张帅
《计算机科学》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
TextSwindler:面向硬标签黑盒文本的对抗攻击算法
熊熙
刘钊荣
张帅
余艳
《中文信息学报》
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部