-
题名面向中文的多层次扰动定位文本对抗样本生成方法
- 1
-
-
作者
侯彦
车蕾
李慧
-
机构
北京信息科技大学信息管理学院
中关村智用人工智能研究院
-
出处
《计算机工程》
北大核心
2025年第7期232-243,共12页
-
基金
非遗数字化与多源信息融合福建省高校工程研究中心2023年度开放基金项目(G3-KF2301)。
-
文摘
为提升中文领域黑盒攻击下生成对抗样本过程中扰动定位精度,并解决现有方法在词重要度评估中忽视上下文关联度和语义密度的问题,提出一种具有多层次扰动定位能力的中文文本对抗样本生成方法(MDLM)。首先,通过整合多源异构深度学习模型,构建一套融合不同特征提取能力的多层次判定模型;其次,在词重要度评估上新增3种评估函数,从多个维度评估词的重要度;最后,通过多层次判定模型与评估函数共同作用实现对原始文本扰动点的精准定位。在文本对抗样本生成策略上,MDLM融合了繁体字、拼音、多音词、同音词等多种文本替换策略,旨在确保攻击成功率的同时,提升生成对抗样本的多样性。实验结果显示,MDLM在多个数据集上针对多个目标模型进行攻击时扰动效果显著,最高攻击扰动率达到了43.5%,进一步增强了对抗样本的攻击能力。同时,针对多层次扰动定位能力的消融实验结果显示,将评估函数与判定模型进行多层次组合可以显著提高生成对抗样本的攻击效果。
-
关键词
黑盒攻击
扰动定位
判定模型
词重要度评估
对抗样本生成
-
Keywords
black-box attack
perturbation localization
decision model
word importance assessment
adversarial sample generation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名个人信息去识别化的类型解构与治理方案
被引量:12
- 2
-
-
作者
蒋洁
兰舟
祁怡然
-
机构
南京信息工程大学法政学院
中关村智用人工智能研究院
-
出处
《图书与情报》
CSSCI
北大核心
2021年第3期79-86,共8页
-
基金
江苏省社会科学基金重点项目“数字技术支撑的新流行病风险管控机制研究”(项目编号:20SHA001)
江苏省高校哲学社会科学重点项目“电子诉讼中数据鉴识的侵权风险及对策研究”(项目编号:2016ZDIXM021)
江苏省“333”人才工程资助研究成果之一。
-
文摘
文章厘清长期混用的个人信息去识别化、匿名化、假名化、去标识化的内涵外延,结合域内外建规立制的发展脉络,搭建动态平衡个体隐私安全与数据充分利用的层级治理方案。充分论证迭代算法有可能重新识别严重不完整的零散数据集,客观上难以达致无法识别且不能复原的匿名状态,亟待有条件免除数据处理者在符合去标识化标准下的同意获取义务。通过基于风险管控搭建的个人信息规制模式、隐私保障方案和以数据利用为核心的权属机制,安全变现数据价值,助力后疫情时代数字经济有序发展。
-
关键词
个人信息
去识别化
匿名化
去标识化
数据治理
-
Keywords
personal information
de-recognization
anonymization
de-identification
data governance
-
分类号
G202
[文化科学—传播学]
-