-
题名基于特征约束和自适应损失平衡的机器遗忘方法
- 1
-
-
作者
殷昱煜
吴广强
李尤慧子
王鑫雨
高洪皓
-
机构
杭州电子科技大学计算机学院
复杂系统建模与仿真教育部重点实验室(杭州电子科技大学)
上海大学计算机工程与科学学院
嘉泉大学计算机工程系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第10期2649-2661,共13页
-
基金
国家自然科学基金项目(62272140)
浙江省自然科学基金项目(LY22F020018)
浙江省“尖兵”“领雁”研发公关计划(2024C01166)。
-
文摘
随着数字化进程的加速推进,数据要素已成为现代社会运转的核心驱动力.由于深度学习模型训练需要大量数据作为输入,其数据隐私保护问题也愈发重要.机器遗忘技术使模型能够删除特定数据的影响,同时保持对剩余数据的泛化性能,为深度学习模型中的数据要素安全保护提供了有效的解决方案.现有的机器遗忘方法主要分为精确遗忘和近似遗忘2类,但前者需要干预模型原始训练流程,后者则在遗忘效果和模型泛化能力之间难以找到平衡点.为此,提出了一种基于特征约束和自适应损失平衡的近似遗忘框架.首先,对于“遗忘”过程,使用同样未经过遗忘样本训练的随机模型作为教师来引导遗忘模型的特征输出,实现模型对数据要素在特征层面的遗忘.然后,采用少量剩余数据进行微调训练,来“恢复”模型对于其他数据的泛化性能.将上述机器遗忘框架视为一个多任务优化问题,在“遗忘”和“恢复”2个任务中引入自适应损失平衡,实现任务的稳步训练.以卷积神经网络模型为例,在3个公开数据集上对比了UNSIR等多种基线方法,实验结果表明,该方法构建的遗忘模型不仅保障了机器遗忘效果,在剩余数据的准确率、时间开销、预测结果分布等指标上优于同类方法,更加有效地保护了模型的泛化性能.
-
关键词
数据要素安全
机器遗忘
特征约束
多任务优化
自适应损失平衡
-
Keywords
data element security
machine unlearning
feature constraints
multi-task optimization
adaptive loss balance
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-