-
题名基于个性化差分隐私的联邦学习方法
被引量:1
- 1
-
-
作者
徐超
张淑芬
彭璐璐
张帅华
-
机构
华北理工大学理学院
河北省数据科学与应用重点实验室
唐山市大数据安全与智能计算重点实验室
唐山市数据科学重点实验室
-
出处
《华北理工大学学报(自然科学版)》
CAS
2024年第2期133-144,共12页
-
基金
国家自然科学基金项目(U20A20179)。
-
文摘
联邦学习的模型参数可能导致用户隐私信息泄露,为解决此问题,将联邦学习和差分隐私进行结合的方法被广泛使用,但目前大多数方法只关注统一的隐私预算分配,忽略了由于用户数据分布不平衡带来的不同隐私预算需求。针对上述问题,提出一种基于数据分布的个性化差分隐私的联邦学习方法,根据用户间数据分布的差异,提出一种基于信息熵的隐私预算分配方案,依据信息熵为用户分配不同的隐私预算,信息熵越大的用户分配的隐私预算越高,从而量化了用户的隐私需求,实现对用户隐私的个性化保护。实验结果表明,在数据分布不平衡的场景下,相比基于统一的隐私预算分配方法,基于信息熵的隐私预算分配方法的模型准确率在不同的隐私预算下均有提高。
-
关键词
联邦学习
差分隐私
信息熵
数据分布
个性化差分隐私
-
Keywords
federated learning
differentialprivacy
information entropy
data distribution
personalized differential privacy
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名基于改进CFSFDP算法的聚类联邦学习
- 2
-
-
作者
彭璐璐
张淑芬
陈海田
徐超
-
机构
华北理工大学理学院
河北省数据科学与应用重点实验室
唐山市大数据安全与智能计算重点实验室
-
出处
《华北理工大学学报(自然科学版)》
CAS
2024年第3期112-121,共10页
-
基金
国家自然科学基金项目(U20A20179):基于Sketch的网络行为测量关键技术与系统。
-
文摘
联邦学习是一种基于多个用户协作训练全局模型的分布式训练范式,旨在解决由数据孤岛造成的数据碎片化问题。然而,在真实环境中,参与联邦学习的各个节点的数据分布通常是不平衡的,这会导致联邦学习模型的精确率下降。针对上述问题,提出了基于改进CFSFDP算法的聚类联邦学习方法——FL_CDP。此方法对CFSFDP算法中的局部密度定义进行了优化,并通过二阶差分实现自动选择聚类中心。通过评估客户端模型的推理相似度,对客户端节点进行了聚类,进而缓解了联邦学习中因节点数据分布不均所带来的模型准确度下降问题。在MNIST和FashionMNIST数据集上的实验结果证明,相较于传统的联邦学习算法,基于改进CFSFDP算法的聚类联邦学习算法在模型准确率方面有着显著提升。
-
关键词
联邦学习
隐私保护
不平衡数据
二阶差分
-
Keywords
federated learning
privacy protection
imbalanced data
second-order difference
-
分类号
TQ301
[化学工程]
-
-
题名基于目标扰动的AdaBoost算法
被引量:3
- 3
-
-
作者
张淑芬
董燕灵
徐精诚
王豪石
-
机构
华北理工大学理学院
河北省数据科学与应用重点实验室
唐山市大数据安全与智能计算重点实验室
唐山市数据科学重点实验室
-
出处
《通信学报》
EI
CSCD
北大核心
2023年第2期198-209,共12页
-
基金
国家自然科学基金资助项目(No.U20A20179)。
-
文摘
针对AdaBoost算法的多轮迭过程会放大为实现差分隐私保护而添加的噪声,从而导致模型收敛缓慢、数据可用性大幅降低的问题,提出了一种基于目标扰动的AdaBoost算法——DPAda,采用目标扰动的方式对样本权值进行加噪,精确计算其敏感度,并赋予其动态的隐私预算。为了解决噪声叠加过多的问题,提出基于摆动数列、随机响应和改进的随机响应3种噪声注入算法。实验结果表明,与DPAda_Random算法和DPAda_Swing算法相比,DPAda_Improved算法能实现数据的隐私保护,拥有更高的分类准确率,优于其他差分隐私AdaBoost算法,并能解决连续加噪带来的噪声过大的问题。
-
关键词
差分隐私
摆动数列
随机响应
隐私预算分配
ADABOOST算法
-
Keywords
differential privacy
swing sequence
random response
privacy budget allocation
AdaBoost algorithm
-
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]
-