-
题名基于本地差分隐私的分布式图统计采集算法
被引量:2
- 1
-
-
作者
傅培旺
丁红发
刘海
蒋合领
唐明丽
于莹莹
-
机构
贵州省高等学校区块链与金融科技重点实验室(贵州财经大学)
贵州财经大学信息学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第7期1643-1669,共27页
-
基金
国家自然科学基金项目(62002080,62062017)
贵州省教育厅自然科学研究项目(黔教技[2023]065,黔教技[2023]014)。
-
文摘
社交网络、社交物联网等应用场景产生的海量分布式图结构数据,被应用服务商采集并以此提供各类以数据为驱动的服务,或将引发严重的隐私风险.在此背景下,如何针对具备强关联性的分布式图结构数据实现安全高效的采集,成为大规模图结构数据应用服务的瓶颈.面向分布式图结构数据隐私保护的节点或边本地差分隐私模型无法有效处理隐私保护效果和数据有效性之间的冲突关系.针对该问题,提出基于本地差分隐私的分布式图统计采集算法,同时实现度分布、三角计数序列和聚类系数3个不同统计指标采集,并适应不同有效性和隐私保护的需求.首先,采用分组机制及对称一元编码机制,设计具备高强度隐私保护的基于Node-LDP的度分布采集算法;其次,基于所提度分布采集算法获取阈值,引入剪枝算法缓解随机加噪的噪声边过多问题,并分别提出基于Node-LDP和Edge-LDP的三角计数序列采集算法;再次,在前述三角计数序列采集算法基础上引入拉普拉斯机制,从而分别提出基于Node-LDP和Edge-LDP的聚类系数采集算法,进而实现不同保护强度及数据效用需求下的分布式图结构多指标采集;最后,实验和对比结果表明,所提算法能同时提高隐私保护强度和数据效用,比现有单一或多统计指标采集算法更具优势.
-
关键词
图结构数据
本地差分隐私
隐私保护技术
数据效用
图统计
数据采集
-
Keywords
graph-structure data
local differential privacy
privacy-preserving techniques
data utility
graph statistics
data collection
-
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]
-