-
题名一种面向聚类的隐私保护数据发布方法
被引量:14
- 1
-
-
作者
崇志宏
倪巍伟
刘腾腾
张勇
-
机构
东南大学计算机科学与工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2010年第12期2083-2089,共7页
-
基金
国家自然科学基金项目(61003057
60973023)
江苏省自然科学基金项目(BK2006095)
-
文摘
隐私保护微数据发布技术可以在保护敏感数据隐私的同时,维持数据的可用性.但已有的多数发布方法都局限于类别属性数据集,发布后数据可用性以维持数据聚集查询可用性和频繁项集分析、分类挖掘可用性为主.针对数据挖掘领域另一重要任务——聚类分析,以及聚类分析中常处理的数值属性数据隐藏发布问题,提出隐藏算法NeSDO,算法对数据记录关于聚类可用性的特征进行分析,引入个性数据记录和共性数据记录的定义.采用合成数据替换扰动方法,为个性数据记录定义相应的正邻域记录集和负邻域记录集.对共性数据记录用其k最近邻域数据记录的均值替换;对个性数据记录分别采用其正邻域记录集或负邻域记录集内记录的均值进行置换,实现隐藏处理.理论分析和实验结果表明,算法NeSDO能够较好地保护敏感数值不泄露,同时能够有效保持发布后数据的聚类可用性.
-
关键词
隐私保护数据发布
聚类
k邻域
个性数据记录
共性数据记录
-
Keywords
privacy-preserving data publishing
clustering
k nearest neighborhood
individual data record
common data record
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-