-
题名面向聚类的数据隐藏发布研究
被引量:16
- 1
-
-
作者
倪巍伟
陈耿
崇志宏
吴英杰
-
机构
东南大学计算机科学与工程学院
南京审计学院信息科学学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2012年第5期1095-1104,共10页
-
基金
国家自然科学基金项目(61003057
60973023)
东南大学网络与信息集成教育部重点实验室开放基金项目(k93-9-2010-21)
-
文摘
数据隐藏发布在保护数据隐私和维持数据可用性间寻求一种折中,近年来得到了研究者的持续关注.数据隐藏发布的起因和目标都源于数据的使用价值,聚类作为实现数据深层使用价值的一个重要步骤,在数据挖掘领域得到了广泛的研究.聚类对数据个体特征的依赖与隐藏操作弱化个体特征的主导思想间的矛盾,使得面向聚类的数据隐藏发布成为一个难点.对面向聚类的隐私保护数据发布领域已有研究成果进行了总结,从保存聚类特征粒度的角度,分析保存聚类特征粒度与聚类可用性、隐私保护安全性间的关系;从维持数据聚类可用性效果角度对匿名、随机化、数据交换、人工合成数据替换等主要隐藏方法的原理、特点进行了分析.在对已有技术方法深入对比分析的基础上,指出了面向聚类的数据隐藏发布领域待解决的一些难点问题和未来发展方向.
-
关键词
隐私保护
聚类挖掘
数据隐藏
聚类可用性
数据发布
-
Keywords
privacy-preservation
clustering
data obfuscation
clustering utility
data publication
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向差分隐私保护的自适应谱聚类优化新算法
被引量:1
- 2
-
-
作者
金亦乔
章永祺
王博
王鑫轲
李昭祥
-
机构
上海师范大学数理学院
上海师范大学信息与机电工程学院
-
出处
《计算机应用与软件》
北大核心
2023年第9期261-266,共6页
-
基金
国家自然科学基金项目(11871043,12271366,12171322)
上海市科技计划项目(20JC1414200)
上海市自然科学基金项目(21ZR1447200,22ZR1445500)。
-
文摘
针对传统差分隐私保护的谱聚类算法存在聚类效果不理想的不足,提出一种面向差分隐私保护的自适应谱聚类优化新算法。采用互邻高斯核函数得到稀疏相似度矩阵,分析高维数据集的数据特征与聚类簇数的关系解决降维幅度和聚类簇数的不确定性;引入中间信息向量和中间性的概念来克服初始簇中心选取的盲目性;根据多维高斯分布离群点检验后的结果采用插补法解决离群点问题。仿真实验结果表明,该算法能够有效克服传统方法的不足,且在同一数据集相同隐私保护参数下,可以在保证数据隐私安全性的同时改善聚类效率并显著提高聚类可用性。
-
关键词
隐私保护
差分隐私
谱聚类
聚类可用性
-
Keywords
Privacy preserving
Differential privacy
Spectral clustering
Clustering availability
-
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]
-
-
题名聚类分析算法在不确定性决策中的应用
被引量:12
- 3
-
-
作者
黄海燕
刘晓明
孙华勇
杨志才
-
机构
陆军工程大学
蚌埠汽车士官学校
酒泉卫星发射中心
-
出处
《计算机科学》
CSCD
北大核心
2019年第B06期593-597,共5页
-
基金
国家自然科学基金项目(61174198)资助
-
文摘
为了更快地获取有用的决策信息,结合当下人工智能技术的发展新趋势,基于K-MEANS等聚类分析算法尝试性地对决策信息进行分析聚类。提出决策信息概念模型,以更好地表述决策信息,方便信息分析处理;结合具体数据实例,将聚类算法应用到不确定性决策中,实现对决策信息的分类推荐,方便快速挖掘关键信息,减少决策时间。最后,研究基于聚类分析算法的评价决策方法,提出聚类信息可用性指标,为度量决策信息中的聚类效果提供一种度量标准。
-
关键词
决策信息
K-MEANS
聚类分析算法
聚类信息可用性指标
-
Keywords
Decision information
K-means
Clustering analysis algorithm
Clustering information availability index
-
分类号
C934
[经济管理—管理学]
-