期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向结构化数据集的敏感属性识别与分级算法 被引量:13
1
作者 何文竹 彭长根 +3 位作者 王毛妮 丁兴 樊玫玫 丁红发 《计算机应用研究》 CSCD 北大核心 2020年第10期3077-3082,共6页
如何对生产环境中经代码混淆的结构化数据集的敏感属性(字段)进行自动化识别、分类分级,已成为对结构化数据隐私保护的瓶颈。提出一种面向结构化数据集的敏感属性自动化识别与分级算法,利用信息熵定义了属性敏感度,通过对敏感度聚类和... 如何对生产环境中经代码混淆的结构化数据集的敏感属性(字段)进行自动化识别、分类分级,已成为对结构化数据隐私保护的瓶颈。提出一种面向结构化数据集的敏感属性自动化识别与分级算法,利用信息熵定义了属性敏感度,通过对敏感度聚类和属性间关联规则挖掘,将任意结构化数据集的敏感属性进行识别和敏感度量化;通过对敏感属性簇中属性间的互信息相关性和关联规则分析,对敏感属性进行分组并量化其平均敏感度,实现敏感属性的分类分级。实验表明,该算法可识别、分类、分级任意结构化数据集的敏感属性,效率和精确率更高;对比分析表明,该算法可同时实现敏感属性的识别与分级,无须预知属性特征、敏感特征字典,兼顾了属性间的相关性和关联关系。 展开更多
关键词 隐私保护 敏感属性识别与分级 最大熵 关联规则 互信息
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部