-
题名基于FP-Tree的反向频繁项集挖掘
被引量:21
- 1
-
-
作者
郭宇红
童云海
唐世渭
杨冬青
-
机构
北京大学计算机科学技术系
北京大学视觉与听觉信息处理国家重点实验室
-
出处
《软件学报》
EI
CSCD
北大核心
2008年第2期338-350,共13页
-
基金
Supported by the National Natural Science Foundation of China under Grant No.60403041 (国家自然科学基金)
-
文摘
在拓展现有反向频繁挖掘问题定义,探索反向频繁项集的3个具体应用后,提出了一种基于FP-tree的反向频繁项集挖掘方法.该方法首先采用分治思想,将目标约束划分为若干子约束,每步求解一个子线性约束问题,经过若干步迭代后找到一个满足整个给定约束的目标FP-tree;然后根据目标FP-tree生成一个仅含频繁项的临时事务数据库TempD;最后通过向TempD中撒入非频繁项得到目标数据集.理论分析和实验表明该方法是正确的、高效的,且与现有方法仅能输出1个目标数据集相比,该方法能够输出较多的目标数据集.
-
关键词
反向挖掘
FP树
频繁项集
隐私保护
知识隐藏
-
Keywords
inverse mining
FP-tree
frequent itemset
privacy preserving
knowledge hiding
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名近似反频繁集挖掘可计算复杂度分析与研究
- 2
-
-
作者
吕品
董武世
-
机构
武汉工程大学计算机科学与工程学院
湖北师范学院计算机系
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第24期179-180,186,共3页
-
基金
:湖北省自然科学基金资助项目(编号:2004ADA023)
-
文摘
数据挖掘作为应用于数据分析的工具,往往会从大型数据库中毫无保留地揭露某些重要信息,这些重要信息由于一定的原因不能向外界透露。所以可以通过构造具有与原始的频繁集一样的特征的虚拟数据集来替代频繁集挖掘结果。文章给出了一种近似的反频繁集挖掘方法,分析了它的可计算复杂度,得出了近似反频繁集挖掘是一个NP完全问题,提出了近似的反频繁集挖掘的下一步研究重点。
-
关键词
隐私保持
反频繁集挖掘
近似性
-
Keywords
preserve privacy,inverse frequent set mining,apporximation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名隐私保护的一站多表跨多表频繁项集挖掘
被引量:1
- 3
-
-
作者
林瑞
钟诚
华蓓
-
机构
广西大学计算机与电子信息学院
-
出处
《计算机应用》
CSCD
北大核心
2013年第12期3437-3440,共4页
-
基金
广西自然科学基金资助项目(2011GXNSFA018152)
-
文摘
从多方合作挖掘分布存储在不同计算站点上多个数据库表而不泄露各方原始数据信息的目的出发,对于每个站点拥有多个数据表的分布式计算环境,基于三方安全协议,运用生成随机数扰乱方法,采取各站点并行挖掘频繁项集,将站点间各表数据公共连接属性作等值连接,以安全协议计算全局站间跨表频繁项集支持数的策略,提出了一站多表的3站点跨多表频繁项集挖掘隐私保护算法。实验结果表明,该算法在高效地联合挖掘出跨多表频繁项集的同时保护了各站点的敏感信息。
-
关键词
跨表挖掘
频繁项集
并行挖掘
隐私保护
多方安全协议
-
Keywords
cross multi-table mining
frequent item set
parallel mining
privacy preserving
secure multi-party protocol
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-