期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于目标扰动的本地化差分隐私矩阵分解推荐算法 被引量:2
1
作者 王永 罗陈红 +1 位作者 邓江洲 高明星 《计算机学报》 北大核心 2025年第2期451-462,共12页
推荐系统作为有效应对信息过载的工具被广泛应用在电子商务、社交媒体和新闻资讯等领域中。矩阵分解具有泛化能力强和计算效率高的优点,是构建推荐系统的主流算法之一。为提高推荐质量,推荐服务器需要收集大量用户数据用于推荐模型的训... 推荐系统作为有效应对信息过载的工具被广泛应用在电子商务、社交媒体和新闻资讯等领域中。矩阵分解具有泛化能力强和计算效率高的优点,是构建推荐系统的主流算法之一。为提高推荐质量,推荐服务器需要收集大量用户数据用于推荐模型的训练。由于推荐服务器不是完全可信的,向服务器共享用户数据会对用户隐私构成极大的威胁。如何构建一个在保护用户隐私的同时,还能确保推荐质量和准确性的系统,成为了一个热门的研究话题。本地化差分隐私是一种分布式的隐私保护机制,它从中心化差分隐私中发展而来,旨在解决服务器不可信场景下的数据的安全收集和分析。这种框架通过精确的数学证明来确保隐私保护的强度。目前,已经有研究工作将本地化差分隐私引入推荐系统,目的是在推荐效果可接受的情况下,确保用户隐私数据的安全。然而,这些研究还面临一些挑战。首先,隐私保护的范围有限。目前的方法大多只关注显式数据的具体数值,认为这是用户的隐私信息。事实上,攻击者可以通过检查数据是否包含在数据集中,来推测用户的隐私信息。其次,推荐质量较低。本地化差分隐私通过引入扰动来保护用户隐私,但这种方法会导致扰动幅度过大和误差累积,进而影响推荐质量。在推荐服务器不可信场景下,本文提出一种基于本地化差分隐私的矩阵分解推荐算法。首先,该算法将评分数值和评分存在性同时作为隐私保护的对象,为用户提供全面的隐私保护。其次,本算法采用目标扰动方法,添加的噪声量不会随着迭代次数增加而增加,有效避免模型训练过程中噪声累积的问题,保证模型训练的有效性。最后,针对分布式场景下多轮迭代导致的中间参数泄露问题,以无放回方式将采样的模型梯度元素发送给推荐服务器,用于模型训练。本文从理论上证明了所提算法满足本地化差分隐私。对所提算法的效用分析证明本文算法在保证有效的推荐质量的同时,能够实现对用户隐私数据的保护。实验结果表明本文算法极大地提高了隐私保护推荐算法的性能,本文算法在公开数据集上的误差下降幅度平均可达18%,在推荐领域数据隐私保护中展现出良好的应用价值。 展开更多
关键词 矩阵分解 本地化差分隐私 目标扰动 推荐算法 隐私保护
在线阅读 下载PDF
基于HMM的本地化差分隐私动态位置保护方法
2
作者 晏燕 李靖 《兰州理工大学学报》 北大核心 2025年第4期95-106,共12页
现有的本地化差分隐私位置保护方法大多针对用户的静态位置进行保护,未考虑到用户位置动态变化的应用场景,且存在算法复杂度高、扰动结果可用性低等问题.针对上述问题,提出一种基于隐马尔科夫模型(hidden Markov model,HMM)的本地化差... 现有的本地化差分隐私位置保护方法大多针对用户的静态位置进行保护,未考虑到用户位置动态变化的应用场景,且存在算法复杂度高、扰动结果可用性低等问题.针对上述问题,提出一种基于隐马尔科夫模型(hidden Markov model,HMM)的本地化差分隐私动态位置保护方法.首先,结合位置动态变化过程中的时空相关性,构建基于隐马尔科夫模型的时间序列和隐私保护安全区域,实现用户位置更新后本地化差分隐私扰动区域的优选.其次,设计基于隐马尔科夫模型的动态位置连续扰动算法和本地化差分隐私随机响应机制,对优选区域内的位置点进行扰动处理,实现用户位置的动态化本地差分隐私保护.最后,在实际位置轨迹数据集合上进行实验和分析,证明所提方法能够在实现动态位置数据本地化隐私保护的前提下,达到更好的聚合准确度和统计可用性. 展开更多
关键词 位置隐私 本地化差分隐私 时空相关性 隐马尔科夫模型 隐私保护安全区域
在线阅读 下载PDF
面向稠密区域的本地化差分隐私自适应空间分解
3
作者 季博 李晓会 贾旭 《计算机应用研究》 北大核心 2025年第8期2518-2524,共7页
针对常规均匀网格法和自适应网格分解法处理空间数据时存在查询精度与查询效率较低的问题,提出一种基于本地化差分隐私的自适应空间分解算法(LDP-ASDT)。通过分组策略对空间进行分层分解,划分出稠密与稀疏区域;利用四分树通过设定合适阈... 针对常规均匀网格法和自适应网格分解法处理空间数据时存在查询精度与查询效率较低的问题,提出一种基于本地化差分隐私的自适应空间分解算法(LDP-ASDT)。通过分组策略对空间进行分层分解,划分出稠密与稀疏区域;利用四分树通过设定合适阈值,对稠密区域进一步自适应分解;利用一元编码对划分结果进行扰动实现隐私保护。理论分析证明该算法满足本地化差分隐私。在三个真实数据集上进行实验,结果表明,查询精度与运行效率优于GT-R、PrivAG、KDRQ、ASDQT算法,在稠密区域查询精度比ASDQT算法提升一倍,运行速率提升17%。 展开更多
关键词 本地化差分隐私 自适应空间分解 自适应网格划分 随机响应 空间范围查询
在线阅读 下载PDF
基于本地化差分隐私的多表星形连接查询
4
作者 张啸剑 曹小杰 +1 位作者 王宁 孟小峰 《软件学报》 北大核心 2025年第2期830-850,共21页
基于本地化差分隐私多关系表示上的Star-JOIN查询已得到研究者广泛关注.现有基于OLH机制与层次树结构的Star-JOIN查询算法存在根节点泄露隐私风险、τ-截断机制没有给出如何选择合适τ值等问题.针对现有算法存在的不足,提出一种有效且... 基于本地化差分隐私多关系表示上的Star-JOIN查询已得到研究者广泛关注.现有基于OLH机制与层次树结构的Star-JOIN查询算法存在根节点泄露隐私风险、τ-截断机制没有给出如何选择合适τ值等问题.针对现有算法存在的不足,提出一种有效且满足本地化差分隐私的Star-JOIN查询算法LPRR-JOIN(longitudinal path random response for join).该算法充分利用层次树的纵向路径结构与GRR机制,设计一种纵向本地扰动算法LPRR,该算法以所有属性纵向路径上的节点组合作为扰动值域.每个用户把自身元组映射到相应节点组合中,再利用GRR机制对映射后的元组进行本地扰动.为了避免事实表上存在的频率攻击,LPRR-JOIN算法允许每个用户利用阈值τ本地截断自身元组个数,大于τ条元组删减、小于τ条元组补充.为了寻找合适的τ值,LPRR-JOIN算法利用τ-截断带来的偏差与扰动方差构造总体误差函数,通过优化误差目标函数获得τ值;其次结合用户分组策略获得τ值的总体分布,再利用中位数获得合适的τ值.LPRR-JOIN算法与现有算法在3种多关系数据集上进行比较,实验结果表明其响应查询算法优于同类算法. 展开更多
关键词 本地化差分隐私 多表星形连接查询 层次结构 纵向节点组合 随机应答机制
在线阅读 下载PDF
基于Huffman编码的移动终端本地差分隐私位置保护 被引量:1
5
作者 晏燕 吕雅琴 李飞飞 《计算机科学与探索》 北大核心 2025年第3期802-817,共16页
移动终端的位置信息与个人隐私紧密相连,一旦泄露可能威胁用户的生命和财产安全。本地化差分隐私模型提供了严格的隐私保护效果,允许用户根据个人需求处理和保护敏感信息,避免了对第三方服务器的依赖。针对现有本地化差分隐私位置保护... 移动终端的位置信息与个人隐私紧密相连,一旦泄露可能威胁用户的生命和财产安全。本地化差分隐私模型提供了严格的隐私保护效果,允许用户根据个人需求处理和保护敏感信息,避免了对第三方服务器的依赖。针对现有本地化差分隐私位置保护方法用户端灵活性差、扰动位置质量损失严重等问题,提出了一种基于Huffman编码的移动终端本地差分隐私位置保护方法。移动用户根据个性化隐私需求提交位置隐私保护范围,服务器端按需进行位置编码并返回给用户。用户端选择所在区域的Huffman编码,并对其进行本地化差分隐私扰动以实现对原始位置的隐私保护。服务器端通过对接收的扰动位置进行解码来判断用户所处的区域,并据此提供基于位置的服务(location-based services,LBS)。在实际位置数据集合上的实验证明,所提方法能够在实现用户位置本地化差分隐私保护的基础上,提供更好的位置数据可用性和运行效率。 展开更多
关键词 位置隐私保护 本地化差分隐私 HUFFMAN编码 随机响应
在线阅读 下载PDF
基于联合树的高维数据本地化差分隐私保护算法
6
作者 程思源 龙士工 《计算机工程与设计》 北大核心 2024年第6期1601-1606,共6页
为解决发布高维数据过程中复杂的属性关联问题并避免中心服务器不可信任的问题,提出一种基于联合树的高维数据本地化差分隐私保护算法(JT-LDP算法)。基于不可信的中心服务器实现对用户数据的本地化差分隐私保护,中心服务器接收到用户本... 为解决发布高维数据过程中复杂的属性关联问题并避免中心服务器不可信任的问题,提出一种基于联合树的高维数据本地化差分隐私保护算法(JT-LDP算法)。基于不可信的中心服务器实现对用户数据的本地化差分隐私保护,中心服务器接收到用户本地化差分隐私保护的数据后,基于联合树算法识别高维数据的属性相关性,将高维数据属性集分割成多个独立的低维属性集。通过采样合成新的数据集进行发布。实验结果表明,JT-LDP算法在高维数据情况下具有更高的精度。 展开更多
关键词 高维数据 本地化差分隐私 联合树 数据发布 联合分布估计 马尔可夫网 随机响应
在线阅读 下载PDF
边缘计算下差分隐私的应用研究综述 被引量:2
7
作者 孙剑明 赵梦鑫 《计算机科学》 CSCD 北大核心 2024年第S01期884-892,共9页
为了解决传统云计算模式的延迟和带宽限制,应对物联网和大数据时代的需求,边缘计算开始崭露头角并逐渐受到广泛关注。在边缘计算环境下,用户数据的隐私问题成为了一个重要的研究热点。差分隐私技术有着坚实的数学基础,它作为一种有效的... 为了解决传统云计算模式的延迟和带宽限制,应对物联网和大数据时代的需求,边缘计算开始崭露头角并逐渐受到广泛关注。在边缘计算环境下,用户数据的隐私问题成为了一个重要的研究热点。差分隐私技术有着坚实的数学基础,它作为一种有效的隐私保护算法,已经被广泛应用于边缘计算中,两者的结合有效缓解了隐私保护低和计算成本高的问题。首先介绍了互联网发展带来的问题,其次介绍了边缘计算的基本概念、特点和组成部分,并概括了与传统云计算相比的优势,然后对差分隐私的基本概念和原理进行了概括,进而详细阐述了差分隐私的3种扰动方式和常用的实现机制,最后对边缘计算下差分隐私的应用研究进行了综述,并指出了未来的研究方向。总之,将差分隐私技术应用于边缘计算场景对隐私保护和数据分享都是一种有效保护手段。 展开更多
关键词 边缘计算 差分隐私 本地化差分隐私 隐私保护 实时数据处理
在线阅读 下载PDF
满足本地化差分隐私的众包位置数据采集 被引量:18
8
作者 霍峥 张坤 +1 位作者 贺萍 武彦斌 《计算机应用》 CSCD 北大核心 2019年第3期763-768,共6页
针对位置数据众包采集中个人位置隐私泄露的问题,提出了一种满足本地化差分隐私的位置数据众包采集方法。首先,使用逐点插入法构造维诺图,对路网空间进行分割;然后,采用满足本地化差分隐私的随机扰动的方式对每个维诺格中的位置数据进... 针对位置数据众包采集中个人位置隐私泄露的问题,提出了一种满足本地化差分隐私的位置数据众包采集方法。首先,使用逐点插入法构造维诺图,对路网空间进行分割;然后,采用满足本地化差分隐私的随机扰动的方式对每个维诺格中的位置数据进行扰动;再次,设计了一种在扰动数据集上进行空间范围查询的方法,获得对真实结果的无偏估计;最后,在空间范围查询下进行了实验验证,并与保护隐私的轨迹数据采集(PTDC)算法进行了对比,算法查询误差率最坏不超过40%,最好情况在20%以下,运行时间在8 s以内,在隐私保护度高于PTDC算法的前提下,上述参数优于PTDC算法。 展开更多
关键词 本地化差分隐私 道路网络 维诺格 位置数据 移动对象
在线阅读 下载PDF
基于本地化差分隐私和属性基可搜索加密的区块链数据共享方案 被引量:27
9
作者 冯涛 陈李秋 +1 位作者 方君丽 石建明 《通信学报》 EI CSCD 北大核心 2023年第5期224-233,共10页
针对传统基于云的数据共享方案依赖可信第三方、只关注数据隐私保护或访问控制问题,提出一种基于本地化差分隐私和属性基可搜索加密的区块链数据共享方案。将区块链和云服务器结合,链上链下协同存储数据,提供高效可靠防篡改的数据共享... 针对传统基于云的数据共享方案依赖可信第三方、只关注数据隐私保护或访问控制问题,提出一种基于本地化差分隐私和属性基可搜索加密的区块链数据共享方案。将区块链和云服务器结合,链上链下协同存储数据,提供高效可靠防篡改的数据共享。首先,引入本地化差分隐私对共享数据进行预处理,保证数据拥有者身份隐私的同时抵御不可信第三方攻击;其次,将可搜索加密技术和属性基加密结合,支持密文检索实现数据隐私保护、为共享数据提供细粒度访问控制;最后,通过安全性、正确性证明及实验分析证明所提方案满足安全目标。 展开更多
关键词 区块链 本地化差分隐私 数据共享 属性基可搜索加密 隐私保护
在线阅读 下载PDF
基于联邦学习的本地化差分隐私机制研究 被引量:2
10
作者 任一支 刘容轲 +5 位作者 王冬 袁理锋 申延召 吴国华 王秋华 杨昌天 《电子与信息学报》 EI CSCD 北大核心 2023年第3期784-792,共9页
联邦学习与群体学习作为当前热门的分布式机器学习范式,前者能够保护用户数据不被第三方获得的前提下在服务器中实现模型参数共享计算,后者在无中心服务器的前提下利用区块链技术实现所有用户同等地聚合模型参数。但是,通过分析模型训... 联邦学习与群体学习作为当前热门的分布式机器学习范式,前者能够保护用户数据不被第三方获得的前提下在服务器中实现模型参数共享计算,后者在无中心服务器的前提下利用区块链技术实现所有用户同等地聚合模型参数。但是,通过分析模型训练后的参数,如深度神经网络训练的权值,仍然可能泄露用户的隐私信息。目前,在联邦学习下运用本地化差分隐私(LDP)保护模型参数的方法层出不穷,但皆难以在较小的隐私预算和用户数量下缩小模型测试精度差。针对此问题,该文提出正负分段机制(PNPM),在聚合前对本地模型参数进行扰动。首先,证明了该机制满足严格的差分隐私定义,保证了算法的隐私性;其次分析了该机制能够在较少的用户数量下保证模型的精度,保证了机制的有效性;最后,在3种主流图像分类数据集上与其他最先进的方法在模型准确性、隐私保护方面进行了比较,表现出了较好的性能。 展开更多
关键词 隐私保护 联邦学习 本地化差分隐私 区块链
在线阅读 下载PDF
基于马尔可夫聚类的隐私高维数据发布方法
11
作者 刘卓群 龙士工 +1 位作者 张珺铭 刘光源 《计算机工程与设计》 北大核心 2025年第1期117-123,共7页
针对现有差分隐私的方法在处理高维数据发布时面临计算成本高、数据精度低和中心服务器不可信任的问题,提出一种基于马尔可夫聚类的隐私高维数据发布方法MCL-LDP。基于在用户本地实现对用户数据的隐私保护,中心服务器接收到用户本地化... 针对现有差分隐私的方法在处理高维数据发布时面临计算成本高、数据精度低和中心服务器不可信任的问题,提出一种基于马尔可夫聚类的隐私高维数据发布方法MCL-LDP。基于在用户本地实现对用户数据的隐私保护,中心服务器接收到用户本地化差分隐私保护的数据后,构建无向依赖图矩阵表示高维数据的复杂的属性关联性,基于马尔可夫聚类将高维数据属性集分割成多个低维属性簇,利用EM算法计算低维属性簇和重叠属性簇的边缘分布、估计原始数据的联合分布,通过采样合成新的数据集进行发布。实验结果表明,所提出方法在发布高维数据集上有较好的精度、较少的迭代次数和较高的计算效率。 展开更多
关键词 高维数据 本地化差分隐私 马尔可夫聚类 数据发布 联合分布估计 属性关联性 数据合成
在线阅读 下载PDF
本地化差分隐私研究综述 被引量:81
12
作者 叶青青 孟小峰 +1 位作者 朱敏杰 霍峥 《软件学报》 EI CSCD 北大核心 2018年第7期1981-2005,共25页
大数据时代信息技术不断发展,个人信息的隐私问题越来越受到关注,如何在数据发布和分析的同时保证其中的个人敏感信息不被泄露是当前面临的重大挑战.中心化差分隐私保护技术建立在可信第三方数据收集者的假设基础上,然而该假设在现实中... 大数据时代信息技术不断发展,个人信息的隐私问题越来越受到关注,如何在数据发布和分析的同时保证其中的个人敏感信息不被泄露是当前面临的重大挑战.中心化差分隐私保护技术建立在可信第三方数据收集者的假设基础上,然而该假设在现实中不一定成立.基于此提出的本地化差分隐私作为一种新的隐私保护模型,具有强隐私保护性,不仅可以抵御具有任意背景知识的攻击者,而且能够防止来自不可信第三方的隐私攻击,对敏感信息提供了更全面的保护.介绍了本地化差分隐私的原理与特性,总结和归纳了该技术的当前研究工作,重点阐述了该技术的研究热点:本地化差分隐私下的频数统计、均值统计以及满足本地化差分隐私的扰动机制设计.在对已有技术深入对比分析的基础上,指出了本地化差分隐私保护技术的未来研究挑战. 展开更多
关键词 隐私保护 本地化差分隐私 中心化差分隐私
在线阅读 下载PDF
一种基于本地化差分隐私的网格聚类方法 被引量:6
13
作者 张东月 倪巍伟 +2 位作者 张森 付楠 候立贺 《计算机学报》 EI CAS CSCD 北大核心 2023年第2期422-435,共14页
随着移动互联网应用的不断深入,产生了大量个体数据,采集分布在不同终端上的数据进行聚类可以发现人群行为模式,支撑应用服务的深入开展.然而这些数据往往包含个体敏感信息,在缺少可信数据采集者的情况下,直接采集数据进行聚类存在泄露... 随着移动互联网应用的不断深入,产生了大量个体数据,采集分布在不同终端上的数据进行聚类可以发现人群行为模式,支撑应用服务的深入开展.然而这些数据往往包含个体敏感信息,在缺少可信数据采集者的情况下,直接采集数据进行聚类存在泄露个体数据隐私的风险.近年来,本地化差分隐私(Local Differential Privacy,LDP)以其严谨的数学理论基础得到隐私保护领域研究者的持续关注.现有基于LDP的聚类研究多数采用基于划分的聚类方法,存在仅适用凸状分布数据以及聚类质量损失较大问题.针对该问题,聚焦网格聚类,提出基于LDP的隐私保护网格聚类方法.首先,设计网格划分评估指标,通过调节网格划分粒度调控网格密度估算误差和簇边缘信息损失,指导网格结构选取;然后,在服务器与终端间构建循环反馈机制,利用数据分布信息迭代优化扰动粒度,降低差分噪声注入量,在保护终端数据隐私安全的前提下,提升网格密度估算精度;最后,在服务器端,提出基于网格结构的自适应网格聚合方法,提升隐私保护聚类质量.理论分析和实验结果表明,所提方法在兼顾各终端个体数据隐私的同时,对不同分布数据有良好的聚类效果. 展开更多
关键词 隐私保护 本地化差分隐私 网格聚类 网格划分评估指标 循环反馈机制
在线阅读 下载PDF
多级本地化差分隐私算法推荐框架 被引量:3
14
作者 王瀚仪 李效光 +3 位作者 毕文卿 陈亚虹 李凤华 牛犇 《通信学报》 EI CSCD 北大核心 2022年第8期52-64,共13页
本地化差分隐私(LDP)算法通常为不同用户分配相同的保护机制及参数,却忽视了不同用户终端设备资源与隐私需求的差异。为此,提出一种多级LDP算法推荐框架。该框架考虑服务商以及用户的需求,通过服务商和用户的多级管理实现多用户差异化... 本地化差分隐私(LDP)算法通常为不同用户分配相同的保护机制及参数,却忽视了不同用户终端设备资源与隐私需求的差异。为此,提出一种多级LDP算法推荐框架。该框架考虑服务商以及用户的需求,通过服务商和用户的多级管理实现多用户差异化隐私保护。将框架应用至频数统计场景形成LDP算法推荐方案,改进LDP算法以保证统计结果的可用性,设计协同机制保护用户的隐私偏好。实验结果证明了所提方案的可用性。 展开更多
关键词 本地化差分隐私 资源自适应 个性化隐私预算
在线阅读 下载PDF
基于本地化差分隐私的政务数据共享隐私保护算法研究 被引量:14
15
作者 郝玉蓉 朴春慧 +1 位作者 颜嘉麒 蒋学红 《情报杂志》 CSSCI 北大核心 2021年第2期169-175,137,共8页
[目的/意义]为了合理化决策,通常一个政府部门会根据业务需求向其他部门共享某类数据,为本部门管理或服务决策提供辅助参考依据。数据共享在其中至关重要,但若在没有适当预防措施的情况下就共享政务数据,将容易造成隐私信息的泄露。[方... [目的/意义]为了合理化决策,通常一个政府部门会根据业务需求向其他部门共享某类数据,为本部门管理或服务决策提供辅助参考依据。数据共享在其中至关重要,但若在没有适当预防措施的情况下就共享政务数据,将容易造成隐私信息的泄露。[方法/过程]针对政府部门间共享统计数据的场景,提出一种基于本地化差分隐私的政务数据共享方法。该方法在算法Generalized randomized response(GRR)的基础上引入数据分箱思想,通过等宽分箱将数据记录分入更小的数据域范围内,以克服当前隐私保护算法在数据域较大且数据量较少时统计误差大的问题。[结果/结论]将所提算法与GRR算法在仿真数据集和真实数据集上均进行了对比分析,实验结果表明该算法可有效降低统计误差,并能在不同分布和数据域大小下保持其效用性。 展开更多
关键词 政府数据共享 本地化差分隐私 数据分箱 隐私保护算法
在线阅读 下载PDF
本地化差分隐私下的频繁序列模式挖掘算法PrivSPM 被引量:5
16
作者 黄硕 李艳辉 曹建秋 《计算机应用》 CSCD 北大核心 2023年第7期2057-2064,共8页
序列数据中可能包含大量敏感信息,因此直接对序列数据的频繁模式进行挖掘存在泄露用户隐私信息的风险。本地化差分隐私(LDP)能够抵御具有任意背景知识的攻击者,可以对敏感信息提供更全面的保护。序列数据内在序列性和高维度的特点为LDP... 序列数据中可能包含大量敏感信息,因此直接对序列数据的频繁模式进行挖掘存在泄露用户隐私信息的风险。本地化差分隐私(LDP)能够抵御具有任意背景知识的攻击者,可以对敏感信息提供更全面的保护。序列数据内在序列性和高维度的特点为LDP应用于频繁序列模式挖掘带来了挑战。为解决这个问题,提出一种满足ε-LDP的top-k频繁序列模式挖掘算法PrivSPM。该算法结合填充和采样技术、自适应频率估计算法与频繁项预测技术来构造候选集;基于新域,利用基于指数机制的策略对用户数据进行扰动,并结合频率估计算法识别最终的频繁序列模式。理论分析证明了该算法满足ε-LDP。在3个真实数据集上的实验结果表明,PrivSPM算法在纳真率(TPR)和归一化累积排名(NCR)上明显高于对比算法,能有效提高挖掘结果的准确度。 展开更多
关键词 本地化差分隐私 隐私保护 频繁序列模式挖掘 指数机制 数据挖掘
在线阅读 下载PDF
基于本地化差分隐私的空间数据近似k-近邻查询 被引量:3
17
作者 张啸剑 徐雅鑫 孟小峰 《计算机研究与发展》 EI CSCD 北大核心 2022年第7期1610-1624,共15页
针对现有本地编码机制与本地扰动机制在收集空间数据时不具有保距性的问题,提出了基于局部敏感Hash结构(locality-sensitive hashing, LSH)的近似k-近邻(k nearest neighbor,kNN)查询算法PELSH与PULSH.这2种算法利用具有多Hash函数的多H... 针对现有本地编码机制与本地扰动机制在收集空间数据时不具有保距性的问题,提出了基于局部敏感Hash结构(locality-sensitive hashing, LSH)的近似k-近邻(k nearest neighbor,kNN)查询算法PELSH与PULSH.这2种算法利用具有多Hash函数的多Hash表对所有用户位置数据进行索引,结合多Hash表结构响应近似kNN查询.每个用户结合收集者所共享的多Hash表副本,将自身位置数据以汉明空间嵌入方式编码成0/1串.借助LSH结构对0/1串进行Hash压缩,并利用GRR机制与按位扰动机制对压缩后的0/1串进行本地处理.收集者利用每个用户的报告值重构多Hash表索引结构,遍历多Hash表响应空间近似kNN查询.为了有效地利用LSH索引结构的特点,PELSH和PULSH算法结合隐私预算分割与用户分组策略来重构多Hash表结构,基于这2种策略设计了4种本地扰动算法PELSHB,PELSHG,PULSHB和PULSHG.PELSH和PULSH算法与现有的近似kNN查询算法在真实的大规模空间数据集上的实验结果表明,所设计的近似空间kNN查询效果优于同类算法. 展开更多
关键词 本地化差分隐私 k-近邻查询 局部敏感Hash 隐私预算分割 用户分组
在线阅读 下载PDF
基于本地化差分隐私的键值数据关联分析 被引量:2
18
作者 孙林 平国楼 叶晓俊 《计算机科学》 CSCD 北大核心 2021年第8期278-283,共6页
在群智感知系统中,从分布式数据源中持续收集和分析数据可以为先进的数据挖掘模型提供决策支持。由于数据中可能包含个人相关的信息,数据的采集和分析过程中通常伴随着隐私泄露的风险。本地化差分隐私作为先进的隐私保护方案可在用户的... 在群智感知系统中,从分布式数据源中持续收集和分析数据可以为先进的数据挖掘模型提供决策支持。由于数据中可能包含个人相关的信息,数据的采集和分析过程中通常伴随着隐私泄露的风险。本地化差分隐私作为先进的隐私保护方案可在用户的隐私性和数据的可用性之间提供较好的权衡。当前,键值数据作为异构类型数据,其同时含有分类数据和数值数据,基于本地化差分隐私在多维度下对键值数据进行关联分析面临着一定的挑战。针对隐私保护前提下键值数据的发布和关联分析问题,首先定义了键值数据的频率关联和均值关联问题,然后提出了适用于键值对的索引独热编码,为键值数据提供本地化差分隐私保护,最后在扰动的数据上对键值数据进行关联分析。基于仿真数据集和真实数据集的实验和理论分析验证了所提方案的有效性。 展开更多
关键词 本地化差分隐私 键值数据 关联分析 均值估计 频率估计
在线阅读 下载PDF
支持本地化差分隐私保护的k-modes聚类方法 被引量:15
19
作者 彭春春 陈燕俐 荀艳梅 《计算机科学》 CSCD 北大核心 2021年第2期105-113,共9页
如何在保护数据隐私的同时进行可用性的数据挖掘已成为热点问题。鉴于在很多实际应用场景中,很难找到一个真正可信的第三方对用户的敏感数据进行处理,文中首次提出了一种支持本地化差分隐私技术的聚类方案——LDPK-modes(Local Differen... 如何在保护数据隐私的同时进行可用性的数据挖掘已成为热点问题。鉴于在很多实际应用场景中,很难找到一个真正可信的第三方对用户的敏感数据进行处理,文中首次提出了一种支持本地化差分隐私技术的聚类方案——LDPK-modes(Local Differential Privacy K-modes)。与传统的基于中心化差分隐私的聚类算法相比,其不再需要一个可信的第三方对数据进行收集和处理,而由用户担任数据隐私化的工作,极大地降低了第三方窃取用户隐私的可能性。用户使用满足本地d-隐私(带有距离度量的本地差分隐私技术)定义的随机响应机制对敏感数据进行扰动,第三方收集到用户扰动数据后,恢复其统计特征,生成合成数据集,并进行k-modes聚类。在聚类过程中,将数据集上频繁出现的特征分配给初始聚类中心点,进一步提高了聚类结果的可用性。理论分析和实验结果表明了LDPK-modes的隐私性和聚类可用性。 展开更多
关键词 本地化差分隐私 k-modes d-隐私 聚类 隐私保护
在线阅读 下载PDF
基于本地化差分隐私的电动汽车接入充电点位置隐私保护 被引量:3
20
作者 李科寰 李红娇 田秀霞 《计算机应用与软件》 北大核心 2021年第6期52-59,共8页
针对现有电动汽车接入充电点位置的隐私保护算法不可抵御背景知识攻击和不可信第三方的隐私攻击问题,提出一种基于本地化差分隐私的电动汽车接入充电点位置隐私保护方法。使用基于距离变换的栅格算法对充电点分布构建维诺图并编号;在客... 针对现有电动汽车接入充电点位置的隐私保护算法不可抵御背景知识攻击和不可信第三方的隐私攻击问题,提出一种基于本地化差分隐私的电动汽车接入充电点位置隐私保护方法。使用基于距离变换的栅格算法对充电点分布构建维诺图并编号;在客户端对每辆电动汽车所在充电点位置数据进行K-RR随机响应,使结果满足本地化差分隐私,并提供一种在扰动结果上获得电动汽车计数分布无偏估计的方法;通过实验证明该方法在真实数据中与k-匿名方式在查询误差率相当的情况下,其算法安全性及效率更佳。 展开更多
关键词 本地化差分隐私 位置隐私保护 电动汽车 维诺图 电动汽车接入电网
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部