期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于拉普拉斯机制的差分隐私保护k-means++聚类算法研究 被引量:21
1
作者 傅彦铭 李振铎 《信息网络安全》 CSCD 北大核心 2019年第2期43-52,共10页
k-means++聚类算法是为了解决k-means聚类算法的准确度受其初始中心点选取的影响较大的问题而提出的,在聚类过程中,需要对相关的隐私数据提供保护。差分隐私模型定义了一种具有最大背景知识假设的攻击模型,并且能对隐私保护强度进行量... k-means++聚类算法是为了解决k-means聚类算法的准确度受其初始中心点选取的影响较大的问题而提出的,在聚类过程中,需要对相关的隐私数据提供保护。差分隐私模型定义了一种具有最大背景知识假设的攻击模型,并且能对隐私保护强度进行量化分析。文章提出一种基于拉普拉斯机制的差分隐私保护k-means++聚类算法(DPk-means++聚类算法),在初始化选取中心点和迭代求均值中心点的过程中,分别根据拉普拉斯机制添加噪声,解决了k-means++聚类算法随机选取初始化中心点隐私泄露的问题和迭代求簇心隐私泄露问题。通过实验分别对隐私预算动态变化对比及聚类准确性结果进行分析,DPk-means++聚类算法能够在隐私预算参数范围内且保证聚类准确性的前提下,实现对数据隐私提供不同级别的保护。 展开更多
关键词 差分隐私保护 拉普拉斯机制 k-means++ 聚类
在线阅读 下载PDF
满足本地差分隐私的混合噪音感知的模糊C均值聚类算法 被引量:3
2
作者 张朋飞 程俊 +4 位作者 张治坤 方贤进 孙笠 王杰 姜茸 《电子与信息学报》 北大核心 2025年第3期739-757,共19页
在大数据和物联网应用中,本地差分隐私(LDP)技术用于保护聚类分析中的用户隐私,但现有方法要么在LDP下交互式地进行聚类,需要消耗大量隐私预算,要么没有同时考虑到聚类数据中蕴含的表示数据质量的高斯噪音以及为满足LDP保护的拉普拉斯噪... 在大数据和物联网应用中,本地差分隐私(LDP)技术用于保护聚类分析中的用户隐私,但现有方法要么在LDP下交互式地进行聚类,需要消耗大量隐私预算,要么没有同时考虑到聚类数据中蕴含的表示数据质量的高斯噪音以及为满足LDP保护的拉普拉斯噪音,致使聚类精度低下。同时,对于衡量用户提交数据和簇心之间的距离选择较为武断,没有充分利用到用户提交的噪音数据中蕴含的噪音模式。为此,该文创新性地提出一种满足LDP的混合噪音感知的模糊C均值聚类算法(mnFCM),该算法的主要思想是同时建模用户上传数据中蕴含的表示用户质量的高斯噪音以及为保护用户数据注入的拉普拉斯噪音,进而设计出混合噪音感知的距离替代传统的欧式距离,来衡量样本数据与簇心间的相似性。特别地,在mnFCM中,该文首先设计了混合噪音感知的距离计算方法,在此基础上给出算法新的目标函数,并基于拉格朗日乘子法设计了求解方法,最后理论上分析了求解算法的收敛性。该文进一步理论分析了mnFCM的隐私、效用和复杂度,分析结果表明所提算法严格满足LDP、相对于对比算法更接近非隐私下的簇心以及和非隐私算法具有接近的复杂度。在两个真实数据集上的实验结果表明,mnFCM在满足LDP下,聚类精度提高了10%~15%。 展开更多
关键词 聚类分析 隐私保护 本地差分隐私 模糊C均值聚类 拉普拉斯机制
在线阅读 下载PDF
基于数据特征相关性和自适应差分隐私的深度学习方法研究 被引量:2
3
作者 康海燕 王骁识 《电子学报》 EI CAS CSCD 北大核心 2024年第6期1963-1976,共14页
基于差分隐私的深度学习隐私保护方法中,训练周期的长度以及隐私预算的分配方式直接制约着深度学习模型的效用.针对现有深度学习结合差分隐私的方法中模型训练周期有限、隐私预算分配不合理导致模型安全性与可用性差的问题,提出一种基... 基于差分隐私的深度学习隐私保护方法中,训练周期的长度以及隐私预算的分配方式直接制约着深度学习模型的效用.针对现有深度学习结合差分隐私的方法中模型训练周期有限、隐私预算分配不合理导致模型安全性与可用性差的问题,提出一种基于数据特征相关性和自适应差分隐私的深度学习方法(deep learning methods based on data feature Relevance and Adaptive Differential Privacy,RADP).首先,该方法利用逐层相关性传播算法在预训练模型上计算出原始数据集上每个特征的平均相关性;然后,使用基于信息熵的方法计算每个特征平均相关性的隐私度量,根据隐私度量对特征平均相关性自适应地添加拉普拉斯噪声;在此基础上,根据加噪保护后的每个特征平均相关性,合理分配隐私预算,自适应地对特征添加拉普拉斯噪声;最后,理论分析该方法(RADP)满足ε-差分隐私,并且兼顾安全性与可用性.同时,在三个真实数据集(MNIST,Fashion-MNIST,CIFAR-10)上的实验结果表明,RADP方法的准确率以及平均损失均优于AdLM(Adaptive Laplace Mechanism)方法、DPSGD(Differential Privacy with Stochastic Gradient Descent)方法和DPDLIGDO(Differentially Private Deep Learning with Iterative Gradient Descent Optimization)方法,并且RADP方法的稳定性仍能保持良好. 展开更多
关键词 差分隐私 深度学习 逐层相关性传播 信息熵 隐私度量 隐私预算 拉普拉斯机制
在线阅读 下载PDF
基于轨迹扰动和路网匹配的位置隐私保护算法 被引量:2
4
作者 刘沛骞 王水莲 +1 位作者 申自浩 王辉 《计算机应用》 CSCD 北大核心 2024年第5期1546-1554,共9页
针对现有扰动机制未考虑位置点语义关系导致数据可用性较低的问题,提出一种基于差分隐私(DP)的轨迹位置隐私保护机制(DP-TLPM)。首先,DP-TLPM利用滑动窗口提取轨迹停留点生成模糊区域,再利用指数机制和拉普拉斯机制对该区域进行采样;其... 针对现有扰动机制未考虑位置点语义关系导致数据可用性较低的问题,提出一种基于差分隐私(DP)的轨迹位置隐私保护机制(DP-TLPM)。首先,DP-TLPM利用滑动窗口提取轨迹停留点生成模糊区域,再利用指数机制和拉普拉斯机制对该区域进行采样;其次,为了消除采样点中可能存在的无语义位置点,提出一种路网匹配算法,对轨迹分段并利用误差椭圆匹配(EEM)进行迭代匹配;最后,根据匹配后的位置点形成扰动轨迹,由用户端将扰动轨迹发送至服务器。实验以混淆质量和均方根误差(RMSE)为评价标准对该机制进行综合评测。与GeoInd算法相比,DP-TLPM的数据质量损失降低了24%,轨迹的混淆质量提高了52%,从隐私保护强度和数据质量两方面验证了该算法的有效性。 展开更多
关键词 轨迹隐私保护 路网匹配 位置扰动 拉普拉斯机制
在线阅读 下载PDF
差分隐私保护下一种精确挖掘top-k频繁模式方法 被引量:29
5
作者 张啸剑 王淼 孟小峰 《计算机研究与发展》 EI CSCD 北大核心 2014年第1期104-114,共11页
频繁模式挖掘是分析事务数据集常用技术.然而,当事务数据集含有敏感数据时(如用户行为记录、电子病例等),直接发布频繁模式及其支持度计数会给个人隐私带来相当大的风险.对此提出了一种满足ε-差分隐私的top-k频繁模式挖掘算法DP-topkP(... 频繁模式挖掘是分析事务数据集常用技术.然而,当事务数据集含有敏感数据时(如用户行为记录、电子病例等),直接发布频繁模式及其支持度计数会给个人隐私带来相当大的风险.对此提出了一种满足ε-差分隐私的top-k频繁模式挖掘算法DP-topkP(differentially private top-kpattern mining).该算法利用指数机制从候选频繁模式集合中挑选出top-k个携带真实支持度计数的模式;采用拉普拉斯机制产生的噪音扰动所选模式的真实支持度计数;为了增强输出模式的可用性,采用后置处理技术对top-k个模式的噪音支持度计数进行求精处理.从理论角度证明了该算法满足ε-差分隐私,并符合(λ,δ)-useful要求.实验结果证明了DP-topkP算法具有较好的准确性、可用性和可扩展性. 展开更多
关键词 频繁模式挖掘 top-k模式 差分隐私 拉普拉斯机制 指数机制
在线阅读 下载PDF
基于差分隐私的多源数据关联规则挖掘方法 被引量:13
6
作者 崔一辉 宋伟 +1 位作者 彭智勇 杨先娣 《计算机科学》 CSCD 北大核心 2018年第6期36-40,56,共6页
随着大数据时代的到来,挖掘大数据的潜在价值越来越受到学术界和工业界的关注。但与此同时,由于互联网安全事件频发,用户越来越多地关注个人隐私数据的泄露问题,用户数据的安全问题成为阻碍大数据分析的首要问题之一。关于用户数据的安... 随着大数据时代的到来,挖掘大数据的潜在价值越来越受到学术界和工业界的关注。但与此同时,由于互联网安全事件频发,用户越来越多地关注个人隐私数据的泄露问题,用户数据的安全问题成为阻碍大数据分析的首要问题之一。关于用户数据的安全性问题,现有研究更多地关注访问控制、密文检索和结果验证,虽然可以保证用户数据本身的安全性,但是无法挖掘出所保护数据的潜在价值。如何既能保护用户的数据安全又能挖掘数据的潜在价值,是亟需解决的关键问题之一。文中提出了一种基于差分隐私保护的关联规则挖掘方法,数据拥有者使用拉普拉斯机制和指数机制在数据发布的过程中对用户数据进行保护,数据分析者在差分隐私的FP-tree上进行关联规则挖掘。其中的安全性假设是:攻击者即使掌握了除攻击目标以外的所有元组数据信息的背景知识,仍旧无法获得攻击目标的信息,因此具有极高的安全性。所提方法是兼顾安全性、性能和准确性,以牺牲部分精确率为代价,大幅增加了用户数据的安全性和处理性能。实验结果表明,所提方法的精确性损失在可接受的范围内,性能优于已有算法的性能。 展开更多
关键词 隐私保护的数据挖掘 差分隐私 拉普拉斯机制 指数机制
在线阅读 下载PDF
K-means‖隐私保护聚类算法 被引量:6
7
作者 郑剑 冷碧玉 《计算机工程与设计》 北大核心 2022年第1期26-33,共8页
针对异常离群点对k-means‖算法的聚类精确度影响较大且在确定中心点过程中会泄露聚类数据隐私的问题,提出DPk-means‖算法。标记离群点,降低离群点对k-means‖算法聚类精确度的影响,将差分隐私应用于k-means‖聚类算法中保护聚类数据... 针对异常离群点对k-means‖算法的聚类精确度影响较大且在确定中心点过程中会泄露聚类数据隐私的问题,提出DPk-means‖算法。标记离群点,降低离群点对k-means‖算法聚类精确度的影响,将差分隐私应用于k-means‖聚类算法中保护聚类数据隐私。在选择聚类初始中心点和迭代求取均值中心点的过程中,应用拉普拉斯机制注入噪声,解决数据隐私泄露的问题。通过隐私预算动态变化对聚类结果准确性的影响及同类算法对比实验分析验证,DPk-means‖算法能够提供更高的隐私保护水平且保证聚类结果的准确性。 展开更多
关键词 聚类精确度 并行化k均值 离群点 拉普拉斯机制 差分隐私
在线阅读 下载PDF
多类别图像数据分类隐私保护算法 被引量:4
8
作者 郑剑 冷碧玉 《科学技术与工程》 北大核心 2020年第29期12007-12013,共7页
为了对所收集的未标记数据进行划分归类,用已知数据生成预测模型成为一种热门方法。针对模型会隐式地记住训练数据集而导致数据隐私泄露的问题,为保护训练集的隐私安全,将差分隐私应用于多类别图像数据集分类任务中,提出差分隐私与深度... 为了对所收集的未标记数据进行划分归类,用已知数据生成预测模型成为一种热门方法。针对模型会隐式地记住训练数据集而导致数据隐私泄露的问题,为保护训练集的隐私安全,将差分隐私应用于多类别图像数据集分类任务中,提出差分隐私与深度残差网络(differential privacy with deep residual networks,Diff-RN)方法。该方法将多类别图像数据分成多个互斥的数据集,通过黑盒的方式对互斥数据集分别进行非公开的教师模型训练,并使用拉普拉斯机制对教师模型结果聚合注入噪声与非敏感公共数据集结合,利用深度残差网络训练公开的学生模型,实验结果表明,在数据集cifar-100上,Diff-RN方法训练得到的模型分类精确度提高,训练过程中数据损失量降低,隐私保护程度更高,并且整个训练过程满足ε-差分隐私。 展开更多
关键词 机器学习 黑盒的方式 拉普拉斯机制 深度残差网络 差分隐私
在线阅读 下载PDF
一种增强的差分隐私数据发布算法 被引量:4
9
作者 孙奎 张志勇 赵长伟 《计算机工程》 CAS CSCD 北大核心 2017年第4期160-165,共6页
为在同等隐私保护强度下提高发布数据的分类准确率,在Diff Gen算法基础上提出一种改进的差分隐私数据发布算法Gini Diff。该算法将原始数据集完全泛化,在每轮迭代中通过指数机制选择特化方案,并以构建决策树的方式将特化后的记录划归到... 为在同等隐私保护强度下提高发布数据的分类准确率,在Diff Gen算法基础上提出一种改进的差分隐私数据发布算法Gini Diff。该算法将原始数据集完全泛化,在每轮迭代中通过指数机制选择特化方案,并以构建决策树的方式将特化后的记录划归到新的等价类,使用拉普拉斯机制为等价类计数添加噪声并生成发布数据集。运用基尼系数增益衡量不同特化方案的可用性,合理分配隐私预算并动态计算其消耗,发布数据集的可用性得到有效提高。实验结果表明,该算法发布的数据在分类准确率方面优于Diff Gen,接近理想水平。 展开更多
关键词 差分隐私 数据发布 决策树 基尼系数增益 指数机制 拉普拉斯机制
在线阅读 下载PDF
MapReduce框架下支持差分隐私保护的随机梯度下降算法 被引量:3
10
作者 俞艺涵 付钰 吴晓平 《通信学报》 EI CSCD 北大核心 2018年第1期70-77,共8页
针对现有分布式计算环境下随机梯度下降算法存在效率性与私密性矛盾的问题,提出一种MapReduce框架下满足差分隐私的随机梯度下降算法。该算法基于MapReduce框架,将数据随机分配到各个Map节点并启动Map分任务独立并行执行随机梯度下降算... 针对现有分布式计算环境下随机梯度下降算法存在效率性与私密性矛盾的问题,提出一种MapReduce框架下满足差分隐私的随机梯度下降算法。该算法基于MapReduce框架,将数据随机分配到各个Map节点并启动Map分任务独立并行执行随机梯度下降算法;启动Reduce分任务合并满足更新要求的分目标更新模型,并加入拉普拉斯随机噪声实现差分隐私保护。根据差分隐私保护原理,证明了算法满足e-差分隐私保护要求。实验表明该算法具有明显的效率优势并有较好的数据可用性。 展开更多
关键词 机器学习 随机梯度下降 MAPREDUCE 差分隐私保护 拉普拉斯机制
在线阅读 下载PDF
基于差分隐私与前缀树的搜索日志隐私保护研究 被引量:2
11
作者 陆叶 卢菁 《小型微型计算机系统》 CSCD 北大核心 2016年第3期540-544,共5页
针对搜索日志的发布泄露用户隐私的问题将差分隐私引入到搜索日志中,提出了一种满足ε-差分隐私的隐私保护策略算法,使得搜索日志中的隐私信息不被泄露.采用前缀树的思想对数据源预处理和剪枝,在所得结果中利用拉普拉斯机制添加噪声扰... 针对搜索日志的发布泄露用户隐私的问题将差分隐私引入到搜索日志中,提出了一种满足ε-差分隐私的隐私保护策略算法,使得搜索日志中的隐私信息不被泄露.采用前缀树的思想对数据源预处理和剪枝,在所得结果中利用拉普拉斯机制添加噪声扰动真实结果,并通过理论证明该方法满足差分隐私保护.实验采用多机联机处理策略,大量缩短算法处理时间.通过实验结果分析,选取合适剪枝k阈值,使得发布数据在隐私保护度和数据准确率中达到平衡. 展开更多
关键词 搜索日志 隐私保护 差分隐私 前缀树 拉普拉斯机制
在线阅读 下载PDF
面向隐私保护的频繁项集挖掘算法 被引量:6
12
作者 蒋辰 杨庚 +1 位作者 白云璐 马君梅 《信息网络安全》 CSCD 北大核心 2019年第4期73-81,共9页
目前已有多种满足ε-差分隐私的频繁项集挖掘算法,但这些算法在处理高维数据集时难以兼顾安全性和效用性。针对该问题,文章提出一种面向隐私保护的频繁项集挖掘算法——TrunSuper。该算法先对事务数据集进行截断以降维,将事务中的项按... 目前已有多种满足ε-差分隐私的频繁项集挖掘算法,但这些算法在处理高维数据集时难以兼顾安全性和效用性。针对该问题,文章提出一种面向隐私保护的频繁项集挖掘算法——TrunSuper。该算法先对事务数据集进行截断以降维,将事务中的项按支持度从大到小进行排序,剔除支持度较小的项,从而降低发布的频繁项集的支持度误差。文章证明了该算法在满足ε-差分隐私的同时具有较好的可用性,且在真实数据集上验证了算法的优越性。 展开更多
关键词 频繁项集挖掘 差分隐私 事务截断 拉普拉斯机制
在线阅读 下载PDF
结合联邦学习和增强学习的车联网数据差分隐私保护 被引量:1
13
作者 邬忠萍 郝宗波 +1 位作者 王文静 刘冬 《汽车技术》 CSCD 北大核心 2023年第11期56-62,共7页
为保证车联网环境下用户数据的安全性和隐私性,提出了结合联邦学习和增强学习的分布式数据差分隐私保护方案。利用联邦学习架构将数据保留在车辆节点或边缘设备上进行学习,通过分布式存储实现数据隐私保护,并减少数据传输开销;基于拉普... 为保证车联网环境下用户数据的安全性和隐私性,提出了结合联邦学习和增强学习的分布式数据差分隐私保护方案。利用联邦学习架构将数据保留在车辆节点或边缘设备上进行学习,通过分布式存储实现数据隐私保护,并减少数据传输开销;基于拉普拉斯机制实现差分隐私,并通过逐层相关传播(LRP)技术管理数据扰动,确保模型参数传递的隐私性和高效率。试验结果表明,所提出的方案在10轮通信内实现了约80%的全局准确度,最高可达98%,能够在消耗较少通信轮数的情况下完成模型聚合,实现了隐私保护和全局数据准确度的较好平衡,且通过增强学习策略准确检测到虚假噪声的注入,能够提升车联网的智能化水平和安全等级。 展开更多
关键词 车联网 联邦学习 增强学习 差分隐私 拉普拉斯机制 逐层相关传播
在线阅读 下载PDF
一种基于差分隐私的个性化服务推荐算法 被引量:2
14
作者 李晓会 陈潮阳 +1 位作者 张兴 伊华伟 《现代电子技术》 2022年第4期83-88,共6页
推荐系统存在用户隐私安全性低、推荐服务质量差的问题。为此,文中提出一种基于差分隐私的个性化服务推荐算法DPk⁃median。该算法针对推荐系统服务器中生成的推荐列表,首先利用k⁃median聚类算法将推荐数据中具有相同属性的数据进行聚类... 推荐系统存在用户隐私安全性低、推荐服务质量差的问题。为此,文中提出一种基于差分隐私的个性化服务推荐算法DPk⁃median。该算法针对推荐系统服务器中生成的推荐列表,首先利用k⁃median聚类算法将推荐数据中具有相同属性的数据进行聚类;然后根据不同簇的风险级别,添加相应的拉普拉斯噪声机制,同一簇中的隐私预算参数是相同的,在保证隐私的前提下,可合理控制噪声的加入并提高噪声的利用率,保证推荐的质量损失减小,同时增加算法的执行效率。相关实验结果表明,与以往的基于差分隐私的个性化服务推荐系统相比,文中所提出的算法在保证系统安全性的同时,提高了服务推荐的质量和算法的执行效率。 展开更多
关键词 个性化服务推荐 差分隐私 数据聚类 拉普拉斯噪声机制 隐私预算 推荐服务质量 风险级别
在线阅读 下载PDF
k-均值问题的差分隐私算法综述
15
作者 袁藩 徐大川 张冬梅 《运筹学学报》 CSCD 北大核心 2022年第3期1-16,共16页
k-均值问题是机器学习和组合优化领域十分重要的问题。它是经典的NP-难问题,被广泛的应用于数据挖掘、企业生产决策、图像处理、生物医疗科技等领域。随着时代的发展,人们越来越注重于个人的隐私保护:在决策通常由人工智能算法做出的情... k-均值问题是机器学习和组合优化领域十分重要的问题。它是经典的NP-难问题,被广泛的应用于数据挖掘、企业生产决策、图像处理、生物医疗科技等领域。随着时代的发展,人们越来越注重于个人的隐私保护:在决策通常由人工智能算法做出的情况下,如何保证尽可能多地从数据中挖掘更多信息,同时不泄露个人隐私。近十年来不断有专家学者研究探索带隐私保护的k-均值问题,得到了许多具有理论指导意义和实际应用价值的结果,本文主要介绍关于k-均值问题的差分隐私算法供读者参考。 展开更多
关键词 k-均值问题 差分隐私 近似算法 指数机制 拉普拉斯机制
在线阅读 下载PDF
差分隐私中噪声添加与精度分析研究
16
作者 王骁识 康海燕 《兰州理工大学学报》 CAS 北大核心 2023年第3期94-103,共10页
国内对于差分隐私定义以及所使用的基本机制缺乏严格清晰的证明与推导过程,对学者入门造成了困难.因此针对这方面空白,通过分析、证明与应用举例的方式,对差分隐私中的拉普拉斯机制与指数机制进行了详细分析,并给出完整的数学推导过程... 国内对于差分隐私定义以及所使用的基本机制缺乏严格清晰的证明与推导过程,对学者入门造成了困难.因此针对这方面空白,通过分析、证明与应用举例的方式,对差分隐私中的拉普拉斯机制与指数机制进行了详细分析,并给出完整的数学推导过程和应用举例.指出了拉普拉斯机制精度公式和指数机制精度公式存在缩放过大的问题,并且在拉普拉斯机制和指数机制精度公式的证明之后给出了放缩过大的理由.通过实验得出结论,拉普拉斯机制精度公式和指数机制精度公式是精度范围过大的公式. 展开更多
关键词 隐私保护 差分隐私 拉普拉斯机制 指数机制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部