期刊文献+
共找到91篇文章
< 1 2 5 >
每页显示 20 50 100
基于密度峰值聚类的不平衡数据过抽样方法 被引量:1
1
作者 张智驹 《统计与决策》 CSSCI 北大核心 2024年第8期11-16,共6页
大多数不平衡数据过抽样方法依赖于太多参数,容易生成噪声并难以处理流形数据集。为此,文章提出了一种基于密度峰值聚类的不平衡数据过抽样方法(OVMEDPC)。首先,OVMEDPC用密度峰值聚类(DPC)来发现不平衡数据的空间结构;其次,OVMEDPC设... 大多数不平衡数据过抽样方法依赖于太多参数,容易生成噪声并难以处理流形数据集。为此,文章提出了一种基于密度峰值聚类的不平衡数据过抽样方法(OVMEDPC)。首先,OVMEDPC用密度峰值聚类(DPC)来发现不平衡数据的空间结构;其次,OVMEDPC设计了一种基于密度峰值聚类的噪声过滤方法来移除噪声;最后,OVMEDPC设计了一种基于密度峰值聚类的插值技术来生成少数类的合成样本。实验证明,就随机森林分类器而言,OVMEDPC在F-measure和G-mean上优于5个先进的过抽样方法。 展开更多
关键词 不平衡分 过抽样方法 密度峰值
在线阅读 下载PDF
基于密度聚类模态分解的卷积神经网络和长短期记忆网络短期风电功率预测 被引量:3
2
作者 崔明勇 董文韬 卢志刚 《现代电力》 北大核心 2024年第4期631-641,共11页
近年来,随着碳达峰和碳中和“双碳”战略目标的提出,风力发电已成为可再生能源发电的关键部分。为提高风电功率短期预测的准确度,提出基于密度聚类与自适应噪声完备集成经验模态分解(complete ensemble empirical mode decomposition wi... 近年来,随着碳达峰和碳中和“双碳”战略目标的提出,风力发电已成为可再生能源发电的关键部分。为提高风电功率短期预测的准确度,提出基于密度聚类与自适应噪声完备集成经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)和卷积神经网络与长短期记忆网络结合的短期风电功率预测方法。首先,利用密度聚类将风电功率与天气特征分成不同类别的数据集,通过自适应噪声完备集成经验模态分解算法将不同类别的数据进行频域分解得到子序列分量。以此为基础,将不同的子序列分量与天气特征进行特征选择,输入到卷积神经网络与长短期记忆网络的预测模型。最后,将不同的预测结果进行叠加得到最终的预测结果。整个预测过程通过聚类、分解和特征选择,有效提高了短期风电功率预测的准确度。 展开更多
关键词 风电功率预测 密度 自适应噪声完备集成经验模态分解 卷积神经网络 长短期记忆网络
在线阅读 下载PDF
基于空间密度的群以噪声发现聚类算法研究 被引量:20
3
作者 毕方明 王为奎 陈龙 《南京大学学报(自然科学版)》 CSCD 北大核心 2012年第4期491-498,共8页
针对基于密度的群以噪声发现聚类算法(density-based spatial clustering of applications withnoise,DBSCAN)的所需内存及I/O消耗大;空间聚类的密度不均匀时,采用全局统一的变量,聚类质量较差;对于输入参数敏感性较高等三个不足进行了... 针对基于密度的群以噪声发现聚类算法(density-based spatial clustering of applications withnoise,DBSCAN)的所需内存及I/O消耗大;空间聚类的密度不均匀时,采用全局统一的变量,聚类质量较差;对于输入参数敏感性较高等三个不足进行了改进.首先根据数据的空间分布特性,将整个数据空间划分为多个较小的分区,使分区的局部密度相对更均匀;然后将每个局部分区运用改进的DBSCAN算法进行聚类,改进的算法可以根据空间数据的分布,对一个中心点自适应的选取近邻,并对这些近邻点进行取样、扩展,有效提高了算法的准确性和效率;接着将所得到的聚类结果按照合并规则进行合并.最后通过仿真实验,验证了改进的DBSCAN算法解决了内存消耗过大、聚类质量差及全局参数敏感的问题. 展开更多
关键词 数据挖掘 空间 基于密度的群以噪声发现 数据分区 参数自适应
在线阅读 下载PDF
基于密度分布的鲁棒谱聚类算法 被引量:1
4
作者 李超 廖红梅 +2 位作者 徐晓 郭丽丽 丁世飞 《计算机学报》 EI CAS CSCD 北大核心 2024年第11期2645-2663,共19页
谱聚类作为一种基于图论的聚类方法,通过相似性矩阵对数据进行特征分解或将数据投影到低维空间以实现更好的数据划分.谱聚类因其适用于复杂数据和非凸子簇而受到广泛的关注,并已成功应用在很多领域.然而,计算复杂度高、噪声敏感等问题... 谱聚类作为一种基于图论的聚类方法,通过相似性矩阵对数据进行特征分解或将数据投影到低维空间以实现更好的数据划分.谱聚类因其适用于复杂数据和非凸子簇而受到广泛的关注,并已成功应用在很多领域.然而,计算复杂度高、噪声敏感等问题会限制其聚类效果的进一步提升.针对这些问题,本文提出了一种基于密度分布的鲁棒谱聚类算法.首先,设置噪声系数以过滤少量的低密度噪声点.其次,根据密度峰值聚类具有的特性,即尽可能多地划分数据能够保证子簇内数据标签的一致性,新提出的算法能够在较少的子簇数和更高的簇内标签一致性上达到平衡,实现了对数据更加优质的划分.最后,基于簇间密度分布的相似性度量改善了谱聚类在密度不均匀数据集上的聚类效果.合成数据以及真实数据上的实验充分证明了新算法在9个最新改进算法中的有效性.在保证聚类效率的前提下,新算法在真实数据上的准确率、调整兰德系数和调整互信息的平均值上至少分别提升了10.02%、22.11%和15.76%. 展开更多
关键词 密度分布 子簇相似性 局部峰值 噪声检测
在线阅读 下载PDF
基于密度与划分方法的聚类算法设计与实现 被引量:4
5
作者 孟海东 宋飞燕 郝永宽 《计算机工程与应用》 CSCD 北大核心 2007年第27期171-174,共4页
在分析常用聚类算法的特点和适应性基础上提出一种基于密度与划分方法的聚类算法。该算法根据数据对象密度分布状态来自动确定聚类簇密度吸引中心点和聚类簇的初始划分;然后利用划分的方法,根据密度可达定义来寻找密度可达数据对象簇,... 在分析常用聚类算法的特点和适应性基础上提出一种基于密度与划分方法的聚类算法。该算法根据数据对象密度分布状态来自动确定聚类簇密度吸引中心点和聚类簇的初始划分;然后利用划分的方法,根据密度可达定义来寻找密度可达数据对象簇,从而完成数据对象簇的最终聚类。实验证明该算法能够很好地处理具有任意形状和大小的簇,能够有效地屏蔽噪声和离群点的影响和发现孤立点;同时也减小了输入参数对领域知识的依赖性。 展开更多
关键词 数据挖掘 密度函数 密度可达 划分方法
在线阅读 下载PDF
基于密度峰值法的设计理性聚类方法 被引量:3
6
作者 王业东 李向前 +2 位作者 敬石开 魏振达 陈英 《计算机集成制造系统》 EI CSCD 北大核心 2017年第8期1662-1669,共8页
针对设计理性的自动聚类问题,提出一种基于密度峰值法的设计理性聚类方法。该方法结合设计理性的语义特点,利用单元本词汇频率/单元本频率值方法将设计理性转化为特征向量。然后基于密度峰值法求出每个特征向量的局部密度和距离两个参数... 针对设计理性的自动聚类问题,提出一种基于密度峰值法的设计理性聚类方法。该方法结合设计理性的语义特点,利用单元本词汇频率/单元本频率值方法将设计理性转化为特征向量。然后基于密度峰值法求出每个特征向量的局部密度和距离两个参数,绘制决策图确定聚类中心,并将其余的数据指派到相应所属的类别中。针对密度峰值法在处理密度分布不均的数据时聚类效果差的问题,利用K最近邻方法定义动态截断距离来改进局部密度函数。以某机械设计团队的55个设计理性为例验证了所提方法的有效性。 展开更多
关键词 设计理性 方法 密度峰值法 动态截断距离 产品设计
在线阅读 下载PDF
主成份分析及模糊聚类方法在噪声功能区域划分中的应用
7
作者 钟秉照 黄按佑 +2 位作者 李定南 朱俊怀 谭卫广 《中国环境监测》 CAS CSSCI CSCD 北大核心 1992年第1期46-48,共3页
一、方法概要 (一)主成份分析法:设有N个样品,每个样品测得P个变量的数值。
关键词 主成份分析 模糊方法 区域划分 噪声管理 网格点 中心 相关系数 矩阵乘法 特征向量 区域
在线阅读 下载PDF
基于传递熵密度聚类的用户窃电识别方法 被引量:22
8
作者 刘康 李彬 +4 位作者 薛阳 杨艺宁 徐英辉 刘爱国 苏盛 《中国电机工程学报》 EI CSCD 北大核心 2022年第20期7535-7545,共11页
在配电线路/台区中,接入用户的用电量与线损电量间存在因果关系,正常用户电量变化对线损电量的影响有限,而窃电用户的用电量对线损电量的影响异于正常用户。传递熵能衡量变量间的信息传递,是评价因果性的重要指标。该文提出基于传递熵... 在配电线路/台区中,接入用户的用电量与线损电量间存在因果关系,正常用户电量变化对线损电量的影响有限,而窃电用户的用电量对线损电量的影响异于正常用户。传递熵能衡量变量间的信息传递,是评价因果性的重要指标。该文提出基于传递熵密度聚类的用户窃电识别方法。首先运用传递熵指向性筛选出对线路/台区线损电量因果关联较强的用户;然后构建其与线损电量的传递熵模型,计算不同时长的用户用电量对线损电量的传递熵值,以衡量其信息传递量;再结合密度聚类算法,将传递熵曲线偏离正常用户类簇的识别为与线损有强因果性的窃电用户。最后,基于已查证的高损台区和长距离配电线路实际数据,验证所提方法的有效性。 展开更多
关键词 窃电 传递熵 基于密度噪声应用空间 因果关联 线损电量
在线阅读 下载PDF
基于时空约束密度聚类的职住地识别方法 被引量:2
9
作者 苗登逢 肖跃雷 《计算机应用研究》 CSCD 北大核心 2022年第6期1779-1784,共6页
为了从移动终端位置数据中精准识别居民职住地,提出了一种基于时空约束密度聚类的职住地识别方法。首先,利用基于K-means的DBSCAN(density-based spatial clustering of applications with noise)时空驻点聚类过程将居民多天的原始轨迹... 为了从移动终端位置数据中精准识别居民职住地,提出了一种基于时空约束密度聚类的职住地识别方法。首先,利用基于K-means的DBSCAN(density-based spatial clustering of applications with noise)时空驻点聚类过程将居民多天的原始轨迹点分成不同的时空驻点簇;然后,利用基于速度阈值的停留点簇和移动点簇识别过程将居民的每一个时空驻点簇区分为停留点簇或移动点簇;接着,利用基于K近距离的DBSCAN重要停留点聚类过程将居民的停留点分成不同的重要停留点簇;最后,利用基于KD-tree优化的KNN(K-nearest neighbor)职住地识别过程将居民的每个重要停留点识别为工作地、居住地、职住同一区域或兴趣地点区域。实验结果表明,该方法的每个过程都是合理有效的,并且最终的职住地识别效果要优于时间阈值法、累加时间法和信息熵法。 展开更多
关键词 密度 职住地识别 K-均值 基于密度噪声空间算法 KD-TREE K-近邻
在线阅读 下载PDF
结合改进密度峰值聚类的LGC半监督学习方法优化 被引量:1
10
作者 薛子晗 潘迪 何丽 《计算机工程》 CAS CSCD 北大核心 2021年第2期77-83,89,共8页
基于图的局部与全局一致性(LGC)半监督学习方法具有较高的标注正确率,但时间复杂度较高,难以适用于数据规模较大的实际应用场景。从缩小图的规模入手,提出一种全局一致性优化方法。使用改进后的密度峰值聚类算法,迭代地从数据集中筛选... 基于图的局部与全局一致性(LGC)半监督学习方法具有较高的标注正确率,但时间复杂度较高,难以适用于数据规模较大的实际应用场景。从缩小图的规模入手,提出一种全局一致性优化方法。使用改进后的密度峰值聚类算法,迭代地从数据集中筛选出多个中心点,以每个中心点为簇中心进行局部聚类,并以中心点为顶点构建图,实现基于LGC的半监督学习。实验结果表明,优化后的LGC方法在D31、Aggregation等数据集上具有较好的鲁棒性,在标注正确率和算法执行时间上优势明显。 展开更多
关键词 半监督学习 密度峰值 基于图方法 标签传递 迭代
在线阅读 下载PDF
基于密度噪声应用空间聚类算法的机载激光雷达建筑物点云提取与单体化 被引量:18
11
作者 吕富强 唐诗华 +1 位作者 何广焕 蒙金龙 《科学技术与工程》 北大核心 2022年第9期3446-3452,共7页
针对机载激光雷达建筑物点云提取过程中自动化提取困难,以及提取后的建筑物单体化过程烦琐等问题,提出一种基于密度噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法的机载雷达建筑物点云提... 针对机载激光雷达建筑物点云提取过程中自动化提取困难,以及提取后的建筑物单体化过程烦琐等问题,提出一种基于密度噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法的机载雷达建筑物点云提取与单体化的方法。该方法对预处理后的点云数据基于DBSCAN算法进行去噪与初步的提取,通过三维密度聚类,将建筑物的点云进行提取与自动单体化。根据建筑物点云密度的特点,进行二维的密度聚类,结合数字正射影像图(digital orthophoto map,DOM)进行点云分割。最后将处理后的点云数据进行优化处理,并将建筑物单体化簇类进行提取,得到单体化建筑物点云。结果表明:提取的建筑物点云数量正确率为97.36%,轮廓边长的中误差为0.077,可以有效地提取出建筑物点云并将其单体化。 展开更多
关键词 机载激光雷达 建筑物点云 基于密度噪声应用空间(DBSCAN) 密度 点云提取 单体化
在线阅读 下载PDF
基于密度峰值聚类的水电现货报价单元组建方法
12
作者 赵丽伟 黄炜斌 +3 位作者 赖春羊 马光文 陈仕军 李相锐 《中国农村水利水电》 北大核心 2023年第4期263-269,共7页
随着电力现货市场的不断推进与完善,发电侧主体多元化使得发电主体的竞价环境更加激烈,报价单元的组建有利于提高发电企业抵御市场竞价风险的能力,分析了不同的流域水文情势、多元的开发主体以及电站的规模属性等因素对发电企业竞价的影... 随着电力现货市场的不断推进与完善,发电侧主体多元化使得发电主体的竞价环境更加激烈,报价单元的组建有利于提高发电企业抵御市场竞价风险的能力,分析了不同的流域水文情势、多元的开发主体以及电站的规模属性等因素对发电企业竞价的影响,以流域、发电企业以及上网点3个主要因素为指标,提出基于密度峰值聚类的报价单元组建方法,并将该方法运用于西南地区主要流域的67个电站,结果表明,报价单元的组建对提高水电竞价能力具有实际意义,单元方案与电网规定的统调单元较为一致,验证了该模型合理可行,可为发电企业参与电力现货市场竞价提供一种新思路。 展开更多
关键词 报价单元 密度峰值方法 发电企业 现货市场 竞价风险
在线阅读 下载PDF
一种基于密度的空间数据流在线聚类算法 被引量:28
13
作者 于彦伟 王沁 +1 位作者 邝俊 何杰 《自动化学报》 EI CSCD 北大核心 2012年第6期1051-1059,共9页
为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点... 为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点及其满足核心点条件的邻域数据做局部聚类更新,降低聚类更新的时间复杂度,实现对空间数据流的在线聚类.OLDStream算法具有快速处理大规模空间数据流、实时获取全局任意形状的聚类簇结果、对数据流的输入顺序不敏感、并能发现孤立点数据等优势.在真实数据和合成数据上的综合实验验证了算法的聚类效果、高效率性和较高的可伸缩性,同时实验结果的统计分析显示仅有4%的空间点消耗最坏运行时间,对每个空间点的平均聚类时间约为0.033ms. 展开更多
关键词 空间数据挖掘 数据流 基于密度的聚 在线算法 噪声处理
在线阅读 下载PDF
Greedy DBSCAN:一种针对多密度聚类的DBSCAN改进算法 被引量:45
14
作者 冯振华 钱雪忠 赵娜娜 《计算机应用研究》 CSCD 北大核心 2016年第9期2693-2696,2700,共5页
针对基于密度的DBSCAN算法对于输入参数敏感、无法聚类多密度数据集等问题,提出了一种贪心的DBSCAN改进算法(greedy DBSCAN)。算法仅需输入一个参数Min Pts,采用贪心策略自适应地寻找Eps半径参数进行簇发现,利用相对稠密度识别和判定噪... 针对基于密度的DBSCAN算法对于输入参数敏感、无法聚类多密度数据集等问题,提出了一种贪心的DBSCAN改进算法(greedy DBSCAN)。算法仅需输入一个参数Min Pts,采用贪心策略自适应地寻找Eps半径参数进行簇发现,利用相对稠密度识别和判定噪声数据,在随机寻找核对象过程中使用邻域查询方式提升算法效率,最终通过簇的合并产生最终的聚类结果。实验结果表明,改进后的算法能有效地分离噪声数据,识别多密度簇,聚类准确度较高。 展开更多
关键词 密度 贪心策略 相对稠密度 邻域查询 噪声数据 DBSCAN
在线阅读 下载PDF
基于局部聚类与图方法的半监督学习算法 被引量:7
15
作者 李明 杨艳屏 占惠融 《自动化学报》 EI CSCD 北大核心 2010年第12期1655-1660,共6页
基于图的算法已经成为半监督学习中的一种流行方法,该方法把数据定义为图的节点,用图的边表示数据之间的关系,在各种数据分布情况下都具有很高的分类准确度.然而图方法的计算复杂度比较高,当图的规模比较大时,计算所需要的时间和存储都... 基于图的算法已经成为半监督学习中的一种流行方法,该方法把数据定义为图的节点,用图的边表示数据之间的关系,在各种数据分布情况下都具有很高的分类准确度.然而图方法的计算复杂度比较高,当图的规模比较大时,计算所需要的时间和存储都非常大,这在一定程度上限制了图方法的使用.因此,如何控制图的大小是基于图的半监督学习算法中的一个重要问题.本文提出了一种基于密度估计的快速聚类方法,可以在局部范围对数据点进行聚类,以聚类形成的子集作为构图的节点,从而大大降低了图的复杂度.新的聚类方法计算量较小,通过推导得到的距离函数能较好地保持原有数据分布.实验结果表明,通过局部聚类后构建的小图在分类效果上与在原图上的结果相当,同时在计算速度上有极大的提高. 展开更多
关键词 半监督学习 方法 密度估计 局部
在线阅读 下载PDF
一种高效的点云去噪聚类方法 被引量:12
16
作者 钟文彬 肖振远 刘光帅 《机械设计与制造》 北大核心 2022年第8期233-237,共5页
逆向工程采用激光扫描设备获取点云数据时会引入无关离体噪声点,针对密度聚类法去噪时引起的内存占用较大、收敛时间较慢的问题,提出了一种高效的点云去噪聚类方法。首先,采用KD-tree建立点云数据的空间索引结构,选择点云的某一维度,找... 逆向工程采用激光扫描设备获取点云数据时会引入无关离体噪声点,针对密度聚类法去噪时引起的内存占用较大、收敛时间较慢的问题,提出了一种高效的点云去噪聚类方法。首先,采用KD-tree建立点云数据的空间索引结构,选择点云的某一维度,找出最小索引核心点云。然后,沿着该维度方向在核心点云邻域外选择最近的未标记的点云扩展密度类。最后,分离出密度相连最大的点云类以完成点云去噪。实验结果表明,与统计滤波、半径滤波、密度聚类滤波算法相比,该方法在完整保留目标点云的同时能高效地去除离体点云噪声,提高了点云去噪的质量。 展开更多
关键词 噪声 密度 KD-TREE 核心点云 密度 密度相连
在线阅读 下载PDF
阈值优化的文本密度聚类算法 被引量:6
17
作者 马素琴 施化吉 《计算机工程与应用》 CSCD 北大核心 2011年第17期134-136,共3页
针对DBSCAN算法的聚类性能受全局阈值影响而降低的问题,提出一种阈值优化的文本密度聚类算法。该算法使用k-近邻距离对对象进行排序,通过分位数区分密度不同的各序列,找到与其对应的优化,根据优化阈值使用密度聚类方法对对象进行聚类。... 针对DBSCAN算法的聚类性能受全局阈值影响而降低的问题,提出一种阈值优化的文本密度聚类算法。该算法使用k-近邻距离对对象进行排序,通过分位数区分密度不同的各序列,找到与其对应的优化,根据优化阈值使用密度聚类方法对对象进行聚类。改进后的聚类算法克服了阈值选取对聚类结果影响的问题,提高了聚类精确度和时间效率。采用树形结构存储聚簇,增加了聚簇的可读性。实验结果证明了该算法的有效性。 展开更多
关键词 文本挖掘 文本 一个基于高密度连接区域的密度方法 一种阈值优化的文本密度算法 分位数
在线阅读 下载PDF
基于密度的面板数据聚类分析 被引量:7
18
作者 杨娟 谢远涛 《统计与信息论坛》 CSSCI 2014年第2期23-28,共6页
研究面板数据聚类问题过程中,在相似性度量上,用Logistic回归模型构造相似系数和非对称相似矩阵。在聚类算法上,目前的聚类算法只适用于对称的相似矩阵。在非对称相似矩阵的聚类算法上,采用最佳优先搜索和轮廓系数,改进DBSCAN聚类方法,... 研究面板数据聚类问题过程中,在相似性度量上,用Logistic回归模型构造相似系数和非对称相似矩阵。在聚类算法上,目前的聚类算法只适用于对称的相似矩阵。在非对称相似矩阵的聚类算法上,采用最佳优先搜索和轮廓系数,改进DBSCAN聚类方法,提出BF—DBSCAN方法。通过实例分析,比较了BF—DBSCAN和DBSCAN方法的聚类结果,以及不同参数设置对BF—DBSCAN聚类结果的影响,验证了该方法的有效性和实用性。 展开更多
关键词 面板数据 LOGISTIC回归模型 基于密度的应用噪声的空间 最佳优先搜索 轮廓系数
在线阅读 下载PDF
基于区域比例的聚类方法 被引量:2
19
作者 李伟雄 谭建豪 王贵山 《计算机工程与应用》 CSCD 北大核心 2011年第8期143-145,共3页
为了改善DBSCAN参数敏感性和对密度分布不均数据对象聚类质量不高的问题,提出了一种基于DBSCAN算法的改进聚类方法。算法使用K最近邻的均值距离度量密度,中心点选取当前密度最大点,并以中心点为核心点扩展种子队列,直至由给定的密度比... 为了改善DBSCAN参数敏感性和对密度分布不均数据对象聚类质量不高的问题,提出了一种基于DBSCAN算法的改进聚类方法。算法使用K最近邻的均值距离度量密度,中心点选取当前密度最大点,并以中心点为核心点扩展种子队列,直至由给定的密度比例因子所决定的密度边缘。为了改善聚类质量,提出了候选核心点,并使用给定的半径比例因子发现核心点。在实验中,利用数据集对该算法进行了测试,测试结果证明了该改进算法的参数鲁棒性,和在聚类密度分布不均数据集时的较好性能。 展开更多
关键词 基于密度的带噪声应用的空间方法(DBSCAN) 算法 密度 区域比例
在线阅读 下载PDF
改进的密度峰值聚类算法的差分隐私保护方案 被引量:2
20
作者 葛丽娜 陈园园 +1 位作者 王捷 王哲 《郑州大学学报(工学版)》 CAS 北大核心 2023年第6期19-24,共6页
针对改进的密度峰值聚类(AdDPC)算法在计算局部密度时产生的隐私泄露问题以及算法的一次分配策略,提出一种改进的密度峰值聚类算法的差分隐私保护方案。该方案在算法计算局部密度的过程中添加Laplace随机噪声,使得即使攻击者拥有最大背... 针对改进的密度峰值聚类(AdDPC)算法在计算局部密度时产生的隐私泄露问题以及算法的一次分配策略,提出一种改进的密度峰值聚类算法的差分隐私保护方案。该方案在算法计算局部密度的过程中添加Laplace随机噪声,使得即使攻击者拥有最大背景知识,也无法通过添加或者删除数据集中的某一点来获取相应的信息,从而利用差分攻击获取目标数据点的信息,达到保护隐私数据的目的,并且在分配非聚类中心点时引入可达定义改进AdDPC算法的分配策略,避免因为一次分配策略导致数据点分配错误的问题。实验对比了DP-rcCFSFDP算法、AdAPC-rDP算法、IDP K-means算法的F-Measure和ARI,结果表明:当隐私预算大于1.5时,所提算法的F-Measure和ARI优于其他算法,所提算法能够在保护敏感数据的同时保证数据的可用性。 展开更多
关键词 密度峰值 差分隐私 随机噪声 算法
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部