期刊文献+
共找到118篇文章
< 1 2 6 >
每页显示 20 50 100
贝壳形屋盖风压系数密度峰值聚类分区研究
1
作者 林拥军 周畅 +2 位作者 张曾鹏 余国菲 谢远昂 《建筑科学与工程学报》 北大核心 2024年第1期158-170,共13页
鉴于贝壳形屋盖表面风压分布的特殊性,提出基于快速搜索技术的密度峰值聚类风压系数分区方法。以某贝壳形屋盖表面风压分布试验结果为基础,进行密度峰值聚类风压系数分区,采用SD有效性指标验证分区数的合理性,并与改进k-means聚类分区... 鉴于贝壳形屋盖表面风压分布的特殊性,提出基于快速搜索技术的密度峰值聚类风压系数分区方法。以某贝壳形屋盖表面风压分布试验结果为基础,进行密度峰值聚类风压系数分区,采用SD有效性指标验证分区数的合理性,并与改进k-means聚类分区结果进行对比。结果表明:密度峰值聚类风压系数分区以风压系数相对距离、局部密度和综合指数为特征参数,能较好反映屋面风压分布特性,有效保证类聚合性和类类分离性;相较于改进k-means分区法,不同风向角下密度峰值聚类得到的分区数与SD最优聚类数接近;密度峰值聚类分区结果能更准确反映贝壳形屋盖表面风压分布特性,充分体现测点风压系数局部密度和相对距离特征值较大的基本原则,对于贝壳形屋盖的风压系数分区具有更好的适用性;贝壳形屋盖密度峰值聚类分区最大负风压系数在-0.59~-1.74之间。 展开更多
关键词 密度峰值 快速搜索 聚类 风压系数分区 贝壳形屋盖
在线阅读 下载PDF
基于类簇合并的无参数密度峰值聚类算法 被引量:1
2
作者 刘天娇 王胜景 袁永生 《现代电子技术》 北大核心 2024年第8期1-8,共8页
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚... 密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。 展开更多
关键词 聚类分析 密度峰值聚类算法 初始类簇 类簇合并 相似度 聚类性能
在线阅读 下载PDF
自适应引力密度峰值聚类优化算法
3
作者 罗岚 詹凤 +2 位作者 周传华 任太娇 周昊 《微电子学与计算机》 2024年第3期21-28,共8页
针对密度峰值聚类(Density Peak Clustering,DPC)算法对截断距离的取值较为敏感,密度度量标准不统一且人为选取聚类中心存在主观性的问题,提出了一种自适应引力密度峰值聚类优化(Optimized Adaptive Gravitational Density Peak Cluster... 针对密度峰值聚类(Density Peak Clustering,DPC)算法对截断距离的取值较为敏感,密度度量标准不统一且人为选取聚类中心存在主观性的问题,提出了一种自适应引力密度峰值聚类优化(Optimized Adaptive Gravitational Density Peak Clustering Algorithm,OAGDPC)算法。首先采用模糊加权K-近邻技术(Fuzzy Weighted KNearest Neighbors Density Peak Clustering,FKNN-DPC)重新定义了局部密度,统一了密度度量的标准;然后提出一种自适应选择聚类中心的策略,结合基于引力的密度峰值(Gravitational Density Peak Clustering,GDPC)算法中牛顿万有引力定律与DPC算法的参数映射,使用引力类比距离,并设置综合考虑局部密度和引力的决策参数,依据决策参数降序折线图的顶角变化自适应确定聚类中心;最后聚集非中心点并识别异常点。实验选取DPC、GDPC、FKNN-DPC和OAGDPC在人工和UCI数据集上进行测试,结果表明,OAGDPC算法在各数据集上都有良好的表现,特别在聚类结果准确性、自适应能力、鲁棒性方面相对于对比算法具有明显优势。 展开更多
关键词 密度峰值聚类 聚类中心自适应 K最近邻 模糊邻域
在线阅读 下载PDF
结合灰狼优化算法和动态邻域的三支密度峰值聚类算法
4
作者 陈沛琦 黄春梅 《长江信息通信》 2024年第1期70-73,77,共5页
针对密度峰值聚类算法聚类效果受截断距离dc的取值影响较大以及传统二支聚类处理不确定数据强制划分带来的决策错误,提出结合灰狼优化算法和动态邻域的三支密度峰值聚类算法。首先,为解决截断距离dc的选取难问题,将聚类内部指标Silhoue... 针对密度峰值聚类算法聚类效果受截断距离dc的取值影响较大以及传统二支聚类处理不确定数据强制划分带来的决策错误,提出结合灰狼优化算法和动态邻域的三支密度峰值聚类算法。首先,为解决截断距离dc的选取难问题,将聚类内部指标Silhouette指标作为目标函数,利用灰狼优化算法(GWO)的全局寻优能力求解最优的截断距离dc;为了使不确定数据的划分更加合理,结合动态邻域的思想,利用K近邻算法将二支聚类结果转化为三支聚类结果。通过在人工数据集以及UCI真实数据集的实验验证,该算法的聚类精度和总体性能优于其他5种对比算法。 展开更多
关键词 密度峰值聚类 灰狼优化算法 三支聚类 截断距离
在线阅读 下载PDF
自适应密度峰值聚类算法
5
作者 张强 周水生 张颖 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期170-181,共12页
密度峰值聚类(DPC)以其简单、高效的特点被广泛应用。然而,其有两个不足:(1)集群密度不均匀和不平衡的数据集在DPC所提供的决策图中,很难识别真正的聚类中心;(2)存在一个区域密度最高的点的错误分配将导致该区域内的所有点都指向同一个... 密度峰值聚类(DPC)以其简单、高效的特点被广泛应用。然而,其有两个不足:(1)集群密度不均匀和不平衡的数据集在DPC所提供的决策图中,很难识别真正的聚类中心;(2)存在一个区域密度最高的点的错误分配将导致该区域内的所有点都指向同一个错误的聚类的“链式效应”。针对这两个不足,引入新的自然邻域(NaN)的概念,提出了一种基于自然邻域的密度峰值聚类算法(DPC-NaN)。算法使用新的自然邻域密度识别噪声点,选择初始预聚类中心点,将非噪声点按密度峰值方法进行分配以得到预聚类;并通过确定预聚类的边界点和合并半径,自适应地将预聚类结果合并为最终聚类。所提算法无需人工预设参数,也缓解了“链式效应”的问题。实验结果表明,与相关聚类算法相比,所提出的算法可在典型的数据集上获得更好的聚类结果,同时在图像分割表现良好。 展开更多
关键词 聚类 密度峰值聚类 自然邻域 图像分割
在线阅读 下载PDF
基于光谱信息散度-光谱角的自适应密度峰值聚类波段选择方法
6
作者 杨榕彬 白洪涛 +1 位作者 曹英晖 何丽莉 《吉林大学学报(信息科学版)》 CAS 2024年第3期438-445,共8页
针对传统密度峰值聚类在波段选择时缺乏信息论角度的相似性度量以及波段数目确定问题,提出基于光谱角-光谱信息散度的自适应密度峰值波段选择方法(SSDPC:Spectral angle mapping and Spectral information divergence Density Peaks Clu... 针对传统密度峰值聚类在波段选择时缺乏信息论角度的相似性度量以及波段数目确定问题,提出基于光谱角-光谱信息散度的自适应密度峰值波段选择方法(SSDPC:Spectral angle mapping and Spectral information divergence Density Peaks Cluster)。该方法将光谱信息散度和光谱角用于高光谱图像密度峰值聚类进行波段选择,取代传统的欧氏距离构建波段相似矩阵。通过构建波段评分策略,有效自动选择出重要的光谱波段子集。在3组高光谱数据集上调用RX(Reed-Xiaoli)算法进行异常检测,在SSDPC的相似性度量方法下,异常检测精度较欧氏距离度量方法分别平均提高1.16%、1.18%和0.07%;在自适应的SSDPC波段选择方法下,异常检测精度相较原始RX算法分别提升6.49%、2.71%和0.05%。结果表明,该算法具有良好的鲁棒性,能提升高光谱图像异常检测的性能并降低其虚警率。 展开更多
关键词 密度峰值 波段选择 光谱角 光谱信息散度 聚类中心
在线阅读 下载PDF
基于密度峰值的高维电力负荷数据聚类方法
7
作者 郭晓霞 刘佳易 程昱舒 《电子设计工程》 2024年第20期103-106,111,共5页
由于电力能源应用量的暴增,电力负荷数据体量也逐渐加大,隐藏信息挖掘难度越来越大,对负荷数据处理技术提出了更高的要求,为此提出基于密度峰值的高维电力负荷数据聚类方法。深入剖析电力负荷数据特征,检测并修正其中的异常数据,去除负... 由于电力能源应用量的暴增,电力负荷数据体量也逐渐加大,隐藏信息挖掘难度越来越大,对负荷数据处理技术提出了更高的要求,为此提出基于密度峰值的高维电力负荷数据聚类方法。深入剖析电力负荷数据特征,检测并修正其中的异常数据,去除负荷曲线基荷部分,完成负荷数据的预处理。确定电力负荷数据局部密度计算公式,引入密度峰值聚类算法制定高维电力负荷数据聚类程序,执行指定程序即可获得负荷数据聚类结果。实验数据显示,应用提出方法后,DBI指标最小值为0.22,FMI指标最大值为0.96,表明其数据聚类效果更好,证实了提出方法的应用性能较佳。 展开更多
关键词 高维数据 数据聚类 密度峰值 电力负荷数据
在线阅读 下载PDF
基于改进密度峰值聚类的路网子区动态划分方法
8
作者 许源 陆良 +1 位作者 徐冲聪 郑芳芳 《交通运输工程与信息学报》 2024年第4期113-127,共15页
在大型异构路网中,不同区域的交通运行特征存在显著差异,因此需要针对各个区域的具体特征制定相应的交通管理和控制策略。合理划分路网以获得交通特征均质的子区,对于有效的交通管控和分析至关重要。首先提出了一种改进的密度峰值聚类方... 在大型异构路网中,不同区域的交通运行特征存在显著差异,因此需要针对各个区域的具体特征制定相应的交通管理和控制策略。合理划分路网以获得交通特征均质的子区,对于有效的交通管控和分析至关重要。首先提出了一种改进的密度峰值聚类方法(Enhanced Density Peak Clustering,En-DPC),用于路网子区的初始划分。该方法基于质量概率相似性并考虑路网连接性约束,提升了算法对异常数据的鲁棒性,避免子区内路段不连续的问题。接着,利用En-DPC方法对初始划分的子区进一步合并,形成大小适中的新子区。最后,通过边界调整提高子区边界的平滑度,获得最终的划分结果。该方法能够根据路网交通状态自动确定子区数量,确保划分的合理性。此外,考虑到路网拥堵状态的时空演变,在静态划分基础上设计了一种动态划分方法,根据车辆密度的变化动态调整边界,以提升其在实时交通管控中的适用性,并利用瑞士苏黎世的线圈检测器数据验证了所提出方法的有效性。结果表明,本文提出的方法能够有效地将大型异构路网划分成均质子区,且每个子区都可获得一个清晰的宏观基本图。与现有文献中的路网划分方法如归一分割和“蛇”方法相比,本文方法不仅在归一化总方差、平均NcutSilhouette和模块度等性能评价指标上表现更优,而且子区划分时间明显低于其他两种方法。 展开更多
关键词 交通工程 路网划分 改进密度峰值聚类 宏观基本图 动态划分
在线阅读 下载PDF
基于密度峰值的数据流动态聚类算法研究
9
作者 张国一 刘三民 《长春理工大学学报(自然科学版)》 2024年第4期82-93,共12页
数据流中存在不确定性,如何识别数据流环境中任意形状的数据以及噪声影响问题引起了广泛关注。为解决上述问题,设计一种鲁棒的密度峰值数据流动态聚类算法,该聚类算法的框架包括在线和离线阶段,在线阶段旨在即时响应并处理连续到达的数... 数据流中存在不确定性,如何识别数据流环境中任意形状的数据以及噪声影响问题引起了广泛关注。为解决上述问题,设计一种鲁棒的密度峰值数据流动态聚类算法,该聚类算法的框架包括在线和离线阶段,在线阶段旨在即时响应并处理连续到达的数据,在线阶段通过设计微簇的不均匀衰减策略减少历史数据对聚类的影响,和根据样本到微簇距离动态地对样本加权。离线阶段在密度峰值聚类的基础上设计基于最近邻域自适应的局部密度计算方法,降低密度峰值算分配阶段的“多米诺效应”影响。该方法能够进行复杂的数据处理,不受有限内存影响,有较好的鲁棒性。对人工数据集和真实数据集进行对比实验,实验结果表明该算法优于其他算法。所提出的鲁棒的密度峰值数据流动态聚类算法能给出更好的聚类效果。 展开更多
关键词 数据流 聚类 不均匀衰减策略 最近邻域 密度峰值
在线阅读 下载PDF
面向流形数据的测地距离与余弦互逆近邻密度峰值聚类算法 被引量:12
10
作者 赵嘉 王刚 +1 位作者 吕莉 樊棠怀 《电子学报》 EI CAS CSCD 北大核心 2022年第11期2730-2737,共8页
密度峰值聚类算法倾向在球形分布数据中选择密度峰值,而流形数据多呈非球形分布,导致不能准确找到数据的类簇中心.该算法的分配策略优先对类簇中心附近的样本进行链式分配,而流形数据大量样本远离其类簇中心,导致本应属于同一类簇的样... 密度峰值聚类算法倾向在球形分布数据中选择密度峰值,而流形数据多呈非球形分布,导致不能准确找到数据的类簇中心.该算法的分配策略优先对类簇中心附近的样本进行链式分配,而流形数据大量样本远离其类簇中心,导致本应属于同一类簇的样本被错误分配.为此,本文提出一种面向流形数据的测地距离与余弦互逆近邻密度峰值聚类算法.将K近邻与测地距离结合并重新定义局部密度,凸显密度峰值与非密度峰值的差异,准确找到类簇中心;将互逆近邻和余弦相似性相结合,得到基于余弦互逆近邻的样本相似度矩阵,为流形类簇准确分配样本.实验结果表明,本算法能有效发现流形数据集的几何形状并准确聚类,对真实数据集和图像数据集的聚类效果优秀. 展开更多
关键词 密度峰值 聚类 K近邻 互逆近邻 局部密度 分配策略
在线阅读 下载PDF
结合双树复小波变换和改进密度峰值快速搜索聚类的乳腺MR图像分割 被引量:13
11
作者 范虹 张程程 +2 位作者 侯存存 朱艳春 姚若侠 《电子学报》 EI CAS CSCD 北大核心 2019年第10期2149-2157,共9页
针对乳腺MR图像组织复杂、灰度不均匀、难分割的特点,本文提出双树复小波(DTCWT)变换结合密度聚类的图像分割方法.首先利用复小波域双变量模型结合各向异性扩散函数对图像进行去噪处理;进而通过简单线性迭代聚类(SLIC)算法将图像划分成... 针对乳腺MR图像组织复杂、灰度不均匀、难分割的特点,本文提出双树复小波(DTCWT)变换结合密度聚类的图像分割方法.首先利用复小波域双变量模型结合各向异性扩散函数对图像进行去噪处理;进而通过简单线性迭代聚类(SLIC)算法将图像划分成一定数量的超像素区域,根据事先设置的阈值搜索每个超像素的近邻,从而降低基于K近邻的密度峰值快速搜索聚类(KNN-DPC)算法寻找每个样本近邻的时间;最终,引入超像素区域的近邻信息度量样本密度,采用KNN-DPC算法的分配策略自适应聚类.仿真和临床数据分割结果表明,所提算法能有效的实现乳腺MR图像的分割. 展开更多
关键词 乳腺MR图像分割 双树复小波变换 双变量模型 超像素分类 密度峰值快速搜索聚类
在线阅读 下载PDF
基于密度峰值聚类算法的模态参数识别 被引量:10
12
作者 王飞宇 胡志祥 黄潇 《振动与冲击》 EI CSCD 北大核心 2019年第2期172-178,共7页
稀疏成分分析是解决欠定盲源分离问题的一种有效方法,其主要分为两步:计算振型矩阵和重构单模态信号。在计算振型矩阵时,针对无法预知源信号数量和高阶振动模态混叠的问题,利用一种基于密度峰值聚类算法识别模态振型。相比于传统的聚类... 稀疏成分分析是解决欠定盲源分离问题的一种有效方法,其主要分为两步:计算振型矩阵和重构单模态信号。在计算振型矩阵时,针对无法预知源信号数量和高阶振动模态混叠的问题,利用一种基于密度峰值聚类算法识别模态振型。相比于传统的聚类算法,该方法具有以下特点:①利用决策图直观地选出聚类中心和聚类数目;②算法可以自动分离噪声点,对噪声不敏感。在重构单模态信号时,利用可以快速重构稀疏信号的SL0算法,重构出单模态时频域信号,提取出各阶模态频率。通过振动结构仿真算例验证了该方法的有效性。 展开更多
关键词 模态分析 稀疏成分分析 密度峰值聚类(DPCA) SL0算法
在线阅读 下载PDF
基于密度峰值快速搜索聚类的多场景分布式电源规划 被引量:6
13
作者 武晓朦 时政 +3 位作者 付子义 刘欣雨 党建 李飞 《河南理工大学学报(自然科学版)》 CAS 北大核心 2022年第2期117-123,共7页
针对间歇性分布式电源出力的随机性、负荷需求的不确定性以及分布式电源与负荷之间存在相关性的问题,采用拉丁超立方抽样并结合Spearman秩相关系数的Cholesky分解,得到分布式电源具有相关性的出力与负荷需求样本。通过密度峰值快速搜索... 针对间歇性分布式电源出力的随机性、负荷需求的不确定性以及分布式电源与负荷之间存在相关性的问题,采用拉丁超立方抽样并结合Spearman秩相关系数的Cholesky分解,得到分布式电源具有相关性的出力与负荷需求样本。通过密度峰值快速搜索聚类算法对相关性样本进行有效削减得到典型场景,以分布式电源投资运行费用和配电网向上级电网购电费用最小为优化目标,建立分布式电源多目标规划模型。最后通过二阶锥松弛将规划模型转化为混合整数二阶锥规划问题,并调用Cplex求解器对规划模型求解。IEEE 33节点算例结果验证了所提模型的合理性。 展开更多
关键词 分布式电源规划 Spearman秩相关系数 密度峰值快速搜索聚类 二阶锥规划
在线阅读 下载PDF
基于密度峰值聚类优化的光伏发电功率预测 被引量:6
14
作者 王帅 杜欣慧 姚宏民 《现代电子技术》 北大核心 2018年第20期141-145,149,共6页
密度峰值聚类算法具有收敛速度快、鲁棒性强、无需人为确定最佳聚类数等特点,具备较好的应用前景。为提高光伏功率预测的精度,提出一种将密度峰值聚类算法应用于短期光伏功率预测的方法,并进行了必要优化。该方法首先通过类间距离优化... 密度峰值聚类算法具有收敛速度快、鲁棒性强、无需人为确定最佳聚类数等特点,具备较好的应用前景。为提高光伏功率预测的精度,提出一种将密度峰值聚类算法应用于短期光伏功率预测的方法,并进行了必要优化。该方法首先通过类间距离优化增强气象数据的可分性;然后利用密度峰值聚类对其进行无标签归类,通过灰色关联度匹配出与待预测日相关度最高的类别;最后将其作为Elman神经网络的训练样本,得到预测结果。Matlab仿真结果表明,该方法能够明显提高气象数据的聚类效果,并有效提高光伏功率的短期预测精度。 展开更多
关键词 密度峰值聚类 光伏发电 灰色关联度 相似日匹配 ELMAN神经网络 短期功率预测
在线阅读 下载PDF
基于快速密度峰值聚类离群因子的离群点检测算法 被引量:11
15
作者 张忠平 李森 +1 位作者 刘伟雄 刘书霞 《通信学报》 EI CSCD 北大核心 2022年第10期186-195,共10页
针对密度峰值聚类算法需要人工设置参数、时间复杂度高的问题,提出了基于快速密度峰值聚类离群因子的离群点检测算法。首先,使用k近邻算法代替密度峰值聚类中的密度估计,采用KD-Tree索引数据结构计算数据对象的k近邻;然后,采用密度和距... 针对密度峰值聚类算法需要人工设置参数、时间复杂度高的问题,提出了基于快速密度峰值聚类离群因子的离群点检测算法。首先,使用k近邻算法代替密度峰值聚类中的密度估计,采用KD-Tree索引数据结构计算数据对象的k近邻;然后,采用密度和距离乘积的方式自动选取聚类中心。此外,定义了向心相对距离、快速密度峰值聚类离群因子来刻画数据对象的离群程度。在人工数据集和真实数据集上对所提算法进行实验验证,并与一些经典和新颖的算法进行对比实验,从正确性和时间效率上验证了所提算法的有效性。 展开更多
关键词 数据挖掘 密度峰值聚类 离群点 K近邻 向心相对距离
在线阅读 下载PDF
基于密度峰值聚类的VRPTW问题研究 被引量:2
16
作者 吴斌 宋琰 +1 位作者 程晶 董敏 《工业工程》 北大核心 2020年第5期58-66,74,共10页
提出一种密度峰值聚类(density peak clustering,DPC)与遗传算法(genetic algorithm,GA)相结合的新型混合算法(density peak clustering with genetic algorithm,DGA),求解带时间窗的车辆路径问题。首先应用DPC对客户进行聚类以缩减问... 提出一种密度峰值聚类(density peak clustering,DPC)与遗传算法(genetic algorithm,GA)相结合的新型混合算法(density peak clustering with genetic algorithm,DGA),求解带时间窗的车辆路径问题。首先应用DPC对客户进行聚类以缩减问题规模,再将聚类后的客户用GA进行线路优化。结果表明:DGA在9个数据集上的平均值比模拟退火(simulated annealing,SA)和禁忌搜索(Tabu)分别提高了13.41%和4.7%,单个数据集最大提高了26.4%。这证明了该算法是求解车辆调度问题的高效算法。 展开更多
关键词 密度峰值聚类 VRPTW问题 车辆调度 遗传算法
在线阅读 下载PDF
汽车行驶轨迹数据密度峰值聚类算法研究 被引量:1
17
作者 江浩斌 路保松 李傲雪 《汽车工程》 EI CSCD 北大核心 2023年第7期1153-1162,共10页
随着物联网、V2X和智慧城市等技术的广泛应用,大量的车辆轨迹数据得以记录保留。利用这些轨迹数据可以提取相关信息,例如计算最优路径、检测异常驾驶行为、监测城市交通流量以及预测车辆下一个位置等,轨迹聚类是关键技术之一。密度峰值... 随着物联网、V2X和智慧城市等技术的广泛应用,大量的车辆轨迹数据得以记录保留。利用这些轨迹数据可以提取相关信息,例如计算最优路径、检测异常驾驶行为、监测城市交通流量以及预测车辆下一个位置等,轨迹聚类是关键技术之一。密度峰值聚类(density peaks clustering,DPC)作为一种简单有效的基于密度的聚类算法,算法中局部密度的定义未充分考虑数据样本密度分布不均时密度差异的影响,也没有适用于汽车行驶轨迹的相似性度量。此外,算法在遇到相对高维的数据时效果不佳。本文通过引入k近邻思想(k-nearest neighbor,KNN)和主成分分析法(principal component analysis,PCA)并且改进相似性度量,提出了一种适用于汽车行驶轨迹的密度峰值聚类算法。该算法首先使用PCA对高维数据进行预处理;然后采用k近邻思想重新定义局部密度;最后通过重新定义轨迹间的距离函数,摒弃了欧氏距离对分配策略的不良影响。通过对人工合成数据集的实验,证明了算法的可行性;同时算法的有效性也在实际汽车行驶轨迹数据上得到了验证。 展开更多
关键词 密度峰值聚类 汽车行驶轨迹数据 K近邻 主成分分析 相似性度量
在线阅读 下载PDF
一种基于密度峰值聚类的经典轨迹计算方法 被引量:3
18
作者 李旭东 成烽 《中国电子科学研究院学报》 北大核心 2019年第9期967-972,共6页
轨迹数据是一类重要的时空大数据,蕴含丰富的语义信息与行为模式。经典轨迹是群体轨迹移动时呈现出的相同或相似路径,在刻画海量轨迹时空特征、分析群体行为模式和预测移动对象路径等方面具有重要意义。本文提出了一种基于密度峰值聚类... 轨迹数据是一类重要的时空大数据,蕴含丰富的语义信息与行为模式。经典轨迹是群体轨迹移动时呈现出的相同或相似路径,在刻画海量轨迹时空特征、分析群体行为模式和预测移动对象路径等方面具有重要意义。本文提出了一种基于密度峰值聚类算法的经典轨迹计算框架,首先在相似性度量方面,采用并改进了顾及轨迹几何与方向的SSPD方法,然后在轨迹数据聚类方面,引入了密度峰值聚类方法,并使用其K近邻版本,以消除参数选择的不利影响,最后考虑到峰值点表征了具有最大局部密度的轨迹,直接将聚类中心作为经典轨迹输出。基于船舶轨迹的实验表明,本文方法可以有效从大规模轨迹中分析出经典轨迹,且同TRACLUS算法相比,输出的经典轨迹更为真实自然。 展开更多
关键词 轨迹数据 经典轨迹 相似度矩阵 密度峰值聚类 轨迹蔟
在线阅读 下载PDF
改进密度峰值聚类算法的财务数据分析 被引量:1
19
作者 李青 高飞 《西安工业大学学报》 CAS 2023年第1期74-80,共7页
为了提高财务数据分析的准确度。文中采用密度峰值聚类算法进行财务数据聚类分析,实现财务数据的深度分析。通过对财务数据样本进行特征提取,建立密度峰值聚类财务分析模型。根据密度峰值聚类的核函数计算密度值,对距离值和密度值按降... 为了提高财务数据分析的准确度。文中采用密度峰值聚类算法进行财务数据聚类分析,实现财务数据的深度分析。通过对财务数据样本进行特征提取,建立密度峰值聚类财务分析模型。根据密度峰值聚类的核函数计算密度值,对距离值和密度值按降序排序,选择较大值所对应的样本点作为若干聚类中心。通过计算各节点和各个聚类中心点的距离,根据设定的距离阈值来判定样本类别。为了防止距离阈值设置不合理而对聚类结果造成较大扰动,引入果蝇优化算法对距离阈值参数进行优化改进,通过果蝇群体对味道浓度的不断更新优化,获得最优适应度个体。采用经过果蝇优化算法优化后的密度峰值聚类算法完成聚类分析,获得财务数据聚类结果。实验结果表明:通过合理设置果蝇优化算法气味变化率范围等参数,对于6类行业样本的聚类准确率均超过了0.9。相比于常用财务数据分析聚类算法,经过果蝇优化算法改进的密度峰值聚类算法能够获得更高的聚类准确率和稳定性。 展开更多
关键词 财务数据 密度峰值聚类 果蝇算法 距离阈值
在线阅读 下载PDF
改进的密度峰值聚类算法的差分隐私保护方案
20
作者 葛丽娜 陈园园 +1 位作者 王捷 王哲 《郑州大学学报(工学版)》 CAS 北大核心 2023年第6期19-24,共6页
针对改进的密度峰值聚类(AdDPC)算法在计算局部密度时产生的隐私泄露问题以及算法的一次分配策略,提出一种改进的密度峰值聚类算法的差分隐私保护方案。该方案在算法计算局部密度的过程中添加Laplace随机噪声,使得即使攻击者拥有最大背... 针对改进的密度峰值聚类(AdDPC)算法在计算局部密度时产生的隐私泄露问题以及算法的一次分配策略,提出一种改进的密度峰值聚类算法的差分隐私保护方案。该方案在算法计算局部密度的过程中添加Laplace随机噪声,使得即使攻击者拥有最大背景知识,也无法通过添加或者删除数据集中的某一点来获取相应的信息,从而利用差分攻击获取目标数据点的信息,达到保护隐私数据的目的,并且在分配非聚类中心点时引入可达定义改进AdDPC算法的分配策略,避免因为一次分配策略导致数据点分配错误的问题。实验对比了DP-rcCFSFDP算法、AdAPC-rDP算法、IDP K-means算法的F-Measure和ARI,结果表明:当隐私预算大于1.5时,所提算法的F-Measure和ARI优于其他算法,所提算法能够在保护敏感数据的同时保证数据的可用性。 展开更多
关键词 密度峰值 差分隐私 随机噪声 聚类算法
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部