期刊文献+
共找到531篇文章
< 1 2 27 >
每页显示 20 50 100
改进的密度峰值聚类算法在岩体结构面优势分组中的应用
1
作者 王述红 高晨翔 侯钦宽 《东北大学学报(自然科学版)》 北大核心 2025年第3期130-137,共8页
岩体稳定性评价依赖于合理的结构面分组,但传统方法存在易受边缘点与异常点影响的弊端.为此,提出一种改进的密度峰值聚类算法用于结构面优势分组.首先,将结构面产状转换为空间坐标,并以单位法向量夹角正弦值的平方作为相似性度量.随后,... 岩体稳定性评价依赖于合理的结构面分组,但传统方法存在易受边缘点与异常点影响的弊端.为此,提出一种改进的密度峰值聚类算法用于结构面优势分组.首先,将结构面产状转换为空间坐标,并以单位法向量夹角正弦值的平方作为相似性度量.随后,基于有效性评价指标构建目标函数,并利用乌鸦算法优化截断距离以获取最佳分组结果.通过模拟数据集验证了该算法能够有效减少人为干预,避免异常点干扰,确保聚类结果更加可靠和合理.结果表明,所提方法不仅与传统方法一致性良好,还具有更高的适用性,为工程中结构面优势分组提供了可靠的参考. 展开更多
关键词 密度峰值 乌鸦算法 有效性评价指标 结构面 优势分组
在线阅读 下载PDF
逆近邻和加权相似性的密度峰值聚类算法
2
作者 景彦迪 康平 +1 位作者 侯家振 吕莉 《小型微型计算机系统》 北大核心 2025年第8期1927-1934,共8页
密度峰值聚类算法在处理密度分布不均数据时,定义的局部密度未能考虑样本所在区域密度差异的影响,导致错误识别类簇中心;在处理流形数据时,设定的分配策略依据欧氏距离进行链式分配,极易导致稀疏类簇的样本误归并给密集类簇.鉴于此,提... 密度峰值聚类算法在处理密度分布不均数据时,定义的局部密度未能考虑样本所在区域密度差异的影响,导致错误识别类簇中心;在处理流形数据时,设定的分配策略依据欧氏距离进行链式分配,极易导致稀疏类簇的样本误归并给密集类簇.鉴于此,提出逆近邻和加权相似性的密度峰值聚类(DPC-NWS)算法.算法设置局部密度时,引入逆近邻思想,充分考虑样本k近邻和非k近邻对样本周围环境的影响,能更容易在稀疏类簇找到类簇中心;在剩余样本分配时,使用自然近邻和共享近邻设定样本间的相似性,新定义的样本相似性更加符合样本的实际分布,避免了样本的连续错误分配,达到正确分配的目的.将DPC-NWS算法与DPC、FNDPC、DPC-CE、DPC-DBFN、IDPC-FA算法在数据集上进行聚类,对比实验结果表明,DPC-NWS算法的聚类效果好. 展开更多
关键词 密度峰值 逆近邻 自然近邻 共享近邻
在线阅读 下载PDF
面向混合数据的对称邻域和微簇合并密度峰值聚类算法
3
作者 陈威 吕莉 +2 位作者 肖人彬 谭德坤 潘正祥 《智能系统学报》 北大核心 2025年第1期172-184,共13页
混合数据是指包含密度分布不均和流形特征的数据集。密度峰值聚类算法局部密度定义方式易忽略密度分布不均数据集类簇间样本的疏密差异,导致误选聚类中心;分配策略依据欧氏距离进行样本分配,不适用于流形数据集同一类簇样本相距较远的情... 混合数据是指包含密度分布不均和流形特征的数据集。密度峰值聚类算法局部密度定义方式易忽略密度分布不均数据集类簇间样本的疏密差异,导致误选聚类中心;分配策略依据欧氏距离进行样本分配,不适用于流形数据集同一类簇样本相距较远的情况,致使样本被错误分配。针对这些问题,本文提出一种面向混合数据的对称邻域和微簇合并密度峰值聚类算法。该算法引入对称邻域概念,采用对数倒数累加方法重新定义局部密度,有效提升了聚类中心的识别度;同时,提出了一种基于密度差的微簇个数选取方法,使微簇个数的选取处于合理范围;此外,设计了一种微簇间相似性度量方法进行微簇合并,避免了分配时产生的连带错误。实验表明,相较于对比算法,本文算法在混合数据集、UCI数据集和图像数据集上均取得较好的聚类效果。 展开更多
关键词 密度峰值 密度分布不均 流形数据 K近邻 逆近邻 对称邻域 微簇间相似性 微簇合并
在线阅读 下载PDF
基于高斯分布的自适应密度峰值聚类算法
4
作者 李启文 王治和 +1 位作者 杜辉 鲁德鹏 《计算机工程》 北大核心 2025年第4期137-148,共12页
密度峰值聚类(DPC)算法可以发现任意形状的簇,对噪声具有鲁棒性,因此被广泛应用于各个领域。但DPC算法需要人工选取聚类中心,对于密度不均匀型数据集表现较差。为此,提出一种基于高斯分布的自适应密度峰值聚类算法。首先,计算局部密度... 密度峰值聚类(DPC)算法可以发现任意形状的簇,对噪声具有鲁棒性,因此被广泛应用于各个领域。但DPC算法需要人工选取聚类中心,对于密度不均匀型数据集表现较差。为此,提出一种基于高斯分布的自适应密度峰值聚类算法。首先,计算局部密度和相对距离的乘积θ_(i),通过Z-score标准化方法,将θ_(i)映射到符合高斯分布的二维空间中,利用高斯分布的标准偏差来自适应选取聚类中心,得到聚类中心集合;其次,将其余数据点分配到离其最近的聚类中心所在的簇中,得到初步划分结果;最后,设计缝合因子模型,计算簇间缝合系数,当缝合系数大于阈值时合并初步划分结果中最相似簇并更新相似度矩阵,直至完成合并得到最终结果。在人工数据集和真实数据集上的实验结果表明,与DBSCAN算法、DPC算法和ICKDC算法对比,所提算法的聚类准确度更高,聚类性能更佳。 展开更多
关键词 密度峰值算法 高斯分布 Z-score标准化 缝合因子 簇间相似度
在线阅读 下载PDF
面向簇间密度不均匀数据的密度峰值聚类优化算法
5
作者 胡文琪 李永博 +1 位作者 王晓彤 孟路稳 《统计与决策》 北大核心 2025年第4期51-56,共6页
针对簇间密度具有较大差异的数据集,密度峰值聚类算法对这类数据集聚类效果不理想的问题,文章从类簇中心的选取和剩余样本的分配两个方面进行优化,提出一种面向簇间密度不均匀数据的密度峰值聚类优化算法。先在定义样本点的局部密度时引... 针对簇间密度具有较大差异的数据集,密度峰值聚类算法对这类数据集聚类效果不理想的问题,文章从类簇中心的选取和剩余样本的分配两个方面进行优化,提出一种面向簇间密度不均匀数据的密度峰值聚类优化算法。先在定义样本点的局部密度时引入K近邻思想,充分考虑样本的空间分布特征,均衡簇间密度差异较大的数据集中样本之间的密度差距,从而提高类簇中心选择的准确性;再对K近邻、自然近邻和共享近邻信息进行混合加权,构造样本的加权相似性,加强同一类簇中样本点之间的关联性,以实现对簇间密度不均匀数据集中剩余样本的正确分配。与DPC、K-means、DBSCAN算法的对比实验结果表明,所提算法对簇间密度差异较大的数据集有较好的聚类效果。 展开更多
关键词 密度峰值 K近邻 混合近邻 样本相似性
在线阅读 下载PDF
基于稀疏张量补全与密度峰值聚类的低空智能网多辐射源定位算法
6
作者 陈智博 郭道省 《电子与信息学报》 北大核心 2025年第5期1310-1321,共12页
该文聚焦于低空智能网中多辐射源的定位技术研究,旨在利用搭载频谱监测设备的无人机采集的信号强度数据,精确解析低空目标区域内多个未知辐射源的空间位置。然而,实际应用场景面临多重挑战:无人机飞行轨迹受限导致测量数据稀疏;环境噪... 该文聚焦于低空智能网中多辐射源的定位技术研究,旨在利用搭载频谱监测设备的无人机采集的信号强度数据,精确解析低空目标区域内多个未知辐射源的空间位置。然而,实际应用场景面临多重挑战:无人机飞行轨迹受限导致测量数据稀疏;环境噪声及阴影衰落加剧数据波动;多个未知辐射源进一步加重了算法的复杂度,严重阻碍了现有低空多辐射源定位(MSL)技术的效能发挥。针对上述挑战,该文创新性地提出了一种基于稀疏张量补全与密度峰值聚类的低空智能网多辐射源定位算法。该算法将多辐射源定位问题解构为两个核心步骤:稀疏张量补全和张量密度峰值检测。具体而言,首先根据无人机的飞行轨迹将稀疏测量数据构建为3维稀疏张量,随后采用卷积自编码器网络对该张量进行高效补全,以复原目标空间内的完整信号强度张量图谱。在此基础上,利用改进的密度峰值聚类算法搜索张量中的密度峰值中心,从而实现多辐射源的精确定位。仿真结果表明,本文提出的算法能够有效利用稀疏测量数据对低空多辐射源进行定位,克服了因环境噪声带来的异常值影响,且展现出对辐射源数量的鲁棒性,为低空智能网中的多辐射源定位问题提供了有效的解决方案。 展开更多
关键词 低空智能网 多辐射源定位 张量补全 卷积自编码器 密度峰值
在线阅读 下载PDF
基于邻域标准差的密度调整谱聚类算法
7
作者 郭笑雨 刘金金 +3 位作者 陈亚军 李豪杰 袁培燕 赵晓焱 《工程科学与技术》 北大核心 2025年第2期40-53,共14页
针对谱聚类在尺度参数计算时需要人为设置近邻参数及聚类结果不稳定等问题,本文将初始类中心值和尺度参数作为决策变量,重点对谱聚类算法进行自适应优化与改进。首先,将样本邻域标准差的倒数作为度量样本局部密度的参数,与密度峰值思想... 针对谱聚类在尺度参数计算时需要人为设置近邻参数及聚类结果不稳定等问题,本文将初始类中心值和尺度参数作为决策变量,重点对谱聚类算法进行自适应优化与改进。首先,将样本邻域标准差的倒数作为度量样本局部密度的参数,与密度峰值思想相结合,设计了一种基于密度峰值的初始类中心决策值选择方法(initial class center decision value algorithm based on density peak,DP_KD),解决密度调整谱聚类中聚类结果不稳定的问题。其次,利用样本间的平均距离计算相应的邻域半径,并根据样本标准差自适应地求解每个样本的尺度参数,构造样本间的相似度矩阵,实现了近邻参数的自适应设置,解决尺度参数需要人为设置的问题。然后,基于优化后的初始类中心决策值和近邻参数方法,进一步调整高斯核函数,提出一种基于邻域标准差的密度调整谱聚类算法(density adjusted spectral clustering algorithm based on neighborhood standard deviation,DSSD),通过构建特征向量空间实现了密度谱聚类。最后,将提出的算法与其他聚类算法在多个数据集上进行了对比。结果表明,与其他谱聚类算法相比,本文提出的DSSD算法不仅具有更好的聚类效果,且聚类结果更加稳定,尤其是在类内密集且类间边缘明确的DIM512数据集中,DSSD算法可以正确地进行聚类分簇;在准确率、兰德系数和F-measure上较其他算法至少提升了0.0268、0.0136和0.0247,这表明DSSD算法不仅聚类效果较好且更适合大规模数据集的聚类分析。 展开更多
关键词 密度调整 邻域标准差 自适应 密度峰值
在线阅读 下载PDF
面向密度分布不均数据的加权逆近邻密度峰值聚类算法 被引量:2
8
作者 吕莉 陈威 +2 位作者 肖人彬 韩龙哲 谭德坤 《智能系统学报》 CSCD 北大核心 2024年第1期165-175,共11页
针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首... 针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首先在局部密度公式中引入基于sigmoid函数的权重系数,增加稀疏区域样本的权重,结合逆近邻思想,重新定义了样本的局部密度,有效提升类簇中心的识别率;其次,引入改进的样本相似度策略,利用样本间的逆近邻及共享逆近邻信息,使得同一类簇样本间具有较高的相似度,可有效改善稀疏区域样本分配错误的问题。在密度分布不均、复杂形态和UCI数据集上的对比实验表明,本文算法的聚类效果优于IDPC-FA、FNDPC、FKNN-DPC、DPC和DPCSA算法。 展开更多
关键词 密度峰值 密度分布不均 逆近邻 共享逆近邻 样本相似度 局部密度 分配策略 数据挖掘
在线阅读 下载PDF
面向密度分布不均数据的混合近邻密度峰值聚类算法 被引量:3
9
作者 吕莉 朱梅子 +1 位作者 康平 韩龙哲 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第10期1821-1830,共10页
密度峰值聚类算法(DPC)的局部密度忽略了密度分布不均数据的疏密差异,易导致类簇中心聚集在密集区域;其分配策略在分配剩余样本时,易将稀疏区域样本错误分配到密集区域,致使聚类效果不佳.为克服上述缺陷,本文提出了面向密度分布不均数... 密度峰值聚类算法(DPC)的局部密度忽略了密度分布不均数据的疏密差异,易导致类簇中心聚集在密集区域;其分配策略在分配剩余样本时,易将稀疏区域样本错误分配到密集区域,致使聚类效果不佳.为克服上述缺陷,本文提出了面向密度分布不均数据的混合近邻密度峰值聚类(MN-DPC)算法.首先,利用自然近邻信息定义样本的局部密度,平衡稀疏区域与密集区域样本之间的密度差异,从而正确找到稀疏区域的类簇中心;其次,利用样本之间的共享及自然近邻信息对样本相似度进行加权处理,加强了同一类簇样本间的相似度,有效的避免稀疏区域样本被错误分配.本文将MN-DPC算法与IDPC-FA,DPC-DBFN,DPCSA,FNDPC,FKNN-DPC,DPC算法进行对比.实验结果表明,MN-DPC算法能有效聚类密度分布不均及UCI数据集. 展开更多
关键词 密度峰值 局部密度 自然近邻 共享近邻 样本相似性
在线阅读 下载PDF
局部标准差优化的密度峰值聚类算法 被引量:2
10
作者 谢娟英 张文杰 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期47-62,共16页
密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密... 密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。 展开更多
关键词 密度峰值 标准差 局部密度 分配策略
在线阅读 下载PDF
基于反向最近邻的密度估计聚类算法
11
作者 许梅梅 侯新民 《计算机工程与应用》 北大核心 2025年第1期165-173,共9页
基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类... 基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类算法(RNN-DEC)。该算法引入反向最近邻来计算数据点的局部密度,将数据点分成强点、弱点和噪声点。使用强点构建聚类算法的骨架,通过软投票的方式将弱点分配到与其相似度最高的簇中去。提出了一种基于反向最近邻的簇融合算法,将相似度高的子簇融合,得到最终的聚类结果。实验结果表明,在一些合成数据集和UCI真实数据集上,相比较于其他经典算法,该算法具有更好的聚类效果。 展开更多
关键词 反向最近邻 局部密度 密度算法 子簇融合
在线阅读 下载PDF
基于网格近邻优化的密度峰值聚类算法 被引量:2
12
作者 刘继 杨金瑞 《计算机应用研究》 CSCD 北大核心 2024年第4期1058-1063,共6页
密度峰值聚类(DPC)将数据样本点的局部密度和相对距离进行结合,能对任意形状数据集进行聚类处理,但密度峰值聚类算法存在主观选择截断距离、简单分配策略和较高时间复杂度等问题。为此,提出了一种基于网格近邻优化的密度峰值聚类算法(KG... 密度峰值聚类(DPC)将数据样本点的局部密度和相对距离进行结合,能对任意形状数据集进行聚类处理,但密度峰值聚类算法存在主观选择截断距离、简单分配策略和较高时间复杂度等问题。为此,提出了一种基于网格近邻优化的密度峰值聚类算法(KG-DPC算法)。首先对数据空间进行网格化,减少了样本数据点之间距离的计算量;在计算局部密度时不仅考虑了网格自身的密度值,而且考虑了周围k个近邻的网格密度值,降低了主观选择截断距离对聚类结果的影响,提高了聚类准确率,设定网格密度阈值,保证了聚类结果的稳定性。通过实验结果表明,KG-DPC算法比DBSCAN、DPC和SDPC算法在聚类准确率上有很大提升,在聚类平均消耗时间上DPC、SNN-DPC和DPC-NN算法分别降低38%、44%和44%。在保证基本聚类准确率的基础上,KG-DPC算法在聚类效率上有特定优势。 展开更多
关键词 密度峰值 密度阈值 网格 近邻优化
在线阅读 下载PDF
面向流形数据的加权自然近邻密度峰值聚类算法
13
作者 赵嘉 马清 +3 位作者 陈蔚昌 肖人彬 崔志华 潘正祥 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期652-660,669,共10页
流形数据由一些弧线形类簇组成,其特点是同一类簇的样本间距离较大.密度峰值聚类(DPC)算法具有简单高效的特点,但应对流形数据时表现不佳. DPC算法的两种密度度量标准可能造成不同程度的信息缺失,其分配策略仅参考距离和密度,致使聚类... 流形数据由一些弧线形类簇组成,其特点是同一类簇的样本间距离较大.密度峰值聚类(DPC)算法具有简单高效的特点,但应对流形数据时表现不佳. DPC算法的两种密度度量标准可能造成不同程度的信息缺失,其分配策略仅参考距离和密度,致使聚类精度不高.提出面向流形数据的加权自然近邻DPC(DPC-WNNN)算法,定义样本局部密度时,综合分析样本的局部和全局信息,引入加权的自然近邻以及逆近邻来应对高斯核或截断核的信息缺失问题.设计样本分配策略时通过引入共享近邻和共享逆近邻计算样本相似度,弥补DPC算法空间因素缺失的问题.将DPC-WNNN算法在流形数据集和真实数据集上与7种类似算法进行比较,结果表明该算法能更有效地找到类簇的中心点并准确分配样本,表现出良好的聚类性能. 展开更多
关键词 密度峰值 流形数据 自然近邻
在线阅读 下载PDF
基于角度分段线性近似和改进密度峰值聚类的户变关系识别
14
作者 赵耀 付皖皖 +1 位作者 陈冉 张涛 《电力科学与技术学报》 北大核心 2025年第1期113-125,共13页
为解决因排查效率低、数据更新不及时等因素导致低压配电网户变关系连接形式与实际不符的问题,提出一种基于角度分段线性近似(anglepiecewiselinearrepresentation,APLR)和改进密度峰值聚类(improved clustering by fast search find of... 为解决因排查效率低、数据更新不及时等因素导致低压配电网户变关系连接形式与实际不符的问题,提出一种基于角度分段线性近似(anglepiecewiselinearrepresentation,APLR)和改进密度峰值聚类(improved clustering by fast search find of density peaks,ICFSFDP)相结合的户变关系识别方法。首先,根据电压曲线中相邻线段的角度变化量提取曲线的转折点,利用APLR对曲线进行自适应降维重构;随后,使用ICFSFDP算法对降维数据组展开聚类分析,在决策图中由拟合函数与坐标轴围成面积的最小值得到最优类簇数目,进而得到聚类和非聚类中心用户;最后,使用动态时间弯曲(dynamic time warping,DTW)距离计算聚类和非聚类中心用户之间的距离相似度,进而得到户变关系。将所提方法应用于模拟和真实数据中,均可证实所提方法的有效性。算例分析结果表明:该方法能够对时间间隔不同、不等维的序列进行分析,且不需要人为设定聚类算法的参数,户变关系识别准确率高。 展开更多
关键词 配电网 户变关系 改进分段线性近似 动态时间弯曲距离 最小面积法 密度峰值
在线阅读 下载PDF
基于共享最近邻的自适应密度峰值聚类算法 被引量:1
15
作者 王心耕 杜韬 +2 位作者 周劲 陈迪 仵匀政 《计算机科学》 CSCD 北大核心 2024年第8期97-105,共9页
密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分... 密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分配样本点时易出现连锁反应这3个缺陷,提出一种基于共享最近邻的自适应密度峰值聚类算法。首先,利用共享最近邻重新定义局部密度等度量值,充分考虑了数据分布的局部特点,使样本点的空间分布特征得以更好地体现;其次,通过引入密度衰减现象让样本点自动聚集成微簇,实现了簇个数自适应确定和簇中心自适应选取;最后,提出一种两阶段的分配方法,先将微簇合并形成簇的主干部分,再用上一步分配好的簇主干指导剩余点的分配,避免了链式反应的发生。在二维合成数据集以及UCI数据集上的实现表明,相较于经典的密度峰值聚类算法及近年来对其提出的改进算法,在大多数情况下,所提算法表现出更优异的性能。 展开更多
关键词 共享最近邻 密度峰值 分配策略 中心 密度衰减
在线阅读 下载PDF
基于共享邻近度和概率分配的密度峰值聚类算法 被引量:2
16
作者 朱鸿祥 吴根秀 王兆辉 《计算机工程与应用》 CSCD 北大核心 2024年第12期74-90,共17页
针对密度峰值聚类(DPC)算法难以准确找到流形数据的类簇中心以及剩余样本点分配过程易发生连带错误等问题,提出了一种基于共享邻近度和概率分配的密度峰值聚类(SP-DPC)算法。基于K近邻和共享K近邻定义了样本点间的共享邻近度,使用共享... 针对密度峰值聚类(DPC)算法难以准确找到流形数据的类簇中心以及剩余样本点分配过程易发生连带错误等问题,提出了一种基于共享邻近度和概率分配的密度峰值聚类(SP-DPC)算法。基于K近邻和共享K近邻定义了样本点间的共享邻近度,使用共享邻近度重新定义了样本点的局部密度,从而找到正确的类簇中心;利用样本点的K近邻信息,提出传递概率分配策略和证据概率分配策略共同优化剩余样本点的分配,从而避免分配连带错误;在17个合成数据集和12个UCI数据集上进行实验,将SP-DPC算法与DPC算法、SKM-DPC算法、DPC-NN算法、DBSCAN算法、K-means算法进行对比,实验结果表明SP-DPC算法在AMI、ARI、FMI这3个评价指标上整体取得了相对最优值,聚类效果优于其他对比算法。 展开更多
关键词 密度峰值 K近邻 共享邻近度 概率分配 证据理论
在线阅读 下载PDF
基于类簇合并的无参数密度峰值聚类算法 被引量:1
17
作者 刘天娇 王胜景 袁永生 《现代电子技术》 北大核心 2024年第8期1-8,共8页
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚... 密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。 展开更多
关键词 分析 密度峰值算法 初始 簇合并 相似度 性能
在线阅读 下载PDF
基于K互近邻与核密度估计的DPC算法 被引量:1
18
作者 周玉 夏浩 +1 位作者 刘虹瑜 白磊 《北京航空航天大学学报》 北大核心 2025年第6期1978-1990,共13页
快速搜索和发现密度峰值聚类(DPC)算法是一种基于密度的聚类算法。该算法不需要迭代和过多的设定参数,但由于计算局部密度时没有考虑数据的局部结构,导致无法识别簇密度小的聚类中心。针对此问题,提出基于K互近邻(KN)和核密度估计(KDE)... 快速搜索和发现密度峰值聚类(DPC)算法是一种基于密度的聚类算法。该算法不需要迭代和过多的设定参数,但由于计算局部密度时没有考虑数据的局部结构,导致无法识别簇密度小的聚类中心。针对此问题,提出基于K互近邻(KN)和核密度估计(KDE)的DPC(KKDPC)算法。通过K近邻和核密度估计方法得到数据点的K互近邻数量和局部核密度;将K互近邻数量与局部核密度进行加和获得新的局部密度;根据数据点的局部密度得到相对距离,并通过构建决策图选取聚类中心及分配非中心点。利用人工数据集和真实数据集进行实验,并与DPC、基于密度的噪声空间聚类应用(DBSCAN)、K-means、模糊C均值聚类算法(FCM)、基于K近邻的DPC(DPCKNN)、近邻优化DPC(DPC-NNO)、基于模糊加权共享邻居的DPC(DPC-FWSN)算法进行对比。通过计算调整互信息(AMI)、调整兰德指数(ARI)、归一化互信息(NMI)来验证KKDPC算法的性能。实验结果表明:KKDPC算法能更加准确地识别聚类中心,有效地提高聚类精度。 展开更多
关键词 算法 密度峰值 K近邻 K互近邻 密度估计
在线阅读 下载PDF
基于人工鱼群的自适应密度峰值聚类算法 被引量:1
19
作者 何凯琳 张正军 +1 位作者 位雅 唐莉 《计算机工程与设计》 北大核心 2024年第1期110-119,共10页
针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,... 针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,根据两个相邻簇的簇间边界区域密度与簇平均密度构造簇间合并规则,利用人工鱼群算法寻找使改进轮廓系数指标达到最大值时的最优截断距离d_(c)。在合成数据集和真实数据集上的实验结果表明,AFSADPC算法具有较好的聚类效果。 展开更多
关键词 密度峰值 算法 人工鱼群算法 截断距离 幂律分布 簇合并策略 轮廓系数
在线阅读 下载PDF
融合优化可调Q因子小波变换的改进密度峰值聚类算法 被引量:1
20
作者 史曼曼 宋朝炀 张景祥 《计算机应用研究》 CSCD 北大核心 2024年第2期466-472,共7页
为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化... 为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化选择策略及改进粒子群优化算法确定的最佳Q因子分解时序信号,通过最优特征子带的能量、均值、标准差和模糊熵构建特征子空间,并采用主成分分析降低特征维度,以减少特征冗余。同时,考虑到距离较远而周围密集程度较大的K近邻样本对局部密度的贡献率,引入权重系数及K近邻重新定义DPC的局部密度,并利用共享最近邻描述样本间的相似性。在BONN癫痫脑电信号和CWRU滚动轴承数据集上进行对比实验,结果表明,该算法的聚类精度分别为95%、94%,且Jacarrd、FMI和F_(1)值指标均优于其他对比算法,证明了OTQWT-IDPC算法的有效性。 展开更多
关键词 密度峰值算法 可调Q因子小波变换 粒子群优化算法 主成分分析
在线阅读 下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部