期刊文献+
共找到597篇文章
< 1 2 30 >
每页显示 20 50 100
密度峰值快速聚类算法优化研究 被引量:3
1
作者 王鹏飞 杨余旺 柯亚琪 《计算机工程与科学》 CSCD 北大核心 2018年第8期1503-1510,共8页
密度峰值快速搜索聚类CFSFDP算法选择聚类中心时需要通过人工在决策图中选择,且最后进行簇核心与簇光晕划分时会将簇的一些边缘部分划入簇光晕中,导致划分结果不够合理。针对以上问题,提出一种聚类中心自动选择及簇核心与簇光晕分割优... 密度峰值快速搜索聚类CFSFDP算法选择聚类中心时需要通过人工在决策图中选择,且最后进行簇核心与簇光晕划分时会将簇的一些边缘部分划入簇光晕中,导致划分结果不够合理。针对以上问题,提出一种聚类中心自动选择及簇核心与簇光晕分割优化的聚类算法。利用异常检测的思想,寻找簇中心权值的异常点,将异常点作为各簇的聚类中心;引入簇内局部密度,实现对簇核心与簇光晕更合理的分割。通过实验对比,本文提出的算法自动化效果优于CFSFDP算法且得到的聚类结果更为精确。 展开更多
关键词 密度峰值 异常检测 簇中心点
在线阅读 下载PDF
基于谱分析的密度峰值快速聚类算法
2
作者 韩忠华 毕开元 +1 位作者 司雯 吕哲 《计算机应用》 CSCD 北大核心 2019年第2期409-413,共5页
针对密度峰值快速聚类(CFSFDP)算法对不同数据集聚类效果的差异,利用谱聚类对密度峰值快速聚类算法加以改进,提出了一种基于谱分析的密度峰值快速聚类算法CFSFDP-SA。首先,将高维非线性的数据集映射到低维子空间上实现降维处理,将聚类... 针对密度峰值快速聚类(CFSFDP)算法对不同数据集聚类效果的差异,利用谱聚类对密度峰值快速聚类算法加以改进,提出了一种基于谱分析的密度峰值快速聚类算法CFSFDP-SA。首先,将高维非线性的数据集映射到低维子空间上实现降维处理,将聚类问题转化为图的最优划分问题以增强算法对数据全局结构的适应性;然后,利用CFSFDP算法对处理后的数据集进行聚类。结合这两种聚类算法各自的优势,能进一步提升聚类算法的性能。在5个人工合成数据集(2个线性数据集和3个非线性数据集)与4个UCI数据库中真实数据集上的聚类结果显示,相比CFSFDP算法,CFSFDP-SA算法的聚类精度有一定提升,在高维数据集的聚类精度上最多提高了14%,对原始数据集的适应性更强。 展开更多
关键词 数据 适应性 降维 密度峰值快速 谱分析
在线阅读 下载PDF
改进的密度峰值聚类算法在岩体结构面优势分组中的应用
3
作者 王述红 高晨翔 侯钦宽 《东北大学学报(自然科学版)》 北大核心 2025年第3期130-137,共8页
岩体稳定性评价依赖于合理的结构面分组,但传统方法存在易受边缘点与异常点影响的弊端.为此,提出一种改进的密度峰值聚类算法用于结构面优势分组.首先,将结构面产状转换为空间坐标,并以单位法向量夹角正弦值的平方作为相似性度量.随后,... 岩体稳定性评价依赖于合理的结构面分组,但传统方法存在易受边缘点与异常点影响的弊端.为此,提出一种改进的密度峰值聚类算法用于结构面优势分组.首先,将结构面产状转换为空间坐标,并以单位法向量夹角正弦值的平方作为相似性度量.随后,基于有效性评价指标构建目标函数,并利用乌鸦算法优化截断距离以获取最佳分组结果.通过模拟数据集验证了该算法能够有效减少人为干预,避免异常点干扰,确保聚类结果更加可靠和合理.结果表明,所提方法不仅与传统方法一致性良好,还具有更高的适用性,为工程中结构面优势分组提供了可靠的参考. 展开更多
关键词 密度峰值 乌鸦算法 有效性评价指标 结构面 优势分组
在线阅读 下载PDF
逆近邻和加权相似性的密度峰值聚类算法
4
作者 景彦迪 康平 +1 位作者 侯家振 吕莉 《小型微型计算机系统》 北大核心 2025年第8期1927-1934,共8页
密度峰值聚类算法在处理密度分布不均数据时,定义的局部密度未能考虑样本所在区域密度差异的影响,导致错误识别类簇中心;在处理流形数据时,设定的分配策略依据欧氏距离进行链式分配,极易导致稀疏类簇的样本误归并给密集类簇.鉴于此,提... 密度峰值聚类算法在处理密度分布不均数据时,定义的局部密度未能考虑样本所在区域密度差异的影响,导致错误识别类簇中心;在处理流形数据时,设定的分配策略依据欧氏距离进行链式分配,极易导致稀疏类簇的样本误归并给密集类簇.鉴于此,提出逆近邻和加权相似性的密度峰值聚类(DPC-NWS)算法.算法设置局部密度时,引入逆近邻思想,充分考虑样本k近邻和非k近邻对样本周围环境的影响,能更容易在稀疏类簇找到类簇中心;在剩余样本分配时,使用自然近邻和共享近邻设定样本间的相似性,新定义的样本相似性更加符合样本的实际分布,避免了样本的连续错误分配,达到正确分配的目的.将DPC-NWS算法与DPC、FNDPC、DPC-CE、DPC-DBFN、IDPC-FA算法在数据集上进行聚类,对比实验结果表明,DPC-NWS算法的聚类效果好. 展开更多
关键词 密度峰值 逆近邻 自然近邻 共享近邻
在线阅读 下载PDF
面向混合数据的对称邻域和微簇合并密度峰值聚类算法
5
作者 陈威 吕莉 +2 位作者 肖人彬 谭德坤 潘正祥 《智能系统学报》 北大核心 2025年第1期172-184,共13页
混合数据是指包含密度分布不均和流形特征的数据集。密度峰值聚类算法局部密度定义方式易忽略密度分布不均数据集类簇间样本的疏密差异,导致误选聚类中心;分配策略依据欧氏距离进行样本分配,不适用于流形数据集同一类簇样本相距较远的情... 混合数据是指包含密度分布不均和流形特征的数据集。密度峰值聚类算法局部密度定义方式易忽略密度分布不均数据集类簇间样本的疏密差异,导致误选聚类中心;分配策略依据欧氏距离进行样本分配,不适用于流形数据集同一类簇样本相距较远的情况,致使样本被错误分配。针对这些问题,本文提出一种面向混合数据的对称邻域和微簇合并密度峰值聚类算法。该算法引入对称邻域概念,采用对数倒数累加方法重新定义局部密度,有效提升了聚类中心的识别度;同时,提出了一种基于密度差的微簇个数选取方法,使微簇个数的选取处于合理范围;此外,设计了一种微簇间相似性度量方法进行微簇合并,避免了分配时产生的连带错误。实验表明,相较于对比算法,本文算法在混合数据集、UCI数据集和图像数据集上均取得较好的聚类效果。 展开更多
关键词 密度峰值 密度分布不均 流形数据 K近邻 逆近邻 对称邻域 微簇间相似性 微簇合并
在线阅读 下载PDF
基于改进密度峰值聚类算法的典型负荷曲线提取
6
作者 彭晓璐 王涛 +3 位作者 卢泽钰 廉杰 赵斌 张谦 《南方电网技术》 北大核心 2025年第9期150-161,共12页
针对现有聚类算法在提取典型负荷曲线时存在的非凸簇识别能力不足和参数敏感性等问题,提出基于改进密度峰值聚类(density peak clustering,DPC)算法的典型负荷曲线提取方法。首先,提出基于局部密度和相对距离的自适应聚类中心选取方法,... 针对现有聚类算法在提取典型负荷曲线时存在的非凸簇识别能力不足和参数敏感性等问题,提出基于改进密度峰值聚类(density peak clustering,DPC)算法的典型负荷曲线提取方法。首先,提出基于局部密度和相对距离的自适应聚类中心选取方法,解决传统DPC算法人为选择聚类中心的主观不确定性问题;其次,定义聚类交叉密度和聚类边界密度两个新参数,提出初始聚类校正策略,有效解决非聚类中心点的分配连带错误问题。通过6个二维数据集、4个多维数据集和1个实际REFIT电气负载测量数据集的对比实验表明,所提改进DPC算法在准确率(ACC)、调整兰德指数(ARI)和Fowlkes-Mallows指数(FMI)3个评价指标上均优于传统DPC、K-means和DBSCAN算法,其中ACC、ARI和FMI平均提升25.40%、46.92%和21.83%。算例结果表明,所提改进DPC算法提取的典型负荷曲线更具代表性,可为电力系统灵活性资源优化调控提供更精准的数据支撑。 展开更多
关键词 负荷 改进DPC算法 交叉密度 边界密度
在线阅读 下载PDF
基于高斯分布的自适应密度峰值聚类算法
7
作者 李启文 王治和 +1 位作者 杜辉 鲁德鹏 《计算机工程》 北大核心 2025年第4期137-148,共12页
密度峰值聚类(DPC)算法可以发现任意形状的簇,对噪声具有鲁棒性,因此被广泛应用于各个领域。但DPC算法需要人工选取聚类中心,对于密度不均匀型数据集表现较差。为此,提出一种基于高斯分布的自适应密度峰值聚类算法。首先,计算局部密度... 密度峰值聚类(DPC)算法可以发现任意形状的簇,对噪声具有鲁棒性,因此被广泛应用于各个领域。但DPC算法需要人工选取聚类中心,对于密度不均匀型数据集表现较差。为此,提出一种基于高斯分布的自适应密度峰值聚类算法。首先,计算局部密度和相对距离的乘积θ_(i),通过Z-score标准化方法,将θ_(i)映射到符合高斯分布的二维空间中,利用高斯分布的标准偏差来自适应选取聚类中心,得到聚类中心集合;其次,将其余数据点分配到离其最近的聚类中心所在的簇中,得到初步划分结果;最后,设计缝合因子模型,计算簇间缝合系数,当缝合系数大于阈值时合并初步划分结果中最相似簇并更新相似度矩阵,直至完成合并得到最终结果。在人工数据集和真实数据集上的实验结果表明,与DBSCAN算法、DPC算法和ICKDC算法对比,所提算法的聚类准确度更高,聚类性能更佳。 展开更多
关键词 密度峰值算法 高斯分布 Z-score标准化 缝合因子 簇间相似度
在线阅读 下载PDF
面向簇间密度不均匀数据的密度峰值聚类优化算法
8
作者 胡文琪 李永博 +1 位作者 王晓彤 孟路稳 《统计与决策》 北大核心 2025年第4期51-56,共6页
针对簇间密度具有较大差异的数据集,密度峰值聚类算法对这类数据集聚类效果不理想的问题,文章从类簇中心的选取和剩余样本的分配两个方面进行优化,提出一种面向簇间密度不均匀数据的密度峰值聚类优化算法。先在定义样本点的局部密度时引... 针对簇间密度具有较大差异的数据集,密度峰值聚类算法对这类数据集聚类效果不理想的问题,文章从类簇中心的选取和剩余样本的分配两个方面进行优化,提出一种面向簇间密度不均匀数据的密度峰值聚类优化算法。先在定义样本点的局部密度时引入K近邻思想,充分考虑样本的空间分布特征,均衡簇间密度差异较大的数据集中样本之间的密度差距,从而提高类簇中心选择的准确性;再对K近邻、自然近邻和共享近邻信息进行混合加权,构造样本的加权相似性,加强同一类簇中样本点之间的关联性,以实现对簇间密度不均匀数据集中剩余样本的正确分配。与DPC、K-means、DBSCAN算法的对比实验结果表明,所提算法对簇间密度差异较大的数据集有较好的聚类效果。 展开更多
关键词 密度峰值 K近邻 混合近邻 样本相似性
在线阅读 下载PDF
面向雷达信号预分选的粒子群快速密度聚类算法
9
作者 路心雨 黄永辉 +2 位作者 崔天舒 朱岩 韩佳宝 《电讯技术》 北大核心 2025年第10期1587-1594,共8页
为了在复杂多变的电子战场景下对密集重叠的雷达脉冲信号进行快速准确的分选,稀释脉冲流,解决现有基于密度的空间聚类算法(Density-based Spatial Clustering of Applications with Noise,DBSCAN)在分选时易受干扰点影响、聚类参数需要... 为了在复杂多变的电子战场景下对密集重叠的雷达脉冲信号进行快速准确的分选,稀释脉冲流,解决现有基于密度的空间聚类算法(Density-based Spatial Clustering of Applications with Noise,DBSCAN)在分选时易受干扰点影响、聚类参数需要人为设置、算法复杂度高的问题,提出了一种面向雷达信号预分选的粒子群快速密度聚类算法(Particle Swarm Fast Density Clustering Algorithm,PSK-DBSCAN)。该算法首先引入数据场理论剔除雷达脉冲信号里的干扰点,提升了分选准确度;其次,引入粒子群算法并设计了基于轮廓系数的适应度函数,自适应地获得最优聚类参数;最后,使用K-D(K-Dimensional)树降低DBSCAN的算法复杂度,减少分选时间。经实验验证,算法可以对复杂交错的雷达脉冲信号实现快速聚类分选,正确率达到98.9%,性能稳定。 展开更多
关键词 雷达信号分选 数据场 粒子群算法 K-D树 密度
在线阅读 下载PDF
基于稀疏张量补全与密度峰值聚类的低空智能网多辐射源定位算法
10
作者 陈智博 郭道省 《电子与信息学报》 北大核心 2025年第5期1310-1321,共12页
该文聚焦于低空智能网中多辐射源的定位技术研究,旨在利用搭载频谱监测设备的无人机采集的信号强度数据,精确解析低空目标区域内多个未知辐射源的空间位置。然而,实际应用场景面临多重挑战:无人机飞行轨迹受限导致测量数据稀疏;环境噪... 该文聚焦于低空智能网中多辐射源的定位技术研究,旨在利用搭载频谱监测设备的无人机采集的信号强度数据,精确解析低空目标区域内多个未知辐射源的空间位置。然而,实际应用场景面临多重挑战:无人机飞行轨迹受限导致测量数据稀疏;环境噪声及阴影衰落加剧数据波动;多个未知辐射源进一步加重了算法的复杂度,严重阻碍了现有低空多辐射源定位(MSL)技术的效能发挥。针对上述挑战,该文创新性地提出了一种基于稀疏张量补全与密度峰值聚类的低空智能网多辐射源定位算法。该算法将多辐射源定位问题解构为两个核心步骤:稀疏张量补全和张量密度峰值检测。具体而言,首先根据无人机的飞行轨迹将稀疏测量数据构建为3维稀疏张量,随后采用卷积自编码器网络对该张量进行高效补全,以复原目标空间内的完整信号强度张量图谱。在此基础上,利用改进的密度峰值聚类算法搜索张量中的密度峰值中心,从而实现多辐射源的精确定位。仿真结果表明,本文提出的算法能够有效利用稀疏测量数据对低空多辐射源进行定位,克服了因环境噪声带来的异常值影响,且展现出对辐射源数量的鲁棒性,为低空智能网中的多辐射源定位问题提供了有效的解决方案。 展开更多
关键词 低空智能网 多辐射源定位 张量补全 卷积自编码器 密度峰值
在线阅读 下载PDF
基于邻域标准差的密度调整谱聚类算法 被引量:1
11
作者 郭笑雨 刘金金 +3 位作者 陈亚军 李豪杰 袁培燕 赵晓焱 《工程科学与技术》 北大核心 2025年第2期40-53,共14页
针对谱聚类在尺度参数计算时需要人为设置近邻参数及聚类结果不稳定等问题,本文将初始类中心值和尺度参数作为决策变量,重点对谱聚类算法进行自适应优化与改进。首先,将样本邻域标准差的倒数作为度量样本局部密度的参数,与密度峰值思想... 针对谱聚类在尺度参数计算时需要人为设置近邻参数及聚类结果不稳定等问题,本文将初始类中心值和尺度参数作为决策变量,重点对谱聚类算法进行自适应优化与改进。首先,将样本邻域标准差的倒数作为度量样本局部密度的参数,与密度峰值思想相结合,设计了一种基于密度峰值的初始类中心决策值选择方法(initial class center decision value algorithm based on density peak,DP_KD),解决密度调整谱聚类中聚类结果不稳定的问题。其次,利用样本间的平均距离计算相应的邻域半径,并根据样本标准差自适应地求解每个样本的尺度参数,构造样本间的相似度矩阵,实现了近邻参数的自适应设置,解决尺度参数需要人为设置的问题。然后,基于优化后的初始类中心决策值和近邻参数方法,进一步调整高斯核函数,提出一种基于邻域标准差的密度调整谱聚类算法(density adjusted spectral clustering algorithm based on neighborhood standard deviation,DSSD),通过构建特征向量空间实现了密度谱聚类。最后,将提出的算法与其他聚类算法在多个数据集上进行了对比。结果表明,与其他谱聚类算法相比,本文提出的DSSD算法不仅具有更好的聚类效果,且聚类结果更加稳定,尤其是在类内密集且类间边缘明确的DIM512数据集中,DSSD算法可以正确地进行聚类分簇;在准确率、兰德系数和F-measure上较其他算法至少提升了0.0268、0.0136和0.0247,这表明DSSD算法不仅聚类效果较好且更适合大规模数据集的聚类分析。 展开更多
关键词 密度调整 邻域标准差 自适应 密度峰值
在线阅读 下载PDF
面向密度分布不均数据的加权逆近邻密度峰值聚类算法 被引量:2
12
作者 吕莉 陈威 +2 位作者 肖人彬 韩龙哲 谭德坤 《智能系统学报》 CSCD 北大核心 2024年第1期165-175,共11页
针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首... 针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首先在局部密度公式中引入基于sigmoid函数的权重系数,增加稀疏区域样本的权重,结合逆近邻思想,重新定义了样本的局部密度,有效提升类簇中心的识别率;其次,引入改进的样本相似度策略,利用样本间的逆近邻及共享逆近邻信息,使得同一类簇样本间具有较高的相似度,可有效改善稀疏区域样本分配错误的问题。在密度分布不均、复杂形态和UCI数据集上的对比实验表明,本文算法的聚类效果优于IDPC-FA、FNDPC、FKNN-DPC、DPC和DPCSA算法。 展开更多
关键词 密度峰值 密度分布不均 逆近邻 共享逆近邻 样本相似度 局部密度 分配策略 数据挖掘
在线阅读 下载PDF
面向密度分布不均数据的混合近邻密度峰值聚类算法 被引量:4
13
作者 吕莉 朱梅子 +1 位作者 康平 韩龙哲 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第10期1821-1830,共10页
密度峰值聚类算法(DPC)的局部密度忽略了密度分布不均数据的疏密差异,易导致类簇中心聚集在密集区域;其分配策略在分配剩余样本时,易将稀疏区域样本错误分配到密集区域,致使聚类效果不佳.为克服上述缺陷,本文提出了面向密度分布不均数... 密度峰值聚类算法(DPC)的局部密度忽略了密度分布不均数据的疏密差异,易导致类簇中心聚集在密集区域;其分配策略在分配剩余样本时,易将稀疏区域样本错误分配到密集区域,致使聚类效果不佳.为克服上述缺陷,本文提出了面向密度分布不均数据的混合近邻密度峰值聚类(MN-DPC)算法.首先,利用自然近邻信息定义样本的局部密度,平衡稀疏区域与密集区域样本之间的密度差异,从而正确找到稀疏区域的类簇中心;其次,利用样本之间的共享及自然近邻信息对样本相似度进行加权处理,加强了同一类簇样本间的相似度,有效的避免稀疏区域样本被错误分配.本文将MN-DPC算法与IDPC-FA,DPC-DBFN,DPCSA,FNDPC,FKNN-DPC,DPC算法进行对比.实验结果表明,MN-DPC算法能有效聚类密度分布不均及UCI数据集. 展开更多
关键词 密度峰值 局部密度 自然近邻 共享近邻 样本相似性
在线阅读 下载PDF
局部标准差优化的密度峰值聚类算法 被引量:2
14
作者 谢娟英 张文杰 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期47-62,共16页
密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密... 密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。 展开更多
关键词 密度峰值 标准差 局部密度 分配策略
在线阅读 下载PDF
基于反向最近邻的密度估计聚类算法
15
作者 许梅梅 侯新民 《计算机工程与应用》 北大核心 2025年第1期165-173,共9页
基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类... 基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类算法(RNN-DEC)。该算法引入反向最近邻来计算数据点的局部密度,将数据点分成强点、弱点和噪声点。使用强点构建聚类算法的骨架,通过软投票的方式将弱点分配到与其相似度最高的簇中去。提出了一种基于反向最近邻的簇融合算法,将相似度高的子簇融合,得到最终的聚类结果。实验结果表明,在一些合成数据集和UCI真实数据集上,相比较于其他经典算法,该算法具有更好的聚类效果。 展开更多
关键词 反向最近邻 局部密度 密度算法 子簇融合
在线阅读 下载PDF
基于网格近邻优化的密度峰值聚类算法 被引量:2
16
作者 刘继 杨金瑞 《计算机应用研究》 CSCD 北大核心 2024年第4期1058-1063,共6页
密度峰值聚类(DPC)将数据样本点的局部密度和相对距离进行结合,能对任意形状数据集进行聚类处理,但密度峰值聚类算法存在主观选择截断距离、简单分配策略和较高时间复杂度等问题。为此,提出了一种基于网格近邻优化的密度峰值聚类算法(KG... 密度峰值聚类(DPC)将数据样本点的局部密度和相对距离进行结合,能对任意形状数据集进行聚类处理,但密度峰值聚类算法存在主观选择截断距离、简单分配策略和较高时间复杂度等问题。为此,提出了一种基于网格近邻优化的密度峰值聚类算法(KG-DPC算法)。首先对数据空间进行网格化,减少了样本数据点之间距离的计算量;在计算局部密度时不仅考虑了网格自身的密度值,而且考虑了周围k个近邻的网格密度值,降低了主观选择截断距离对聚类结果的影响,提高了聚类准确率,设定网格密度阈值,保证了聚类结果的稳定性。通过实验结果表明,KG-DPC算法比DBSCAN、DPC和SDPC算法在聚类准确率上有很大提升,在聚类平均消耗时间上DPC、SNN-DPC和DPC-NN算法分别降低38%、44%和44%。在保证基本聚类准确率的基础上,KG-DPC算法在聚类效率上有特定优势。 展开更多
关键词 密度峰值 密度阈值 网格 近邻优化
在线阅读 下载PDF
基于流形密度峰值聚类的低压配电网拓扑辨识方法
17
作者 严绍奎 丁海丽 +2 位作者 邱嘉怡 谷紫文 黄纯 《电力科学与技术学报》 北大核心 2025年第4期61-71,共11页
针对低压配电网的频繁变化的拓扑关系经常出错导致降低辨识准确度的问题,提出一种基于流形密度峰值聚类的低压配电网拓扑辨识方法。所提方法包含特征提取和特征聚类2个阶段。在特征提取阶段,通过流形学习算法提取电压数据的低维嵌入,减... 针对低压配电网的频繁变化的拓扑关系经常出错导致降低辨识准确度的问题,提出一种基于流形密度峰值聚类的低压配电网拓扑辨识方法。所提方法包含特征提取和特征聚类2个阶段。在特征提取阶段,通过流形学习算法提取电压数据的低维嵌入,减少特征冗余,保持原始数据的任意形状分布特征。在特征聚类阶段,基于电压数据的低维流形,通过密度峰值聚类算法将相似的低维流形聚类在同一簇中,将不同的低维流形聚类在不同簇中,从而实现拓扑辨识。研究结果表明,相比于原始密度峰值聚类算法,所提算法能更准确地发现聚类中心,提高低压配电网拓扑辨识的准确率。 展开更多
关键词 低压配电网 拓扑辨识 流形学习 密度峰值
在线阅读 下载PDF
面向流形数据的加权自然近邻密度峰值聚类算法
18
作者 赵嘉 马清 +3 位作者 陈蔚昌 肖人彬 崔志华 潘正祥 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期652-660,669,共10页
流形数据由一些弧线形类簇组成,其特点是同一类簇的样本间距离较大.密度峰值聚类(DPC)算法具有简单高效的特点,但应对流形数据时表现不佳. DPC算法的两种密度度量标准可能造成不同程度的信息缺失,其分配策略仅参考距离和密度,致使聚类... 流形数据由一些弧线形类簇组成,其特点是同一类簇的样本间距离较大.密度峰值聚类(DPC)算法具有简单高效的特点,但应对流形数据时表现不佳. DPC算法的两种密度度量标准可能造成不同程度的信息缺失,其分配策略仅参考距离和密度,致使聚类精度不高.提出面向流形数据的加权自然近邻DPC(DPC-WNNN)算法,定义样本局部密度时,综合分析样本的局部和全局信息,引入加权的自然近邻以及逆近邻来应对高斯核或截断核的信息缺失问题.设计样本分配策略时通过引入共享近邻和共享逆近邻计算样本相似度,弥补DPC算法空间因素缺失的问题.将DPC-WNNN算法在流形数据集和真实数据集上与7种类似算法进行比较,结果表明该算法能更有效地找到类簇的中心点并准确分配样本,表现出良好的聚类性能. 展开更多
关键词 密度峰值 流形数据 自然近邻
在线阅读 下载PDF
基于角度分段线性近似和改进密度峰值聚类的户变关系识别
19
作者 赵耀 付皖皖 +1 位作者 陈冉 张涛 《电力科学与技术学报》 北大核心 2025年第1期113-125,共13页
为解决因排查效率低、数据更新不及时等因素导致低压配电网户变关系连接形式与实际不符的问题,提出一种基于角度分段线性近似(anglepiecewiselinearrepresentation,APLR)和改进密度峰值聚类(improved clustering by fast search find of... 为解决因排查效率低、数据更新不及时等因素导致低压配电网户变关系连接形式与实际不符的问题,提出一种基于角度分段线性近似(anglepiecewiselinearrepresentation,APLR)和改进密度峰值聚类(improved clustering by fast search find of density peaks,ICFSFDP)相结合的户变关系识别方法。首先,根据电压曲线中相邻线段的角度变化量提取曲线的转折点,利用APLR对曲线进行自适应降维重构;随后,使用ICFSFDP算法对降维数据组展开聚类分析,在决策图中由拟合函数与坐标轴围成面积的最小值得到最优类簇数目,进而得到聚类和非聚类中心用户;最后,使用动态时间弯曲(dynamic time warping,DTW)距离计算聚类和非聚类中心用户之间的距离相似度,进而得到户变关系。将所提方法应用于模拟和真实数据中,均可证实所提方法的有效性。算例分析结果表明:该方法能够对时间间隔不同、不等维的序列进行分析,且不需要人为设定聚类算法的参数,户变关系识别准确率高。 展开更多
关键词 配电网 户变关系 改进分段线性近似 动态时间弯曲距离 最小面积法 密度峰值
在线阅读 下载PDF
基于密度峰值聚类的Tri-training算法 被引量:1
20
作者 罗宇航 吴润秀 +3 位作者 崔志华 张翼英 何业慎 赵嘉 《系统仿真学报》 CAS CSCD 北大核心 2024年第5期1189-1198,共10页
Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类... Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类簇中心和局部密度可选出数据空间结构表现较好的样本。DPC-TT算法采用密度峰值聚类算法获取训练数据的类簇中心和样本的局部密度,对类簇中心的截断距离范围内的样本认定为空间结构表现较好,标记为核心数据,使用核心数据更新分类器,可降低迭代过程中的训练噪声,进而提高分类器的性能。实验结果表明:相比于标准Tritraining算法及其改进算法,DPC-TT算法具有更好的分类性能。 展开更多
关键词 TRI-TRAINING 半监督学习 密度峰值 空间结构
在线阅读 下载PDF
上一页 1 2 30 下一页 到第
使用帮助 返回顶部