为了在复杂多变的电子战场景下对密集重叠的雷达脉冲信号进行快速准确的分选,稀释脉冲流,解决现有基于密度的空间聚类算法(Density-based Spatial Clustering of Applications with Noise,DBSCAN)在分选时易受干扰点影响、聚类参数需要...为了在复杂多变的电子战场景下对密集重叠的雷达脉冲信号进行快速准确的分选,稀释脉冲流,解决现有基于密度的空间聚类算法(Density-based Spatial Clustering of Applications with Noise,DBSCAN)在分选时易受干扰点影响、聚类参数需要人为设置、算法复杂度高的问题,提出了一种面向雷达信号预分选的粒子群快速密度聚类算法(Particle Swarm Fast Density Clustering Algorithm,PSK-DBSCAN)。该算法首先引入数据场理论剔除雷达脉冲信号里的干扰点,提升了分选准确度;其次,引入粒子群算法并设计了基于轮廓系数的适应度函数,自适应地获得最优聚类参数;最后,使用K-D(K-Dimensional)树降低DBSCAN的算法复杂度,减少分选时间。经实验验证,算法可以对复杂交错的雷达脉冲信号实现快速聚类分选,正确率达到98.9%,性能稳定。展开更多
针对谱聚类在尺度参数计算时需要人为设置近邻参数及聚类结果不稳定等问题,本文将初始类中心值和尺度参数作为决策变量,重点对谱聚类算法进行自适应优化与改进。首先,将样本邻域标准差的倒数作为度量样本局部密度的参数,与密度峰值思想...针对谱聚类在尺度参数计算时需要人为设置近邻参数及聚类结果不稳定等问题,本文将初始类中心值和尺度参数作为决策变量,重点对谱聚类算法进行自适应优化与改进。首先,将样本邻域标准差的倒数作为度量样本局部密度的参数,与密度峰值思想相结合,设计了一种基于密度峰值的初始类中心决策值选择方法(initial class center decision value algorithm based on density peak,DP_KD),解决密度调整谱聚类中聚类结果不稳定的问题。其次,利用样本间的平均距离计算相应的邻域半径,并根据样本标准差自适应地求解每个样本的尺度参数,构造样本间的相似度矩阵,实现了近邻参数的自适应设置,解决尺度参数需要人为设置的问题。然后,基于优化后的初始类中心决策值和近邻参数方法,进一步调整高斯核函数,提出一种基于邻域标准差的密度调整谱聚类算法(density adjusted spectral clustering algorithm based on neighborhood standard deviation,DSSD),通过构建特征向量空间实现了密度谱聚类。最后,将提出的算法与其他聚类算法在多个数据集上进行了对比。结果表明,与其他谱聚类算法相比,本文提出的DSSD算法不仅具有更好的聚类效果,且聚类结果更加稳定,尤其是在类内密集且类间边缘明确的DIM512数据集中,DSSD算法可以正确地进行聚类分簇;在准确率、兰德系数和F-measure上较其他算法至少提升了0.0268、0.0136和0.0247,这表明DSSD算法不仅聚类效果较好且更适合大规模数据集的聚类分析。展开更多
密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密...密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。展开更多
为解决因排查效率低、数据更新不及时等因素导致低压配电网户变关系连接形式与实际不符的问题,提出一种基于角度分段线性近似(anglepiecewiselinearrepresentation,APLR)和改进密度峰值聚类(improved clustering by fast search find of...为解决因排查效率低、数据更新不及时等因素导致低压配电网户变关系连接形式与实际不符的问题,提出一种基于角度分段线性近似(anglepiecewiselinearrepresentation,APLR)和改进密度峰值聚类(improved clustering by fast search find of density peaks,ICFSFDP)相结合的户变关系识别方法。首先,根据电压曲线中相邻线段的角度变化量提取曲线的转折点,利用APLR对曲线进行自适应降维重构;随后,使用ICFSFDP算法对降维数据组展开聚类分析,在决策图中由拟合函数与坐标轴围成面积的最小值得到最优类簇数目,进而得到聚类和非聚类中心用户;最后,使用动态时间弯曲(dynamic time warping,DTW)距离计算聚类和非聚类中心用户之间的距离相似度,进而得到户变关系。将所提方法应用于模拟和真实数据中,均可证实所提方法的有效性。算例分析结果表明:该方法能够对时间间隔不同、不等维的序列进行分析,且不需要人为设定聚类算法的参数,户变关系识别准确率高。展开更多
Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类...Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类簇中心和局部密度可选出数据空间结构表现较好的样本。DPC-TT算法采用密度峰值聚类算法获取训练数据的类簇中心和样本的局部密度,对类簇中心的截断距离范围内的样本认定为空间结构表现较好,标记为核心数据,使用核心数据更新分类器,可降低迭代过程中的训练噪声,进而提高分类器的性能。实验结果表明:相比于标准Tritraining算法及其改进算法,DPC-TT算法具有更好的分类性能。展开更多
文摘为了在复杂多变的电子战场景下对密集重叠的雷达脉冲信号进行快速准确的分选,稀释脉冲流,解决现有基于密度的空间聚类算法(Density-based Spatial Clustering of Applications with Noise,DBSCAN)在分选时易受干扰点影响、聚类参数需要人为设置、算法复杂度高的问题,提出了一种面向雷达信号预分选的粒子群快速密度聚类算法(Particle Swarm Fast Density Clustering Algorithm,PSK-DBSCAN)。该算法首先引入数据场理论剔除雷达脉冲信号里的干扰点,提升了分选准确度;其次,引入粒子群算法并设计了基于轮廓系数的适应度函数,自适应地获得最优聚类参数;最后,使用K-D(K-Dimensional)树降低DBSCAN的算法复杂度,减少分选时间。经实验验证,算法可以对复杂交错的雷达脉冲信号实现快速聚类分选,正确率达到98.9%,性能稳定。
文摘针对谱聚类在尺度参数计算时需要人为设置近邻参数及聚类结果不稳定等问题,本文将初始类中心值和尺度参数作为决策变量,重点对谱聚类算法进行自适应优化与改进。首先,将样本邻域标准差的倒数作为度量样本局部密度的参数,与密度峰值思想相结合,设计了一种基于密度峰值的初始类中心决策值选择方法(initial class center decision value algorithm based on density peak,DP_KD),解决密度调整谱聚类中聚类结果不稳定的问题。其次,利用样本间的平均距离计算相应的邻域半径,并根据样本标准差自适应地求解每个样本的尺度参数,构造样本间的相似度矩阵,实现了近邻参数的自适应设置,解决尺度参数需要人为设置的问题。然后,基于优化后的初始类中心决策值和近邻参数方法,进一步调整高斯核函数,提出一种基于邻域标准差的密度调整谱聚类算法(density adjusted spectral clustering algorithm based on neighborhood standard deviation,DSSD),通过构建特征向量空间实现了密度谱聚类。最后,将提出的算法与其他聚类算法在多个数据集上进行了对比。结果表明,与其他谱聚类算法相比,本文提出的DSSD算法不仅具有更好的聚类效果,且聚类结果更加稳定,尤其是在类内密集且类间边缘明确的DIM512数据集中,DSSD算法可以正确地进行聚类分簇;在准确率、兰德系数和F-measure上较其他算法至少提升了0.0268、0.0136和0.0247,这表明DSSD算法不仅聚类效果较好且更适合大规模数据集的聚类分析。
文摘密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。
文摘为解决因排查效率低、数据更新不及时等因素导致低压配电网户变关系连接形式与实际不符的问题,提出一种基于角度分段线性近似(anglepiecewiselinearrepresentation,APLR)和改进密度峰值聚类(improved clustering by fast search find of density peaks,ICFSFDP)相结合的户变关系识别方法。首先,根据电压曲线中相邻线段的角度变化量提取曲线的转折点,利用APLR对曲线进行自适应降维重构;随后,使用ICFSFDP算法对降维数据组展开聚类分析,在决策图中由拟合函数与坐标轴围成面积的最小值得到最优类簇数目,进而得到聚类和非聚类中心用户;最后,使用动态时间弯曲(dynamic time warping,DTW)距离计算聚类和非聚类中心用户之间的距离相似度,进而得到户变关系。将所提方法应用于模拟和真实数据中,均可证实所提方法的有效性。算例分析结果表明:该方法能够对时间间隔不同、不等维的序列进行分析,且不需要人为设定聚类算法的参数,户变关系识别准确率高。
文摘Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类簇中心和局部密度可选出数据空间结构表现较好的样本。DPC-TT算法采用密度峰值聚类算法获取训练数据的类簇中心和样本的局部密度,对类簇中心的截断距离范围内的样本认定为空间结构表现较好,标记为核心数据,使用核心数据更新分类器,可降低迭代过程中的训练噪声,进而提高分类器的性能。实验结果表明:相比于标准Tritraining算法及其改进算法,DPC-TT算法具有更好的分类性能。