为了在复杂多变的电子战场景下对密集重叠的雷达脉冲信号进行快速准确的分选,稀释脉冲流,解决现有基于密度的空间聚类算法(Density-based Spatial Clustering of Applications with Noise,DBSCAN)在分选时易受干扰点影响、聚类参数需要...为了在复杂多变的电子战场景下对密集重叠的雷达脉冲信号进行快速准确的分选,稀释脉冲流,解决现有基于密度的空间聚类算法(Density-based Spatial Clustering of Applications with Noise,DBSCAN)在分选时易受干扰点影响、聚类参数需要人为设置、算法复杂度高的问题,提出了一种面向雷达信号预分选的粒子群快速密度聚类算法(Particle Swarm Fast Density Clustering Algorithm,PSK-DBSCAN)。该算法首先引入数据场理论剔除雷达脉冲信号里的干扰点,提升了分选准确度;其次,引入粒子群算法并设计了基于轮廓系数的适应度函数,自适应地获得最优聚类参数;最后,使用K-D(K-Dimensional)树降低DBSCAN的算法复杂度,减少分选时间。经实验验证,算法可以对复杂交错的雷达脉冲信号实现快速聚类分选,正确率达到98.9%,性能稳定。展开更多
道路点云数据的障碍物检测技术在智能交通系统和自动驾驶中至关重要.传统的基于密度的空间聚类(DensityBased Spatial Clustering of Applications with Noise,DBSCAN)算法在处理高维或不同密度区域数据时,由于距离度量低效、参数组合...道路点云数据的障碍物检测技术在智能交通系统和自动驾驶中至关重要.传统的基于密度的空间聚类(DensityBased Spatial Clustering of Applications with Noise,DBSCAN)算法在处理高维或不同密度区域数据时,由于距离度量低效、参数组合确定困难导致聚类效果欠佳,因此,提出了一种基于改进DBSCAN的道路障碍物点云聚类方法 .首先,在确定Eps领域时利用孤立核函数来改进传统的距离度量方式,提高了DBSCAN聚类对不同密度区域的适应性和准确性.其次,针对猎豹优化算法(Cheetah Optimizer,CO)在信息共享和迭代更新方面的不足,提出了一种基于及时更新机制与兼容度量策略的CO优化算法(Timely Updating Mechanisms and Compatible Metric Strategies for CO Algorithms,TCCO),通过实时更新操作确保每次迭代的优秀信息得到及时沟通共享,并在全局更新时基于非支配排序与拥挤距离优化淘汰机制,平衡全局搜索和局部开发能力,提高了收敛速度和收敛精度.最后,利用孤立度量改进Eps领域,并利用TCCO优化DBSCAN聚类,自适应确定参数,提高了聚类精度和效率.在八个UCI数据集上进行测试,仿真结果表明,提出的TCCO-DBSCAN算法与CO-DBSCAN,SSA-DBSCAN,DBSCAN,KMC方法相比,F-Measure,ARI,NMI指标均有明显提升,且聚类精度更优.通过激光雷达点云数据障碍物聚类的实验验证,证明TCCO-DBSCAN能够有效地适应点云数据密度变化,获得更好的道路障碍物聚类效果,为辅助驾驶中障碍物检测提供支持.展开更多
为解决因排查效率低、数据更新不及时等因素导致低压配电网户变关系连接形式与实际不符的问题,提出一种基于角度分段线性近似(anglepiecewiselinearrepresentation,APLR)和改进密度峰值聚类(improved clustering by fast search find of...为解决因排查效率低、数据更新不及时等因素导致低压配电网户变关系连接形式与实际不符的问题,提出一种基于角度分段线性近似(anglepiecewiselinearrepresentation,APLR)和改进密度峰值聚类(improved clustering by fast search find of density peaks,ICFSFDP)相结合的户变关系识别方法。首先,根据电压曲线中相邻线段的角度变化量提取曲线的转折点,利用APLR对曲线进行自适应降维重构;随后,使用ICFSFDP算法对降维数据组展开聚类分析,在决策图中由拟合函数与坐标轴围成面积的最小值得到最优类簇数目,进而得到聚类和非聚类中心用户;最后,使用动态时间弯曲(dynamic time warping,DTW)距离计算聚类和非聚类中心用户之间的距离相似度,进而得到户变关系。将所提方法应用于模拟和真实数据中,均可证实所提方法的有效性。算例分析结果表明:该方法能够对时间间隔不同、不等维的序列进行分析,且不需要人为设定聚类算法的参数,户变关系识别准确率高。展开更多
为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化...为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化选择策略及改进粒子群优化算法确定的最佳Q因子分解时序信号,通过最优特征子带的能量、均值、标准差和模糊熵构建特征子空间,并采用主成分分析降低特征维度,以减少特征冗余。同时,考虑到距离较远而周围密集程度较大的K近邻样本对局部密度的贡献率,引入权重系数及K近邻重新定义DPC的局部密度,并利用共享最近邻描述样本间的相似性。在BONN癫痫脑电信号和CWRU滚动轴承数据集上进行对比实验,结果表明,该算法的聚类精度分别为95%、94%,且Jacarrd、FMI和F_(1)值指标均优于其他对比算法,证明了OTQWT-IDPC算法的有效性。展开更多
数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的CURD(clustering using references and density)聚类算...数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的CURD(clustering using references and density)聚类算法,其创新点在于,通过参考点来准确地反映数据的空间几何特征,然后基于参考点对数据进行分析处理.CURD算法保持了基于密度的聚类算法的上述优点,而且CURD算法具有近似线性的时间复杂性,因此CURD算法适合对大规模数据的挖掘.理论分析和实验结果也证明了CURD算法具有处 理任意形状的聚类、对噪音数据不敏感的特点,并且其执行效率明显高于传统的基于R*-树的DBSCAN算法.展开更多
针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法—基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise,QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上...针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法—基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise,QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上的缺陷。QDBSCAN算法在基于密度的空间聚类算法(density based spatial cluste-ring of applications with noise,DBSCAN)算法的基础上做了相关改进:在邻近度度量上提出了最短可行路径的概念,使聚类更符合计算机兵棋的规则;动态设置密度参数;采用提出的代表对象选择方法来减少对对象邻域的判断次数;按区域对数据进行分组以缩小聚类规模。实验表明,QDBSCAN算法的性能在数据规模较大的情况下,明显优于DBSCAN算法。展开更多
聚类是大数据分析与数据挖掘的基础问题。刊登在2014年《Science》杂志上的文章《Clustering by fast search and find of density peaks》提出一种快速搜索密度峰值的聚类算法,算法简单实用,但聚类结果依赖于参数dc的经验选择。论文提...聚类是大数据分析与数据挖掘的基础问题。刊登在2014年《Science》杂志上的文章《Clustering by fast search and find of density peaks》提出一种快速搜索密度峰值的聚类算法,算法简单实用,但聚类结果依赖于参数dc的经验选择。论文提出一种改进的搜索密度峰值的聚类算法,引入密度估计熵自适应优化算法参数。对比实验结果表明,改进方法不仅可以较好地解决原算法的参数人为确定的不足,而且具有相对更好的聚类性能。展开更多
文摘为了在复杂多变的电子战场景下对密集重叠的雷达脉冲信号进行快速准确的分选,稀释脉冲流,解决现有基于密度的空间聚类算法(Density-based Spatial Clustering of Applications with Noise,DBSCAN)在分选时易受干扰点影响、聚类参数需要人为设置、算法复杂度高的问题,提出了一种面向雷达信号预分选的粒子群快速密度聚类算法(Particle Swarm Fast Density Clustering Algorithm,PSK-DBSCAN)。该算法首先引入数据场理论剔除雷达脉冲信号里的干扰点,提升了分选准确度;其次,引入粒子群算法并设计了基于轮廓系数的适应度函数,自适应地获得最优聚类参数;最后,使用K-D(K-Dimensional)树降低DBSCAN的算法复杂度,减少分选时间。经实验验证,算法可以对复杂交错的雷达脉冲信号实现快速聚类分选,正确率达到98.9%,性能稳定。
文摘道路点云数据的障碍物检测技术在智能交通系统和自动驾驶中至关重要.传统的基于密度的空间聚类(DensityBased Spatial Clustering of Applications with Noise,DBSCAN)算法在处理高维或不同密度区域数据时,由于距离度量低效、参数组合确定困难导致聚类效果欠佳,因此,提出了一种基于改进DBSCAN的道路障碍物点云聚类方法 .首先,在确定Eps领域时利用孤立核函数来改进传统的距离度量方式,提高了DBSCAN聚类对不同密度区域的适应性和准确性.其次,针对猎豹优化算法(Cheetah Optimizer,CO)在信息共享和迭代更新方面的不足,提出了一种基于及时更新机制与兼容度量策略的CO优化算法(Timely Updating Mechanisms and Compatible Metric Strategies for CO Algorithms,TCCO),通过实时更新操作确保每次迭代的优秀信息得到及时沟通共享,并在全局更新时基于非支配排序与拥挤距离优化淘汰机制,平衡全局搜索和局部开发能力,提高了收敛速度和收敛精度.最后,利用孤立度量改进Eps领域,并利用TCCO优化DBSCAN聚类,自适应确定参数,提高了聚类精度和效率.在八个UCI数据集上进行测试,仿真结果表明,提出的TCCO-DBSCAN算法与CO-DBSCAN,SSA-DBSCAN,DBSCAN,KMC方法相比,F-Measure,ARI,NMI指标均有明显提升,且聚类精度更优.通过激光雷达点云数据障碍物聚类的实验验证,证明TCCO-DBSCAN能够有效地适应点云数据密度变化,获得更好的道路障碍物聚类效果,为辅助驾驶中障碍物检测提供支持.
文摘为解决因排查效率低、数据更新不及时等因素导致低压配电网户变关系连接形式与实际不符的问题,提出一种基于角度分段线性近似(anglepiecewiselinearrepresentation,APLR)和改进密度峰值聚类(improved clustering by fast search find of density peaks,ICFSFDP)相结合的户变关系识别方法。首先,根据电压曲线中相邻线段的角度变化量提取曲线的转折点,利用APLR对曲线进行自适应降维重构;随后,使用ICFSFDP算法对降维数据组展开聚类分析,在决策图中由拟合函数与坐标轴围成面积的最小值得到最优类簇数目,进而得到聚类和非聚类中心用户;最后,使用动态时间弯曲(dynamic time warping,DTW)距离计算聚类和非聚类中心用户之间的距离相似度,进而得到户变关系。将所提方法应用于模拟和真实数据中,均可证实所提方法的有效性。算例分析结果表明:该方法能够对时间间隔不同、不等维的序列进行分析,且不需要人为设定聚类算法的参数,户变关系识别准确率高。
文摘为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化选择策略及改进粒子群优化算法确定的最佳Q因子分解时序信号,通过最优特征子带的能量、均值、标准差和模糊熵构建特征子空间,并采用主成分分析降低特征维度,以减少特征冗余。同时,考虑到距离较远而周围密集程度较大的K近邻样本对局部密度的贡献率,引入权重系数及K近邻重新定义DPC的局部密度,并利用共享最近邻描述样本间的相似性。在BONN癫痫脑电信号和CWRU滚动轴承数据集上进行对比实验,结果表明,该算法的聚类精度分别为95%、94%,且Jacarrd、FMI和F_(1)值指标均优于其他对比算法,证明了OTQWT-IDPC算法的有效性。
文摘数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的CURD(clustering using references and density)聚类算法,其创新点在于,通过参考点来准确地反映数据的空间几何特征,然后基于参考点对数据进行分析处理.CURD算法保持了基于密度的聚类算法的上述优点,而且CURD算法具有近似线性的时间复杂性,因此CURD算法适合对大规模数据的挖掘.理论分析和实验结果也证明了CURD算法具有处 理任意形状的聚类、对噪音数据不敏感的特点,并且其执行效率明显高于传统的基于R*-树的DBSCAN算法.
文摘针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法—基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise,QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上的缺陷。QDBSCAN算法在基于密度的空间聚类算法(density based spatial cluste-ring of applications with noise,DBSCAN)算法的基础上做了相关改进:在邻近度度量上提出了最短可行路径的概念,使聚类更符合计算机兵棋的规则;动态设置密度参数;采用提出的代表对象选择方法来减少对对象邻域的判断次数;按区域对数据进行分组以缩小聚类规模。实验表明,QDBSCAN算法的性能在数据规模较大的情况下,明显优于DBSCAN算法。
文摘聚类是大数据分析与数据挖掘的基础问题。刊登在2014年《Science》杂志上的文章《Clustering by fast search and find of density peaks》提出一种快速搜索密度峰值的聚类算法,算法简单实用,但聚类结果依赖于参数dc的经验选择。论文提出一种改进的搜索密度峰值的聚类算法,引入密度估计熵自适应优化算法参数。对比实验结果表明,改进方法不仅可以较好地解决原算法的参数人为确定的不足,而且具有相对更好的聚类性能。