对基于密度的分布式聚类算法DBDC(density based distributed clustering)进行改进,提出了一种基于密度的分布式聚类算法DBDC*.该算法在局部筛选代表点时结合贝叶斯信息准则BIC,得到少量精准反映局部站点数据分布的BIC核心点,有效降低...对基于密度的分布式聚类算法DBDC(density based distributed clustering)进行改进,提出了一种基于密度的分布式聚类算法DBDC*.该算法在局部筛选代表点时结合贝叶斯信息准则BIC,得到少量精准反映局部站点数据分布的BIC核心点,有效降低了分布式聚类过程中的数据通信量,全局聚类时综合考虑了各站点数据的分布情况.实验结果表明,算法DBDC*的效率优于DBDC,聚类效果好.展开更多
为准确聚类复杂的船舶轨迹和辨识隐蔽轨迹簇,提出一种考虑多维特征的船舶轨迹分层聚类算法。用核心萤火虫算法(core firefly algorithm,CFA)解决具有噪声的基于密度的空间聚类(density-based spatial clustering of applications with n...为准确聚类复杂的船舶轨迹和辨识隐蔽轨迹簇,提出一种考虑多维特征的船舶轨迹分层聚类算法。用核心萤火虫算法(core firefly algorithm,CFA)解决具有噪声的基于密度的空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法的邻域查询冗余和参数敏感问题,并在传统船舶轨迹聚类特征的基础上引入水域环境、轨迹线型和时隙特征来分层建立轨迹相似性度量指标,最终实现轨迹的逐层递进聚类。以厦门港及其附近水域的AIS数据验证算法的有效性,检验结果表明:船舶轨迹由算法聚类为9簇;簇内动态时间规整(dynamic time warping,DTW)距离均值为5.199,簇间DTW距离均值为18.032;聚类结果符合实际的船舶交通流情况,聚类准确率为91.50%。可见,提出的算法相比其他常用的轨迹聚类算法能更有效地辨识轨迹地理分布和船舶运动特征的异同,更容易发现隐蔽的轨迹簇。由提出的算法聚类的同簇轨迹,其船舶运动特性更相似,聚类结果可为船舶交通流特性分析及船舶行为模式识别等提供典型的轨迹样本。展开更多
DBSCAN(density-based spatial clustering of applications with noise)是应用最广的密度聚类算法之一.然而,它时间复杂度过高(O(n^(2))),无法处理大规模数据.因而,对它进行加速成为一个研究热点,众多富有成效的工作不断涌现.从加速目...DBSCAN(density-based spatial clustering of applications with noise)是应用最广的密度聚类算法之一.然而,它时间复杂度过高(O(n^(2))),无法处理大规模数据.因而,对它进行加速成为一个研究热点,众多富有成效的工作不断涌现.从加速目标上看,这些工作大体上可分为减少冗余计算和并行化两大类;就具体加速手段而言,可分为6个主要类别:基于分布式、基于采样化、基于近似模糊、基于快速近邻、基于空间划分以及基于GPU加速技术.根据该分类,对现有工作进行了深入梳理与交叉比较,发现采用多重技术的融合加速算法优于单一加速技术;近似模糊化、并行化与分布式是当前最有效的手段;高维数据仍然难以应对.此外,对快速化DBSCAN算法在多个领域中的应用进行了跟踪报告.最后,对本领域未来的方向进行了展望.展开更多
文摘对基于密度的分布式聚类算法DBDC(density based distributed clustering)进行改进,提出了一种基于密度的分布式聚类算法DBDC*.该算法在局部筛选代表点时结合贝叶斯信息准则BIC,得到少量精准反映局部站点数据分布的BIC核心点,有效降低了分布式聚类过程中的数据通信量,全局聚类时综合考虑了各站点数据的分布情况.实验结果表明,算法DBDC*的效率优于DBDC,聚类效果好.
文摘为准确聚类复杂的船舶轨迹和辨识隐蔽轨迹簇,提出一种考虑多维特征的船舶轨迹分层聚类算法。用核心萤火虫算法(core firefly algorithm,CFA)解决具有噪声的基于密度的空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法的邻域查询冗余和参数敏感问题,并在传统船舶轨迹聚类特征的基础上引入水域环境、轨迹线型和时隙特征来分层建立轨迹相似性度量指标,最终实现轨迹的逐层递进聚类。以厦门港及其附近水域的AIS数据验证算法的有效性,检验结果表明:船舶轨迹由算法聚类为9簇;簇内动态时间规整(dynamic time warping,DTW)距离均值为5.199,簇间DTW距离均值为18.032;聚类结果符合实际的船舶交通流情况,聚类准确率为91.50%。可见,提出的算法相比其他常用的轨迹聚类算法能更有效地辨识轨迹地理分布和船舶运动特征的异同,更容易发现隐蔽的轨迹簇。由提出的算法聚类的同簇轨迹,其船舶运动特性更相似,聚类结果可为船舶交通流特性分析及船舶行为模式识别等提供典型的轨迹样本。
文摘DBSCAN(density-based spatial clustering of applications with noise)是应用最广的密度聚类算法之一.然而,它时间复杂度过高(O(n^(2))),无法处理大规模数据.因而,对它进行加速成为一个研究热点,众多富有成效的工作不断涌现.从加速目标上看,这些工作大体上可分为减少冗余计算和并行化两大类;就具体加速手段而言,可分为6个主要类别:基于分布式、基于采样化、基于近似模糊、基于快速近邻、基于空间划分以及基于GPU加速技术.根据该分类,对现有工作进行了深入梳理与交叉比较,发现采用多重技术的融合加速算法优于单一加速技术;近似模糊化、并行化与分布式是当前最有效的手段;高维数据仍然难以应对.此外,对快速化DBSCAN算法在多个领域中的应用进行了跟踪报告.最后,对本领域未来的方向进行了展望.