期刊文献+
共找到440篇文章
< 1 2 22 >
每页显示 20 50 100
改进的密度峰值聚类算法在岩体结构面优势分组中的应用
1
作者 王述红 高晨翔 侯钦宽 《东北大学学报(自然科学版)》 北大核心 2025年第3期130-137,共8页
岩体稳定性评价依赖于合理的结构面分组,但传统方法存在易受边缘点与异常点影响的弊端.为此,提出一种改进的密度峰值聚类算法用于结构面优势分组.首先,将结构面产状转换为空间坐标,并以单位法向量夹角正弦值的平方作为相似性度量.随后,... 岩体稳定性评价依赖于合理的结构面分组,但传统方法存在易受边缘点与异常点影响的弊端.为此,提出一种改进的密度峰值聚类算法用于结构面优势分组.首先,将结构面产状转换为空间坐标,并以单位法向量夹角正弦值的平方作为相似性度量.随后,基于有效性评价指标构建目标函数,并利用乌鸦算法优化截断距离以获取最佳分组结果.通过模拟数据集验证了该算法能够有效减少人为干预,避免异常点干扰,确保聚类结果更加可靠和合理.结果表明,所提方法不仅与传统方法一致性良好,还具有更高的适用性,为工程中结构面优势分组提供了可靠的参考. 展开更多
关键词 密度峰值 乌鸦算法 有效性评价指标 结构面 优势分组
在线阅读 下载PDF
基于反向最近邻的密度估计聚类算法
2
作者 许梅梅 侯新民 《计算机工程与应用》 北大核心 2025年第1期165-173,共9页
基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类... 基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类算法(RNN-DEC)。该算法引入反向最近邻来计算数据点的局部密度,将数据点分成强点、弱点和噪声点。使用强点构建聚类算法的骨架,通过软投票的方式将弱点分配到与其相似度最高的簇中去。提出了一种基于反向最近邻的簇融合算法,将相似度高的子簇融合,得到最终的聚类结果。实验结果表明,在一些合成数据集和UCI真实数据集上,相比较于其他经典算法,该算法具有更好的聚类效果。 展开更多
关键词 反向最近邻 局部密度 密度算法 子簇融合
在线阅读 下载PDF
基于高斯分布的自适应密度峰值聚类算法
3
作者 李启文 王治和 +1 位作者 杜辉 鲁德鹏 《计算机工程》 北大核心 2025年第4期137-148,共12页
密度峰值聚类(DPC)算法可以发现任意形状的簇,对噪声具有鲁棒性,因此被广泛应用于各个领域。但DPC算法需要人工选取聚类中心,对于密度不均匀型数据集表现较差。为此,提出一种基于高斯分布的自适应密度峰值聚类算法。首先,计算局部密度... 密度峰值聚类(DPC)算法可以发现任意形状的簇,对噪声具有鲁棒性,因此被广泛应用于各个领域。但DPC算法需要人工选取聚类中心,对于密度不均匀型数据集表现较差。为此,提出一种基于高斯分布的自适应密度峰值聚类算法。首先,计算局部密度和相对距离的乘积θ_(i),通过Z-score标准化方法,将θ_(i)映射到符合高斯分布的二维空间中,利用高斯分布的标准偏差来自适应选取聚类中心,得到聚类中心集合;其次,将其余数据点分配到离其最近的聚类中心所在的簇中,得到初步划分结果;最后,设计缝合因子模型,计算簇间缝合系数,当缝合系数大于阈值时合并初步划分结果中最相似簇并更新相似度矩阵,直至完成合并得到最终结果。在人工数据集和真实数据集上的实验结果表明,与DBSCAN算法、DPC算法和ICKDC算法对比,所提算法的聚类准确度更高,聚类性能更佳。 展开更多
关键词 密度峰值算法 高斯分布 Z-score标准化 缝合因子 簇间相似度
在线阅读 下载PDF
Greedy DBSCAN:一种针对多密度聚类的DBSCAN改进算法 被引量:45
4
作者 冯振华 钱雪忠 赵娜娜 《计算机应用研究》 CSCD 北大核心 2016年第9期2693-2696,2700,共5页
针对基于密度的DBSCAN算法对于输入参数敏感、无法聚类多密度数据集等问题,提出了一种贪心的DBSCAN改进算法(greedy DBSCAN)。算法仅需输入一个参数Min Pts,采用贪心策略自适应地寻找Eps半径参数进行簇发现,利用相对稠密度识别和判定噪... 针对基于密度的DBSCAN算法对于输入参数敏感、无法聚类多密度数据集等问题,提出了一种贪心的DBSCAN改进算法(greedy DBSCAN)。算法仅需输入一个参数Min Pts,采用贪心策略自适应地寻找Eps半径参数进行簇发现,利用相对稠密度识别和判定噪声数据,在随机寻找核对象过程中使用邻域查询方式提升算法效率,最终通过簇的合并产生最终的聚类结果。实验结果表明,改进后的算法能有效地分离噪声数据,识别多密度簇,聚类准确度较高。 展开更多
关键词 密度 贪心策略 相对稠密度 邻域查询 噪声数据 dbscan
在线阅读 下载PDF
基于类簇合并的无参数密度峰值聚类算法 被引量:1
5
作者 刘天娇 王胜景 袁永生 《现代电子技术》 北大核心 2024年第8期1-8,共8页
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚... 密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。 展开更多
关键词 分析 密度峰值算法 初始 簇合并 相似度 性能
在线阅读 下载PDF
基于人工鱼群的自适应密度峰值聚类算法 被引量:1
6
作者 何凯琳 张正军 +1 位作者 位雅 唐莉 《计算机工程与设计》 北大核心 2024年第1期110-119,共10页
针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,... 针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,根据两个相邻簇的簇间边界区域密度与簇平均密度构造簇间合并规则,利用人工鱼群算法寻找使改进轮廓系数指标达到最大值时的最优截断距离d_(c)。在合成数据集和真实数据集上的实验结果表明,AFSADPC算法具有较好的聚类效果。 展开更多
关键词 密度峰值 算法 人工鱼群算法 截断距离 幂律分布 簇合并策略 轮廓系数
在线阅读 下载PDF
基于密度聚类算法和广度优先搜索算法的道岔摩擦电流智能分析系统 被引量:1
7
作者 邱晓莉 韩思远 +1 位作者 熊庆 余东 《城市轨道交通研究》 北大核心 2024年第4期114-118,共5页
[目的]现场的道岔摩擦电流测试与调整存在流程繁琐且风险高、对检修人员专业水平要求高、测定数值的主观性占比大3个弊端,为此需要基于各类智能算法及技术提升道岔的智能运维水平。[方法]分析了道岔摩擦电流测试曲线4个阶段的特征,提出... [目的]现场的道岔摩擦电流测试与调整存在流程繁琐且风险高、对检修人员专业水平要求高、测定数值的主观性占比大3个弊端,为此需要基于各类智能算法及技术提升道岔的智能运维水平。[方法]分析了道岔摩擦电流测试曲线4个阶段的特征,提出建立道岔摩擦电流的智能分析系统。阐述了该系统的功能及工作原理,设定了该系统的摩擦电流标准值及阈值范围。该系统可基于密度聚类算法和广度优先搜索算法自动获取道岔摩擦电流值。介绍了该系统的调试界面截图,以说明系统在获取道岔摩擦电流值如何为现场检修人员提供操作建议。[结果及结论]该智能系统具有良好的可用性,实现了节约检修时间、降低维护成本和提高检修效率的既定目的。 展开更多
关键词 城市轨道交通 信号 智能运维 道岔转辙机 摩擦电流 密度算法 广度优先搜索算法
在线阅读 下载PDF
融合优化可调Q因子小波变换的改进密度峰值聚类算法 被引量:1
8
作者 史曼曼 宋朝炀 张景祥 《计算机应用研究》 CSCD 北大核心 2024年第2期466-472,共7页
为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化... 为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化选择策略及改进粒子群优化算法确定的最佳Q因子分解时序信号,通过最优特征子带的能量、均值、标准差和模糊熵构建特征子空间,并采用主成分分析降低特征维度,以减少特征冗余。同时,考虑到距离较远而周围密集程度较大的K近邻样本对局部密度的贡献率,引入权重系数及K近邻重新定义DPC的局部密度,并利用共享最近邻描述样本间的相似性。在BONN癫痫脑电信号和CWRU滚动轴承数据集上进行对比实验,结果表明,该算法的聚类精度分别为95%、94%,且Jacarrd、FMI和F_(1)值指标均优于其他对比算法,证明了OTQWT-IDPC算法的有效性。 展开更多
关键词 密度峰值算法 可调Q因子小波变换 粒子群优化算法 主成分分析
在线阅读 下载PDF
VDBSCAN:变密度聚类算法 被引量:22
9
作者 周董 刘鹏 《计算机工程与应用》 CSCD 北大核心 2009年第11期137-141,153,共6页
传统的密度聚类算法不能识别并聚类多个不同密度的簇。对此提出了变密度聚类算法VDBSCAN,针对密度不稳定的数据集,可有效识别并同时聚类不同密度的簇,避免合并和遗漏。VDBSCAN算法的基本思想是:根据k-dist图和DK分析,对数据集中的不同... 传统的密度聚类算法不能识别并聚类多个不同密度的簇。对此提出了变密度聚类算法VDBSCAN,针对密度不稳定的数据集,可有效识别并同时聚类不同密度的簇,避免合并和遗漏。VDBSCAN算法的基本思想是:根据k-dist图和DK分析,对数据集中的不同密度层次自动选择一组Eps值,分别调用DBSCAN算法。不同的Eps值,能够找到不同密度的簇。4个二维数据集实验验证了VDB-SCAN算法的有效性,表明VDBSCAN算法可以有效地聚类密度不均匀的数据集,且参数Eps的自动选择方法也是有效的和健壮的。 展开更多
关键词 密度算法 基于密度 dbscan 数据挖掘
在线阅读 下载PDF
一种DBSCAN聚类点密度的加权质心定位算法 被引量:4
10
作者 李轶 张亮 +1 位作者 张然 张申 《河南科技大学学报(自然科学版)》 CAS 北大核心 2018年第2期36-39,47,共5页
加权质心定位算法是无线传感器网络中最常用的定位算法,为了进一步提高其定位精度,本文将聚类算法引入到无线传感器网络定位中,提出了一种具有噪声的基于密度的聚类算法(DBSCAN)聚类点密度的加权质心定位算法。该算法根据共线度理论选... 加权质心定位算法是无线传感器网络中最常用的定位算法,为了进一步提高其定位精度,本文将聚类算法引入到无线传感器网络定位中,提出了一种具有噪声的基于密度的聚类算法(DBSCAN)聚类点密度的加权质心定位算法。该算法根据共线度理论选择参数,构建定位三角形的集合。选择集合中定位效果较好的一部分三角形对未知节点进行定位,并对所得的初始定位结果进行DBSCAN聚类。在排除误差较大的定位坐标后,将聚类后每个簇的核心点个数视为权值,采用加权质心定位算法得到未知节点的最终定位位置。仿真结果表明:该算法与传统加权质心定位算法相比,平均定位误差减小80%以上,有效提高了无线传感器网络定位精度。 展开更多
关键词 无线传感器网络 dbscan 加权质心定位算法 共线度
在线阅读 下载PDF
一种改进的基于密度的DBSCAN聚类算法 被引量:4
11
作者 王翠茹 朵春红 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期104-107,共4页
主要讨论数据挖掘领域中一种基于密度的DBSCAN聚类算法,并对算法进行改进。利用取样技术缩小数据库的规模,减少算法的运行时间。利用遗传算法对聚类结果进行优化,保证聚类的质量。给出了一种基于取样的DBSCAN算法及其遗传优化。最后实... 主要讨论数据挖掘领域中一种基于密度的DBSCAN聚类算法,并对算法进行改进。利用取样技术缩小数据库的规模,减少算法的运行时间。利用遗传算法对聚类结果进行优化,保证聚类的质量。给出了一种基于取样的DBSCAN算法及其遗传优化。最后实验证明了算法的有效性。 展开更多
关键词 数据挖掘 dbscan算法 取样 遗传算法
在线阅读 下载PDF
融合改进DBSCAN聚类和多种进化策略的改进蝗虫优化算法
12
作者 于平 《仪表技术与传感器》 CSCD 北大核心 2024年第5期98-105,112,共9页
针对蝗虫优化算法复杂高维问题收敛精度不高、寻优能力不强、难以跳出局部最优的缺陷,提出一种融合改进DBSCAN聚类和多种进化策略的改进蝗虫优化算法(GOA)。首先,引入多核加权距离度量和动态并行运算策略,以提高改进DBSCAN高维数据聚类... 针对蝗虫优化算法复杂高维问题收敛精度不高、寻优能力不强、难以跳出局部最优的缺陷,提出一种融合改进DBSCAN聚类和多种进化策略的改进蝗虫优化算法(GOA)。首先,引入多核加权距离度量和动态并行运算策略,以提高改进DBSCAN高维数据聚类效率。其次,利用改进DBSCAN可以对任意形状数据集进行聚类的优势,对蝗虫种群进行聚类分析,并为蝗虫个体赋予核心点、边界点和孤立点等空间属性。最后,综合考虑种群空间特性和个体间进化程度差异性,设计多种蝗虫个体进化策略,以更好地提升算法全局寻优能力。典型复杂、高维测试函数以及经典TSP问题仿真结果表明:改进后的GOA在收敛精度上更具优势。 展开更多
关键词 蝗虫优化算法 dbscan 收敛精度
在线阅读 下载PDF
近邻关系约束和簇心扩散的密度峰值聚类算法
13
作者 杨重阳 徐华 张紫丹 《小型微型计算机系统》 CSCD 北大核心 2024年第12期2830-2837,共8页
研究表明,对于非球形簇和密度不均匀的聚类,DPC很难选择正确的簇中心;同时,DPC的分配方法存在多米诺骨牌效应,即不正确的分配一个区域中密度最高的点,将导致该区域中的所有点都指向同一个错误的聚类.为了解决这两个不足,本文提出了近邻... 研究表明,对于非球形簇和密度不均匀的聚类,DPC很难选择正确的簇中心;同时,DPC的分配方法存在多米诺骨牌效应,即不正确的分配一个区域中密度最高的点,将导致该区域中的所有点都指向同一个错误的聚类.为了解决这两个不足,本文提出了近邻关系约束和簇心扩散的密度峰值聚类算法(DPC-NCCD).首先,引入了k近邻和二阶k近邻来重新定义局部密度,避免了密度不均匀的数据集在选取密度峰值时候出现的错误,确保簇心选择的正确性;其次,对于剩余样本的分配,本文采用三阶段的分配策略,每个阶段中依据不同的近邻关系约束条件来逐步扩大类簇.这样的分配策略可以缓解多米诺效应,并提高在流形数据集上的正确性.通过人工数据和真实数据的测试,证明了该算法在密度不均匀的流形数据集上具有良好的聚类性能. 展开更多
关键词 算法 密度峰值 K近邻 二阶K近邻
在线阅读 下载PDF
基于K互近邻与核密度估计的DPC算法 被引量:2
14
作者 周玉 夏浩 +1 位作者 刘虹瑜 白磊 《北京航空航天大学学报》 北大核心 2025年第6期1978-1990,共13页
快速搜索和发现密度峰值聚类(DPC)算法是一种基于密度的聚类算法。该算法不需要迭代和过多的设定参数,但由于计算局部密度时没有考虑数据的局部结构,导致无法识别簇密度小的聚类中心。针对此问题,提出基于K互近邻(KN)和核密度估计(KDE)... 快速搜索和发现密度峰值聚类(DPC)算法是一种基于密度的聚类算法。该算法不需要迭代和过多的设定参数,但由于计算局部密度时没有考虑数据的局部结构,导致无法识别簇密度小的聚类中心。针对此问题,提出基于K互近邻(KN)和核密度估计(KDE)的DPC(KKDPC)算法。通过K近邻和核密度估计方法得到数据点的K互近邻数量和局部核密度;将K互近邻数量与局部核密度进行加和获得新的局部密度;根据数据点的局部密度得到相对距离,并通过构建决策图选取聚类中心及分配非中心点。利用人工数据集和真实数据集进行实验,并与DPC、基于密度的噪声空间聚类应用(DBSCAN)、K-means、模糊C均值聚类算法(FCM)、基于K近邻的DPC(DPCKNN)、近邻优化DPC(DPC-NNO)、基于模糊加权共享邻居的DPC(DPC-FWSN)算法进行对比。通过计算调整互信息(AMI)、调整兰德指数(ARI)、归一化互信息(NMI)来验证KKDPC算法的性能。实验结果表明:KKDPC算法能更加准确地识别聚类中心,有效地提高聚类精度。 展开更多
关键词 算法 密度峰值 K近邻 K互近邻 密度估计
在线阅读 下载PDF
基于区域划分的DBSCAN多密度聚类算法 被引量:30
15
作者 韩利钊 钱雪忠 +1 位作者 罗靖 宋威 《计算机应用研究》 CSCD 北大核心 2018年第6期1668-1671,1685,共5页
DBSCAN聚类算法使用固定的Eps和min Pts,处理多密度的数据效果不理想,并且算法的时间复杂度为O(N2)。针对以上问题,提出一种基于区域划分的DBSCAN多密度聚类算法。算法利用网格相对密度差把数据空间划分成密度不同的区域,每个区域的Eps... DBSCAN聚类算法使用固定的Eps和min Pts,处理多密度的数据效果不理想,并且算法的时间复杂度为O(N2)。针对以上问题,提出一种基于区域划分的DBSCAN多密度聚类算法。算法利用网格相对密度差把数据空间划分成密度不同的区域,每个区域的Eps根据该区域的密度计算自动获得,并利用DBSCAN算法进行聚类,提升了DBSCAN的精度;避免了DBSCAN在查找密度相连时需要遍历所有数据的不足,从而改善了算法效率。实验表明算法能有效地对多密度数据进行聚类,对各种数据的适应力较强,效率较优。 展开更多
关键词 区域划分 密度 相对密度 dbscan
在线阅读 下载PDF
密度峰值聚类算法综述 被引量:58
16
作者 陈叶旺 申莲莲 +3 位作者 钟才明 王田 陈谊 杜吉祥 《计算机研究与发展》 EI CSCD 北大核心 2020年第2期378-394,共17页
密度峰值聚类(density peak,DPeak)算法是一种简单有效的聚类算法,它可将任意维度数据映射成2维,在降维后的空间中建构出数据之间的层次关系,可以非常容易地从中挑选出密度高、且与其他密度更高区域相隔较远的数据点.这些点被称为密度... 密度峰值聚类(density peak,DPeak)算法是一种简单有效的聚类算法,它可将任意维度数据映射成2维,在降维后的空间中建构出数据之间的层次关系,可以非常容易地从中挑选出密度高、且与其他密度更高区域相隔较远的数据点.这些点被称为密度峰值点,可以用来作为聚类中心.根据建构好的层次关系,该算法提供了2种不同的方式完成最后聚类:一种是与用户交互的决策图,另一种是自动化方式.跟踪了DPeak近年来的发展与应用动态,对该算法的各种改进或变种从以下3方面进行了总结和梳理:首先,介绍了DPeak算法原理,对其在聚类算法分类体系中的位置进行了讨论.将其与5个主要的聚类算法做了比较之后,发现DPeak与均值漂移聚类算法(mean shift)有诸多相似之处,因而认为其可能为mean shift的一个特殊变种.其次,讨论了DPeak的几个不足之处,如复杂度较高、自适应性不足、精度低和高维数据适用性差等,将针对这些缺点进行改进的相关算法做了分类讨论.此外,梳理了DPeak算法在不同领域中的应用,如自然语言处理、生物医学应用、光学应用等.最后,探讨了密度峰值聚类算法所存在的问题及挑战,同时对进一步的工作进行展望. 展开更多
关键词 算法 密度峰值 大数据 数据挖掘 密度
在线阅读 下载PDF
一种基于参考点和密度的快速聚类算法 被引量:108
17
作者 马帅 王腾蛟 +2 位作者 唐世渭 杨冬青 高军 《软件学报》 EI CSCD 北大核心 2003年第6期1089-1095,共7页
数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的CURD(clustering using references and density)聚类算... 数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的CURD(clustering using references and density)聚类算法,其创新点在于,通过参考点来准确地反映数据的空间几何特征,然后基于参考点对数据进行分析处理.CURD算法保持了基于密度的聚类算法的上述优点,而且CURD算法具有近似线性的时间复杂性,因此CURD算法适合对大规模数据的挖掘.理论分析和实验结果也证明了CURD算法具有处 理任意形状的聚类、对噪音数据不敏感的特点,并且其执行效率明显高于传统的基于R*-树的DBSCAN算法. 展开更多
关键词 快速算法 密度 高维 参考点 数据挖掘
在线阅读 下载PDF
基于DBSCAN聚类算法的研究与实现 被引量:78
18
作者 荣秋生 颜君彪 郭国强 《计算机应用》 CSCD 北大核心 2004年第4期45-46,61,共3页
高密度聚类作为数据挖掘中聚类算法的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的类。文中分析了传统的聚类算法及局限性,讨论了一个基于高密度聚类算法的实现过程,使得算法可自动发现高维子空间,处理高维... 高密度聚类作为数据挖掘中聚类算法的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的类。文中分析了传统的聚类算法及局限性,讨论了一个基于高密度聚类算法的实现过程,使得算法可自动发现高维子空间,处理高维数据表格,得到较快的聚类速度和最佳的聚类效果。 展开更多
关键词 数据挖掘 密度 网格 dbscan
在线阅读 下载PDF
基于DBSCAN聚类算法的闪电临近预报模型 被引量:24
19
作者 侯荣涛 朱斌 +2 位作者 冯民学 史鑫明 路郁 《计算机应用》 CSCD 北大核心 2012年第3期847-851,共5页
针对闪电定位仪中庞大而杂乱的定位数据,提出一种基于改进DBSCAN聚类算法(IDBSCAN)进行闪电聚类分析的方法。该方法依据闪电定位系统中的实时监控数据,搜索闪电密度大于阈值范围的地闪点,建立密度可达最大值的地闪聚类簇,并找到该簇类... 针对闪电定位仪中庞大而杂乱的定位数据,提出一种基于改进DBSCAN聚类算法(IDBSCAN)进行闪电聚类分析的方法。该方法依据闪电定位系统中的实时监控数据,搜索闪电密度大于阈值范围的地闪点,建立密度可达最大值的地闪聚类簇,并找到该簇类中的核心地闪点。同时,应用邻接表结构对DBSCAN算法进行改进,使得初始地闪数据的搜索集的建立时间和空间得到大大减少。在聚类分析结果基础上,对核心地闪点的移动路径进行拟合,从而预报下一时刻的核心地闪点位置。实验证明,将IDBSCAN算法应用在闪电临近预报中是有效的。 展开更多
关键词 闪电临近预报 定位资料 dbscan算法 邻接表 空间
在线阅读 下载PDF
核密度估计及其在聚类算法构造中的应用 被引量:66
20
作者 李存华 孙志挥 +1 位作者 陈耿 胡云 《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1712-1719,共8页
经典数理统计学中的核密度估计理论是构造基于数据集密度函数聚类算法的理论基础 ,采用分箱近似的快速核密度函数估计方法同样为构造高效的聚类算法提供了依据 通过对核密度估计理论及其快速分箱核近似方法的讨论 ,给出分箱近似密度估... 经典数理统计学中的核密度估计理论是构造基于数据集密度函数聚类算法的理论基础 ,采用分箱近似的快速核密度函数估计方法同样为构造高效的聚类算法提供了依据 通过对核密度估计理论及其快速分箱核近似方法的讨论 ,给出分箱近似密度估计相对于核密度估计的均方误差界 ,提出基于网格数据重心的分箱核近似方法 在不改变计算复杂度的条件下 ,基于网格数据重心的分箱核近似密度函数计算可以有效地降低近似误差 ,这一思想方法对于构造高效大规模数据聚类分析算法具有指导意义 展开更多
关键词 密度估计 分箱规则 算法
在线阅读 下载PDF
上一页 1 2 22 下一页 到第
使用帮助 返回顶部