期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
逆近邻和加权相似性的密度峰值聚类算法
1
作者 景彦迪 康平 +1 位作者 侯家振 吕莉 《小型微型计算机系统》 北大核心 2025年第8期1927-1934,共8页
密度峰值聚类算法在处理密度分布不均数据时,定义的局部密度未能考虑样本所在区域密度差异的影响,导致错误识别类簇中心;在处理流形数据时,设定的分配策略依据欧氏距离进行链式分配,极易导致稀疏类簇的样本误归并给密集类簇.鉴于此,提... 密度峰值聚类算法在处理密度分布不均数据时,定义的局部密度未能考虑样本所在区域密度差异的影响,导致错误识别类簇中心;在处理流形数据时,设定的分配策略依据欧氏距离进行链式分配,极易导致稀疏类簇的样本误归并给密集类簇.鉴于此,提出逆近邻和加权相似性的密度峰值聚类(DPC-NWS)算法.算法设置局部密度时,引入逆近邻思想,充分考虑样本k近邻和非k近邻对样本周围环境的影响,能更容易在稀疏类簇找到类簇中心;在剩余样本分配时,使用自然近邻和共享近邻设定样本间的相似性,新定义的样本相似性更加符合样本的实际分布,避免了样本的连续错误分配,达到正确分配的目的.将DPC-NWS算法与DPC、FNDPC、DPC-CE、DPC-DBFN、IDPC-FA算法在数据集上进行聚类,对比实验结果表明,DPC-NWS算法的聚类效果好. 展开更多
关键词 聚类 密度峰值 逆近邻 自然近邻 共享近邻
在线阅读 下载PDF
融合边界和密度的时序不平衡过采样算法
2
作者 杨瑞 张海清 +3 位作者 李代伟 陈金京 任李娟 刘佳璇 《计算机工程与设计》 北大核心 2025年第8期2178-2185,共8页
针对时间序列数据中不平衡问题,提出一种基于样本边界和局部密度的生成对抗网络(density-boundary generative adversarial network,DBGAN)。根据样本分布特点,利用共享最近邻、局部离群因子以及高斯核函数获得少数类样本的重要性得分,... 针对时间序列数据中不平衡问题,提出一种基于样本边界和局部密度的生成对抗网络(density-boundary generative adversarial network,DBGAN)。根据样本分布特点,利用共享最近邻、局部离群因子以及高斯核函数获得少数类样本的重要性得分,指导生成器合成具有代表性的少数类样本。同时借鉴CatGAN模型对cGAN的判别器进行修改,使其能够适应多样性的类内分布。实验结果表明,该模型在不同数据集上的性能指标得到提升,有效缓解类不平衡问题。 展开更多
关键词 时间序列 类不平衡 生成对抗网络 共享最近邻 局部离群因子 边界样本 局部密度
在线阅读 下载PDF
基于相对邻近度的自适应谱聚类算法
3
作者 原泽菲 张正军 姜国林 《计算机科学》 北大核心 2025年第10期79-89,共11页
针对以高斯核函数为相似性度量的传统谱聚类算法需人为设置尺度参数,相似度与样本分布结构无关的问题,定义了在自然k近邻基础上的共享邻居,结合数据点的近邻信息构造了能反映区域密度的多尺度参数,以新的尺度参数重新定义了相似性度量,... 针对以高斯核函数为相似性度量的传统谱聚类算法需人为设置尺度参数,相似度与样本分布结构无关的问题,定义了在自然k近邻基础上的共享邻居,结合数据点的近邻信息构造了能反映区域密度的多尺度参数,以新的尺度参数重新定义了相似性度量,提出了一种基于相对邻近度的自适应谱聚类算法(Adaptive Spectral Clustering based on Relative Proximity,RPASC)。改进的尺度参数结合了间隔尺度、顺序尺度及比例尺度等特性,体现了数据点之间的相对位置关系,反映了不同密度簇的分布特征和空间结构,提高了算法对不同分布数据集的适应性。新的相似性度量通过灵活调整局部尺度参数的大小,自适应地缩小不同密度簇边界上数据点的相似度,使聚类的簇边界更明确,有利于发现真实的簇形态。通过在人工合成数据集和UCI真实数据集上进行的实验,验证了RPASC算法在多个聚类性能指标上的有效性。 展开更多
关键词 谱聚类 多尺度参数 共享邻居 自然k近邻 相似性度量
在线阅读 下载PDF
级联H桥七电平逆变器故障的SKSNN-LPP特征提取方法 被引量:5
4
作者 彭丽维 张彼德 孔令瑜 《电子测量与仪器学报》 CSCD 北大核心 2019年第2期110-116,共7页
针对级联H桥七电平逆变器结构复杂,故障特征属性相互交叉,相似故障类间区分度低的问题,提出一种监督核共享近邻(SKSNN)相似性度量方法,并运用于局部保持投影(LPP)算法中,形成一种新的基于监督核共享近邻的局部保持投影(SKSNN-LPP)特征... 针对级联H桥七电平逆变器结构复杂,故障特征属性相互交叉,相似故障类间区分度低的问题,提出一种监督核共享近邻(SKSNN)相似性度量方法,并运用于局部保持投影(LPP)算法中,形成一种新的基于监督核共享近邻的局部保持投影(SKSNN-LPP)特征提取算法,用于提取七电平逆变器IGBT开路故障低维敏感特征。首先,采集各故障状态下逆变器交流侧三相电流原始信号数据;其次,利用SKSNN-LPP算法提取嵌入于原始数据中的低维敏感特征;然后,将提取的特征作为支持向量机(SVM)的输入建立故障诊断模型;最后,与传统信号处理及统计分析方法进行了仿真对比分析。结果表明,所提出的特征提取方法能有效减低相似故障类误诊率,诊断精度高达96.4%,明显高于其他方法。 展开更多
关键词 级联H桥七电平逆变器 监督核共享近邻 特征提取 局部保持投影
在线阅读 下载PDF
面向密度分布不均数据的加权逆近邻密度峰值聚类算法 被引量:2
5
作者 吕莉 陈威 +2 位作者 肖人彬 韩龙哲 谭德坤 《智能系统学报》 CSCD 北大核心 2024年第1期165-175,共11页
针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首... 针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首先在局部密度公式中引入基于sigmoid函数的权重系数,增加稀疏区域样本的权重,结合逆近邻思想,重新定义了样本的局部密度,有效提升类簇中心的识别率;其次,引入改进的样本相似度策略,利用样本间的逆近邻及共享逆近邻信息,使得同一类簇样本间具有较高的相似度,可有效改善稀疏区域样本分配错误的问题。在密度分布不均、复杂形态和UCI数据集上的对比实验表明,本文算法的聚类效果优于IDPC-FA、FNDPC、FKNN-DPC、DPC和DPCSA算法。 展开更多
关键词 密度峰值聚类 密度分布不均 逆近邻 共享逆近邻 样本相似度 局部密度 分配策略 数据挖掘
在线阅读 下载PDF
基于共享最近邻的自适应密度峰值聚类算法 被引量:1
6
作者 王心耕 杜韬 +2 位作者 周劲 陈迪 仵匀政 《计算机科学》 CSCD 北大核心 2024年第8期97-105,共9页
密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分... 密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分配样本点时易出现连锁反应这3个缺陷,提出一种基于共享最近邻的自适应密度峰值聚类算法。首先,利用共享最近邻重新定义局部密度等度量值,充分考虑了数据分布的局部特点,使样本点的空间分布特征得以更好地体现;其次,通过引入密度衰减现象让样本点自动聚集成微簇,实现了簇个数自适应确定和簇中心自适应选取;最后,提出一种两阶段的分配方法,先将微簇合并形成簇的主干部分,再用上一步分配好的簇主干指导剩余点的分配,避免了链式反应的发生。在二维合成数据集以及UCI数据集上的实现表明,相较于经典的密度峰值聚类算法及近年来对其提出的改进算法,在大多数情况下,所提算法表现出更优异的性能。 展开更多
关键词 共享最近邻 密度峰值聚类 分配策略 聚类中心 密度衰减
在线阅读 下载PDF
基于共享邻近度和概率分配的密度峰值聚类算法 被引量:2
7
作者 朱鸿祥 吴根秀 王兆辉 《计算机工程与应用》 CSCD 北大核心 2024年第12期74-90,共17页
针对密度峰值聚类(DPC)算法难以准确找到流形数据的类簇中心以及剩余样本点分配过程易发生连带错误等问题,提出了一种基于共享邻近度和概率分配的密度峰值聚类(SP-DPC)算法。基于K近邻和共享K近邻定义了样本点间的共享邻近度,使用共享... 针对密度峰值聚类(DPC)算法难以准确找到流形数据的类簇中心以及剩余样本点分配过程易发生连带错误等问题,提出了一种基于共享邻近度和概率分配的密度峰值聚类(SP-DPC)算法。基于K近邻和共享K近邻定义了样本点间的共享邻近度,使用共享邻近度重新定义了样本点的局部密度,从而找到正确的类簇中心;利用样本点的K近邻信息,提出传递概率分配策略和证据概率分配策略共同优化剩余样本点的分配,从而避免分配连带错误;在17个合成数据集和12个UCI数据集上进行实验,将SP-DPC算法与DPC算法、SKM-DPC算法、DPC-NN算法、DBSCAN算法、K-means算法进行对比,实验结果表明SP-DPC算法在AMI、ARI、FMI这3个评价指标上整体取得了相对最优值,聚类效果优于其他对比算法。 展开更多
关键词 密度峰值聚类 K近邻 共享邻近度 概率分配 证据理论
在线阅读 下载PDF
基于改进密度峰值算法的轨迹聚类 被引量:1
8
作者 钟超 刘漫丹 贺帆 《计算机工程与设计》 北大核心 2024年第1期130-138,共9页
为解决用户群体移动轨迹划分和密度峰值聚类算法自身局限性的问题,以校园轨迹为对象,考虑时间和位置语义信息层面的信息,建立网络用户间的相似性度量模型,提出一种基于共享近邻贡献度的密度峰值聚类算法(density peak clustering based ... 为解决用户群体移动轨迹划分和密度峰值聚类算法自身局限性的问题,以校园轨迹为对象,考虑时间和位置语义信息层面的信息,建立网络用户间的相似性度量模型,提出一种基于共享近邻贡献度的密度峰值聚类算法(density peak clustering based on shared nearest neighbor contribution,SNNC-DPC),结合信息熵理论,通过最小化局部密度熵自适应选择截断距离;在局部密度计算上,利用共享近邻贡献度重新计算局部密度,更加全面地反映数据分布的特性;采用非线性变换方法选取决策值,解决聚类中心选取困难且方法单一的问题。在真实校园轨迹数据集上实验,验证了改进算法的有效性。 展开更多
关键词 无线网络 密度峰值聚类 语义信息 相似性度量 信息熵 聚类中心 共享近邻贡献度
在线阅读 下载PDF
融合转移概率矩阵的多阶最近邻图聚类算法
9
作者 徐童童 解滨 +1 位作者 张春昊 张喜梅 《计算机应用》 CSCD 北大核心 2024年第5期1527-1538,共12页
聚类是根据样本之间的相似性将数据集划分为多个类簇。现有的大多数聚类方法都存在两个挑战:一方面,在定义样本间相似性时往往没有考虑样本的空间分布结构,无法构建稳定的相似度矩阵;另一方面,图聚类构造的样本图结构过于复杂,计算成本... 聚类是根据样本之间的相似性将数据集划分为多个类簇。现有的大多数聚类方法都存在两个挑战:一方面,在定义样本间相似性时往往没有考虑样本的空间分布结构,无法构建稳定的相似度矩阵;另一方面,图聚类构造的样本图结构过于复杂,计算成本较高。为解决这两个问题,提出融合转移概率矩阵的多阶最近邻图聚类算法(MNNGC)。首先,综合样本的近邻关系和空间分布结构,将共享近邻定义的相似度进行趋密性加权,得到节点间的趋密性亲和矩阵;其次,利用节点间多阶概率转移预测非邻接点的关联程度,并通过融合多阶转移概率矩阵得到稳定的节点间亲和矩阵;再次,为进一步增强图局部结构,重新构建节点的多阶最近邻图,并对多阶最近邻图的局部结构分层聚类;最后,优化了边缘点分配策略。定位实验结果表明,MNNGC在合成数据集上的准确率(Acc)均优于对比算法,且在8个UCI数据集上的Acc为最大值。其中在Compound数据集上,MNNGC的Acc、调整互信息(AMI)、调整兰德指数(ARI)和FM指数(FMI)相较于基于局部密度峰值的谱聚类(LDP-SC)算法分别提高38.6、27.2、45.4、35.1个百分点。 展开更多
关键词 共享近邻 趋密性 转移概率 多阶最近邻 分层聚类
在线阅读 下载PDF
基于局部相对密度的离群点检测算法 被引量:1
10
作者 何旭 邓安生 葛小龙 《计算机应用与软件》 北大核心 2024年第12期296-302,共7页
数据集中离群点占比很小,但大多现有的方法在检测期间需要对所有数据都进行离群度计算。针对此问题提出一种基于互近邻聚类的正常数据去除算法(EMNC),通过数据预处理最大程度消除正常点。只考虑k最近邻不适用分布异常的离群点,充分利用... 数据集中离群点占比很小,但大多现有的方法在检测期间需要对所有数据都进行离群度计算。针对此问题提出一种基于互近邻聚类的正常数据去除算法(EMNC),通过数据预处理最大程度消除正常点。只考虑k最近邻不适用分布异常的离群点,充分利用对象与其邻居的分布,同时考虑k最近邻、反近邻和共享近邻来进行密度估计。最后重新定义基于局部相对密度的离群度(ROF)对剩余可疑点进行离群判断。该算法在减少离群度计算量的同时提升了检测效率,在合成与真实数据集上和其他方法的对比实验结果表明了算法的有效性。 展开更多
关键词 离群点检测 局部相对密度 互近邻聚类 共享近邻
在线阅读 下载PDF
一种基于共享近邻的密度聚类算法
11
作者 郑喜臣 杨易扬 《计算机应用与软件》 北大核心 2024年第2期264-270,共7页
针对经典的快速漂移(Quick Shift)算法在偏移过程中需要人为地指定领域值,导致在复杂数据集上表现不佳等问题,提出一种改进的共享近邻密度聚类算法(QS-SNN)。该聚类算法基于共享近邻(SNN),计算出样本点之间的相似度;通过相似度衡量得到... 针对经典的快速漂移(Quick Shift)算法在偏移过程中需要人为地指定领域值,导致在复杂数据集上表现不佳等问题,提出一种改进的共享近邻密度聚类算法(QS-SNN)。该聚类算法基于共享近邻(SNN),计算出样本点之间的相似度;通过相似度衡量得到样本点的局部密度矩阵;通过在SNN领域中对样本点进行快速偏移,得到最终的聚类结果。在多个数据集上进行实验,结果分析表明,该算法比传统的Quick shift算法以及其他的聚类算法在准确度上有了较大的提升。 展开更多
关键词 密度聚类 共享近邻 快速漂移
在线阅读 下载PDF
基于共享近邻的自适应谱聚类 被引量:16
12
作者 刘馨月 李静伟 +2 位作者 于红 尤全增 林鸿飞 《小型微型计算机系统》 CSCD 北大核心 2011年第9期1876-1880,共5页
谱聚类是一种极具竞争力的聚类算法.相似度定义对谱聚类算法的性能有至关重要的影响.本文用两点的共享近邻数目表征局部密度,从而获知隐含的簇结构信息.将这一信息与自调节的高斯核函数结合,提出了基于共享近邻的自适应相似度及相应的... 谱聚类是一种极具竞争力的聚类算法.相似度定义对谱聚类算法的性能有至关重要的影响.本文用两点的共享近邻数目表征局部密度,从而获知隐含的簇结构信息.将这一信息与自调节的高斯核函数结合,提出了基于共享近邻的自适应相似度及相应的谱聚类算法.它满足聚类假设的要求,具有局部密度的自适应性,能有效识别数据点之间的内在联系.典型人工和真实数据集上的实验结果证明了算法的有效性. 展开更多
关键词 聚类 谱聚类 相似度度量 共享近邻
在线阅读 下载PDF
基于改进的凝聚性和分离性的层次聚类算法 被引量:15
13
作者 郭景峰 赵玉艳 +1 位作者 边伟峰 李晶 《计算机研究与发展》 EI CSCD 北大核心 2008年第z1期202-206,共5页
由于传统的数据聚类算法都是在单一表上进行,因此如何在多表中进行聚类是现在聚类分析的一个新方向.提出了一种基于改进的凝聚性和分离性的层次聚类算法——ICCSH(a hierarchical clustering algorithmbased oni mproved cluster cohesi... 由于传统的数据聚类算法都是在单一表上进行,因此如何在多表中进行聚类是现在聚类分析的一个新方向.提出了一种基于改进的凝聚性和分离性的层次聚类算法——ICCSH(a hierarchical clustering algorithmbased oni mproved cluster cohesion and separation) ,该算法首先通过ID传播把关系数据库中的各个表联系起来,再通过计算共享最近邻的相似度和改进的凝聚性算法将数据对象聚类为大量相对较小的子聚类,然后通过计算改进的簇间分离性合并子类来找到真正的结果簇.实验表明,该算法不仅运行时间相对较短,具有较强的可伸缩性,还可以得到较高精确的聚类结果. 展开更多
关键词 共享最近邻 关系数据库 层次聚类 凝聚性 分离性
在线阅读 下载PDF
K近邻和加权相似性的密度峰值聚类算法 被引量:23
14
作者 赵嘉 陈磊 +2 位作者 吴润秀 张波 韩龙哲 《控制理论与应用》 EI CAS CSCD 北大核心 2022年第12期2349-2357,共9页
密度峰值聚类算法的局部密度定义未考虑密度分布不均数据类簇间的样本密度差异影响,易导致误选类簇中心;其分配策略依据欧氏距离通过密度峰值进行链式分配,而流形数据通常有较多样本距离其密度峰值较远,导致大量本应属于同一个类簇的样... 密度峰值聚类算法的局部密度定义未考虑密度分布不均数据类簇间的样本密度差异影响,易导致误选类簇中心;其分配策略依据欧氏距离通过密度峰值进行链式分配,而流形数据通常有较多样本距离其密度峰值较远,导致大量本应属于同一个类簇的样本被错误分配给其他类簇,致使聚类精度不高.鉴于此,本文提出了一种K近邻和加权相似性的密度峰值聚类算法.该算法基于样本的K近邻信息重新定义了样本局部密度,此定义方式可以调节样本局部密度的大小,能够准确找到密度峰值;采用样本的共享最近邻及自然最近邻信息定义样本间的相似性,摒弃了欧氏距离对分配策略的影响,避免了样本分配策略产生的错误连带效应.流形及密度分布不均数据集上的对比实验表明,本文算法能准确找到疏密程度相差较大数据集的密度峰值,避免了流形数据的分配错误连带效应,得到了满意的聚类效果;同时在真实数据集上的聚类效果也十分优秀. 展开更多
关键词 密度峰值聚类 局部密度 K近邻 共享最近邻 自然最近邻
在线阅读 下载PDF
多扩展目标滤波器的量测集划分算法 被引量:8
15
作者 韩玉兰 任重义 韩崇昭 《压电与声光》 CAS CSCD 北大核心 2015年第4期603-608,共6页
针对不同扩展目标产生的量测密度差别较大时的量测集划分问题,为扩展目标概率假设密度(PHD)滤波器提出了一种基于共享最近邻(SNN)相似度的量测集划分算法。量测间的SNN相似度可体现量测在量测空间局部分布情况,考虑了量测周围的量测信息... 针对不同扩展目标产生的量测密度差别较大时的量测集划分问题,为扩展目标概率假设密度(PHD)滤波器提出了一种基于共享最近邻(SNN)相似度的量测集划分算法。量测间的SNN相似度可体现量测在量测空间局部分布情况,考虑了量测周围的量测信息,因此提出的SNN相似度划分法能够较好地划分量测密度差别较大的量测集,进而提高了扩展目标的跟踪性能,且基于提出的划分算法的PHD滤波器计算量也所减少。 展开更多
关键词 目标跟踪 扩展目标 扩展目标概率假设密度(PHD)滤波器 量测集划分 snn相似度
在线阅读 下载PDF
基于混合测度的并行仿射传播聚类算法 被引量:4
16
作者 张建朋 陈福才 +1 位作者 李邵梅 于洪涛 《计算机科学》 CSCD 北大核心 2013年第7期167-172,195,共7页
针对仿射传播聚类(AP)算法应用于流形结构复杂、密度不均匀的数据集存在的不足,通过学习数据集的低维流形结构,提出了密度自适应的"流形距离核"(ad-MDK)的概念。该距离测度既考虑了数据点的局部密度信息,又包含了数据集全局... 针对仿射传播聚类(AP)算法应用于流形结构复杂、密度不均匀的数据集存在的不足,通过学习数据集的低维流形结构,提出了密度自适应的"流形距离核"(ad-MDK)的概念。该距离测度既考虑了数据点的局部密度信息,又包含了数据集全局结构信息,从而提高了算法对这类数据集的处理能力。同时,针对引入流形距离所带来的计算复杂问题,提出了算法的并行化设计方法,有效提高了算法处理效率。通过在多个数据集上的实验验证了所提算法在处理大规模多尺度数据集上的性能优于传统AP算法。 展开更多
关键词 仿射传播聚类 流形距离核 共享最近邻 并行计算
在线阅读 下载PDF
基于共享最近邻的离群检测算法 被引量:2
17
作者 苏晓珂 郑远攀 万仁霞 《计算机应用研究》 CSCD 北大核心 2012年第7期2426-2428,2453,共4页
为识别混合属性数据集中的离群点,提出了一种基于共享最近邻的离群检测算法,通过计算增量聚类结果簇间的共享最近邻相似度,不但能够发现任意形状的簇,还可以检测到变密度数据集中的全局离群点。算法时间复杂度关于数据集的大小和属性个... 为识别混合属性数据集中的离群点,提出了一种基于共享最近邻的离群检测算法,通过计算增量聚类结果簇间的共享最近邻相似度,不但能够发现任意形状的簇,还可以检测到变密度数据集中的全局离群点。算法时间复杂度关于数据集的大小和属性个数呈近似线性。在人工数据集和真实数据集上的实验结果显示,提出的算法能有效检测到数据集中的离群点。 展开更多
关键词 共享最近邻 离群检测 任意形状簇 混合属性
在线阅读 下载PDF
非线性降维算法及其在医院绩效考核上的应用 被引量:4
18
作者 李凯 黄添强 +1 位作者 余养强 郭躬德 《计算机应用》 CSCD 北大核心 2010年第4期1004-1007,共4页
流形学习算法中的等距嵌入算法(ISOMAP)具有对离群点敏感的瑕疵,针对此问题,提出利用基于共享近邻的距离度量方式,并充分利用了流形上对象的局部密度信息,有效改善了算法的性能,提高了算法的健壮性。同时,首次尝试将该改进的流形学习算... 流形学习算法中的等距嵌入算法(ISOMAP)具有对离群点敏感的瑕疵,针对此问题,提出利用基于共享近邻的距离度量方式,并充分利用了流形上对象的局部密度信息,有效改善了算法的性能,提高了算法的健壮性。同时,首次尝试将该改进的流形学习算法应用于医院绩效考核。人工数据与真实数据上的实验表明,改进的算法健壮且有效,在绩效考核上应用成功。 展开更多
关键词 非线性降维 共享近邻 等距嵌入算法 离群点 绩效考核
在线阅读 下载PDF
改进的共享型最近邻居聚类算法 被引量:5
19
作者 耿技 印鉴 《电子科技大学学报》 EI CAS CSCD 北大核心 2006年第1期70-72,共3页
聚类效果往往依赖于密度和相似度的定义,并且当数据的维增加时,其复杂度也随之增加。该文基于共享型最近邻居聚类算法SNN,提出了一种改进的共享型最近邻居聚类算法RSNN,并将RSNN应用于高速公路交通数据集上,解决了SNN算法在“去噪”、... 聚类效果往往依赖于密度和相似度的定义,并且当数据的维增加时,其复杂度也随之增加。该文基于共享型最近邻居聚类算法SNN,提出了一种改进的共享型最近邻居聚类算法RSNN,并将RSNN应用于高速公路交通数据集上,解决了SNN算法在“去噪”、孤立点和代表点的判断、聚类效果等方面的不足之处。实验结果表明,RSNN算法比SNN算法在时空数据集上具有更好的聚类效果。 展开更多
关键词 聚类分析 共享型最近邻居 孤立点 相似度
在线阅读 下载PDF
基于网格的共享近邻聚类算法 被引量:7
20
作者 刘敏娟 柴玉梅 《计算机应用》 CSCD 北大核心 2006年第7期1673-1675,共3页
提出了一种基于网格的共享近邻聚类算法(Grid-based shared NearestNeighbor algorithm,GNN)。该算法主要利用网格技术去除数据集中的部分孤立点或噪声,使用密度阈值处理技术来处理网格的密度阈值,使用中心点技术提高聚类效率。GNN算法... 提出了一种基于网格的共享近邻聚类算法(Grid-based shared NearestNeighbor algorithm,GNN)。该算法主要利用网格技术去除数据集中的部分孤立点或噪声,使用密度阈值处理技术来处理网格的密度阈值,使用中心点技术提高聚类效率。GNN算法仅对数据集进行一遍扫描,且能处理任意形状和大小的聚类。实验表明,GNN有较好的可扩展性,其精度和效率明显地好于共享近邻SNN算法。 展开更多
关键词 基于网格 共享近邻 中心点
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部