期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
Outlier detection based on multi-dimensional clustering and local density
1
作者 SHOU Zhao-yu LI Meng-ya LI Si-min 《Journal of Central South University》 SCIE EI CAS CSCD 2017年第6期1299-1306,共8页
Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outl... Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outlier. In this work, an effective outlier detection method based on multi-dimensional clustering and local density(ODBMCLD) is proposed. ODBMCLD firstly identifies the center objects by the local density peak of data objects, and clusters the whole dataset based on the center objects. Then, outlier objects belonging to different clusters will be marked as candidates of abnormal data. Finally, the top N points among these abnormal candidates are chosen as final anomaly objects with high outlier factors. The feasibility and effectiveness of the method are verified by experiments. 展开更多
关键词 data MINING OUTLIER DETECTION OUTLIER DETECTION method based on MULTI-DIMENSIONAL clustering and local density (ODBMCLD) algorithm deviation DEGREE
在线阅读 下载PDF
基于反向最近邻的密度估计聚类算法
2
作者 许梅梅 侯新民 《计算机工程与应用》 北大核心 2025年第1期165-173,共9页
基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类... 基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类算法(RNN-DEC)。该算法引入反向最近邻来计算数据点的局部密度,将数据点分成强点、弱点和噪声点。使用强点构建聚类算法的骨架,通过软投票的方式将弱点分配到与其相似度最高的簇中去。提出了一种基于反向最近邻的簇融合算法,将相似度高的子簇融合,得到最终的聚类结果。实验结果表明,在一些合成数据集和UCI真实数据集上,相比较于其他经典算法,该算法具有更好的聚类效果。 展开更多
关键词 反向最近邻 局部密度 密度聚类算法 子簇融合
在线阅读 下载PDF
基于智能算法的稳定点自动分析方法研究
3
作者 张超 邓扬 +3 位作者 李爱群 周泰翔 李雨航 钟国强 《振动.测试与诊断》 北大核心 2025年第1期65-72,200,共9页
为了提高辨识稳定图中真实模态的准确性与自动化程度,首先,从稳定点定义方式的角度论述了聚类算法效果欠佳的原因,并采用异阶系统非等权重的定义方式输出稳定点;其次,基于数据挖掘思想,采用改进的辨识聚类结构的有序点(ordering points ... 为了提高辨识稳定图中真实模态的准确性与自动化程度,首先,从稳定点定义方式的角度论述了聚类算法效果欠佳的原因,并采用异阶系统非等权重的定义方式输出稳定点;其次,基于数据挖掘思想,采用改进的辨识聚类结构的有序点(ordering points to identify the clustering structure,简称OPTICS)算法自动清洗稳定点集,通过遍历性搜索的方式确定输入参数;然后,提出结合度矩阵去噪的自适应局部密度谱聚类(local density adaptive spectral clustering,简称SC-DA)算法分析稳定点集,并以簇中值作为模态参数的代表值,实现模态参数的自动化识别;最后,将含有密集模态的外滩大桥作为识别对象进行试验验证。试验结果表明:所提出方法具有较高的精度,与频域分解(frequency domain decomposition,简称FDD)法的频率结果最大相差仅为0.012 3 Hz,且在线识别的准确率达到82.86%,显著高于基于层次聚类的自动识别方法,实现了无人工干预下模态参数的自动、准确识别,具有一定的工程应用前景。 展开更多
关键词 模态参数识别 自动化 聚类分析 辨识聚类结构的有序点算法 自适应局部密度谱聚类算法 随机子空间法 稳定图
在线阅读 下载PDF
高密度PCB锡膏喷印的分层路径规划
4
作者 吴振亚 曹鹏彬 +1 位作者 张聪 彭伊丽 《组合机床与自动化加工技术》 北大核心 2025年第1期57-62,68,共7页
针对传统算法求解高密度印制电路板锡膏喷印路径规划问题存在收敛速度慢、易陷入局部最优的不足,提出了一种融合密度峰值聚类算法和蚁群算法的分层路径规划方法。利用密度峰值聚类算法处理分布呈矩形或线形的高密度焊盘,将原始问题分解... 针对传统算法求解高密度印制电路板锡膏喷印路径规划问题存在收敛速度慢、易陷入局部最优的不足,提出了一种融合密度峰值聚类算法和蚁群算法的分层路径规划方法。利用密度峰值聚类算法处理分布呈矩形或线形的高密度焊盘,将原始问题分解为上层聚类中心与下层小规模子问题集合;蚁群算法求解下层子问题获得子路径集合,求解上层聚类中心得到初始全局路径的重组路线;为避免子路径重组过程中陷入局部最优,利用局部搜索算法对初始全局路径进行二次优化,得到最优全局路径。实验结果表明,该分层路径规划方法降低了全局路径求解的复杂度,提升了算法收敛速度,缩短了加工路径总长度,有效提高了高密度印制电路板锡膏喷印的加工效率。 展开更多
关键词 锡膏喷印 分层路径规划 高密度印制电路板 密度峰值聚类 蚁群算法 局部搜索
在线阅读 下载PDF
基于LV-DBSCAN算法的大坝安全监测数据异常检测 被引量:14
5
作者 戴领 李少林 +2 位作者 刘光彪 纪传波 段国学 《人民长江》 北大核心 2024年第1期236-241,共6页
大坝安全监测数据原始序列中常存在异常测值,极大影响了大坝安全监测资料分析的可靠性和准确性。为此,在分析异常值特性及传统异常检测方法优缺点的基础上,分别从局部与整体角度研究监测数据异常检测方法。首先针对多重局部异常系数法... 大坝安全监测数据原始序列中常存在异常测值,极大影响了大坝安全监测资料分析的可靠性和准确性。为此,在分析异常值特性及传统异常检测方法优缺点的基础上,分别从局部与整体角度研究监测数据异常检测方法。首先针对多重局部异常系数法要求数据序列较长且数据等时间间距等缺陷,提出了局部变化异常系数法(LV)及局部方法与整体方法协同判别策略;进一步引入密度聚类算法(DBSCAN),提出了兼顾数据整体与局部特性的LV-DBSCAN异常检测方法。以某混凝土重力坝两垂线测点顺流向位移监测数据为实例,对比分析了不同方法在不同类型数据集上的检测精度。研究结果表明,所提LV-DBSCAN方法适用性更广,准确率更高,误判率更低。 展开更多
关键词 大坝安全监测 异常值 局部变化异常系数法(LV) 密度聚类算法(DBSCAN) 置信度
在线阅读 下载PDF
密度分布函数在聚类算法中的应应用用 被引量:8
6
作者 谭建豪 章兢 李伟雄 《控制理论与应用》 EI CAS CSCD 北大核心 2011年第12期1791-1796,共6页
深入分析了传统的基于密度的聚类方法的特点和存在的问题及讨论了基于密度聚类算法研究现状,提出了一种改进的基于密度分布函数的聚类算法.使用K最近邻(KNN)的思想度量密度以寻找当前密度最大点,即中心点.并使用区域比例,将类从中心点... 深入分析了传统的基于密度的聚类方法的特点和存在的问题及讨论了基于密度聚类算法研究现状,提出了一种改进的基于密度分布函数的聚类算法.使用K最近邻(KNN)的思想度量密度以寻找当前密度最大点,即中心点.并使用区域比例,将类从中心点开始扩展,每次扩展的同时引入半径比例因子以发现核心点.再从该核心点的KNN扩展类,直至密度下降到中心点密度的给定比率时结束.给出了数个算法实例并与基于网格的共享近邻聚类(GNN)算法在聚类准确率和效率上进行了试验比较,试验表明该算法极大降低了基于密度聚类算法对参数的敏感性、改善了对高维密度分布不均数据集的聚类效果、提高了聚类准确率和效率. 展开更多
关键词 聚类算法 KNN GNN 密度分布函数 OPTICS DENCLUE 区域比例 半径比例因子
在线阅读 下载PDF
基于密度分簇的无线传感器网络定位算法 被引量:4
7
作者 王勇 胡良梁 袁巢燕 《电子科技大学学报》 EI CAS CSCD 北大核心 2013年第3期406-409,共4页
针对MDS-MAP(P)算法存在节点间最短路径距离计算误差、合并误差及算法复杂度过高等问题,提出了一种基于密度分簇的算法MDS-MAP(DB)。该算法选择邻居节点数最多的节点作为分簇机制的开始节点,一跳邻居节点组成的簇域内利用三角不等式法... 针对MDS-MAP(P)算法存在节点间最短路径距离计算误差、合并误差及算法复杂度过高等问题,提出了一种基于密度分簇的算法MDS-MAP(DB)。该算法选择邻居节点数最多的节点作为分簇机制的开始节点,一跳邻居节点组成的簇域内利用三角不等式法则测距,两跳内节点组成的簇域内利用最短路径法测距,且每个簇域内只有簇头节点执行测距算法,降低了测距误差及算法计算复杂度,提高了算法的性能。仿真实验结果表明,该算法具有更小的定位误差。 展开更多
关键词 分簇 分布式定位 多维标尺 节点密度 无线传感器网络
在线阅读 下载PDF
一种结合节点局部影响力的标签传播算法 被引量:9
8
作者 许合利 宁念文 牛丽君 《小型微型计算机系统》 CSCD 北大核心 2017年第6期1299-1304,共6页
标签传播算法(LPA)作为一种简单高效的社区挖掘算法一直受到广泛的关注.但是标签传播过程中存在随机性,导致算法鲁棒性差、社区划分结果不稳定.为解决此类问题,本文提出一种结合节点局部影响力的算法(CRD-LPA).该算法综合考虑节点度、... 标签传播算法(LPA)作为一种简单高效的社区挖掘算法一直受到广泛的关注.但是标签传播过程中存在随机性,导致算法鲁棒性差、社区划分结果不稳定.为解决此类问题,本文提出一种结合节点局部影响力的算法(CRD-LPA).该算法综合考虑节点度、邻节点的消息传播能力、局部密度分布等因素,将近似集聚系数和节点局部密度引入到CRD系数的计算中,从而更精确的衡量节点在网络中的重要程度;然后,根据CRD系数对LPA算法的节点标签更新策略进行改进.实验结果表明,改进后的算法不仅提高了社区划分的质量,而且也表现出较好的鲁棒性. 展开更多
关键词 标签传播算法 节点影响力 clusterRank系数 节点局部密度
在线阅读 下载PDF
局部显著单元高维聚类算法 被引量:1
9
作者 宗瑜 李明楚 +1 位作者 徐贯东 张彦春 《电子与信息学报》 EI CSCD 北大核心 2010年第11期2707-2712,共6页
以等宽或随机宽度网格密度单元为基础的高维聚类算法不能保证复杂数据集中的聚类结果的质量。该文在核密度估计和空间统计理论的基础上,给出一种基于局部显著单元的高维聚类算法来处理复杂数据的高维聚类问题。该方法以局部核密度估计... 以等宽或随机宽度网格密度单元为基础的高维聚类算法不能保证复杂数据集中的聚类结果的质量。该文在核密度估计和空间统计理论的基础上,给出一种基于局部显著单元的高维聚类算法来处理复杂数据的高维聚类问题。该方法以局部核密度估计和空间统计理论为基础定义了局部显著单元结构来捕获局部数据分布;设计了能快速发现覆盖数据分布的局部显著区域的贪婪算法;对具有相同属性子集的局部显著单元执行Single-linkage算法发现其中的聚类结果。实验结果表明,以局部显著单元为基础的高维聚类算法能够发现复杂数据集中隐含的高质量聚类结果。 展开更多
关键词 聚类分析 高维聚类算法 核密度估计 局部显著单元
在线阅读 下载PDF
一种基于数据包含度的自动聚类算法 被引量:1
10
作者 马云红 王成汗 +1 位作者 江腾蛟 张堃 《西北工业大学学报》 EI CAS CSCD 北大核心 2016年第5期863-866,共4页
聚类分析是机器学习和模式识别领域的一个重要问题,聚类算法常用于解决这类问题。针对传统聚类算法运算量大、不适应任意分布数据聚类的不足,提出了一种基于数据包含度的自动聚类算法。该算法引入数据包含度的概念,能够自动确定聚类个... 聚类分析是机器学习和模式识别领域的一个重要问题,聚类算法常用于解决这类问题。针对传统聚类算法运算量大、不适应任意分布数据聚类的不足,提出了一种基于数据包含度的自动聚类算法。该算法引入数据包含度的概念,能够自动确定聚类个数和聚类中心,并进一步采用跟随策略实现聚类。多组数据的实验验证了自动聚类算法的有效性。对不同分布的数据进行了自动聚类算法与K-means聚类算法的聚类结果比较,实验结果表明自动聚类算法具有很好的聚类性能。 展开更多
关键词 聚类算法 数据包含度 数据局部密度
在线阅读 下载PDF
基于捕食-被捕食粒子群优化的模糊聚类 被引量:2
11
作者 王琳 罗可 罗永红 《计算机工程与应用》 CSCD 北大核心 2008年第35期129-131,共3页
粒子群优化聚类算法具有参数简单,收敛快等优势,但也有局部极值问题。为解决此问题,提出一种基于捕食-被捕食的粒子群优化模糊聚类算法且聚类中心采用密度函数初始化。捕食者追逐被捕食者中心,加速收敛,而被捕食者逃离捕食者,促进多样性... 粒子群优化聚类算法具有参数简单,收敛快等优势,但也有局部极值问题。为解决此问题,提出一种基于捕食-被捕食的粒子群优化模糊聚类算法且聚类中心采用密度函数初始化。捕食者追逐被捕食者中心,加速收敛,而被捕食者逃离捕食者,促进多样性,以防局部极值出现。实验测试数据表明,算法具有防止局部极值、收敛快、全局寻优能力强等性能优势,能够比较好客观地反映现实世界。 展开更多
关键词 捕食-被捕食 粒子群优化 模糊聚类 密度函数 局部极值
在线阅读 下载PDF
快速识别密度骨架的聚类算法 被引量:5
12
作者 邱保志 唐雅敏 《计算机应用》 CSCD 北大核心 2017年第12期3482-3486,共5页
针对如何快速寻找密度骨架、提高高维数据聚类准确性的问题,提出一种快速识别高密度骨架的聚类(ECLUB)算法。首先,在定义了对象局部密度的基础上,根据互k近邻一致性及近邻点局部密度关系,快速识别出高密度骨架;然后,对未分配的低密度点... 针对如何快速寻找密度骨架、提高高维数据聚类准确性的问题,提出一种快速识别高密度骨架的聚类(ECLUB)算法。首先,在定义了对象局部密度的基础上,根据互k近邻一致性及近邻点局部密度关系,快速识别出高密度骨架;然后,对未分配的低密度点依据邻近关系进行划分,得到最终聚类。人工合成数据集及真实数据集上的实验验证了所提算法的有效性,在Olivetti Face数据集上的聚类结果显示,ECLUB算法的调整兰德系数(ARI)和归一化互信息(NMI)分别为0.877 9和0.962 2。与经典的基于密度的聚类算法(DBSCAN)、密度中心聚类算法(CFDP)以及密度骨架聚类算法(CLUB)相比,所提ECLUB算法效率更高,且对于高维数据聚类准确率更高。 展开更多
关键词 聚类算法 高维数据 K近邻 密度骨架 局部密度
在线阅读 下载PDF
基于量子计算加速的DDC算法
13
作者 刘雪娟 袁家斌 +1 位作者 许娟 段博佳 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第7期1677-1682,共6页
考虑到量子计算具有超强的并行计算能力,拟引入量子计算以降低局部密度和delta距离度量的聚类算法(DDC)计算复杂度。DDC算法的局部密度求解过程是计数算法,提出利用量子计数算法加速局部密度的求解;delta距离是最小值查找的过程,提出利... 考虑到量子计算具有超强的并行计算能力,拟引入量子计算以降低局部密度和delta距离度量的聚类算法(DDC)计算复杂度。DDC算法的局部密度求解过程是计数算法,提出利用量子计数算法加速局部密度的求解;delta距离是最小值查找的过程,提出利用最小值查找量子算法加速delta距离的求解。研究结果表明:利用量子计算对DDC聚类算法进行加速,能够使算法的执行效率获得显著提升。 展开更多
关键词 局部密度 delta距离 聚类算法 量子计算 加速
在线阅读 下载PDF
机器人听觉系统中指纹定位改进方法
14
作者 杨鹏 徐静 王硕朋 《传感技术学报》 CAS CSCD 北大核心 2018年第10期1521-1526,共6页
针对传统指纹定位方法中高定位精度依赖于高参考点密度、计算复杂度高的问题,提出了一种改进的声音位置指纹定位方法。基于声音位置的聚类算法首先被用来构建位置指纹数据库,从而降低在线搜索数据库的计算成本,同时线性插值方法被采用... 针对传统指纹定位方法中高定位精度依赖于高参考点密度、计算复杂度高的问题,提出了一种改进的声音位置指纹定位方法。基于声音位置的聚类算法首先被用来构建位置指纹数据库,从而降低在线搜索数据库的计算成本,同时线性插值方法被采用在选定聚类内生成虚拟参考点来更新数据库,最后,目标位置由声源与虚拟参考点的指纹相似度计算得出。实验结果表明,该方法能有效提高低参考点密度下的系统定位精度,同时算法复杂度低。 展开更多
关键词 听觉定位系统 指纹算法 参考点密度 聚类 线性插值 相似度
在线阅读 下载PDF
基于改进空间模糊聚类的DTI图像分割算法 被引量:9
15
作者 刘絮雨 张相芬 +2 位作者 马燕 李传江 杨燕勤 《中国生物医学工程学报》 CAS CSCD 北大核心 2018年第4期394-403,共10页
针对模糊C均值(FCM)聚类算法初始聚类中心选择的随机性和噪声的敏感性等问题,提出一种基于改进空间模糊聚类的图像分割算法来分割人脑DTI图像。使用局部密度核函数和中心距离函数精确选取初始聚类中心,不仅可以解决因聚类中心随机选取... 针对模糊C均值(FCM)聚类算法初始聚类中心选择的随机性和噪声的敏感性等问题,提出一种基于改进空间模糊聚类的图像分割算法来分割人脑DTI图像。使用局部密度核函数和中心距离函数精确选取初始聚类中心,不仅可以解决因聚类中心随机选取造成的聚类效果不稳定的问题,而且还可以使目标函数迅速收敛,提高分割效率;通过将正态分布空间信息融入模糊隶属度函数,能减小图像噪声以及人为因素对分割结果的影响。用该方法与FCM、SFCM方法对人脑DTI数据进行分割,以评价算法的聚类效果。实验对美国明尼苏达大学生物医学功能成像与神经工程实验室提供的58例DTI数据、3例FA参数图像以及6例迭加过噪声的人脑DTI图像进行分割,结果表明:该算法分割系数最高,可达到0.984 1;在同一图像中,该算法在划分系数上比FCM最高提升20.2%,并且在划分熵上比SFCM最高下降19.8%;该算法目标函数平均迭代次数为32,较FCM的52次与空间FCM的76次有明显降低。实验证明,该算法能够准确、快速地分割出重要目标,且对图像噪声不敏感。 展开更多
关键词 FCM算法 聚类中心 局部密度 空间信息 DTI图像
在线阅读 下载PDF
基于自然最近邻的密度峰值聚类算法 被引量:11
16
作者 汤鑫瑶 张正军 +1 位作者 储杰 严涛 《计算机科学》 CSCD 北大核心 2021年第3期151-157,共7页
针对密度峰值聚类算法(Density Peaks Clustering,DPC)需要人为指定截断距离d c,以及局部密度定义简单和一步分配策略导致算法在复杂数据集上表现不佳的问题,提出了一种基于自然最近邻的密度峰值聚类算法(Density Peaks Clustering base... 针对密度峰值聚类算法(Density Peaks Clustering,DPC)需要人为指定截断距离d c,以及局部密度定义简单和一步分配策略导致算法在复杂数据集上表现不佳的问题,提出了一种基于自然最近邻的密度峰值聚类算法(Density Peaks Clustering based on Natural Nearest Neighbor,NNN-DPC)。该算法无需指定任何参数,是一种非参数的聚类方法。该算法首先根据自然最近邻的定义,给出新的局部密度计算方法来描述数据的分布,揭示内在的联系;然后设计了两步分配策略来进行样本点的划分。最后定义了簇间相似度并提出了新的簇合并规则进行簇的合并,从而得到最终聚类结果。实验结果表明,在无需参数的情况下,NNN-DPC算法在各类数据集上都有优秀的泛化能力,对于流形数据或簇间密度差异大的数据能更加准确地识别聚类数目和分配样本点。与DPC、FKNN-DPC(Fuzzy Weighted K-nearest Density Peak Clustering)以及其他3种经典聚类算法的性能指标相比,NNN-DPC算法更具优势。 展开更多
关键词 聚类算法 自然最近邻居 密度峰值 局部密度
在线阅读 下载PDF
分层递进的改进聚类蚁群算法解决TSP问题 被引量:19
17
作者 冯志雨 游晓明 刘升 《计算机科学与探索》 CSCD 北大核心 2019年第8期1280-1294,共15页
随着旅行商问题(TSP)规模的增大,传统蚁群算法的运行时间会增大,算法的解精度也会降低,并且算法很容易陷入局部最优的情况。提出的分层递进算法的思想源于分工合作的产品线组装流程,首先利用改进的密度峰聚类算法确定拐点,从而选举出聚... 随着旅行商问题(TSP)规模的增大,传统蚁群算法的运行时间会增大,算法的解精度也会降低,并且算法很容易陷入局部最优的情况。提出的分层递进算法的思想源于分工合作的产品线组装流程,首先利用改进的密度峰聚类算法确定拐点,从而选举出聚类中心,根据聚类中心确定包含的数据点;其次将初始的TSP问题分割成较小的簇,这些簇称为二类TSP问题;再经自适应信息素更新策略的蚁群算法运算,找出每个簇的最优解,进一步将簇与簇之间相近的节点构成的边断开;然后两簇之间断开的节点重组成全局最优解;最终通过局部优化策略对重组的优化解进一步优化,从而在保证算法解质量的前提下有效地缩短了运行时间。从TSPLIB中选取小规模、大规模基准案例,通过Matlab仿真验证了改进算法具有更好的鲁棒性,特别是在大规模基准案例中显著地减少了算法运行时间。 展开更多
关键词 分层递进 密度峰聚类 蚁群算法 局部优化 旅行商问题(TSP)
在线阅读 下载PDF
基于加权共享近邻与累加序列的密度峰值算法 被引量:6
18
作者 王芙银 张德生 肖燕婷 《计算机工程》 CAS CSCD 北大核心 2022年第4期61-69,共9页
密度峰值聚类(DPC)算法在对密度分布差异较大的数据进行聚类时效果不佳,聚类结果受局部密度及其相对距离影响,且需要手动选取聚类中心,从而降低了算法的准确性与稳定性。为此,提出一种基于加权共享近邻与累加序列的密度峰值算法DPC-WSN... 密度峰值聚类(DPC)算法在对密度分布差异较大的数据进行聚类时效果不佳,聚类结果受局部密度及其相对距离影响,且需要手动选取聚类中心,从而降低了算法的准确性与稳定性。为此,提出一种基于加权共享近邻与累加序列的密度峰值算法DPC-WSNN。基于加权共享近邻重新定义局部密度的计算方式,以避免截断距离选取不当对聚类效果的影响,同时有效处理不同类簇数据集分布不均的问题。在原有DPC算法决策值的基础上,生成一组累加序列,将累加序列的均值作为聚类中心和非聚类中心的临界点从而实现聚类中心的自动选取。利用人工合成数据集与UCI上的真实数据集测试与评估DPC-WSNN算法,并将其与FKNN-DPC、DPC、DBSCAN等算法进行比较,结果表明,DPC-WSNN算法具有更好的聚类表现,聚类准确率较高,鲁棒性较强。 展开更多
关键词 密度峰值聚类算法 局部密度 加权共享近邻 累加序列 聚类中心
在线阅读 下载PDF
融合最近邻矩阵与局部密度的自适应K-means聚类算法 被引量:6
19
作者 艾力米努尔·库尔班 谢娟英 姚若侠 《计算机科学与探索》 CSCD 北大核心 2023年第2期355-366,共12页
针对传统K-means聚类算法对初始聚类中心和离群孤立点敏感的缺陷,以及现有引入密度概念优化的K-means算法均需要设置密度参数或阈值的缺点,提出一种融合最近邻矩阵与局部密度的自适应K-means聚类算法。受最邻近吸收原则与密度峰值原则启... 针对传统K-means聚类算法对初始聚类中心和离群孤立点敏感的缺陷,以及现有引入密度概念优化的K-means算法均需要设置密度参数或阈值的缺点,提出一种融合最近邻矩阵与局部密度的自适应K-means聚类算法。受最邻近吸收原则与密度峰值原则启发,通过引入数据对象间的距离差异值构造邻近矩阵,根据邻近矩阵计算局部密度,不需要任何参数设置,采取最近邻矩阵与局部密度融合策略,自适应确定初始聚类中心数目和位置,同时完成非中心点的初分配。人工数据集和UCI数据集的实验测试,以及与传统K-means算法、基于离群点改进的K-means算法、基于密度改进的K-means算法的实验比较表明,提出的自适应K-means算法对人工数据集的孤立点免疫度较高,对UCI数据集具有更准确的聚类结果。 展开更多
关键词 自适应K-means聚类算法 密度峰值原则 最邻近吸收原则 局部密度
在线阅读 下载PDF
结合K近邻的改进密度峰值聚类算法 被引量:22
20
作者 薛小娜 高淑萍 +1 位作者 彭弘铭 吴会会 《计算机工程与应用》 CSCD 北大核心 2018年第7期36-43,共8页
针对密度峰值聚类算法(DPC)在处理维数较高、含噪声及结构复杂数据集时聚类性能不佳问题,提出一种结合K近邻的改进密度峰值聚类算法(IDPCA)。该算法首先给出新的局部密度度量方法来描述每个样本在空间中的分布情况,然后引入核心点的概... 针对密度峰值聚类算法(DPC)在处理维数较高、含噪声及结构复杂数据集时聚类性能不佳问题,提出一种结合K近邻的改进密度峰值聚类算法(IDPCA)。该算法首先给出新的局部密度度量方法来描述每个样本在空间中的分布情况,然后引入核心点的概念并结合K近邻思想设计了全局搜索分配策略,通过不断将核心点的未分配K近邻正确归类以加快聚类速度,进而提出一种基于K近邻加权的统计学习分配策略,利用剩余点的K近邻加权信息来确定其被分配到各局部类的概率,有效提高了聚类质量。实验结果表明,IDPCA算法在21个典型的测试数据集上均有良好的适用性,而在与DPC算法及另外3种典型聚类算法的性能指标对比上,其优势更为明显。 展开更多
关键词 数据挖掘 聚类算法 局部密度 密度峰值 K近邻
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部