期刊文献+
共找到682篇文章
< 1 2 35 >
每页显示 20 50 100
基于密度的多度量空间数据聚类算法 被引量:1
1
作者 朱轶凡 罗程阳 +3 位作者 马瑞遥 陈璐 毛玉仁 高云君 《软件学报》 北大核心 2025年第2期851-873,共23页
具有噪声的基于密度的数据聚类(DBSCAN)算法是数据挖掘领域中的经典方法之一,其不仅能发现数据中潜藏的复杂关系,还能过滤其中的数据噪声,从而获得高质量的数据聚类.然而,现有的基于密度的数据聚类算法仅支持单模态(类型)数据的聚类,难... 具有噪声的基于密度的数据聚类(DBSCAN)算法是数据挖掘领域中的经典方法之一,其不仅能发现数据中潜藏的复杂关系,还能过滤其中的数据噪声,从而获得高质量的数据聚类.然而,现有的基于密度的数据聚类算法仅支持单模态(类型)数据的聚类,难以应对多模态(类型)数据并存的应用场景.随着信息技术的快速发展,数据呈现多模态化的发展态势,现实生活中的数据不再是单一的数据类型,而是多种数据模态(类型)的组合,如文本、图像、地理坐标、数据特征等.因此,现有的数据聚类方法难以对复杂的多模态数据进行有效的数据建模,更无法进行高效的多模态数据聚类.基于此,提出一种基于密度的多度量空间聚类算法.首先,为了刻画多模态数据间的复杂关系,利用多度量空间表征数据之间的相似性关系,并且利用聚合多度量图索引(AMG)实现多模态数据建模.接着,利用差分化的相似性关系优化聚合多度量图的图结构,并且结合最优策略优先的搜索策略进行剪枝,以实现高效的多模态数据聚类.最后,在真实与合成数据集上针对多种参数设置进行实验.实验结果验证了所提方法运行效率提升了至少1个数量级,并具有较高的聚类精度与良好的可扩展性. 展开更多
关键词 多度量空间 多度量图 基于密度的数据 数据挖掘 多模态数据
在线阅读 下载PDF
基于多次密度空间聚类算法的多逆变器并网同步稳定物理表征
2
作者 范宏 彭瑞 +1 位作者 张树卿 唐绍普 《南方电网技术》 北大核心 2025年第6期173-183,共11页
新能源电源通过逆变器实现并网,其并网系统的电压幅值、相位、频率等物理量在电磁、机电等多时间尺度均存在强交互耦合,准确把握并网逆变器的同步稳定主导行为特征是目前的热点问题。为此,提出了一种多次密度空间聚类(density-based spa... 新能源电源通过逆变器实现并网,其并网系统的电压幅值、相位、频率等物理量在电磁、机电等多时间尺度均存在强交互耦合,准确把握并网逆变器的同步稳定主导行为特征是目前的热点问题。为此,提出了一种多次密度空间聚类(density-based spatial clustering of applications with Noise,DBSCAN)算法来分析多逆变器并网系统同步稳定的物理表征。首先建立了跟网型和构网型逆变器并网模型,分析了其同步控制单元的同步特性;其次利用所提算法实现对并网逆变器与公共连接点的相位差、逆变器功角、系统频率等仿真数据的聚类和分类;最后通过仿真分析表明,逆变器并网系统同步稳定特征表现为功角逐步恢复原来运行状态和新稳态,此外,系统同步稳定与频率稳定具有一致性。不同的是,跟网型同步控制单元成功锁相可以表征其系统的同步稳定,而构网型同步控制单元无法表征。 展开更多
关键词 逆变器 跟网型控制 构网型控制 同步稳定 密度空间
在线阅读 下载PDF
改进的密度峰值聚类算法在岩体结构面优势分组中的应用
3
作者 王述红 高晨翔 侯钦宽 《东北大学学报(自然科学版)》 北大核心 2025年第3期130-137,共8页
岩体稳定性评价依赖于合理的结构面分组,但传统方法存在易受边缘点与异常点影响的弊端.为此,提出一种改进的密度峰值聚类算法用于结构面优势分组.首先,将结构面产状转换为空间坐标,并以单位法向量夹角正弦值的平方作为相似性度量.随后,... 岩体稳定性评价依赖于合理的结构面分组,但传统方法存在易受边缘点与异常点影响的弊端.为此,提出一种改进的密度峰值聚类算法用于结构面优势分组.首先,将结构面产状转换为空间坐标,并以单位法向量夹角正弦值的平方作为相似性度量.随后,基于有效性评价指标构建目标函数,并利用乌鸦算法优化截断距离以获取最佳分组结果.通过模拟数据集验证了该算法能够有效减少人为干预,避免异常点干扰,确保聚类结果更加可靠和合理.结果表明,所提方法不仅与传统方法一致性良好,还具有更高的适用性,为工程中结构面优势分组提供了可靠的参考. 展开更多
关键词 密度峰值 乌鸦算法 有效性评价指标 结构面 优势分组
在线阅读 下载PDF
基于反向最近邻的密度估计聚类算法
4
作者 许梅梅 侯新民 《计算机工程与应用》 北大核心 2025年第1期165-173,共9页
基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类... 基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类算法(RNN-DEC)。该算法引入反向最近邻来计算数据点的局部密度,将数据点分成强点、弱点和噪声点。使用强点构建聚类算法的骨架,通过软投票的方式将弱点分配到与其相似度最高的簇中去。提出了一种基于反向最近邻的簇融合算法,将相似度高的子簇融合,得到最终的聚类结果。实验结果表明,在一些合成数据集和UCI真实数据集上,相比较于其他经典算法,该算法具有更好的聚类效果。 展开更多
关键词 反向最近邻 局部密度 密度算法 子簇融合
在线阅读 下载PDF
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:2
5
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 半监督学习 机器学习 神经网络 K-MEANS 特征空间增强 mixup算法
在线阅读 下载PDF
基于多层次密度中心图的聚类算法 被引量:1
6
作者 卢建云 邵俊明 《计算机工程与科学》 北大核心 2025年第2期327-335,共9页
密度聚类是一种依据数据对象之间的密度关系进行聚类的算法。密度聚类通过判断数据集中低密度对象与密度中心对象的隶属关系实现对数据集的划分,能够有效地处理数据集中各种大小、不同形状和密度的簇。然而,受到数据集变密度、噪声和复... 密度聚类是一种依据数据对象之间的密度关系进行聚类的算法。密度聚类通过判断数据集中低密度对象与密度中心对象的隶属关系实现对数据集的划分,能够有效地处理数据集中各种大小、不同形状和密度的簇。然而,受到数据集变密度、噪声和复杂分布的影响,如何准确估计数据对象的局部密度并通过密度中心确定聚类数目仍是需要研究的问题。针对上述密度聚类问题提出一种多层次密度中心图的聚类算法CMDCG。首先,基于每个数据对象的邻域,利用信息熵计算其局部密度;其次,依据局部密度和邻域空间确定每个数据对象的隶属关系并确定密度中心;最后,通过变化邻域空间得到多层次密度中心,根据多层次密度中心的隶属关系构建图结构,得到图的连通分量即为初始聚类,其他数据对象根据隶属关系划归到对应的初始聚类。在人工和真实数据集上的实验结果表明,CMDCG算法能够准确地识别聚类数目并形成正确的初始聚类,算法对变密度和噪声情况下的数据集有很好的鲁棒性。 展开更多
关键词 密度 多层次密度中心 连通图 信息熵 邻域空间
在线阅读 下载PDF
基于非局部信息和子空间的模糊C有序均值聚类的图像分割算法
7
作者 陈阳 黄成泉 +3 位作者 覃小素 彭家磊 雷欢 周丽华 《计算机辅助设计与图形学学报》 北大核心 2025年第3期506-518,共13页
针对模糊C有序均值聚类算法没有考虑图像空间信息,导致难以有效地分割含噪图像的问题,提出一种基于非局部信息和子空间的模糊C有序均值聚类(non-local information and subspace for fuzzy C-ordered means,SFCOM-NLS)算法.首先,利用图... 针对模糊C有序均值聚类算法没有考虑图像空间信息,导致难以有效地分割含噪图像的问题,提出一种基于非局部信息和子空间的模糊C有序均值聚类(non-local information and subspace for fuzzy C-ordered means,SFCOM-NLS)算法.首先,利用图像中给定的相似邻域结构的像素提取当前像素的非局部空间信息;其次,计算每个像素的典型性,并对其进行排序,在每次迭代中更新像素的典型性,提高像素聚类的准确性,解决在聚类过程中存在相似类导致的误分类问题;最后,引入子空间聚类概念,为图像不同维度分配适当的权重,提高彩色图像的分割性能.在含噪合成图像和公开数据集BSDS500,MSRA100和AID上实验结果表明,所提算法的模糊划分系数、模糊划分熵、分割精度和标准化互信息平均值分别达到了95.00%,6.66%,98.77%和95.54%,均优于对比的同类算法. 展开更多
关键词 非局部空间信息 空间 模糊C有序均值 噪声图像分割 鲁棒性
在线阅读 下载PDF
基于高斯分布的自适应密度峰值聚类算法
8
作者 李启文 王治和 +1 位作者 杜辉 鲁德鹏 《计算机工程》 北大核心 2025年第4期137-148,共12页
密度峰值聚类(DPC)算法可以发现任意形状的簇,对噪声具有鲁棒性,因此被广泛应用于各个领域。但DPC算法需要人工选取聚类中心,对于密度不均匀型数据集表现较差。为此,提出一种基于高斯分布的自适应密度峰值聚类算法。首先,计算局部密度... 密度峰值聚类(DPC)算法可以发现任意形状的簇,对噪声具有鲁棒性,因此被广泛应用于各个领域。但DPC算法需要人工选取聚类中心,对于密度不均匀型数据集表现较差。为此,提出一种基于高斯分布的自适应密度峰值聚类算法。首先,计算局部密度和相对距离的乘积θ_(i),通过Z-score标准化方法,将θ_(i)映射到符合高斯分布的二维空间中,利用高斯分布的标准偏差来自适应选取聚类中心,得到聚类中心集合;其次,将其余数据点分配到离其最近的聚类中心所在的簇中,得到初步划分结果;最后,设计缝合因子模型,计算簇间缝合系数,当缝合系数大于阈值时合并初步划分结果中最相似簇并更新相似度矩阵,直至完成合并得到最终结果。在人工数据集和真实数据集上的实验结果表明,与DBSCAN算法、DPC算法和ICKDC算法对比,所提算法的聚类准确度更高,聚类性能更佳。 展开更多
关键词 密度峰值算法 高斯分布 Z-score标准化 缝合因子 簇间相似度
在线阅读 下载PDF
面向Shapelet空间的多变量时间序列密度聚类算法 被引量:4
9
作者 盛锦超 杜明晶 +1 位作者 孙嘉睿 李宇蕊 《计算机科学与探索》 CSCD 北大核心 2024年第2期387-402,共16页
多变量时间序列聚类问题已经成为时间序列分析任务中重要的研究课题,相较于单变量时间序列,多变量时间序列的研究复杂性更高,难度更大。尽管当前已经提出了许多针对多变量时间序列的聚类算法,但是这些算法在精度和解释性方面仍旧不足。... 多变量时间序列聚类问题已经成为时间序列分析任务中重要的研究课题,相较于单变量时间序列,多变量时间序列的研究复杂性更高,难度更大。尽管当前已经提出了许多针对多变量时间序列的聚类算法,但是这些算法在精度和解释性方面仍旧不足。其一,当前大部分工作并未考虑多变量时间序列的长度冗余性和变量相关性等问题,导致最终得到的相似性矩阵具有较大误差;其二,数据在聚类过程中普遍采用划分范式,当数值空间呈现复杂分布时该思想表现不佳,并且不具备对各个变量及空间的解释力。针对上述问题,提出了一种面向Shapelet(富有高信息量的连续子序列)空间的多变量时间序列自适应权重密度聚类算法(MDCS)。算法首先对各个变量进行Shapelet搜索,通过自适应策略获取到各自的Shapelet空间,接着对各个变量产生的数值分布进行组合加权,得到了更符合数据分布特征的相似度矩阵,最后利用改进密度计算和二次分配的共享最近邻密度峰值聚类算法对数据进行最终分配。在真实数据集上的实验结果证明,与目前先进的聚类算法相比,MDCS拥有更好的聚类结果,在标准化互信息和兰德系数指标上平均提高了0.344与0.09,兼顾了性能与可解释性。 展开更多
关键词 多变量时间序列 子序列 Shapelet空间 密度峰值 数据挖掘
在线阅读 下载PDF
基于空间密度的群以噪声发现聚类算法研究 被引量:19
10
作者 毕方明 王为奎 陈龙 《南京大学学报(自然科学版)》 CSCD 北大核心 2012年第4期491-498,共8页
针对基于密度的群以噪声发现聚类算法(density-based spatial clustering of applications withnoise,DBSCAN)的所需内存及I/O消耗大;空间聚类的密度不均匀时,采用全局统一的变量,聚类质量较差;对于输入参数敏感性较高等三个不足进行了... 针对基于密度的群以噪声发现聚类算法(density-based spatial clustering of applications withnoise,DBSCAN)的所需内存及I/O消耗大;空间聚类的密度不均匀时,采用全局统一的变量,聚类质量较差;对于输入参数敏感性较高等三个不足进行了改进.首先根据数据的空间分布特性,将整个数据空间划分为多个较小的分区,使分区的局部密度相对更均匀;然后将每个局部分区运用改进的DBSCAN算法进行聚类,改进的算法可以根据空间数据的分布,对一个中心点自适应的选取近邻,并对这些近邻点进行取样、扩展,有效提高了算法的准确性和效率;接着将所得到的聚类结果按照合并规则进行合并.最后通过仿真实验,验证了改进的DBSCAN算法解决了内存消耗过大、聚类质量差及全局参数敏感的问题. 展开更多
关键词 数据挖掘 空间 基于密度的群以噪声发现 数据分区 参数自适应
在线阅读 下载PDF
基于聚类集成的地下空间地质环境质量三维评价 被引量:1
11
作者 熊芸莹 李晓晖 +3 位作者 袁峰 卢志堂 吴少元 窦帆帆 《合肥工业大学学报(自然科学版)》 北大核心 2025年第1期78-84,91,共8页
城市地下空间开发利用是解决城市土地资源紧缺的重要手段,地下空间地质环境质量评价是地下空间合理安全利用和降低开发风险的前提和保障。为了降低评价过程中的主观性和评价结果中多种评价指标交叉交融的不确定性,文章基于三维地质模型... 城市地下空间开发利用是解决城市土地资源紧缺的重要手段,地下空间地质环境质量评价是地下空间合理安全利用和降低开发风险的前提和保障。为了降低评价过程中的主观性和评价结果中多种评价指标交叉交融的不确定性,文章基于三维地质模型,采用多种聚类模型的聚类集成算法对地下空间地质环境质量进行评价。利用K-means、高斯混合模型、自组织神经网络等聚类模型计算结果,结合重标记法的聚类集成算法实现地质环境质量评价。以厦门市某区为例,基于三维评价指标信息,利用上述分析方法进行评价,并与层次分析法结合多级指数叠加法评价结果进行对比分析。结果表明,基于聚类集成的评价方法能够有效应用于地下空间地质环境质量三维分类及评价研究,相关评价结果可以更客观地为地下空间的安全合理开发提供支持和保障,更好地服务于城市地下空间的建设规划和可持续发展。 展开更多
关键词 地下空间 自组织神经网络 K-MEANS算法 高斯混合模型 集成 三维
在线阅读 下载PDF
基于空间插值的不规则海洋地质样品测试分析数据聚类算法研究 被引量:1
12
作者 邵长高 严镔 陈秋 《热带海洋学报》 CAS CSCD 北大核心 2024年第2期166-172,共7页
海洋地质调查中获取大量海洋沉积物柱状样样品测试分析数据,样品测试分析目的不同导致柱状样数据采样深度不同,由此造成地质取样数据在三维空间上呈现不规则散点状分布。传统聚类算法无法在三维空间上对此类不规则散点数据进行聚类分析... 海洋地质调查中获取大量海洋沉积物柱状样样品测试分析数据,样品测试分析目的不同导致柱状样数据采样深度不同,由此造成地质取样数据在三维空间上呈现不规则散点状分布。传统聚类算法无法在三维空间上对此类不规则散点数据进行聚类分析。对此,文章设计了一种基于空间插值的不规则地质样品测试分析数据聚类算法,有效地将三维样品测试分析散点数据降为二维数据后进行聚类分析,本算法较好地解决了地质体中试验测试数据的不均衡性问题,为海洋地质大数据分析提供了基础技术方法。 展开更多
关键词 地质取样 实验测试 算法 空间插值 三维
在线阅读 下载PDF
基于聚类算法的钢轨内部伤损检测与分类
13
作者 吴福培 周旭 李昇平 《铁道学报》 北大核心 2025年第8期134-142,共9页
准确检测钢轨内部伤损对确保列车的运行安全具有重要意义。为提高钢轨内部伤损智能检测的学习能力,提出一种基于聚类算法的钢轨内部伤损检测与分类方法。首先,通过分析B型图像噪声特征提出基于游程编码的噪声去除方法,有效去除噪声并保... 准确检测钢轨内部伤损对确保列车的运行安全具有重要意义。为提高钢轨内部伤损智能检测的学习能力,提出一种基于聚类算法的钢轨内部伤损检测与分类方法。首先,通过分析B型图像噪声特征提出基于游程编码的噪声去除方法,有效去除噪声并保留关键信息。其次,基于轨头、轨腰、轨底三个区域常见伤损特征的分布规律,提出一种基于多维特征融合的聚类算法(CMF),以实现对钢轨内部伤损的准确分类。最后,由开发的伤损检测仪采集的76张钢轨B型图像进行伤损检测和分类,评估所提方法的准确性。实验结果表明,样品集所含的1554个伤损中,本文所提出方法的平均检测分类正确率为97.55%,漏检率为1.93%,其中轨头区域、轨腰区域和轨底区域的伤损检测正确率分别为99.03%、96.21%和97.99%,而对应漏检率分别为0.72%、2.79%和2.01%,实验结果验证了所提方法的有效性。 展开更多
关键词 钢轨内部伤损 缺陷检测 算法 噪声去除
在线阅读 下载PDF
基于密度分布的鲁棒谱聚类算法 被引量:1
14
作者 李超 廖红梅 +2 位作者 徐晓 郭丽丽 丁世飞 《计算机学报》 EI CAS CSCD 北大核心 2024年第11期2645-2663,共19页
谱聚类作为一种基于图论的聚类方法,通过相似性矩阵对数据进行特征分解或将数据投影到低维空间以实现更好的数据划分.谱聚类因其适用于复杂数据和非凸子簇而受到广泛的关注,并已成功应用在很多领域.然而,计算复杂度高、噪声敏感等问题... 谱聚类作为一种基于图论的聚类方法,通过相似性矩阵对数据进行特征分解或将数据投影到低维空间以实现更好的数据划分.谱聚类因其适用于复杂数据和非凸子簇而受到广泛的关注,并已成功应用在很多领域.然而,计算复杂度高、噪声敏感等问题会限制其聚类效果的进一步提升.针对这些问题,本文提出了一种基于密度分布的鲁棒谱聚类算法.首先,设置噪声系数以过滤少量的低密度噪声点.其次,根据密度峰值聚类具有的特性,即尽可能多地划分数据能够保证子簇内数据标签的一致性,新提出的算法能够在较少的子簇数和更高的簇内标签一致性上达到平衡,实现了对数据更加优质的划分.最后,基于簇间密度分布的相似性度量改善了谱聚类在密度不均匀数据集上的聚类效果.合成数据以及真实数据上的实验充分证明了新算法在9个最新改进算法中的有效性.在保证聚类效率的前提下,新算法在真实数据上的准确率、调整兰德系数和调整互信息的平均值上至少分别提升了10.02%、22.11%和15.76%. 展开更多
关键词 密度分布 子簇相似性 局部峰值 噪声检测
在线阅读 下载PDF
基于密度噪声应用空间聚类算法的机载激光雷达建筑物点云提取与单体化 被引量:18
15
作者 吕富强 唐诗华 +1 位作者 何广焕 蒙金龙 《科学技术与工程》 北大核心 2022年第9期3446-3452,共7页
针对机载激光雷达建筑物点云提取过程中自动化提取困难,以及提取后的建筑物单体化过程烦琐等问题,提出一种基于密度噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法的机载雷达建筑物点云提... 针对机载激光雷达建筑物点云提取过程中自动化提取困难,以及提取后的建筑物单体化过程烦琐等问题,提出一种基于密度噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法的机载雷达建筑物点云提取与单体化的方法。该方法对预处理后的点云数据基于DBSCAN算法进行去噪与初步的提取,通过三维密度聚类,将建筑物的点云进行提取与自动单体化。根据建筑物点云密度的特点,进行二维的密度聚类,结合数字正射影像图(digital orthophoto map,DOM)进行点云分割。最后将处理后的点云数据进行优化处理,并将建筑物单体化簇类进行提取,得到单体化建筑物点云。结果表明:提取的建筑物点云数量正确率为97.36%,轮廓边长的中误差为0.077,可以有效地提取出建筑物点云并将其单体化。 展开更多
关键词 机载激光雷达 建筑物点云 基于密度噪声应用空间(DBSCAN) 密度 点云提取 单体化
在线阅读 下载PDF
一种基于密度的空间数据流在线聚类算法 被引量:28
16
作者 于彦伟 王沁 +1 位作者 邝俊 何杰 《自动化学报》 EI CSCD 北大核心 2012年第6期1051-1059,共9页
为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点... 为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点及其满足核心点条件的邻域数据做局部聚类更新,降低聚类更新的时间复杂度,实现对空间数据流的在线聚类.OLDStream算法具有快速处理大规模空间数据流、实时获取全局任意形状的聚类簇结果、对数据流的输入顺序不敏感、并能发现孤立点数据等优势.在真实数据和合成数据上的综合实验验证了算法的聚类效果、高效率性和较高的可伸缩性,同时实验结果的统计分析显示仅有4%的空间点消耗最坏运行时间,对每个空间点的平均聚类时间约为0.033ms. 展开更多
关键词 空间数据挖掘 数据流 基于密度 在线算法 噪声处理
在线阅读 下载PDF
基于类簇合并的无参数密度峰值聚类算法 被引量:1
17
作者 刘天娇 王胜景 袁永生 《现代电子技术》 北大核心 2024年第8期1-8,共8页
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚... 密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。 展开更多
关键词 分析 密度峰值算法 初始 簇合并 相似度 性能
在线阅读 下载PDF
基于人工鱼群的自适应密度峰值聚类算法 被引量:1
18
作者 何凯琳 张正军 +1 位作者 位雅 唐莉 《计算机工程与设计》 北大核心 2024年第1期110-119,共10页
针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,... 针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,根据两个相邻簇的簇间边界区域密度与簇平均密度构造簇间合并规则,利用人工鱼群算法寻找使改进轮廓系数指标达到最大值时的最优截断距离d_(c)。在合成数据集和真实数据集上的实验结果表明,AFSADPC算法具有较好的聚类效果。 展开更多
关键词 密度峰值 算法 人工鱼群算法 截断距离 幂律分布 簇合并策略 轮廓系数
在线阅读 下载PDF
融合优化可调Q因子小波变换的改进密度峰值聚类算法 被引量:1
19
作者 史曼曼 宋朝炀 张景祥 《计算机应用研究》 CSCD 北大核心 2024年第2期466-472,共7页
为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化... 为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化选择策略及改进粒子群优化算法确定的最佳Q因子分解时序信号,通过最优特征子带的能量、均值、标准差和模糊熵构建特征子空间,并采用主成分分析降低特征维度,以减少特征冗余。同时,考虑到距离较远而周围密集程度较大的K近邻样本对局部密度的贡献率,引入权重系数及K近邻重新定义DPC的局部密度,并利用共享最近邻描述样本间的相似性。在BONN癫痫脑电信号和CWRU滚动轴承数据集上进行对比实验,结果表明,该算法的聚类精度分别为95%、94%,且Jacarrd、FMI和F_(1)值指标均优于其他对比算法,证明了OTQWT-IDPC算法的有效性。 展开更多
关键词 密度峰值算法 可调Q因子小波变换 粒子群优化算法 主成分分析
在线阅读 下载PDF
基于优化密度的耦合空间LDA文本聚类算法研究 被引量:8
20
作者 邢长征 赵全颖 +1 位作者 王伟 王星 《计算机应用研究》 CSCD 北大核心 2017年第7期1966-1970,共5页
针对传统的空间向量模型在进行文本表示时计算相似度仅采用词频统计来表示文本以及对高维文本数据聚类效果有所下降等问题,提出一种基于优化密度的耦合空间LDA文本聚类算法。该算法利用提出的耦合空间模型和LDA主题模型线性融合计算文... 针对传统的空间向量模型在进行文本表示时计算相似度仅采用词频统计来表示文本以及对高维文本数据聚类效果有所下降等问题,提出一种基于优化密度的耦合空间LDA文本聚类算法。该算法利用提出的耦合空间模型和LDA主题模型线性融合计算文本相似度,并对阈值敏感问题进行优化,确定不同密度区域对应的阈值半径。实验结果表明,与改进的DBSCAN文本聚类算法和R-DBSCAN文本聚类算法相比,该算法的文本聚类精度更高、聚类效果更优。 展开更多
关键词 文本 耦合空间模型 LDA主题模型 密度 阈值
在线阅读 下载PDF
上一页 1 2 35 下一页 到第
使用帮助 返回顶部