期刊文献+
共找到51篇文章
< 1 2 3 >
每页显示 20 50 100
基于密度的面板数据聚类分析 被引量:7
1
作者 杨娟 谢远涛 《统计与信息论坛》 CSSCI 2014年第2期23-28,共6页
研究面板数据聚类问题过程中,在相似性度量上,用Logistic回归模型构造相似系数和非对称相似矩阵。在聚类算法上,目前的聚类算法只适用于对称的相似矩阵。在非对称相似矩阵的聚类算法上,采用最佳优先搜索和轮廓系数,改进DBSCAN聚类方法,... 研究面板数据聚类问题过程中,在相似性度量上,用Logistic回归模型构造相似系数和非对称相似矩阵。在聚类算法上,目前的聚类算法只适用于对称的相似矩阵。在非对称相似矩阵的聚类算法上,采用最佳优先搜索和轮廓系数,改进DBSCAN聚类方法,提出BF—DBSCAN方法。通过实例分析,比较了BF—DBSCAN和DBSCAN方法的聚类结果,以及不同参数设置对BF—DBSCAN聚类结果的影响,验证了该方法的有效性和实用性。 展开更多
关键词 面板数据聚类 LOGISTIC回归模型 基于密度的应用噪声的空间聚类 最佳优先搜索 轮廓系数
在线阅读 下载PDF
基于相对密度的军事高维数据噪声点检测方法 被引量:2
2
作者 王伟一 郝文宁 +1 位作者 赵水宁 蒋维 《计算机工程》 CAS CSCD 北大核心 2009年第5期50-52,共3页
军事训练领域的特殊性造成其相关数据存在大量的噪声点,同时也为噪声检测算法提出了相应的要求。分析现有数据噪声点检测算法,提出将数据属性分为空间属性、环境属性、特征属性,利用空间属性确定数据对象的分类,利用环境属性确定具有不... 军事训练领域的特殊性造成其相关数据存在大量的噪声点,同时也为噪声检测算法提出了相应的要求。分析现有数据噪声点检测算法,提出将数据属性分为空间属性、环境属性、特征属性,利用空间属性确定数据对象的分类,利用环境属性确定具有不同特征的数据对象邻域,利用特征属性计算离群度。改进了基于相对密度的离群度计算方法,提出LRDF算法,实验结果表明,该方法有效地提高了噪声点检测的精度和效率,增强算法可用性。 展开更多
关键词 军事训练数据 数据挖掘 噪声点检测 相对密度 属性分类
在线阅读 下载PDF
一种基于密度的空间数据流在线聚类算法 被引量:28
3
作者 于彦伟 王沁 +1 位作者 邝俊 何杰 《自动化学报》 EI CSCD 北大核心 2012年第6期1051-1059,共9页
为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点... 为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点及其满足核心点条件的邻域数据做局部聚类更新,降低聚类更新的时间复杂度,实现对空间数据流的在线聚类.OLDStream算法具有快速处理大规模空间数据流、实时获取全局任意形状的聚类簇结果、对数据流的输入顺序不敏感、并能发现孤立点数据等优势.在真实数据和合成数据上的综合实验验证了算法的聚类效果、高效率性和较高的可伸缩性,同时实验结果的统计分析显示仅有4%的空间点消耗最坏运行时间,对每个空间点的平均聚类时间约为0.033ms. 展开更多
关键词 空间数据挖掘 聚类数据 基于密度的聚类 在线算法 噪声处理
在线阅读 下载PDF
基于密度网格的数据流聚类算法 被引量:11
4
作者 米源 杨燕 李天瑞 《计算机科学》 CSCD 北大核心 2011年第12期178-181,共4页
针对基于密度网格的数据流聚类算法中存在的缺陷进行改进,提出一种基于D-Stream算法的改进算法NDD-Stream。算法通过统计网格单元的密度与簇的数目,动态确定网格单元的密度阈值;对位于簇边界的网格单元采用不均匀划分,以提高簇边界的聚... 针对基于密度网格的数据流聚类算法中存在的缺陷进行改进,提出一种基于D-Stream算法的改进算法NDD-Stream。算法通过统计网格单元的密度与簇的数目,动态确定网格单元的密度阈值;对位于簇边界的网格单元采用不均匀划分,以提高簇边界的聚类精度。合成与真实数据集上的实验结果表明,算法能够在数据流对象上取得良好的聚类质量。 展开更多
关键词 数据挖掘 数据 聚类分析 密度网格 不均匀划分
在线阅读 下载PDF
基于空间密度的群以噪声发现聚类算法研究 被引量:20
5
作者 毕方明 王为奎 陈龙 《南京大学学报(自然科学版)》 CSCD 北大核心 2012年第4期491-498,共8页
针对基于密度的群以噪声发现聚类算法(density-based spatial clustering of applications withnoise,DBSCAN)的所需内存及I/O消耗大;空间聚类的密度不均匀时,采用全局统一的变量,聚类质量较差;对于输入参数敏感性较高等三个不足进行了... 针对基于密度的群以噪声发现聚类算法(density-based spatial clustering of applications withnoise,DBSCAN)的所需内存及I/O消耗大;空间聚类的密度不均匀时,采用全局统一的变量,聚类质量较差;对于输入参数敏感性较高等三个不足进行了改进.首先根据数据的空间分布特性,将整个数据空间划分为多个较小的分区,使分区的局部密度相对更均匀;然后将每个局部分区运用改进的DBSCAN算法进行聚类,改进的算法可以根据空间数据的分布,对一个中心点自适应的选取近邻,并对这些近邻点进行取样、扩展,有效提高了算法的准确性和效率;接着将所得到的聚类结果按照合并规则进行合并.最后通过仿真实验,验证了改进的DBSCAN算法解决了内存消耗过大、聚类质量差及全局参数敏感的问题. 展开更多
关键词 数据挖掘 空间聚类 基于密度的群以噪声发现聚类 数据分区 参数自适应
在线阅读 下载PDF
基于MATLAB的准实时背景噪声计算分析软件研制 被引量:11
6
作者 王俊 缪发军 +1 位作者 詹小艳 高景春 《地震研究》 CSCD 北大核心 2013年第2期231-237,共7页
针对目前我国省级区域数字测震台网所运行的JOPENS系统,利用Matlab语言开发了采用功率谱概率密度函数的背景噪声计算分析软件。实现了对数字地震台网的数据记录质量、观测系统的健康状态以及背景噪声源变化的准实时监控,计算结果的有效... 针对目前我国省级区域数字测震台网所运行的JOPENS系统,利用Matlab语言开发了采用功率谱概率密度函数的背景噪声计算分析软件。实现了对数字地震台网的数据记录质量、观测系统的健康状态以及背景噪声源变化的准实时监控,计算结果的有效频带范围为90s~35Hz,对信号的最小分辨率约为0.012Hz。软件根据功能需求进行模块化设计,并通过TaskContral定时任务控制终端来进行控制和管理,以减少各模块之间的相互联系,从而保证软件运行的持久和稳定。2011年1月在江苏省数字地震台网进行实际部署,运行情况和实际效能均良好。 展开更多
关键词 测震台网 数据记录质量 背景噪声 功率谱概率密度函数 JOPENS系统
在线阅读 下载PDF
面向海量数据流的基于密度的簇结构挖掘算法 被引量:3
7
作者 于彦伟 王欢 +1 位作者 王沁 赵金东 《软件学报》 EI CSCD 北大核心 2015年第5期1113-1128,共16页
提出一种基于密度的簇结构挖掘算法(mining density-based clustering structure over data streams,简称MClu Stream),以解决数据流密度聚类中输入参数选择困难和重叠簇识别等问题.首先,设计了一种树拓扑CR-Tree索引结构,将直接核心可... 提出一种基于密度的簇结构挖掘算法(mining density-based clustering structure over data streams,简称MClu Stream),以解决数据流密度聚类中输入参数选择困难和重叠簇识别等问题.首先,设计了一种树拓扑CR-Tree索引结构,将直接核心可达的一对数据点映射成树结构中的父子关系,蕴含了数据点依赖关系的CR-Tree涵盖了一系列sub Eps参数下的基于密度的簇结构;其次,MClu Stream算法采用滑动窗口的方式更新CR-Tree,在线维护当前窗口上的簇结构,实现了对海量数据流的快速演化聚类分析;再次,设计了一种快速从CR-Tree提取簇结构的方法,根据可视化的簇结构,选择合理的聚类结果;最后,在真实和合成海量数据上的实验验证了MClu Stream算法具有有效的挖掘效果、较高的聚类效率和较小的空间开销.MClu Stream可适用于海量数据流应用中自适应的密度聚类演化分析. 展开更多
关键词 聚类分析 密度聚类 簇结构 数据 滑动窗口
在线阅读 下载PDF
面向流形数据的共享近邻密度峰值聚类算法 被引量:7
8
作者 赵嘉 马清 +2 位作者 肖人彬 潘正祥 韩龙哲 《智能系统学报》 CSCD 北大核心 2023年第4期719-730,共12页
流形数据由一些弧线状或环状的类簇组成,其特点是同一类簇的样本间距离差距较大。密度峰值聚类算法不能有效识别流形类簇的类簇中心且分配剩余样本时易引发样本的连续误分配问题。为此,本文提出面向流形数据的共享近邻密度峰值聚类(dens... 流形数据由一些弧线状或环状的类簇组成,其特点是同一类簇的样本间距离差距较大。密度峰值聚类算法不能有效识别流形类簇的类簇中心且分配剩余样本时易引发样本的连续误分配问题。为此,本文提出面向流形数据的共享近邻密度峰值聚类(density peaks clustering based on shared nearest neighbor for manifold datasets,DPC-SNN)算法。提出了一种基于共享近邻的样本相似度定义方式,使得同一流形类簇样本间的相似度尽可能高;基于上述相似度定义局部密度,不忽略距类簇中心较远样本的密度贡献,能更好地区分出流形类簇的类簇中心与其他样本;根据样本的相似度分配剩余样本,避免了样本的连续误分配。DPC-SNN算法与DPC、FKNNDPC、FNDPC、DPCSA及IDPC-FA算法的对比实验结果表明,DPC-SNN算法能够有效发现流形数据的类簇中心并准确完成聚类,对真实以及人脸数据集也有不错的聚类效果。 展开更多
关键词 密度峰值 聚类分析 流形数据 K近邻 共享近邻 样本相似度 数据挖掘 图像处理
在线阅读 下载PDF
基于双层网格和密度的数据流聚类算法 被引量:3
9
作者 王治和 杨晏 《计算机工程》 CAS CSCD 2014年第4期146-150,共5页
传统的基于网格的数据流聚类算法在同一粒度的网格上进行聚类,虽然提高了处理速度,但聚类准确性较低。针对此问题,提出一种新的基于双层网格和密度的数据流聚类算法DBG Stream。在2种粒度的网格上对数据流进行聚类,并借鉴CluStream算法... 传统的基于网格的数据流聚类算法在同一粒度的网格上进行聚类,虽然提高了处理速度,但聚类准确性较低。针对此问题,提出一种新的基于双层网格和密度的数据流聚类算法DBG Stream。在2种粒度的网格上对数据流进行聚类,并借鉴CluStream算法的思想,将聚类过程分为2个阶段。在线过程中利用粗粒度的网格单元形成初始聚类,离线过程中在细粒度网格单元上,对位于簇边界的网格单元进行二次聚类以提高聚类精度,并实现了关键参数的自动设置,通过删格策略提高算法效率。实验结果表明,DBG Stream算法的聚类精确度较D Stream算法有较大提高,有效解决了传统基于网格聚类算法的聚类精度较低的问题。 展开更多
关键词 数据挖掘 数据 聚类 聚类分析 密度 双层网格
在线阅读 下载PDF
基于矢量中值滤波的ISS高密度地震数据去噪方法 被引量:9
10
作者 徐海 樊太亮 +4 位作者 赵夏 翟立新 张翊孟 杨剑 韩瑞冬 《石油地球物理勘探》 EI CSCD 北大核心 2013年第3期340-344,506+325,共5页
ISS高密度地震采集是以干扰炮相对有效炮为随机信号的基本理念对地震数据进行采集的方法,其大部分有效信号会淹没于噪声之中。基于此,本文提出一种在十字排列域或检波点域进行矢量中值滤波方法,并针对理论模型简要分析了不同空间滤波参... ISS高密度地震采集是以干扰炮相对有效炮为随机信号的基本理念对地震数据进行采集的方法,其大部分有效信号会淹没于噪声之中。基于此,本文提出一种在十字排列域或检波点域进行矢量中值滤波方法,并针对理论模型简要分析了不同空间滤波参数对保持有效信号和压制干扰信号的影响及处理中应注意的问题;实际单炮地震数据的处理和叠加成像结果表明,该方法在有效压制相干炮噪声的同时,能够较好地保持有效信号,提高资料信噪比,显著优于常规去噪方法的处理效果。 展开更多
关键词 去噪 ISS高密度地震数据采集 矢量中值滤波 随机噪声 信噪比
在线阅读 下载PDF
DENGENE:一种高精度的基于密度的适用于基因表达数据的聚类算法 被引量:1
11
作者 孙亮 赵芳 王永吉 《计算机应用研究》 CSCD 北大核心 2007年第4期58-61,共4页
根据基因表达数据的特点,提出一种高精度的基于密度的聚类算法DENGENE。DENGENE通过定义一致性检测和引进峰点改进搜索方向,使得算法能够更好地处理基因表达数据。为了评价算法的性能,选取了两组广为使用的测试数据,即啤酒酵母基因表达... 根据基因表达数据的特点,提出一种高精度的基于密度的聚类算法DENGENE。DENGENE通过定义一致性检测和引进峰点改进搜索方向,使得算法能够更好地处理基因表达数据。为了评价算法的性能,选取了两组广为使用的测试数据,即啤酒酵母基因表达数据集对算法来进行测试。实验结果表明,与基于模型的五种算法、CAST算法、K-均值聚类等相比,DENGENE在滤除噪声和聚类精度方面取得了显著的改善。 展开更多
关键词 基因表达数据 聚类分析 基于密度的聚类 一致性检测 峰点
在线阅读 下载PDF
限带白噪声随机过程的雨流幅值概率密度函数模型 被引量:1
12
作者 施剑玮 奚蔚 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2020年第4期659-665,共7页
对17种不同带宽系数的限带白噪声随机过程进行了雨流循环计数统计,提出了一个限带白噪声随机过程的雨流幅值概率密度函数(Probability density function,PDF)模型。该模型是Rayleigh分布和Weibull分布的线性组合,其中待定系数均为随机... 对17种不同带宽系数的限带白噪声随机过程进行了雨流循环计数统计,提出了一个限带白噪声随机过程的雨流幅值概率密度函数(Probability density function,PDF)模型。该模型是Rayleigh分布和Weibull分布的线性组合,其中待定系数均为随机过程谱参数的函数。采用该模型对这17种随机过程的雨流幅值概率密度函数进行了公式拟合,探究了模型中待定参数与随机过程谱参数之间的关系,确定了模型表达式。对照随机过程的雨流计数统计结果,将该模型与Dirlik模型的预测精度进行了比较,结果表明该模型的预测效果优于Dirlik模型。 展开更多
关键词 限带白噪声 雨流幅值 概率密度函数 振动疲劳 数据拟合
在线阅读 下载PDF
基于数据流的聚类趋势分析算法 被引量:6
13
作者 樊仲欣 《计算机应用》 CSCD 北大核心 2020年第8期2248-2254,共7页
聚类趋势分析算法基于抽样原理导致聚类趋势指标不稳定和片面,而且不适应数据流的批量增量特性,因而需要重复进行聚类趋势指数计算。为此,基于全体数据进行整体分析,提出一种基于最小距离连通图(MDCG)的聚类趋势分析算法MDCG-CTI。首先... 聚类趋势分析算法基于抽样原理导致聚类趋势指标不稳定和片面,而且不适应数据流的批量增量特性,因而需要重复进行聚类趋势指数计算。为此,基于全体数据进行整体分析,提出一种基于最小距离连通图(MDCG)的聚类趋势分析算法MDCG-CTI。首先,利用栈的深度优先遍历法更新增量数据的最邻近路径从而降低MDCG的建立复杂度;然后,计算聚类趋势指数并确定可聚类性的判定阈值;最后,将所提算法和批量增量的具有噪声的基于密度的聚类方法(DBSCAN)相结合。在自定义数据集上的实验表明,该算法比现有算法对单簇和含大量噪点的数据的可聚类性判断更为精确;而在大数据集pendigits和avila上,所提算法比基于谱方法的聚类趋势可视化分析(SpecVAT)累计耗时降低了38%和42%,且相较SpecVAT结合批量增量DBSCAN,该算法结合批量增量DBSCAN的聚类平均准确率分别提高了6%和11%,聚类累计耗时则分别降低了7%和8%。实验结果表明该算法可以准确无参地判断聚类趋势,并明显提高增量聚类的有效性和运行效率。 展开更多
关键词 聚类趋势 最小距离连通图 数据流聚类 批量增量聚类 有噪声的基于密度的聚类方法
在线阅读 下载PDF
基于流域变换的聚类分析
14
作者 王皓 曹永锋 孙洪 《信号处理》 CSCD 北大核心 2005年第z1期375-378,共4页
提出了一种基于流域变换的多维数据聚类新方法.该方法以密度聚类技术为基础,通过对密度空间进行流域变换,实现多维数据的聚类.通过实验与基本聚类算法的比较,证明本文提出的算法对多维数据有更强的聚类能力.
关键词 流域变换 聚类分析 密度空间 多维数据
在线阅读 下载PDF
基于多源数据的京杭大运河核心监控区国土空间分段研究 被引量:1
15
作者 胡苏 翁艳美 +1 位作者 潘杰华 陈龙高 《江苏农业科学》 北大核心 2024年第23期214-221,共8页
国土空间分区是进行国土空间用途管控的基础,分析京杭大运河核心监控区国土空间及产业分布格局,并对其进行空间分段可以有效地制定基于空间格局差异化的管控策略。基于可获得的多源公开数据,综合应用文本分析、核密度分析以及聚类分析... 国土空间分区是进行国土空间用途管控的基础,分析京杭大运河核心监控区国土空间及产业分布格局,并对其进行空间分段可以有效地制定基于空间格局差异化的管控策略。基于可获得的多源公开数据,综合应用文本分析、核密度分析以及聚类分析方法探究京杭大运河核心监控区国土空间与产业分布格局特征,并据此进行国土空间分段。结果表明,机械设备、纺织服装、食品、养殖、建材类领域相关公司企业为大运河核心监控区范围内最常见的产业类型,化工、金属、餐饮、混凝土、钢铁等易产生环境污染的相关公司企业分布数量也较高。整体上看,监控区范围内公司企业集中分布于运河南北两端,并呈现出典型的密集型分布特征。养殖、化工、水泥砂浆混凝土、石化、煤电等部分易产生环境污染或损害风险的产业呈现差异化空间分布特征。国土空间分段结果显示,低强度乡村主导区段为大运河核心监控区国土空间分段的主导类型,包括除河北省沧州市、江苏省常州市、江苏省无锡市、浙江省杭州市、浙江省嘉兴市、江苏省苏州市以外的其他15个城市区段;低污染低生态功能区段包括沧州段和常州段,高强度低耕地区段主要为无锡段,旅游主导区段包括杭州段与嘉兴段,高强度产业密集区段为苏州段。 展开更多
关键词 京杭大运河 国土空间分段 多源数据 文本分析 密度分析 聚类分析
在线阅读 下载PDF
基于密度网格的分布式数据流聚类算法 被引量:6
16
作者 林秀丹 毛国君 《计算机工程》 CAS CSCD 2012年第16期70-73,共4页
提出一种适用于分布式数据流环境的、基于密度网格的聚类算法。利用局部站点快速更新数据流信息,使网格空间反映当前数据流的变化。中心站点负责在接收及合并局部网格结构后,对全局网格结构进行密度网格聚类以及噪声网格优化,形成全局... 提出一种适用于分布式数据流环境的、基于密度网格的聚类算法。利用局部站点快速更新数据流信息,使网格空间反映当前数据流的变化。中心站点负责在接收及合并局部网格结构后,对全局网格结构进行密度网格聚类以及噪声网格优化,形成全局聚类结果。实验结果表明,该算法能减少网络通信量,提高全局聚类精度。 展开更多
关键词 分布式数据 密度网格 聚类 噪声 滑动窗口 增量式更新
在线阅读 下载PDF
基于数据相似度和引力理论的密度峰聚类算法 被引量:4
17
作者 詹康 王逸文 何熊熊 《高技术通讯》 CAS 2023年第1期88-96,共9页
本文针对密度峰聚类算法(DPC)中存在的参数敏感、算法不连续和聚类分块化问题,提出一种基于数据相似度和引力理论的密度峰聚类算法(SLDPC)。该算法基于数据相似度确定局部密度,采用引力理论扩大簇心与非簇心数据点之间的差异,通过设定... 本文针对密度峰聚类算法(DPC)中存在的参数敏感、算法不连续和聚类分块化问题,提出一种基于数据相似度和引力理论的密度峰聚类算法(SLDPC)。该算法基于数据相似度确定局部密度,采用引力理论扩大簇心与非簇心数据点之间的差异,通过设定阈值自动确定簇心,通过基于边缘分布的合并策略对聚类分块化进行合并。实验共采用16个数据集,并与DPC、K-means、基于密度的噪声应用空间聚类算法(DBSCAN)及DPC改进算法进行了对比。实验结果表明,本方法具有优异的聚类准确性和良好的稳定性。 展开更多
关键词 聚类分析 密度峰值 数据相似度 引力理论 聚类合并
在线阅读 下载PDF
面向位置大数据的快速密度聚类算法 被引量:33
18
作者 于彦伟 贾召飞 +3 位作者 曹磊 赵金东 刘兆伟 刘惊雷 《软件学报》 EI CSCD 北大核心 2018年第8期2470-2484,共15页
面向位置大数据聚类,提出了一种简单但高效的快速密度聚类算法CBSCAN,以快速发现位置大数据中任意形状的聚类簇模式和噪声.首先,定义了Cell网格概念,并提出了基于Cell的距离分析理论,利用该距离分析,无需距离计算,可快速确定高密度区域... 面向位置大数据聚类,提出了一种简单但高效的快速密度聚类算法CBSCAN,以快速发现位置大数据中任意形状的聚类簇模式和噪声.首先,定义了Cell网格概念,并提出了基于Cell的距离分析理论,利用该距离分析,无需距离计算,可快速确定高密度区域的核心点和密度相连关系;其次,给出了网格簇定义,将基于位置点的密度簇映射成基于网格的密度簇,利用排他网格与相邻网格的密度关系,可快速确定网格簇的包含网格;第三,利用基于Cell的距离分析理论和网格簇概念,实现了一个快速密度聚类算法,将DBSCAN基于数据点的密度扩展聚类转换成基于Cell的密度扩展聚类,极大地减少高密度区域的距离计算,利用位置数据的内在特性提高了聚类效率;最后,在基准测试数据上验证了所提算法的聚类效果,在位置大数据上的实验结果统计显示,与DBSCAN、PR-Tree索引和Grid索引优化的DBSCAN相比,CBSCAN分别平均提升了525倍、30倍和11倍效率. 展开更多
关键词 聚类分析 密度聚类 位置大数据 Cell网格 网格簇
在线阅读 下载PDF
基于密度峰值的混合型数据聚类算法设计 被引量:6
19
作者 李晔 陈奕延 张淑芬 《计算机应用》 CSCD 北大核心 2018年第2期483-490,496,共9页
针对k-prototypes算法无法自动识别簇数以及无法发现任意形状的簇的问题,提出一种针对混合型数据的新方法:寻找密度峰值的聚类算法。首先,把CFSFDP(Clustering by Fast Search and Find of Density Peaks)聚类算法扩展到混合型数据集,... 针对k-prototypes算法无法自动识别簇数以及无法发现任意形状的簇的问题,提出一种针对混合型数据的新方法:寻找密度峰值的聚类算法。首先,把CFSFDP(Clustering by Fast Search and Find of Density Peaks)聚类算法扩展到混合型数据集,定义混合型数据对象之间的距离后利用CFSFDP算法确定出簇中心,这样也就自动确定了簇的个数,然后其余的点按照密度从大到小的顺序进行分配。其次,研究了该算法中阈值(截断距离)及权值的选取问题:对于密度公式中的阈值,通过计算数据场中的势熵来自动提取;对于距离公式中的权值,利用度量数值型数据集和分类型数据集聚类趋势的统计量来定义。最后通过在三个实际混合型数据集上的测试发现:与传统k-prototypes算法相比,寻找密度峰值的聚类算法能有效提高聚类的精度。 展开更多
关键词 聚类分析 混合型数据 数据 聚类趋势 密度峰值
在线阅读 下载PDF
图斑数据的多密度属性连接聚类方法
20
作者 陈颂 张福浩 +3 位作者 仇阿根 赵习枝 王苑 欧尔格力 《测绘通报》 CSCD 北大核心 2023年第7期107-112,共6页
图斑面的聚类处理是挖掘图斑空间知识的重要手段。针对当前图斑面大小不一、形态各异、分布不均等导致聚类结果不够准确的问题,同时为满足大规模图斑数据分析的需要,本文引入多密度属性计算指标,提出了一种图斑数据的聚类方法。首先,根... 图斑面的聚类处理是挖掘图斑空间知识的重要手段。针对当前图斑面大小不一、形态各异、分布不均等导致聚类结果不够准确的问题,同时为满足大规模图斑数据分析的需要,本文引入多密度属性计算指标,提出了一种图斑数据的聚类方法。首先,根据单个图斑内部点位置(包含边界)的不同赋予其多个密度属性;然后,根据图斑间密度低值向密度高值靠拢的趋势建立图斑归属连接,依次生成图斑要素的树状结构连接;最后,依据树状结构连接的结果对各连接进行剪枝或合并,生成多个独立树,完成图斑面的聚类。试验证明,本文方法可以有效识别各类不规则图斑的聚合集群,并在大规模图斑数据的聚合中具有良好的精度表现,满足高密度多边形区域的聚类识别需求。 展开更多
关键词 数据 图斑数据 聚类分析 图斑聚类 密度属性
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部