期刊文献+
共找到74篇文章
< 1 2 4 >
每页显示 20 50 100
Outlier detection based on multi-dimensional clustering and local density
1
作者 SHOU Zhao-yu LI Meng-ya LI Si-min 《Journal of Central South University》 SCIE EI CAS CSCD 2017年第6期1299-1306,共8页
Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outl... Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outlier. In this work, an effective outlier detection method based on multi-dimensional clustering and local density(ODBMCLD) is proposed. ODBMCLD firstly identifies the center objects by the local density peak of data objects, and clusters the whole dataset based on the center objects. Then, outlier objects belonging to different clusters will be marked as candidates of abnormal data. Finally, the top N points among these abnormal candidates are chosen as final anomaly objects with high outlier factors. The feasibility and effectiveness of the method are verified by experiments. 展开更多
关键词 data MINING OUTLIER DETECTION OUTLIER DETECTION method based on MULTI-DIMENSIONAL clustering and local density (ODBMCLD) algorithm deviation DEGREE
在线阅读 下载PDF
VDBSCAN:变密度聚类算法 被引量:22
2
作者 周董 刘鹏 《计算机工程与应用》 CSCD 北大核心 2009年第11期137-141,153,共6页
传统的密度聚类算法不能识别并聚类多个不同密度的簇。对此提出了变密度聚类算法VDBSCAN,针对密度不稳定的数据集,可有效识别并同时聚类不同密度的簇,避免合并和遗漏。VDBSCAN算法的基本思想是:根据k-dist图和DK分析,对数据集中的不同... 传统的密度聚类算法不能识别并聚类多个不同密度的簇。对此提出了变密度聚类算法VDBSCAN,针对密度不稳定的数据集,可有效识别并同时聚类不同密度的簇,避免合并和遗漏。VDBSCAN算法的基本思想是:根据k-dist图和DK分析,对数据集中的不同密度层次自动选择一组Eps值,分别调用DBSCAN算法。不同的Eps值,能够找到不同密度的簇。4个二维数据集实验验证了VDB-SCAN算法的有效性,表明VDBSCAN算法可以有效地聚类密度不均匀的数据集,且参数Eps的自动选择方法也是有效的和健壮的。 展开更多
关键词 变密度聚类算法 基于密度的聚类 DBSCAN 数据挖掘
在线阅读 下载PDF
虚拟电厂规模化灵活资源集群优化配置
3
作者 黄蔚亮 王斐 +3 位作者 张扬 莫理莉 兰峻焜 陈皓勇 《太阳能学报》 北大核心 2025年第6期451-461,共11页
针对大型城市电网中灵活资源存在聚合及应用困难的问题,提出一种资源集群优化配置算法。首先,提出基于灵活资源特征及辅助服务需求的分层分区集群策略,并采用基于密度的噪声应用空间聚类算法(DBSCAN)对资源进行聚类,以资源集群参与虚拟... 针对大型城市电网中灵活资源存在聚合及应用困难的问题,提出一种资源集群优化配置算法。首先,提出基于灵活资源特征及辅助服务需求的分层分区集群策略,并采用基于密度的噪声应用空间聚类算法(DBSCAN)对资源进行聚类,以资源集群参与虚拟电厂任务;其次,根据虚拟电厂所需调节功率和资源集群容量潜力,优化配置其参与任务的时间段,实现资源利用效率和虚拟电厂运行效益的最大化;然后,引入状态势博弈理论和惩罚机制,优化时间段内资源配置确保任务过程中的稳定性和可靠性;最后,给出算例,证明该方案下虚拟电厂规模化灵活资源可高效地进行资源优化配置,算法是可行和有效的。 展开更多
关键词 虚拟电厂 博弈论 优化算法 DBSCAN算法 资源集群 惩罚机制
在线阅读 下载PDF
基于广义二次相关和改进飞蛾扑火算法的变压器局部放电定位技术
4
作者 蔡谦 钱勇 +2 位作者 徐治仁 王辉 盛戈皞 《电力自动化设备》 北大核心 2025年第7期218-224,共7页
在当前变压器局部放电定位研究中,针对存在复杂噪声环境下对局部放电信号处理不足、信号时延估计误差大、由时延误差引起的定位算法失效等问题,提出了一种基于广义二次相关和改进飞蛾扑火算法的变压器局部放电定位技术。对测得的特高频... 在当前变压器局部放电定位研究中,针对存在复杂噪声环境下对局部放电信号处理不足、信号时延估计误差大、由时延误差引起的定位算法失效等问题,提出了一种基于广义二次相关和改进飞蛾扑火算法的变压器局部放电定位技术。对测得的特高频信号采用广义二次相关求得信号的时延,具有抗噪性能好的优点;对基本飞蛾扑火算法进行改进,对定位方程问题进行求解;采用改进飞蛾扑火算法和几种传统智能优化算法对基本检测函数进行求解,对比最优目标函数值、运算时间和迭代曲线,证明该改进优化算法的正确性和速度性;针对定位检测的误差,采用密度聚类算法,传感器阵列对局放多次测量并对检测到的信号进行排列组合,对得到的多个局放源定位结果基于密度进行聚类,取最大簇的几何中心位置作为最终的局放源位置。通过仿真和现场实验,验证了所提定位检测方法的有效性。 展开更多
关键词 变压器 局部放电 定位 广义二次相关 飞蛾扑火算法 密度聚类算法
在线阅读 下载PDF
基于混合优化算法的电磁监测裂缝参数识别 被引量:1
5
作者 曾波 杨扬 +5 位作者 宋毅 陈珂 徐尔斯 王怡亭 徐颖洁 裴婧 《石油物探》 CSCD 北大核心 2024年第3期684-693,共10页
压裂实时监测是水力压裂效果评价和工程参数优化的重要保障措施之一。传统电磁监测裂缝参数识别方法的准确性和精度难以保证,影响了监测效果。为了提高裂缝参数识别能力,提出了一种基于海洋捕食者密度聚类混合优化算法的电磁监测裂缝参... 压裂实时监测是水力压裂效果评价和工程参数优化的重要保障措施之一。传统电磁监测裂缝参数识别方法的准确性和精度难以保证,影响了监测效果。为了提高裂缝参数识别能力,提出了一种基于海洋捕食者密度聚类混合优化算法的电磁监测裂缝参数识别方法。利用海洋捕食者算法(MPA)进行多次寻优,以每次寻优结果作为初始数据集,然后,利用密度聚类算法(DBSCAN)进行聚类,构建中间样本数据集,最后,抽取该样本数据中值作为最终输出结果。采用Rastrigin函数进行测试,分析混合优化算法寻优能力。测试结果表明,相对粒子群优化算法(PSO),MPA算法单次寻优效果较佳。但两种算法寻优结果均具有较强随机性,其中,PSO和MPA算法50次寻优精度分别为10^(-7)~10^(2)和10^(-10)~10^(-2),而改进的混合优化算法寻优效果更稳定,寻优精度达10^(-7)。构建缝长、方位压裂模型并进行了数值模拟实验,结果表明,在噪声低于15%时,缝长和方位识别平均绝对误差分别小于1 m和1°。利用改进的算法对四川盆地某井页岩气压裂电磁监测实测数据进行分析,确定了裂缝改造的长度(缝长)与方位。实例分析结果验证了改进算法的可行性和有效性。 展开更多
关键词 水力压裂 电磁法 海洋捕食者算法 密度聚类算法 实时监测 裂缝参数识别
在线阅读 下载PDF
基于激光雷达回波信号的雾天车道线快速检测
6
作者 陈琼 李小玲 《中国测试》 CAS 北大核心 2024年第11期120-128,共9页
当前主要通过深度神经网络模型提取路面车道线,并设计能见度检测网络,根据车道线可见长度检测路面车道线。但是,在雾天,基于深度分割神经网络设计编码解码结构非相关因素过多,无法通过其提取车道线特征图,无法准确检测图像坐标系下可见... 当前主要通过深度神经网络模型提取路面车道线,并设计能见度检测网络,根据车道线可见长度检测路面车道线。但是,在雾天,基于深度分割神经网络设计编码解码结构非相关因素过多,无法通过其提取车道线特征图,无法准确检测图像坐标系下可见车道线的高度。针对雾天驾驶时的视觉障碍问题,以激光雷达技术为支撑,提出雾天车道线快速检测方法。根据激光雷达回波信号中每个回波脉冲宽度级的扫描点数,采用最小类内方差算法,阈值分割路面与车道线扫描点,由3σ准则分离出车道线的种子点后,基于高斯核函数加权搜索的生长准则,经区域生长得到完整的车道线种子点集。基于密度的空间聚类算法二次聚类获取的车道线种子点集,得到车道线的识别结果。以识别结果为基础,建立抛物线模型,结合随机采样一致性算法和最小二乘法,依据拟合分值迭代取得最优模型,通过拟合完成车道线检测。实验结果表明:该方法屏蔽雾天干扰引起的非相关因素,清晰检测出雾天环境中的多种车道线。在雾天环境车道线检测中,交并比高于0.95,F1值高于96%,可以满足准确性和实时性需求,为雾天驾驶提供有效的解决方案。 展开更多
关键词 雾天环境 激光雷达 回波信号脉冲宽度 基于密度的空间聚类算法 抛物线 车道线检测
在线阅读 下载PDF
嘉陵江流域骤发干旱时空演变特征分析 被引量:7
7
作者 孟长青 董子娇 +3 位作者 刘柯莹 王远坤 张验科 钟德钰 《水利水电科技进展》 CSCD 北大核心 2024年第4期23-30,58,共9页
为探究嘉陵江流域骤发干旱可识别特性与时空演变特征,基于标准化蒸发胁迫比研究了1980—2020年嘉陵江流域骤发干旱的时空分布特征,通过密度聚类算法提取骤发干旱斑块分析了斑块质心的轨迹变化,并探讨了骤发干旱暴发初期气象要素的异常... 为探究嘉陵江流域骤发干旱可识别特性与时空演变特征,基于标准化蒸发胁迫比研究了1980—2020年嘉陵江流域骤发干旱的时空分布特征,通过密度聚类算法提取骤发干旱斑块分析了斑块质心的轨迹变化,并探讨了骤发干旱暴发初期气象要素的异常情况。结果表明:流域西北部骤发干旱强度更高且发展速度更快,流域南部骤发干旱持续时间更长;流域骤发干旱事件主要发生在4—11月,且骤发干旱事件的质心主要沿东北和西北方向迁移;嘉陵江流域的骤发干旱主要由高温和降水共同主导。 展开更多
关键词 骤发干旱 标准化蒸发胁迫比 密度聚类算法 质心迁移 时空演变 嘉陵江流域
在线阅读 下载PDF
中空铜纳米线的拉伸断裂分布与初始滑移分布的关系
8
作者 刘守涛 赵健伟 +1 位作者 王奋英 马汉杰 《无机化学学报》 SCIE CAS CSCD 北大核心 2024年第2期394-404,共11页
构建了系列球形中空结构的纳米线(NW),采用分子动力学(MD)对每个模型300个不同初始态的样本开展拉伸形变模拟。并利用基于密度的噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)机器学习算法,... 构建了系列球形中空结构的纳米线(NW),采用分子动力学(MD)对每个模型300个不同初始态的样本开展拉伸形变模拟。并利用基于密度的噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)机器学习算法,获得了初始滑移面的位置。基于大数据统计,分析了初始滑移位置分布以及断裂位置分布两者之间的相关性。研究结果表明:当内部中空半径较小时,断裂位置分布形成于塑性形变阶段,初始滑移分布与断裂位置分布之间无显著的相关性;但是对于脆性特征明显的大中空半径的NW,高能内表面诱导产生的滑移面迅速积累,产生颈缩并导致最终的断裂。因此当内部中空结构达到一定尺寸时初始滑移位置的分布与最终断裂位置的分布之间有明确的因果关系。 展开更多
关键词 分子动力学 中空结构 基于密度的噪声应用空间聚类算法 初始滑移 断裂失效
在线阅读 下载PDF
岩质高边坡结构面识别及产状统计信息采集方法 被引量:1
9
作者 蒋水华 余琦 +2 位作者 黄河 常志璐 孟京京 《工矿自动化》 CSCD 北大核心 2024年第7期156-164,共9页
准确识别岩质高边坡结构面和获取产状统计信息是进行边坡稳定性分析的重要前提。无人机摄影测量技术为解决高边坡结构面准确勘测难题提供了可能,但缺少高效准确的影像后处理方法,且现有研究没有考虑结构面产状信息特征的不确定性,致使... 准确识别岩质高边坡结构面和获取产状统计信息是进行边坡稳定性分析的重要前提。无人机摄影测量技术为解决高边坡结构面准确勘测难题提供了可能,但缺少高效准确的影像后处理方法,且现有研究没有考虑结构面产状信息特征的不确定性,致使结构面识别准确性差、效率低。针对该问题,以江西省南昌市某露天矿高边坡为研究背景,提出了融合无人机摄影、后处理算法及统计分析的一体化结构面识别与产状统计信息采集方法。首先,通过Phantom 4 Pro V2.0无人机获取边坡表面影像;其次,利用Context Capture软件进行处理,得到高密度三维点云数据;然后,采用K近邻(KNN)算法中的确定近邻点数量法构建相似点集,采用基于密度的聚类(DBSCAN)算法进行聚类分析,从而实现边坡结构面识别,获得结构面产状信息并进行统计特征分析;最后,通过现场勘测数据进行对比验证。结果表明:该方法能够快速获取完整的高密度点云数据,准确高效地识别岩质高边坡大部分结构面,识别结果与边坡工程现场实际情况基本吻合;该方法可获取高边坡结构面数量、产状信息及其统计特征,大部分结构面倾角和倾向概率分布与实测数据拟合较好,为高边坡裂隙网络模型构建及稳定性分析提供了重要数据来源。 展开更多
关键词 岩质高边坡 结构面识别 产状统计信息 无人机摄影测量 K近邻算法 基于密度的聚类算法
在线阅读 下载PDF
机载激光雷达通信网络测距大数据均衡调度
10
作者 时进 陈瑾 赵文瑄 《现代雷达》 CSCD 北大核心 2024年第12期121-126,共6页
由于机载激光雷达通信网络节点本身的通信距离有限,存在测距节点的硬件资源不均衡、节点能量有限、通信干扰等问题。对此,提出均衡聚类下的机载激光雷达测距大数据调度方法。基于小波变换中的非线性尺度变换结构对采集到的雷达测距大数... 由于机载激光雷达通信网络节点本身的通信距离有限,存在测距节点的硬件资源不均衡、节点能量有限、通信干扰等问题。对此,提出均衡聚类下的机载激光雷达测距大数据调度方法。基于小波变换中的非线性尺度变换结构对采集到的雷达测距大数据去噪处理。使用K-means++算法和局部搜索策略进行分区,使用基于密度的噪声应用空间聚类算法分析不同聚类结果的关联特征。引入自适应权重学习方法,提取输出雷达通信网络节点特征量,将原始特征向量与归一化的节点分布量化值融合,构建新的测距大数据网络调度特征向量。实验测试结果表明:所提方法在雷达通信网络测距节点调度应用中,内存使用率降低至62%以下,能耗降低至1200 J以下,执行时间降低至40 ms以下,提升了均衡聚类调度应用效果。 展开更多
关键词 机载激光雷达 测距大数据 均衡聚类 K-means++算法 非线性尺度变换结构 基于密度的噪声应用空间聚类算法
在线阅读 下载PDF
一种基于密度的K-means算法研究 被引量:44
11
作者 张琳 陈燕 +1 位作者 汲业 张金松 《计算机应用研究》 CSCD 北大核心 2011年第11期4071-4073,4085,共4页
针对传统K-means算法必须事先确定聚类数目以及对初始聚类中心的选取比较敏感的缺陷,采用基于密度的思想,通过设定Eps邻域以及Eps邻域内至少包含的对象数minpts来排除孤立点,并将不重复的核心点作为初始聚类中心;采用类内距离和类间距... 针对传统K-means算法必须事先确定聚类数目以及对初始聚类中心的选取比较敏感的缺陷,采用基于密度的思想,通过设定Eps邻域以及Eps邻域内至少包含的对象数minpts来排除孤立点,并将不重复的核心点作为初始聚类中心;采用类内距离和类间距离的比值作为准则评价函数,将准则函数取得最小值时的聚类数作为最佳聚类数,这些改进有效地克服了K-means算法的不足。最后通过几个实例介绍了改进后算法的具体应用,实例表明改进后的算法比原算法有更高的聚类准确性,更能实现类内紧密类间远离的聚类效果。 展开更多
关键词 K-MEANS算法 基于密度 类内距离 类间距离
在线阅读 下载PDF
一种基于密度的空间数据流在线聚类算法 被引量:28
12
作者 于彦伟 王沁 +1 位作者 邝俊 何杰 《自动化学报》 EI CSCD 北大核心 2012年第6期1051-1059,共9页
为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点... 为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点及其满足核心点条件的邻域数据做局部聚类更新,降低聚类更新的时间复杂度,实现对空间数据流的在线聚类.OLDStream算法具有快速处理大规模空间数据流、实时获取全局任意形状的聚类簇结果、对数据流的输入顺序不敏感、并能发现孤立点数据等优势.在真实数据和合成数据上的综合实验验证了算法的聚类效果、高效率性和较高的可伸缩性,同时实验结果的统计分析显示仅有4%的空间点消耗最坏运行时间,对每个空间点的平均聚类时间约为0.033ms. 展开更多
关键词 空间数据挖掘 聚类数据流 基于密度的聚类 在线算法 噪声处理
在线阅读 下载PDF
基于密度复杂簇聚类算法研究与实现 被引量:16
13
作者 宋宇辰 宋飞燕 孟海东 《计算机工程与应用》 CSCD 北大核心 2007年第35期162-165,共4页
聚类算法在模式识别、数据分析、图像处理、以及市场研究的应用中,需要解决的关键技术是如何有效地聚类各种复杂的数据对象簇。在分析与研究现有聚类算法的基础上,提出了一种基于密度和自适应密度可达的改进算法。实验证明,该算法能够... 聚类算法在模式识别、数据分析、图像处理、以及市场研究的应用中,需要解决的关键技术是如何有效地聚类各种复杂的数据对象簇。在分析与研究现有聚类算法的基础上,提出了一种基于密度和自适应密度可达的改进算法。实验证明,该算法能够有效聚类任意分布形状、不同密度、不同尺度的簇;同时,算法的计算复杂度与传统基于密度的聚类算法相比有明显的降低。 展开更多
关键词 聚类算法 复杂簇 基于密度 自适应密度可达
在线阅读 下载PDF
基于全局中心的高密度不唯一的K-means算法研究 被引量:10
14
作者 何云斌 刘雪娇 +2 位作者 王知强 万静 李松 《计算机工程与应用》 CSCD 北大核心 2016年第1期48-54,共7页
传统的K-means算法敏感于初始中心点的选取,并且无法事先确定准确的聚类数目k,不利于聚类结果的稳定性。针对传统K-means算法的以上不足,提出了基于全局中心的高密度不唯一的新方法——NDK-means,该方法通过标准差确定有效密度半径,并... 传统的K-means算法敏感于初始中心点的选取,并且无法事先确定准确的聚类数目k,不利于聚类结果的稳定性。针对传统K-means算法的以上不足,提出了基于全局中心的高密度不唯一的新方法——NDK-means,该方法通过标准差确定有效密度半径,并从高密度区域中选取具有代表性的样本点作为初始聚类中心。此外算法针对最高密度点不唯一的情况进行特别分析,选取距离全局中心最远的点集作为最优的初始中心点集合。在NDK-means算法基础上结合有效性指标BWP对聚类结果进行分析,从而解决了最佳有效聚类数目无法事先确定的不足。理论研究与实验结果表明所提方法的聚类结果具有更好的稳定性和可行性。 展开更多
关键词 K-MEANS算法 初始中心 聚类数 基于密度
在线阅读 下载PDF
一种有效的K-means聚类中心初始化方法 被引量:87
15
作者 熊忠阳 陈若田 张玉芳 《计算机应用研究》 CSCD 北大核心 2011年第11期4188-4190,共3页
传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上... 传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上,选取到所有已初始化聚类中心距离乘积最大的高密度点作为当前聚类中心。理论分析与对比实验结果表明,此方法相对于传统K-means算法和最大最小距离法有更快的收敛速度、更高的准确率和更强的稳定性。 展开更多
关键词 K-均值算法 基于密度 初始聚类中心 最大最小距离 最大距离积
在线阅读 下载PDF
改进的基于密度方法的态势聚类显示算法 被引量:9
16
作者 赵恩来 郝文宁 +1 位作者 赵水宁 韩宪勇 《计算机工程》 CAS CSCD 北大核心 2010年第18期35-37,40,共4页
为解决计算机标图过程中因缩小地图比例尺而导致的标号扎堆问题,通过分析邻域参数,利用DBSCAN算法寻找相互遮挡的标号,在其质心处用标图代替扎堆标号。针对DBSCAN算法的不足,结合实际应用情况,将传统基于密度方法的圆形邻域改为针对应... 为解决计算机标图过程中因缩小地图比例尺而导致的标号扎堆问题,通过分析邻域参数,利用DBSCAN算法寻找相互遮挡的标号,在其质心处用标图代替扎堆标号。针对DBSCAN算法的不足,结合实际应用情况,将传统基于密度方法的圆形邻域改为针对应用的多边形邻域,提出改进的算法BDIRCAN。实验结果表明,BDIRCAN算法能较好地解决标号扎堆问题,避免对临近但不相互遮挡的标号进行错误的聚类。 展开更多
关键词 DBSCAN 算法 引射线法 聚类 标图 标号
在线阅读 下载PDF
邻域平衡密度聚类算法 被引量:22
17
作者 武佳薇 李雄飞 +1 位作者 孙涛 李巍 《计算机研究与发展》 EI CSCD 北大核心 2010年第6期1044-1052,共9页
聚类是数据挖掘领域的一项重要分析手段.在分析核心对象与其邻域对象的分布特征后,引入对象的投影点,对象的邻域平衡、平衡核心对象、边界稀疏对象等概念.提出一种新的基于密度的聚类算法bDBSCAN(balance-DBSCAN).算法将核心对象邻域中... 聚类是数据挖掘领域的一项重要分析手段.在分析核心对象与其邻域对象的分布特征后,引入对象的投影点,对象的邻域平衡、平衡核心对象、边界稀疏对象等概念.提出一种新的基于密度的聚类算法bDBSCAN(balance-DBSCAN).算法将核心对象邻域中的对象投影,进行向量单位化,考察核心对象的邻域平衡性,将与平衡核心对象平衡密度可达的对象聚成一个簇.理论分析和实验结果表明,算法可以处理任意形状的簇,有效地排除边界稀疏对象这类噪声,并且可以解决高维数据聚类边界区分不明显、噪声对象多等问题,提高了聚类精度.算法的时间复杂度与DBSCAN近似. 展开更多
关键词 投影点 邻域平衡 平衡核心对象 边界稀疏对象 基于密度的聚类算法
在线阅读 下载PDF
一种特征加权的聚类算法框架 被引量:6
18
作者 高滢 刘大有 徐益 《计算机科学》 CSCD 北大核心 2008年第10期152-154,共3页
为了考虑数据各维特征对聚类的不同贡献,并把有监督特征评价方法应用到无监督分类问题中,提出一种特征加权的聚类算法框架。该框架首先通过某种聚类算法对数据聚类,然后,根据聚类结果,采用有监督特征评价方法学习各维特征的权值,再根据... 为了考虑数据各维特征对聚类的不同贡献,并把有监督特征评价方法应用到无监督分类问题中,提出一种特征加权的聚类算法框架。该框架首先通过某种聚类算法对数据聚类,然后,根据聚类结果,采用有监督特征评价方法学习各维特征的权值,再根据特征权值重新聚类,之后再次学习特征权值,该过程反复迭代,直至算法收敛或达到指定的迭代次数。欧几里德空间内基于距离、基于密度的聚类算法均适用于本框架。基于本框架,采用模糊C均值聚类算法(FCM)、密度聚类算法(DBSCAN),并通过信息增益特征评价、ReliefF特征评价方法,对多个UCI数据集进行了实验,验证了该框架的有效性。 展开更多
关键词 聚类算法框架 特征加权 基于距离的聚类 基于密度的聚类
在线阅读 下载PDF
基于网格和密度的簇边缘精度增强聚类算法 被引量:4
19
作者 单世民 张宁 +1 位作者 江贺 张宪超 《计算机工程与应用》 CSCD 北大核心 2008年第23期143-146,共4页
现有的基于网格聚类算法在付出较小的时间复杂度的同时,牺牲了聚类的质量,得到的往往并不是最理想的聚类结果,尤其是在簇边缘可能出现数据点聚类不准现象。提出了一种将网格化空间中位于簇边缘的网格进行精度进一步细化处理的算法,将这... 现有的基于网格聚类算法在付出较小的时间复杂度的同时,牺牲了聚类的质量,得到的往往并不是最理想的聚类结果,尤其是在簇边缘可能出现数据点聚类不准现象。提出了一种将网格化空间中位于簇边缘的网格进行精度进一步细化处理的算法,将这些边缘网格中的这些不确定的点重新恢复它们的固有信息,再利用相似度函数将它们分配到合适的簇中。在空间数据集上实验数据表明,这种簇边缘精度增强聚类算法可在O(n)时间内得到优于CLIQUE算法的聚类结果。 展开更多
关键词 数据聚类 基于网格 基于密度 混合算法
在线阅读 下载PDF
密度分布函数在聚类算法中的应应用用 被引量:8
20
作者 谭建豪 章兢 李伟雄 《控制理论与应用》 EI CAS CSCD 北大核心 2011年第12期1791-1796,共6页
深入分析了传统的基于密度的聚类方法的特点和存在的问题及讨论了基于密度聚类算法研究现状,提出了一种改进的基于密度分布函数的聚类算法.使用K最近邻(KNN)的思想度量密度以寻找当前密度最大点,即中心点.并使用区域比例,将类从中心点... 深入分析了传统的基于密度的聚类方法的特点和存在的问题及讨论了基于密度聚类算法研究现状,提出了一种改进的基于密度分布函数的聚类算法.使用K最近邻(KNN)的思想度量密度以寻找当前密度最大点,即中心点.并使用区域比例,将类从中心点开始扩展,每次扩展的同时引入半径比例因子以发现核心点.再从该核心点的KNN扩展类,直至密度下降到中心点密度的给定比率时结束.给出了数个算法实例并与基于网格的共享近邻聚类(GNN)算法在聚类准确率和效率上进行了试验比较,试验表明该算法极大降低了基于密度聚类算法对参数的敏感性、改善了对高维密度分布不均数据集的聚类效果、提高了聚类准确率和效率. 展开更多
关键词 聚类算法 KNN GNN 密度分布函数 OPTICS DENCLUE 区域比例 半径比例因子
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部