期刊文献+
共找到136篇文章
< 1 2 7 >
每页显示 20 50 100
Scaling up Kernel Grower Clustering Method for Large Data Sets via Core-sets 被引量:2
1
作者 CHANG Liang DENG Xiao-Ming +1 位作者 ZHENG Sui-Wu WANG Yong-Qing 《自动化学报》 EI CSCD 北大核心 2008年第3期376-382,共7页
核栽培者是聚类最近 Camastra 和 Verri 建议的方法的一个新奇的核。它证明为各种各样的数据的好性能关于流行聚类的算法有利地设定并且比较。然而,方法的主要缺点是在处理大数据集合的弱可伸缩能力,它极大地限制它的应用程序。在这... 核栽培者是聚类最近 Camastra 和 Verri 建议的方法的一个新奇的核。它证明为各种各样的数据的好性能关于流行聚类的算法有利地设定并且比较。然而,方法的主要缺点是在处理大数据集合的弱可伸缩能力,它极大地限制它的应用程序。在这份报纸,我们用核心集合建议一个可伸缩起来的核栽培者方法,它是比为聚类的大数据的原来的方法显著地快的。同时,它能处理很大的数据集合。象合成数据集合一样的基准数据集合的数字实验显示出建议方法的效率。方法也被用于真实图象分割说明它的性能。 展开更多
关键词 大型数据集 图象分割 模式识别 磁心配置 核聚类
在线阅读 下载PDF
Clustering method based on data division and partition 被引量:1
2
作者 卢志茂 刘晨 +2 位作者 S.Massinanke 张春祥 王蕾 《Journal of Central South University》 SCIE EI CAS 2014年第1期213-222,共10页
Many classical clustering algorithms do good jobs on their prerequisite but do not scale well when being applied to deal with very large data sets(VLDS).In this work,a novel division and partition clustering method(DP... Many classical clustering algorithms do good jobs on their prerequisite but do not scale well when being applied to deal with very large data sets(VLDS).In this work,a novel division and partition clustering method(DP) was proposed to solve the problem.DP cut the source data set into data blocks,and extracted the eigenvector for each data block to form the local feature set.The local feature set was used in the second round of the characteristics polymerization process for the source data to find the global eigenvector.Ultimately according to the global eigenvector,the data set was assigned by criterion of minimum distance.The experimental results show that it is more robust than the conventional clusterings.Characteristics of not sensitive to data dimensions,distribution and number of nature clustering make it have a wide range of applications in clustering VLDS. 展开更多
关键词 clustering DIVISION PARTITION very large data sets (VLDS)
在线阅读 下载PDF
基于粒球邻域粗糙集的三支高斯混合聚类
3
作者 邵春梅 万仁霞 +1 位作者 苗夺谦 赵杰 《郑州大学学报(理学版)》 北大核心 2025年第6期16-23,共8页
为了解决高维数据集中冗余信息影响三支高斯混合模型聚类效果的问题,将粒球邻域粗糙集的理论融入三支高斯混合聚类模型中,提出一种基于粒球邻域粗糙集的三支高斯混合聚类模型。首先,使用k-means聚类生成满足纯度要求的粒球集,再在粒球... 为了解决高维数据集中冗余信息影响三支高斯混合模型聚类效果的问题,将粒球邻域粗糙集的理论融入三支高斯混合聚类模型中,提出一种基于粒球邻域粗糙集的三支高斯混合聚类模型。首先,使用k-means聚类生成满足纯度要求的粒球集,再在粒球生成正域不变约束下进行属性约简,提取关键属性。其次,使用三支高斯混合模型对约简后的数据进行聚类,将对象划分到类簇的核心域或边界域。在7个UCI公共数据集上的对比实验结果表明,所提模型不仅继承了三支高斯混合聚类模型优越的聚类性能,具有更高的准确率、轮廓系数和更低的戴维森堡丁指数,其对类簇边界部分的刻画也更加准确。此外,由于所提模型对高维空间进行了属性约简处理,使得其具有更小的时间复杂度。 展开更多
关键词 高维数据 三支高斯混合模型 聚类 粒球邻域粗糙集 正域 属性约简
在线阅读 下载PDF
基于文献计量分析的土壤质量评价最小数据集(MDS)研究热点分析及展望
4
作者 侯意龙 马睿岐 +6 位作者 李征 石武良 李斌 张生武 曹宁 崔金虎 张玉斌 《农学学报》 2025年第5期48-61,共14页
本研究采用文献计量学方法,总结当前土壤质量研究中最小数据集(MDS)选取的方法和指标,定量分析并指出土壤质量评价中最小数据集的热点和前沿,为中国土壤质量评价和农业绿色发展提供科学参考。通过检索1991-2022年CNKI和Web of Science... 本研究采用文献计量学方法,总结当前土壤质量研究中最小数据集(MDS)选取的方法和指标,定量分析并指出土壤质量评价中最小数据集的热点和前沿,为中国土壤质量评价和农业绿色发展提供科学参考。通过检索1991-2022年CNKI和Web of Science相关文献,收集了文献中310个最小数据集进行筛选,借助CiteSpace和VOSviewer对年度发文量、国家/地区、机构、期刊进行共现分析,对关键词进行突现词和聚类分析。31年来该领域文献量逐步增加并仍处于快速发展阶段,中国是发文量最多的国家,期刊载文量最多的为《土壤通报》《生态学报》和Ecological Indicators;主要研究热点表现在“农业管理对土壤质量影响、土壤退化与修复、土壤质量对气候变化的响应与应对及最小数据集筛选方法与模型构建”等方面;前期MDS在土壤质量评价中选用较多的主要为物理、化学指标,但随着土壤健康的发展,生物学指标逐步增长。在未来一段时间内MDS发文量仍为快速增长阶段,发展中国家在全球起着重要节点作用;MDS核心指标为土壤有机质/碳(SOM/SOC)、pH、全氮、速效磷和容重;未来研究应注重在基于大数据平台构建不同尺度下静态评价与动态监测相结合的综合反映土壤功能的土壤健康质量评价框架体系,探讨气候变化背景下与土壤质量变化相对应的MDS及其指标体系,构建精准反映土壤质量变化规律的评价模型与最优最小数据集。 展开更多
关键词 土壤质量评价 最小数据集 CITESPACE 聚类分析 评价指标 土壤健康
在线阅读 下载PDF
用迭代自组织数据分析技术A(ISODATA)对零件进行模糊分类 被引量:2
5
作者 吴庄胜 支灿 《西南交通大学学报》 EI CSCD 北大核心 1991年第3期103-108,共6页
本文将机械零件的 GT 分类编码视为模糊样品集,进行分类成组。给出了模糊数学模型,用 ISODATA 模糊聚类方法进行求解,程序运行的结果表明:比普通聚类法运行速度快;结果更切合客观实际。
关键词 成组技术 机械零件 ISOdata
在线阅读 下载PDF
MSHC:一种多阶段超图聚类算法
6
作者 张春英 王静 +2 位作者 刘璐 兰思武 张庆达 《深圳大学学报(理工版)》 北大核心 2025年第1期68-76,共9页
超图作为普通图的高维推广,能够更加灵活地反映节点间的高阶复杂关系.超图聚类旨在发现超图结构中复杂的高阶关联关系.针对目前超图聚类结果不稳定、容易陷入局部最优等问题,结合超图划分思想,提出一种多阶段超图聚类(multi-stage hyper... 超图作为普通图的高维推广,能够更加灵活地反映节点间的高阶复杂关系.超图聚类旨在发现超图结构中复杂的高阶关联关系.针对目前超图聚类结果不稳定、容易陷入局部最优等问题,结合超图划分思想,提出一种多阶段超图聚类(multi-stage hypergraph clustering,MSHC)算法,该算法将超图聚类过程分为超图约简、超图初始聚类以及优化迁移3个阶段.在超图约简阶段,提出一种不改变超图结构的快速约简方法,降低了后续算法的复杂度;提出基于集对分析理论的超图节点间相似性度量方法,并采用层次聚类方法对超图进行初始聚类,采用4种不同的类簇合并计算方法,增加聚类方案的多样性;将遗传算法应用于优化超图聚类方案的研究中,以此获得最优超图聚类方案.在3个不同规模的数据集上与4个经典的超图聚类方法进行对比实验,结果表明,MSHC算法在Songs_genres数据集和Papers_keywords数据集上超图模块度指数分别提高了0.0797和0.0777,在Movies_genres数据集上仅降低0.0060. 展开更多
关键词 数据处理 超图聚类 遗传算法 集对分析理论 超图约简 多阶段聚类 超图模块度
在线阅读 下载PDF
基于限制容差关系的动力舱冷却通风综合评估
7
作者 张浩 《空军工程大学学报》 北大核心 2025年第2期19-25,共7页
为拓展动力装置冷却通风试飞结果评价体系,定量评估冷却通风系统的综合性能水平,在试飞过程中发动机舱内温度测量数据存在缺失的情况下,引入综合舱温裕度的概念,开展了适用于不完备试飞数据的冷却通风综合性能评估方法研究。使用K-mean... 为拓展动力装置冷却通风试飞结果评价体系,定量评估冷却通风系统的综合性能水平,在试飞过程中发动机舱内温度测量数据存在缺失的情况下,引入综合舱温裕度的概念,开展了适用于不完备试飞数据的冷却通风综合性能评估方法研究。使用K-means聚类算法将舱温数据离散化,结合粗糙集理论的限制容差关系确定舱温指标权重,建立了一种动力舱冷却通风综合性能评估方法,并在3发构型直升机上进行算法应用,评估了冷却通风系统综合性能的影响因素。结果表明,技术状态更改和发动机装机位置对动力舱综合舱温裕度的影响较大,最大差异分别达到65.5℃和83.2℃。综合舱温裕度能够表征冷却通风综合性能,该方法具有通用性,可作为冷却通风试飞传统评估方式的补充。 展开更多
关键词 限制容差关系 冷却通风试飞 数据缺失 综合舱温裕度 K-MEANS聚类 粗糙集理论
在线阅读 下载PDF
基于集对分析的半监督ISODATA聚类
8
作者 魏小涛 《计算机工程与应用》 CSCD 北大核心 2009年第36期99-100,231,共3页
提出一个基于集对分析的半监督ISODATA聚类算法,用于网络异常检测。在三方面进行了改进:首先,算法能够直接处理字符数字混合属性的数据,并使用集对分析来计算数据记录之间的距离;其次,算法同时处理有标号和无标号的数据,并利用少量的有... 提出一个基于集对分析的半监督ISODATA聚类算法,用于网络异常检测。在三方面进行了改进:首先,算法能够直接处理字符数字混合属性的数据,并使用集对分析来计算数据记录之间的距离;其次,算法同时处理有标号和无标号的数据,并利用少量的有标号数据来指导算法的分裂过程;最后,将算法的输入参数减少到只有两个。在KDD99入侵检测数据集上的实验结果显示,该算法获得了95.62%的检测率和1.29%的误报率。 展开更多
关键词 集对分析 网络异常检测 半监督聚类 迭代自组织数据分析方法(ISOdata)
在线阅读 下载PDF
重庆市植烟土壤质量评价指标体系的构建与应用 被引量:2
9
作者 代先强 周嵘 +1 位作者 周鑫斌 冉茂 《土壤》 CAS CSCD 北大核心 2024年第2期388-397,共10页
为准确评价重庆市烟区土壤质量,以重庆2 513个代表性植烟单元(每个单元面积约6.7 hm^(2))的典型烟田土壤理化指标数据为基础,采用聚类分析法和主成分分析法建立了土壤质量评价最小数据集,构建了植烟土壤质量评价指标体系。结果表明:(1)... 为准确评价重庆市烟区土壤质量,以重庆2 513个代表性植烟单元(每个单元面积约6.7 hm^(2))的典型烟田土壤理化指标数据为基础,采用聚类分析法和主成分分析法建立了土壤质量评价最小数据集,构建了植烟土壤质量评价指标体系。结果表明:(1)基于主成分分析法建立的土壤质量评价体系更适合重庆烟区土壤质量评价,评价指标从原来的16个减为7个,具体为:p H、有机质、有效磷、有效铁、有效锌、有效硫和水稳性大团聚体。(2)烟区土壤酸化较为严重,有35.1%的烟田土壤偏酸;土壤氮素较为适宜,而有效磷和速效钾偏高的烟田占比分别为62.9%和75.8%,其他元素缺乏和过量并存,水稳性大团聚体偏低的烟田占比47.2%。(3)对基于最小数据集构建模型进行的合理性验证发现,基于主成分分析法确定的最小数据集(MDS-PCA)模型的R2比基于聚类分析法确定的最小数据模型的R~2高,前者的MAE、RMSE相比后者更小,说明MDS-PCA能够替代全量数据集对烟田土壤质量进行评价;基于MDS-PCA得到的土壤质量指数平均值为0.61,表明烟区土壤质量总体处于中等偏低水平,45.04%的烟田土壤质量急需提升。(4)土壤质量评价指标隶属度值雷达图表明,pH、有效磷、有效铁、有效硫和水稳性大团聚体的隶属度比较小,为烟区土壤质量限制性因子。 展开更多
关键词 植烟土壤 质量评价 聚类分析 主成分分析 最小数据集
在线阅读 下载PDF
基于最小数据集的油茶林土壤质量评价 被引量:1
10
作者 罗蜜 潘波 +3 位作者 王会利 劳贵连 方贵凤 江海涛 《广西林业科学》 2024年第4期438-446,共9页
为给油茶(Camellia)林土壤质量提升和改善提供理论支撑,测定土壤pH值及有机质、全氮、全磷、全钾、水解氮、有效磷、速效钾、代换性钙、代换性镁、有效铜、有效锌、有效硼、有效铁和有效锰含量,采用主成分分析法和聚类分析法建立最小数... 为给油茶(Camellia)林土壤质量提升和改善提供理论支撑,测定土壤pH值及有机质、全氮、全磷、全钾、水解氮、有效磷、速效钾、代换性钙、代换性镁、有效铜、有效锌、有效硼、有效铁和有效锰含量,采用主成分分析法和聚类分析法建立最小数据集,基于土壤质量指数(SQI)对油茶林土壤质量进行评价。结果表明,油茶林养分属于中等水平,土壤pH值为4.77,酸化现象明显。基于主成分分析法建立最小数据集的评价指标包括全氮、有效磷、代换性镁、有效铜和有效锰含量。基于主成分分析法建立最小数据集计算的油茶林SQI为0.249~0.684,均值为0.459,土壤质量等级以Ⅱ~Ⅴ级为主,无Ⅰ级土壤。与聚类分析法相比,基于主成分分析法建立最小数据集能提取大部分数据信息,可有效评价油茶林土壤质量。 展开更多
关键词 主成分分析 聚类分析 最小数据集 土壤质量指数 油茶林
在线阅读 下载PDF
基于数据驱动期望场景集序列的微电网鲁棒经济调度算法 被引量:2
11
作者 秦海杰 郑鹏远 +2 位作者 王雅琳 徐晓旭 支运婷 《现代电力》 北大核心 2024年第5期886-895,共10页
针对新能源和负荷功率的不确定性,提出基于数据驱动期望场景集序列的微电网鲁棒经济调度算法。通过聚类方法将大量历史场景数据进行聚类处理,形成聚类场景集序列,基于概率缩减为期望场景集序列。日前计划阶段,以任意场景可行作为约束条... 针对新能源和负荷功率的不确定性,提出基于数据驱动期望场景集序列的微电网鲁棒经济调度算法。通过聚类方法将大量历史场景数据进行聚类处理,形成聚类场景集序列,基于概率缩减为期望场景集序列。日前计划阶段,以任意场景可行作为约束条件,以期望场景所对应的微电网运行成本的概率加权指标作为目标函数,通过列约束生成算法对微电网经济调度问题进行求解。日内调度阶段,利用新能源和负荷的测量数据,基于日前计划调度结果对微电网进行再调度,通过对传统能源发电功率和电网交互功率调整进行惩罚,来追踪日前计划调度结果,优选出微电网设备最优出力,提高微电网经济性。仿真案例验证了该方法的有效性。 展开更多
关键词 微电网 数据驱动 聚类 期望场景 期望场景集 列约束生成算法 鲁棒经济调度
在线阅读 下载PDF
基于特征聚类和等距映射的无监督特征选择算法 被引量:1
12
作者 段立娟 郭亚静 +1 位作者 解晨瑶 张文博 《北京工业大学学报》 CAS CSCD 北大核心 2024年第3期325-332,共8页
为了提高无标签场景下特征选择的准确率和稳定性,提出一种基于特征聚类和等距映射的无监督特征选择算法。特征聚类将相似性较高的特征聚成一类,然后结合等距映射和稀疏系数矩阵定义新的特征得分计量函数。该函数对各特征簇中的特征进行... 为了提高无标签场景下特征选择的准确率和稳定性,提出一种基于特征聚类和等距映射的无监督特征选择算法。特征聚类将相似性较高的特征聚成一类,然后结合等距映射和稀疏系数矩阵定义新的特征得分计量函数。该函数对各特征簇中的特征进行打分,选择出每个类簇中得分最高的代表特征,构成特征子集。在14个广泛应用的数据集上的实验结果表明:本文所提算法能够选择出具有强分类能力的特征,且算法具有很强的泛化性。 展开更多
关键词 特征选择方法 多源数据集 高维特征 无标签场景 特征聚类 等距映射
在线阅读 下载PDF
基于不完备数据聚类的缺失数据填补方法 被引量:64
13
作者 武森 冯小东 单志广 《计算机学报》 EI CSCD 北大核心 2012年第8期1726-1738,共13页
缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失数据填补方法大部分是基于概率分布等一些统计假设,对于大数据集的数据挖掘不一定是最适合的方法.受不完备数据分析(ROUSTIDA)未采用传统的概率统计学方法启发,提... 缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失数据填补方法大部分是基于概率分布等一些统计假设,对于大数据集的数据挖掘不一定是最适合的方法.受不完备数据分析(ROUSTIDA)未采用传统的概率统计学方法启发,提出基于不完备数据聚类的缺失数据填补方法(MIBOI),针对分类变量不完备数据集定义约束容差集合差异度,直接计算不完备数据对象集合内所有对象的总体相异程度,以不完备数据聚类的结果为基础进行缺失数据的填补.采用UCI机器学习基准数据集进行实验表明,MIBOI对缺失数据的填补是有效可行的. 展开更多
关键词 数据填补 不完备数据 聚类 约束容差集合差异度
在线阅读 下载PDF
半监督的仿射传播聚类 被引量:29
14
作者 王开军 李健 +1 位作者 张军英 涂重阳 《计算机工程》 CAS CSCD 北大核心 2007年第23期197-198,201,共3页
仿射传播聚类算法快速、有效,可以解决大数据集的聚类问题,但当数据的聚类结构比较松散时,聚类准确性不高。该文提出了半监督的仿射传播聚类算法,在迭代过程中嵌入了有效性指标以监督和引导算法向最优聚类结果的方向运行。实验结果表明... 仿射传播聚类算法快速、有效,可以解决大数据集的聚类问题,但当数据的聚类结构比较松散时,聚类准确性不高。该文提出了半监督的仿射传播聚类算法,在迭代过程中嵌入了有效性指标以监督和引导算法向最优聚类结果的方向运行。实验结果表明,该方法对于聚类结构比较紧密和松散的数据集,均可以给出较为准确的聚类结果。 展开更多
关键词 仿射传播聚类 半监督聚类 大数据集的聚类算法
在线阅读 下载PDF
基于粗糙集和决策树的数据挖掘方法 被引量:15
15
作者 吴成东 许可 +1 位作者 韩中华 裴涛 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第5期481-484,共4页
从粗糙集和决策树两种方法具有的优势互补性出发,提出了一种基于粗糙集和决策树相结合的数据挖掘新方法·以胶合板缺陷检测数据分析为应用对象,利用粗糙集理论对胶合板数据库中的特征信息进行缺陷识别·利用谱系聚类重心距离法... 从粗糙集和决策树两种方法具有的优势互补性出发,提出了一种基于粗糙集和决策树相结合的数据挖掘新方法·以胶合板缺陷检测数据分析为应用对象,利用粗糙集理论对胶合板数据库中的特征信息进行缺陷识别·利用谱系聚类重心距离法对数据进行离散化处理,采用粗糙集进行属性约简,得到低维样本数据,最后用决策树方法产生决策规则·实验证明,这种数据挖掘方法保留了原始数据的内部特点,加快了获取知识的进程,提高了模型的分类准确率,增强了规则的可解释性,取得了满意的研究结果· 展开更多
关键词 粗糙集 决策树 数据离散化 数据挖掘 谱系聚类 属性约简
在线阅读 下载PDF
基于粗糙集和决策树的自适应神经网络短期负荷预测方法 被引量:29
16
作者 牛东晓 王建军 +1 位作者 李莉 李存斌 《电力自动化设备》 EI CSCD 北大核心 2009年第10期30-34,共5页
利用数据挖掘中的聚类技术将历史负荷数据进行聚类,根据聚类后的分类信息对定性属性利用粗糙集进行属性约简,由约简结果进一步生成决策规则树供短期预测使用。根据聚类的结果对每类进行BP神经网络的训练,神经网络的隐含层单元采取逐步... 利用数据挖掘中的聚类技术将历史负荷数据进行聚类,根据聚类后的分类信息对定性属性利用粗糙集进行属性约简,由约简结果进一步生成决策规则树供短期预测使用。根据聚类的结果对每类进行BP神经网络的训练,神经网络的隐含层单元采取逐步试用的方法根据训练误差最小化进行选择。在实际预测中,首先对待预测的记录利用决策规则树进行归类,然后选取相应类别的神经网络予以预测。通过实例证明,该方法的平均相对误差为2.16%,而同结构BP神经网络预测的平均相对误差为2.67%,ARMA预测的平均相对误差为3.81%,证明所提方法有效。 展开更多
关键词 数据挖掘 负荷预测 短期 聚类 粗糙集 决策树 自适应神经网络
在线阅读 下载PDF
基于新的距离度量的K-Modes聚类算法 被引量:47
17
作者 梁吉业 白亮 曹付元 《计算机研究与发展》 EI CSCD 北大核心 2010年第10期1749-1755,共7页
传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-... 传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-1匹配差异法的不足,既考虑了它们本身的异同,又考虑了其他相关分类属性对它们的区分性.并将提出的距离度量应用于传统K-Modes聚类算法中.通过与基于其他距离度量的K-Modes聚类算法进行实验比较,结果表明新的距离度量是更加有效的. 展开更多
关键词 聚类算法 分类属性数据 粗糙集 粗糙隶属度 距离度量
在线阅读 下载PDF
一种量化关联规则挖掘算法 被引量:10
18
作者 佟强 周园春 +1 位作者 吴开超 阎保平 《计算机工程》 CAS CSCD 北大核心 2007年第10期34-35,69,共3页
提出了一种新的挖掘量化关联规则的方法。该方法使用聚类算法把数据库中的交易记录分成若干个簇,把簇投影到数值型属性所在的域,形成重叠的、有意义的区间。实验结果显示,这种方法能够有效地挖掘量化关联规则,并且能够发现以前的算法可... 提出了一种新的挖掘量化关联规则的方法。该方法使用聚类算法把数据库中的交易记录分成若干个簇,把簇投影到数值型属性所在的域,形成重叠的、有意义的区间。实验结果显示,这种方法能够有效地挖掘量化关联规则,并且能够发现以前的算法可能遗漏的重要的规则。 展开更多
关键词 数据挖掘 量化关联规则 频集 聚类
在线阅读 下载PDF
基于数据挖掘的图书馆个性化服务系统 被引量:12
19
作者 柳炳祥 邓欢军 +1 位作者 高淑妍 陈欢欢 《现代情报》 北大核心 2007年第3期108-109,共2页
分析和研究了粗糙集和模糊聚类两种常用的数据挖掘算法,将其应用到图书馆个性化服务中,建立了一个基于数据挖掘的图书馆个性化服务系统,并对我院图书馆借阅数据进行了分析,为图书馆个性化服务提出了一种新的研究思路和分析方法。
关键词 数据挖掘 个性化服务 粗糙集 模糊聚类
在线阅读 下载PDF
基于改进的K-means算法的关联规则数据挖掘研究 被引量:37
20
作者 李珺 刘鹤 朱良宽 《小型微型计算机系统》 CSCD 北大核心 2021年第1期15-19,共5页
关联规则是数据挖掘中的概念,通过分析数据找到数据之间的关联.海量数据会产生大量冗余和相似的关联规则,影响用户对规则的理解和判断.本文采用鸢尾花数据集进行实验.建立三个检验指标,删除冗余关联规则;在进行K-means分析时利用规则产... 关联规则是数据挖掘中的概念,通过分析数据找到数据之间的关联.海量数据会产生大量冗余和相似的关联规则,影响用户对规则的理解和判断.本文采用鸢尾花数据集进行实验.建立三个检验指标,删除冗余关联规则;在进行K-means分析时利用规则产生的三角形迭代选择初始点,再将删除冗余后的规则进行聚类.实验证实本文方法将相似的关联规则归为一簇,能有效的帮助用户迅速找到有用的关联规则,有助于用户更好的对规则进行理解和分析,提高了聚类的效率. 展开更多
关键词 K-MEANS算法 关联规则 聚类算法 鸢尾花数据集
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部