期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于MapReduce和改进密度峰值的划分聚类算法 被引量:7
1
作者 黄学雨 向驰 陶涛 《计算机应用研究》 CSCD 北大核心 2021年第10期2988-2993,3024,共7页
对于基于划分的聚类算法随机选取初始聚类中心导致初始中心敏感,聚类结果不稳定、集群效率低等问题,提出一种基于MapReduce框架和改进的密度峰值的划分聚类算法(based on MapReduce framework and improved density peak partition clus... 对于基于划分的聚类算法随机选取初始聚类中心导致初始中心敏感,聚类结果不稳定、集群效率低等问题,提出一种基于MapReduce框架和改进的密度峰值的划分聚类算法(based on MapReduce framework and improved density peak partition clustering algorithm,MR-IDPACA)。首先,通过自然最近邻定义新的局部密度计算方式,将搜索样本密度峰值点作为划分聚类算法的初始聚类中心;其次针对算法在大规模数据下运行时间复杂,提出基于E2LSH(exact Euclidean locality sensitive hashing)的一种分区方法,即KLSH(K of locality sensitive hashing)。通过该方法对数据分区后结合MapReduce框架并行搜寻初始聚类中心,有效减少了算法在搜索初始聚类中心时的运行时间;对于MapReduce框架中的数据倾斜问题,提出ME(multistage equilibrium)策略对中间数据进行多段均衡分区,以提升算法运行效率;在MapReduce框架下并行聚类,得到最终聚类结果。实验得出MR-IDPACA算法在单机环境下有着较高的准确率和较强的稳定性,集群性能上也有着较好的加速比和运行时间,聚类效果有所提升。 展开更多
关键词 划分聚类算法 密度峰值 自然最近邻 MAPREDUCE 数据倾斜
在线阅读 下载PDF
半监督二次划分聚类算法及其报表系统应用 被引量:3
2
作者 赵立永 赵冲冲 +1 位作者 时鹏 胡长军 《小型微型计算机系统》 CSCD 北大核心 2011年第3期499-505,共7页
在基于B/S结构的Web报表系统中,报表单元格之间往往存在着复杂的依赖关系,某一单元格的求值过程会进行大量的涉及到其它单元格的公式计算,而在多用户访问的情况下,这种计算开销更为可观,导致服务器负载过重,响应速度变慢.优化报表的计... 在基于B/S结构的Web报表系统中,报表单元格之间往往存在着复杂的依赖关系,某一单元格的求值过程会进行大量的涉及到其它单元格的公式计算,而在多用户访问的情况下,这种计算开销更为可观,导致服务器负载过重,响应速度变慢.优化报表的计算任务,可以有效减少计算量和减轻服务器端负载.为此本文提出一种半监督二次划分聚类算法,在单元格聚类的基础上,以报表单元格为顶点,以单元格之间的引用关系为有向边建立有向最大无环子图,然后通过协同计算各有向最大无环子图的拓扑序列,从而获得较优的计算顺序,达到提高Web报表计算效率,减轻服务器负载的目的.通过该算法与常规算法的对比试验,验证了其能有效降低计算量,提高系统响应速度.该算法已经成功应用于实际的Web报表系统中,表现出良好的实用性. 展开更多
关键词 半监督二次划分聚类算法 WEB报表 有向无环图 依赖关系 拓扑排序 报表单元格
在线阅读 下载PDF
文档聚类中k-means算法的一种改进算法 被引量:29
3
作者 万小军 杨建武 陈晓鸥 《计算机工程》 CAS CSCD 北大核心 2003年第2期102-103,157,共3页
介绍了文档聚类中基于划分的k-means算法,k-means算法适合于海量文档集的处理,但它对孤立点很敏感。为此,文章提出将聚类均值点与聚类种子相分离的思想,并具体给出了基于该思想的对k-means算法的改进算法。实验表明,该改进算法比原... 介绍了文档聚类中基于划分的k-means算法,k-means算法适合于海量文档集的处理,但它对孤立点很敏感。为此,文章提出将聚类均值点与聚类种子相分离的思想,并具体给出了基于该思想的对k-means算法的改进算法。实验表明,该改进算法比原k-means算法具有更高的准确性和稳定性。 展开更多
关键词 文档 K-MEANS算法 划分聚类算法 数据库
在线阅读 下载PDF
一种初值优化的K-均值文档聚类算法(英文) 被引量:2
4
作者 陈媛媛 屈志毅 +1 位作者 张恒龙 廖绍雯 《江西师范大学学报(自然科学版)》 CAS 北大核心 2008年第2期206-210,共5页
K-均值算法是文档聚类中常用的一种划分方法.近年来,为提高聚类质量,出现了不少优化初始中心的改进算法.该文在基于密度选择中心点算法的基础上,建立了相似度概率模型辅助密度参数的确定,有效减少了参数选择的盲目性.同时,该文提出一种... K-均值算法是文档聚类中常用的一种划分方法.近年来,为提高聚类质量,出现了不少优化初始中心的改进算法.该文在基于密度选择中心点算法的基础上,建立了相似度概率模型辅助密度参数的确定,有效减少了参数选择的盲目性.同时,该文提出一种二分快速确定K值最优解的方法.大量实验结果表明,该方法具有理想的效果. 展开更多
关键词 文档 K-均值 向量空间模型 划分聚类算法
在线阅读 下载PDF
具备历史借鉴能力的软划分聚类模型
5
作者 孙寿伟 钱鹏江 +1 位作者 陈爱国 蒋亦樟 《计算机应用》 CSCD 北大核心 2015年第2期435-439,共5页
在数据稀少或失真等场景下,传统软划分聚类算法无法获得满意的聚类效果。为解决该问题,以极大熵聚类算法为基础,基于历史知识利用的途径,提出两种新的具备历史借鉴能力的软划分聚类模型(分别简称SPBCRHK-1和SPBC-RHK-2)。SPBC-RHK-1是... 在数据稀少或失真等场景下,传统软划分聚类算法无法获得满意的聚类效果。为解决该问题,以极大熵聚类算法为基础,基于历史知识利用的途径,提出两种新的具备历史借鉴能力的软划分聚类模型(分别简称SPBCRHK-1和SPBC-RHK-2)。SPBC-RHK-1是仅借鉴历史类中心的基础模型,SPBC-RHK-2则是以历史类中心和历史隶属度相融合为手段的高级模型。通过历史知识借鉴,两种模型的聚类有效性均得到有效提高,比较而言具备更高知识利用能力的SPBC-RHK-2模型在聚类有效性和鲁棒性上具有更好的表现。由于所用历史知识不暴露历史源数据,因此两种方法还具有良好的历史数据隐私保护效果。最后在模拟数据集和真实数据集上的实验验证了上述优点。 展开更多
关键词 划分聚类算法 信息缺失或失真 历史知识 知识利用 隐私保护
在线阅读 下载PDF
一种基于划分的无监督优化算法 被引量:1
6
作者 孟娜娜 徐振明 《计算机工程》 CAS CSCD 北大核心 2011年第S1期168-170,共3页
基于划分的经典聚类算法存在对初始聚类中心选取敏感的不足,为此,提出一种基于划分的无监督优化算法。针对经典算法效率受噪声点影响以及对聚类研究对象形状存在局限的问题,引入层次聚类的思想,设计基于遗传算法的初始聚类中心动态选取... 基于划分的经典聚类算法存在对初始聚类中心选取敏感的不足,为此,提出一种基于划分的无监督优化算法。针对经典算法效率受噪声点影响以及对聚类研究对象形状存在局限的问题,引入层次聚类的思想,设计基于遗传算法的初始聚类中心动态选取与优化聚类算法。实验结果表明,该算法可实现对任意形状、任意大小数据集快速有效的聚类。 展开更多
关键词 划分聚类算法 适应度 初始中心 遗传算法
在线阅读 下载PDF
一种融合三支决策理论的改进K-means算法 被引量:9
7
作者 夏月月 张以文 《小型微型计算机系统》 CSCD 北大核心 2020年第4期724-731,共8页
传统的K-means算法及其改进算法在对数据集进行聚类划分时通常精确地确定样本点与聚簇的隶属关系,没有充分考虑隶属关系模糊的边界点.本文提出一种结合三支决策理论的改进算法TK-means.首先,将数据空间分为核心区域和边缘区域分别处理,... 传统的K-means算法及其改进算法在对数据集进行聚类划分时通常精确地确定样本点与聚簇的隶属关系,没有充分考虑隶属关系模糊的边界点.本文提出一种结合三支决策理论的改进算法TK-means.首先,将数据空间分为核心区域和边缘区域分别处理,解决K-means算法对所有样本点统一处理造成的聚类结果不准确的问题;其次,结合网格聚类算法中划分网格的思想快速确定核心点和边缘点;最后,设计了新的初始聚类中心确定方法,可有效解决K-means算法初始聚类中心随机选择使得聚类结果不稳定的问题.通过模拟数据集和UCI数据集的大量实验证明,TK-means算法比现有经典的K-means及其改进算法拥有更好的性能. 展开更多
关键词 三支决策 K-MEANS 划分聚类算法
在线阅读 下载PDF
智能制造系统可靠性与风险评估模型 被引量:2
8
作者 段春艳 王佳洁 +1 位作者 王皓博 张文娟 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第2期313-322,共10页
针对智能制造系统的可靠性与风险评估问题,提出一种基于改进失效模式与影响分析(FMEA)的智能制造系统可靠性与风险评估模型。从创新运用组合权重、逼近理想解排序法思想和模糊多准则妥协解排序法的角度对传统FMEA模型进行改进;基于逼近... 针对智能制造系统的可靠性与风险评估问题,提出一种基于改进失效模式与影响分析(FMEA)的智能制造系统可靠性与风险评估模型。从创新运用组合权重、逼近理想解排序法思想和模糊多准则妥协解排序法的角度对传统FMEA模型进行改进;基于逼近理想解排序法思想得到专家权重,减少了专家团队对失效模式风险因子分析过程中的个体差异;使用模糊层次分析法和熵权法分别计算风险因子的主观和客观权重,减少了风险因子确定的主观性。最后,运用围绕中心点划分(PAM)聚类算法对改进模型得到的结果进行分析,并应用于智能制造系统风险评估中,确定了智能制造系统中各失效模式的重要程度,通过比较分析验证了改进模型的有效性。 展开更多
关键词 智能制造系统 失效模式与影响分析 模糊多准则妥协解排序法 可靠性 风险评估 围绕中心点划分(PAM)算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部