期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
基于特定领域的中文微博热点话题挖掘系统BTopicMiner 被引量:26
1
作者 李劲 张华 +1 位作者 吴浩雄 向军 《计算机应用》 CSCD 北大核心 2012年第8期2346-2349,共4页
随着微博应用的迅猛发展,自动地从海量微博信息中提取出用户感兴趣的热点话题成为一个具有挑战性的研究课题。为此研究并提出了基于扩展的话题模型的中文微博热点话题抽取算法。为了解决微博信息固有的数据稀疏性问题,算法首先利用文本... 随着微博应用的迅猛发展,自动地从海量微博信息中提取出用户感兴趣的热点话题成为一个具有挑战性的研究课题。为此研究并提出了基于扩展的话题模型的中文微博热点话题抽取算法。为了解决微博信息固有的数据稀疏性问题,算法首先利用文本聚类方法将内容相关的微博消息合成为微博文档;基于微博之间的跟帖关系蕴含着话题的关联性的假设,算法对传统潜在狄利克雷分配(LDA)话题模型进行扩展以建模微博之间的跟帖关系;最后利用互信息(MI)计算被抽取出的话题的话题词汇用于热点话题推荐。为了验证扩展的话题抽取模型的有效性,实现了一个基于特定领域的中文微博热点话题挖掘的原型系统——BTopicMiner。实验结果表明:基于微博跟帖关系的扩展话题模型可以更准确地自动提取微博中的热点话题,同时利用MI度量自动计算得到的话题词汇和人工挑选的热点词汇之间的语义相似度达到75%以上。 展开更多
关键词 数据挖掘 信息检索 微博 话题模型 文本聚类 互信息
在线阅读 下载PDF
基于数据挖掘探讨国医大师王琦院士治疗头痛的用药规律
2
作者 马晗 赵永烈 +2 位作者 郭文茜 王济 王琦 《世界中医药》 北大核心 2025年第9期1589-1594,共6页
目的:挖掘王琦院士治疗头痛的用药规律,拓宽治疗头痛病的临床诊疗思路,为中医治疗头痛病提供临床依据和参考。方法:采集并整理王琦院士门诊治疗头痛病的完整医案,使用Excel 2019建立治疗头痛的方药数据库,运用SPSS Modeler 18.0、SPSS S... 目的:挖掘王琦院士治疗头痛的用药规律,拓宽治疗头痛病的临床诊疗思路,为中医治疗头痛病提供临床依据和参考。方法:采集并整理王琦院士门诊治疗头痛病的完整医案,使用Excel 2019建立治疗头痛的方药数据库,运用SPSS Modeler 18.0、SPSS Statistics 26.0软件进行频次统计、关联规则及聚类分析,然后运用中医学理论对统计结果进行分析讨论。结果:纳入治疗头痛的处方246首,涉及中药225味,总用药频次为2 554次。常用中药为川芎、白芍、白芷、甘草、土茯苓等,以解表药、活血化瘀药和补虚药为主,药性以温为主,药味多辛苦甘,归经多属肝经、脾经、肺经。挖掘得到关联规则12条(2味药8条、3味药4条),包括“川芎-白芷-白芍”“川芎-白芷”“川芎-蔓荆子”等。聚类分析得到4类药物,包括“乳香,没药,丹参,川芎,蔓荆子,白芍,甘草,延胡索,葛根,天麻,土茯苓”“白芥子,郁李仁,香附,柴胡,白芷”等多种药物组合。主成分因子分析共提取出8个公因子。结论:王琦院士临证辨治头痛用药多以解表药、活血化瘀药为主,性味多以辛温为主,归经以肝脾肺经为主,重视气血经脉辨证,强调理气活血通络治法的运用,为临床辨治头痛提供新的思路。 展开更多
关键词 头痛 数据挖掘 用药规律 国医大师 @王琦 关联规则 聚类分析 “辨体-辨病-辨证” 诊疗模式
在线阅读 下载PDF
高维空间中的离群点发现 被引量:44
3
作者 魏藜 宫学庆 +1 位作者 钱卫宁 周傲英 《软件学报》 EI CSCD 北大核心 2002年第2期280-290,共11页
在许多KDD(knowledge discovery in databases)应用中,如电子商务中的欺诈行为监测,例外情况或离群点的发现比常规知识的发现更有意义.现有的离群点发现大多是针对数值属性的,而且这些方法只能发现离群点不能对其含义进行解释.提出了一... 在许多KDD(knowledge discovery in databases)应用中,如电子商务中的欺诈行为监测,例外情况或离群点的发现比常规知识的发现更有意义.现有的离群点发现大多是针对数值属性的,而且这些方法只能发现离群点不能对其含义进行解释.提出了一种基于超图模型的离群点(outlier)定义,这一定义既体现了“局部”的概念能很好地解释离群点的含义.同时给出了HOT(hypergraph-based outlier test)算法,通过计算每个点的支持度、隶属度和规模偏差来检测离群点.该算法既能够处理数值属性,又能够处理类别属性.分析表明,该算法能有效地发现高维空间数据中的离群点. 展开更多
关键词 数据挖掘 离群点 超图模型 聚类 知识发现 高维空间数据库
在线阅读 下载PDF
一种基于概念的数据聚类模型 被引量:15
4
作者 张明卫 刘莹 +1 位作者 张斌 朱志良 《软件学报》 EI CSCD 北大核心 2009年第9期2387-2396,共10页
在数据挖掘研究领域,现有的大多数聚类算法都受到数据可伸缩性和结果可解释性的限制.为了解决这一难题,提出了一种基于概念的数据聚类模型.该模型从描述数据样本的数据本身出发,首先在预处理后的数据集上提取基本概念,再对这些概念进行... 在数据挖掘研究领域,现有的大多数聚类算法都受到数据可伸缩性和结果可解释性的限制.为了解决这一难题,提出了一种基于概念的数据聚类模型.该模型从描述数据样本的数据本身出发,首先在预处理后的数据集上提取基本概念,再对这些概念进行概化,形成表示聚类结果的高层概念,最后基于这些高层概念进行样本划分,从而完成整个聚类过程.该模型能够在保证聚类准确性的基础上,很大程度地减少要处理的数据量,提高原算法的可伸缩性.另外,该模型基于概念进行知识的发现与分析,能够提高聚类结果的可解释性,便于与用户交互.实验结果表明,该模型对于聚类结果较好且复杂度较高的算法尤为有效. 展开更多
关键词 数据挖掘 聚类 概念 概念元组 模型
在线阅读 下载PDF
基于数据模式聚类算法的离群点检测 被引量:3
5
作者 李永丽 任辉明 +3 位作者 董立岩 李威 陈思国 赵宇 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2007年第3期435-437,共3页
针对传统模式挖掘算法在事务包含模式定义上未考虑模式间的包含关系而使聚类结果不够优良的问题,提出一种新的基于模式聚类的离群点检测算法PCOT,该算法适合于高维数据空间,采用一种新的事务包含模式,通过将模式表示成超图,用超图分割... 针对传统模式挖掘算法在事务包含模式定义上未考虑模式间的包含关系而使聚类结果不够优良的问题,提出一种新的基于模式聚类的离群点检测算法PCOT,该算法适合于高维数据空间,采用一种新的事务包含模式,通过将模式表示成超图,用超图分割方法对模式进行聚类.实验与分析结果表明,该算法能有效地在高维稀疏空间中发现离群点. 展开更多
关键词 数据挖掘 离群点 聚类 超图分割
在线阅读 下载PDF
基于改进RFM模型的电子商务客户细分 被引量:50
6
作者 徐翔斌 王佳强 +1 位作者 涂欢 穆明 《计算机应用》 CSCD 北大核心 2012年第5期1439-1442,共4页
对电子商务企业的客户进行准确细分,采取相应的营销策略,是电子商务发展的重要环节。在传统零售行业客户细分的RFM模型上,引入总利润属性,创建RFP模型,使用数据挖掘K-Means算法对某电子商务企业客户进行聚类分析,与RFM模型比较,并分析... 对电子商务企业的客户进行准确细分,采取相应的营销策略,是电子商务发展的重要环节。在传统零售行业客户细分的RFM模型上,引入总利润属性,创建RFP模型,使用数据挖掘K-Means算法对某电子商务企业客户进行聚类分析,与RFM模型比较,并分析了模型属性的关联性对聚类结果的影响,得出了模型比较的六个结论和四个营销策略,能为电子商务行业以及其他销售行业提出相关营销策略。 展开更多
关键词 电子商务 数据挖掘 RFM模型 聚类分析客户细分
在线阅读 下载PDF
基于MapReduce的分布式网络数据聚类算法 被引量:9
7
作者 陈东明 刘健 +1 位作者 王冬琦 徐晓伟 《计算机工程》 CAS CSCD 2013年第7期76-82,共7页
时空复杂度较高以及物理机器内存不足,会导致传统聚类算法不能有效地分析处理大规模数据网络。针对该问题,在MapReduce分布式模型的基础上,提出一种网络数据分布式聚类算法。根据MRC理论设计有限MapReduce轮数,控制混洗过程所需时间,利... 时空复杂度较高以及物理机器内存不足,会导致传统聚类算法不能有效地分析处理大规模数据网络。针对该问题,在MapReduce分布式模型的基础上,提出一种网络数据分布式聚类算法。根据MRC理论设计有限MapReduce轮数,控制混洗过程所需时间,利用Map内合并技术对网络流量进行控制,在进行中间结果合并时仅对社团合并,而不考虑社团内部节点,以控制内存开销。使用模拟生成的数据在集群中进行实验,结果表明,当数据规模和集群规模增大时,该算法具有较好的加速比和扩展性。 展开更多
关键词 聚类算法 分布式聚类 MapReduce编程模型 数据挖掘 社团结构
在线阅读 下载PDF
基于用户模式聚类的智能信息推荐算法 被引量:7
8
作者 何波 杨武 +1 位作者 张建勋 王越 《计算机工程与设计》 CSCD 北大核心 2006年第13期2360-2361,2374,共3页
基于数据挖掘的智能信息推荐日益成为一个重要的研究课题。针对现有智能信息推荐算法存在的不足,提出了一种基于用户模式聚类的智能信息推荐算法(IRUMC)。该算法将相似的用户模式聚类到一起,生成用户聚类模式,然后将用户访问操作与用户... 基于数据挖掘的智能信息推荐日益成为一个重要的研究课题。针对现有智能信息推荐算法存在的不足,提出了一种基于用户模式聚类的智能信息推荐算法(IRUMC)。该算法将相似的用户模式聚类到一起,生成用户聚类模式,然后将用户访问操作与用户聚类模式进行匹配,最后形成推荐集。它比较适合新用户、访问站点较少的用户和有新颖性信息需求的用户。实验结果表明,该算法是有效的。 展开更多
关键词 智能信息推荐 用户模式 数据挖掘 聚类 WEB挖掘
在线阅读 下载PDF
基于属性分布相似度的超图高维聚类算法研究 被引量:7
9
作者 陈建斌 宋翰涛 《计算机工程与应用》 CSCD 北大核心 2004年第34期195-198,共4页
在许多聚类应用中,数据对象是具有高维、稀疏、二元的特征。传统聚类算法无法有效地处理此类数据。该文提出一种基于超图模型的高维聚类算法,通过定义对象属性分布特征向量和对象间属性分布相似度,建立超图模型,并应用超图分割法进行聚... 在许多聚类应用中,数据对象是具有高维、稀疏、二元的特征。传统聚类算法无法有效地处理此类数据。该文提出一种基于超图模型的高维聚类算法,通过定义对象属性分布特征向量和对象间属性分布相似度,建立超图模型,并应用超图分割法进行聚类。聚类结果通过簇内奇异特征值进行评价。实验结果和算法分析表明,该算法可以有效地进行聚类知识挖掘。 展开更多
关键词 高维聚类 超图模型 数据挖掘
在线阅读 下载PDF
模糊粗糙数据模型:一种数据分析的新方法 被引量:7
10
作者 黄金杰 武俊峰 蔡云泽 《计算机学报》 EI CSCD 北大核心 2005年第11期1866-1874,共9页
提出了一种数据分析的新方法———模糊粗糙数据模型(Fuzzy Rough Data Model,FRDM).该方法采用动态自适应模糊聚类技术,将Kowalczyk方法中的粗糙数据模型(Rough Data Model,RDM)对输入数据空间的网格状“硬划分”转化为模糊划分,辨识... 提出了一种数据分析的新方法———模糊粗糙数据模型(Fuzzy Rough Data Model,FRDM).该方法采用动态自适应模糊聚类技术,将Kowalczyk方法中的粗糙数据模型(Rough Data Model,RDM)对输入数据空间的网格状“硬划分”转化为模糊划分,辨识输入数据空间中的模糊模式类,并通过定义各模糊模式类与决策类别之间的类型映射关系ftype:Ci→y,以及输入数据对各模式类分类规则的匹配度(Degree of Fulfillment,DoF(x))概念,建立起相应的FRDM模型.不同数据集的实验测试结果表明,与Kowalczyk的RDM方法相比,文中方法具有更好的数据概括能力、更强的噪声数据处理能力和更高的搜索效率. 展开更多
关键词 粗糙集 粗糙数据模型 模糊聚类 数据挖掘 模糊粗糙数据模型
在线阅读 下载PDF
工程类几何模型分类与聚类的现状与趋势 被引量:2
11
作者 莫蓉 石源 +2 位作者 常智勇 陈泽峰 张欣 《计算机集成制造系统》 EI CSCD 北大核心 2010年第3期449-461,共13页
总结了目前工程类几何模型分类与聚类问题的研究进展。首先分析了基于k最近邻方法和基于支持向量机的模型分类技术,回顾了传统聚类技术和人工神经网络在模型聚类方面的应用现状;然后探讨了聚类和降维技术在模型分类与聚类的过程可视化... 总结了目前工程类几何模型分类与聚类问题的研究进展。首先分析了基于k最近邻方法和基于支持向量机的模型分类技术,回顾了传统聚类技术和人工神经网络在模型聚类方面的应用现状;然后探讨了聚类和降维技术在模型分类与聚类的过程可视化和结果可视化方面的应用。最后,通过对已有研究成果的比较分析,预测了工程类几何模型的分类与聚类的研究方向。 展开更多
关键词 几何模型 分类 聚类 可视化 数据挖掘
在线阅读 下载PDF
一种基于垂直分布的非数值数据聚类算法 被引量:1
12
作者 何增有 邓胜春 +1 位作者 徐晓飞 宋玉福 《小型微型计算机系统》 CSCD 北大核心 2003年第12期2267-2269,共3页
在本文中 ,我们提出了一种新的非数值数据聚类算法 -VBCCD .VBCCD算法由关系表计算关系的一维分割 ,再由关系的分割来构造一个超图 ,而后通过超图分割算法 ,对构造出来的超图进行优化分割 ,得到最终的聚类结果 .试验结果表明 ,该算法比... 在本文中 ,我们提出了一种新的非数值数据聚类算法 -VBCCD .VBCCD算法由关系表计算关系的一维分割 ,再由关系的分割来构造一个超图 ,而后通过超图分割算法 ,对构造出来的超图进行优化分割 ,得到最终的聚类结果 .试验结果表明 ,该算法比传统的针对数值数据设计的聚类算法有更好的效果 . 展开更多
关键词 数据挖掘 超图 非数值数据聚类算法 VBCCD算法 垂直分布
在线阅读 下载PDF
基于数据挖掘的符号序列聚类相似度量模型 被引量:3
13
作者 郑宏珍 初佃辉 +1 位作者 战德臣 徐晓飞 《计算机工程》 CAS CSCD 北大核心 2009年第1期178-179,194,共3页
为了从消费者偏好序列中发现市场细分结构,采用数据挖掘领域中的符号序列聚类方法,提出一种符号序列聚类的研究方法和框架,给出RSM相似性度量模型。调整RSM模型参数,使得RSM可以变为与编辑距离、海明距离等价的相似性度量。通过RSM与其... 为了从消费者偏好序列中发现市场细分结构,采用数据挖掘领域中的符号序列聚类方法,提出一种符号序列聚类的研究方法和框架,给出RSM相似性度量模型。调整RSM模型参数,使得RSM可以变为与编辑距离、海明距离等价的相似性度量。通过RSM与其他序列相似性度量的比较,表明RSM具有更强的表达相似性概念的能力。由于RSM能够表达不同的相似性概念,从而使之能适用于不同的应用环境,并在其基础上提出自组织特征映射退火符号聚类模型,使得从消费者偏好进行市场细分结构研究的研究途径在实际应用中得以实现。 展开更多
关键词 符号序列聚类 数据挖掘 相似性模型
在线阅读 下载PDF
基于客流数据的区域出行特征聚类 被引量:19
14
作者 冷彪 赵文远 《计算机研究与发展》 EI CSCD 北大核心 2014年第12期2653-2662,共10页
区域功能发现对完善城市规划有着重要的指导意义.区域居民的出行特征提取与发掘可以作为建立模型分析区域功能的数据支撑.随着智能交通技术在轨道交通系统的应用,大量蕴含行人移动性和出行目的地信息的客流数据被采集得到,发现客流数据... 区域功能发现对完善城市规划有着重要的指导意义.区域居民的出行特征提取与发掘可以作为建立模型分析区域功能的数据支撑.随着智能交通技术在轨道交通系统的应用,大量蕴含行人移动性和出行目的地信息的客流数据被采集得到,发现客流数据与地铁站相关区域功能有紧密联系.从地铁客流数据中提取出乘客出行模式和地铁站客流模式,并以此为基础建立概率图模型,实现了区域出行特征聚类.首先,以地铁客流数据为基础提取了乘客出行模式和地铁站客流模式,发现地铁站客流集中性和潮汐性的特性,能在一定程度上反映地铁的区域功能.然后,采用了文本分析领域经典的概率图模型,建立基于潜在狄利克雷分配(latent Dirichlet allocation,LDA)主题模型的地铁客流出行特征聚类模型,将具有出行规律相似性的地铁站聚类在一起.最后,通过分析聚类实验结果,发现在不同客流峰段内的区域功能和相互客流关系. 展开更多
关键词 出行特征聚类 人类移动性 概率图模型 地铁客流 数据挖掘
在线阅读 下载PDF
大数据中数据挖掘模型的模糊改进聚类算法 被引量:11
15
作者 李小红 常振云 《现代电子技术》 北大核心 2020年第3期177-182,共6页
在大数据的数据挖掘模型中,普遍采用模糊聚类算法进行数据分析。常用的模糊C均值聚类算法即FCM聚类算法,具有较多明显缺点,如抗噪性偏低、收敛速度慢、聚类数目无法自动确定等。常用的增量式模糊聚类方法通常在原有的以一个中心点为集... 在大数据的数据挖掘模型中,普遍采用模糊聚类算法进行数据分析。常用的模糊C均值聚类算法即FCM聚类算法,具有较多明显缺点,如抗噪性偏低、收敛速度慢、聚类数目无法自动确定等。常用的增量式模糊聚类方法通常在原有的以一个中心点为集群代表的基础上,改为选取多中心点进行增量式聚类算法的分析。但是,通过这样的算法进行数据分析也存在一定的问题,主要表现在其中心点选择是固定的,灵活性很差。基于以上原因,文中将对原有基础算法做出改进,主要对大数据中数据挖掘模型的增量型模糊聚类算法做出分析,经实践验证,改进后算法切实可行,普适性较强。 展开更多
关键词 增量型模糊聚类 大数据 数据挖掘模型 聚类算法 余弦相似度 隶属度矩阵
在线阅读 下载PDF
分布式数据流聚类算法 被引量:2
16
作者 刘力雄 郭云飞 +1 位作者 康晶 马宏 《计算机工程与设计》 CSCD 北大核心 2011年第8期2708-2711,2763,共5页
针对分布式数据流中数据有交叠、不完整的情况和聚类需要较低通信代价的要求,提出了密度和模型聚类思想相结合的分布式数据流聚类算法DAM-Distream。该算法利用混合高斯模型描述数据流的分布概况,可以有效压缩数据量并能较好的反映分布... 针对分布式数据流中数据有交叠、不完整的情况和聚类需要较低通信代价的要求,提出了密度和模型聚类思想相结合的分布式数据流聚类算法DAM-Distream。该算法利用混合高斯模型描述数据流的分布概况,可以有效压缩数据量并能较好的反映分布数据流间的交叠性。由于获得模型参数的EM算法对初值敏感,应用Hoeffding界理论和基于密度的算法对数据流进行初聚类,得到比较准确的初始参数,最后采用合并近似模型策略获得全局模型。仿真实验结果表明,DAM-Distream能有效克服EM算法的缺点,获得的模型参数性能更优,在降低系统的通信代价的同时能提高分布式环境下数据流的聚类质量。 展开更多
关键词 分布式数据流 聚类 基于密度 基于模型 数据挖掘
在线阅读 下载PDF
大范围低压供电区电力消费及窃电规律研究 被引量:4
17
作者 陈曦 宋纯贺 王天然 《太原理工大学学报》 CAS 北大核心 2022年第1期71-79,共9页
针对国内外在220 V和380 V供电电压的低压地区电力消耗的研究较少,很难探究实时线损的问题。对供电、用电、线损、窃电4个方面进行数据分析,建立统计模型与聚类模型,探索电力消费和窃电的规律。利用时间序列分析、频谱分析、概率密度函... 针对国内外在220 V和380 V供电电压的低压地区电力消耗的研究较少,很难探究实时线损的问题。对供电、用电、线损、窃电4个方面进行数据分析,建立统计模型与聚类模型,探索电力消费和窃电的规律。利用时间序列分析、频谱分析、概率密度函数、互补累积分布函数的统计模型进行分析。结果表明窃电用户用电周期是正常用户的2倍,窃电用户的日均用电量大于正常用户,窃电用户在台区线损率大于40%时数量激增,线损率到达65%时数量放缓,可以优先排查此区间的台区。基于时间序列相似度度量和k-means聚类相结合的聚类模型,将566个台区365维的时间序列聚类得到6类不同的台区线损率模式,并通过核密度估计对比了他们的分布差别,可以帮助快速排查出重点窃电台区并监测线损率改善的情况。 展开更多
关键词 数据分析 用电消费 窃电 统计模型 聚类
在线阅读 下载PDF
数据聚类技术的研究 被引量:7
18
作者 张蓉 《计算机工程与应用》 CSCD 北大核心 2002年第16期145-147,共3页
在分析指出传统数据聚类方法的缺点和不足的基础上,提出了一种新的数据聚类方法,给当前数据聚类技术的研究提供了一个新的思路。
关键词 数据聚类 超图模式 图形分割 数据库 知识发现 数据挖掘
在线阅读 下载PDF
基于ART2网络的三维模型聚类分析方法 被引量:3
19
作者 李山 石源 刘红军 《计算机集成制造系统》 EI CSCD 北大核心 2011年第9期1865-1872,共8页
为解决三维模型聚类中存在的聚类结果对数据输入顺序和维度敏感的问题,将基于自适应谐振理论的ART2网络引入到模型聚类中。以Rand指数、调整Rand指数和互信息指数3种聚类有效性评价指标为依据,通过实验分析了ART2网络中a,b,c,d,θ五个... 为解决三维模型聚类中存在的聚类结果对数据输入顺序和维度敏感的问题,将基于自适应谐振理论的ART2网络引入到模型聚类中。以Rand指数、调整Rand指数和互信息指数3种聚类有效性评价指标为依据,通过实验分析了ART2网络中a,b,c,d,θ五个参数对聚类有效性的影响,并给出了一组较优的参数组合。在此基础上,定性地分析了警戒系数对聚类结果的影响,其中包括最大聚类数的确定和聚类结果对输入顺序的敏感度。聚类结果验证了ART2网络在模型聚类上的可行性和实用性。 展开更多
关键词 三维模型 聚类分析 ART2网络 聚类有效性评估 数据挖掘
在线阅读 下载PDF
基于大数据挖掘的多维数据去重聚类算法分析 被引量:12
20
作者 宋鹏 《现代电子技术》 北大核心 2019年第23期150-153,共4页
数据产生的渠道越来越多,速度越来越快,大量的数据为数据分析和处理带来了较大的难度,云平台中的数据种类和规模也在不断扩大,超大的数据规模给数据的存储、管理、分析等带来了前所未有的挑战。数据量剧增会导致数据的可靠性不足,如何... 数据产生的渠道越来越多,速度越来越快,大量的数据为数据分析和处理带来了较大的难度,云平台中的数据种类和规模也在不断扩大,超大的数据规模给数据的存储、管理、分析等带来了前所未有的挑战。数据量剧增会导致数据的可靠性不足,如何有效地处理数据之间的关系,降低冗余数据,建立多维数据去重聚类模型是业界共同努力的方向。文中最先介绍了在大数据挖掘下的多维聚类算法,通过分析大数据内部之间的关系,建立一种适合大数据处理的多维数据去重聚类算法分析模型,对该算法进行改进和实验分析,得到该算法在采样时所存在的复杂度较低,数据分析的结果准确,有利于实现数据的分析和处理,减少数据的冗余,增加数据分析的效率,具有良好的判定效果。 展开更多
关键词 大数据挖掘 多维数据去重 聚类算法 数据分析 模型建立 减少冗余
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部