期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
云模式事件混沌关联特征提取的物联网大数据聚类算法 被引量:10
1
作者 王雪蓉 万年红 《计算机应用研究》 CSCD 北大核心 2021年第2期391-397,共7页
目前的聚类方法单纯从某个角度研究数据聚类问题,对基于云模式的混沌的物联网大数据聚类的考虑不足,聚类质量不高。为实现敏捷、智能、平稳的物联网大数据聚类,基于开展物联网事件的云模式通用描述模型、物联网事件混沌关联特征的云模... 目前的聚类方法单纯从某个角度研究数据聚类问题,对基于云模式的混沌的物联网大数据聚类的考虑不足,聚类质量不高。为实现敏捷、智能、平稳的物联网大数据聚类,基于开展物联网事件的云模式通用描述模型、物联网事件混沌关联特征的云模式通用解析模型、基于云模式的物联网事件混沌关联特征提取算法、基于云模式混沌关联特征的物联网大数据关联挖掘研究,改进分解奇异值算法、网格耦合聚类算法、K-means算法、决策树学习法、分析主成分法、分层合并法等算法和分布概率函数,设计了一种基于事件混沌关联特征、敏捷、智能、平稳的物联网大数据聚类算法。最后,开展实验验证,并与传统算法进行性能对比分析。实验结果表明,相比传统算法,该算法聚类时间短、误差小,且敏捷性、智能性、动态演化性和平稳性高。因此,该算法实现了基于云模式的具有混沌关联特征的物联网事件大数据的有效聚类,具有较高的应用价值。 展开更多
关键词 物联网事件 云模式 混沌关联特征 关联挖掘 数据聚类算法
在线阅读 下载PDF
一种基于快速分解模拟退火算法的数据聚类算法 被引量:3
2
作者 张蓉 彭宏 《计算机工程》 CAS CSCD 北大核心 2002年第8期88-89,110,共3页
把求解数据聚类问题转换为一个图形分割寻优问题,提出一种基于快速分解模拟退火算法的数据聚类算法。实验结果证明,快速分解模拟退火算法退火时间短,收敛速度快,磁盘开销小,把它应用于数据聚类中,可以获得较好的聚类结果。
关键词 快速分解模拟退火算法 数据聚类算法 数据 数据挖掘
在线阅读 下载PDF
一种基于垂直分布的非数值数据聚类算法 被引量:1
3
作者 何增有 邓胜春 +1 位作者 徐晓飞 宋玉福 《小型微型计算机系统》 CSCD 北大核心 2003年第12期2267-2269,共3页
在本文中 ,我们提出了一种新的非数值数据聚类算法 -VBCCD .VBCCD算法由关系表计算关系的一维分割 ,再由关系的分割来构造一个超图 ,而后通过超图分割算法 ,对构造出来的超图进行优化分割 ,得到最终的聚类结果 .试验结果表明 ,该算法比... 在本文中 ,我们提出了一种新的非数值数据聚类算法 -VBCCD .VBCCD算法由关系表计算关系的一维分割 ,再由关系的分割来构造一个超图 ,而后通过超图分割算法 ,对构造出来的超图进行优化分割 ,得到最终的聚类结果 .试验结果表明 ,该算法比传统的针对数值数据设计的聚类算法有更好的效果 . 展开更多
关键词 数据挖掘 超图 非数值数据聚类算法 VBCCD算法 垂直分布
在线阅读 下载PDF
基于动态滑动窗口的改进数据流聚类算法
4
作者 许颖梅 《郑州轻工业学院学报(自然科学版)》 CAS 2014年第1期98-102,共5页
提出一种采用滑动窗口处理数据的优化算法DCluStream.该方法基于CluStream算法双层框架思想,在聚类特征中引入数据流入和流出滑动窗口的实际时间,动态调整窗口大小以适应有限内存;对历史数据通过时间衰减机制来降低它对新数据对象的影响... 提出一种采用滑动窗口处理数据的优化算法DCluStream.该方法基于CluStream算法双层框架思想,在聚类特征中引入数据流入和流出滑动窗口的实际时间,动态调整窗口大小以适应有限内存;对历史数据通过时间衰减机制来降低它对新数据对象的影响,使聚类效果更好.实验结果表明,与CluStream相比,本算法处理数据的效率更高且相对节约内存. 展开更多
关键词 滑动窗口 数据算法 时间衰减机制
在线阅读 下载PDF
基于数据流模糊聚类挖掘的入侵检测系统研究
5
作者 李俊鹏 王勇 +1 位作者 白焱 李云杰 《现代防御技术》 北大核心 2013年第2期207-211,共5页
传统的基于数据挖掘入侵检测技术往往是基于静态数据的检测,随着网络速度的提高和网络流量的剧增,网络数据通常以数据流的形式出现。提出了一种作用于数据流的模糊聚类挖掘算法(SFCM),并且针对该算法提出了一种基于数据流模糊聚类的入... 传统的基于数据挖掘入侵检测技术往往是基于静态数据的检测,随着网络速度的提高和网络流量的剧增,网络数据通常以数据流的形式出现。提出了一种作用于数据流的模糊聚类挖掘算法(SFCM),并且针对该算法提出了一种基于数据流模糊聚类的入侵检测系统,实验结果显示,该方法有较高的检测率和较低的漏报率和误报率。 展开更多
关键词 数据流挖掘 算法 基于数据流的模糊挖掘算法(SFCM) 入侵检测
在线阅读 下载PDF
面向大数据的数据处理与分析算法综述 被引量:30
6
作者 周宇 曹英楠 王永超 《南京航空航天大学学报》 CAS CSCD 北大核心 2021年第5期664-676,共13页
大数据处理是近年来广受关注和研究的技术领域,数据挖掘作为从大量数据中挖掘隐藏价值信息的技术,是处理大数据的有效工具。本文主要从数据挖掘的角度对大数据处理算法的研究现状进行分类总结。首先介绍了大数据中针对流式数据分类的方... 大数据处理是近年来广受关注和研究的技术领域,数据挖掘作为从大量数据中挖掘隐藏价值信息的技术,是处理大数据的有效工具。本文主要从数据挖掘的角度对大数据处理算法的研究现状进行分类总结。首先介绍了大数据中针对流式数据分类的方法,包括单模型算法和集成分类算法;其次分别从单机算法和基于分布式并行平台的多机算法两个角度概括介绍了大数据聚类方法以及大数据关联规则挖掘方法;最后总结了现有面向大数据的数据挖掘算法的研究进展并展望未来的发展趋势。 展开更多
关键词 数据算法 数据聚类算法 数据关联规则挖掘
在线阅读 下载PDF
半监督的仿射传播聚类 被引量:29
7
作者 王开军 李健 +1 位作者 张军英 涂重阳 《计算机工程》 CAS CSCD 北大核心 2007年第23期197-198,201,共3页
仿射传播聚类算法快速、有效,可以解决大数据集的聚类问题,但当数据的聚类结构比较松散时,聚类准确性不高。该文提出了半监督的仿射传播聚类算法,在迭代过程中嵌入了有效性指标以监督和引导算法向最优聚类结果的方向运行。实验结果表明... 仿射传播聚类算法快速、有效,可以解决大数据集的聚类问题,但当数据的聚类结构比较松散时,聚类准确性不高。该文提出了半监督的仿射传播聚类算法,在迭代过程中嵌入了有效性指标以监督和引导算法向最优聚类结果的方向运行。实验结果表明,该方法对于聚类结构比较紧密和松散的数据集,均可以给出较为准确的聚类结果。 展开更多
关键词 仿射传播 半监督 数据集的算法
在线阅读 下载PDF
网站个性化服务的研究 被引量:12
8
作者 杨武剑 王泽兵 +1 位作者 冯雁 武新玲 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2003年第3期278-282,共5页
利用Web数据挖掘技术,对用户未来的访问进行预测和推荐,是实现网站柔性个性化服务的研究方向之一.笔者通过对网站个性化服务相关技术的研究,改进了对Web服务器用户访问日志信息进行聚类分析的关联数据竞争聚类(competitiveagglomeration... 利用Web数据挖掘技术,对用户未来的访问进行预测和推荐,是实现网站柔性个性化服务的研究方向之一.笔者通过对网站个性化服务相关技术的研究,改进了对Web服务器用户访问日志信息进行聚类分析的关联数据竞争聚类(competitiveagglomerationforrelationdata,CARD)算法,并在此基础上构建了相应的实验模型.CARD算法是CA算法的一种改进算法,适合于处理没有明显特征的Web数据.试验是建立在真实的Web日志上的,实验证明该算法具有较好的聚类效果和适用度. 展开更多
关键词 数据挖掘 个性化网站 个性化服务 关联数据竞争算法 Web用户模式挖掘 CARD算法
在线阅读 下载PDF
Linear manifold clustering for high dimensional data based on line manifold searching and fusing 被引量:1
9
作者 黎刚果 王正志 +2 位作者 王晓敏 倪青山 强波 《Journal of Central South University》 SCIE EI CAS 2010年第5期1058-1069,共12页
High dimensional data clustering,with the inherent sparsity of data and the existence of noise,is a serious challenge for clustering algorithms.A new linear manifold clustering method was proposed to address this prob... High dimensional data clustering,with the inherent sparsity of data and the existence of noise,is a serious challenge for clustering algorithms.A new linear manifold clustering method was proposed to address this problem.The basic idea was to search the line manifold clusters hidden in datasets,and then fuse some of the line manifold clusters to construct higher dimensional manifold clusters.The orthogonal distance and the tangent distance were considered together as the linear manifold distance metrics. Spatial neighbor information was fully utilized to construct the original line manifold and optimize line manifolds during the line manifold cluster searching procedure.The results obtained from experiments over real and synthetic data sets demonstrate the superiority of the proposed method over some competing clustering methods in terms of accuracy and computation time.The proposed method is able to obtain high clustering accuracy for various data sets with different sizes,manifold dimensions and noise ratios,which confirms the anti-noise capability and high clustering accuracy of the proposed method for high dimensional data. 展开更多
关键词 linear manifold subspace clustering line manifold data mining data fusing clustering algorithm
在线阅读 下载PDF
A new clustering algorithm for large datasets 被引量:1
10
作者 李清峰 彭文峰 《Journal of Central South University》 SCIE EI CAS 2011年第3期823-829,共7页
The Circle algorithm was proposed for large datasets.The idea of the algorithm is to find a set of vertices that are close to each other and far from other vertices.This algorithm makes use of the connection between c... The Circle algorithm was proposed for large datasets.The idea of the algorithm is to find a set of vertices that are close to each other and far from other vertices.This algorithm makes use of the connection between clustering aggregation and the problem of correlation clustering.The best deterministic approximation algorithm was provided for the variation of the correlation of clustering problem,and showed how sampling can be used to scale the algorithms for large datasets.An extensive empirical evaluation was given for the usefulness of the problem and the solutions.The results show that this method achieves more than 50% reduction in the running time without sacrificing the quality of the clustering. 展开更多
关键词 data mining Circle algorithm clustering categorical data clustering aggregation
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部