-
题名流数据分析与管理综述
被引量:163
- 1
-
-
作者
金澈清
钱卫宁
周傲英
-
机构
复旦大学计算机科学与工程学系
-
出处
《软件学报》
EI
CSCD
北大核心
2004年第8期1172-1181,共10页
-
基金
国家高技术研究发展计划(863)~~
-
文摘
有关流数据分析与管理的研究是目前国际数据库研究领域的一个热点.在过去30多年中,尽管传统数据库技术发展迅速且得到了广泛应用,但是它不能够处理在诸如网络路由、传感器网络、股票分析等应用中所生成的一种新型数据,即流数据.流数据的特点是数据持续到达,且速度快、规模宏大;其研究核心是设计高效的单遍数据集扫描算法,在一个远小于数据规模的内存空间里不断更新一个代表数据集的结构棗概要数据结构,使得在任何时候都能够根据这个结构迅速获得近似查询结果.综述国际上关于流数据的概要数据结构生成与维护的研究成果,并通过列举解决流数据上两个重要问题的各种方案来比较各种算法的特点以及优劣.
-
关键词
流数据
概要数据结构
界标模型
滑动窗1:3模型
-
Keywords
Algorithms
Data structures
Mathematical models
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名时间滑动窗口内基于密度的数据流聚类算法
被引量:5
- 2
-
-
作者
李娜
邢长征
-
机构
辽宁工程技术大学电子与信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2011年第5期1363-1366,共4页
-
文摘
为了提高数据流的聚类质量和效率,采用等时间跨度滑动窗口技术,然后利用改进的微簇结构保存数据流的概要信息,最后利用微簇删除策略,定期删除过期、孤立微簇。基于真实数据集与人工数据集的实验表明:与传统基于界标模型的聚类算法相比,该算法可获得较好的效率、较小的内存开销和快速的数据处理能力。
-
关键词
数据流
聚类
滑动窗口
微簇
界标模型
-
Keywords
data stream
clustering
sliding window
micro cluster
landmark model
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于合并-分裂策略的近似等深直方图增量维护
被引量:1
- 3
-
-
作者
张龙波
李战怀
王勇
-
机构
山东理工大学计算机学院
西北工业大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2009年第8期182-184,共3页
-
基金
国家自然科学基金(60873196)
山东理工大学博士基金资助
-
文摘
直方图在数据库领域有着广泛的应用,是一种常用的概要数据结构生成方法。首先提出了一个基于数据流界标窗口模型的近似等深直方图构建维护算法框架,该算法框架通过桶的合并-分裂实现近似等深直方图的增量维护;然后对三种不同的桶合并-分裂策略进行了比较和讨论;最后对该算法框架和三种不同的桶合并-分裂策略进行了实验分析。
-
关键词
数据流
界标窗口模型
概要数据结构
直方图
-
Keywords
Data stream, Landmark window model, Synopsis data structure, Histogram
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-