期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
数据流分析与技术研究 被引量:6
1
作者 李岩 王惠文 叶明 《计算机工程与应用》 CSCD 北大核心 2008年第15期8-11,共4页
数据流作为一种新的数据形态,不同于传统的静态数据,具有连续快速、短暂易逝和不可预测的特点,对其进行有效地分析和挖掘遇到了极大的挑战。介绍了数据流的基本概念、数据流模型、数据流处理模型和目前一些数据流管理系统,并对数据流技... 数据流作为一种新的数据形态,不同于传统的静态数据,具有连续快速、短暂易逝和不可预测的特点,对其进行有效地分析和挖掘遇到了极大的挑战。介绍了数据流的基本概念、数据流模型、数据流处理模型和目前一些数据流管理系统,并对数据流技术及其挖掘算法进行归纳和分类论述。 展开更多
关键词 数据流 dsms 概要数据结构 滑动窗口
在线阅读 下载PDF
改进的数据流频繁闭项集挖掘算法 被引量:5
2
作者 刘洁 杨路明 +2 位作者 毛伊敏 刘立新 谢东 《计算机工程》 CAS CSCD 北大核心 2011年第9期75-77,共3页
为提高数据流频繁闭项集的查找效率,提出一种改进的NewMoment频繁闭项集挖掘算法,通过在LevelCET数据结构中加入层次结点,并利用层次检测策略与最佳频繁闭项集检测策略快速挖掘数据流滑动窗口中所有的频繁闭项集。实验结果证明,与NewMom... 为提高数据流频繁闭项集的查找效率,提出一种改进的NewMoment频繁闭项集挖掘算法,通过在LevelCET数据结构中加入层次结点,并利用层次检测策略与最佳频繁闭项集检测策略快速挖掘数据流滑动窗口中所有的频繁闭项集。实验结果证明,与NewMoment算法相比,改进的算法性能更优。 展开更多
关键词 数据流 频繁闭项集 滑动窗口 NewMoment算法 LevelCET数据结构
在线阅读 下载PDF
挖掘数据流频繁模式的相关技术和算法研究综述 被引量:6
3
作者 唐懿芳 穆志纯 +1 位作者 张师超 钟达夫 《计算机工程与应用》 CSCD 北大核心 2009年第26期121-125,共5页
数据流本身的特点使得静态挖掘方法不再满足要求。国内外学者已提出许多新的挖掘数据流频繁模式的方法和技术。对这些技术和算法进行了综述。首先介绍数据流的概念和特点,分析国内外的研究现状,总结了数据流中挖掘频繁模式的特点,并列... 数据流本身的特点使得静态挖掘方法不再满足要求。国内外学者已提出许多新的挖掘数据流频繁模式的方法和技术。对这些技术和算法进行了综述。首先介绍数据流的概念和特点,分析国内外的研究现状,总结了数据流中挖掘频繁模式的特点,并列出挖掘方法的常用技术和基于这些技术的代表性算法,最后讨论了将来的研究方向。 展开更多
关键词 数据流 频繁模式 概要数据结构 衰减因子 倾斜时间窗口
在线阅读 下载PDF
带权值数据流滑动窗口随机抽样算法的改进 被引量:3
4
作者 张龙波 李战怀 +1 位作者 余敏 蒋芸 《计算机工程与应用》 CSCD 北大核心 2007年第25期18-20,共3页
通过改进加权抽样算法,结合基本窗口技术,提出了两种面向带权值数据流上连续更新滑动窗口的随机抽样算法:WRSB算法和IWRSB算法。当新的数据元组到达时,根据数据元组的权值计算出该元组的键值,根据元组键值的大小决定其是否进入样本集以... 通过改进加权抽样算法,结合基本窗口技术,提出了两种面向带权值数据流上连续更新滑动窗口的随机抽样算法:WRSB算法和IWRSB算法。当新的数据元组到达时,根据数据元组的权值计算出该元组的键值,根据元组键值的大小决定其是否进入样本集以及样本集中被替换的数据元组,同时设置一个系统缓冲区来保存最近到达的键值较大的部分数据元组,作为过期数据元组的后备,使算法能够有效地处理过期数据元组问题。理论分析和实验结果表明,两种算法都能有效地处理带权值数据流上连续更新滑动窗口的随机抽样问题,相比较而言,IWRSB算法具有更好的性能。 展开更多
关键词 数据流 滑动窗口 概要数据结构 随机抽样算法
在线阅读 下载PDF
挖掘数据流界标窗口Top-K频繁项集 被引量:6
5
作者 杨蓓 黄厚宽 《计算机研究与发展》 EI CSCD 北大核心 2010年第3期463-473,共11页
数据流频繁项集挖掘是目前数据挖掘与知识发现领域的热点研究课题,在许多领域有重要应用.然而支持度阈值的设定需要一定的领域知识,设置不当会给后续的分析处理带来很多困难和不必要的负担,因此挖掘数据流top-K频繁项集有重要意义.提出... 数据流频繁项集挖掘是目前数据挖掘与知识发现领域的热点研究课题,在许多领域有重要应用.然而支持度阈值的设定需要一定的领域知识,设置不当会给后续的分析处理带来很多困难和不必要的负担,因此挖掘数据流top-K频繁项集有重要意义.提出一个挖掘数据流界标窗口top-K频繁项集的动态增量近似算法TOPSIL-Miner,为此设计了存储流数据摘要信息的概要结构TOPSIL-Tree以及动态记录挖掘相关信息的树层最大支持度表MaxSL、项目序表OIL,TOPSET和最小支持度表MinSL等,并分析了与这些概要结构相关的挖掘特性.在此基础上研究算法的3种优化措施:1)剪枝当前数据流的平凡项集;2)挖掘过程中启发式自适应提升挖掘阈值;3)动态提升剪枝阈值.对算法的误差上界进行了分析研究.最后通过实验验证了算法的可行性、精确性和时空高效性. 展开更多
关键词 数据挖掘 数据流 界标窗口 频繁项集 概要数据结构
在线阅读 下载PDF
面向海量数据流的基于密度的簇结构挖掘算法 被引量:3
6
作者 于彦伟 王欢 +1 位作者 王沁 赵金东 《软件学报》 EI CSCD 北大核心 2015年第5期1113-1128,共16页
提出一种基于密度的簇结构挖掘算法(mining density-based clustering structure over data streams,简称MClu Stream),以解决数据流密度聚类中输入参数选择困难和重叠簇识别等问题.首先,设计了一种树拓扑CR-Tree索引结构,将直接核心可... 提出一种基于密度的簇结构挖掘算法(mining density-based clustering structure over data streams,简称MClu Stream),以解决数据流密度聚类中输入参数选择困难和重叠簇识别等问题.首先,设计了一种树拓扑CR-Tree索引结构,将直接核心可达的一对数据点映射成树结构中的父子关系,蕴含了数据点依赖关系的CR-Tree涵盖了一系列sub Eps参数下的基于密度的簇结构;其次,MClu Stream算法采用滑动窗口的方式更新CR-Tree,在线维护当前窗口上的簇结构,实现了对海量数据流的快速演化聚类分析;再次,设计了一种快速从CR-Tree提取簇结构的方法,根据可视化的簇结构,选择合理的聚类结果;最后,在真实和合成海量数据上的实验验证了MClu Stream算法具有有效的挖掘效果、较高的聚类效率和较小的空间开销.MClu Stream可适用于海量数据流应用中自适应的密度聚类演化分析. 展开更多
关键词 聚类分析 密度聚类 簇结构 数据流 滑动窗口
在线阅读 下载PDF
基于合并-分裂策略的近似等深直方图增量维护 被引量:1
7
作者 张龙波 李战怀 王勇 《计算机科学》 CSCD 北大核心 2009年第8期182-184,共3页
直方图在数据库领域有着广泛的应用,是一种常用的概要数据结构生成方法。首先提出了一个基于数据流界标窗口模型的近似等深直方图构建维护算法框架,该算法框架通过桶的合并-分裂实现近似等深直方图的增量维护;然后对三种不同的桶合并-... 直方图在数据库领域有着广泛的应用,是一种常用的概要数据结构生成方法。首先提出了一个基于数据流界标窗口模型的近似等深直方图构建维护算法框架,该算法框架通过桶的合并-分裂实现近似等深直方图的增量维护;然后对三种不同的桶合并-分裂策略进行了比较和讨论;最后对该算法框架和三种不同的桶合并-分裂策略进行了实验分析。 展开更多
关键词 数据流 界标窗口模型 概要数据结构 直方图
在线阅读 下载PDF
三维编织复合材料健康监测系统连续数据的实时分析和处理方法
8
作者 万振凯 罗先武 《天津工业大学学报》 CAS 北大核心 2016年第5期53-58,共6页
基于从三维编织复合材料健康监测系统,建立了一套基于数据流的滑动窗口技术的模型,处理分析三维编织复合材料健康监测系统的连续数据.该模型能够及时地处理和判断传感器实时采集到的数据,并能对异常数据进行保存和分析,进而做出相应的提... 基于从三维编织复合材料健康监测系统,建立了一套基于数据流的滑动窗口技术的模型,处理分析三维编织复合材料健康监测系统的连续数据.该模型能够及时地处理和判断传感器实时采集到的数据,并能对异常数据进行保存和分析,进而做出相应的提示.实验结果表明该模型的计算结果与实际数据具有很好的吻合性.该模型大大减少了三维编织复合材料健康监测系统数据处理的难度,同时也很大程度上提高了数据处理的效率. 展开更多
关键词 三维编织复合材料 结构健康监测 连续数据 实时分析 数据流 滑动窗口 数据处理
在线阅读 下载PDF
EMS数据流管理系统的框架设计 被引量:8
9
作者 何轶璇 罗毅 涂光瑜 《电力系统自动化》 EI CSCD 北大核心 2006年第24期33-38,共6页
针对现有关系型数据库系统在能量管理系统(EMS)实时应用中存在的缺陷,设计了一个新型EMS数据流管理系统的框架,并建立了相对应的数据流模型。该框架能够根据流速不同对采集数据进行分类处理,通过数据流查询窗口对相量测量单元(PMU)高速... 针对现有关系型数据库系统在能量管理系统(EMS)实时应用中存在的缺陷,设计了一个新型EMS数据流管理系统的框架,并建立了相对应的数据流模型。该框架能够根据流速不同对采集数据进行分类处理,通过数据流查询窗口对相量测量单元(PMU)高速数据进行分割、降速、筛选,实现了对PMU数据和原有监控与数据采集(SCADA)系统测量值的并行实时处理,并且能够在实现稳态计算功能的同时对系统进行动态监测。文中描述了系统的基本结构、各组成部分的功能和关键技术,并在数据流处理方面提出了一些提高效率的改进措施。 展开更多
关键词 EMS PMU 数据流管理系统 数据流模型 滑动窗口
在线阅读 下载PDF
基于大纲的数据流自适应聚集算子的实现 被引量:1
10
作者 田海生 陈立军 《计算机应用》 CSCD 北大核心 2007年第10期2383-2387,共5页
采用基于大纲的数据流自适应聚集算子的批处理(Batchingprocessing)算法处理数据流,Batching算法能够随着流速的变化动态调整自己的执行策略,以便更好地利用有限的系统资源提供尽可能好的查询质量,并且可以在Batching算法的基础上根据... 采用基于大纲的数据流自适应聚集算子的批处理(Batchingprocessing)算法处理数据流,Batching算法能够随着流速的变化动态调整自己的执行策略,以便更好地利用有限的系统资源提供尽可能好的查询质量,并且可以在Batching算法的基础上根据不同的流聚集算子提出相应的优化算法,进一步提高查询质量并真正达到或接近实时查询。实验结果已在北大Argus数据流管理系统中得到成功应用。 展开更多
关键词 数据流管理系统 数据流 自适应 批处理 聚集算子 滑动窗口
在线阅读 下载PDF
数据流管理系统中Max、Min聚集算子的示例概要算法
11
作者 田海生 《计算机应用》 CSCD 北大核心 2008年第8期1986-1990,共5页
Max和Min是数据流管理系统中重要聚集算子。应用基于滑动窗口下的示例概要法在实时数据流场景下计算Max和Min。在本方法中不需要保存所有落入滑动窗口中数据元组,这意味着可以极大地减小存储空间。由于存储元组的减少,系统的处理时间也... Max和Min是数据流管理系统中重要聚集算子。应用基于滑动窗口下的示例概要法在实时数据流场景下计算Max和Min。在本方法中不需要保存所有落入滑动窗口中数据元组,这意味着可以极大地减小存储空间。由于存储元组的减少,系统的处理时间也显著地减少。实验结果表明基于滑动窗口的示例概要法显著降低了时间和空间的开销。 展开更多
关键词 示例概要法 滑动窗口 数据流管理系统
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部