期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
数据流中一种快速启发式频繁模式挖掘方法 被引量:14
1
作者 张昕 李晓光 +1 位作者 王大玲 于戈 《软件学报》 EI CSCD 北大核心 2005年第12期2099-2105,共7页
在现有的数据流频繁模式挖掘算法中,批处理方法平均处理时间短,但需要积攒足够的数据,使得其实时性差且查询粒度粗;而启发式方法可以直接处理数据流,但处理速度慢.提出一种改进的字典树结构——IL-TREE(improvedlexicographictree),并... 在现有的数据流频繁模式挖掘算法中,批处理方法平均处理时间短,但需要积攒足够的数据,使得其实时性差且查询粒度粗;而启发式方法可以直接处理数据流,但处理速度慢.提出一种改进的字典树结构——IL-TREE(improvedlexicographictree),并在其基础上提出一种新的启发式算法FPIL-Stream(frequentpatternminingbasedonimprovedlexicographictree),在更新模式和生成新模式的过程中,可以快速定位历史模式.算法结合了倾斜窗口策略,可以详细记录历史信息.该算法在及时处理数据流的前提下,也降低了数据的平均处理时间,并且提供了更细的查询粒度. 展开更多
关键词 数据挖掘 数据流 频繁模式 倾斜窗口
在线阅读 下载PDF
挖掘数据流频繁模式的相关技术和算法研究综述 被引量:6
2
作者 唐懿芳 穆志纯 +1 位作者 张师超 钟达夫 《计算机工程与应用》 CSCD 北大核心 2009年第26期121-125,共5页
数据流本身的特点使得静态挖掘方法不再满足要求。国内外学者已提出许多新的挖掘数据流频繁模式的方法和技术。对这些技术和算法进行了综述。首先介绍数据流的概念和特点,分析国内外的研究现状,总结了数据流中挖掘频繁模式的特点,并列... 数据流本身的特点使得静态挖掘方法不再满足要求。国内外学者已提出许多新的挖掘数据流频繁模式的方法和技术。对这些技术和算法进行了综述。首先介绍数据流的概念和特点,分析国内外的研究现状,总结了数据流中挖掘频繁模式的特点,并列出挖掘方法的常用技术和基于这些技术的代表性算法,最后讨论了将来的研究方向。 展开更多
关键词 数据流 频繁模式 概要数据结构 衰减因子 倾斜时间窗口
在线阅读 下载PDF
高维Turnstile型数据流聚类算法 被引量:6
3
作者 周晓云 张净 孙志挥 《计算机科学》 CSCD 北大核心 2006年第11期14-17,37,共5页
现有数据流聚类算法只能处理Ti me Series和Cash Register型数据流,并且应用于高维数据流时其精度不甚理想。提出针对高维Turnstile型数据流的子空间聚类算法HT-Stream,算法对数据空间进行网格划分,在线动态维护网格单元信息,采用倾斜... 现有数据流聚类算法只能处理Ti me Series和Cash Register型数据流,并且应用于高维数据流时其精度不甚理想。提出针对高维Turnstile型数据流的子空间聚类算法HT-Stream,算法对数据空间进行网格划分,在线动态维护网格单元信息,采用倾斜时间窗口存储统计信息,根据用户指定时间跨度离线输出聚类结果。基于真实数据集与仿真数据集的实验表明,算法具有良好的适用性和有效性。 展开更多
关键词 数据流 子空间聚类 高维 倾斜时间窗口
在线阅读 下载PDF
TWCT-Stream:数据流上的频繁模式挖掘算法 被引量:1
4
作者 庄波 刘希玉 隆坤 《计算机工程与应用》 CSCD 北大核心 2009年第20期147-150,161,共5页
提出一种结合倾斜时间窗的TWCT树结构,可以保存不同时间粒度下频繁模式的完全集,并设计了其顺序更新和删除算法,使其能够存储在外存,从而有效地降低算法的内存空间需求。结合TWCT树结构特点,提出了数据流上的频繁模式挖掘算法TWCT-Stre... 提出一种结合倾斜时间窗的TWCT树结构,可以保存不同时间粒度下频繁模式的完全集,并设计了其顺序更新和删除算法,使其能够存储在外存,从而有效地降低算法的内存空间需求。结合TWCT树结构特点,提出了数据流上的频繁模式挖掘算法TWCT-Stream,其模式生长的TWCT-Growth算法按字典顺序生成频繁模式,以配合TWCT结构的顺序更新。实验证实算法的内存需求低于FP-Stream等同类算法。 展开更多
关键词 数据流挖掘 频繁模式 倾斜时间窗口
在线阅读 下载PDF
一种多维多粒度用户兴趣模型研究 被引量:1
5
作者 陈辉 《小型微型计算机系统》 CSCD 北大核心 2017年第12期2785-2790,共6页
人们在享受网络服务带来便利的同时,也不得不面对"信息过载"和"信息迷航"的问题.发现用户兴趣并推送用户感兴趣资源是解决这一问题的有效途径.通过分析用户兴趣特点,设计了一种多维多粒度用户兴趣模型UIM.该模型采... 人们在享受网络服务带来便利的同时,也不得不面对"信息过载"和"信息迷航"的问题.发现用户兴趣并推送用户感兴趣资源是解决这一问题的有效途径.通过分析用户兴趣特点,设计了一种多维多粒度用户兴趣模型UIM.该模型采用概念分类树维护用户兴趣主题的多粒度性,用倾斜时间窗口维护用户兴趣时间的多粒度性,用时间衰减模型区分用户当前兴趣与历史兴趣的权重.采取增量更新UIM以及对UIM剪枝,保证UIM结构精简与高效,从而可快速查找出用户的top-k兴趣概念.仿真实验结果显示,UIM模型具有存储效率高,可发现用户不同时间窗口内兴趣的特点,其正确性优于其它同类模型. 展开更多
关键词 用户兴趣 层次分类树 倾斜时间窗口 衰减模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部