-
题名基于概率衰减窗口模型的不确定数据流频繁模式挖掘
被引量:15
- 1
-
-
作者
廖国琼
吴凌琴
万常选
-
机构
江西财经大学信息管理学院
江西省高校数据与知识工程重点实验室
江西省赣抚平原水利工程管理局
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2012年第5期1105-1115,共11页
-
基金
国家自然科学基金项目(60863016)
江西省自然科学基金项目(2008GQS0019)
+3 种基金
江西省教育厅科技重点基金项目(GJJ10694
GJJ12259)
江西省教育厅青年科学基金项目(GJJ10119)
江西省优势科技创新团队建设计划基金项目(20113BCB24008)
-
文摘
考虑到不确定数据流的不确定性,设计了一种新的概率频繁模式树PFP-tree和基于该树的概率频繁模式挖掘方法PFP-growth.PFP-growth使用事务性不确定数据流及概率衰减窗口模型,通过计算各概率数据项的期望支持度以发现概率频繁模式,其主要特点有:考虑到窗口内不同时间到达数据项的贡献度不同,采用概率衰减窗口模型计算期望支持度,以提高模式挖掘准确度;设置数据项索引表和事务索引表,以加快频繁模式树检索速度;通过剪枝删除不可能成为频繁模式的结点,以降低模式树的存储及检索开销;对每个结点都设立一个事务概率信息链表,以支持数据项在不同事务中具有不同概率的情形.实验结果表明,PFP-growth在保证挖掘模式准确度的前提下,在处理时间和内存空间等方面都具有较好的性能.
-
关键词
不确定数据
数据流
概率频繁模式
频繁模式挖掘
数据挖掘
-
Keywords
uncertain data
data stream
probability frequent patterns
frequent pattern mining
data
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-