-
题名广义关联分析的蕴涵-约束框架及其挖掘算法
被引量:1
- 1
-
-
作者
邹目权
王丽珍
姚华传
芦俊丽
-
机构
云南大学信息学院
-
出处
《燕山大学学报》
CAS
2014年第6期503-515,共13页
-
基金
国家自然科学基金资助项目(61472346
61272126
+1 种基金
61262069)
云南省教育厅基金项目(2012C103)
-
文摘
本文将所有基于事务和非基于事务的关联分析称为广义的关联分析。基于事务的关联分析主要依托支持度-置信度框架进行数据挖掘,而非基于事务的关联分析常采用参与度-条件概率框架。首先,在讨论强关联规则的正确性、可靠性和有趣性的基础上,提出了蕴涵-约束框架。其次,提出并论证了最小支持度_和最小置信度_的合理取值范围,从而将最小置信度由支持度-置信度框架下的(0,1]缩小为蕴涵-约束框架下的(0.5,1],最小支持度由(0,1]缩小为(0,_]。第三,提出随机顶点极大团划分法,它能将非基于事务的关联分析转化为基于事务的关联分析,从而使广义关联分析问题整合成为基于事务的关联分析问题。第四,基于映射的概念,将约束划分为事前、事中和事后约束,从而形式化地解决了约束的应用及方法。第五,利用稠密维和稀疏维,提出了一种multi-knowledge tree的树形存储结构,能在无论频繁项集是否满足向下闭合性质时都有效降低算法的空间复杂度;同时,在数据增加、删除、修改后能快速获取新的强关联规则。最后,大量实验验证了所提出理论和算法的效果和效率。
-
关键词
广义关联分析
蕴涵-约束框架
约束的映射
合理阈值
multi-knowledgetree
-
Keywords
generalized correlation analysis
implication-constraint framework
constraint mapping
reasonable threshold
multiknowledge tree
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-