-
题名基于前缀共享树的频繁情节挖掘算法
- 1
-
-
作者
丁勇
朱辉生
高广银
-
机构
南京理工大学泰州科技学院
泰州学院计算机科学与技术学院
-
出处
《科学技术与工程》
北大核心
2014年第28期231-234,246,共5页
-
基金
国家自然科学基金项目(61003001,61103009)资助
-
文摘
经典的频繁情节挖掘算法NONEPI及其改进算法NONEPI+存在时空复杂度高、"重复计算"等问题,基于最小且非重叠发生的支持度定义,提出一个基于前缀共享树的频繁情节挖掘算法PST_NONEPI,该算法采用深度优先搜索策略,将发现的频繁情节压缩到前缀共享树中,通过动态维护前缀共享树来发现所有的频繁情节。该算法只需扫描事件序列一次,大大提高了频繁情节挖掘的效率。实验证明,PST_NONEPI算法能有效地挖掘频繁情节。
-
关键词
事件序列
频繁情节
最小且非重叠发生
前缀共享树
-
Keywords
event sequence
frequent episode
minimal and non-overlapped occurrence
prefix shared tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于Hadoop的关联规则挖掘算法
被引量:8
- 2
-
-
作者
丁勇
朱长水
武玉艳
-
机构
南京理工大学泰州科技学院
-
出处
《计算机科学》
CSCD
北大核心
2018年第B11期409-411,416,共4页
-
基金
2015江苏省高校自然科学研究面上项目(15KJB520016)
2017年度江苏省高校"青蓝工程"资助
-
文摘
传统的并行关联规则算法对每一次迭代都定义一个MapReduce任务,以实现候选项集的生成和计数功能,但多次启动MapReduce任务会带来极大的性能开销。文中定义了一种并行关联规则挖掘算法PST-Apriori,该算法采取分治策略,在每个分布式计算节点定义一个前缀共享树,通过递归调用的方式将事务T生成的候选项集逐层压缩到前缀共享树(PST)中。然后广度遍历PST,逐层将每个节点对应的〈key,value〉作为map函数的输入,并由MapReduce框架自动按照key值进行聚集。最后调用reduce函数对多个任务的处理结果进行汇总,得到满足最小支持度阈值的频繁项集。算法只使用两个MapReduce任务,且PST按照key值排序便于Mapper端的shuffle操作,提高了运行效率。
-
关键词
关联规则
HADOOP
MAPREDUCE
前缀共享树
-
Keywords
Association rule
Hadoop
MapReduce
Prefix shared tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名关联规则挖掘在证券业个性化服务中的应用
被引量:1
- 3
-
-
作者
徐晓峰
黄林鹏
顾锡康
-
机构
上海交通大学计算机科学与工程系
东吴证券有限责任公司
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第19期214-216,共3页
-
基金
国家"863"计划基金资助项目(2001AA113160)
-
文摘
提出了一种适用于证券业交易数据库挖掘的频繁模式链表关联规则挖掘算法,它采用共享前缀交易项树和频繁模式链表结构,无须产生候选项集,FPL-growth算法通过直接排列出链路中的频项组合,就可得到完整的频繁模式集,且支持多阈值挖掘,挖掘到的关联规则带有时间段属性,特别适用于证券业的个性化信息需求获取。
-
关键词
关联规则
共享前缀交易树
频繁模式链表
频繁模式链表关联规则算法
时间属性
证券
-
Keywords
Association rule
STP-tree
FP-link
FPL-growth
Time-property
Stock
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名关联规则挖掘在证券业中的应用
被引量:1
- 4
-
-
作者
徐晓峰
黄林鹏
顾锡康
-
机构
上海交通大学计算机科学与工程系
东吴证券有限责任公司
-
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第B12期6-7,96,共3页
-
基金
国家"863"计划基金资助项目(2001AA113160)
-
文摘
基于证券业急需一种能帮助其提高个性化服务质量的系统,该文提出了一种适用干证券业单交易项交易数据库挖掘的频繁模式链表 关联规则挖掘算法,它采用共享前缀交易项树和频繁模式链表结构,无须产生候选项集,FPL-growth算法通过直接排列出链路中的频项组 合,就可得到完整的频繁模式集,且支持多阈值挖掘,挖掘到的关联规则带有时间段属性,特别适用于证券业的个性化信息需求获取。
-
关键词
关联规则
共享前缀交易树
频繁模式链表
频繁模式链表关联规则算法
时间属性
证券
-
Keywords
Association rule
STP-trce
FP-link
FPL-growth
Time-property
Stock
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-