-
题名一种有效的周期高效用序列模式增量挖掘算法
被引量:1
- 1
-
-
作者
荀亚玲
任姿芊
闫海博
-
机构
太原科技大学计算机科学与技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2024年第8期2301-2308,共8页
-
基金
国家自然科学基金面上项目(62272336)。
-
文摘
周期高效用序列模式挖掘(PHUSPM)因其能够发现时间序列中更具实际价值的规律性模式而备受关注,但现有的PHUSPM算法难以有效地处理数据集的增量更新,且未考虑大规模数据下算法的向下闭包性和复杂性。针对该问题,提出了IncPUS-Miner算法,有效地实现了周期高效用序列模式(PHUSPs)的增量挖掘。IncPUS-Miner引入了一种名为pu-tree的新型数据结构,每个树节点对应一个更新效用列表(UUL)用于存储相应序列的辅助信息,当有增量数据加入时,该结构使得项目信息能够灵活更新,从而增强了算法的动态适应性和可扩展性。此外,还提出了两种新的序列效用上界PUB和EUB,以及两种相应的剪枝策略,有效地减少了计算负担。实验结果表明,在真实数据集上,IncPUS-Miner算法可以有效地增量挖掘PHUSPs,与其他算法相比,在运行效率和内存消耗上展现出了优越的性能。
-
关键词
增量挖掘
高效用序列模式
周期序列模式
序列模式挖掘
-
Keywords
incremental mining
high utility sequential pattern
periodic sequential pattern
sequential pattern mining
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名含负项的高效用序列模式挖掘算法
被引量:4
- 2
-
-
作者
吕存伟
黄德才
陆亿红
-
机构
浙江工业大学计算机科学与技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第8期1724-1729,共6页
-
基金
水利部公益性行业科研专项项目(201401044)资助
国家科技支撑计划子课题项目(2012BAD10B0101)资助
-
文摘
高效用模式挖掘在现实中有广泛的应用,也是数据挖掘研究的热点.数据库中的事务在以序列形式存在的情况下,又引申出高效用序列模式挖掘问题.序列模式的搜索空间比一般模式的大,所以计算复杂度比高效用模式挖掘大.目前对高效用序列模式算法研究比较少,且都没有考虑序列数据库中项的外部效用值为负的情况.面对含负项的外部效用值,首次提出了含负项的高效用序列模式挖掘算法EHUSN,该算法提出1-2-UM和2-2-UM结构模型,结合效用信息列表能快速剪枝非候选序列,从而使挖掘算法在时空效率上的得到提升.
-
关键词
序列模式挖掘
高效用序列模式挖掘
模式挖掘
-
Keywords
sequential pattern mining
high utility sequential pattern mining
pattern mining
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于模式增长的高效用序列模式挖掘算法
被引量:2
- 3
-
-
作者
唐辉军
王乐
樊成立
-
机构
宁波财经学院金融与信息学院
宁波财经学院数字技术与工程学院
-
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2021年第4期943-954,共12页
-
基金
浙江省公益技术应用研究计划项目(LGF19H180002,2017C35014)
宁波市自然科学基金项目(2017A610122)
慈溪市社会发展科技计划项目(CN2018001)资助。
-
文摘
高效用序列模式挖掘是数据挖掘领域的一项重要内容,在生物信息学、消费行为分析等方面具有重要的应用.与传统基于频繁项模式挖掘方法不同,高效用序列模式挖掘不仅考虑项集的内外效用,更突出项集的时间序列含义,计算复杂度较高.尽管已经有一定数量的算法被提出应用于解决该类问题,挖掘算法的时空效率依然成为该领域的主要研究热点问题.鉴于此,本文提出一个基于模式增长的高效用序列模式挖掘算法HUSP-FP.依据高效用序列项集必须满足事务效用闭包属性要求,算法首先在去除无用项后建立全局树,进而采用模式增长方法从全局树上获取全部高效用序列模式,避免产生候选项集.在实验环节与目前效率较好的HUSP-Miner、USPAN、HUS-Span三类算法进行了时空计算对比,实验结果表明本文给出算法在较小阈值下仍能有效挖掘到相关序列模式,并且在计算时间和空间使用效率两方面取得了较大的提高.
-
关键词
高效用序列模式
模式增长
闭包属性
数据挖掘
-
Keywords
High utility sequential pattern
pattern growth
downward closure property
data mining
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种快速的高效用序列模式挖掘算法
- 4
-
-
作者
张瑞华
韩萌
何菲菲
孟凡兴
李春鹏
-
机构
北方民族大学计算机科学与工程学院
-
出处
《燕山大学学报》
2025年第4期349-366,共18页
-
基金
国家自然科学基金资助项目(62062004)
宁夏自然科学基金资助项目(2023AAC03315)
+1 种基金
北方民族大学中央高校基本科研业务费专项资金资助项目(2021KJCX10)
北方民族大学研究生创新项目(YCX24120)。
-
文摘
高效用序列模式挖掘任务主要是从序列数据库中提取高效用子序列从而获取潜在知识。然而,序列数据的效用计算与低效用阈值产生的搜索空间组合爆炸问题使得高效用序列模式挖掘极具挑战性。针对现有的高效用序列模式挖掘算法存在的时间与空间消耗成本过高的问题,提出了一种紧凑的效用索引列表结构,用于存储挖掘过程中序列的效用与位置等信息,基于该结构设计了一种快速的高效用序列模式挖掘算法。为了进一步提高算法的挖掘效率,提出了一种新的序列效用计算上界,用于缩减搜索空间。在真实和合成数据集上的大量实验表明,本文设计的算法在时间、内存、搜索空间缩减和可扩展性方面均优于目前先进算法。
-
关键词
模式挖掘
高效用序列模式
序列分析
效用挖掘
效用索引列表
-
Keywords
pattern mining
high utility sequential patterns
sequence analysis
utility-oriented mining
utility index list
-
分类号
TP311.13
[自动化与计算机技术]
-