期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于投影数据库的序列模式挖掘增量式更新算法 被引量:5
1
作者 陆介平 刘月波 +2 位作者 倪巍伟 陈耿 孙志挥 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第3期457-462,共6页
针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算... 针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算.对于因增量数据库新产生的频繁模式,利用了在增量数据库中出现的频繁项集来减小投影数据库,进一步提高了算法的效率.理论分析和实验表明,算法是有效可行的,并且增量数据库越大,算法在效率上的优越性越明显,算法ISPBP优于传统增量式更新算法. 展开更多
关键词 序列模式 数据挖掘 投影数据库 增量式更新
在线阅读 下载PDF
无重复投影数据库扫描的序列模式挖掘算法 被引量:17
2
作者 张坤 朱扬勇 《计算机研究与发展》 EI CSCD 北大核心 2007年第1期126-132,共7页
序列模式挖掘在Web点击流分析、自然灾害预测、DNA和蛋白质序列模式发现等领域有着广泛应用.基于频繁模式增长的PrefixSpan是目前性能最好的序列模式挖掘算法之一.然而在密数据集和长序列模式挖掘过程中会出现大量的重复投影数据库,使... 序列模式挖掘在Web点击流分析、自然灾害预测、DNA和蛋白质序列模式发现等领域有着广泛应用.基于频繁模式增长的PrefixSpan是目前性能最好的序列模式挖掘算法之一.然而在密数据集和长序列模式挖掘过程中会出现大量的重复投影数据库,使得这类算法性能下降.算法SPMDS通过对投影数据库的伪投影做单项杂凑函数,如MD5等,检查是否存在重复的投影数据库,避免大量重复数据库的扫描,并采用一些必要条件简化投影数据库的搜索,进而提高算法的性能.实验和分析都表明SPMDS性能优于PrefixSpan. 展开更多
关键词 序列模式挖掘 投影数据库 前缀树 单向杂凑函数
在线阅读 下载PDF
基于投影数据库的改进单向COFI-tree关联分类 被引量:2
3
作者 唐成华 刘鹏程 +1 位作者 强保华 王文波 《小型微型计算机系统》 CSCD 北大核心 2014年第4期791-796,共6页
针对关联分类算法面对大数据集事务库时的候选集庞大、难以生成挖掘数据结构和高资源消耗等问题,提出了一种基于投影数据库的改进单向COFI-tree频繁项集生成算法,结合相关性度量等剪枝操作提取高效的分类规则,通过分治数据库有效降低整... 针对关联分类算法面对大数据集事务库时的候选集庞大、难以生成挖掘数据结构和高资源消耗等问题,提出了一种基于投影数据库的改进单向COFI-tree频繁项集生成算法,结合相关性度量等剪枝操作提取高效的分类规则,通过分治数据库有效降低整个数据库对资源的需求,减小对频繁项集的搜索空间和非频繁项集的数量,从而实现对频繁项集生成的优化过程.实验结果表明该算法通过生成初始投影数据库,并利用单向COFI-tree挖掘频繁项集的时间远小于同类算法对数据集进行直接挖掘,为大数据集的关联分类挖掘提供了一种新的解决途径. 展开更多
关键词 关联分类 投影数据库 COFI—tree 频繁项集 相关性度量
在线阅读 下载PDF
缩减投影数据库规模的增量式序列模式算法 被引量:2
4
作者 刘佳新 严书亭 任家东 《计算机工程》 CAS CSCD 2012年第3期28-30,共3页
在增量式序列模式挖掘算法中,数据库更新只有插入和扩展2种操作,未考虑序列删除的情况。为此,提出一种基于频繁序列树的增量式序列模式更新算法(IUFST)。在数据库和支持度发生变化时,IUFST算法分不同情况对频繁序列树进行更新操作,缩减... 在增量式序列模式挖掘算法中,数据库更新只有插入和扩展2种操作,未考虑序列删除的情况。为此,提出一种基于频繁序列树的增量式序列模式更新算法(IUFST)。在数据库和支持度发生变化时,IUFST算法分不同情况对频繁序列树进行更新操作,缩减投影数据库的规模,提高算法效率。实验结果表明,该算法在时间性能上优于PrefixSpan算法和IncSpan算法。 展开更多
关键词 数据挖掘 增量式挖掘 序列模式 投影数据库 频繁序列树 深度优先
在线阅读 下载PDF
挖掘RFID数据库中多维频繁路径的研究 被引量:2
5
作者 陈竹西 胡孔法 +1 位作者 陈崚 宋爱波 《高技术通讯》 CAS CSCD 北大核心 2011年第8期803-809,共7页
针对应用于物流和供应链管理的射频识别(RFID)系统产生的海量路径数据集中的多维频繁路径挖掘的问题进行了深入的研究,提出了Dim-path与Path-dim两种不同的顺序处理非路径维数据和路径数据的多维频繁路径挖掘算法。这两种算法根据R... 针对应用于物流和供应链管理的射频识别(RFID)系统产生的海量路径数据集中的多维频繁路径挖掘的问题进行了深入的研究,提出了Dim-path与Path-dim两种不同的顺序处理非路径维数据和路径数据的多维频繁路径挖掘算法。这两种算法根据RFID路径数据自身的特点,将RFID数据划分为非路径维数据、位置数据、停留时间数据,将多维路径挖掘问题分解为多维模式分析与序列模式挖掘问题处理,来提高算法的效率。买验结果与算法分析都表明,Dim-path算法与Path-dim算法能够有效快速地挖掘多维频繁路径。 展开更多
关键词 射频识别(RFID) 多维模式分析 序列模式挖掘 投影数据库
在线阅读 下载PDF
改进PrefixSpan的行为轨迹数据挖掘算法 被引量:5
6
作者 陈万志 赵帅 +1 位作者 方圆 王天元 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2023年第4期506-512,共7页
针对用户行为轨迹数据挖掘PrefixSpan算法构造投影数据库过程中重复扫描而造成时空开销过大的问题,提出一种改进的序列模式挖掘算法TDM-PrefixSpan(trajectory data mining based on prefixSpan algorithm)。依据时间序列分布特征,采用... 针对用户行为轨迹数据挖掘PrefixSpan算法构造投影数据库过程中重复扫描而造成时空开销过大的问题,提出一种改进的序列模式挖掘算法TDM-PrefixSpan(trajectory data mining based on prefixSpan algorithm)。依据时间序列分布特征,采用具有轨迹数据预处理的SMM(statistical mobility model)算法,通过分段合并和自适应调整方法去除异常数据,解决轨迹数据存在大量pingpong效应的问题。采用频繁项集逆序挖掘序列模式,通过已挖掘序列模式集迭代去除冗余项集得到待挖掘序列模式集,缩短扫描候选数据库时间。数据集测试结果表明:SMM算法预处理后,原始数据库数据规模减小;通过对比可知,TDM-PrefixSpan算法能够有效降低时间复杂度,提升挖掘效率。 展开更多
关键词 轨迹模型 PREFIXSPAN算法 pingpong效应 序列模式 投影数据库
在线阅读 下载PDF
基于PrefixSpan的快速交互序列模式挖掘算法 被引量:6
7
作者 陆介平 刘月波 +2 位作者 倪巍伟 刘同明 孙志挥 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第5期692-696,共5页
为了克服序列模式挖掘过程中重复运行挖掘算法而产生的时空消耗,提出了一个快速、简单而有效序列模式的交互式算法FISPM,利用前次挖掘得到的序列构造序列模式数据库用来存储挖掘出来的所有序列,通过缩减本次挖掘所要构造投影数据库的频... 为了克服序列模式挖掘过程中重复运行挖掘算法而产生的时空消耗,提出了一个快速、简单而有效序列模式的交互式算法FISPM,利用前次挖掘得到的序列构造序列模式数据库用来存储挖掘出来的所有序列,通过缩减本次挖掘所要构造投影数据库的频繁项的数量来减少构造投影数据库所需的时间以及投影数据库的大小,从而减少时间和空间消耗,提高挖掘效率.通过设置全局最小支持度来减少算法迭代次数.实验结果证明在交互挖掘过程中FISPM效率优于Pre-fixSpan. 展开更多
关键词 数据挖掘 序列模式 交互式挖掘 投影数据库
在线阅读 下载PDF
基于改进PrefixSpan的序列模式挖掘算法 被引量:12
8
作者 公伟 刘培玉 贾娴 《计算机应用》 CSCD 北大核心 2011年第9期2405-2407,共3页
针对PrefixSpan算法构造投影数据库开销大的问题,提出一种基于改进PrefixSpan的序列模式挖掘算法SPMIP。该方法通过添加剪枝步和减少某些特定序列模式生成过程的扫描,来减少投影数据库的规模及扫描投影数据库的时间,提高算法效率,并最... 针对PrefixSpan算法构造投影数据库开销大的问题,提出一种基于改进PrefixSpan的序列模式挖掘算法SPMIP。该方法通过添加剪枝步和减少某些特定序列模式生成过程的扫描,来减少投影数据库的规模及扫描投影数据库的时间,提高算法效率,并最终得到需要的序列模式。实验结果证明在获得序列模式不受影响情况下,SPMIP算法比PrefixSpan算法效率更高。 展开更多
关键词 PREFIXSPAN 序列模式 投影数据库 剪枝 扫描
在线阅读 下载PDF
基于位置信息的序列模式挖掘算法 被引量:12
9
作者 张利军 李战怀 王淼 《计算机应用研究》 CSCD 北大核心 2009年第2期529-531,共3页
PrefixSpan算法在产生频繁序列模式时会产生大量的投影数据库,其中很多投影数据库是相同的。提出了基于位置信息的序列模式挖掘算法——PVS,该方法通过记录每个已产生投影数据库的位置信息,避免了重复产生相同的投影数据库,从而提高了... PrefixSpan算法在产生频繁序列模式时会产生大量的投影数据库,其中很多投影数据库是相同的。提出了基于位置信息的序列模式挖掘算法——PVS,该方法通过记录每个已产生投影数据库的位置信息,避免了重复产生相同的投影数据库,从而提高了算法的运行效率。通过实验证明,该算法在处理相似度很高的序列数据时比PrefixSpan算法有效。 展开更多
关键词 前缀 序列模式 投影数据库 位置信息
在线阅读 下载PDF
一种基于序列末项位置信息的序列模式挖掘算法 被引量:5
10
作者 缪裕青 吴孔玲 +1 位作者 朱晓雁 苏杰 《计算机应用研究》 CSCD 北大核心 2012年第7期2505-2508,共4页
针对PrefixSpan算法中反复扫描投影数据库寻找局部频繁项并重复构造挖掘大量重复投影数据库的不足,提出一种基于序列末项位置信息的序列模式挖掘算法SPM-LIPT。通过连接2-序列位置信息表(LIPT)找到序列模式的下一项,实现序列模式增长,... 针对PrefixSpan算法中反复扫描投影数据库寻找局部频繁项并重复构造挖掘大量重复投影数据库的不足,提出一种基于序列末项位置信息的序列模式挖掘算法SPM-LIPT。通过连接2-序列位置信息表(LIPT)找到序列模式的下一项,实现序列模式增长,避免对投影数据库反复扫描;同时通过检查相同末项序列首位置信息表(SLIFPT)进行前向剪枝;消除大量重复投影的构建。最后通过实验证明了算法的有效性。 展开更多
关键词 数据挖掘 序列模式挖掘 位置信息 投影数据库
在线阅读 下载PDF
基于PrefixSpan的序列模式挖掘改进算法 被引量:13
11
作者 汪林林 范军 《计算机工程》 CAS CSCD 北大核心 2009年第23期56-58,61,共4页
针对序列模式挖掘算法PrefixSpan在挖掘过程中需要构造大量投影数据库的不足,提出IPMSP算法,在递归挖掘过程中,通过检查序列数据库关于前缀的前缀,避免对同一频繁前缀模式构造重复投影数据库,同时舍弃对非频繁项的存储并在投影序列数小... 针对序列模式挖掘算法PrefixSpan在挖掘过程中需要构造大量投影数据库的不足,提出IPMSP算法,在递归挖掘过程中,通过检查序列数据库关于前缀的前缀,避免对同一频繁前缀模式构造重复投影数据库,同时舍弃对非频繁项的存储并在投影序列数小于最小支持度时停止扫描投影数据库,从而提高PrefixSpan算法的时空性能。实验结果证明,IPMSP算法在时间和空间性能上优于PrefixSpan算法。 展开更多
关键词 序列模式 PREFIXSPAN算法 投影数据库
在线阅读 下载PDF
基于序列树的增量式序列模式更新算法 被引量:1
12
作者 刘佳新 严书亭 +1 位作者 贺春亮 任家东 《计算机工程与应用》 CSCD 北大核心 2011年第33期143-145,155,共4页
在序列数据库更新时,现有的增量式序列模式挖掘算法只提到序列的插入操作和序列的扩展操作两种情况,没有针对序列删除操作。提出了一种基于序列树的增量式序列模式更新算法(ISPST)。当数据库更新时,ISPST算法只需要对与删除序列有关的... 在序列数据库更新时,现有的增量式序列模式挖掘算法只提到序列的插入操作和序列的扩展操作两种情况,没有针对序列删除操作。提出了一种基于序列树的增量式序列模式更新算法(ISPST)。当数据库更新时,ISPST算法只需要对与删除序列有关的序列构造投影数据库,实现对序列树的更新操作,通过深度优先遍历序列树得到更新后数据库中的所有序列模式。实验结果表明,当支持度发生变化时,ISPST算法在时间性能上优于PrefixSpan算法和IncSpan算法。 展开更多
关键词 序列模式 增量式挖掘 投影数据库 序列树
在线阅读 下载PDF
一种高效的增量式序列模式挖掘算法 被引量:3
13
作者 刘佳新 《计算机工程》 CAS CSCD 2012年第12期39-41,共3页
现有的增量式挖掘算法在支持度发生变化时,需要对序列数据库进行重复挖掘,为减少由此产生的时空消耗,提出一种高效的增量式序列模式挖掘算法。算法采用频繁序列树作为序列存储结构,当序列数据库和最小支持度发生变化时,通过执行更新操作... 现有的增量式挖掘算法在支持度发生变化时,需要对序列数据库进行重复挖掘,为减少由此产生的时空消耗,提出一种高效的增量式序列模式挖掘算法。算法采用频繁序列树作为序列存储结构,当序列数据库和最小支持度发生变化时,通过执行更新操作,实现频繁序列树的更新,利用深度优先遍历频繁序列树找到序列数据库中所有的序列模式。实验结果表明,与IncSpan算法和PrefixSpan算法相比,该算法的挖掘效率较高。 展开更多
关键词 数据挖掘 增量式挖掘 序列模式 投影数据库 频繁序列树
在线阅读 下载PDF
恶意代码检测中的PrefixSpan算法应用 被引量:3
14
作者 王丽娜 谭小彬 +1 位作者 潘剑锋 奚宏生 《计算机工程》 CAS CSCD 北大核心 2010年第7期119-121,共3页
结合数据挖掘和专家系统技术解决主机恶意代码检测问题,提出一个基于行为的恶意代码检测系统。数据挖掘算法采用改进的序列模式挖据算法——PrefixSpan,该算法用简约投影数据库代替原PrefixSpan算法的投影数据库。PrefixSpan从恶意代码... 结合数据挖掘和专家系统技术解决主机恶意代码检测问题,提出一个基于行为的恶意代码检测系统。数据挖掘算法采用改进的序列模式挖据算法——PrefixSpan,该算法用简约投影数据库代替原PrefixSpan算法的投影数据库。PrefixSpan从恶意代码行为序列库中挖掘关联规则,专家系统将获取的主机行为与规则匹配,从而达到检测恶意行为的目的。实验结果证明了该算法的正确性和有效性。 展开更多
关键词 恶意代码检测 基于行为检测 序列模式挖掘 PREFIXSPAN算法 投影数据库
在线阅读 下载PDF
一种挖掘多维序列模式的有效方法 被引量:3
15
作者 肖仁财 薛安荣 《计算机工程与应用》 CSCD 北大核心 2008年第6期187-190,共4页
提出了一种新的多维序列模式挖掘算法,首先在序列信息中挖掘序列模式,然后针对每个序列模式,在包含此模式的所有元组中的多维信息中挖掘频繁1-项集,由得到的频繁1-项集开始,循环的由频繁(k-1)-项集(k>1)连接生成频繁k项集,从而得到... 提出了一种新的多维序列模式挖掘算法,首先在序列信息中挖掘序列模式,然后针对每个序列模式,在包含此模式的所有元组中的多维信息中挖掘频繁1-项集,由得到的频繁1-项集开始,循环的由频繁(k-1)-项集(k>1)连接生成频繁k项集,从而得到所有的多维模式。该算法通过扫描不断缩小的频繁(k-1)-项集来生成频繁k项集,减少了扫描投影数据库的次数,因而减少了时间开销,实验表明该算法有较高的挖掘效率。 展开更多
关键词 投影数据库 多维序列模式 序列模式 数据挖掘
在线阅读 下载PDF
基于Top-k的高效用模式挖掘算法 被引量:4
16
作者 赵林柳 吕鑫 陶飞飞 《计算机工程》 CAS CSCD 北大核心 2019年第5期169-174,181,共7页
通过用户设定阈值获取高效用模式的算法效率较低且挖掘结果不一定满足用户需求。针对这一问题,基于EFIM算法提出一种高效用Top-k模式挖掘算法。由用户指定高效用模式个数来代替人为阈值设定。采用基于扩展效用和剩余效用的双重剪枝策略... 通过用户设定阈值获取高效用模式的算法效率较低且挖掘结果不一定满足用户需求。针对这一问题,基于EFIM算法提出一种高效用Top-k模式挖掘算法。由用户指定高效用模式个数来代替人为阈值设定。采用基于扩展效用和剩余效用的双重剪枝策略,有效控制模式的增长。在数据库投影过程中,应用事务排序及合并策略减少运行时间和内存消耗。实验结果表明,该算法在运行时间和内存消耗上具有较大优势,尤其适用于密集型数据集的高效用模式挖掘。 展开更多
关键词 高效用模式 Top-k模式 扩展效用值 剩余效用值 数据库投影
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部