期刊文献+
共找到212篇文章
< 1 2 11 >
每页显示 20 50 100
时间权重驱动的日志模式循环迭代挖掘算法
1
作者 黄岩 罗朝彤 +5 位作者 左金虎 肖忠良 陈佳 陈晓磊 王鹏 汪卫 《计算机应用与软件》 北大核心 2025年第11期311-317,397,共8页
日志数据是运维人员监控软件系统的重要依据,自动化挖掘日志模式能够有效地帮助运维人员理解系统的行为。然而,相同任务与不同任务的日志交错会干扰日志模式的挖掘。为此,提出一种时间权重驱动的日志模式循环迭代挖掘算法TSP-Miner。该... 日志数据是运维人员监控软件系统的重要依据,自动化挖掘日志模式能够有效地帮助运维人员理解系统的行为。然而,相同任务与不同任务的日志交错会干扰日志模式的挖掘。为此,提出一种时间权重驱动的日志模式循环迭代挖掘算法TSP-Miner。该算法提取关联日志的合理时间间隔作为时间权重,准确识别日志间的关联性并挖掘日志模式,无需任务特征信息。通过循环迭代挖掘的策略,TSP-Miner持续替换日志序列中符合已有日志模式的子序列,简化其结构,即使在交错干扰下也能有效挖掘日志模式。基于真实和模拟数据集的实验结果均表明,TSP-Miner挖掘出的日志模式质量优于已有算法。 展开更多
关键词 数据挖掘 模式挖掘 日志分析 序列模式
在线阅读 下载PDF
一种有效的周期高效用序列模式增量挖掘算法 被引量:2
2
作者 荀亚玲 任姿芊 闫海博 《计算机应用研究》 CSCD 北大核心 2024年第8期2301-2308,共8页
周期高效用序列模式挖掘(PHUSPM)因其能够发现时间序列中更具实际价值的规律性模式而备受关注,但现有的PHUSPM算法难以有效地处理数据集的增量更新,且未考虑大规模数据下算法的向下闭包性和复杂性。针对该问题,提出了IncPUS-Miner算法,... 周期高效用序列模式挖掘(PHUSPM)因其能够发现时间序列中更具实际价值的规律性模式而备受关注,但现有的PHUSPM算法难以有效地处理数据集的增量更新,且未考虑大规模数据下算法的向下闭包性和复杂性。针对该问题,提出了IncPUS-Miner算法,有效地实现了周期高效用序列模式(PHUSPs)的增量挖掘。IncPUS-Miner引入了一种名为pu-tree的新型数据结构,每个树节点对应一个更新效用列表(UUL)用于存储相应序列的辅助信息,当有增量数据加入时,该结构使得项目信息能够灵活更新,从而增强了算法的动态适应性和可扩展性。此外,还提出了两种新的序列效用上界PUB和EUB,以及两种相应的剪枝策略,有效地减少了计算负担。实验结果表明,在真实数据集上,IncPUS-Miner算法可以有效地增量挖掘PHUSPs,与其他算法相比,在运行效率和内存消耗上展现出了优越的性能。 展开更多
关键词 增量挖掘 高效用序列模式 周期序列模式 序列模式挖掘
在线阅读 下载PDF
一次性条件下top-k高平均效用序列模式挖掘算法 被引量:2
3
作者 杨克帅 武优西 +2 位作者 耿萌 刘靖宇 李艳 《计算机应用》 CSCD 北大核心 2024年第2期477-484,共8页
针对传统序列模式挖掘(SPM)不考虑模式重复性且忽略各项的效用(单价或利润)与模式长度对用户兴趣度影响的问题,提出一次性条件下top-k高平均效用序列模式挖掘(TOUP)算法。TOUP算法主要包括两个核心步骤:平均效用计算和候选模式生成。首... 针对传统序列模式挖掘(SPM)不考虑模式重复性且忽略各项的效用(单价或利润)与模式长度对用户兴趣度影响的问题,提出一次性条件下top-k高平均效用序列模式挖掘(TOUP)算法。TOUP算法主要包括两个核心步骤:平均效用计算和候选模式生成。首先,提出基于各项出现位置与项重复关系数组的CSP(Calculation Support of Pattern)算法计算模式支持度,从而实现模式平均效用的快速计算;其次,采用项集扩展和序列扩展生成候选模式,并提出了最大平均效用上界,基于该上界实现对候选模式的有效剪枝。在5个真实数据集和1个合成数据集上的实验结果表明,相较于TOUP-dfs和HAOP-ms算法,TOUP算法的候选模式数分别降低了38.5%~99.8%和0.9%~77.6%;运行时间分别降低了33.6%~97.1%和57.9%~97.2%。TOUP的算法性能更优,能更高效地挖掘用户感兴趣的模式。 展开更多
关键词 数据挖掘 序列模式挖掘 高平均效用 一次性条件 TOP-K
在线阅读 下载PDF
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
4
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树 增量式更新
在线阅读 下载PDF
大型数据库中的高效序列模式增量式更新算法 被引量:10
5
作者 邹翔 张巍 +1 位作者 蔡庆生 王清毅 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第2期165-171,共7页
 提出一种称为FIMS(fastincrementalminingofsequentialpatterns)的序列模式增量式更新算法,处理因数据库的更新而引起的序列模式的维护问题.主要思想是利用原先的序列模式挖掘结果,通过建立一个投影数据库来减少对整个数据库的扫描次...  提出一种称为FIMS(fastincrementalminingofsequentialpatterns)的序列模式增量式更新算法,处理因数据库的更新而引起的序列模式的维护问题.主要思想是利用原先的序列模式挖掘结果,通过建立一个投影数据库来减少对整个数据库的扫描次数和候选序列的生成,从而提高挖掘的效率.实验结果显示在更新数据量远小于整个数据库的大小时,FIMS算法的性能优于GSP算法4~7倍. 展开更多
关键词 数据库 增量式更新算法 数据挖掘 序列模式 扫描次数 侯选序列
在线阅读 下载PDF
序列模式挖掘综述 被引量:25
6
作者 陈卓 杨炳儒 +1 位作者 宋威 宋泽锋 《计算机应用研究》 CSCD 北大核心 2008年第7期1960-1963,1976,共5页
综述了序列模式挖掘的研究状况。首先介绍了序列模式挖掘背景与相关概念;其次总结了序列模式挖掘的一般方法,介绍并分析了最具代表性的序列模式挖掘算法;最后展望序列模式挖掘的研究方向。便于研究者对已有算法进行改进,提出具有更好性... 综述了序列模式挖掘的研究状况。首先介绍了序列模式挖掘背景与相关概念;其次总结了序列模式挖掘的一般方法,介绍并分析了最具代表性的序列模式挖掘算法;最后展望序列模式挖掘的研究方向。便于研究者对已有算法进行改进,提出具有更好性能的新的序列模式挖掘算法。 展开更多
关键词 数据挖掘 序列模式 周期模式 增量式挖掘
在线阅读 下载PDF
带通配符和One-Off条件的序列模式挖掘 被引量:23
7
作者 吴信东 谢飞 +2 位作者 黄咏明 胡学钢 高隽 《软件学报》 EI CSCD 北大核心 2013年第8期1804-1815,共12页
很多应用领域产生大量的序列数据.如何从这些序列数据中挖掘具有重要价值的模式,已成为序列模式挖掘研究的主要任务.研究这样一个问题:给定序列S、支持度阈值和间隔约束,从序列S中挖掘所有出现次数不小于给定支持度阈值的频繁序列模式,... 很多应用领域产生大量的序列数据.如何从这些序列数据中挖掘具有重要价值的模式,已成为序列模式挖掘研究的主要任务.研究这样一个问题:给定序列S、支持度阈值和间隔约束,从序列S中挖掘所有出现次数不小于给定支持度阈值的频繁序列模式,并且要求模式中任意两个相邻元素在序列中的出现位置满足用户定义的间隔约束.设计了一种有效的带有通配符的模式挖掘算法One-Off Mining,模式在序列中的出现满足One-Off条件,即模式的任意两次出现都不共享序列中同一位置的字符.在生物DNA序列上的实验结果表明,One-Off Mining比相关的序列模式挖掘算法具有更好的时间性能和完备性. 展开更多
关键词 数据挖掘 序列模式挖掘 频繁模式 通配符 One-Off条件
在线阅读 下载PDF
基于频繁模式树的关联规则增量式更新算法 被引量:81
8
作者 朱玉全 孙志挥 季小俊 《计算机学报》 EI CSCD 北大核心 2003年第1期91-96,共6页
研究了大型事务数据库中关联规则的增量式更新问题 ,提出了一种基于频繁模式树的关联规则增量式更新算法 ,以处理最小支持度或事务数据库发生变化后相应关联规则的更新问题 。
关键词 频繁模式树 关联规则 增量式更新算法 数据挖掘 数据库
在线阅读 下载PDF
快速更新频繁项集 被引量:63
9
作者 朱玉全 孙志挥 赵传申 《计算机研究与发展》 EI CSCD 北大核心 2003年第1期94-99,共6页
发现频繁项集是数据挖掘应用中的关键问题 ,发现过程的高花费要求对增量数据挖掘算法进行深入研究 首先分析并指出了增量式更新频繁项集算法的技术难点———寻找新的有效频繁项集 ;其次提出了一种快速的增量式更新频繁项集算法FUFIA ;
关键词 快速更新频繁项集 数据挖掘 关联规则 频繁项集 事务数据库
在线阅读 下载PDF
基于权限频繁模式挖掘算法的Android恶意应用检测方法 被引量:48
10
作者 杨欢 张玉清 +1 位作者 胡予濮 刘奇旭 《通信学报》 EI CSCD 北大核心 2013年第S1期106-115,共10页
Android应用所申请的各个权限可以有效反映出应用程序的行为模式,而一个恶意行为的产生需要多个权限的配合,所以通过挖掘权限之间的关联性可以有效检测未知的恶意应用。以往研究者大多关注单一权限的统计特性,很少研究权限之间关联性的... Android应用所申请的各个权限可以有效反映出应用程序的行为模式,而一个恶意行为的产生需要多个权限的配合,所以通过挖掘权限之间的关联性可以有效检测未知的恶意应用。以往研究者大多关注单一权限的统计特性,很少研究权限之间关联性的统计特性。因此,为有效检测Android平台未知的恶意应用,提出了一种基于权限频繁模式挖掘算法的Android恶意应用检测方法,设计了能够挖掘权限之间关联性的权限频繁模式挖掘算法—PApriori。基于该算法对49个恶意应用家族进行权限频繁模式发现,得到极大频繁权限项集,从而构造出权限关系特征库来检测未知的恶意应用。最后,通过实验验证了该方法的有效性和正确性,实验结果表明所提出的方法与其他相关工作对比效果更优。 展开更多
关键词 频繁模式 数据挖掘 恶意应用检测 权限特征 ANDROID系统
在线阅读 下载PDF
基于投影数据库的序列模式挖掘增量式更新算法 被引量:5
11
作者 陆介平 刘月波 +2 位作者 倪巍伟 陈耿 孙志挥 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第3期457-462,共6页
针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算... 针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算.对于因增量数据库新产生的频繁模式,利用了在增量数据库中出现的频繁项集来减小投影数据库,进一步提高了算法的效率.理论分析和实验表明,算法是有效可行的,并且增量数据库越大,算法在效率上的优越性越明显,算法ISPBP优于传统增量式更新算法. 展开更多
关键词 序列模式 数据挖掘 投影数据库 增量式更新
在线阅读 下载PDF
一种挖掘压缩序列模式的有效算法 被引量:8
12
作者 童咏昕 张媛媛 +3 位作者 袁玫 马世龙 余丹 赵莉 《计算机研究与发展》 EI CSCD 北大核心 2010年第1期72-80,共9页
从序列数据库中挖掘频繁序列模式是数据挖掘领域的一个中心研究主题,而且该领域已经提出和研究了各种有效的序列模式挖掘算法.由于在挖掘过程中会产生大量的频繁序列模式,最近许多研究者已经不再聚焦于序列模式挖掘算法的效率,而更关注... 从序列数据库中挖掘频繁序列模式是数据挖掘领域的一个中心研究主题,而且该领域已经提出和研究了各种有效的序列模式挖掘算法.由于在挖掘过程中会产生大量的频繁序列模式,最近许多研究者已经不再聚焦于序列模式挖掘算法的效率,而更关注于如何让用户更容易地理解序列模式的结果集.受压缩频繁项集思想的启发,提出了一种CFSP(compressing frequent sequential patterns)算法,其可挖掘出少量有代表性的序列模式来表达全部频繁序列模式的信息,并且清除了大量的冗余序列模式.CFSP是一种two-steps的算法:在第1步,其获得了全部闭序列模式作为有代表性序列模式的候选集,与此同时还得到大多数的有代表性模式;在第2步,该算法只花费了少量的时间去发现剩余的有代表性序列模式.一个采用真实数据集与模拟数据集的实验研究也证明了CFSP算法具有高效性. 展开更多
关键词 挖掘序列模式 压缩 频繁模式挖掘 关联规则 数据挖掘
在线阅读 下载PDF
一个简单的Web日志挖掘系统 被引量:22
13
作者 杨怡玲 管旭东 +1 位作者 陆丽娜 尤晋元 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第7期932-935,共4页
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序... 在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序列模式识别过程和算法 ,包括最大向前路径的识别和频繁遍历路径的发现 。 展开更多
关键词 数据挖掘 WEB日志挖掘 序列模式识别 SWLMS
在线阅读 下载PDF
关联规则的增量式更新算法 被引量:227
14
作者 冯玉才 冯剑琳 《软件学报》 EI CSCD 北大核心 1998年第4期301-306,共6页
关联规则的开采是一个重要的数据开采问题.目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,用户将需要不断... 关联规则的开采是一个重要的数据开采问题.目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,用户将需要不断调整两个描述用户兴趣程度的阈值:最小支持度和最小可信度.本文提出了两种增量式更新算法——IUA(incrementalupdatingalgorithm)和PIUA(paralelincre-mentalupdatingalgorithm),用来解决这一关联规则高效维护问题. 展开更多
关键词 数据开采 知识发现 关联规则 增量式更新 数据库
在线阅读 下载PDF
频繁项目集的快速增量式更新算法 被引量:6
15
作者 杨明 孙志挥 +1 位作者 宋余庆 陈耿 《应用科学学报》 CAS CSCD 2003年第4期367-372,共6页
提出了频繁项目集的快速增量式更新算法(FIUA),主要考虑最小支持度发生变化时频繁项目集的更新情况.FIUA在最坏的情况下仅需扫描数据库一遍,且无需生成候选项目集,有效地节约了存储空间,提高了频繁项目集的更新效率.
关键词 频繁项目集 快速增量式更新算法 频繁模式树 数据挖掘 数据库
在线阅读 下载PDF
免预设间隔约束的对比序列模式高效挖掘 被引量:15
16
作者 王慧锋 段磊 +3 位作者 左劼 王文韬 李钟麒 唐常杰 《计算机学报》 EI CSCD 北大核心 2016年第10期1979-1991,共13页
对比序列模式在识别不同类别序列样本集合的特征上有着重要的作用.已有对比序列模式挖掘算法需要用户预设间隔约束.在不具备充分先验知识情况下,用户不易准确地预设恰当的间隔约束,进而导致不能发现有用的模式.对此,文中设计了带紧凑间... 对比序列模式在识别不同类别序列样本集合的特征上有着重要的作用.已有对比序列模式挖掘算法需要用户预设间隔约束.在不具备充分先验知识情况下,用户不易准确地预设恰当的间隔约束,进而导致不能发现有用的模式.对此,文中设计了带紧凑间隔约束的最小对比序列模式挖掘算法,实现免预设间隔约束,并对候选模式自动计算最适合的间隔约束.此外,设计了3种剪枝策略来提高算法的执行效率.通过蛋白质序列、DNA序列、行为序列数据集验证了提出的算法的有效性和高效率. 展开更多
关键词 对比序列模式 间隔约束 序列数据挖掘
在线阅读 下载PDF
序列模式挖掘研究与发展 被引量:33
17
作者 王虎 丁世飞 《计算机科学》 CSCD 北大核心 2009年第12期14-17,共4页
序列模式挖掘是数据挖掘的一个重要研究课题,它在很多领域中都有着广泛的应用。首先讨论了序列模式挖掘的相关背景,然后对序列模式挖掘进行分类,并在此基础上对每一类序列模式挖掘算法的特点进行了介绍和比较;最后,对序列模式挖掘未来... 序列模式挖掘是数据挖掘的一个重要研究课题,它在很多领域中都有着广泛的应用。首先讨论了序列模式挖掘的相关背景,然后对序列模式挖掘进行分类,并在此基础上对每一类序列模式挖掘算法的特点进行了介绍和比较;最后,对序列模式挖掘未来的研究重点进行展望,以便研究者对序列模式挖掘做进一步的研究。 展开更多
关键词 数据挖掘 序列模式挖掘 闭合模式 增量式 多维模式
在线阅读 下载PDF
闭合序列模式挖掘算法 被引量:9
18
作者 沙金 邓成玉 +1 位作者 张翠肖 刘伟峰 《计算机工程与设计》 CSCD 北大核心 2006年第3期514-518,共5页
提出了一种新的挖掘闭合序列模式的PosD算法,该算法利用位置数据保存数据项的顺序信息,并基于位置数据列表保存数据项的顺序关系提出了两种修剪方法:逆向超模式和相同位置数据。为了确保栅格存储的正确性和简洁性,另外还针对一些特殊情... 提出了一种新的挖掘闭合序列模式的PosD算法,该算法利用位置数据保存数据项的顺序信息,并基于位置数据列表保存数据项的顺序关系提出了两种修剪方法:逆向超模式和相同位置数据。为了确保栅格存储的正确性和简洁性,另外还针对一些特殊情况做处理。试验结果表明,在中大型数据库和小支持度的情况下该算法比CloSpan算法更有效。 展开更多
关键词 数据挖掘 序列模式 闭合序列模式 逆向超模式
在线阅读 下载PDF
负增量式关联规则更新算法 被引量:7
19
作者 张师超 张继连 +1 位作者 陈峰 倪艾玲 《计算机科学》 CSCD 北大核心 2005年第9期153-155,175,共4页
模式维护是数据挖掘中一个具有挑战性的任务。现有的增量式关联规则更新算法主要解决两种情况下的维护问题:一是最小支持度不变,而数据量增加;二是数据量不变,而改变最小支持度。本文提出了一种负增量关联规则更新算法。实验表明,该算... 模式维护是数据挖掘中一个具有挑战性的任务。现有的增量式关联规则更新算法主要解决两种情况下的维护问题:一是最小支持度不变,而数据量增加;二是数据量不变,而改变最小支持度。本文提出了一种负增量关联规则更新算法。实验表明,该算法是有效的。 展开更多
关键词 数据挖掘 关联规则 增量更新算法 模式维护 数据库
在线阅读 下载PDF
基于模式挖掘的用户行为异常检测算法 被引量:13
20
作者 宋海涛 韦大伟 +1 位作者 汤光明 孙怡峰 《小型微型计算机系统》 CSCD 北大核心 2016年第2期221-226,共6页
为了解决恶意终端用户行为的安全管控问题,针对用户行为的规律性、偶然性、多重复性的特点,提出一种基于模式挖掘的用户行为异常检测算法.该算法针对单个用户行为序列,包括序列模式挖掘和模式比较两个过程.序列模式挖掘应用滑动时间窗... 为了解决恶意终端用户行为的安全管控问题,针对用户行为的规律性、偶然性、多重复性的特点,提出一种基于模式挖掘的用户行为异常检测算法.该算法针对单个用户行为序列,包括序列模式挖掘和模式比较两个过程.序列模式挖掘应用滑动时间窗口界定事务策略和首项固定策略,挖掘出用户的行为模式;通过模式比较计算的相关度,综合了当前行为模式与正常行为模式相比较的连接度、匹配度两个因素,当模式比较结果处于可评判区间,便可以给出异常检测的确定性结果.实验结果表明,由本文序列模式挖掘过程获得的用户行为模式更贴合用户的实际操作情况;模式比较得到的相关度能够区分正常行为与异常行为,有效地实现用户行为的异常检测. 展开更多
关键词 序列模式 数据挖掘 单用户行为 异常检测
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部