期刊文献+
共找到624篇文章
< 1 2 32 >
每页显示 20 50 100
基于FP-Growth数据挖掘的直流串联故障电弧特征提取及检测方法
1
作者 杨晓华 费正源 +3 位作者 代盛国 刘家欣 陈思磊 李兴文 《广东电力》 北大核心 2025年第3期104-112,共9页
为解决传统时频分析方法难以有效提取多种电极材料下的故障电弧特征,导致故障电弧检测装置拒动而引发火灾的问题,提出了基于频繁模式增长(FP-Growth)数据挖掘的直流故障电弧检测算法,实现多种电极材料下的特征有效提取。基于改进粒子群... 为解决传统时频分析方法难以有效提取多种电极材料下的故障电弧特征,导致故障电弧检测装置拒动而引发火灾的问题,提出了基于频繁模式增长(FP-Growth)数据挖掘的直流故障电弧检测算法,实现多种电极材料下的特征有效提取。基于改进粒子群算法对检测算法的准确率、检测时间和内存大小进行协同优化,实现在硬件资源受限条件下故障电弧检测算法最优参数的选取。经过测试验证表明该方法能够快速、有效地检测不同电极材料下的直流串联故障电弧,为基于材料差异的故障电弧特征提取及检测方法的硬件实现提供参考。 展开更多
关键词 故障电弧 频繁模式增长 协同优化 改进粒子群 硬件实现 机器学习
在线阅读 下载PDF
基于优化FP⁃Growth算法的滑坡频繁因素组合挖掘
2
作者 李佳颖 郝彬超 +4 位作者 王卫东 王智超 曹禄来 韩征 朱崇政 《防灾减灾工程学报》 北大核心 2025年第3期532-541,共10页
滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方... 滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方检验剔除与滑坡灾害弱相关的影响因素,耦合分析滑坡区域与影响因素区划,针对大数据挖掘算法仅能以历史滑坡次数等离散型变量为挖掘依据的局限性,引入特征参数优化频繁模式树(FPGrowth)算法,使其能以历史滑坡面积和历史滑坡密度等连续型变量为挖掘依据,挖掘滑坡频繁二级因素组合,利用卡方检验与频率比检验挖掘结果准确性。结果表明:基于历史滑坡密度的优化关联规则算法能更好地挖掘滑坡频繁二级因素组合,其中,“高程<1769 m、地表起伏度62~140 m”的区域滑坡最频繁,需要对滑坡灾害重点关注与防治。针对原始关联规则算法仅能以滑坡次数为挖掘依据的局限,优化算法以考虑滑坡范围的影响,深入研究多种影响因素对滑坡的综合作用,为滑坡灾害的快速判识与防灾减灾提供参考。 展开更多
关键词 大数据挖掘技术 优化关联规则算法 fp-GROWTH算法 滑坡影响因素 频繁组合挖掘
在线阅读 下载PDF
基于FP-Growth的目标编队规律挖掘模型
3
作者 徐秋坪 孙耀宗 《系统工程与电子技术》 北大核心 2025年第5期1620-1626,共7页
面向目标间编队协同作战运用规律分析挖掘需求,考虑目标编队样本存在一型多架、同类样本目标关联顺序不同等特征,提出一种基于频繁模式树的编队协同规律挖掘算法模型。模型中设计样本格式化预处理方法和频繁项分拣策略,运用频繁模式增... 面向目标间编队协同作战运用规律分析挖掘需求,考虑目标编队样本存在一型多架、同类样本目标关联顺序不同等特征,提出一种基于频繁模式树的编队协同规律挖掘算法模型。模型中设计样本格式化预处理方法和频繁项分拣策略,运用频繁模式增长算法挖掘目标编组规律知识,从编组运用样式、作战运用样式等维度分析典型编队规律运用特征。该模型易于工程实现,能够基于积累的编队样本数据,挖掘形成典型目标协同作战运用规律知识,通过案例分析介绍该模型的可行性和有效性,可为实时战场编队识别研判、目标态势变化趋势预测、临机动态规划等作战应用提供高价值情报支撑。 展开更多
关键词 编队规律 作战运用特征 频繁模式增长算法
在线阅读 下载PDF
基于改进FP-growth算法的食品风险因素关联分析方法
4
作者 于家斌 马欣玥 +5 位作者 赵峙尧 王小艺 张新 崔晓玉 白玉廷 陈帅祥 《食品科学》 EI CAS CSCD 北大核心 2024年第23期250-258,共9页
为解决传统食品安全监督抽检“随机抽”模式存在的抽检决策主观性强、靶向性不高的问题,本研究提出一种基于改进Frequent Pattern-growth(FP-growth)算法的食品风险因素关联分析方法。首先,采用熵权法分别对食品种类的风险指标进行权重... 为解决传统食品安全监督抽检“随机抽”模式存在的抽检决策主观性强、靶向性不高的问题,本研究提出一种基于改进Frequent Pattern-growth(FP-growth)算法的食品风险因素关联分析方法。首先,采用熵权法分别对食品种类的风险指标进行权重分配,以计算出不同食品种类的风险指数。其次,以风险指数为特征,基于小批量K均值算法(MiniBatchKmeans)进行风险聚类,得到食品的风险等级。最后,采用带约束的改进FP-growth算法进行食品风险因素关联规则挖掘,挖掘食品风险等级与食品种类、时间、地域属性信息之间的关联关系,并对挖掘出的结果进行关联分析,从而为精准靶向引导抽检决策提供指导。本研究依托2019年中国某些地区的食品抽检数据进行分析,对其进行指标赋权,计算风险指数;后经过风险聚类为低风险、中风险和高风险;最后,将数据导入改进FPgrowth算法,得到食品风险因素关联规则。通过对比实验得到结果:对于17214条抽检数据,本研究提出的改进FP-growth算法相较于Apriori算法运行时间短;相较于传统FP-growth算法,删除了无效规则,提高了对食品风险因素关联规则的分析效率,从而为食品监管部门抽检工作提供了准确、高效的决策依据。 展开更多
关键词 食品安全监督抽检 关联分析 熵权法 MinibatchKmeans聚类 frequent pattern-growth算法
在线阅读 下载PDF
基于LFP树与与代理向量的轨迹隐私数据发布 被引量:1
5
作者 吕朋朋 吴轲 缪平 《计算机应用与软件》 北大核心 2024年第7期279-287,349,共10页
为了兼顾数据的安全性以及利用率,提出一种基于局部频繁模式树与与代理向量的轨迹隐私数据发布方法。引入一种基于网格环境的代理向量,从而有效避免隐私的泄露问题;根据基于信任用户的数据公开,可以预测整个轨迹流,并且能够得到特定区... 为了兼顾数据的安全性以及利用率,提出一种基于局部频繁模式树与与代理向量的轨迹隐私数据发布方法。引入一种基于网格环境的代理向量,从而有效避免隐私的泄露问题;根据基于信任用户的数据公开,可以预测整个轨迹流,并且能够得到特定区域的轨迹统计信息;引入局部频繁模式树,可以有效地跳过大量不必要的候选序列,并降低数据维数,减少时间复杂度。实验结果表明该方法能够保证良好的安全性与数据利用率。 展开更多
关键词 局部频繁模式 代理向量 隐私数据发布 安全性
在线阅读 下载PDF
面向时间有序事务数据的聚簇频繁模式挖掘
6
作者 王少鹏 牛超煜 《软件学报》 北大核心 2025年第5期2342-2361,共20页
首次对时间有序事务数据中聚簇频繁模式的挖掘问题进行研究.为了解决Naive算法处理该问题时存在冗余运算的问题,提出一种改进的聚簇频繁模式挖掘算法ICFPM(improved cluster frequent pattern mining).该算法使用2种优化策略,一方面可... 首次对时间有序事务数据中聚簇频繁模式的挖掘问题进行研究.为了解决Naive算法处理该问题时存在冗余运算的问题,提出一种改进的聚簇频繁模式挖掘算法ICFPM(improved cluster frequent pattern mining).该算法使用2种优化策略,一方面可以利用定义的参数minCF,有效减少挖掘结果的搜索空间,另一方面可以参考(n–1)项集的判别结果加速聚簇频繁n项集的判别过程,算法还使用了ICFPM-list结构来减少候选n项集的构建开销.基于两个真实世界数据集的仿真实验证明了ICFPM算法的有效性,与Naive算法相比,ICFPM算法在时间和空间效率方面得到了大幅度的提高,是解决聚簇频繁模式挖掘的有效方法. 展开更多
关键词 时间有序事务数据 聚簇 频繁模式 数据挖掘 向下闭包
在线阅读 下载PDF
基于改进的FP-tree的频繁模式挖掘算法 被引量:21
7
作者 李也白 唐辉 +1 位作者 张淳 贺玉明 《计算机应用》 CSCD 北大核心 2011年第1期101-103,共3页
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP... FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 fp—growth算法 fp—tree
在线阅读 下载PDF
基于压缩FP-树和数组技术的频繁模式挖掘算法 被引量:16
8
作者 秦亮曦 苏永秀 +1 位作者 刘永彬 梁碧珍 《计算机研究与发展》 EI CSCD 北大核心 2008年第z1期244-249,共6页
FP-growth算法是目前较高效的频繁模式挖掘算法之一.它只需扫描数据库两次,而且不需要产生和测试候选集,避免了这些费时的工作,因此该算法具有较高的效率.然而,FP-growth算法需要递归地生成大量的条件FP-树,这耗费了大量的存储空间和时... FP-growth算法是目前较高效的频繁模式挖掘算法之一.它只需扫描数据库两次,而且不需要产生和测试候选集,避免了这些费时的工作,因此该算法具有较高的效率.然而,FP-growth算法需要递归地生成大量的条件FP-树,这耗费了大量的存储空间和时间.综合已有的几项优势技术,提出了一种频繁模式挖掘算法CFPmine.一是采用了基于压缩FP-树的约束子树的挖掘方法,避免在挖掘过程中生成条件FP-树,减少内存占用;二是采用基于数组的技术,减少FP-树的遍历时间,提高算法的效率.另外,在算法中还实现了统一的内存管理.实验结果表明,CFPmine是一个高效的频繁模式挖掘算法,其性能优于Apriori,Eclat和FP-growth算法,而需要的内存却少于FP-growth算法. 展开更多
关键词 数据挖掘 关联规则 频繁模式 压缩fp-树
在线阅读 下载PDF
基于排序FP-树的频繁模式高效挖掘算法 被引量:13
9
作者 秦亮曦 李谦 史忠植 《计算机科学》 CSCD 北大核心 2005年第4期31-33,共3页
FP-growth算法是目前较高效的频繁模式挖掘算法之一。在FP-growth算法中,FP-树及条件FP-树的构造和遍历占了算法绝大部分的时间,如果能减少这方面的时间,则有望进一步改善算法的效率。本文给出了一个频繁模式挖掘算法SFP-growth。算法... FP-growth算法是目前较高效的频繁模式挖掘算法之一。在FP-growth算法中,FP-树及条件FP-树的构造和遍历占了算法绝大部分的时间,如果能减少这方面的时间,则有望进一步改善算法的效率。本文给出了一个频繁模式挖掘算法SFP-growth。算法通过将FP-树有序化及采用高效排序算法等措施来提高FP-树构造的效率,从而使算法达到较高的效率。实验结果表明,SFP-growth是一个高效的频繁模式挖掘算法,其性能优于Apriori、Eclat和FP-growtn算法。 展开更多
关键词 fp-树 挖掘算法 频繁模式 fp-GROWTH算法 高效 APRIORI 排序算法 有序化 时间 构造 遍历
在线阅读 下载PDF
暴雨雨型对城市排水管网和地表洪涝过程的联合影响 被引量:1
10
作者 高长松 肖洋 +4 位作者 许栋 李彬权 周瑛 徐辉荣 唐洪武 《水资源保护》 北大核心 2025年第4期60-70,共11页
针对气候变化背景下城市暴雨雨型发生变化影响洪涝致灾过程的问题,在广州南沙金洲涌独立排水区构建了基于SWMM和LISFLOOD-FP的单向耦合内涝模型,探讨了雨峰系数分别为0.431(标准雨型)、0.2(雨型Ⅰ)、0.5(雨型Ⅱ)和0.8(雨型Ⅲ)的暴雨内... 针对气候变化背景下城市暴雨雨型发生变化影响洪涝致灾过程的问题,在广州南沙金洲涌独立排水区构建了基于SWMM和LISFLOOD-FP的单向耦合内涝模型,探讨了雨峰系数分别为0.431(标准雨型)、0.2(雨型Ⅰ)、0.5(雨型Ⅱ)和0.8(雨型Ⅲ)的暴雨内涝特征。结果表明:研究区在标准雨型设计暴雨条件下,降雨重现期从2 a提高至100 a时,溢流节点最大流量提高约55%,溢流总量增幅达207%,淹没面积占比从24.2%增加至40.8%;随着降雨重现期的增大,重度淹没区面积显著增加,随着雨峰系数的增大,峰现时间延迟,达到最大淹没面积的滞后时间也越短,淹没面积峰值时刻提前于地表积水总量峰值时刻,且雨峰系数越小提前时间越长;不同雨型设计暴雨条件下,淹没面积与雨峰系数呈正相关关系,淹没面积增长率与降雨重现期呈负相关关系;对称型雨型导致的溢流总量最大,各降雨重现期下雨型Ⅱ的溢流总量较标准雨型平均高出3.765%,最大可高出7.728%;随着降雨重现期从2 a提高至100 a,管网达到超载开始溢流时刻提前15~40 min,超载和溢流时间均延长。 展开更多
关键词 城市内涝 暴雨雨型 雨峰系数 SWMM LISFLOOD-fp 广州市
在线阅读 下载PDF
在FP-树中挖掘频繁模式而不生成条件FP-树 被引量:56
11
作者 范明 李川 《计算机研究与发展》 EI CSCD 北大核心 2003年第8期1216-1222,共7页
FP growth算法是目前已发表的最有效的频繁模式挖掘算法之一 然而 ,由于在挖掘频繁模式时需要递归地生成大量的条件FP 树 ,其时空效率仍然不够高 改进了FP 树结构 ,提出了一种基于被约束子树挖掘频繁项集的有效算法 改进的FP 树是单向... FP growth算法是目前已发表的最有效的频繁模式挖掘算法之一 然而 ,由于在挖掘频繁模式时需要递归地生成大量的条件FP 树 ,其时空效率仍然不够高 改进了FP 树结构 ,提出了一种基于被约束子树挖掘频繁项集的有效算法 改进的FP 树是单向的 ,每个结点只保留指向父结点的指针 ,这大约节省了三分之一的树空间 通过引入被约束子树(可以用 3个很小的数组表示 ) ,算法在挖掘频繁模式时不生成条件FP 树 ,从而大大提高了频繁模式挖掘的时空效率 实验表明 ,与FP growth算法相比 ,算法的挖掘速度提高了 1倍以上 ,而所需的存储空间减少了一半 此外 ,随着数据库规模的增大 ,算法具有很好的可伸缩性 对于稠密数据集 ,算法也具有良好的性能 . 展开更多
关键词 数据挖掘 频繁模式 fp-树
在线阅读 下载PDF
改进的基于频繁模式树的最大频繁项集挖掘算法——FP-MFIA 被引量:16
12
作者 杨鹏坤 彭慧 +1 位作者 周晓锋 孙玉庆 《计算机应用》 CSCD 北大核心 2015年第3期775-778,共4页
针对最大频繁项目集挖掘算法(DMFIA)当候选项目集维数高而最大频繁项目集维数较低的情况下要产生大量的候选项目集的缺点,提出了一种改进的基于频繁模式树(FP-tree)结构的最大频繁项目集挖掘算法——FPMFIA。该算法根据FP-tree的项目头... 针对最大频繁项目集挖掘算法(DMFIA)当候选项目集维数高而最大频繁项目集维数较低的情况下要产生大量的候选项目集的缺点,提出了一种改进的基于频繁模式树(FP-tree)结构的最大频繁项目集挖掘算法——FPMFIA。该算法根据FP-tree的项目头表,采用自底向上的搜索策略逐层挖掘最大频繁项目集,从而加速每次对候选集计数的操作。在挖掘时根据每层的条件模式基产生维数较低的非频繁项目集,尽早对候选项目集进行剪枝和降维,可大量减少候选项目集的数量。同时在挖掘时充分利用最大频繁项集的性质,减少搜索空间。通过算法在不同支持度下挖掘时间的对比可知,算法FP-MFIA在最小支持度较低的情况下时间效率是DMFIA以及基于降维的最大频繁模式挖掘算法(BDRFI)的2倍以上,说明FP-MFIA在候选集维数较高的时候优势明显。 展开更多
关键词 最大频繁项集 频繁模式树 数据挖掘 关联规则 非频繁项集
在线阅读 下载PDF
FP-Growth算法的改进 被引量:25
13
作者 杨云 罗艳霞 《计算机工程与设计》 CSCD 北大核心 2010年第7期1506-1509,共4页
基于FP树的FP-Growth算法在挖掘频繁模式过程中需要两次扫描事务集来建立FP树,这不仅降低了算法的效率,而且给数据库服务器带来负担。在原有经典FP-Growth算法的基础上,提出一种基于二维表的方法对原算法进行改进,改进算法通过使用二维... 基于FP树的FP-Growth算法在挖掘频繁模式过程中需要两次扫描事务集来建立FP树,这不仅降低了算法的效率,而且给数据库服务器带来负担。在原有经典FP-Growth算法的基础上,提出一种基于二维表的方法对原算法进行改进,改进算法通过使用二维向量记录频繁度仅需遍历一次事务集,从而省略FP-Growth算法在生成新条件FP树时对条件模式基的第一次遍历,大大缩短了建立FP树的时间。实验结果表明,该算法的改进优于经典算法。 展开更多
关键词 数据挖掘 关联规则 频繁模式 频繁项集 fp
在线阅读 下载PDF
基于FP-tree的最大频繁模式挖掘算法 被引量:18
14
作者 冯志新 钟诚 《计算机工程》 CAS CSCD 北大核心 2004年第11期123-124,共2页
在FP-tree结构的基础上提出了最大频繁模式挖掘算法FP-Max。算法FP-Max只需要两次数据库扫描,挖掘过程不会产生候选项集。实验表明,算法FP-Max在挖掘密集型数据集方面是高效的。
关键词 数据挖掘 关联规则 频繁模式树 最大频繁模式
在线阅读 下载PDF
基于FP-tree和约束概念格的关联规则挖掘算法及应用研究 被引量:27
15
作者 付冬梅 王志强 《计算机应用研究》 CSCD 北大核心 2014年第4期1013-1015,1019,共4页
现有的基于频繁模式树FP-tree和概念格的规则挖掘算法在构造概念格时存在重复遍历FP-tree问题,在挖掘后件约束的规则时算法构造的概念格包含冗余结点。针对这两个问题,提出了通过遍历FP-tree生成候选概念格节点的策略,并根据候选概念格... 现有的基于频繁模式树FP-tree和概念格的规则挖掘算法在构造概念格时存在重复遍历FP-tree问题,在挖掘后件约束的规则时算法构造的概念格包含冗余结点。针对这两个问题,提出了通过遍历FP-tree生成候选概念格节点的策略,并根据候选概念格节点进一步构造规则约束条件下无冗余概念格。通过实际项目中大气腐蚀数据进行算法的应用,结果表明该算法比现有算法具有更高的挖掘效率且腐蚀规则结果对材料腐蚀现状研究具有重要指导价值。 展开更多
关键词 规则挖掘 频繁模式树 约束概念格 材料腐蚀
在线阅读 下载PDF
基于Spark的并行FP-Growth算法优化与实现 被引量:8
16
作者 陆可 桂伟 +1 位作者 江雨燕 杜萍萍 《计算机应用与软件》 2017年第9期273-278,共6页
频繁模式挖掘作为模式识别的重要问题,一直受到研究者的广泛关注。FP-Growth算法因其高效快速的特点,被大量应用于频繁模式的挖掘任务中。然而,该算法依赖于内存运行的特性,使其难以适应大规模数据计算。针对上述问题,围绕大规模数据集... 频繁模式挖掘作为模式识别的重要问题,一直受到研究者的广泛关注。FP-Growth算法因其高效快速的特点,被大量应用于频繁模式的挖掘任务中。然而,该算法依赖于内存运行的特性,使其难以适应大规模数据计算。针对上述问题,围绕大规模数据集下频繁模式挖掘展开研究,基于Spark框架,通过对支持度计数和分组过程的优化改进了FP-Growth算法,并实现了算法的分布式计算和计算资源的动态分配。运算过程中产生的中间结果均保存在内存中,因此有效减少数据的I/O消耗,提高算法的运行效率。实验结果表明,经优化后的算法在面向大规模数据时要优于传统的FP-Growth算法。 展开更多
关键词 频繁模式挖掘 fp-GROWTH算法 分布式计算 Spark框架
在线阅读 下载PDF
负载均衡的FP-growth并行算法研究 被引量:10
17
作者 曾志勇 杨呈智 陶冶 《计算机工程与应用》 CSCD 北大核心 2010年第4期125-126,229,共3页
针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证... 针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证明,该算法可以完整高效地挖掘频繁模式,并且实现均衡负载。 展开更多
关键词 数据挖掘 并行算法 fp—growth 频繁模式
在线阅读 下载PDF
基于FP-Tree的快速选择性集成算法 被引量:6
18
作者 赵强利 蒋艳凰 徐明 《软件学报》 EI CSCD 北大核心 2011年第4期709-721,共13页
选择性集成通过选择部分基分类器参与集成,从而提高集成分类器的泛化能力,降低预测开销.但已有的选择性集成算法普遍耗时较长,将数据挖掘的技术应用于选择性集成,提出一种基于FP-Tree(frequent pattern tree)的快速选择性集成算法:CPM-E... 选择性集成通过选择部分基分类器参与集成,从而提高集成分类器的泛化能力,降低预测开销.但已有的选择性集成算法普遍耗时较长,将数据挖掘的技术应用于选择性集成,提出一种基于FP-Tree(frequent pattern tree)的快速选择性集成算法:CPM-EP(coverage based pattern mining for ensemble pruning).该算法将基分类器对校验样本集的分类结果组织成一个事务数据库,从而使选择性集成问题可转化为对事务数据集的处理问题.针对所有可能的集成分类器大小,CPM-EP算法首先得到一个精简的事务数据库,并创建一棵FP-Tree树保存其内容;然后,基于该FP-Tree获得相应大小的集成分类器.在获得的所有集成分类器中,对校验样本集预测精度最高的集成分类器即为算法的输出.实验结果表明,CPM-EP算法以很低的计算开销获得优越的泛化能力,其分类器选择时间约为GASEN的1/19以及Forward-Selection的1/8,其泛化能力显著优于参与比较的其他方法,而且产生的集成分类器具有较少的基分类器. 展开更多
关键词 集成学习 选择性集成 频繁模式树 BAGGING 误差反向传播神经网络
在线阅读 下载PDF
基于FP-Tree模型的频繁轨迹模式挖掘方法 被引量:8
19
作者 牛新征 牛嘉郡 +1 位作者 苏大壮 佘堃 《电子科技大学学报》 EI CAS CSCD 北大核心 2016年第1期86-90,134,共6页
通过对经典频繁模式数据结构FP-tree的扩展与改进,提出了一种适用于处理轨迹数据的灵活高效的FP-tree轨迹挖掘方法(NFTM)。首先运用二维筛选和GPS格式过滤的方法对轨迹进行预处理,然后将有效数据经一次扫描后,生成按照真实轨迹顺序排列... 通过对经典频繁模式数据结构FP-tree的扩展与改进,提出了一种适用于处理轨迹数据的灵活高效的FP-tree轨迹挖掘方法(NFTM)。首先运用二维筛选和GPS格式过滤的方法对轨迹进行预处理,然后将有效数据经一次扫描后,生成按照真实轨迹顺序排列且具备时空属性的改进型FP-tree,使用动态数组存储模式挖掘过程中得到的候选集,根据用户的输入针对性输出相应时间和频率范围的频繁轨迹。最后通过与GSP算法、Prefixspan算法的对比测试表明,该算法具有更短执行时间和更优性能。 展开更多
关键词 fp-TREE 频繁轨迹模式 模式挖掘 时空属性
在线阅读 下载PDF
SFPMax——基于排序FP树的最大频繁模式挖掘算法 被引量:26
20
作者 秦亮曦 史忠植 《计算机研究与发展》 EI CSCD 北大核心 2005年第2期217-223,共7页
FP-growth算法是目前较高效的频繁模式挖掘算法之一 ,但将它用于最大频繁模式挖掘时却不能获得较高的效率 深入分析了造成低效的原因 ,提出了利用排序FP 树挖掘最大频繁模式的算法SFP- Max 算法的主要思想如下 :①基于排序FP 树 ;②利... FP-growth算法是目前较高效的频繁模式挖掘算法之一 ,但将它用于最大频繁模式挖掘时却不能获得较高的效率 深入分析了造成低效的原因 ,提出了利用排序FP 树挖掘最大频繁模式的算法SFP- Max 算法的主要思想如下 :①基于排序FP 树 ;②利用最大频繁模式的性质 ,减小产生的候选最大模式的规模 ;③设置中间结果集 ,缩小检验的范围 ,从而减少检验候选最大模式的时间 实验表明 ,SFP -Max是一个高效的最大频繁模式的挖掘算法 ,对于测试的数据集 ,SFP 展开更多
关键词 数据挖掘 关联规则 排序fp-树 最大频繁模式
在线阅读 下载PDF
上一页 1 2 32 下一页 到第
使用帮助 返回顶部