期刊文献+
共找到360篇文章
< 1 2 18 >
每页显示 20 50 100
面向时间有序事务数据的聚簇频繁模式挖掘
1
作者 王少鹏 牛超煜 《软件学报》 北大核心 2025年第5期2342-2361,共20页
首次对时间有序事务数据中聚簇频繁模式的挖掘问题进行研究.为了解决Naive算法处理该问题时存在冗余运算的问题,提出一种改进的聚簇频繁模式挖掘算法ICFPM(improved cluster frequent pattern mining).该算法使用2种优化策略,一方面可... 首次对时间有序事务数据中聚簇频繁模式的挖掘问题进行研究.为了解决Naive算法处理该问题时存在冗余运算的问题,提出一种改进的聚簇频繁模式挖掘算法ICFPM(improved cluster frequent pattern mining).该算法使用2种优化策略,一方面可以利用定义的参数minCF,有效减少挖掘结果的搜索空间,另一方面可以参考(n–1)项集的判别结果加速聚簇频繁n项集的判别过程,算法还使用了ICFPM-list结构来减少候选n项集的构建开销.基于两个真实世界数据集的仿真实验证明了ICFPM算法的有效性,与Naive算法相比,ICFPM算法在时间和空间效率方面得到了大幅度的提高,是解决聚簇频繁模式挖掘的有效方法. 展开更多
关键词 时间有序事务数据 聚簇 频繁模式 数据挖掘 向下闭包
在线阅读 下载PDF
SFPMax——基于排序FP树的最大频繁模式挖掘算法 被引量:26
2
作者 秦亮曦 史忠植 《计算机研究与发展》 EI CSCD 北大核心 2005年第2期217-223,共7页
FP-growth算法是目前较高效的频繁模式挖掘算法之一 ,但将它用于最大频繁模式挖掘时却不能获得较高的效率 深入分析了造成低效的原因 ,提出了利用排序FP 树挖掘最大频繁模式的算法SFP- Max 算法的主要思想如下 :①基于排序FP 树 ;②利... FP-growth算法是目前较高效的频繁模式挖掘算法之一 ,但将它用于最大频繁模式挖掘时却不能获得较高的效率 深入分析了造成低效的原因 ,提出了利用排序FP 树挖掘最大频繁模式的算法SFP- Max 算法的主要思想如下 :①基于排序FP 树 ;②利用最大频繁模式的性质 ,减小产生的候选最大模式的规模 ;③设置中间结果集 ,缩小检验的范围 ,从而减少检验候选最大模式的时间 实验表明 ,SFP -Max是一个高效的最大频繁模式的挖掘算法 ,对于测试的数据集 ,SFP 展开更多
关键词 数据挖掘 关联规则 排序FP-树 最大频繁模式
在线阅读 下载PDF
基于主动学习的模式兴趣评估方法
3
作者 王璐 付勋 +2 位作者 沈玲珍 蒋星 王欣 《南京大学学报(自然科学版)》 北大核心 2025年第2期249-260,共12页
频繁模式挖掘(Frequent Pattern Mining,FPM)是图数据分析、挖掘领域的核心问题之一,其目的是从大规模图数据中发现支持度不低于指定阈值的模式.传统的频繁模式挖掘算法依赖支持度进行剪枝,返回结果往往包含大量“冗余”模式;top-k模式... 频繁模式挖掘(Frequent Pattern Mining,FPM)是图数据分析、挖掘领域的核心问题之一,其目的是从大规模图数据中发现支持度不低于指定阈值的模式.传统的频繁模式挖掘算法依赖支持度进行剪枝,返回结果往往包含大量“冗余”模式;top-k模式挖掘算法虽然仅返回k个频繁模式,但该类算法主要依据“客观”指标,如支持度等,对模式进行评估,难以充分反映用户的主观兴趣偏好.针对上述问题,提出一种基于主动学习的模式兴趣评估方法(Pattern Interestingness Evaluation with Active Learning,PIEAL),通过主动学习策略,从采样图上挖掘的频繁模式中选择代表性模式,并利用有限次人机交互收集用户对这些模式的偏好,进而预测模式的兴趣分数,指导算法发现用户感兴趣的模式.在人机交互环节,PIEAL采用基于成对比较的策略来收集用户对模式的偏好反馈,有效降低了用户的主观评价难度.在真实数据集上的实验结果表明,PIEAL仅需要少量的人机交互便可发现用户感兴趣的模式,其测试集准确率最高可达95%. 展开更多
关键词 主动学习 交互式 频繁模式挖掘 兴趣度
在线阅读 下载PDF
模式感知采样算法研究
4
作者 沈玲珍 王欣 +1 位作者 石俊豪 王璐 《计算机工程与科学》 北大核心 2025年第4期740-750,共11页
图数据规模的迅速膨胀,传统分析技术难以应对,尤其在频繁模式挖掘任务中,传统算法往往面临计算资源崩溃的风险。图采样技术能够有效减小数据体量,并进而降低计算开销,已成为图数据分析任务重要的研究方向。然而,现有的图采样算法对频繁... 图数据规模的迅速膨胀,传统分析技术难以应对,尤其在频繁模式挖掘任务中,传统算法往往面临计算资源崩溃的风险。图采样技术能够有效减小数据体量,并进而降低计算开销,已成为图数据分析任务重要的研究方向。然而,现有的图采样算法对频繁模式挖掘任务的支持存在局限,其原因是这些算法未能充分将图数据的关键属性融入结构特征,从而导致采样质量较低。为此,提出了兼顾图的高频结构与关键属性的模式感知采样PAS算法。PAS依托邻域(局部特征)和高频单边模式(全局特征)对图中节点和边进行加权,随后通过在加权图上的有偏游走,完成采样任务。实验表明,PAS在多项指标上优于基线算法,并且能在采样图上挖掘出与原图高度一致的前B个频繁模式,在采样率仅为0.20的设定下,准确率最高达到94%。 展开更多
关键词 图采样 频繁模式挖掘 聚合 图属性
在线阅读 下载PDF
频繁模式增量维护算法IM-FPM 被引量:1
5
作者 林晓勇 朱群雄 《仪器仪表学报》 EI CAS CSCD 北大核心 2008年第7期1517-1521,共5页
数据挖掘是当今研究的一个热点,传感器实时收集大量的数据,将数据收集与数据挖掘技术结合起来,是现代数据处理技术发展的重要趋势。频繁模式挖掘是数据挖掘中的核心问题,本文针对数据库发生变化时频繁模式挖掘中普遍存在的重复扫描、遍... 数据挖掘是当今研究的一个热点,传感器实时收集大量的数据,将数据收集与数据挖掘技术结合起来,是现代数据处理技术发展的重要趋势。频繁模式挖掘是数据挖掘中的核心问题,本文针对数据库发生变化时频繁模式挖掘中普遍存在的重复扫描、遍历和计算问题,提出了频繁模式的增量维护算法IM-FPM。该算法充分利用已有挖掘结果来提高效率但又完全独立于上次采用的挖掘方法,并且只需对原始数据库进行一次扫描。实验结果表明,该算法能有效地解决数据库发生变化时的频繁模式增量维护问题。 展开更多
关键词 数据挖掘 关联规则 增量维护 频繁模式 数据处理
在线阅读 下载PDF
基于反事实用户行为生成的会话推荐方法
6
作者 卢香葵 邬俊 《电子学报》 北大核心 2025年第4期1264-1278,共15页
为保护用户隐私,许多平台为用户提供了匿名登录选项,迫使推荐系统仅能访问当前会话中的有限用户行为记录,进而催生了会话推荐(Session-Based Recommendation,SBR)系统.现有SBR技术在很大程度上沿用了传统非匿名用户行为建模思路,聚焦于... 为保护用户隐私,许多平台为用户提供了匿名登录选项,迫使推荐系统仅能访问当前会话中的有限用户行为记录,进而催生了会话推荐(Session-Based Recommendation,SBR)系统.现有SBR技术在很大程度上沿用了传统非匿名用户行为建模思路,聚焦于序列建模以习得会话表征.然而,当会话长度偏短时,现有SBR技术性能衰减严重,难以应对以短会话为主的真实会话推荐场景.有鉴于此,提出一种通过频繁模式引导长会话生成的反事实推理方法(Counterfactual inference by frequent pattern guided Long Session Generation,CLSG),试图回答反事实问题:“如果会话内包含更丰富的交互物品,SBR模型预测结果将会如何?”CLSG遵循反事实理论的“归纳-行动-预测”经典三阶段推理流程.“归纳”:从已观测会话集合中构建频繁模式知识库;“行动”:基于所构建知识库生成反事实长会话;“预测”:度量已观测会话和反事实会话预测结果间的差异,并将其作为正则化项并入目标函数,以达到表征一致性的目的 .值得注意的是,CLSG具有模型无关的技术特点,可对现有SBR模型实现普惠式赋能.三个基准数据集上的实验结果表明,CLSG提升了五款现有SBR模型的预测性能,在命中率(Hit Rate,HR)和平均倒数排名(Mean Reciprocal Rank,MRR)评价指标上均取得6%左右的平均性能提升. 展开更多
关键词 会话推荐 反事实推理 频繁模式挖掘 用户行为建模 匿名会话
在线阅读 下载PDF
带频繁区域的空间并置模式挖掘方法
7
作者 罗浩瑜 芦俊丽 陈雪瑶 《计算机应用研究》 北大核心 2025年第7期2086-2095,共10页
聚焦于空间并置模式挖掘,旨在探索空间特征间的共存关系。传统方法虽能识别频繁共存的模式,但无法确定这些模式在空间中的具体分布区域。为了解决这一问题,提出了一种新颖的带频繁区域的空间并置模式挖掘算法。算法分为两个阶段,第一阶... 聚焦于空间并置模式挖掘,旨在探索空间特征间的共存关系。传统方法虽能识别频繁共存的模式,但无法确定这些模式在空间中的具体分布区域。为了解决这一问题,提出了一种新颖的带频繁区域的空间并置模式挖掘算法。算法分为两个阶段,第一阶段采用凝聚层次聚类方法,根据数据特性进行空间分区,进而在各聚类簇内确认实例间的邻近关系;第二阶段引入了并置模式存在区域与区域参与度概念,基于此逐阶识别并置模式的频繁区域。为加速频繁区域识别和模式挖掘过程,算法通过子模式的扩展区域快速构建高阶模式的候选区域,利用区域粗参与度提前筛除不可能频繁的候选区域。最后,通过在真实和模拟数据集上进行广泛的实验,验证了该算法在生成带频繁区域的空间并置模式数量、频繁区域的准确性以及频繁区域的精确度方面的表现。在真实数据集上,该算法的精确度为0.83~0.95。此外,在验证算法可扩展性的实验中,当数据集特征数量适中时,PROC-Col的性能较现有的先进算法multi-level提升了约2倍。 展开更多
关键词 空间并置模式挖掘 频繁区域 候选区域 拓展区域 区域粗参与度
在线阅读 下载PDF
一种基于关联程度的高效用数量比频繁模式挖掘算法 被引量:1
8
作者 王辉 李燕 +2 位作者 丁丁 吴坤 黄雅平 《计算机工程与科学》 CSCD 北大核心 2024年第9期1702-1710,共9页
高效用频繁模式挖掘算法运用数据项的重要度信息,能够从数据中挖掘出更重要的频繁模式,而高效用数量比频繁模式挖掘算法可以进一步研究频繁模式中数据项的数量比例关系,是目前数据挖掘领域中的研究课题。从提高算法性能和实用性的角度... 高效用频繁模式挖掘算法运用数据项的重要度信息,能够从数据中挖掘出更重要的频繁模式,而高效用数量比频繁模式挖掘算法可以进一步研究频繁模式中数据项的数量比例关系,是目前数据挖掘领域中的研究课题。从提高算法性能和实用性的角度出发对高效用数量比频繁模式挖掘算法进行优化,提出了一种基于关联程度的高效用数量比频繁模式挖掘算法RHUQI-Miner。RHUQI-Miner首先提出关联程度的概念,依据关联程度构建项目关联程度结构,并给出关联剪枝优化策略,寻找关联程度更高的项目集合,减少冗余和无效的频繁模式;随后运用修正模式长度策略,修正挖掘过程中项集的效用信息,使算法可根据实际数据情况控制输出频繁模式的长度,进一步提升算法的性能,提高算法的实用性。通过对RHUQI-Miner在动车组PHM系统车载故障数据集上的实验结果进行分析,表明该算法能够有效减少挖掘过程中的时间以及内存消耗,可以得出该算法适用于铁路实际数据和业务的有效结论。 展开更多
关键词 高效用 数量比 频繁模式挖掘 关联剪枝 修正模式长度
在线阅读 下载PDF
基于频繁模式挖掘算法的中医问诊策略研究
9
作者 李瑞珍 夏春明 +2 位作者 王忆勤 许朝霞 熊玉洁 《世界科学技术-中医药现代化》 CSCD 北大核心 2024年第6期1608-1617,共10页
目的研究中医问诊策略,实现快速捕捉患者的关键病情信息,推进中医问诊客观化的发展。方法采用基于关联分析中频繁模式挖掘算法的症状提问模型,并使用交叉合并的方法建立中医单系统症状提问与多系统综合症状提问的中医症状问诊策略,达到... 目的研究中医问诊策略,实现快速捕捉患者的关键病情信息,推进中医问诊客观化的发展。方法采用基于关联分析中频繁模式挖掘算法的症状提问模型,并使用交叉合并的方法建立中医单系统症状提问与多系统综合症状提问的中医症状问诊策略,达到通过最短的时间、最高的效率来获取到患者关键病情信息。结果实现了从单系统问诊到五系统综合问诊的突破,通过单系统与五系统两种症状提问模式实现了高效获取患者病情信息的过程,且对比传统量表提问方式,系统减少了65%的提问次数就可获取到患者92%的症状信息,大大提高了对患者症状信息获取的效率。结论在两种不同的症状提问模式下,打破了中医基于量表来询问患者的传统问诊模式,缩短了对患者症状获取的时间,简化了问诊流程,减少了由于经验不足或人为主观造成的差异,能够用于中医临床辅助诊断中。 展开更多
关键词 中医问诊 频繁模式挖掘算法 症状关联性 问诊策略
在线阅读 下载PDF
基于滑动窗口含负项的高效用模式挖掘
10
作者 武妍 荀亚玲 马煜 《计算机工程与设计》 北大核心 2024年第3期845-851,共7页
针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW。利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有... 针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW。利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有效的逐批次挖掘,避免重复的数据库扫描,在不产生候选效用模式集的情况下,直接挖掘出高效用模式,使HUPN_SW有效适应于动态流数据。实验结果表明,HUPN_SW算法在运行时间和可扩展性方面有良好表现。 展开更多
关键词 频繁模式挖掘 滑动窗口 高效用模式挖掘 高效用项集 负效用 流数据 效用列表
在线阅读 下载PDF
面向大图的Top-Rank-K频繁模式挖掘算法 被引量:2
11
作者 邹杰军 王欣 +5 位作者 石俊豪 兰卓 方宇 张翀 谢文波 沈玲珍 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期38-52,共15页
频繁模式挖掘(Frequent Pattern Mining,FPM)在社交分析中扮演重要角色,能从海量社交数据中挖掘用户行为的模式和规律,为社交网络的研究提供新的认识和决策支持.然而,对于一个FPM任务,设置一个合适的支持度阈值不容易;此外,FPM作为一个N... 频繁模式挖掘(Frequent Pattern Mining,FPM)在社交分析中扮演重要角色,能从海量社交数据中挖掘用户行为的模式和规律,为社交网络的研究提供新的认识和决策支持.然而,对于一个FPM任务,设置一个合适的支持度阈值不容易;此外,FPM作为一个NP-hard问题,不存在多项式时间的算法.针对上述问题,提出一种无须用户设置初始支持度阈值的算法ItrMiner.该算法使用一种新的兴趣度指标对模式进行评估,综合考虑模式的大小和支持度,挖掘Top-Rank-K频繁模式.同时,为了解决去除初始支持度阈值后在算法剪枝阶段遇到的困难,提出基于树模式优先识别的策略和模式扩展约束策略,减少非必要候选模式的生成.在真实图和人工合成图数据集上进行了广泛的实验,证明ItrMiner在执行效率和可扩展性方面表现出色,尤其在稠密的数据集上,其时间开销仅为基线算法Top-K Graph Miner的13.2%.另外,提出的模式扩展约束策略的有效性较高,和无扩展约束优化的ItrMiner_(nopt)算法相比,效率提升最高可达9.5倍. 展开更多
关键词 频繁模式挖掘 社交分析 支持度阈值 兴趣度
在线阅读 下载PDF
频繁时序模式挖掘方法综述 被引量:2
12
作者 唐增金 徐贞顺 +3 位作者 苏梦瑶 刘纳 王振彪 张文豪 《计算机工程与应用》 CSCD 北大核心 2024年第17期48-61,共14页
频繁时序模式挖掘是指从时间序列数据中发现频繁出现的模式或规律的过程,其目的是可以帮助理解时间序列数据中的重要特征,例如周期性、趋势和异常等,有助于预测未来的发展趋势和识别异常情况等。根据近年来的频繁时序模式挖掘方法的相... 频繁时序模式挖掘是指从时间序列数据中发现频繁出现的模式或规律的过程,其目的是可以帮助理解时间序列数据中的重要特征,例如周期性、趋势和异常等,有助于预测未来的发展趋势和识别异常情况等。根据近年来的频繁时序模式挖掘方法的相关文献调研,按照关键技术和代表性算法将其分为三类,即基于结构约束的频繁时序模式挖掘方法、基于参数约束的频繁时序模式挖掘方法和基于窗口的频繁时序模式挖掘方法。陈述了频繁时序模式挖掘方法的背景以及各方法的特点;分别介绍了三类挖掘方法的发展以及分类,并从优缺点和性能等方面对各类改进方法进行了详细的对比分析;对频繁时序模式挖掘方法进行归纳和总结,并对频繁时序模式挖掘方法的未来研究方向进行了展望。 展开更多
关键词 时序数据 频繁时序模式 结构约束 参数约束 窗口 数据挖掘
在线阅读 下载PDF
基于时效性和相关性约束的周期模式挖掘
13
作者 闫海博 荀亚玲 +2 位作者 任姿芊 侯亚飞 胡晓莹 《计算机应用研究》 CSCD 北大核心 2024年第4期1064-1069,共6页
传统周期模式挖掘忽略了模式本身的相关性和时效性,导致获取到一些实用价值有限的弱相关且时效性较低的模式。因此,提出了新颖的基于时效性和相关性约束的周期模式挖掘方法(correlation and recency periodic frequent pattern-breadth ... 传统周期模式挖掘忽略了模式本身的相关性和时效性,导致获取到一些实用价值有限的弱相关且时效性较低的模式。因此,提出了新颖的基于时效性和相关性约束的周期模式挖掘方法(correlation and recency periodic frequent pattern-breadth first search,CRPFP-BFS)和(correlation and recency periodic frequent pattern-depth first search,CRPFP-DFS)。将给定的数据库压缩到一个列式结构的列表CRPFP-List中,CRPFP-BFS和CRPFP-DFS分别采用广度优先和深度优先搜索方式递归地进行挖掘,同时利用支持度、周期、时效性以及相关性剪枝策略减少搜索空间,以有效地发现相关时效周期模式。与当前最先进算法在密集数据集和稀疏数据集上进行对比实验,结果表明CRPFP-BFS和CRPFP-DFS具有较低的内存占用和更高的运行效率,并且具有良好的可扩展性,其中CRPFP-DFS适合于内存要求严格的情况,CRPFP-BFS在长事务稀疏数据集下的运行效率更高。 展开更多
关键词 频繁模式挖掘 周期模式 相关时效周期模式 相关性 时效性
在线阅读 下载PDF
大图中多样化Top-k模式挖掘算法研究 被引量:1
14
作者 何宇昂 王欣 沈玲珍 《计算机科学》 CSCD 北大核心 2024年第5期70-84,共15页
频繁模式挖掘(Frequent Pattern Mining,FPM)是图数据挖掘领域的一项重要任务。该任务的目标是从图数据中找到出现频次大于给定阈值的所有模式。近年来,随着社交网络等大规模图数据的涌现,单一大图上的FPM问题受到广泛关注,并得到了较... 频繁模式挖掘(Frequent Pattern Mining,FPM)是图数据挖掘领域的一项重要任务。该任务的目标是从图数据中找到出现频次大于给定阈值的所有模式。近年来,随着社交网络等大规模图数据的涌现,单一大图上的FPM问题受到广泛关注,并得到了较为充分的研究,取得了一系列研究成果。然而,已有技术大都存在着计算成本高、挖掘结果理解困难以及并行计算难等问题。针对上述问题,文中提出了一种从大规模图数据中挖掘多样化top-k模式的方法。首先设计了一个多样化函数,用于度量模式集合的多样性;随后设计了一种面向分布式图数据,具有提前终止特性的分布式挖掘算法DisTopk,以实现多样化top-k模式高效挖掘。在真实图数据和合成图数据上进行了大量实验,结果表明,与传统分布式挖掘算法相比,DisTopk算法能更高效地挖掘多样化top-k模式。 展开更多
关键词 频繁模式挖掘 Top-k模式 结果多样性 分布式挖掘 提前终止
在线阅读 下载PDF
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
15
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树 增量式更新
在线阅读 下载PDF
带通配符和One-Off条件的序列模式挖掘 被引量:23
16
作者 吴信东 谢飞 +2 位作者 黄咏明 胡学钢 高隽 《软件学报》 EI CSCD 北大核心 2013年第8期1804-1815,共12页
很多应用领域产生大量的序列数据.如何从这些序列数据中挖掘具有重要价值的模式,已成为序列模式挖掘研究的主要任务.研究这样一个问题:给定序列S、支持度阈值和间隔约束,从序列S中挖掘所有出现次数不小于给定支持度阈值的频繁序列模式,... 很多应用领域产生大量的序列数据.如何从这些序列数据中挖掘具有重要价值的模式,已成为序列模式挖掘研究的主要任务.研究这样一个问题:给定序列S、支持度阈值和间隔约束,从序列S中挖掘所有出现次数不小于给定支持度阈值的频繁序列模式,并且要求模式中任意两个相邻元素在序列中的出现位置满足用户定义的间隔约束.设计了一种有效的带有通配符的模式挖掘算法One-Off Mining,模式在序列中的出现满足One-Off条件,即模式的任意两次出现都不共享序列中同一位置的字符.在生物DNA序列上的实验结果表明,One-Off Mining比相关的序列模式挖掘算法具有更好的时间性能和完备性. 展开更多
关键词 数据挖掘 序列模式挖掘 频繁模式 通配符 One-Off条件
在线阅读 下载PDF
ESPM——频繁子树挖掘算法 被引量:18
17
作者 朱永泰 王晨 +2 位作者 洪铭胜 汪卫 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1720-1727,共8页
随着互联网的发展 ,频繁模式的挖掘由频繁项集扩展到结构化数据 :树和图 在这些结构上的挖掘工作被应用于更为复杂的领域 ,比如生物信息学、网络日志和XML文档 提出了一个新颖的算法 :ESPM ,以挖掘有序标号树中的频繁子树 不同于以往... 随着互联网的发展 ,频繁模式的挖掘由频繁项集扩展到结构化数据 :树和图 在这些结构上的挖掘工作被应用于更为复杂的领域 ,比如生物信息学、网络日志和XML文档 提出了一个新颖的算法 :ESPM ,以挖掘有序标号树中的频繁子树 不同于以往的工作 ,把树同构的判断工作放到了算法的晚期 ,从而减少了整个挖掘过程的时间开销 人工数据集和真实数据集上的实验都证明ESPM相较于其他算法的优越性 展开更多
关键词 数据挖掘 频繁模式 频繁子树 ESPM
在线阅读 下载PDF
基于特征挖掘的电网故障诊断方法 被引量:46
18
作者 李再华 白晓民 +5 位作者 周子冠 许婧 李晓珺 张霖 孟珺遐 朱宁辉 《中国电机工程学报》 EI CSCD 北大核心 2010年第10期16-22,共7页
专家系统在应用方面的主要瓶颈是:规则库的维护;推理的速度和准确度的协调。分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的关联规则挖掘方法。结合电网故障信息的特征,改进了频繁模式(frequent pattern,FP)–算法:考虑了... 专家系统在应用方面的主要瓶颈是:规则库的维护;推理的速度和准确度的协调。分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的关联规则挖掘方法。结合电网故障信息的特征,改进了频繁模式(frequent pattern,FP)–算法:考虑了故障信息的特征,如时序和因果关联关系、故障性质、严重故障、稀有故障等因素;增加了规则的"或"逻辑;改进了FP-树的修剪技术。算例表明该算法能够大量减少无效挖掘,推理速度和准确度显著提高,适用于在线诊断。 展开更多
关键词 数据挖掘 关联规则 特征挖掘 频繁模式一算法 故障诊断 专家系统
在线阅读 下载PDF
一种基于栈变换的高效关联规则挖掘算法 被引量:15
19
作者 惠晓滨 张凤鸣 +1 位作者 虞健飞 牛世民 《计算机研究与发展》 EI CSCD 北大核心 2003年第2期330-335,共6页
在一个模式信息保全引理的基础上 ,提出了一个基于频繁模式栈变换的关联规则挖掘算法FPST ,给出了相应的栈构造和栈变换的算法描述 ,并进行了算法的性能分析和比较试验 。
关键词 栈变换 高效关联规则挖掘算法 数据库 数据挖掘算法 频繁模式 关联规则
在线阅读 下载PDF
一种高效频繁子图挖掘算法 被引量:35
20
作者 李先通 李建中 高宏 《软件学报》 EI CSCD 北大核心 2007年第10期2469-2480,共12页
由于在频繁项集和频繁序列上取得的成功,数据挖掘技术正在着手解决结构化模式挖掘问题——频繁子图挖掘.诸如化学、生物学、计算机网络和WWW等应用技术都需要挖掘此类模式.提出了一种频繁子图挖掘的新算法.该算法通过对频繁子树的扩展,... 由于在频繁项集和频繁序列上取得的成功,数据挖掘技术正在着手解决结构化模式挖掘问题——频繁子图挖掘.诸如化学、生物学、计算机网络和WWW等应用技术都需要挖掘此类模式.提出了一种频繁子图挖掘的新算法.该算法通过对频繁子树的扩展,避免了图挖掘过程中高代价的计算过程.目前最好的频繁子图挖掘算法的时间复杂性是O(n3·2n),其中,n是图集中的频繁边数.提出算法的时间复杂性是O[2n·n2.5/logn],性能提高了O((1/2)n·logn)倍.实验结果也证实了这一理论分析. 展开更多
关键词 频繁模式挖掘 子图同构 子树同构 频繁子树 生成树
在线阅读 下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部