期刊文献+
共找到114篇文章
< 1 2 6 >
每页显示 20 50 100
基于图重构和子图挖掘的僵尸网络检测方法
1
作者 景永俊 吴悔 +1 位作者 陈旭 宋吉飞 《郑州大学学报(工学版)》 CAS 北大核心 2025年第1期34-41,共8页
针对伪装后僵尸网络主机难以检测的问题,提出一种基于图重构和子图挖掘的僵尸网络检测方法(GR-SGM)。首先,将网络数据转化为图数据,并对其进行重构以此增强主机节点特征表示;其次,基于重构图中拓扑结构、节点的特征和位置变化设计僵尸... 针对伪装后僵尸网络主机难以检测的问题,提出一种基于图重构和子图挖掘的僵尸网络检测方法(GR-SGM)。首先,将网络数据转化为图数据,并对其进行重构以此增强主机节点特征表示;其次,基于重构图中拓扑结构、节点的特征和位置变化设计僵尸网络子图评分函数,以此捕捉伪装后的特征,提取出僵尸网络子图,并对原始图和重构图进行预检测,以提高检测的准确率和效率,减少重构误差;最后,对预检测结果和僵尸网络子图进行综合评分,以获取完整的僵尸网络信息。在ISCX2014僵尸网络数据集和CICIDS2017僵尸网络数据集上的实验结果表明:GR-SGM的检测准确率分别达到99.98%和99.91%,F 1分别达到99.94%和99.65%,相较于其他僵尸网络检测模型,GR-SGM能更加高效准确地识别僵尸网络节点,同时具有更低的误报率。 展开更多
关键词 僵尸网络 挖掘 重构 网络安全 预检测
在线阅读 下载PDF
多源图结构挖掘的RV减速器故障诊断方法
2
作者 王梦迪 刘畅 +2 位作者 贺飞飞 柳小勤 王之海 《机械科学与技术》 北大核心 2025年第8期1418-1425,共8页
RV减速器作为应用广泛的高效率、高精度传动装置,对其进行智能诊断对于保障设备运行至关重要。但因其结构复杂、工况时变,使得对其故障诊断存在很大挑战。因此,本文提出一种基于多源图结构挖掘的RV减速器故障诊断方法。首先挖掘三轴数... RV减速器作为应用广泛的高效率、高精度传动装置,对其进行智能诊断对于保障设备运行至关重要。但因其结构复杂、工况时变,使得对其故障诊断存在很大挑战。因此,本文提出一种基于多源图结构挖掘的RV减速器故障诊断方法。首先挖掘三轴数据特征非线性关联,构造多源图结构特征集;然后基于图分类任务构造节点嵌入的双卷积图神经网络,提升时变工况下故障诊断的准确率;最后采用自制试验台进行方法验证。结果表明,所提方法能够从三轴传感器数据中有效挖掘图特征,在诊断性能与准确率方面具有很大提升。 展开更多
关键词 RV减速器 结构挖掘 多源结构特征集 卷积神经网络
在线阅读 下载PDF
语义信息提取和图结构挖掘的事件骨架生成方法
3
作者 黄凯 马廷淮 +3 位作者 孙圣杰 龚智恒 汤毅翔 陈思 《计算机工程与应用》 北大核心 2025年第12期187-195,共9页
事件骨架生成旨在从一系列的事件图中归纳出包含事件类型及其时序关系的事件骨架图。这是在时间复杂事件模式归纳任务中的一个核心步骤。尽管现有的方法在这项任务上已经取得了一定的效果,但是由于事件图的复杂性和多变性,这些方法在挖... 事件骨架生成旨在从一系列的事件图中归纳出包含事件类型及其时序关系的事件骨架图。这是在时间复杂事件模式归纳任务中的一个核心步骤。尽管现有的方法在这项任务上已经取得了一定的效果,但是由于事件图的复杂性和多变性,这些方法在挖掘事件图的结构信息和语义信息方面仍显不足。因此,为解决该问题,提出了一种事件骨架生成模型。在图编码阶段,模型使用了拉普拉斯位置编码,以精准捕捉和编码图结构的局部信息。同时,模型采用了多头注意力机制和图卷积网络,以提取语义信息和图结构信息,全面总结事件发展的全局结构信息,构建出更泛化、更全面的事件骨架图。实验证明,在事件骨架生成任务上,该模型在Event Match指标上提升了8.83%,Event Sequence Match指标上提升了11.2%(L=2)和7.6%(L=3),实现了较大的性能提升。 展开更多
关键词 事件模式归纳 事件骨架生成 生成 语义信息提取 结构挖掘
在线阅读 下载PDF
犯罪组织的图数据挖掘实训设计
4
作者 朱涛 高光亮 +1 位作者 夏玲玲 梁广俊 《实验技术与管理》 北大核心 2025年第8期62-72,共11页
随着犯罪组织的活动形态和行动模式呈现出大数据特征,对公共安全管理工作提出了新挑战,迫切需要掌握针对犯罪组织的数据分析技术手段。针对犯罪网络分析这一新的研究领域缺乏教学实训的实际,该文设计了一个犯罪网络图数据挖掘实训方案:... 随着犯罪组织的活动形态和行动模式呈现出大数据特征,对公共安全管理工作提出了新挑战,迫切需要掌握针对犯罪组织的数据分析技术手段。针对犯罪网络分析这一新的研究领域缺乏教学实训的实际,该文设计了一个犯罪网络图数据挖掘实训方案:首先,构建了基于数据的犯罪网络交互式实训分析框架;其次,通过剖析犯罪活动基本二元结构,引导学生从多关系多属性角度扩展图概念,用集合的方式对犯罪组织进行形式化描述和建模;再次,以报案笔录的共现分析为例,提出一种基于共现方法的实体关联提取实验方法;最后,构建了犯罪组织网络特性指标,从全局和局部角度对犯罪网络进行特性分析,研究了网络度中心性对犯罪组织结构的影响,实现了对犯罪组织网络特性的提取。教学实践表明,学生通过该实训方案能较快掌握犯罪组织的网络分析基本流程、基础方法和实用技能。 展开更多
关键词 犯罪网络分析 挖掘 复杂网络
在线阅读 下载PDF
面向时序图的季节突发性子图挖掘算法 被引量:1
5
作者 张千桢 郭得科 赵翔 《软件学报》 EI CSCD 北大核心 2024年第12期5526-5543,共18页
时序图是一类边上带有时间戳信息的图.在时序图中,季节突发性子图是在多个时间周期内具有突发性特征的稠密子图,它可以用于社交网络中的活动发现和群体关系分析.然而以前大多数的研究主要集中在识别没有时间信息的网络中的稠密子图.为此... 时序图是一类边上带有时间戳信息的图.在时序图中,季节突发性子图是在多个时间周期内具有突发性特征的稠密子图,它可以用于社交网络中的活动发现和群体关系分析.然而以前大多数的研究主要集中在识别没有时间信息的网络中的稠密子图.为此,提出一种极大(ω,θ)-稠密子图模型对时序图中的季节突发性子图进行建模.所提模型表示时序图中在至少ω个长度不小于θ的时间段内快速累积密度的子图.为了挖掘出时序图中所有的极大(ω,θ)-稠密子图,将该类挖掘问题转化为一个混合的整数规划问题,包括挖掘最稠密子图和寻找突发值最大化时间段集合两个子问题,并给出有效的解决方案.进一步基于key-核模型和动态规划思想设计两种优化策略来提升算法的性能.实验表明所提模型能够真实地反映现实世界中具有季节突发性的行为模式.同时在5个真实时序网络中验证了所提算法的有效性、效率和可扩展性. 展开更多
关键词 时序 稠密子 季节突发性 挖掘 时间段
在线阅读 下载PDF
基于图挖掘的黑灰产运作模式可视分析 被引量:2
6
作者 尚思佳 陈晓淇 +3 位作者 林靖淞 林睫菲 李臻 刘延华 《信息安全研究》 CSCD 北大核心 2024年第1期48-54,共7页
为分析黑灰产网络资产图谱数据中黑灰产团伙掌握的网络资产及其关联关系,提出一种基于图挖掘的黑灰产运作模式可视分析方法.首先,在网络资产图谱数据中锁定潜在团伙线索;其次,根据潜在线索、黑灰产业务规则挖掘由同一黑灰产团伙掌握的... 为分析黑灰产网络资产图谱数据中黑灰产团伙掌握的网络资产及其关联关系,提出一种基于图挖掘的黑灰产运作模式可视分析方法.首先,在网络资产图谱数据中锁定潜在团伙线索;其次,根据潜在线索、黑灰产业务规则挖掘由同一黑灰产团伙掌握的网络资产子图,并识别子图中的核心资产与关键链路;最后,基于标记核心资产和关键链路的黑灰产子图实现可视分析系统,从而直观发现黑灰产团伙掌握的网络资产及其关联关系,帮助分析人员制定黑灰产网络资产打击策略.经实验验证,该方法能有效、直观地分析和发现黑灰产团伙及其网络资产关联关系,为更好监测黑灰产网络运作态势提供必要的技术支持. 展开更多
关键词 黑灰产 网络资产 挖掘 关键链路 可视分析
在线阅读 下载PDF
面向二部图的极大缺陷二团高效枚举算法
7
作者 代强强 于瀚文 +2 位作者 李荣华 李振军 王国仁 《软件学报》 北大核心 2025年第4期1796-1810,共15页
极大二团枚举问题是二部图分析中的一个基本研究问题.然而,在实际应用中,传统二团模型要求子图必须为完全二部图的约束往往过于严格,因此需要一些更为宽松的二团模型作为代替.为此,提出一种新的称之为k-缺陷二团的松弛二团模型.该模型... 极大二团枚举问题是二部图分析中的一个基本研究问题.然而,在实际应用中,传统二团模型要求子图必须为完全二部图的约束往往过于严格,因此需要一些更为宽松的二团模型作为代替.为此,提出一种新的称之为k-缺陷二团的松弛二团模型.该模型允许二部图子图与完全子图二团最多相差k条边.由于极大k-缺陷二团枚举问题属于NP-难问题,设计高效的枚举算法是一项极具挑战性的任务.为解决此问题,提出一种基于对称集合枚举的算法.该算法的思想是通过k-缺陷二团中缺失边的数量约束来控制子分支的数量.为进一步提高计算效率,还提出一系列优化技术,包括基于排序的子图划分方法、基于上界的剪枝方法、基于线性时间的更新技术以及分支的优化方法.此外,提出的优化算法的时间复杂度与量的实验结果表明,在大部分参数条件下所提方法的效率相较于传统分支定界方法提高了100倍以上. 展开更多
关键词 二部 稠密子挖掘 k-缺陷二团
在线阅读 下载PDF
从不确定图中挖掘频繁子图模式 被引量:33
8
作者 邹兆年 李建中 +1 位作者 高宏 张硕 《软件学报》 EI CSCD 北大核心 2009年第11期2965-2976,共12页
研究不确定图数据的挖掘,主要解决不确定图数据的频繁子图模式挖掘问题.介绍了一种数据模型来表示图的不确定性,以及一种期望支持度来评价子图模式的重要性.利用期望支持度的Apriori性质,给出了一种基于深度优先搜索策略的挖掘算法.该... 研究不确定图数据的挖掘,主要解决不确定图数据的频繁子图模式挖掘问题.介绍了一种数据模型来表示图的不确定性,以及一种期望支持度来评价子图模式的重要性.利用期望支持度的Apriori性质,给出了一种基于深度优先搜索策略的挖掘算法.该算法使用高效的期望支持度计算方法和搜索空间裁剪技术,使得计算子图模式的期望支持度所需的子图同构测试的数量从指数级降低到线性级.实验结果表明,该算法比简单的深度优先搜索算法快3-5个数量级,有很高的效率和可扩展性. 展开更多
关键词 不确定 挖掘 频繁子模式
在线阅读 下载PDF
利用MapReduce平台实现高效并行的频繁子图挖掘 被引量:4
9
作者 孙鹤立 陈强 +2 位作者 刘玮 黄健斌 邹建华 《计算机科学与探索》 CSCD 2014年第7期790-801,共12页
频繁子图挖掘是数据挖掘领域的一个重要问题,并且有着广泛的应用。在Hadoop平台上实现了一种基于MapReduce的高效频繁子图挖掘算法Cloud-GFSG(cloud-global frequent subgraph)。该算法基于Apriori思想,在扩展边生成新的子图时,使用已... 频繁子图挖掘是数据挖掘领域的一个重要问题,并且有着广泛的应用。在Hadoop平台上实现了一种基于MapReduce的高效频繁子图挖掘算法Cloud-GFSG(cloud-global frequent subgraph)。该算法基于Apriori思想,在扩展边生成新的子图时,使用已经挖掘出的k-1阶的频繁子图生成k阶的频繁子图。同时,检查是否存在待扩展生成的子图,设定生成的频繁子图表示规则,保证了频繁子图信息的唯一性。较同类算法相比,该算法在挖掘频繁子图时更具通用性,并且在扩展边时避免产生大量的复制图,从而使得算法的正确性得以保证,且运行效率显著提高。 展开更多
关键词 频繁子挖掘 MAPREDUCE HADOOP平台
在线阅读 下载PDF
从图数据库中挖掘频繁跳跃模式 被引量:10
10
作者 刘勇 李建中 高宏 《软件学报》 EI CSCD 北大核心 2010年第10期2477-2493,共17页
很多频繁子图挖掘算法已被提出.然而,这些算法产生的频繁子图数量太多而不能被用户有效地利用.为此,提出了一个新的研究问题:挖掘图数据库中的频繁跳跃模式.挖掘频繁跳跃模式既可以大幅度地减少输出模式的数量,又能使有意义的图模式保... 很多频繁子图挖掘算法已被提出.然而,这些算法产生的频繁子图数量太多而不能被用户有效地利用.为此,提出了一个新的研究问题:挖掘图数据库中的频繁跳跃模式.挖掘频繁跳跃模式既可以大幅度地减少输出模式的数量,又能使有意义的图模式保留在挖掘结果中.此外,跳跃模式还具有抗噪声干扰能力强等优点.然而,由于跳跃模式不具有反单调性质,挖掘它们非常具有挑战性.通过研究跳跃模式自身的特性,提出了两种新的裁剪技术:基于内扩展的裁剪和基于外扩展的裁剪.在此基础上又给出了一种高效的挖掘算法GraphJP(an algorithm for mining jump patterns from graph databases).另外,还严格证明了裁剪技术和算法GraphJP的正确性.实验结果表明,所提出的裁剪技术能够有效地裁剪图模式搜索空间,算法GraphJP是高效、可扩展的. 展开更多
关键词 数据挖掘 挖掘 数据库 频繁子 跳跃模式
在线阅读 下载PDF
基于时间序列图挖掘的网络流量异常检测 被引量:9
11
作者 周颖杰 胡光岷 贺伟淞 《计算机科学》 CSCD 北大核心 2009年第1期46-50,共5页
网络流量异常检测要解决的核心问题之一是获得信息的全面性和流量信息描述的准确性。针对现有网络异常流量检测方法分析多时间序列的不足,提出了一种基于图挖掘的流量异常检测方法。该方法使用时间序列图准确、全面地描述用于流量异常... 网络流量异常检测要解决的核心问题之一是获得信息的全面性和流量信息描述的准确性。针对现有网络异常流量检测方法分析多时间序列的不足,提出了一种基于图挖掘的流量异常检测方法。该方法使用时间序列图准确、全面地描述用于流量异常检测的多时间序列的相互关系;通过对项集模式进行支持度计数,挖掘各种频繁项集模式,有利于对各种异常流量的有效检测;通过挖掘各项集之间的关系,引入了项集的权重系数,解决了流量异常检测的多时间序列相互关系的量化问题。仿真结果表明,该方法能有效地检测出网络流量异常,并且对DDos攻击的检测效果明显优于基于连续小波变换的检测方法。 展开更多
关键词 网络流量异常检测 多时间序列 挖掘
在线阅读 下载PDF
基于最大频繁子图挖掘的动态污点分析方法 被引量:6
12
作者 郭方方 王欣悦 +5 位作者 王慧强 吕宏武 胡义兵 吴芳 冯光升 赵倩 《计算机研究与发展》 EI CSCD 北大核心 2020年第3期631-638,共8页
目前,传统面向恶意代码识别的动态污点分析方法广泛存在行为依赖图数量巨大、匹配时间消耗长的问题.提出一种动态污点分析方法——基于最大频繁子图挖掘的动态污点分析方法.该方法从恶意代码家族行为依赖图挖掘出代表家族显著共性特征... 目前,传统面向恶意代码识别的动态污点分析方法广泛存在行为依赖图数量巨大、匹配时间消耗长的问题.提出一种动态污点分析方法——基于最大频繁子图挖掘的动态污点分析方法.该方法从恶意代码家族行为依赖图挖掘出代表家族显著共性特征的最大频繁子图,被挖掘出的最大频繁子图即为某类恶意代码家族以及该家族所有变种之间最为突出的共有特征,使用挖掘出的最大频繁子图与被测行为依赖图进行比较匹配即可.既能够保证原有恶意代码特征无丢失又削减了行为依赖图数量,并在此基础上进一步提升了识别效率.经实验分析,提出的这种新的动态污点分析方法相比于传统方法,当最小支持度为0.045时,行为依赖图数量减少了82%,识别效率提高了81.7%,准确率达到了92.15%. 展开更多
关键词 恶意代码识别 恶意代码家族 动态污点分析 行为依赖 最大频繁子挖掘
在线阅读 下载PDF
基于数据流的大图中频繁模式挖掘算法研究 被引量:7
13
作者 汤小春 樊雪枫 +1 位作者 周佳文 李战怀 《计算机学报》 EI CSCD 北大核心 2020年第7期1293-1311,共19页
随着单个图数据规模的扩大以及应用领域的扩展,大规模单图的频繁模式挖掘的需求越来越强烈.传统的单机环境已经无法满足大规模图数据挖掘的要求,而现有的并行或者分布式环境下的挖掘方法,普遍受到并行性以及数据倾斜等问题的限制,论文... 随着单个图数据规模的扩大以及应用领域的扩展,大规模单图的频繁模式挖掘的需求越来越强烈.传统的单机环境已经无法满足大规模图数据挖掘的要求,而现有的并行或者分布式环境下的挖掘方法,普遍受到并行性以及数据倾斜等问题的限制,论文在分析了现有的频繁模式挖掘算法后,提出了一种基于数据流的单个大图频繁模式挖掘方法.首先,建立基于数据流的频繁模式挖掘模型,将MapReduce模型中的“批”数据变成“微批”数据,提高了数据处理的并行度,并且其迭代方式也满足频繁子图挖掘的反单调性;其二,设计了数据流模型中的频繁模式检查、子图实例扩展以及正规编码计算等操作,实现了基于数据流模型的频繁模式挖掘算法;其三,为解决正规编码计算中的复杂性问题,提出了基于不变关系的正规编码计算策略以及基于编码树的优化策略,优化正规编码比未优化编码的计算性能提升了30%,基于编码树的优化策略比原始编码计算策略在性能上提升了10%;最后,对涉及的相关算法进行了实验测试,实验证明,算法提高了频繁模式挖掘的并行性,大幅度减少了大图的搜索空间,降低了正规编码的计算时间,相比于传统算法大规模单图中频繁模式挖掘的效率提升了30%. 展开更多
关键词 挖掘 频繁模式 数据流模型 并行算法 编码树
在线阅读 下载PDF
频繁子图挖掘算法研究 被引量:9
14
作者 唐德权 朱林立 《计算机工程》 CAS CSCD 北大核心 2009年第9期52-54,共3页
图像能表达丰富语义,但增加了数据结构的复杂性和感兴趣子结构的挖掘难度。综合应用图论知识和数据挖掘的各种技术,对图像进行规范化编码,通过连接和扩展操作产生所有候选子图,引用嵌入集概念,计算候选子图的支持度和频繁度。提出频繁... 图像能表达丰富语义,但增加了数据结构的复杂性和感兴趣子结构的挖掘难度。综合应用图论知识和数据挖掘的各种技术,对图像进行规范化编码,通过连接和扩展操作产生所有候选子图,引用嵌入集概念,计算候选子图的支持度和频繁度。提出频繁子图挖掘算法FSubgraphM,能从图数据库中挖掘频繁导出子图。 展开更多
关键词 数据挖掘 同构 规范化编码 嵌入集 频繁子挖掘
在线阅读 下载PDF
一种基于加权软件行为图挖掘的软件错误定位方法 被引量:3
15
作者 苏小红 王甜甜 +1 位作者 杨劭君 马培军 《计算机学报》 EI CSCD 北大核心 2016年第11期2175-2188,共14页
已有错误定位方法通常仅给出可疑语句排序而缺少必要的上下文信息,导致难于理解软件失效的产生原因.为了解决该问题,定义了加权软件行为图来表示成功和失败的程序执行路径,由于图中边的权重表示了路径的执行频率,因此与LEAP方法相比,可... 已有错误定位方法通常仅给出可疑语句排序而缺少必要的上下文信息,导致难于理解软件失效的产生原因.为了解决该问题,定义了加权软件行为图来表示成功和失败的程序执行路径,由于图中边的权重表示了路径的执行频率,因此与LEAP方法相比,可以较好地分析与循环和递归等结构相关的软件错误.在此基础上,执行基于分支限界搜索的加权软件行为图挖掘算法,识别成功和失败执行之间最有差异的子图来获得错误签名,不但可以有效定位错误位置,还能输出缺陷语句相关的执行路径,从而提供失效产生的上下文.分析Siemens基准测试集和flex程序的结果表明,在检查相同百分比的语句的情况下,文中方法可以比Tarantula方法和LEAP方法定位到更多的错误.特别是对于冗余代码、缺失代码和变量替换,以及会直接改变执行路径类的错误,文中方法具有较高的定位精度. 展开更多
关键词 错误定位 软件行为 挖掘 错误签名 分支限界搜索
在线阅读 下载PDF
基于图挖掘和决策树的软件故障定位研究 被引量:2
16
作者 杨书新 徐丽萍 王鹏 《计算机工程与应用》 CSCD 北大核心 2015年第20期67-71,共5页
对于非崩溃的错误,测试人员往往花费大量的时间才能发现。为了快速准确地定位这类错误,降低软件开发成本,提高软件质量,提出一种辅助定位非崩溃错误的方法。该方法通过收集程序的执行轨迹信息,构造出程序调用图。提取频繁边,运用J48决... 对于非崩溃的错误,测试人员往往花费大量的时间才能发现。为了快速准确地定位这类错误,降低软件开发成本,提高软件质量,提出一种辅助定位非崩溃错误的方法。该方法通过收集程序的执行轨迹信息,构造出程序调用图。提取频繁边,运用J48决策树算法,得到基于方法粒度的故障决策树,可辅助人员判定软件缺陷。通过实验与分析,进一步验证了该方法的有效性。 展开更多
关键词 软件故障定位 执行轨迹 挖掘 决策树
在线阅读 下载PDF
挖掘不确定频繁子图的改进算法的研究 被引量:2
17
作者 胡健 何林波 +1 位作者 毛伊敏 杨健 《计算机工程与应用》 CSCD 北大核心 2015年第3期112-116,共5页
鉴于图结构能简单方便地描绘复杂的数据以及实际应用中图数据的获得具有不确定性,不确定频繁子图挖掘算法得到广泛的研究。目前一个典型的图挖掘算法是MUSE,但MUSE算法存在期望支持度计算消耗大、时间效率不够高等问题。针对此问题提出... 鉴于图结构能简单方便地描绘复杂的数据以及实际应用中图数据的获得具有不确定性,不确定频繁子图挖掘算法得到广泛的研究。目前一个典型的图挖掘算法是MUSE,但MUSE算法存在期望支持度计算消耗大、时间效率不够高等问题。针对此问题提出了一种基于划分思想混合搜索策略的不确定子图挖掘算法EDFS,它用改进过的GSpan算法进行不确定的子图数据预处理,用裁剪子图模式的搜索空间裁剪不确定子图数据,用基于划分思想的混合策略进行频繁子图的挖掘。子图同构与边存在概率的实验结果证明了EDFS算法能更高效地挖掘出不确定数据频繁子图。 展开更多
关键词 不确定 挖掘 频繁子 划分思想 混合策略
在线阅读 下载PDF
基于联合意义度量的Top-K图模式挖掘 被引量:3
18
作者 刘勇 高宏 李建中 《计算机学报》 EI CSCD 北大核心 2010年第2期215-230,共16页
提出了一个新的研究问题:如何挖掘Top-K图模式,联合起来使某个意义度量最大化.利用信息论的概念,给出了两个具体问题的定义MES和MIGS,并证明它们是NP-难.提出了两个高效算法Greedy-TopK和Clus-ter-TopK.Greedy-TopK先产生频繁子图,然后... 提出了一个新的研究问题:如何挖掘Top-K图模式,联合起来使某个意义度量最大化.利用信息论的概念,给出了两个具体问题的定义MES和MIGS,并证明它们是NP-难.提出了两个高效算法Greedy-TopK和Clus-ter-TopK.Greedy-TopK先产生频繁子图,然后按增量贪心方式选择K个图模式.Cluster-TopK先挖掘频繁子图的一个代表模式集合,然后从代表模式中按增量贪心方式选择K个图模式.当意义度量满足submodular性质时,Greedy-TopK能提供近似比保证.Cluster-TopK没有近似比保证,但比Greedy-TopK更高效.实验结果显示,在结果可用性方面,文中提出的Top-K挖掘优于传统的Top-K挖掘.Cluster-TopK比Greedy-TopK快至少一个数量级.而且,在质量和可用性方面,Cluster-TopK的挖掘结果非常类似于Greedy-TopK的挖掘结果. 展开更多
关键词 挖掘 数据库 频繁子 代表模式 联合熵 信息增益
在线阅读 下载PDF
Apriori算法用于频繁子图挖掘的改进方法 被引量:4
19
作者 陈立宁 罗可 《计算机工程与应用》 CSCD 北大核心 2011年第10期113-117,共5页
AGM算法最早将Apriori思想应用到频繁子图挖掘中。AGM算法结构简单,以递归统计为基础,但面临庞大的图数据集时,由于存在子图同构的问题,在生成候选子图时容易产生很多冗余子图,使计算时间开销很大。基于AGM算法,针对候选子图生成这一环... AGM算法最早将Apriori思想应用到频繁子图挖掘中。AGM算法结构简单,以递归统计为基础,但面临庞大的图数据集时,由于存在子图同构的问题,在生成候选子图时容易产生很多冗余子图,使计算时间开销很大。基于AGM算法,针对候选子图生成这一环节对原算法进行改进,减少了冗余子图的生成,使改进后的算法在计算时间上具有高效性;测试了在不同最小支持度情况下改进方法的时间开销。实验结果表明改进算法比原算法缩短了计算时间,提高了频繁子图的挖掘效率。 展开更多
关键词 频繁子挖掘 AGM算法 同构
在线阅读 下载PDF
基于路径的频繁子图挖掘算法研究 被引量:4
20
作者 唐德权 张波云 《计算机工程与科学》 CSCD 北大核心 2019年第12期2223-2230,共8页
图挖掘是数据挖掘的一个重要研究方向,而图挖掘主要集中在图数据集内频繁子图的挖掘。频繁子图挖掘技术的关键是建立有效机制减少冗余候选子图,以便高效计算和处理所需的频繁子图。提出了一种基于路径的频繁子图挖掘算法,该算法首先找... 图挖掘是数据挖掘的一个重要研究方向,而图挖掘主要集中在图数据集内频繁子图的挖掘。频繁子图挖掘技术的关键是建立有效机制减少冗余候选子图,以便高效计算和处理所需的频繁子图。提出了一种基于路径的频繁子图挖掘算法,该算法首先找出所有频繁边从而挖掘出频繁单路径,然后通过组合、双射和操作扩展出较多的频繁路径,再通过连接操作产生所有频繁子图候选集。通过定理证明了该算法的正确性和完整性,从理论上分析了该算法时间复杂度低于现有的算法,最后进行了2个图数据集实验,在候选集产生的数量和时间性能2方面验证了算法的优越性。 展开更多
关键词 挖掘 频繁子 候选子 频繁路径 时间性能
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部