期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于多级实体关联的光栅断点故障数据并行挖掘方法
1
作者 陈思 赵鹏 杨潞霞 《激光杂志》 北大核心 2025年第4期180-185,共6页
在光栅断点故障数据中,存在多种类型的实体,这些实体具有多个层级,导致关联分析变得复杂,加大了故障数据挖掘的难度。多级实体关联分析考虑了故障数据的多层次特性,通过关联相似性能够对故障数据进行更为全面的捕捉。因此,提出基于多级... 在光栅断点故障数据中,存在多种类型的实体,这些实体具有多个层级,导致关联分析变得复杂,加大了故障数据挖掘的难度。多级实体关联分析考虑了故障数据的多层次特性,通过关联相似性能够对故障数据进行更为全面的捕捉。因此,提出基于多级实体关联的光栅断点故障数据并行挖掘方法。采用多级实体关联模型,通过层次化分析计算关联相似度,有效捕捉和简化光栅断点故障数据的复杂关系和层次结构。在MapReduce框架下,结合多级实体关联的层次化相似性结果,采用区间型FCM聚类算法对大规模光栅断点故障数据进行并行挖掘。实验结果表明,所提方法在处理光栅断点故障数据时,能够显著提升并行挖掘的吞吐量,使其稳定维持在6 kbps以上,并且显著降低了计算开销。 展开更多
关键词 多级实体关联 关联相似度 光栅断点 故障数据 并行挖掘
在线阅读 下载PDF
一种基于FP-Growth的频繁项目集并行挖掘算法 被引量:44
2
作者 章志刚 吉根林 《计算机工程与应用》 CSCD 2014年第2期103-106,共4页
FP-Growth算法是基于FP树挖掘频繁项目集的经典算法,为提高FP-Growth算法挖掘大规模数据频繁项目集的效率,提出了一种基于FP-Growth的频繁项目集并行挖掘算法FPPM。该算法基于Map/Reduce并行模型,在每个计算节点上首先构造局部频繁模式... FP-Growth算法是基于FP树挖掘频繁项目集的经典算法,为提高FP-Growth算法挖掘大规模数据频繁项目集的效率,提出了一种基于FP-Growth的频繁项目集并行挖掘算法FPPM。该算法基于Map/Reduce并行模型,在每个计算节点上首先构造局部频繁模式树,并对之进行挖掘得到局部频繁项目集,然后合并局部频繁项目集以得到全局频繁项集,由于此时得到的结果并不完备,所以对合并后未达到最小支持度阈值的项目集,重新计算其支持数。介绍了FPPM算法的设计思想,测试了其性能。实验结果表明FPPM算法具有较好的可扩展性。 展开更多
关键词 频繁项目集 并行挖掘 FP Growth MAP REDUCE
在线阅读 下载PDF
并行挖掘频繁项目集新算法——MREclat 被引量:4
3
作者 章志刚 吉根林 唐梦梦 《计算机应用》 CSCD 北大核心 2014年第8期2175-2178,共4页
针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节... 针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节点上,且在分发数据时引入了均衡策略;接着,在各个计算节点上求出以某一前缀开头的所有频繁项目集;最后,合并各个节点的结果得到所有频繁项目集。介绍了MREclat的设计思想,研究了算法的运行性能。实验结果表明,MREclat算法效率大约是PEclat算法的2倍,加速比性能比PEclat算法提高了64%。 展开更多
关键词 频繁项目集 并行挖掘算法 列存储 MAP REDUCE Eclat算法
在线阅读 下载PDF
一种FP树的并行挖掘算法 被引量:10
4
作者 谈克林 孙志挥 《计算机工程与应用》 CSCD 北大核心 2006年第13期155-157,共3页
为提高频繁模式树(FP)的关联规则挖掘性能,论文提出一种FP树的并行挖掘算法,即将FP树进行逐步分解,分解过程中进行剪枝和合并,得到各个简化的小FP树,利用网格上各个计算资源进行关联规则挖掘。
关键词 FP树 频繁项集 并行挖掘
在线阅读 下载PDF
序列关联并行挖掘算法研究 被引量:3
5
作者 李庆华 赵峰 《计算机科学》 CSCD 北大核心 2003年第8期114-116,共3页
Ming sequential associations is becoming increasing essential in many scientific and commercial domains.Developing parallel algorithm becomes quite challenging depending on enormous size of available dataset and possi... Ming sequential associations is becoming increasing essential in many scientific and commercial domains.Developing parallel algorithm becomes quite challenging depending on enormous size of available dataset and possiblylarge number of mined associations ,the nature of input data and the timing constraints imposed on the desired associa-tions. In this paper ,we discuss several different parallel algorithms that cater to various situations to speed up thecurrent mining process. 展开更多
关键词 数据仓库 序列关联 并行挖掘算法 数据挖掘 数据集 数据库
在线阅读 下载PDF
基于元信息的粗糙集规则并行挖掘方法 被引量:2
6
作者 苏健 高济 《计算机科学》 CSCD 北大核心 2003年第3期35-39,共5页
Rough sets is one important method of data mining. Data mining processes such a great quantity of data inlarge database that the speed of Rough Sets Data Mining Algorithm is critical to Data Mining System. Utilizing n... Rough sets is one important method of data mining. Data mining processes such a great quantity of data inlarge database that the speed of Rough Sets Data Mining Algorithm is critical to Data Mining System. Utilizing net-work computing resources is an effective approach to improve the performance of Data Mining System. This paperproposes the concept of meta-information,which is used to describes the result of Rough Sets Data Mining in informa-tion system,and a meta-information-based method for rule parallel mining. This method decomposes the information-system into a lot of sub-information-system,dispatchs the task of generating meta-information of sub-information-sys-tem to some task performer in the network,and lets them parallel compute meta-information,then synthesizes themeta-information of sub-information-system to the meta-information of information system in the task synthesizer,and finally produces the rule according to the meta-information. 展开更多
关键词 元信息 粗糙集规则 并行挖掘 数据库 数据挖掘 信息子系统 计算机网络
在线阅读 下载PDF
一种高效的并行挖掘频繁序列的算法
7
作者 佘春东 吴跃 +2 位作者 孙世新 李磊 车著明 《计算机科学》 CSCD 北大核心 2004年第10期203-205,共3页
序列模式发现在数据挖掘领域中的地位越来越重要,本文首先介绍了频繁序列挖掘模式的基本概念,然后基于投影树算法,给出了其数据并行模式和任务并行模式,接着进行了算法的复杂性分析,我们的实验证明这些算法都能获得较好的加速比,而且任... 序列模式发现在数据挖掘领域中的地位越来越重要,本文首先介绍了频繁序列挖掘模式的基本概念,然后基于投影树算法,给出了其数据并行模式和任务并行模式,接着进行了算法的复杂性分析,我们的实验证明这些算法都能获得较好的加速比,而且任务并行模式具有更好的可扩展性。 展开更多
关键词 频繁序列 并行挖掘 算法 并行模式 序列模式 数据并行 数据挖掘 任务 地位 复杂性分析
在线阅读 下载PDF
基于MapReduce的健康大数据并行挖掘算法研究 被引量:1
8
作者 陈榆 何慧敏 +1 位作者 梁志胜 欧旭 《现代电子技术》 2023年第12期79-83,共5页
随着信息技术的发展,健康大数据呈指数级别剧增,但数据量过大使得较多有价值的数据被埋没,医疗服务的质量与效率难以提升。为解决上述问题,文中提出一种基于MapReduce的健康大数据并行挖掘算法。首先对健康大数据进行预处理,消除一些不... 随着信息技术的发展,健康大数据呈指数级别剧增,但数据量过大使得较多有价值的数据被埋没,医疗服务的质量与效率难以提升。为解决上述问题,文中提出一种基于MapReduce的健康大数据并行挖掘算法。首先对健康大数据进行预处理,消除一些不利因素对数据的影响;再以预处理后的健康大数据为依据,获取初始簇中心,度量健康大数据与簇中心之间的距离,聚类处理健康大数据;最后,应用MapReduce制定健康大数据并行挖掘程序,执行制定程序即可完成健康大数据的并行挖掘。实验结果表明,所提算法的健康大数据挖掘效率最大值为94 GB/s,加速比最大值为4.5,相比于其他方法,该算法对健康大数据挖掘的性能更佳。 展开更多
关键词 健康大数据 并行挖掘算法 MAPREDUCE 数据预处理 数据聚类 挖掘程序
在线阅读 下载PDF
一种基于后缀项表的并行闭频繁项集挖掘算法 被引量:11
9
作者 唐颖峰 陈世平 《计算机应用研究》 CSCD 北大核心 2014年第2期373-377,共5页
对现有的基于MapReduce的并行频繁项集挖掘算法进行了研究,提出一种基于后缀项表的并行闭频繁项集挖掘算法,通过后缀项表的引入及以闭频繁项集挖掘的形式,减少组分间的数据传送量,提高挖掘效率。实验表明,该算法可以有效缩短平均挖掘时... 对现有的基于MapReduce的并行频繁项集挖掘算法进行了研究,提出一种基于后缀项表的并行闭频繁项集挖掘算法,通过后缀项表的引入及以闭频繁项集挖掘的形式,减少组分间的数据传送量,提高挖掘效率。实验表明,该算法可以有效缩短平均挖掘时间,对于高维大数据具有较好的性能。 展开更多
关键词 频繁项集挖掘 并行挖掘算法 MAPREDUCE 闭频繁项集 后缀项表
在线阅读 下载PDF
一种高效并行关联规则挖掘新算法 被引量:3
10
作者 杨欣斌 孙京诰 +1 位作者 陈霁威 黄道 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第3期295-298,共4页
提出了一种在微机集群上实现的高效并行算法。该算法利用矩阵理论中上三角矩阵的良好性质 ,通过数据库约简、投影等操作 ,在微机集群的各节点上开展并行挖掘 ,从而提高挖掘算法的效率和可扩性。在微机集群上的实验证明 ,该算法能大大提... 提出了一种在微机集群上实现的高效并行算法。该算法利用矩阵理论中上三角矩阵的良好性质 ,通过数据库约简、投影等操作 ,在微机集群的各节点上开展并行挖掘 ,从而提高挖掘算法的效率和可扩性。在微机集群上的实验证明 ,该算法能大大提高关联规则的挖掘效率 ,并具有良好的可扩性。 展开更多
关键词 数据挖掘 关联规则 微机集群 并行挖掘 可扩性
在线阅读 下载PDF
序列模式挖掘的并行算法研究 被引量:2
11
作者 马传香 简钟 《计算机工程》 EI CAS CSCD 北大核心 2005年第6期16-17,136,共3页
序列模式在许多领域都有着重要的应用,大量的数据和模式需要高效的、可扩展的并行算法。针对目前序列模式挖掘算法存在的普遍问题,提出了一个适合无共享并行环境下的算法PMSP,有效地解决了存储受限以及时效性问题,并将它与当前相对较优... 序列模式在许多领域都有着重要的应用,大量的数据和模式需要高效的、可扩展的并行算法。针对目前序列模式挖掘算法存在的普遍问题,提出了一个适合无共享并行环境下的算法PMSP,有效地解决了存储受限以及时效性问题,并将它与当前相对较优的并行算法HPSPM做了比较,实验表明PMSP是有效的。 展开更多
关键词 序列模式 频繁序列 并行挖掘
在线阅读 下载PDF
并行数据挖掘研究 被引量:11
12
作者 张潇 恽爽 +1 位作者 陆桑璐 陈道蓄 《计算机工程》 CAS CSCD 北大核心 2003年第17期58-59,75,共3页
随着数据挖掘中数据量的高速增长以及大规模并行计算在数据挖掘中的应用,并行数据挖掘这一结合并行计算技术和数据挖掘技术在社会各个方面得到了大规模的各种各样的应用。然而,在数据挖掘并行化过程的同时,由于挖掘系统本身的原因,... 随着数据挖掘中数据量的高速增长以及大规模并行计算在数据挖掘中的应用,并行数据挖掘这一结合并行计算技术和数据挖掘技术在社会各个方面得到了大规模的各种各样的应用。然而,在数据挖掘并行化过程的同时,由于挖掘系统本身的原因,将挖掘过程完全并行还有一定的困难,这正是研究并行数据挖掘的价值所在。该文在分析并行挖掘现状,阐述并行挖掘技术发展前景的同时,针对并行挖掘的问题,指出了今后应该进行的工作。 展开更多
关键词 并行数据挖掘 分类规则 关联规则 工作站网
在线阅读 下载PDF
大数据环境下关联规则并行分层挖掘算法研究 被引量:27
13
作者 张忠林 田苗凤 刘宗成 《计算机科学》 CSCD 北大核心 2016年第1期286-289,共4页
为满足大数据实时处理的需求,提出了一种基于划分的关联规则并行分层挖掘算法(Parallel Hierarchical Association Rule Mining,PHARM)。首先,将整个数据库D随机分割成若干个非重叠区域,并行挖掘出局部频繁项集;然后利用先验性质,连接... 为满足大数据实时处理的需求,提出了一种基于划分的关联规则并行分层挖掘算法(Parallel Hierarchical Association Rule Mining,PHARM)。首先,将整个数据库D随机分割成若干个非重叠区域,并行挖掘出局部频繁项集;然后利用先验性质,连接局部频繁项集得全局候选项集;再次扫描D统计出每个候选项集的实际支持度,以确定全局频繁项集。最后,建模分析了该算法的高效性。 展开更多
关键词 大数据 划分 关联规则 并行分层挖掘 高效性
在线阅读 下载PDF
一种提高并行数据挖掘效率的方法 被引量:2
14
作者 佘春东 范植华 +2 位作者 孙世新 车著明 唐剑 《计算机科学》 CSCD 北大核心 2004年第2期132-134,166,共4页
发现关联规则是数据挖掘的一项重要任务,本文介绍了几种数据挖掘的串行和并行算法。其中IDD算法是一种高效的和易于扩展的发现关联规则的并行算法,然而,当处理器数目增加时,由于负载的失衡导致其效率的严重下降,于是通过引入近似算法成... 发现关联规则是数据挖掘的一项重要任务,本文介绍了几种数据挖掘的串行和并行算法。其中IDD算法是一种高效的和易于扩展的发现关联规则的并行算法,然而,当处理器数目增加时,由于负载的失衡导致其效率的严重下降,于是通过引入近似算法成功地解决了这个问题。我们给出了两种近似算法和其性能证明,其一是在线算法,另一种是离线算法。在本文的最后,我们进行了改进的IDD算法的复杂性分析。 展开更多
关键词 数据库 知识发现 并行数据挖掘效率 关联规则 数据集合 数据驱动 计算机
在线阅读 下载PDF
分布式并行数据挖掘系统的研究与实现 被引量:8
15
作者 张学明 施法中 《计算机工程与应用》 CSCD 北大核心 2002年第4期198-200,共3页
分布式多层体系结构,一方面可以适用于分布式应用的需要,另一方面可以减少系统的升级、维护费用,提高系统的鲁棒性。并行计算可以提高系统的执行效率。因此,研究分布式数据挖掘和并行数据挖掘问题很有必要性。文章研究了基于多线程的并... 分布式多层体系结构,一方面可以适用于分布式应用的需要,另一方面可以减少系统的升级、维护费用,提高系统的鲁棒性。并行计算可以提高系统的执行效率。因此,研究分布式数据挖掘和并行数据挖掘问题很有必要性。文章研究了基于多线程的并行数据挖掘,和基于VisiBroker的分布式数据挖掘的实现原理,以及运行实例。 展开更多
关键词 数据库管理系统 分布式并行数据挖掘系统 多线程
在线阅读 下载PDF
软件过程中的并行性挖掘 被引量:2
16
作者 李彤 王黎霞 《计算机应用与软件》 CSCD 北大核心 2001年第5期27-31,共5页
挖掘软件过程中的并行性,使其中的活动尽量并行进行,是提高软件生产率的重要手段。本文提出了一种通过活动间相关性分析,寻找软件过程中可并行化的因素,挖掘出可并行进行的活动,进而构造出Petri网表示的并行化的软件过程模型的技术,获... 挖掘软件过程中的并行性,使其中的活动尽量并行进行,是提高软件生产率的重要手段。本文提出了一种通过活动间相关性分析,寻找软件过程中可并行化的因素,挖掘出可并行进行的活动,进而构造出Petri网表示的并行化的软件过程模型的技术,获得了比较理想的并行性挖掘效果。 展开更多
关键词 并行挖掘 软件过程 PETRI网 软件并行工程 软件开发
在线阅读 下载PDF
基于Spark的并行频繁项集挖掘算法 被引量:7
17
作者 毛伊敏 吴斌 +1 位作者 许春冬 张茂省 《计算机集成制造系统》 EI CSCD 北大核心 2023年第4期1267-1283,共17页
针对大数据环境下基于Spark的频繁模式增长(FP-Growth)算法存在创建条件频繁模式树(FP-tree)时空效率低,节点间通信开销大,以及冗余搜索等问题,提出了基于Spark的并行频繁项集挖掘算法(PAFMFI-Spark)。首先,该算法提出非负矩阵分解策略(... 针对大数据环境下基于Spark的频繁模式增长(FP-Growth)算法存在创建条件频繁模式树(FP-tree)时空效率低,节点间通信开销大,以及冗余搜索等问题,提出了基于Spark的并行频繁项集挖掘算法(PAFMFI-Spark)。首先,该算法提出非负矩阵分解策略(SNMF),通过提供支持度计数查询和分解储存支持度计数的矩阵,解决了创建条件FP-tree的时空效率低的问题;其次,提出基于遗传算法的分组策略(GS-GA),均衡分配频繁1项集至各节点,解决了节点间的通信开销大的问题;最后,提出高效缩减树结构策略(ERTSS),缩减FP-tree树结构,解决了冗余搜索的问题。实验结果验证了PAFMFI-Spark算法的可行性以及相较于其他挖掘算法的性能优势,所提算法能有效适应各种数据的频繁项集挖掘。 展开更多
关键词 大数据 Spark框架 并行频繁项集挖掘 频繁模式增长算法 非负矩阵分解
在线阅读 下载PDF
并行性挖掘的图文法方法
18
作者 邹阳 吕建 曾晓勤 《小型微型计算机系统》 CSCD 北大核心 2011年第2期271-278,共8页
并行性分析技术一般通过对程序的控制与数据流图或相关依赖图的分析来实现,因而需要从程序中抽取出相应依赖图的算法的支持.本文基于上下文相关图文法RGG形式框架,定义了一种任务级的并行编程图语言GPPL来直接描述顺序或并行程序的控制... 并行性分析技术一般通过对程序的控制与数据流图或相关依赖图的分析来实现,因而需要从程序中抽取出相应依赖图的算法的支持.本文基于上下文相关图文法RGG形式框架,定义了一种任务级的并行编程图语言GPPL来直接描述顺序或并行程序的控制与数据流图,而且设计了相应的并行性分析算法以挖掘GPPL图程序的并行性特征.GPPL图语言可视为并行程序设计与程序代码生成之间的协同语言,从而使并行性挖掘避免了从程序中抽取出相应依赖图的过程.与已有的描述顺序或并行程序的图语言及其分析算法相比,GPPL图程序形式更为简洁和直观,易于设计,描述能力也更强;基于GPPL图的并行性分析算法的分析能力更强,而且具有可扩展性. 展开更多
关键词 并行挖掘 上下文相关图文法 图语言 并行性分析算法
在线阅读 下载PDF
软件过程建模中的并行性挖掘与延拓技术研究
19
作者 马臻 张毅坤 魏芳 《西安理工大学学报》 CAS 2005年第4期433-436,共4页
针对软件过程建模中存在的诸多问题,提出了一个基于并行性挖掘与延拓技术的软件过程建模模型,并利用此模型对火车调度系统进行了建模。结果表明,该模型正确且工作效率高。
关键词 PETRI网 并行挖掘与延拓技术 软件过程建模模型 火车调度系统
在线阅读 下载PDF
基于Hadoop云平台的并行数据挖掘方法 被引量:38
20
作者 杨来 史忠植 +1 位作者 梁帆 齐保元 《系统仿真学报》 CAS CSCD 北大核心 2013年第5期936-944,共9页
业界已经开始运用云平台来处理海量高维数据,将各种异构系统仿真为一个系统,其中在Hadoop环境进行数据挖掘会遇到数据模型的全局性、HDFS的文件随机写操作、数据生命周期短等问题。为解决这些问题,在Hadoop上实现高效海量数据挖掘,提出... 业界已经开始运用云平台来处理海量高维数据,将各种异构系统仿真为一个系统,其中在Hadoop环境进行数据挖掘会遇到数据模型的全局性、HDFS的文件随机写操作、数据生命周期短等问题。为解决这些问题,在Hadoop上实现高效海量数据挖掘,提出了在Hadoop上一种高效数据挖掘框架,利用数据库来模拟链表结构,管理挖掘出来的知识,提供了树形结构、图模型的分布式计算方法;在此基础上实现一个统计算法——Yscore分箱算法,以及决策树和KD树的建树算法;并利用Vega云对Hadoop集群进行仿真。实验数据表明该框架和算法实用可行,且可能拓展与数据挖掘之外的其他领域。 展开更多
关键词 并行数据挖掘 决策树算法 KD树算法 JPA 云计算
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部