期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
MapReduce并行编程模型研究综述 被引量:189
1
作者 李建江 崔健 +2 位作者 王聃 严林 黄义双 《电子学报》 EI CAS CSCD 北大核心 2011年第11期2635-2642,共8页
MapReduce并行编程模型通过定义良好的接口和运行时支持库,能够自动并行执行大规模计算任务,隐藏底层实现细节,降低并行编程的难度.本文对MapReduce的国内外相关研究现状进行了综述,阐述和分析了当前国内外与MapReduce相关的典型研究成... MapReduce并行编程模型通过定义良好的接口和运行时支持库,能够自动并行执行大规模计算任务,隐藏底层实现细节,降低并行编程的难度.本文对MapReduce的国内外相关研究现状进行了综述,阐述和分析了当前国内外与MapReduce相关的典型研究成果的特点和不足,重点对MapReduce涉及的关键技术(包括:模型改进、模型针对不同平台的实现、任务调度、负载均衡和容错)的研究现状进行了深入的分析.本文最后还对MapReduce未来的发展趋势进行了展望. 展开更多
关键词 mapreduce 并行编程模型 运行时支持库 海量数据处理
在线阅读 下载PDF
MapReduce并行编程架构模型研究 被引量:23
2
作者 江务学 张璟 王志明 《微电子学与计算机》 CSCD 北大核心 2011年第6期168-170,175,共4页
针对高质量高效率的MapReduce应用程序的开发,分析了基于Hadoop MapReduce模型的工作机制,从开发类库级阐述了MapReduce并行工作流程,提出了一个具有通用性的MapReduce开发框架原型,对开源的Ma-pReduce模型的改进作了一些展望.
关键词 mapreduce模型 并行编程 心跳程序
在线阅读 下载PDF
基于MapReduce模型的并行科学计算 被引量:39
3
作者 郑启龙 房明 +3 位作者 汪胜 王向前 吴晓伟 王昊 《微电子学与计算机》 CSCD 北大核心 2009年第8期13-17,共5页
随着多核处理器日渐普及,开发高效易用的并行编程模型成为新的挑战.MapReduce是Google开发的一种并行分布式计算模型,在其搜索业务中获得了巨大的成功.将MapReduce模型引入科学计算领域,并结合实例阐述了如何使用面向高性能计算的HPMR/H... 随着多核处理器日渐普及,开发高效易用的并行编程模型成为新的挑战.MapReduce是Google开发的一种并行分布式计算模型,在其搜索业务中获得了巨大的成功.将MapReduce模型引入科学计算领域,并结合实例阐述了如何使用面向高性能计算的HPMR/HPMR-s系统在分布式或共享存储系统中采用统一的方式描述并实现并行科学计算. 展开更多
关键词 并行编程模型 科学计算 mapreduce
在线阅读 下载PDF
基于MapReduce编程模型的改进KNN分类算法研究 被引量:3
4
作者 邱宁佳 郭畅 +2 位作者 杨华民 王鹏 温暖 《长春理工大学学报(自然科学版)》 2017年第1期110-114,共5页
采用一种属性约简算法,将待分类的数据样本进行两次约简处理--初次决策表属性约简和基于核属性值的二次约简。通过属性约简方法来删除数据集中的冗余数据,进而提高KNN算法的分类精度。在此基础上应用MapReduce并行编程模型,在Hadoop集... 采用一种属性约简算法,将待分类的数据样本进行两次约简处理--初次决策表属性约简和基于核属性值的二次约简。通过属性约简方法来删除数据集中的冗余数据,进而提高KNN算法的分类精度。在此基础上应用MapReduce并行编程模型,在Hadoop集群环境上实现并行化分类计算实验。实验结果表明,改进后的算法在集群环境下执行的效率得到很大提升,能够高效处理实验数据。实验执行的加速比也有明显提高。 展开更多
关键词 KNN 属性约简 mapreduce编程模型 HADOOP
在线阅读 下载PDF
采用MapReduce模型的甚长基线干涉测量并行处理方法 被引量:2
5
作者 田斌 何强 +1 位作者 王佳 郑雨西 《西安交通大学学报》 EI CAS CSCD 北大核心 2015年第4期61-66,共6页
针对传统甚长基线干涉测量(very long baseline interferometry,VLBI)并行处理方法存在逻辑复杂、数据存储和计算扩展性较差等缺点,基于MapReduce模型设计了一种VLBI观测数据相关的并行处理方法。该方法采用模型周期作为数据并行处理基... 针对传统甚长基线干涉测量(very long baseline interferometry,VLBI)并行处理方法存在逻辑复杂、数据存储和计算扩展性较差等缺点,基于MapReduce模型设计了一种VLBI观测数据相关的并行处理方法。该方法采用模型周期作为数据并行处理基本单元,构建数据关联算法分割观测数据使各台站同一模型周期数据对齐到同一波前,设计实现数据相关计算的Map过程,使用Reduce对各模型周期结果进行综合处理以得到最终结果。实验结果表明:该方法在积分周期包含的模型周期数量大于节点CPU核数时性能比传统方式低25%左右,在积分周期包含的模型周期数量小于节点CPU核数时通常能提供更高的计算效率,并且能简化VLBI并行相关处理的复杂度,具有更好的数据存储和计算可扩展性。 展开更多
关键词 甚长基线干涉测量 数据相关处理 并行处理 mapreduce模型
在线阅读 下载PDF
基于MapReduce模型的并行粒子群分簇算法研究 被引量:1
6
作者 赵彦 孙俊 《现代电子技术》 2021年第7期137-141,共5页
在超大规模数据集的分簇管理上,存在大数据获取、存储、检索、分析和可视化等困难。面对爆炸式增长的数据,利用分布式、并行计算原理,在MapReduce模型的基础上构建并行粒子群优化算法(PSOC-MR),实现对超大规模数据的有效分簇处理。实验... 在超大规模数据集的分簇管理上,存在大数据获取、存储、检索、分析和可视化等困难。面对爆炸式增长的数据,利用分布式、并行计算原理,在MapReduce模型的基础上构建并行粒子群优化算法(PSOC-MR),实现对超大规模数据的有效分簇处理。实验结果表明,PSOC-MR算法在集群节点数量与数据集大小等比例增加的情况下呈现良好的可扩展性,能在保持分簇质量的同时呈现线性加速,该算法可有效解决超大规模数据集的分簇问题,实现低成本、高性能的商用大数据分析。 展开更多
关键词 粒子群算法 分簇算法 并行计算 mapreduce模型 分簇处理 大数据分析
在线阅读 下载PDF
基于MapReduce的CME参数识别模型并行计算技术 被引量:3
7
作者 杨世通 蔡燕霞 +1 位作者 鲁国瑞 王晶晶 《空间科学学报》 CAS CSCD 北大核心 2020年第2期169-175,共7页
日冕物质抛射(Coronal Mass Ejection,CME)参数识别模型是太阳风预报过程的重要组成部分.在空间环境预报业务中,为提高太阳风预报的准确率,需要提高CME参数识别的精度.模型以计算任务串行的方式运行,运算效率低导致模型运算时间长,不能... 日冕物质抛射(Coronal Mass Ejection,CME)参数识别模型是太阳风预报过程的重要组成部分.在空间环境预报业务中,为提高太阳风预报的准确率,需要提高CME参数识别的精度.模型以计算任务串行的方式运行,运算效率低导致模型运算时间长,不能满足这种需求.CME参数识别模型的物理运算过程相互不独立,其在单节点上的运行方式不能满足并行化要求.基于MapReduce的并行计算框架,改进了CME参数识别模型的计算流程,提出CDMR(CME detection under MapReduce)方法,实现了CME参数识别模型的并行计算,并对比分析CME参数识别模型在串行计算和MapReduce并行计算下的运行时间,提高了模型的识别精度和计算效率. 展开更多
关键词 CME参数识别模型 mapreduce 并行计算效率
在线阅读 下载PDF
KNN分类算法的MapReduce并行化实现 被引量:21
8
作者 闫永刚 马廷淮 王建 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2013年第4期550-555,共6页
为了提高k-nearest neighbor algorithm(KNN)算法处理大数据集的能力,本文利用Map Reduce并行编程模型,同时结合KNN算法自身的特点,给出了KNN算法在Hadoop平台下的并行化实现。通过设计Map、Combine和Reduce 3个函数,实现了KNN算法的并... 为了提高k-nearest neighbor algorithm(KNN)算法处理大数据集的能力,本文利用Map Reduce并行编程模型,同时结合KNN算法自身的特点,给出了KNN算法在Hadoop平台下的并行化实现。通过设计Map、Combine和Reduce 3个函数,实现了KNN算法的并行化。Map函数完成每个测试样本与训练样本之间的相似度计算,Combine函数作为一个本地的Reduce操作,用以减少中间计算量及通信开销,Reduce函数则根据上述函数得到的中间结果计算出k近邻并作出分类判断。实验结果表明:较之以往的单机版方法,在Hadoop集群上实现的并行化KNN算法具有较好的加速比和良好的扩展性。 展开更多
关键词 KNN分类 并行计算 mapreduce模型 HADOOP
在线阅读 下载PDF
基于MapReduce的三元N-gram算法的并行化研究 被引量:6
9
作者 龚永罡 田润琳 +1 位作者 廉小亲 夏天 《电子技术应用》 2019年第5期70-73,77,共5页
大规模语料库的训练是使用三元N-gram算法进行中文文本自动查错中一个重要的基础工作。面对新媒体平台每日高达百万篇需处理的语料信息,单一节点的三元N-gram语言模型词库的构建存在计算瓶颈。在深入研究三元N-gram算法的基础上,提出了... 大规模语料库的训练是使用三元N-gram算法进行中文文本自动查错中一个重要的基础工作。面对新媒体平台每日高达百万篇需处理的语料信息,单一节点的三元N-gram语言模型词库的构建存在计算瓶颈。在深入研究三元N-gram算法的基础上,提出了基于MapReduce计算模型的三元N-gram并行化算法的思想。MapReduce计算模型中,将运算任务平均分配到m个节点,三元N-gram算法在Map函数部分的主要任务是计算局部字词分别与其前两个字词搭配出现的次数,Reduce函数部分的主要任务是合并Map部分统计字词搭配出现的次数,生成全局统计结果。实验结果表明,运行在Hadoop集群上的基于MapReduce的三元N-gram并行化算法具有很好的运算性和可扩展性,对于每日120亿字的训练语料数据集,集群环境下该算法得到训练结果的速率更接近于线性。 展开更多
关键词 中文文本查错 三元N-gram算法 mapreduce计算模型 并行化算法 HADOOP集群 语料库
在线阅读 下载PDF
一种基于MapReduce的并行PSO-BP神经网络算法 被引量:4
10
作者 崔红艳 曹建芳 史昊 《科技通报》 北大核心 2017年第4期110-115,共6页
为了提高BP神经网络算法的分类准确率和运行时间效率,利用PSO算法和并行化设计的思想,提出了Hadoop平台下基于MapReduce的PSO优化BP神经网络的并行化设计及实现方法。利用PSO算法优化BP神经网络的初始权值和阈值,提高算法分类准确率;采... 为了提高BP神经网络算法的分类准确率和运行时间效率,利用PSO算法和并行化设计的思想,提出了Hadoop平台下基于MapReduce的PSO优化BP神经网络的并行化设计及实现方法。利用PSO算法优化BP神经网络的初始权值和阈值,提高算法分类准确率;采用MapReduce并行编程模型实现算法的并行化处理,解决了BP神经网络在处理大规模样本数据集时存在的硬件开销和通信开销大的问题。选用SUN Database场景图像库构造了5个不同规模的数据集,通过与传统的串行PSO-BP神经网络算法实验对比,并行化的PSO-BP神经网络算法分类准确率达92%左右,系统效率在0.85左右,在处理大规模数据集时具有明显的优越性。 展开更多
关键词 PSO算法 BP神经网络 mapreduce编程模型 HADOOP平台 并行化处理 大规模数据集
在线阅读 下载PDF
云计算环境下Apriori算法的MapReduce并行化 被引量:3
11
作者 李晓飞 《长春工业大学学报》 CAS 2013年第6期736-740,共5页
借助分割数据技术优化了经典的Apriori算法,实现了对候选项集的分组统计。给出了优化Apriori算法的MapReduce编程实现模型,达到了Apriori算法并行化的目的。实验结果表明,该算法能够大量减少键/值对的产生,提高了算法的效率,并且随着挖... 借助分割数据技术优化了经典的Apriori算法,实现了对候选项集的分组统计。给出了优化Apriori算法的MapReduce编程实现模型,达到了Apriori算法并行化的目的。实验结果表明,该算法能够大量减少键/值对的产生,提高了算法的效率,并且随着挖掘频繁项目集节点数的增加,算法的加速比成线性提高。 展开更多
关键词 云计算 APRIORI算法 mapreduce模型 并行 数据分割
在线阅读 下载PDF
虚拟计算环境下并行编程模型的研究与实现
12
作者 刘晓东 王淼 《微电子学与计算机》 CSCD 北大核心 2015年第12期141-146,150,共7页
针对目前面向大数据处理的并行编程模型研究中存在的不足,利用BSP模型性能可预测、易于编程、消息传递不产生死锁等优点,将BSP模型与虚拟计算环境相结合,提出一种虚拟计算环境下分布式内存与共享内存混合的并行编程模型BSPCloud.利用Jav... 针对目前面向大数据处理的并行编程模型研究中存在的不足,利用BSP模型性能可预测、易于编程、消息传递不产生死锁等优点,将BSP模型与虚拟计算环境相结合,提出一种虚拟计算环境下分布式内存与共享内存混合的并行编程模型BSPCloud.利用Java语言实现了BSPCloud并行编程模型原型系统,在虚拟计算环境下对其性能可预测性和加速比进行评估,实验结果表明BSPCloud具有很好的性能和可预测性. 展开更多
关键词 大数据 并行计算 编程模型
在线阅读 下载PDF
支持多种访存技术的CBEA片上多核MPI并行编程模型探讨
13
作者 李广润 《黑龙江科技信息》 2013年第12期164-164,共1页
在计算机信息技术领域中,传统的CBEA计算机编程模型在实际编程应用中,主要侧重进行类似于流处理的批量访存应用支持,并且在实际编程应用中,该编程模型的传统非规则访问应用性能比较低。针对这一情况问题,本文主要提出一种支持多种访存... 在计算机信息技术领域中,传统的CBEA计算机编程模型在实际编程应用中,主要侧重进行类似于流处理的批量访存应用支持,并且在实际编程应用中,该编程模型的传统非规则访问应用性能比较低。针对这一情况问题,本文主要提出一种支持多种访存技术的CBEA片上多核MPI并行编程模型,该编程模型主要是在对于Cell框架结构原理应用的基础上,同时能够实现批量访存以经济非规则访存支持应用的MPI并行编程模型。 展开更多
关键词 多种访存技术 CBEA 通信支持 异构多核 并行 编程模型 MPI
在线阅读 下载PDF
基于MapReduce模型遗传算法的一种改进与实现 被引量:5
14
作者 胡涛 《电子设计工程》 2013年第5期32-35,39,共5页
遗传算法的内在隐并行性决定了其能够以少量的问题编码进而处理大量模式,不少处理更大规模且复杂问题的并行遗传算法也提了出来。本文给出了在Hadoop中MapReduce并行计算框架下简单遗传算法的并行化处理流程,结合框架处理输入和输出键... 遗传算法的内在隐并行性决定了其能够以少量的问题编码进而处理大量模式,不少处理更大规模且复杂问题的并行遗传算法也提了出来。本文给出了在Hadoop中MapReduce并行计算框架下简单遗传算法的并行化处理流程,结合框架处理输入和输出键值对的特点提出了基于最小堆的最优个体保留策略的遗传算法在的设计与实现,进一步优化了算法的收敛速度。实验结果表明:运用框架的并行处理能力及堆的线性操作时间,应用于较大规模复杂问题该算法实现在收敛速度上呈良好特性。 展开更多
关键词 mapreduce模型 并行计算框架 遗传算法 最小堆结构
在线阅读 下载PDF
异构计算并行编程模型综述 被引量:7
15
作者 邬江兴 祁晓峰 高彦钊 《上海航天(中英文)》 CSCD 2021年第4期1-11,共11页
异构计算架构是目前高性能计算研究的重要领域。在异构计算架构中,不同种类的计算器件协同工作需要解决如任务调度、数据通信、存储、同步优化等问题。这些问题会对异构计算架构系统的运行性能、功耗、可靠性等指标产生重要影响。为解... 异构计算架构是目前高性能计算研究的重要领域。在异构计算架构中,不同种类的计算器件协同工作需要解决如任务调度、数据通信、存储、同步优化等问题。这些问题会对异构计算架构系统的运行性能、功耗、可靠性等指标产生重要影响。为解决异构系统的应用开发与系统优化问题,近年出现许多面向异构计算架构的并行编程模型。本文介绍异构并行编程模型的研究进展,针对异构并行计算需要解决的关键问题进行讨论,最后对异构体系架构的发展方向做出总结。 展开更多
关键词 异构计算 并行编程 编程模型 中间表示 任务调度 负载均衡
在线阅读 下载PDF
云计算下MapReduce多组容错机制架构的分析与研究 被引量:6
16
作者 张治斌 李燕歌 《微电子学与计算机》 CSCD 北大核心 2014年第1期52-55,59,共5页
提出了MapReduce多组容错机制,在传统的Hadoop MapReduce架构上进行改进,即在同机柜中的TaskTracker节点之间增加了多组关系,这样可以缩短发现失效节点的时间,同时减轻JobTracker节点的负荷,减低了带宽使用率,减少网络拥塞.通过实验证明... 提出了MapReduce多组容错机制,在传统的Hadoop MapReduce架构上进行改进,即在同机柜中的TaskTracker节点之间增加了多组关系,这样可以缩短发现失效节点的时间,同时减轻JobTracker节点的负荷,减低了带宽使用率,减少网络拥塞.通过实验证明,MapReduce多组容错机制提高了MapReduce的工作效率. 展开更多
关键词 云计算 mapreduce并行编程模型 多组容错机制
在线阅读 下载PDF
面向地震数据处理的并行与分布式编程框架 被引量:17
17
作者 赵长海 晏海华 +2 位作者 王宏琳 史晓华 王雷 《石油地球物理勘探》 EI CSCD 北大核心 2010年第1期146-155,共10页
本文提出了一个适用于地震资料处理的并行与分布式编程框架GeoPF。该框架构建在集群系统之上,采用粗粒度数据并行执行模型,它可以调度串行语言编写的处理模块,同时运行在多个计算节点或者单个节点内的多个CPU核上,隐藏了计算节点及其CP... 本文提出了一个适用于地震资料处理的并行与分布式编程框架GeoPF。该框架构建在集群系统之上,采用粗粒度数据并行执行模型,它可以调度串行语言编写的处理模块,同时运行在多个计算节点或者单个节点内的多个CPU核上,隐藏了计算节点及其CPU核的调度、通讯与节点故障恢复、模块之间的数据传输等并行编程细节。经过实验评估,GeoPF框架从串行到并行的线性加速性能有所提高,处理相同任务的时间从21h33min缩减到15min27s,效果显著。GeoPF与商用的地震数据处理系统相比,在业务流程方面有一些相同特点,其不同之处就是GeoPF的处理模块具有自动并行特点,而大部分地震处理模块只能是串行方式。 展开更多
关键词 并行执行模型 地震数据处理 编程框架 分布式 计算节点 地震资料处理 数据处理系统 串行方式
在线阅读 下载PDF
基于MapReduce的PageRank算法的研究 被引量:5
18
作者 陈宫 牛秦洲 《微电子学与计算机》 CSCD 北大核心 2012年第5期81-85,共5页
在对PageRank算法进行研究的基础上,利用MapReduce编程模型思想对PageRank算法进行改进,设计了在云平台Hadoop环境下运行的基于MapReduce的PageRank分布式并行算法,并在实验中对不同规模的Web图数据集进行了测试,分析不同的Blocksize参... 在对PageRank算法进行研究的基础上,利用MapReduce编程模型思想对PageRank算法进行改进,设计了在云平台Hadoop环境下运行的基于MapReduce的PageRank分布式并行算法,并在实验中对不同规模的Web图数据集进行了测试,分析不同的Blocksize参数对于算法计算性能的作用以及集群节点数目对于算法运行效率的影响. 展开更多
关键词 云计算 mapreduce模型 PAGERANK算法 HADOOP 并行计算
在线阅读 下载PDF
并行编程模式及分析 被引量:2
19
作者 何元清 孙世新 傅彦 《电子科技大学学报》 EI CAS CSCD 北大核心 2002年第2期173-175,共3页
讨论了主从模型、单控制流多数据流、分治策略、数据流水线、投机策略、混合模型六种并行编程模型的结构和工作方式、性能及特点,分析统计了大量应用程序。指出了并行程序设计中,并行编程模式的选择直接影响了并行程序的正确性和效率,... 讨论了主从模型、单控制流多数据流、分治策略、数据流水线、投机策略、混合模型六种并行编程模型的结构和工作方式、性能及特点,分析统计了大量应用程序。指出了并行程序设计中,并行编程模式的选择直接影响了并行程序的正确性和效率,而主从模型和单控制流多数据流在整体性能上最优,程序执行效率也最好,是两种最常用的并行编程模型。 展开更多
关键词 并行编程模式 主从模型 分治策略 并行程序设计
在线阅读 下载PDF
Linux环境下MPI并行编程与算法实现研究 被引量:5
20
作者 曾志峰 《航空计算技术》 2004年第2期61-64,共4页
并行计算实现求解一些复杂的问题,并行编程技术的进步使得并行计算逐步应用到很多领域。MPI是一种消息传递编程模型并可以被广泛使用的编写消息传递程序的标准,已扩展为一种优秀的并行程序设计语言。该文简要介绍了有关并行编程的基本... 并行计算实现求解一些复杂的问题,并行编程技术的进步使得并行计算逐步应用到很多领域。MPI是一种消息传递编程模型并可以被广泛使用的编写消息传递程序的标准,已扩展为一种优秀的并行程序设计语言。该文简要介绍了有关并行编程的基本概念与方法,深入讨论了MPI并行编程环境与并行编程模式,对MPI并行性进行了分析,给出了Linux环境下MPI编程环境的配置方法,最后结合一个实例详细描述了用MPI实现并行算法的方法。通过对实验程序的结果分析,在Linux机群环境下用MPI实现复杂的并行算法是简单的,并且能取得较好的性能。 展开更多
关键词 LINUX操作系统 MPI 并行编程 算法 通信模式 消息传递编程模型
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部