期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
多群粒子输运问题在多核集群系统上的混合并行计算
1
作者 迟利华 刘杰 +3 位作者 龚春叶 徐涵 蒋杰 胡庆丰 《计算机工程与科学》 CSCD 北大核心 2009年第11期94-97,共4页
本文分析了非结构网格多群粒子输运Sn方程求解的并行性,拟合多核机群系统的特点,设计了MPI/OpenMP混合程序,针对空间网格点采用区域分解划分,计算结点间基于消息传递MPI编程,每个MPI计算进程在计算过程中碰到关于能群的计算,就生成多个O... 本文分析了非结构网格多群粒子输运Sn方程求解的并行性,拟合多核机群系统的特点,设计了MPI/OpenMP混合程序,针对空间网格点采用区域分解划分,计算结点间基于消息传递MPI编程,每个MPI计算进程在计算过程中碰到关于能群的计算,就生成多个OpenMP线程,计算结点内针对能群进行多线程并行计算。数值测试结果表明,非结构网格上的粒子输运问题的混合并行计算能较好地匹配多核机群系统的硬件结构,具有良好的可扩展性,可以扩展到1024个CPU核。 展开更多
关键词 mpi/openmp混合并行计算 粒子输运 Sn方法 多核机群系统
在线阅读 下载PDF
蒙特卡罗中子输运程序的MPI/OpenMP混合并行研究 被引量:3
2
作者 梁金刚 刘诗文 +1 位作者 徐琪 王侃 《原子能科学技术》 EI CAS CSCD 北大核心 2013年第B12期654-659,共6页
消息传递/共享内存混合并行方法具有适应分布共享式集群计算机的发展趋势、有助于解决蒙特卡罗计算内存问题、改善并行性能等优势。本文基于一维中子蒙特卡罗输运程序,实现MPI/OpenMP混合并行,研究影响混合并行性能的因素,提出针对共享... 消息传递/共享内存混合并行方法具有适应分布共享式集群计算机的发展趋势、有助于解决蒙特卡罗计算内存问题、改善并行性能等优势。本文基于一维中子蒙特卡罗输运程序,实现MPI/OpenMP混合并行,研究影响混合并行性能的因素,提出针对共享内存访问竞争、锁竞争、伪共享等问题的解决方法。测试结果表明,混合并行程序和纯粹MPI并行程序有相近的加速效果,同时大量节省了程序的内存使用,对于实现中子蒙特卡罗输运程序的大规模并行有重要意义。 展开更多
关键词 中子输运 蒙特卡罗 混合并行 mpi openmp 内存
在线阅读 下载PDF
多核环境下AREM模式混合并行计算研究 被引量:2
3
作者 赵军 吴建平 +1 位作者 宋君强 辜旭赞 《计算机工程与应用》 CSCD 北大核心 2011年第21期61-63,76,共4页
使用多核处理器已成为构建高性能计算机系统的主流方式。结合多核高性能计算机系统集共享内存结构和分布式内存结构于一体的体系结构特点,对AREM模式开展MPI/OpenMP混合并行计算研究与实现。性能测试结果表明,使用MPI/OpenMP混合并行计... 使用多核处理器已成为构建高性能计算机系统的主流方式。结合多核高性能计算机系统集共享内存结构和分布式内存结构于一体的体系结构特点,对AREM模式开展MPI/OpenMP混合并行计算研究与实现。性能测试结果表明,使用MPI/OpenMP混合并行计算可以将并行应用扩展至更大处理机规模,缩短计算时间,不对原程序结构做大的改动、以增量方式和较小的并行化代价,取得比较好的并行计算效果。 展开更多
关键词 先进区域eta(AREM)模式 mpi openmp 并行计算
在线阅读 下载PDF
基于MPI/OPENMP混合编程的三维粒子模拟并行优化 被引量:3
4
作者 颜小洋 张伟文 +1 位作者 布社辉 邓辉舫 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第4期71-78,共8页
针对MPI、OPENMP并行程序各自存在的缺陷,将MPI与OPENMP结合起来,实现了MPI/OPENMP混合并行编程;通过实验对MPI、OPENMP并行程序及MPI/OPENMP混合并行编程进行了分析.实验结果表明:MPI/OPENMP混合并行编程可以大大减少通信量,其效率和... 针对MPI、OPENMP并行程序各自存在的缺陷,将MPI与OPENMP结合起来,实现了MPI/OPENMP混合并行编程;通过实验对MPI、OPENMP并行程序及MPI/OPENMP混合并行编程进行了分析.实验结果表明:MPI/OPENMP混合并行编程可以大大减少通信量,其效率和加速比均优于纯MPI并行程序,克服了MPI并行程序中因粒子分布不均匀使负载不均衡而导致的程序性能下降的问题,使得可以利用集群中的更多结点来进行计算,缓解了MPI并行程序的通信延迟问题;同时,MPI/OPENMP混合并行编程克服了OPENMP并行程序依赖于单台计算机处理能力和存储空间的问题,大幅度提高了模拟规模. 展开更多
关键词 mpi并行程序 openmp并行程序 3DEMPM 并行计算
在线阅读 下载PDF
OpenFoam中多面体网格生成的MPI+OpenMP混合并行方法 被引量:3
5
作者 刘江 刘文博 张矩 《计算机科学》 CSCD 北大核心 2022年第3期3-10,共8页
网格生成是计算流体力学中非常重要的一环,大规模数值模拟过程中对网格精度要求的提高会导致网格生成所耗的时间增加.文中基于OpenFoam开源软件中的网格生成算法,主要研究多面体网格的并行生成,并提出OpenMP和MPI混合并行的多面体网格... 网格生成是计算流体力学中非常重要的一环,大规模数值模拟过程中对网格精度要求的提高会导致网格生成所耗的时间增加.文中基于OpenFoam开源软件中的网格生成算法,主要研究多面体网格的并行生成,并提出OpenMP和MPI混合并行的多面体网格生成方法.通过理论分析得到,使用混合并行方法生成相同质量的网格时,混合并行方法生成网格的时间消耗随着线程数量和网格单元数量的增加而减少.3组使用不同求解器的数值模拟实验结果表明,该混合并行方法不但可以保证生成网格的质量---可以正常进行数值计算模拟且模拟结果与原方法相比几乎没有差别,而且生成同样质量与数量网格的耗时最多可以缩短至未使用OpenMP并行方法之耗时的1/4以内. 展开更多
关键词 计算流体力学 OPENFOAM 多面体网格生成 mpi+openmp混合并行 并行效率
在线阅读 下载PDF
云计算中的并行计算技术分析 被引量:8
6
作者 郑文武 李先绪 黄执勤 《电信科学》 北大核心 2011年第12期31-38,共8页
本文阐述了并行计算和云计算的关系,简要回顾并行计算的历史,分析了并行计算的重要技术OpenMP、MPI和Erlang,研究了这些技术在中国电信的应用方法,并介绍了中国电信实施云计算、并行计算的指导思想、原则和策略。
关键词 并行计算 openmp mpi ERLANG
在线阅读 下载PDF
一种基于OpenMP的并行混合PVS算法 被引量:3
7
作者 邹竞 马华 谢鲲 《计算机应用研究》 CSCD 北大核心 2016年第1期56-59,91,共5页
针对传统串行混合PVS(principal variation search,主要变例搜索)算法的计算量大、执行耗时长和无法利用多核资源的不足,提出了一种基于OpenMP(open multi-processing)的并行混合PVS算法。该算法应用了PVSplitting(主要变例分裂)策略,... 针对传统串行混合PVS(principal variation search,主要变例搜索)算法的计算量大、执行耗时长和无法利用多核资源的不足,提出了一种基于OpenMP(open multi-processing)的并行混合PVS算法。该算法应用了PVSplitting(主要变例分裂)策略,自底向上将博弈树每一层的首个PV节点的每个分支的搜索线程化,利用多核CPU并行执行,并对临界区和线程调度进行了合理设计,以提高搜索效率。最后,基于一个真实的中国象棋博弈系统进行了实验,结果表明,该算法拥有较高的剪枝率和加速比,能够明显提升混合PVS算法的执行性能。 展开更多
关键词 并行计算 混合PVS算法 博弈树 openmp PVSplitting
在线阅读 下载PDF
适用于任意网格的大规模并行CFD计算框架PHengLEI 被引量:32
8
作者 赵钟 张来平 +3 位作者 何磊 何先耀 郭永恒 徐庆新 《计算机学报》 EI CSCD 北大核心 2019年第11期2368-2383,共16页
针对计算流体力学(Computational Fluid Dynamics,CFD)大规模并行计算的需要,我们设计了适用于任意网格类型的并行计算框架风雷(PHengLEI)软件,同时支持结构网格、非结构网格和重叠网格.为了实现并行通信与网格类型无关且与物理求解器... 针对计算流体力学(Computational Fluid Dynamics,CFD)大规模并行计算的需要,我们设计了适用于任意网格类型的并行计算框架风雷(PHengLEI)软件,同时支持结构网格、非结构网格和重叠网格.为了实现并行通信与网格类型无关且与物理求解器开发者隔离,我们设计了通用的通信模式和一种基于网格块的“三合一”的数据交换模式,即将多块结构网格块、并行分区网格块和结构/非结构网格块间的交界面数据完全标准化为数据底层后,在数据底层统一进行交换,使得数据交换不依赖于网格类型和数据类型,从而实现任意网格类型并行通信模式的统一.作为气动数据生产的“数值风洞”,要求代码将并行隔离至底层,为此针对主流计算机系统的特点,设计了粗粒度MPI/OpenMP混合并行模式,领域专家只需关注求解器开发而无需关注并行通信,在提高可移植性、可扩展性的同时尽可能兼顾封装性.针对大规模并行计算的实际工程需求,设计了并行分区、大规模并行文件存储模式,以缩短前置处理和文件I/O时间.最后,分别基于结构网格、非结构网格和重叠网格,给出了工程应用领域的标模算例,以说明PHengLEI并行计算框架对不同网格类型的适应性.大规模网格测试结果表明,国产定制集群上16.38万核并行效率达83%以上,“天河二号”上近10万核并行效率达95%以上,展现了较好的可扩展性和并行计算效率. 展开更多
关键词 并行计算 mpi/openmp混合并行 CFD并行计算框架 PHengLEI 风雷软件 HyperFLOW
在线阅读 下载PDF
基于MPI+OpenMP的三维声波方程正演模拟 被引量:5
9
作者 宋鹏 解闯 +3 位作者 李金山 谭军 刘伟 谭惠文 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第9期97-102,129,共7页
针对三维声波方程数值模拟的大计算量和大内存消耗问题,研究并实现了基于MPI+OpenMP的三维声波方程数值模拟并行算法,在PC-Cluster的计算节点间采用基于MPI的按炮分任务的多进程并行模式,在计算节点内采用基于OpenMP的按空间分任务的多... 针对三维声波方程数值模拟的大计算量和大内存消耗问题,研究并实现了基于MPI+OpenMP的三维声波方程数值模拟并行算法,在PC-Cluster的计算节点间采用基于MPI的按炮分任务的多进程并行模式,在计算节点内采用基于OpenMP的按空间分任务的多线程并行模式,以有效地利用计算和存储资源。3D-Overthrust模型的实验结果显示,基于MPI+OpenMP的三维声波方程数值模拟并行算法的计算效率与基于MPI的按炮分任务并行计算模式相当,但其内存消耗远远低于后者,其更适合于基于大模型或实际模型的三维模拟。 展开更多
关键词 三维声波方程 正演模拟 并行计算 mpi+openmp
在线阅读 下载PDF
基于超级计算机平台的并行解技术在卫星重力测量中的应用 被引量:5
10
作者 聂琳娟 申文斌 +1 位作者 王正涛 金涛勇 《大地测量与地球动力学》 CSCD 北大核心 2012年第2期64-68,73,共6页
分析超级计算机平台的并行解技术应用于卫星重力测量中的相关问题,对涉及的矩阵运算并行化给出了数值计算和分析,并利用卫星重力扰动位观测基于最小二乘直接解法,比较了OpenMP和MPI两种并行化技术的计算效率。
关键词 卫星重力 并行计算 重力位模型 openmp mpi
在线阅读 下载PDF
利用混合编程改善SMP机群上并行矩阵乘法的性能 被引量:6
11
作者 吴建平 王正华 李晓梅 《国防科技大学学报》 EI CAS CSCD 北大核心 2006年第4期68-72,共5页
针对SMP机群,探讨了分别利用单机优化、OpenMP与MPI从指令级、共享存储级与分布主存级三个层次上改善矩阵并行乘Fox算法性能的方法。并通过调用数学函数库与混合编程的方式,在深腾6800上进行了实验,取得了相当满意的数值效果。
关键词 SMP机群 openmp mpi 混合编程 Fox算法
在线阅读 下载PDF
多核集群系统下的混合并行遗传算法研究 被引量:6
12
作者 王竹荣 巨涛 马凡 《计算机科学》 CSCD 北大核心 2011年第7期194-199,共6页
为应对传统遗传算法在处理大规模组合优化问题面临的进化速度缓慢,难以达到实时要求的严峻挑战,提出了一种在多核PC集群系统上实现"粗粒度-主从式"混合并行遗传算法的模型:通过把"粗粒度-主从式"并行遗传算法映射... 为应对传统遗传算法在处理大规模组合优化问题面临的进化速度缓慢,难以达到实时要求的严峻挑战,提出了一种在多核PC集群系统上实现"粗粒度-主从式"混合并行遗传算法的模型:通过把"粗粒度-主从式"并行遗传算法映射到多核PC集群上,结合消息传递和共享存储两种并行编程模型,在节点间使用消息传递模型(MPI),对应的遗传算法为粗粒度并行遗传算法,在节点内使用共享存储模型(OpenMP),对应的遗传算法为主从式并行遗传算法,用MPI和OpenMP混合编程的方式以进程和线程两级并行在多核集群上实现具体的混合并行遗传算法。理论分析和实验结果表明,提出的实现模型有较好的性能,可大大改进传统遗传算法的缺陷。为利用并行遗传算法在普通多核PC集群上处理大规模组合优化问题提出了一种有效、可行的解决方案。 展开更多
关键词 混合并行遗传算法 多核集群系统 openmp mpi
在线阅读 下载PDF
基于SMP集群的三维网格多粒度混合并行编程模型 被引量:6
13
作者 于方 郑晓薇 孙晓鹏 《计算机应用与软件》 CSCD 2009年第3期138-140,166,共4页
为提高大规模三维网格并行算法的执行效率,针对SMP集群分布/共享两级内存层次结构的特点,介绍适用于SMP集群混合编程的不同实现方法。对三维网格模型最短路径问题的并行求解提出了多粒度混合并行编程模型,给出了实现该问题的MPI+OpenMP... 为提高大规模三维网格并行算法的执行效率,针对SMP集群分布/共享两级内存层次结构的特点,介绍适用于SMP集群混合编程的不同实现方法。对三维网格模型最短路径问题的并行求解提出了多粒度混合并行编程模型,给出了实现该问题的MPI+OpenMP混合并行算法,并在SMP集群上同粗粒度MPI(Message Passing Interface)并行算法做了性能比较。结果表明,采用该多粒度混合并行编程模型具有更好的加速比和运行效率。 展开更多
关键词 SMP集群 分布/共享内存 mpi+openmp 混合编程模型 三维网格
在线阅读 下载PDF
适用于混合网格的并行GMRES+LU-SGS方法 被引量:3
14
作者 康忠良 阎超 《空气动力学学报》 CSCD 北大核心 2013年第2期225-230,共6页
给出了一种适用于混合网格的并行无矩阵GMRES+LU-SGS隐式时间格式。首先采用LU-SGS方法迭代若干步以获得一个合适的初场,然后切换到GMRES方法在每一时间步内近似求解,并将LU-SGS方法作为其预处理器。为加速收敛,将CFL数随着残差的降低... 给出了一种适用于混合网格的并行无矩阵GMRES+LU-SGS隐式时间格式。首先采用LU-SGS方法迭代若干步以获得一个合适的初场,然后切换到GMRES方法在每一时间步内近似求解,并将LU-SGS方法作为其预处理器。为加速收敛,将CFL数随着残差的降低逐步放大;为减少存储量和计算量,通量Jacobian采用无矩阵处理。在保证与串行执行一致的前提下,采用基于共享内存的OpenMP方法实现了并行计算,并通过对网格的分组避免了内存争夺。算例验证表明,方法极大地提高了计算收敛效率,并行结果与串行结果完全一致,计算结果与实验结果吻合较好。 展开更多
关键词 混合网格 并行计算 GMRES 隐式格式 openmp
在线阅读 下载PDF
基于CMP多核集群的混合并行编程技术研究 被引量:1
15
作者 王文义 王春霞 王杰 《计算机科学》 CSCD 北大核心 2014年第2期19-22,共4页
高性能科学计算(High Performance Science Computing,简称HPC)是验证某些理论和测试计算机系统处理能力的一种有效的实验手段。鉴于目前CMP(Chip Multi-processor)多核集群已变得越来越普及,尝试对由MPI和OpenMP两种不同并行编程技术... 高性能科学计算(High Performance Science Computing,简称HPC)是验证某些理论和测试计算机系统处理能力的一种有效的实验手段。鉴于目前CMP(Chip Multi-processor)多核集群已变得越来越普及,尝试对由MPI和OpenMP两种不同并行编程技术构成的混合编程模式做一些实验性的研究。通过对程序执行时间和加速比的实验数据分析,可以看出在多核和多节点集群上采用细粒度的混合并行编程方法较单一使用MPI并行编程方法更加合理和高效,也更能体现出系统硬软件的特性与优势。 展开更多
关键词 高性能计算 CMP多核集群 墙钟时间 mpi+openmp混合并行编程
在线阅读 下载PDF
基于P2P的保护定值在线校核混合并行算法 被引量:2
16
作者 刘高明 宋玮 仇向东 《南方电网技术》 2014年第2期60-64,共5页
考虑到大型互联电网规模的逐渐扩大,尤其是"三华"特高压同步电网的顺利投运,传统的集中式计算会遇到硬件计算能力的瓶颈,提出了一种基于P2P的保护定值在线校核混合并行算法。充分利用P2P网络技术的对等通信,实现区域间信息的... 考虑到大型互联电网规模的逐渐扩大,尤其是"三华"特高压同步电网的顺利投运,传统的集中式计算会遇到硬件计算能力的瓶颈,提出了一种基于P2P的保护定值在线校核混合并行算法。充分利用P2P网络技术的对等通信,实现区域间信息的对等交互,重点介绍了MPI+OpenMP的混合并行编程模型以及算法的设计,对在线校核进行了并行性分析,实现了在线校核进程级与线程级的两级并行。最后,在基于P2P技术的分布式并行计算平台上,对混合并行算法进行了测试比较,结果表明所提出的算法正确且有效。 展开更多
关键词 保护定值在线校核 P2P 混合并行计算 mpi openmp
在线阅读 下载PDF
用OpenMP并行化气象预报模式试验 被引量:4
17
作者 朱政慧 施培量 颜宏 《应用气象学报》 CSCD 北大核心 2002年第1期102-108,共7页
介绍可移植的共享内存并行编程应用程序接口OpenMP ,通过对浅水波模式和复杂地形下的嵌套细网格模式的并行计算试验 ,探讨它用于并行化气象预报模式的可行性 。
关键词 并行计算 openmp mpi 可行性 计算 气象预报模式
在线阅读 下载PDF
基于数据分治与双层索引的并行点面叠加分析方法研究 被引量:2
18
作者 周玉科 周成虎 +4 位作者 马廷 高锡章 范俊甫 许涛 季民 《地理与地理信息科学》 CSCD 北大核心 2015年第2期1-6,共6页
地图叠加分析是一种计算密集型算法,并行化计算是加快算法执行速度的一种有效方法。该文研究分布式环境下的点面图层并行化叠加分析方法与实现。首先根据点面叠加的特点设置并行数据分解的方式,基于分治法分解空间数据,在并行系统下将... 地图叠加分析是一种计算密集型算法,并行化计算是加快算法执行速度的一种有效方法。该文研究分布式环境下的点面图层并行化叠加分析方法与实现。首先根据点面叠加的特点设置并行数据分解的方式,基于分治法分解空间数据,在并行系统下将地理要素分而治之。然后引入双层索引的并行叠加机制,一是对面图层根据Hilbert空间索引的排序方式分发数据,二是对点图层建立四叉树索引,对每一个进行相交运算的多边形进行快速过滤和求交。最后在Linux集群系统下实现该并行算法,其一利用MPI分布式计算环境实现在整体计算框架下的消息通讯模式的并行,其二在每个子节点中实现基于多核OpenMP工具的本地并行化。结果表明,利用双层空间索引分治的方法可实现并行数据分块,各子节点实现独立计算,减少并行系统中的I/O冲突,并行加速比明显。该方法对矢量地图运算的并行化进行了有益的尝试,为大数据时代的空间数据分析提供一种有效的途径。 展开更多
关键词 地图叠加分析 并行计算 空间索引 mpi openmp
在线阅读 下载PDF
SMP集群系统上矩阵特征问题并行求解器的有效算法 被引量:5
19
作者 赵永华 迟学斌 程强 《计算机研究与发展》 EI CSCD 北大核心 2007年第2期334-340,共7页
对称矩阵三对角化和三对角对称矩阵的特征值求解是稠密对称矩阵特征问题并行求解器的关键步.针对SMP集群系统的多级体系结构,基于Householder变换的矩阵三对角化和三对角矩阵特征值问题的分而治之算法,给出了它们的MPI+OpenMP混合并行算... 对称矩阵三对角化和三对角对称矩阵的特征值求解是稠密对称矩阵特征问题并行求解器的关键步.针对SMP集群系统的多级体系结构,基于Householder变换的矩阵三对角化和三对角矩阵特征值问题的分而治之算法,给出了它们的MPI+OpenMP混合并行算法.算法研究集中在SMP集群系统环境下的负载平衡、通信开销和性能评价.混合并行算法的设计结合了粗粒度线程并行模式和任务共享的动态调用方法,改善了MPI算法中的负载平衡问题、降低了通信开销.在深腾6800上的实验表明,基于混合并行算法的求解器比纯MPI版本的求解器具有更好的性能和可扩展性. 展开更多
关键词 SMP集群系统 mpi+openmp 混合并行算法 矩阵特征值问题 并行求解器
在线阅读 下载PDF
多核机群下MPI程序优化技术的研究 被引量:2
20
作者 王洁 衷璐洁 曾宇 《计算机科学》 CSCD 北大核心 2011年第10期281-284,共4页
多核处理器的新特性使多核机群的存储层次更加复杂,同时也给MPI程序带来了新的优化空间。国内外学者提出了许多多核机群下MPI程序的优化方法和技术。测试了3个不同多核机群的通信性能,并分别在Intel与AMD多核机群下实验评估了几种具有... 多核处理器的新特性使多核机群的存储层次更加复杂,同时也给MPI程序带来了新的优化空间。国内外学者提出了许多多核机群下MPI程序的优化方法和技术。测试了3个不同多核机群的通信性能,并分别在Intel与AMD多核机群下实验评估了几种具有普遍意义的优化技术:混合MPI/OpenMP、优化MPI运行时参数以及优化MPI进程摆放,同时对实验结果和优化性能进行了分析。 展开更多
关键词 多核机群 存储层次化 mpi程序优化 混合mpi/openmp mpi运行时参数 mpi进程摆放
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部