期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
MPI程序同步通信基本模型死锁检测 被引量:6
1
作者 廖名学 范植华 《电子学报》 EI CAS CSCD 北大核心 2008年第2期402-407,共6页
本文提出了MPI程序的同步通信模型及三个基本简化模型,给出了判定这些基本模型是否死锁的方法和定理并予以了严格证明.简化模型的死锁检测理论和方法是真实MPI程序死锁检测的必要基础.这些方法基于程序静态分析,必要时进行运行时检测,... 本文提出了MPI程序的同步通信模型及三个基本简化模型,给出了判定这些基本模型是否死锁的方法和定理并予以了严格证明.简化模型的死锁检测理论和方法是真实MPI程序死锁检测的必要基础.这些方法基于程序静态分析,必要时进行运行时检测,它们对两种简化模型可以在程序编译前确定是否死锁,对另外一种模型,在编译前可静态确定部分死锁,运行中可确定其他死锁.我们的理论可以证明MPI程序死锁检测主流算法的正确性,其方法可以减少它们对客户源代码或MPI profiling接口的修改量,从而大大降低死锁检测开销,并可在运行前判定死锁. 展开更多
关键词 mpi(message passing interface) 死锁 同步通信
在线阅读 下载PDF
基于MPI+CUDA的异构并行可压缩流求解器 被引量:7
2
作者 刘枫 李桦 +1 位作者 田正雨 潘沙 《国防科技大学学报》 EI CAS CSCD 北大核心 2014年第1期6-10,共5页
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数... 在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求解器鲁棒性好,计算效率较CPU同构并行计算提高10倍以上。 展开更多
关键词 消息传递接口 统一计算设备架构 异构计算 可压缩流
在线阅读 下载PDF
基于MPI的OBC三维多波多分量地震观测正演模拟并行算法实现 被引量:5
3
作者 周丽 顾汉明 +3 位作者 成景旺 刘春成 刘志斌 杨小春 《石油物探》 EI CSCD 北大核心 2014年第6期665-674,共10页
针对海上OBC三维地震观测正演数值模拟的海量计算需求,研究并实现了基于信息传递接口(Message Passing Interface,MPI)并行平台的交错网格有限差分数值模拟并行算法。该算法能够以三维任意偶阶空间精度从X,Y和Z3个方向同时实现并行运算... 针对海上OBC三维地震观测正演数值模拟的海量计算需求,研究并实现了基于信息传递接口(Message Passing Interface,MPI)并行平台的交错网格有限差分数值模拟并行算法。该算法能够以三维任意偶阶空间精度从X,Y和Z3个方向同时实现并行运算,可以任意选择空间并行计算方向以及并行计算的进程个数。在算法实现过程中,引入了进程坐标系的概念,使得每一个参与计算的进程对应一个进程坐标,通过进程坐标来判断边界条件的使用;同时引入虚拟进程以方便模型边界处的数据交换。通过层状模型采用不同计算进程个数的正演计算验证了该并行算法的可行性和运行效率;最后对海上某靶区三维地质模型进行了Patch观测系统下的多波多分量地震观测正演并行模拟。 展开更多
关键词 OBC观测 多波多分量地震勘探 mpi 进程坐标系 并行模拟
在线阅读 下载PDF
基于MPI的地下水数值模拟并行算法研究 被引量:3
4
作者 黄林显 邵景力 +2 位作者 崔亚莉 李玲 程汤培 《安徽农业科学》 CAS 2012年第12期7356-7358,共3页
地下水数值模拟是研究分析各种地下水问题的重要手段。针对传统地下水数值模拟串行算法在处理海量数据模型时计算时间长、运行效率低的特点,在分布式存储系统上利用消息传递标准MPI,设计了一种采用Cholesky预条件子,粗粒度、低通信开销... 地下水数值模拟是研究分析各种地下水问题的重要手段。针对传统地下水数值模拟串行算法在处理海量数据模型时计算时间长、运行效率低的特点,在分布式存储系统上利用消息传递标准MPI,设计了一种采用Cholesky预条件子,粗粒度、低通信开销的PCG并行算法。通过在具有4个处理核心的Linux集群环境中的测试可知,该程序运行所获得的加速比会随着处理核心数的增加而不断增大,并在4个处理核心数的时候获得最大加速比2.21,说明所设计的PCG并行算法具有较好的加速效果和可扩展性。 展开更多
关键词 地下水数值模拟 并行算法 消息传递标准mpi 预处理共轭梯度法
在线阅读 下载PDF
基于MPI实现粗糙地面电磁散射并行FDTD计算 被引量:2
5
作者 齐国雷 胡浩 +2 位作者 周东方 候德亭 张闯 《微波学报》 CSCD 北大核心 2010年第4期19-23,共5页
提出了在由微机互连构成的机群(COW)并行计算系统上应用信息传递的方式实现粗糙地面散射并行FDTD算法。综合考虑了区域分割和负载平衡因素,并详细分析了子区域在普通网格和吸收边界处与相邻子区域的场值的数据传递,提高了二维粗糙地面F... 提出了在由微机互连构成的机群(COW)并行计算系统上应用信息传递的方式实现粗糙地面散射并行FDTD算法。综合考虑了区域分割和负载平衡因素,并详细分析了子区域在普通网格和吸收边界处与相邻子区域的场值的数据传递,提高了二维粗糙地面FDTD并行计算效率。解决了在计算电大尺寸粗糙地面散射时产生的内存不足和计算耗时长等瓶颈问题。理论分析和数值计算结果验证了该算法的正确性;当计算电大尺寸的粗糙地面散射时,并行效率提升明显,即当参与计算的处理器数量达到6个时,并行效率仍然可以保持在90%以上。 展开更多
关键词 并行计算 时域有限差分 粗糙地面 电磁散射 信息传递接口(mpi)
在线阅读 下载PDF
MPI并行编程环境及程序设计 被引量:8
6
作者 杨爱民 陈一鸣 《河北理工学院学报》 CAS 2005年第3期41-43,共3页
通过对MPI原理和特点的研究,给出了并行MPI程序的基本设计思路和执行过程,并实现了向量相加的并行计算。
关键词 mpi 并行编程 消息传递
在线阅读 下载PDF
Linux环境下MPI并行编程与算法实现研究 被引量:5
7
作者 曾志峰 《航空计算技术》 2004年第2期61-64,共4页
并行计算实现求解一些复杂的问题,并行编程技术的进步使得并行计算逐步应用到很多领域。MPI是一种消息传递编程模型并可以被广泛使用的编写消息传递程序的标准,已扩展为一种优秀的并行程序设计语言。该文简要介绍了有关并行编程的基本... 并行计算实现求解一些复杂的问题,并行编程技术的进步使得并行计算逐步应用到很多领域。MPI是一种消息传递编程模型并可以被广泛使用的编写消息传递程序的标准,已扩展为一种优秀的并行程序设计语言。该文简要介绍了有关并行编程的基本概念与方法,深入讨论了MPI并行编程环境与并行编程模式,对MPI并行性进行了分析,给出了Linux环境下MPI编程环境的配置方法,最后结合一个实例详细描述了用MPI实现并行算法的方法。通过对实验程序的结果分析,在Linux机群环境下用MPI实现复杂的并行算法是简单的,并且能取得较好的性能。 展开更多
关键词 LINUX操作系统 mpi 并行编程 算法 通信模式 消息传递编程模型
在线阅读 下载PDF
基于云平台的MPI研究与应用 被引量:4
8
作者 商娟叶 《电子设计工程》 2015年第16期175-177,181,共4页
为满足信息化处理需求的增长,提出MPI在云计算领域的应用研究。文章在介绍了云计算的优势、MPI概念的基础上,将MPI并行程序与并行机群系统及云计算平台整合在一起,借助Hadoop框架,充分利用Map Reduce模式来实现并行化云计算对应的MPI算... 为满足信息化处理需求的增长,提出MPI在云计算领域的应用研究。文章在介绍了云计算的优势、MPI概念的基础上,将MPI并行程序与并行机群系统及云计算平台整合在一起,借助Hadoop框架,充分利用Map Reduce模式来实现并行化云计算对应的MPI算法。研究结果分析表明,该算法是可行的,可有效提高MPI并行处理的性能。 展开更多
关键词 云平台 并行处理 消息传递接口 Hadoop架构 MapReduce模式
在线阅读 下载PDF
产生安全椭圆曲线的MPI并行实现 被引量:1
9
作者 杨浩淼 江春华 《成都信息工程学院学报》 2005年第2期138-141,共4页
快速产生安全的椭圆曲线是椭圆曲线密码体制(ECC)理论研究和实际应用的前提和基础,构造给定阶的椭圆曲线的复乘(CM)方法,是实践中构造安全椭圆曲线最常用的方法。基于消息传递接口(MPI)的并行实现了复乘方法,实验表明,在两台主机上加速... 快速产生安全的椭圆曲线是椭圆曲线密码体制(ECC)理论研究和实际应用的前提和基础,构造给定阶的椭圆曲线的复乘(CM)方法,是实践中构造安全椭圆曲线最常用的方法。基于消息传递接口(MPI)的并行实现了复乘方法,实验表明,在两台主机上加速比达到了1 38。 展开更多
关键词 椭圆曲线密码体制(ECC) 复乘(CM)方法 消息传递接口(mpi)
在线阅读 下载PDF
基于MPI和OpenCL多层次并行图像卷积算法设计
10
作者 王继刚 刘惠 姜滨 《中兴通讯技术》 2015年第2期53-55,62,共4页
通过对图像卷积算法的分析,发现算法在对图像处理的过程中具有很高的并行性。提出了一种结合异构开发框架开放运算语言(Open CL)和并行开发库消息传递接口(MPI)的算法,在支持图形处理器(GPU)的异构集群环境下设计并实现了图像卷积算法... 通过对图像卷积算法的分析,发现算法在对图像处理的过程中具有很高的并行性。提出了一种结合异构开发框架开放运算语言(Open CL)和并行开发库消息传递接口(MPI)的算法,在支持图形处理器(GPU)的异构集群环境下设计并实现了图像卷积算法的多层次并行实现,使得算法在处理速度上有了显著的提升。 展开更多
关键词 异构集群 消息传递接口 开放运算语言 图像卷积
在线阅读 下载PDF
MPI下三维FDTD并行运算的分析与实现
11
作者 宋永 杨阔 《电子设计工程》 2013年第4期156-158,161,共4页
基于Message-Passing Interface(MPI)的编程环境,以PML(Perfectly Matched Layer)为吸收边界条件,讨论了时域有限差分法FDTD的三维并行运算情况。通过一定的数值计算,定量地给出了MPI下FDTD并行算法中的网格数、进程数、分割方式三者之... 基于Message-Passing Interface(MPI)的编程环境,以PML(Perfectly Matched Layer)为吸收边界条件,讨论了时域有限差分法FDTD的三维并行运算情况。通过一定的数值计算,定量地给出了MPI下FDTD并行算法中的网格数、进程数、分割方式三者之间的关系以及对计算效率的影响。 展开更多
关键词 时域有限差分法 并行算法 mpi PML吸收边界
在线阅读 下载PDF
用MPI实现FDTD网络并行电磁散射运算 被引量:4
12
作者 冯峰 逯贵祯 关亚林 《微波学报》 CSCD 北大核心 2006年第2期11-16,共6页
提出了在由微机互连构成的机群(COW)并行计算系统上应用基于消息传递(M essage Passing)的方式实现二维FDTD并行算法。通过区域分割,各个子区域在边界处与其相邻的子区域进行场值的数据传递,从而实现FDTD并行计算。文中还仔细分析了与F... 提出了在由微机互连构成的机群(COW)并行计算系统上应用基于消息传递(M essage Passing)的方式实现二维FDTD并行算法。通过区域分割,各个子区域在边界处与其相邻的子区域进行场值的数据传递,从而实现FDTD并行计算。文中还仔细分析了与FDTD相关的外围边界的并行化处理。文中以二维金属方柱算例验证了算法的正确性和有效性,并将本文实现的加速比以及并行效率与其它文献进行了比较,从而为运用FDTD方法进行电大尺寸复杂电磁问题数值模拟计算提供了一条有效途径。 展开更多
关键词 时域有限差分 网络并行计算 区域分割技术 工作站机群 mpi
在线阅读 下载PDF
MPI并行编程环境若干技术研究 被引量:9
13
作者 李东 李晓明 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 1996年第4期25-28,共4页
通过对基于消息传递的并行程序开发环境MPI的研究分析,指出了目前常用的一些基于消息传递的并行编程环境的不足,并详细说明了为克服上述不足而引入的新概念和新方法.最后,指出了MPI中尚待解决的若干问题.
关键词 mpi 并行编程 硬件平台 工作站 计算机
在线阅读 下载PDF
Parallelizing AT with open multi-processing and MPI
14
作者 罗承明 田顺强 +3 位作者 王坤 张满洲 张庆磊 姜伯承 《Nuclear Science and Techniques》 SCIE CAS CSCD 2015年第3期17-20,共4页
Simulating charged particle motion through the elements is necessary to understand modern particle accelerators. The particle numbers and the circling turns in a synchrotron are huge, and a simulation can be timeconsu... Simulating charged particle motion through the elements is necessary to understand modern particle accelerators. The particle numbers and the circling turns in a synchrotron are huge, and a simulation can be timeconsuming. Open multi-processing(Open MP) is a convenient method to speed up the computing of multi-cores for computers based on share memory model. Using message passing interface(MPI) which is based on nonuniform memory access architecture, a coarse grain parallel algorithm is set up for the Accelerator Toolbox(AT)for dynamic tracking processes. The computing speedup of the tracking process is 3.77 times with a quad-core CPU computer and the speed almost grows linearly with the number of CPU. 展开更多
关键词 多处理技术 并行算法 mpi 开放式 粒子加速器 带电粒子运动 消息传递接口 动态跟踪
在线阅读 下载PDF
基于MPI+OpenMP的雷达信号脉内分析并行加速方法
15
作者 姚群 童真 柴恒 《舰船电子对抗》 2023年第4期66-69,79,共5页
雷达脉内分析一般采用中频数据,数据量大,处理算法复杂,运算量大,实时性差。基于多节点高性能多核CPU信号处理平台,提出了一种基于消息传递接口(MPI)+开放式多处理(OpenMP)的雷达信号脉内分析技术,综合利用了MPI跨节点并行以及OpenMP节... 雷达脉内分析一般采用中频数据,数据量大,处理算法复杂,运算量大,实时性差。基于多节点高性能多核CPU信号处理平台,提出了一种基于消息传递接口(MPI)+开放式多处理(OpenMP)的雷达信号脉内分析技术,综合利用了MPI跨节点并行以及OpenMP节点内并行的特点,实现了雷达信号脉内分析的高性能脉冲级并行处理。在基于IntelXeon2640构建的多节点集群系统上的测试结果表明,该方法显著的提高了脉内分析的处理速度。 展开更多
关键词 信号处理 消息传递接口 OPENMP 脉内分析
在线阅读 下载PDF
基于并行迭代动态规划的聚合物驱最优控制求解 被引量:4
16
作者 郭兰磊 李树荣 +1 位作者 张玉斌 雷阳 《中国石油大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第3期167-171,174,共6页
针对迭代动态规划计算量大,耗费时间长的特点,基于实验室搭建的PC机群,以消息传递库MPICH为编程工具,搭建一个并行计算平台,给出一种主从式的并行迭代动态规划算法,利用该算法对聚合物驱最优控制问题进行求解,并与串行计算结果进行对比... 针对迭代动态规划计算量大,耗费时间长的特点,基于实验室搭建的PC机群,以消息传递库MPICH为编程工具,搭建一个并行计算平台,给出一种主从式的并行迭代动态规划算法,利用该算法对聚合物驱最优控制问题进行求解,并与串行计算结果进行对比。结果表明:在大规模的优化问题中并行迭代动态规划算法与串行算法结果一致,但表现出较高的并行效率和加速比;并行算法求解的效率受到主节点分配任务时是否均衡的影响。 展开更多
关键词 迭代动态规划 消息传递接口 最优控制 并行化 聚合物驱
在线阅读 下载PDF
中等雷诺数方柱绕流的直接数值模拟及涡系分析 被引量:6
17
作者 王建春 吴乘胜 +1 位作者 王星 徐金秀 《船舶力学》 EI CSCD 北大核心 2019年第8期893-905,共13页
作为一种典型的钝体绕流,方柱绕流具有物体几何外形简单而流场结构非常复杂的特性,常规的基于RANS的数值计算方法难以准确模拟。DNS不使用任何湍流模型,直接求解完整的非定常流动控制方程组,模拟包括脉动在内的湍流所有非定常流动量的... 作为一种典型的钝体绕流,方柱绕流具有物体几何外形简单而流场结构非常复杂的特性,常规的基于RANS的数值计算方法难以准确模拟。DNS不使用任何湍流模型,直接求解完整的非定常流动控制方程组,模拟包括脉动在内的湍流所有非定常流动量的时空演变过程,是湍流数值模拟中最精确的方法,在复杂流动数值模拟方面的应用潜力巨大。本文自主设计和编制并行数值模拟程序,使用基于"神威·太湖之光"国产CPU架构的大规模并行计算,开展了中等雷诺数(Re=10 000)方柱绕流的直接数值模拟。其中:不可压N-S方程组采用基于交错网格的有限体积法离散;压力-速度耦合采用SIMPLE算法处理;离散得到的代数方程组采用Gauss-Seidel迭代求解;时间步进采用Euler隐式格式,对流项采用QUICK格式,耗散项采用中心差分格式;数值模拟程序的并行化使用MPI方法处理。文中重点分析了方柱绕流的复杂涡系结构,同时给出了部分湍流统计结果,并通过与RANS和LES模拟结果的对比分析,展现了DNS在复杂精细流场模拟方面的优势。 展开更多
关键词 直接数值模拟 方柱绕流 涡系结构 mpi并行 国产CPU架构
在线阅读 下载PDF
直接数值模拟中三对角方程组并行算法研究 被引量:2
18
作者 周俊虎 朱晨洁 +3 位作者 王智化 张彦威 樊建人 岑可法 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2005年第9期1439-1444,共6页
为了提高大规模直接数值模拟(DNS)中三对角方程组的并行求解效率,提出了一种并行分裂算法.该算法基于Wang 的分裂算法,采用平均分配策略划分三对角方程组,利用非阻塞通信模式取代阻塞通信模式,以原有空间存储新的计算结果.在Linux集群... 为了提高大规模直接数值模拟(DNS)中三对角方程组的并行求解效率,提出了一种并行分裂算法.该算法基于Wang 的分裂算法,采用平均分配策略划分三对角方程组,利用非阻塞通信模式取代阻塞通信模式,以原有空间存储新的计算结果.在Linux集群服务器上进行了两种不同规模三对角方程组的实现,并研究了不同节点数目与计算规模下的计算时间和加速比.结果表明,该算法的计算与通信重叠度高,计算步骤和存储开销小,具有较高的并行计算效率.在百兆网络条件下,从1×105规模矩阵开始具有明显并行优势,并且随矩阵规模增大,加速比不断提高.该算法适用于大规模三对角矩阵的并行计算. 展开更多
关键词 三对角方程组 并行算法 消息传递接口 加速比
在线阅读 下载PDF
基于PC机群并行环境的构建方法 被引量:4
19
作者 花嵘 傅游 《山东科技大学学报(自然科学版)》 CAS 2002年第3期28-30,共3页
介绍一种用于高性能计算的并行环境 PC机群 ,从硬件平台和软件环境两个方面讲述了它的构建方法 ,并简单介绍了MPICH并行环境的使用方法。
关键词 并行环境 构建方法 并行计算 硬件平台 软件环境 开放式机群系统 PC机群系统 mpiCH
在线阅读 下载PDF
并行FDTD结合服务器分析电大电磁问题 被引量:3
20
作者 雷继兆 梁昌洪 张玉 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2009年第5期846-850,共5页
为了在刀片服务器平台发挥并行FDTD的最佳性能,以舰船模型上两根超短波天线的远场辐射分析为例,采用各种节点配置和MPI虚拟拓扑结构进行计算,分析了不同MPI虚拟拓扑对并行性能的影响,提出了刀片服务器平台中MPI编程环境的并行FDTD的最... 为了在刀片服务器平台发挥并行FDTD的最佳性能,以舰船模型上两根超短波天线的远场辐射分析为例,采用各种节点配置和MPI虚拟拓扑结构进行计算,分析了不同MPI虚拟拓扑对并行性能的影响,提出了刀片服务器平台中MPI编程环境的并行FDTD的最佳虚拟拓扑选择原则.以F117飞机模型为例,利用该方法准确快速地计算了其工作于2 GHz的雷达散射截面,该问题需很大内存,基于PC集群的并行FDTD无法处理. 展开更多
关键词 时域有限差分法 并行计算 电大平台 电磁散射 mpi
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部