期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
面向国产异构众核系统的Parallel C语言设计与实现 被引量:10
1
作者 何王全 刘勇 +2 位作者 方燕飞 魏迪 漆锋滨 《软件学报》 EI CSCD 北大核心 2017年第4期764-785,共22页
异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、... 异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、提升并行程序的性能都具有重要的意义.提出统一架构的多模式并行编程模型,包括异构融合的加速运算模型和按同构方式编程的自主运算模型,根据编程模型设计了Parallel C语言,能够有效地描述国产众核系统的异构并行性.与其他众核系统上MPI+X的使用模式相比,编程和系统优化都具有全局视角,在多级局部性描述、单边消息、兼容已有多核应用等方面具有特色;基于Open64构建了Parallel C编译系统,全面支持加速运算模型和自主运算模型,提出并实现了数据布局与自动DMA、编译指导的线程代理和拓扑位置感知的集合通信等优化.Micro Benchmark和实际应用在神威太湖之光计算机系统上的测试数据结果表明:Parallel C语言和编译系统具有良好的性能和可扩展性,能够有效支撑大型应用. 展开更多
关键词 异构众核 编程模型 并行语言 parallel C 编译器 消息传递
在线阅读 下载PDF
一种基于Message Passing的并行程序设计技术 被引量:1
2
作者 温钰洪 王鼎兴 +1 位作者 沈美明 郑纬民 《小型微型计算机系统》 CSCD 北大核心 1995年第5期7-13,共7页
本文首先分析介绍构造并行计算机系统的两种方法:Multiprocessors和Multicomputers,然后介绍一种Multicomputers并行计算机系统中基于messagepassing的并行程序设计环境以... 本文首先分析介绍构造并行计算机系统的两种方法:Multiprocessors和Multicomputers,然后介绍一种Multicomputers并行计算机系统中基于messagepassing的并行程序设计环境以及并行程序设计方法,它具有程序设计简单、直观等特点,易于构造程序模型,并能获得较好的加速比。 展开更多
关键词 程序设计 并行程序 并行计算机
在线阅读 下载PDF
MPI:大有希望的massage_passing标准 被引量:1
3
作者 王继龙 唐朔飞 方滨兴 《计算机科学》 CSCD 北大核心 1996年第4期31-34,共4页
message-passing是一个被广泛应用的并行计算模型,但至今,无论从语法或语义上message-Passing都还没有形成一个标准.并行计算机厂商在提供标准串行语言的同时,提供了各自不同的专有message一passing库,并行程序设计难免依赖于具体的系... message-passing是一个被广泛应用的并行计算模型,但至今,无论从语法或语义上message-Passing都还没有形成一个标准.并行计算机厂商在提供标准串行语言的同时,提供了各自不同的专有message一passing库,并行程序设计难免依赖于具体的系统和应用,这既限制了可移植性,也限制了听取用户对某些不易获得或对当前的应用不合适的系统的意见。没有一个标准,厂商们非常自然地把他们的专有库的优点视为有竟争力的优势,更加着力与众不同(因而不可移植)。为了应付可移植问题,研究团体已经开发了许多库来收集其它库之间的不同点. 展开更多
关键词 并行程序设计 MPI MASSAGE passing 标准
在线阅读 下载PDF
梯级水电站群长期优化调度云计算随机动态规划算法 被引量:17
4
作者 周东清 彭世玉 +1 位作者 程春田 王健 《中国电机工程学报》 EI CSCD 北大核心 2017年第12期3437-3448,共12页
为了应对随机动态规划算法在解决梯级水电站群长期发电优化调度时的"维数灾"问题,并行化方法得到了广泛研究。单机多核并行算法扩展性不强;传统的分布式并行算法编程复杂,缺少负载均衡和容错机制。云计算平台作为新的分布式... 为了应对随机动态规划算法在解决梯级水电站群长期发电优化调度时的"维数灾"问题,并行化方法得到了广泛研究。单机多核并行算法扩展性不强;传统的分布式并行算法编程复杂,缺少负载均衡和容错机制。云计算平台作为新的分布式计算平台能够充分利用资源,具有诸多优势。为了探索云平台下的分布式并行随机动态规划模型,该文基于消息传递接口(message passing interface,MPI)和Spark框架分别实现了传统集群计算和云计算分布式随机动态规划算法,后者将计算模型转换为数据处理模型进行计算,并通过三库优化调度实验对算法进行了比较。算法分析及实验结果表明,基于云计算的分布式并行随机动态规划算法则可以有效利用云平台的优势,同时拥有完善的容错以及负载均衡机制,具有广阔的应用前景。 展开更多
关键词 随机动态规划 并行计算 云计算 消息传递接口(MPI) spark框架
在线阅读 下载PDF
GRAPES全球格点模式的并行计算负载平衡策略 被引量:7
5
作者 伍湘君 陈德辉 +3 位作者 宋君强 金之雁 杨学胜 张红亮 《气象学报》 CAS CSCD 北大核心 2010年第5期591-597,共7页
随着高性能计算机技术的发展和应用,并行计算已成为保证数值天气预报模式业务运行时效的关键技术之一。目前高性能计算机计算能力已达到每秒千万亿次浮点计算,系统中处理器数量也早已达十万甚至更多,如此巨大的计算资源对应用软件系统... 随着高性能计算机技术的发展和应用,并行计算已成为保证数值天气预报模式业务运行时效的关键技术之一。目前高性能计算机计算能力已达到每秒千万亿次浮点计算,系统中处理器数量也早已达十万甚至更多,如此巨大的计算资源对应用软件系统的设计也提出了挑战。数值天气预报软件系统要充分利用高性能计算机提供的计算资源,必须依靠并行计算方法,这包括适合计算问题的可扩展并行算法的设计、合适的数据分配方案以及良好的任务负载平衡方案。作为中国新一代数值天气预报格点模式,GRAPES(Global and Regional Assimilation and PrEdiction System)设计的最终目标是一个科研/业务通用,区域/全球通用模式。作为一个格点模式,GRAPES的并行计算具有与欧洲中期数值预报研究中心谱模式并行计算不同的特点,GRAPES的并行计算采用了经典的水平网格数据划分。但对于全球的GRAPES模式,由于采用拉格朗日差分方案,模式极地及附近区域格点与格点之间距离的减小,使得模式并行计算在采用简单的经纬网格划分方式实现时,必须考虑极地区域并行计算跨越多个处理器时导致的频繁通讯解决途径。本研究提出了利用消息传递组通讯实现全球格点模式并行计算的一种方法,其核心思想是将极点附近一定区域内的处理器按纬向划归不同的处理器组。文中还给出了该实现方法的任务分配算法,提出了改进的任务分配负载平衡方案。在中国气象局高性能计算机IBM-cluster1600上的测试表明,算法具有较好的可扩展性,其负载平衡方案改善了计算的绝对墙钟时间,使并行计算效率提高10%以上。模式的准业务运行结果表明计算墙钟时间基本可以满足数值预报业务的实时性要求。 展开更多
关键词 GRAPES模式 并行计算 消息传递组通讯 负载平衡 IBM-cluster1600
在线阅读 下载PDF
格网DEM水系提取并行算法研究 被引量:8
6
作者 江岭 刘学军 +2 位作者 阳建逸 刘凯 宋效东 《地理与地理信息科学》 CSCD 北大核心 2013年第4期62-66,共5页
作为数字地形分析的重要内容,基于格网DEM的水系提取包括DEM预处理、汇流累积及河网分级3个子过程。面对海量DEM数据,单机计算十分耗时,很难满足用户的时间相应需求。该文分析了提取过程的串行实现,基于MPI并行化工具,提出了基于双栈的... 作为数字地形分析的重要内容,基于格网DEM的水系提取包括DEM预处理、汇流累积及河网分级3个子过程。面对海量DEM数据,单机计算十分耗时,很难满足用户的时间相应需求。该文分析了提取过程的串行实现,基于MPI并行化工具,提出了基于双栈的并行策略,实现了DEM预处理、汇流累积及河网分级串行算法的并行化,完成了水系提取的并行计算。在配置Linux操作系统的集群环境下,利用不同大小的DEM数据,测试了算法的并行性能,结果表明并行算法运行时间明显低于串行算法,具有较好的并行效率。 展开更多
关键词 数字高程模型(DEM) 水系提取 并行计算 消息传递接口(MPI)
在线阅读 下载PDF
网络环境下的并行计算模型 被引量:3
7
作者 吴洁明 计永昶 陈国良 《计算机科学》 CSCD 北大核心 1999年第4期43-45,共3页
1.引言所谓网络并行计算就是将一群计算机系统用网络以某种结构互连起来,充分利用各系统资源,统一调度,协调处理,以实现高效的并行处理。它是并行分布式计算领域近年来比较活跃的研究领域。由于网络技术的发展,特别是局域网中高速数据... 1.引言所谓网络并行计算就是将一群计算机系统用网络以某种结构互连起来,充分利用各系统资源,统一调度,协调处理,以实现高效的并行处理。它是并行分布式计算领域近年来比较活跃的研究领域。由于网络技术的发展,特别是局域网中高速数据通讯网络的出现,使得利用工作站集群(NOW或COW)作为并行计算的平台越来越具有吸引力,同时也出现了许多支持异种机网络计算的软件工具环境,如MPI、PVM、EXPRESS等。NOW与巨型机和MPP系统相比,具有很高的性能价格比。 展开更多
关键词 并行计算模型 算法 网络环境 计算机
在线阅读 下载PDF
MPI+TBB混合并行编程模型在分子动力学中的应用 被引量:2
8
作者 白明泽 赵文辉 +2 位作者 豆育升 孙世新 温迪 《计算机应用研究》 CSCD 北大核心 2012年第5期1772-1774,1794,共4页
为了提高分子动力学模拟在对称多处理(SMP)集群上的计算速度,在分子动力学并行方法中引入MPI+TBB的混合并行编程模型。基于该模型,在分子动力学软件LAMMPS中设计并实现混合并行算法,在节点间采用MPI及空间分解技术实施进程级并行,节点... 为了提高分子动力学模拟在对称多处理(SMP)集群上的计算速度,在分子动力学并行方法中引入MPI+TBB的混合并行编程模型。基于该模型,在分子动力学软件LAMMPS中设计并实现混合并行算法,在节点间采用MPI及空间分解技术实施进程级并行,节点内采用TBB及临界区技术实施线程级并行。在SMP集群中的测试表明,该方法在体系较大以及节点数较多时可以明显减少通信时间,使加速比在纯MPI模型上提高45%。结果表明,MPI+TBB混合并行编程模型可促进分子动力学并行模拟且效率明显提升。 展开更多
关键词 分子动力学 混合并行编程模型 SMP集群 MPI 线程构建块
在线阅读 下载PDF
基于MPI+CUDA异步模型的并行矩阵乘法 被引量:2
9
作者 刘青昆 马名威 阎慰椿 《计算机应用》 CSCD 北大核心 2011年第12期3327-3330,共4页
矩阵乘法在科学计算领域中起着重要的作用,不同结构模型能够改善并行矩阵乘的性能。现有的MPI+CUDA同步模型中,主机端需要进入等待状态,直到设备端完成任务后才能继续工作,这显然浪费时间。针对上述问题,提出一种基于MPI+CUDA异步模型... 矩阵乘法在科学计算领域中起着重要的作用,不同结构模型能够改善并行矩阵乘的性能。现有的MPI+CUDA同步模型中,主机端需要进入等待状态,直到设备端完成任务后才能继续工作,这显然浪费时间。针对上述问题,提出一种基于MPI+CUDA异步模型的并行矩阵乘法。该模型避免了主机端进入等待状态,并采用CUDA流技术解决数据量超过GPU内存问题。通过分析异步模型的加速比和效率,实验结果表明,此方法显著提高了并行效率和大型矩阵乘法的运算速度,充分发挥了节点间分布式存储和节点内共享内存的优势,是一种有效可行的并行策略。 展开更多
关键词 矩阵乘法 并行计算 混合编程 消息传递接口 统一计算设备架构
在线阅读 下载PDF
基于天河互连的公共通信接口UCX实现与评估 被引量:2
10
作者 谢旻 周恩强 +1 位作者 董勇 张伟 《计算机应用》 CSCD 北大核心 2019年第A01期113-118,共6页
为解决在天河互连和未来高性能互连网络上支持多种高性能、可扩展并行编程模型的问题,提出了一种基于远程直接内存访问(RDMA)技术的公共通信接口UCX实现方案。该UCX实现系统建立了UCX数据抽象到天河互连系统通信资源对象的映射关系,基... 为解决在天河互连和未来高性能互连网络上支持多种高性能、可扩展并行编程模型的问题,提出了一种基于远程直接内存访问(RDMA)技术的公共通信接口UCX实现方案。该UCX实现系统建立了UCX数据抽象到天河互连系统通信资源对象的映射关系,基于短报文通信和共享的RDMA缓冲池实现了一种面向ActiveMessage和单边通信接口的高速数据传输协议,并提出了一种动态可扩展信用流控机制来提高UCX系统在大规模并行应用运行时的可扩展性。实验测试测试表明,由于UCX通信接口操作更匹配互连网络硬件特性,精简了软件处理层次,UCX软件层增加的总开销小于200ns,而基于该UCX的消息传递接口(MPI)系统,相对于现有的天河互连MPI实现架构,减少了约50ns的通信延迟,短消息速率也有约10%的性能提升。该UCX实现系统对拓展天河互连网络上的并行编程模型和应用类型,并确保并行运行效率,提供了较好的技术支撑。 展开更多
关键词 高速互连网络 并行编程模型 消息传递接口 公共通信接口 远程直接内存访问
在线阅读 下载PDF
基于MPI的伪谱法大涡模拟并行计算的研究 被引量:2
11
作者 肖红林 罗纪生 《计算机工程与应用》 CSCD 北大核心 2009年第3期242-244,共3页
使用伪谱方法的大涡模拟准确、高效,但在高雷诺数情况下,计算量仍然非常巨大,需要采用并行方法,但是快速傅里叶变换的并行算法在实际应用中有很大的困难。针对这一问题,提出了一种新的基于MPI的伪谱法大涡模拟的并行计算方法。通过实例... 使用伪谱方法的大涡模拟准确、高效,但在高雷诺数情况下,计算量仍然非常巨大,需要采用并行方法,但是快速傅里叶变换的并行算法在实际应用中有很大的困难。针对这一问题,提出了一种新的基于MPI的伪谱法大涡模拟的并行计算方法。通过实例验证,该方法准确、易行、稳健,并且可以大幅提高计算速度,节省计算时间,这对大涡模拟在工程中的广泛应用具有重要意义。 展开更多
关键词 大涡模拟 谱方法 消息传递接口 并行计算 亚格子模型
在线阅读 下载PDF
机群环境T.cover最优投资决策模型的并行化研究
12
作者 郑晓薇 刘青昆 李天琦 《计算机工程与应用》 CSCD 北大核心 2006年第6期107-109,共3页
在Linux操作系统和MPI并行环境下,由多台微机组成的机群上,实现了分布式决策支持系统中T.cover最优投资决策模型的并行化。在并行算法中采用组消息通讯和阻塞同步的方式实现了投资决策数据的并行计算。
关键词 机群 并行计算 MPI T.cover最优投资决策模型
在线阅读 下载PDF
数值预报MAPS模式并行化移植初探
13
作者 龚贤创 俞康庆 向立莉 《南京气象学院学报》 CSCD 北大核心 2002年第4期533-538,共6页
通过武汉区域气象中心数值预报 MAPS(Mesoscale Analysis and ProcessSystem)模式并行化移植的实例 ,介绍了如何使用共享内存、消息传递的并行方式进行数值预报模式并行化工作 ,对不同条件下并行 MAPS模式的并行效率进行了比较。结果表... 通过武汉区域气象中心数值预报 MAPS(Mesoscale Analysis and ProcessSystem)模式并行化移植的实例 ,介绍了如何使用共享内存、消息传递的并行方式进行数值预报模式并行化工作 ,对不同条件下并行 MAPS模式的并行效率进行了比较。结果表明 ,对数值预报 MAPS模式完成程序优化和共享内存方式以及消息传递方式的并行化等工作后 ,MAPS模式运算时间大为缩短 ,满足预报业务时效的要求。 展开更多
关键词 数值预报模式 共享内存编程 消息传递接口 并行化 天气预报
在线阅读 下载PDF
并行计算通信库测试方法研究及实践
14
作者 熊玉庆 张云泉 《软件学报》 EI CSCD 北大核心 2000年第12期1681-1684,共4页
并行计算通信库的测试在并行计算系统中起着重要的作用 .对通信库的测试一般都是通过设计一些测试程序对库的各个或几个部分分别进行单独隔离测试 .但是有许多库中的错误用这种隔离测试方法测不出来 ,只有当库的多个部分以某种复杂的、... 并行计算通信库的测试在并行计算系统中起着重要的作用 .对通信库的测试一般都是通过设计一些测试程序对库的各个或几个部分分别进行单独隔离测试 .但是有许多库中的错误用这种隔离测试方法测不出来 ,只有当库的多个部分以某种复杂的、有机的方式组合运行时才会暴露出来 .而这种复杂的、有机的组合方式 ,从设计库的测试角度看很难形成 .提出两种新的测试方法 ,根据通信库结构的分层特性 ,利用可移植的上层库的测试程序来测试下层库 .上层库的测试程序也可看做是下层库的应用程序 ,但与一般的下层库应用程序不同 ,它几乎覆盖了下层库的各个部分 ,且有机地将它们组合起来 ,运行时形成某种复杂的形态 ,而仅用下层库的测试程序往往达不到这种形态 .这样 。 展开更多
关键词 测试方法 并行计算通信库 并行计算系统
在线阅读 下载PDF
MPI程序中两种通信原语相关性研究
15
作者 张小红 《河南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第3期155-157,共3页
基于并行计算中将相同数据模块传递给所有处理器的实验,评估并比较了MPI-1标准化库中点对点通信与广播通信的性能.在延迟方面性能的比较是通过改变处理器的数目和数据模块大小来实现的,而工具Jump-shot-4则用于MPI通信程序性能的详细测试.
关键词 并行编程 MPI 通信原语 集群计算机
在线阅读 下载PDF
一种实用的并行计算模型 被引量:16
16
作者 计永昶 丁卫群 +1 位作者 陈国良 安虹 《计算机学报》 EI CSCD 北大核心 2001年第4期437-441,共5页
对于当前流行的工作站集群环境和各类并行机系统 ,文中提出了一种实用的并行计算模型 ,即基于L og GP的非独占异质同步模型 NHBL(Nondedicated Heterogeneous Barrier L og GP) ,它旨在反映具有异质性和非独占性的 NOW计算环境对并行算... 对于当前流行的工作站集群环境和各类并行机系统 ,文中提出了一种实用的并行计算模型 ,即基于L og GP的非独占异质同步模型 NHBL(Nondedicated Heterogeneous Barrier L og GP) ,它旨在反映具有异质性和非独占性的 NOW计算环境对并行算法设计和分析的影响 ,然后用 NHBL 模型分析了 PSRS算法在国家高性能计算中心 (合肥 )的工作站集群 NHPCC- Cluster和曙光 - 10 0 0 MPP上的代价 ,并用实测结果进行了验证 . 展开更多
关键词 工作站集群 并行计算模型 PSRS算法 MPP MPI
在线阅读 下载PDF
消息传递接口在声波方程正演中的应用
17
作者 何兵寿 陈美年 张会星 《勘探地球物理进展》 2009年第5期346-350,共5页
声波方程正演在地震资料采集、处理、解释与反演中均发挥重要作用,但现有的基于求解地震波动方程的正演算法由于受庞大计算量的制约而难于大规模应用于工业生产。从声波方程出发,研究了利用有限差分法并行求解该方程的基本思路与方法,... 声波方程正演在地震资料采集、处理、解释与反演中均发挥重要作用,但现有的基于求解地震波动方程的正演算法由于受庞大计算量的制约而难于大规模应用于工业生产。从声波方程出发,研究了利用有限差分法并行求解该方程的基本思路与方法,给出了适于并行求解的计算空间划分方法,分析了不同参数条件下并行程序的运行时间、加速比与效率,引入消息传递接口(MPI)实现了声波方程的并行求解,极大地提高了数值求解声波方程的计算效率。 展开更多
关键词 声波方程 正演 有限差分 并行计算 消息传递接口
在线阅读 下载PDF
LBGK模型的分布式并行计算 被引量:2
18
作者 段杰峰 李青 +1 位作者 周美莲 蔡群 《计算机工程》 CAS CSCD 北大核心 2008年第1期100-101,104,共3页
以二维9速模型D2Q9(LBGK)为例,针对不同集合形状的流场,研究了数据分布与通信量及并行效率之间的关系。在"自强3000"集群式超级计算机上就流场网格的不同规模、多种数据分布及通信方案进行了数值实验。测试结果表明,LBGK模型... 以二维9速模型D2Q9(LBGK)为例,针对不同集合形状的流场,研究了数据分布与通信量及并行效率之间的关系。在"自强3000"集群式超级计算机上就流场网格的不同规模、多种数据分布及通信方案进行了数值实验。测试结果表明,LBGK模型的并行效率高、可扩展性好,在数据分布方案与流场网格形状相似时,并行效率最高。该结论与理论分析相吻合。 展开更多
关键词 格子模型方法 消息传递接口 并行计算 可扩展性
在线阅读 下载PDF
简单要素模型多边形拓扑检查并行算法 被引量:2
19
作者 任沂斌 陈振杰 +2 位作者 李飞雪 周琛 杨云丽 《计算机应用》 CSCD 北大核心 2014年第7期1852-1856,共5页
将并行计算应用到大数据量简单要素模型多边形拓扑检查中,设计实现了简单要素模型多边形拓扑检查并行算法。算法针对拓扑检查的计算特点,改进了主从式并行策略,在主进程中进一步划分线程以实现任务并行,从而隐藏拓扑错误提取和结果写入... 将并行计算应用到大数据量简单要素模型多边形拓扑检查中,设计实现了简单要素模型多边形拓扑检查并行算法。算法针对拓扑检查的计算特点,改进了主从式并行策略,在主进程中进一步划分线程以实现任务并行,从而隐藏拓扑错误提取和结果写入时间。采用MPI和PThread实现进程与线程的结合。利用苏南五市土地现状调查地类图斑数据对算法进行测试。经测试,该算法能够对大数据量简单要素模型多边形进行准确、快速的拓扑检查。算法提出的进程与线程结合的任务并行策略相对于传统主从式策略加速比提高约20%。 展开更多
关键词 并行计算 简单要素模型 拓扑检查 消息传递接口 PThread
在线阅读 下载PDF
基于文件拆分与高斯消去的线性方程组求解 被引量:2
20
作者 邢芳 刘青昆 宫利东 《计算机工程》 CAS CSCD 北大核心 2011年第3期39-41,共3页
针对集群系统内存不足导致大规模矩阵无法调入的情况,设计并实现一种基于文件拆分与高斯消去的线性方程组求解算法,将大规模系数矩阵文件连续拆分为多个规模可控的子文件进行存储和计算,使服务器空闲内存小且具有较好的计算能力。在ABEE... 针对集群系统内存不足导致大规模矩阵无法调入的情况,设计并实现一种基于文件拆分与高斯消去的线性方程组求解算法,将大规模系数矩阵文件连续拆分为多个规模可控的子文件进行存储和计算,使服务器空闲内存小且具有较好的计算能力。在ABEEMσπ模型中的应用结果表明,当Altix3700服务器任务提交量大、CPU占有率高时,该算法仍可以计算出蛋白质分子的电荷分布。 展开更多
关键词 原子-键电负性均衡模型 并行计算 消息传递接口 高斯消去 矩阵拆分
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部