期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
循环携带反依赖的MPI自动并行化研究
1
作者 赵捷 赵荣彩 +1 位作者 韩林 许瑾晨 《计算机科学》 CSCD 北大核心 2012年第6期297-300,共4页
传统的面向MPI的自动并行化使用的依赖测试技术,只能确定代码中是否含有循环携带依赖,而不对循环携带依赖的类型进行判定。经研究发现,当循环携带的是反依赖时,代码仍然可以在一定条件下实现面向MPI的自动并行化。基于依赖测试方法和数... 传统的面向MPI的自动并行化使用的依赖测试技术,只能确定代码中是否含有循环携带依赖,而不对循环携带依赖的类型进行判定。经研究发现,当循环携带的是反依赖时,代码仍然可以在一定条件下实现面向MPI的自动并行化。基于依赖测试方法和数据流信息,通过创建合理的依赖数据副本,提出了一种循环携带反依赖的MPI自动并行方法。实验结果表明,所提出的方法能够有效识别存在循环携带反依赖的并行循环,将其作为后端生成MPI代码的依据可有效提高MPI程序的效率。 展开更多
关键词 自动并行化 依赖测试 mpi协议 反依赖 循环携带
在线阅读 下载PDF
基于Define-Use图的MPI通信求解算法
2
作者 赵捷 赵荣彩 +1 位作者 丁锐 陈达智 《计算机工程》 CAS CSCD 2012年第4期247-250,共4页
针对分布存储计算机系统并行编译过程中,为维持数据一致性而产生冗余通信的问题,提出一种优化的通信求解算法。该算法基于依赖关系分析和过程间数据流分析,通过遍历Define-Use图,获得更精确的通信数据,消除过程调用时产生的冗余通信。... 针对分布存储计算机系统并行编译过程中,为维持数据一致性而产生冗余通信的问题,提出一种优化的通信求解算法。该算法基于依赖关系分析和过程间数据流分析,通过遍历Define-Use图,获得更精确的通信数据,消除过程调用时产生的冗余通信。实验结果表明,将算法所得结果作为后端生成MPI通信代码的依据,可以有效减少通信量,加速比接近手工MPI并行程序。 展开更多
关键词 Open64编译器 冗余通信 mpi协议 并行编译 Define-Use图
在线阅读 下载PDF
基于MPI的GPU集群并行通信系统实现 被引量:3
3
作者 侯景德 陈庆奎 赵海燕 《计算机应用与软件》 CSCD 2016年第4期116-121,共6页
针对GPU和MPI混合编程本身的复杂性问题,提出基于MPI的GPU并行通信系统:动态管道缓冲池体系(Pipe Dynamic Buffer Pool)。描述PDBP的主要部件、体系结构和实现过程,定义通信协议。该系统采用动态管道池和动态缓冲池技术,对MPI并行通信... 针对GPU和MPI混合编程本身的复杂性问题,提出基于MPI的GPU并行通信系统:动态管道缓冲池体系(Pipe Dynamic Buffer Pool)。描述PDBP的主要部件、体系结构和实现过程,定义通信协议。该系统采用动态管道池和动态缓冲池技术,对MPI并行通信进行扩展,为CUDA程序员提供简易高效的通信编程接口。实验表明,PDBP具有较高的并行通信效率,特别是在多对多通信模式下,通信效率提高了近9倍。 展开更多
关键词 mpi 动态管道池 动态缓冲池 通信协议 PDBP
在线阅读 下载PDF
水动力学数学模型并行计算技术研究及实现 被引量:8
4
作者 杨明 余欣 +1 位作者 姜恺 高文永 《泥沙研究》 CSCD 北大核心 2007年第3期1-3,共3页
基于MPI(Message Passing Interface)消息传递实现了黄河二维水动力学数学模型的并行编程。以数据的分布存储作为区域划分的依据,实现了计算量的负载平衡;在全局网格和局部区域之间建立映射关系,并且在临界单元、进出口单元、共用节点... 基于MPI(Message Passing Interface)消息传递实现了黄河二维水动力学数学模型的并行编程。以数据的分布存储作为区域划分的依据,实现了计算量的负载平衡;在全局网格和局部区域之间建立映射关系,并且在临界单元、进出口单元、共用节点等通过规约等进行特殊处理,一方面尽可能的减少通讯量,另一方面也避免消息的阻塞。采用曙光4000A系统的8个CPU进行计算的加速比达0.8,多CPU并行计算极大的提高了计算任务的容量,使得无法在单机上完成的巨量计算成为可能。 展开更多
关键词 mpi 并行计算 通讯 规约 加速比
在线阅读 下载PDF
基于S7-300/200 PLC和Modbus协议的电力参数采集系统 被引量:13
5
作者 徐鹏鹏 《工矿自动化》 2011年第12期104-107,共4页
介绍了基于S7-300/200 PLC和Modbus协议的电力参数采集系统的硬件结构和S7-200 PLC的程序设计,阐述了S7-300 PLC通过MPI通信读取S7-200 PLC中存放的电量参数的过程。实际应用表明,该系统应用简便,运行稳定可靠,在工程上具有一定的参考... 介绍了基于S7-300/200 PLC和Modbus协议的电力参数采集系统的硬件结构和S7-200 PLC的程序设计,阐述了S7-300 PLC通过MPI通信读取S7-200 PLC中存放的电量参数的过程。实际应用表明,该系统应用简便,运行稳定可靠,在工程上具有一定的参考意义。 展开更多
关键词 中央泵房 电力参数 采集系统 通信接口 MODBUS协议 mpi通信
在线阅读 下载PDF
一种面向中规模科学计算的网络协议设计 被引量:1
6
作者 徐晓飞 付游 康继昌 《小型微型计算机系统》 CSCD 北大核心 2003年第6期999-1001,共3页
科学计算一直是计算机应用的一个重要领域 .利用工作站机群进行集群计算 (cluster computing)已经成为科学计算的一个重要方式 .本文提出了一种新型的确定型通信机制及相应的上层专用网络协议设计 .实验数据证明 。
关键词 CLUSTER mpi 信令寻径式网络 网络协议设计
在线阅读 下载PDF
通信对机群并行计算性能的影响 被引量:2
7
作者 胡明昌 史岗 +1 位作者 胡伟武 唐志敏 《小型微型计算机系统》 CSCD 北大核心 2003年第9期1569-1573,共5页
分析了通信和计算重叠模型及 L og GP模型 ,指出各通信参数对并行计算性能的影响 ,结合并行程序的特征介绍了在机群环境下改善并行计算性能经常采用的五种通信方式 :采用高速网络、采用用户级通信协议、利用 SMP通信、动态预取或迁移数... 分析了通信和计算重叠模型及 L og GP模型 ,指出各通信参数对并行计算性能的影响 ,结合并行程序的特征介绍了在机群环境下改善并行计算性能经常采用的五种通信方式 :采用高速网络、采用用户级通信协议、利用 SMP通信、动态预取或迁移数据、消息合并发送 ,详尽测试了各种方式影响性能情况并分析了其特点和适用范围 .采用高速网络是最常用的方法 ,性能提高明显 ,适用于各类应用程序 .需要传送大量小消息的并行程序还应采用用户级通信协议 .对于特定的一类应用程序 ,采用消息合并发送方式提高性能最多 .采用动态预取或迁移数据和利用 SMP通信时要慎重 。 展开更多
关键词 LogGP模型 用户级通信 机群 曙光3000 mpi JIAJIA 预取 home迁移
在线阅读 下载PDF
PLC在门座式起重机中的应用
8
作者 姜健 徐叶淮 张蓉 《兵工自动化》 2003年第2期51-53,共3页
门座式起重机电控系统由起升、行走、旋转、变幅控制柜,PLC控制柜,TP27-6触摸屏等组成。PLC控制柜选用S7-300可编程控制器和1对IM365接口模块。触摸屏和CPU314的通讯采用MPI协议。其控制软件由行走机构、起升机构、旋转机构、变幅机构... 门座式起重机电控系统由起升、行走、旋转、变幅控制柜,PLC控制柜,TP27-6触摸屏等组成。PLC控制柜选用S7-300可编程控制器和1对IM365接口模块。触摸屏和CPU314的通讯采用MPI协议。其控制软件由行走机构、起升机构、旋转机构、变幅机构子程序和触摸屏监控子程序构成。触摸屏软件采用Siemens组态软件ProTool编写。 展开更多
关键词 PLC 门座式起重机 硬件 触摸屏软件 PROTOOL 多点接口协议
在线阅读 下载PDF
基于“嵩山”超级计算机的UCX库分析与优化
9
作者 刘康 万伟 +2 位作者 刘波 李俊宏 李柱 《计算机工程》 CAS CSCD 北大核心 2023年第12期274-281,共8页
UCX是一个经过生产验证的优化通信框架,适用于当前的高带宽和低延迟高速网络。UCX作为“嵩山”国产高性能计算平台的通信中间件,提高了并行编程模型在InfiniBand(IB)高速互联网络上的开发效率,同时其性能也会直接影响上层应用的通信能... UCX是一个经过生产验证的优化通信框架,适用于当前的高带宽和低延迟高速网络。UCX作为“嵩山”国产高性能计算平台的通信中间件,提高了并行编程模型在InfiniBand(IB)高速互联网络上的开发效率,同时其性能也会直接影响上层应用的通信能力。基于“嵩山”超级计算平台,对平台上的UCX框架进行分析与性能测试,在此过程中归纳IB适配器通信存在的局限性以及UCX在通信传输选择中的不合理性。针对这些问题,根据“嵩山”超级计算平台的网络架构特点,在参数层面进行调优,使得UCX适配“嵩山”平台的Socket Direct架构;在代码层面修改UCX对传输的选择逻辑,使得UCX在选出共享内存传输后不再选择网卡进行传输,从而解决节点内的进程间通信抢占HCA卡资源的问题。同时,修正UCX中KNEM共享内存的带宽设置,使UCX在共享内存CMA和KNEM传输的选择上更加合理。实验结果表明,使用优化后的UCX在100个节点间进行allgather集合通信测试时,相对优化前延迟至多降低80%,节点内alltoall集合通信延迟至多降低70%,gather集合通信延迟至多降低45%。改进后的UCX通信库为“嵩山”超级计算平台上的并行编程模型和应用提供了更好的互联网络支撑,明显提升了平台的集合通信性能。 展开更多
关键词 UCX框架 高性能计算 集合通信 InfiniBand协议 共享内存 消息传递接口 高速网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部