期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
9
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
循环携带反依赖的MPI自动并行化研究
1
作者
赵捷
赵荣彩
+1 位作者
韩林
许瑾晨
《计算机科学》
CSCD
北大核心
2012年第6期297-300,共4页
传统的面向MPI的自动并行化使用的依赖测试技术,只能确定代码中是否含有循环携带依赖,而不对循环携带依赖的类型进行判定。经研究发现,当循环携带的是反依赖时,代码仍然可以在一定条件下实现面向MPI的自动并行化。基于依赖测试方法和数...
传统的面向MPI的自动并行化使用的依赖测试技术,只能确定代码中是否含有循环携带依赖,而不对循环携带依赖的类型进行判定。经研究发现,当循环携带的是反依赖时,代码仍然可以在一定条件下实现面向MPI的自动并行化。基于依赖测试方法和数据流信息,通过创建合理的依赖数据副本,提出了一种循环携带反依赖的MPI自动并行方法。实验结果表明,所提出的方法能够有效识别存在循环携带反依赖的并行循环,将其作为后端生成MPI代码的依据可有效提高MPI程序的效率。
展开更多
关键词
自动并行化
依赖测试
mpi
协议
反依赖
循环携带
在线阅读
下载PDF
职称材料
基于Define-Use图的MPI通信求解算法
2
作者
赵捷
赵荣彩
+1 位作者
丁锐
陈达智
《计算机工程》
CAS
CSCD
2012年第4期247-250,共4页
针对分布存储计算机系统并行编译过程中,为维持数据一致性而产生冗余通信的问题,提出一种优化的通信求解算法。该算法基于依赖关系分析和过程间数据流分析,通过遍历Define-Use图,获得更精确的通信数据,消除过程调用时产生的冗余通信。...
针对分布存储计算机系统并行编译过程中,为维持数据一致性而产生冗余通信的问题,提出一种优化的通信求解算法。该算法基于依赖关系分析和过程间数据流分析,通过遍历Define-Use图,获得更精确的通信数据,消除过程调用时产生的冗余通信。实验结果表明,将算法所得结果作为后端生成MPI通信代码的依据,可以有效减少通信量,加速比接近手工MPI并行程序。
展开更多
关键词
Open64编译器
冗余通信
mpi
协议
并行编译
Define-Use图
在线阅读
下载PDF
职称材料
基于MPI的GPU集群并行通信系统实现
被引量:
3
3
作者
侯景德
陈庆奎
赵海燕
《计算机应用与软件》
CSCD
2016年第4期116-121,共6页
针对GPU和MPI混合编程本身的复杂性问题,提出基于MPI的GPU并行通信系统:动态管道缓冲池体系(Pipe Dynamic Buffer Pool)。描述PDBP的主要部件、体系结构和实现过程,定义通信协议。该系统采用动态管道池和动态缓冲池技术,对MPI并行通信...
针对GPU和MPI混合编程本身的复杂性问题,提出基于MPI的GPU并行通信系统:动态管道缓冲池体系(Pipe Dynamic Buffer Pool)。描述PDBP的主要部件、体系结构和实现过程,定义通信协议。该系统采用动态管道池和动态缓冲池技术,对MPI并行通信进行扩展,为CUDA程序员提供简易高效的通信编程接口。实验表明,PDBP具有较高的并行通信效率,特别是在多对多通信模式下,通信效率提高了近9倍。
展开更多
关键词
mpi
动态管道池
动态缓冲池
通信协议
PDBP
在线阅读
下载PDF
职称材料
水动力学数学模型并行计算技术研究及实现
被引量:
8
4
作者
杨明
余欣
+1 位作者
姜恺
高文永
《泥沙研究》
CSCD
北大核心
2007年第3期1-3,共3页
基于MPI(Message Passing Interface)消息传递实现了黄河二维水动力学数学模型的并行编程。以数据的分布存储作为区域划分的依据,实现了计算量的负载平衡;在全局网格和局部区域之间建立映射关系,并且在临界单元、进出口单元、共用节点...
基于MPI(Message Passing Interface)消息传递实现了黄河二维水动力学数学模型的并行编程。以数据的分布存储作为区域划分的依据,实现了计算量的负载平衡;在全局网格和局部区域之间建立映射关系,并且在临界单元、进出口单元、共用节点等通过规约等进行特殊处理,一方面尽可能的减少通讯量,另一方面也避免消息的阻塞。采用曙光4000A系统的8个CPU进行计算的加速比达0.8,多CPU并行计算极大的提高了计算任务的容量,使得无法在单机上完成的巨量计算成为可能。
展开更多
关键词
mpi
并行计算
通讯
规约
加速比
在线阅读
下载PDF
职称材料
基于S7-300/200 PLC和Modbus协议的电力参数采集系统
被引量:
13
5
作者
徐鹏鹏
《工矿自动化》
2011年第12期104-107,共4页
介绍了基于S7-300/200 PLC和Modbus协议的电力参数采集系统的硬件结构和S7-200 PLC的程序设计,阐述了S7-300 PLC通过MPI通信读取S7-200 PLC中存放的电量参数的过程。实际应用表明,该系统应用简便,运行稳定可靠,在工程上具有一定的参考...
介绍了基于S7-300/200 PLC和Modbus协议的电力参数采集系统的硬件结构和S7-200 PLC的程序设计,阐述了S7-300 PLC通过MPI通信读取S7-200 PLC中存放的电量参数的过程。实际应用表明,该系统应用简便,运行稳定可靠,在工程上具有一定的参考意义。
展开更多
关键词
中央泵房
电力参数
采集系统
通信接口
MODBUS协议
mpi
通信
在线阅读
下载PDF
职称材料
一种面向中规模科学计算的网络协议设计
被引量:
1
6
作者
徐晓飞
付游
康继昌
《小型微型计算机系统》
CSCD
北大核心
2003年第6期999-1001,共3页
科学计算一直是计算机应用的一个重要领域 .利用工作站机群进行集群计算 (cluster computing)已经成为科学计算的一个重要方式 .本文提出了一种新型的确定型通信机制及相应的上层专用网络协议设计 .实验数据证明 。
关键词
CLUSTER
mpi
信令寻径式网络
网络协议设计
在线阅读
下载PDF
职称材料
通信对机群并行计算性能的影响
被引量:
2
7
作者
胡明昌
史岗
+1 位作者
胡伟武
唐志敏
《小型微型计算机系统》
CSCD
北大核心
2003年第9期1569-1573,共5页
分析了通信和计算重叠模型及 L og GP模型 ,指出各通信参数对并行计算性能的影响 ,结合并行程序的特征介绍了在机群环境下改善并行计算性能经常采用的五种通信方式 :采用高速网络、采用用户级通信协议、利用 SMP通信、动态预取或迁移数...
分析了通信和计算重叠模型及 L og GP模型 ,指出各通信参数对并行计算性能的影响 ,结合并行程序的特征介绍了在机群环境下改善并行计算性能经常采用的五种通信方式 :采用高速网络、采用用户级通信协议、利用 SMP通信、动态预取或迁移数据、消息合并发送 ,详尽测试了各种方式影响性能情况并分析了其特点和适用范围 .采用高速网络是最常用的方法 ,性能提高明显 ,适用于各类应用程序 .需要传送大量小消息的并行程序还应采用用户级通信协议 .对于特定的一类应用程序 ,采用消息合并发送方式提高性能最多 .采用动态预取或迁移数据和利用 SMP通信时要慎重 。
展开更多
关键词
LogGP模型
用户级通信
机群
曙光3000
mpi
JIAJIA
预取
home迁移
在线阅读
下载PDF
职称材料
PLC在门座式起重机中的应用
8
作者
姜健
徐叶淮
张蓉
《兵工自动化》
2003年第2期51-53,共3页
门座式起重机电控系统由起升、行走、旋转、变幅控制柜,PLC控制柜,TP27-6触摸屏等组成。PLC控制柜选用S7-300可编程控制器和1对IM365接口模块。触摸屏和CPU314的通讯采用MPI协议。其控制软件由行走机构、起升机构、旋转机构、变幅机构...
门座式起重机电控系统由起升、行走、旋转、变幅控制柜,PLC控制柜,TP27-6触摸屏等组成。PLC控制柜选用S7-300可编程控制器和1对IM365接口模块。触摸屏和CPU314的通讯采用MPI协议。其控制软件由行走机构、起升机构、旋转机构、变幅机构子程序和触摸屏监控子程序构成。触摸屏软件采用Siemens组态软件ProTool编写。
展开更多
关键词
PLC
门座式起重机
硬件
触摸屏软件
PROTOOL
多点接口协议
在线阅读
下载PDF
职称材料
基于“嵩山”超级计算机的UCX库分析与优化
9
作者
刘康
万伟
+2 位作者
刘波
李俊宏
李柱
《计算机工程》
CAS
CSCD
北大核心
2023年第12期274-281,共8页
UCX是一个经过生产验证的优化通信框架,适用于当前的高带宽和低延迟高速网络。UCX作为“嵩山”国产高性能计算平台的通信中间件,提高了并行编程模型在InfiniBand(IB)高速互联网络上的开发效率,同时其性能也会直接影响上层应用的通信能...
UCX是一个经过生产验证的优化通信框架,适用于当前的高带宽和低延迟高速网络。UCX作为“嵩山”国产高性能计算平台的通信中间件,提高了并行编程模型在InfiniBand(IB)高速互联网络上的开发效率,同时其性能也会直接影响上层应用的通信能力。基于“嵩山”超级计算平台,对平台上的UCX框架进行分析与性能测试,在此过程中归纳IB适配器通信存在的局限性以及UCX在通信传输选择中的不合理性。针对这些问题,根据“嵩山”超级计算平台的网络架构特点,在参数层面进行调优,使得UCX适配“嵩山”平台的Socket Direct架构;在代码层面修改UCX对传输的选择逻辑,使得UCX在选出共享内存传输后不再选择网卡进行传输,从而解决节点内的进程间通信抢占HCA卡资源的问题。同时,修正UCX中KNEM共享内存的带宽设置,使UCX在共享内存CMA和KNEM传输的选择上更加合理。实验结果表明,使用优化后的UCX在100个节点间进行allgather集合通信测试时,相对优化前延迟至多降低80%,节点内alltoall集合通信延迟至多降低70%,gather集合通信延迟至多降低45%。改进后的UCX通信库为“嵩山”超级计算平台上的并行编程模型和应用提供了更好的互联网络支撑,明显提升了平台的集合通信性能。
展开更多
关键词
UCX框架
高性能计算
集合通信
InfiniBand协议
共享内存
消息传递接口
高速网络
在线阅读
下载PDF
职称材料
题名
循环携带反依赖的MPI自动并行化研究
1
作者
赵捷
赵荣彩
韩林
许瑾晨
机构
解放军信息工程大学信息工程学院
出处
《计算机科学》
CSCD
北大核心
2012年第6期297-300,共4页
基金
"核高基"重大专项(2009ZX01036-001-001-2)资助
文摘
传统的面向MPI的自动并行化使用的依赖测试技术,只能确定代码中是否含有循环携带依赖,而不对循环携带依赖的类型进行判定。经研究发现,当循环携带的是反依赖时,代码仍然可以在一定条件下实现面向MPI的自动并行化。基于依赖测试方法和数据流信息,通过创建合理的依赖数据副本,提出了一种循环携带反依赖的MPI自动并行方法。实验结果表明,所提出的方法能够有效识别存在循环携带反依赖的并行循环,将其作为后端生成MPI代码的依据可有效提高MPI程序的效率。
关键词
自动并行化
依赖测试
mpi
协议
反依赖
循环携带
Keywords
Auto-parallelization
Dependence testing
mpi protocol
Anti-dependence
Loop-carried
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于Define-Use图的MPI通信求解算法
2
作者
赵捷
赵荣彩
丁锐
陈达智
机构
解放军信息工程大学信息工程学院
出处
《计算机工程》
CAS
CSCD
2012年第4期247-250,共4页
基金
"核高基"重大专项"支持国产CPU的编译系统及工具链"分课题"自动并行化与二进制翻译系统"(2009ZX01036-001-001-2)
文摘
针对分布存储计算机系统并行编译过程中,为维持数据一致性而产生冗余通信的问题,提出一种优化的通信求解算法。该算法基于依赖关系分析和过程间数据流分析,通过遍历Define-Use图,获得更精确的通信数据,消除过程调用时产生的冗余通信。实验结果表明,将算法所得结果作为后端生成MPI通信代码的依据,可以有效减少通信量,加速比接近手工MPI并行程序。
关键词
Open64编译器
冗余通信
mpi
协议
并行编译
Define-Use图
Keywords
Open64 co
mpi
ler
redundant communication
mpi protocol
parallel co
mpi
lation
Define-Use graph
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于MPI的GPU集群并行通信系统实现
被引量:
3
3
作者
侯景德
陈庆奎
赵海燕
机构
上海理工大学光电信息与计算机工程学院
上海市现代光学系统重点实验室
出处
《计算机应用与软件》
CSCD
2016年第4期116-121,共6页
基金
国家自然科学基金项目(60970012)
高等学校博士学科点专项科研博导基金项目(20113120110008)
+3 种基金
上海重点科技攻关项目(14511107902)
上海市工程中心建设项目(GCZX14014)
上海市一流学科建设项目(XTKX2012)
沪江基金研究基地专项(C14001)
文摘
针对GPU和MPI混合编程本身的复杂性问题,提出基于MPI的GPU并行通信系统:动态管道缓冲池体系(Pipe Dynamic Buffer Pool)。描述PDBP的主要部件、体系结构和实现过程,定义通信协议。该系统采用动态管道池和动态缓冲池技术,对MPI并行通信进行扩展,为CUDA程序员提供简易高效的通信编程接口。实验表明,PDBP具有较高的并行通信效率,特别是在多对多通信模式下,通信效率提高了近9倍。
关键词
mpi
动态管道池
动态缓冲池
通信协议
PDBP
Keywords
mpi
Dynamic pipe pool
Dynamic buffer pool
Communication
protocol
PDBP
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
水动力学数学模型并行计算技术研究及实现
被引量:
8
4
作者
杨明
余欣
姜恺
高文永
机构
天津大学
黄河水利科学研究院
上海超级计算中心
黄河水利委员会山东水文水资源局
出处
《泥沙研究》
CSCD
北大核心
2007年第3期1-3,共3页
基金
国家自然科学基金委员会
水利部黄河水利委员会联合研究基金项目(50439020
50339020)
文摘
基于MPI(Message Passing Interface)消息传递实现了黄河二维水动力学数学模型的并行编程。以数据的分布存储作为区域划分的依据,实现了计算量的负载平衡;在全局网格和局部区域之间建立映射关系,并且在临界单元、进出口单元、共用节点等通过规约等进行特殊处理,一方面尽可能的减少通讯量,另一方面也避免消息的阻塞。采用曙光4000A系统的8个CPU进行计算的加速比达0.8,多CPU并行计算极大的提高了计算任务的容量,使得无法在单机上完成的巨量计算成为可能。
关键词
mpi
并行计算
通讯
规约
加速比
Keywords
mpi
parallel computing
communication
protocol
accelerating ratio
分类号
O242 [理学—计算数学]
在线阅读
下载PDF
职称材料
题名
基于S7-300/200 PLC和Modbus协议的电力参数采集系统
被引量:
13
5
作者
徐鹏鹏
机构
河南煤业化工集团永煤公司新桥煤矿
出处
《工矿自动化》
2011年第12期104-107,共4页
文摘
介绍了基于S7-300/200 PLC和Modbus协议的电力参数采集系统的硬件结构和S7-200 PLC的程序设计,阐述了S7-300 PLC通过MPI通信读取S7-200 PLC中存放的电量参数的过程。实际应用表明,该系统应用简便,运行稳定可靠,在工程上具有一定的参考意义。
关键词
中央泵房
电力参数
采集系统
通信接口
MODBUS协议
mpi
通信
Keywords
centre pump room
power parameter
acquisition system
communication port
Modbus
protocol
mpi
communication
分类号
TD611 [矿业工程—矿山机电]
在线阅读
下载PDF
职称材料
题名
一种面向中规模科学计算的网络协议设计
被引量:
1
6
作者
徐晓飞
付游
康继昌
机构
西北工业大学计算机科学与工程系
出处
《小型微型计算机系统》
CSCD
北大核心
2003年第6期999-1001,共3页
基金
国家航空基金 ( 98F5 3 0 5 5 )资助
文摘
科学计算一直是计算机应用的一个重要领域 .利用工作站机群进行集群计算 (cluster computing)已经成为科学计算的一个重要方式 .本文提出了一种新型的确定型通信机制及相应的上层专用网络协议设计 .实验数据证明 。
关键词
CLUSTER
mpi
信令寻径式网络
网络协议设计
Keywords
cluster
mpi
Token routing network
netork
protocol
designing
分类号
TP393.04 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
通信对机群并行计算性能的影响
被引量:
2
7
作者
胡明昌
史岗
胡伟武
唐志敏
机构
中国科学院计算技术研究所
出处
《小型微型计算机系统》
CSCD
北大核心
2003年第9期1569-1573,共5页
基金
国家自然科学基金项目 (60 0 73 0 18)资助
中国科学院盈科优秀青年学者奖课题 (2 0 0 0 40 2 1)资助中科院
+1 种基金
计算所领域前沿青年基金课题 (60 0 0 6B0
2 0 0 162 80 -0 1)资助
文摘
分析了通信和计算重叠模型及 L og GP模型 ,指出各通信参数对并行计算性能的影响 ,结合并行程序的特征介绍了在机群环境下改善并行计算性能经常采用的五种通信方式 :采用高速网络、采用用户级通信协议、利用 SMP通信、动态预取或迁移数据、消息合并发送 ,详尽测试了各种方式影响性能情况并分析了其特点和适用范围 .采用高速网络是最常用的方法 ,性能提高明显 ,适用于各类应用程序 .需要传送大量小消息的并行程序还应采用用户级通信协议 .对于特定的一类应用程序 ,采用消息合并发送方式提高性能最多 .采用动态预取或迁移数据和利用 SMP通信时要慎重 。
关键词
LogGP模型
用户级通信
机群
曙光3000
mpi
JIAJIA
预取
home迁移
Keywords
LogGP model
ULNI
protocol
s
cluster
dawning 3000
mpi
JIAJIA
prefetch
home migration
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
PLC在门座式起重机中的应用
8
作者
姜健
徐叶淮
张蓉
机构
华中科技大学控制科学与工程系
华中科技大学电气与电子工程学院
出处
《兵工自动化》
2003年第2期51-53,共3页
文摘
门座式起重机电控系统由起升、行走、旋转、变幅控制柜,PLC控制柜,TP27-6触摸屏等组成。PLC控制柜选用S7-300可编程控制器和1对IM365接口模块。触摸屏和CPU314的通讯采用MPI协议。其控制软件由行走机构、起升机构、旋转机构、变幅机构子程序和触摸屏监控子程序构成。触摸屏软件采用Siemens组态软件ProTool编写。
关键词
PLC
门座式起重机
硬件
触摸屏软件
PROTOOL
多点接口协议
Keywords
PLC
Portal jib crane
Touch panel
mpi protocol
分类号
TH213.4 [机械工程—机械制造及自动化]
在线阅读
下载PDF
职称材料
题名
基于“嵩山”超级计算机的UCX库分析与优化
9
作者
刘康
万伟
刘波
李俊宏
李柱
机构
郑州大学计算机与人工智能学院
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第12期274-281,共8页
文摘
UCX是一个经过生产验证的优化通信框架,适用于当前的高带宽和低延迟高速网络。UCX作为“嵩山”国产高性能计算平台的通信中间件,提高了并行编程模型在InfiniBand(IB)高速互联网络上的开发效率,同时其性能也会直接影响上层应用的通信能力。基于“嵩山”超级计算平台,对平台上的UCX框架进行分析与性能测试,在此过程中归纳IB适配器通信存在的局限性以及UCX在通信传输选择中的不合理性。针对这些问题,根据“嵩山”超级计算平台的网络架构特点,在参数层面进行调优,使得UCX适配“嵩山”平台的Socket Direct架构;在代码层面修改UCX对传输的选择逻辑,使得UCX在选出共享内存传输后不再选择网卡进行传输,从而解决节点内的进程间通信抢占HCA卡资源的问题。同时,修正UCX中KNEM共享内存的带宽设置,使UCX在共享内存CMA和KNEM传输的选择上更加合理。实验结果表明,使用优化后的UCX在100个节点间进行allgather集合通信测试时,相对优化前延迟至多降低80%,节点内alltoall集合通信延迟至多降低70%,gather集合通信延迟至多降低45%。改进后的UCX通信库为“嵩山”超级计算平台上的并行编程模型和应用提供了更好的互联网络支撑,明显提升了平台的集合通信性能。
关键词
UCX框架
高性能计算
集合通信
InfiniBand协议
共享内存
消息传递接口
高速网络
Keywords
UCX framework
high performance computing
collective communications
InfiniBand(IB)
protocol
share memory
Message Passing Interface(
mpi
)
high-speed network
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
循环携带反依赖的MPI自动并行化研究
赵捷
赵荣彩
韩林
许瑾晨
《计算机科学》
CSCD
北大核心
2012
0
在线阅读
下载PDF
职称材料
2
基于Define-Use图的MPI通信求解算法
赵捷
赵荣彩
丁锐
陈达智
《计算机工程》
CAS
CSCD
2012
0
在线阅读
下载PDF
职称材料
3
基于MPI的GPU集群并行通信系统实现
侯景德
陈庆奎
赵海燕
《计算机应用与软件》
CSCD
2016
3
在线阅读
下载PDF
职称材料
4
水动力学数学模型并行计算技术研究及实现
杨明
余欣
姜恺
高文永
《泥沙研究》
CSCD
北大核心
2007
8
在线阅读
下载PDF
职称材料
5
基于S7-300/200 PLC和Modbus协议的电力参数采集系统
徐鹏鹏
《工矿自动化》
2011
13
在线阅读
下载PDF
职称材料
6
一种面向中规模科学计算的网络协议设计
徐晓飞
付游
康继昌
《小型微型计算机系统》
CSCD
北大核心
2003
1
在线阅读
下载PDF
职称材料
7
通信对机群并行计算性能的影响
胡明昌
史岗
胡伟武
唐志敏
《小型微型计算机系统》
CSCD
北大核心
2003
2
在线阅读
下载PDF
职称材料
8
PLC在门座式起重机中的应用
姜健
徐叶淮
张蓉
《兵工自动化》
2003
0
在线阅读
下载PDF
职称材料
9
基于“嵩山”超级计算机的UCX库分析与优化
刘康
万伟
刘波
李俊宏
李柱
《计算机工程》
CAS
CSCD
北大核心
2023
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部