期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向图形处理器重叠通信与计算的数据划分方法 被引量:5
1
作者 张保 曹海军 +2 位作者 董小社 李丹 胡雷钧 《西安交通大学学报》 EI CAS CSCD 北大核心 2011年第4期1-5,11,共6页
针对"主核心+协处理器"式异构并行系统采用数据平均划分再分批执行的方法来解决主协式处理架构的额外通信开销时未能充分利用系统资源的问题,提出了一种新的数据比例划分方法.结合系统通信带宽和图形处理器(GPU)的计算能力,... 针对"主核心+协处理器"式异构并行系统采用数据平均划分再分批执行的方法来解决主协式处理架构的额外通信开销时未能充分利用系统资源的问题,提出了一种新的数据比例划分方法.结合系统通信带宽和图形处理器(GPU)的计算能力,将应用数据按比例划分为大小不同的数据块后分批提交给GPU处理,使系统的传输资源PCI-E总线和计算资源GPU在一段时间内并行工作,从而实现了应用通信与计算的重叠.在处理按照比例划分的数据块过程中,尽可能充分利用系统的传输资源和计算资源,以减少数据传输和计算的相互等待时间.实验结果表明,采用数据比例划分方法后的应用性能明显提高,可以有效地重叠通信与计算时间,矩阵相乘和快速傅里叶变换总执行时间比未划分时分别减少了5%和30%左右,比平均划分时分别减少了3%和6%左右. 展开更多
关键词 图形处理器 重叠通信与计算 数据划分
在线阅读 下载PDF
LogGP-U:一种统一的并行计算模型
2
作者 王向前 王昊 +1 位作者 马宏星 耿锐 《计算机工程与应用》 CSCD 北大核心 2015年第17期59-63,共5页
提出一种统一的并行计算模型Log GP-U(Unified Log GP),它是一个基于Log GP的并行计算模型,给出在几种并行程序设计模式下对应的修正形式。使用这个模型既可以准确度量一般情况下并行程序的时间复杂性,也可以度量通信和计算重叠、单边... 提出一种统一的并行计算模型Log GP-U(Unified Log GP),它是一个基于Log GP的并行计算模型,给出在几种并行程序设计模式下对应的修正形式。使用这个模型既可以准确度量一般情况下并行程序的时间复杂性,也可以度量通信和计算重叠、单边通信等形式下并行程序的时间复杂性。用这个模型分析了cannon矩阵乘在几种编程模式下的理论性能,并在曙光4000A集群上进行验证Log GP-U模型的有效性。 展开更多
关键词 LOG GP LOG GP-U 通信与计算重叠 单边通信 cannon
在线阅读 下载PDF
基于重排序变换和循环分布的通信优化算法 被引量:1
3
作者 陈达智 赵荣彩 +2 位作者 韩林 丁锐 赵捷 《计算机科学》 CSCD 北大核心 2012年第9期296-301,共6页
针对现有通信优化算法无法使MPI自动并行化编译器生成加速比理想的消息传递程序问题,提出了一种基于重排序变换和循环分布的通信优化算法。该算法根据给出的过程间副作用集合和基于mpi_wait/mpi_irecv移动的重排序变换规则,有序地采用... 针对现有通信优化算法无法使MPI自动并行化编译器生成加速比理想的消息传递程序问题,提出了一种基于重排序变换和循环分布的通信优化算法。该算法根据给出的过程间副作用集合和基于mpi_wait/mpi_irecv移动的重排序变换规则,有序地采用重排序变换和循环分布,尽可能安全地扩大点到点非阻塞通信中通信与计算的重叠窗口,使MPI自动并行化编译器生成具有更多计算重叠通信的消息传递代码。实验结果表明,该算法能够隐藏更多的点到点非阻塞通信开销,并且明显提升消息传递程序的加速比。 展开更多
关键词 重排序变换 循环分布 通信优化 并行化编译 点到点非阻塞通信 通信与计算重叠
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部