期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
Runtime系统综述
1
作者 张宏莉 胡铭曾 方滨兴 《计算机科学》 CSCD 北大核心 1999年第6期25-28,共4页
Runtime systems play an important role in parallel programming and parallel compilation. In this paper,goals and key techniques of runtime systems are presented. And some experiences and its trend are given in the end.
关键词 runtime系统 并行编译系统 并行处理 多线程 同步 通信技术 调度技术
在线阅读 下载PDF
面向国产异构众核系统的Parallel C语言设计与实现 被引量:10
2
作者 何王全 刘勇 +2 位作者 方燕飞 魏迪 漆锋滨 《软件学报》 EI CSCD 北大核心 2017年第4期764-785,共22页
异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、... 异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、提升并行程序的性能都具有重要的意义.提出统一架构的多模式并行编程模型,包括异构融合的加速运算模型和按同构方式编程的自主运算模型,根据编程模型设计了Parallel C语言,能够有效地描述国产众核系统的异构并行性.与其他众核系统上MPI+X的使用模式相比,编程和系统优化都具有全局视角,在多级局部性描述、单边消息、兼容已有多核应用等方面具有特色;基于Open64构建了Parallel C编译系统,全面支持加速运算模型和自主运算模型,提出并实现了数据布局与自动DMA、编译指导的线程代理和拓扑位置感知的集合通信等优化.Micro Benchmark和实际应用在神威太湖之光计算机系统上的测试数据结果表明:Parallel C语言和编译系统具有良好的性能和可扩展性,能够有效支撑大型应用. 展开更多
关键词 异构众核 编程模型 并行语言 parallel C 编译器 消息传递
在线阅读 下载PDF
分布式系统中数据分解的研究 被引量:2
3
作者 沈亚楠 姚远 +2 位作者 张平 赵荣彩 罗向阳 《计算机工程》 EI CAS CSCD 北大核心 2006年第11期114-115,132,共3页
数据分解对消息传递并行机下的并行编译器取得高性能至关重要。根据编译器自动得出的数据分解(映射数据到处理机)信息,C语言版本的发送/接收消息循环嵌套可产生出来,从而在处理机之间实现分布数据。不仅一个已被证明且功能强大的数学模... 数据分解对消息传递并行机下的并行编译器取得高性能至关重要。根据编译器自动得出的数据分解(映射数据到处理机)信息,C语言版本的发送/接收消息循环嵌套可产生出来,从而在处理机之间实现分布数据。不仅一个已被证明且功能强大的数学模型用于产生数据分解代码,而且一个形式化的算法及其实现也已给出。初步实验结果显示该算法能显著提高性能。 展开更多
关键词 并行编译器 消息传递 线性不等式 数据分解
在线阅读 下载PDF
并行化编译中的一种集成优化方法 被引量:1
4
作者 孙彤 李三立 李晓明 《软件学报》 EI CSCD 北大核心 1996年第12期705-713,共9页
本文提出了一种面向分布存储器多机系统的并行化编译方法.针对分布存储并行系统的特点,作者采用的基本优化策略是:折衷并行性与数据引用局部性;减少和隐藏通信开销.通过对基于仿射函数的程序分解方式所导致的数据通信性质的分析,... 本文提出了一种面向分布存储器多机系统的并行化编译方法.针对分布存储并行系统的特点,作者采用的基本优化策略是:折衷并行性与数据引用局部性;减少和隐藏通信开销.通过对基于仿射函数的程序分解方式所导致的数据通信性质的分析,得到了适合分布存储结构特殊要求的并行性开发方法.为了在保持并行性的前提下最小化通信数据总量,提出了基于齐次线性方程组求解的程序全局优化分解方法.为了优化数据通信的组织,提高结点代码的效率。 展开更多
关键词 并行化编译 集成优化 编译程序
在线阅读 下载PDF
基于精确数组数据流分析框架的通信优化
5
作者 任华 赵荣彩 +1 位作者 张平 孟然 《计算机工程与应用》 CSCD 北大核心 2006年第36期130-133,共4页
为了提高消息传递型多处理器的性能,优化处理器间的通信对于并行化编译器至关重要。介绍了建立在精确数组数据流分析基础上的通信优化技术。通过优化,减少了通信次数,降低了通信代价。最后通过一个实例说明,在一定计算划分下结合精确数... 为了提高消息传递型多处理器的性能,优化处理器间的通信对于并行化编译器至关重要。介绍了建立在精确数组数据流分析基础上的通信优化技术。通过优化,减少了通信次数,降低了通信代价。最后通过一个实例说明,在一定计算划分下结合精确数据流分析实现通信比仅仅依据计算划分实现通信能更有效地减少通信量。 展开更多
关键词 消息传递型多处理器 并行化编译器 计算划分 消息合并 消息聚合 数组数据流分析
在线阅读 下载PDF
MPI自动并行化编译系统中消息传递代码生成算法 被引量:2
6
作者 陈达智 赵荣彩 +1 位作者 姚远 韩林 《计算机科学》 CSCD 北大核心 2012年第6期301-304,共4页
传统MPI自动并行化编译系统从数据重分布的角度,生成面向分布式存储系统的消息传递程序,但是大量数据重分布通信的额外开销导致其加速比低。为了解决此问题,在基于Open64的MPI自动并行化编译系统后端,提出了一种消息传递代码生成算法。... 传统MPI自动并行化编译系统从数据重分布的角度,生成面向分布式存储系统的消息传递程序,但是大量数据重分布通信的额外开销导致其加速比低。为了解决此问题,在基于Open64的MPI自动并行化编译系统后端,提出了一种消息传递代码生成算法。该算法以统一数据分布为中心,根据给定的并行化循环集和通信数组集,通过修改WHIRL表示的串行代码语法结构树,生成更精确的消息传递代码。实验结果表明,该算法能够较大程度地降低消息传递程序的通信开销,并且明显提升其加速比。 展开更多
关键词 MPI 自动并行化编译 分布式存储系统 消息传递代码 Open64 加速比
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部