期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
程序自动并行化系统 被引量:34
1
作者 朱传琪 臧斌宇 陈彤 《软件学报》 EI CSCD 北大核心 1996年第3期180-186,共7页
有效的自动并行化系统能帮助用户充分地利用并行计算机资源.本文介绍了自动并行化的历史及现状,并着重介绍了作者所开发的自动并行化系统AFT(automaticFortrantransformer)及其特色和所用的关键技术... 有效的自动并行化系统能帮助用户充分地利用并行计算机资源.本文介绍了自动并行化的历史及现状,并着重介绍了作者所开发的自动并行化系统AFT(automaticFortrantransformer)及其特色和所用的关键技术.测试结果表明AFT系统在功能上已超越了传统的自动并行化系统. 展开更多
关键词 程序并行 并行计算机 自动并行化系统
在线阅读 下载PDF
CFD程序自动并行化的相关性分析和通信策略 被引量:8
2
作者 况正谦 傅游 +1 位作者 冯百明 康继昌 《西北工业大学学报》 EI CAS CSCD 北大核心 2000年第3期341-344,共4页
针对 CFD( computational fluid dynamics)问题中的点松弛和线松弛迭代算法 ,研究其帧内和帧间数据相关性 ,提出一种数据相关性分析算法和通信策略。与相应的程序重构技术相结合 ,实现这类程序的 SPMD模式的自动并行化。该算法与平台无... 针对 CFD( computational fluid dynamics)问题中的点松弛和线松弛迭代算法 ,研究其帧内和帧间数据相关性 ,提出一种数据相关性分析算法和通信策略。与相应的程序重构技术相结合 ,实现这类程序的 SPMD模式的自动并行化。该算法与平台无关 ,能够适用于消息传递 ( MP)和共享变量的通信机制 ,目前已在 PVM环境中实现。经测试 ,基于该算法自动生成的并行程序能够达到很高的并行效率 ,对于绝大多数算例 ,其相关性和通信点的识别和归约可达到手工处理的效果。 展开更多
关键词 相关性分析 自动并行化 计算流体动力学 程序
在线阅读 下载PDF
一种面向循环优化和非规则代码段的粗粒度半自动并行化方法 被引量:4
3
作者 刘松 赵博 +1 位作者 蒋庆 伍卫国 《计算机学报》 EI CSCD 北大核心 2017年第9期2127-2147,共21页
多核架构已成为当今的主流,而大量传统的串行程序和遗留软件无法充分利用多核处理器的并行计算性能.人工改写这些遗留软件工作量繁重、成本高昂,自动实现程序并行化的技术成为学术和工业界研究的热点.该文提出了一种新颖的面向一般程序... 多核架构已成为当今的主流,而大量传统的串行程序和遗留软件无法充分利用多核处理器的并行计算性能.人工改写这些遗留软件工作量繁重、成本高昂,自动实现程序并行化的技术成为学术和工业界研究的热点.该文提出了一种新颖的面向一般程序的for循环优化和非规则代码段的粗粒度半自动并行化方法.该方法通过程序动态分析,根据程序的控制流和数据依赖信息将源程序代码映射成可计算单元(CU)图,从中提取出可并行执行的非规则代码段.同时针对程序中for循环部分,提出了一种基于局部性分析的分块收益模型,有效地选择具有收益的循环代码实施循环分块优化;提出了一种基于cache均匀映射的最优分块因子大小选择算法UMC-TSS,以生成优化的分块代码,充分利用cache性能并实现分块的粗粒度并行.该文实现了一个基于LLVM编译架构的C/C++源码到Intel TBB并行源码转换的半自动化工具,它在AST上进行深度代码重构,只需少量的人工干预即可生成高效的并行代码.为了验证该文方法的有效性,从4组不同的基准测试集上选取18个具有代表性的测试程序在一台Intel Xeon多核服务器上进行了一系列实验,在循环级和任务级并行性能上分别获得平均10.95和4.45的加速比.和目前最先进的一种最优分块大小算法相比,UMC-TSS算法平均提升了4%的分块代码性能.实验结果还表明由源到源代码转换工具生成的Intel TBB并行代码具有良好的并行性和可扩展性. 展开更多
关键词 自动并行化 循环分块 局部性分析 最优分块大小 源到源代码转换
在线阅读 下载PDF
基于JavaCC的C代码自动并行化的设计与实现 被引量:5
4
作者 刘有耀 杨鹏程 《计算机应用》 CSCD 北大核心 2016年第9期2422-2426,2431,共6页
针对当前大量遗产代码无法重复利用的问题,设计一种新的编译工具将C的串行代码转换为基于MPI+Open MP的混合并行编程代码,降低了并行编程的开发成本。首先,通过对Java CC的优化,实现一种可以解析C语言的词法和语法分析器,进行源代码分... 针对当前大量遗产代码无法重复利用的问题,设计一种新的编译工具将C的串行代码转换为基于MPI+Open MP的混合并行编程代码,降低了并行编程的开发成本。首先,通过对Java CC的优化,实现一种可以解析C语言的词法和语法分析器,进行源代码分析并生成抽象语法树;其次,根据语法树对源代码进行控制依赖性和数据依赖性分析,产生可并行化的语句块分区;再次,按照提出的并行代码生成方法得到目标代码;最后,基于Visual Studio 2010构建目标代码仿真验证环境。实验结果表明,该工具可以较为理想地实现串行代码自动并行化,与手工编写的代码在加速比上的误差为8.2%~18.4%。 展开更多
关键词 JAVACC 抽象语法树 依赖性 自动并行化 MPI+OPENMP
在线阅读 下载PDF
基于LLVM Pass的复杂嵌套循环自动并行化框架 被引量:3
5
作者 马春燕 吕炳旭 +1 位作者 叶许姣 张雨 《软件学报》 EI CSCD 北大核心 2023年第7期3022-3042,共21页
随着多核处理器的普及应用,针对嵌入式遗留系统中串行代码的自动并行化方法是研究热点.其中,针对具有非完美嵌套结构、非仿射依赖关系特征的复杂嵌套循环的自动并行化方法存在技术挑战.提出了一种基于LLVMPass的复杂嵌套循环的自动并行... 随着多核处理器的普及应用,针对嵌入式遗留系统中串行代码的自动并行化方法是研究热点.其中,针对具有非完美嵌套结构、非仿射依赖关系特征的复杂嵌套循环的自动并行化方法存在技术挑战.提出了一种基于LLVMPass的复杂嵌套循环的自动并行化框架(CNLPF).首先,提出了一种复杂嵌套循环的表示模型,即循环结构树,并将嵌套循环的正则区域自动转换为循环结构树表示;然后,对循环结构树进行数据依赖分析,构建循环内和循环间的依赖关系;最后,基于OpenMP共享内存的编程模型生成并行的循环程序.针对SPEC2006数据集中包含近500个复杂嵌套循环的6个程序案例,分别对其进行复杂嵌套循环占比统计和并行性能加速测试.结果表明,提出的自动并行化框架可以处理LLVMPolly无法优化的复杂嵌套循环,增强了LLVM的并行编译优化能力,且该方法结合Polly的组合优化,比单独采用Polly优化的加速效果提升了9%-43%. 展开更多
关键词 复杂嵌套循环 自动并行化 LLVM Pass 依赖分析
在线阅读 下载PDF
面向MPP Fortran的程序自动并行化初探 被引量:3
6
作者 郭克榕 唐新春 《国防科技大学学报》 EI CAS CSCD 北大核心 1996年第1期92-97,共6页
MPPFortran是由Cray公司推出的一种较有代表性的数据并行语言,本文首先介绍了MPPFortran的主要特点,然后,以该语言为例,对面向MPP系统程序自动并行化的主要内容进行了初步的探讨。
关键词 程序自动并行化 FORTRAN 数据并行语言 MPP系统
在线阅读 下载PDF
面向复杂连续系统仿真程序的自动并行化模型及其实现 被引量:1
7
作者 王宏力 邓彬 +1 位作者 王忠 邓方林 《系统仿真学报》 CAS CSCD 1999年第1期14-18,共5页
有效的自动并行化能够帮助用户充分利用并行计算机的资源。本文介绍了我们自行设计的面向复杂连续系统仿真程序的自动并行化模型ASPM,并着重讨论了基于该模型的自动并行化系统。
关键词 仿真程序 连续系统 武器系统 自动并行化
在线阅读 下载PDF
程序自动并行化工具FAX 被引量:1
8
作者 郭克榕 唐新春 曾丽芳 《计算机工程与应用》 CSCD 北大核心 1999年第9期36-38,43,共4页
该文介绍了大规模并行处理系统程序自动并行化工具FAX(FortranAutomatedXlator)的系统概况。重点阐述了FAX中所采用的先进技术。测试结果表明,FAX已具备一定的可用性及有效性,作为面向分布主存并行机系统的程序自动并行化工具,基... 该文介绍了大规模并行处理系统程序自动并行化工具FAX(FortranAutomatedXlator)的系统概况。重点阐述了FAX中所采用的先进技术。测试结果表明,FAX已具备一定的可用性及有效性,作为面向分布主存并行机系统的程序自动并行化工具,基本达到了设计目标。 展开更多
关键词 程序自动并行化 软件工具 数据分布 FAX
在线阅读 下载PDF
含有跨迭代数据依赖关系循环的自动并行化 被引量:1
9
作者 张琼声 李莹 +1 位作者 范志东 李吉乐 《小型微型计算机系统》 CSCD 北大核心 2014年第6期1293-1297,共5页
OpenMP是为在多处理机上编写并行程序而设计的一个应用编程接口,在串行程序中简单插入OpenMP编译指导语句,编译器就可自动将串行程序并行化.但用OpenMP对for循环进行并行化时,要求循环各次迭代之间不能含有数据依赖关系.文中提出了一种... OpenMP是为在多处理机上编写并行程序而设计的一个应用编程接口,在串行程序中简单插入OpenMP编译指导语句,编译器就可自动将串行程序并行化.但用OpenMP对for循环进行并行化时,要求循环各次迭代之间不能含有数据依赖关系.文中提出了一种对含有跨迭代数据依赖关系的for循环进行OpenMP自动并行化的方法.该方法首先对串行程序的GCC抽象语法树文本进行冗余信息消除,以提取程序的有用信息;然后利用这些信息分析循环是否含有跨迭代数据依赖关系,若有则采用预计算(pre-computation)技术消除跨迭代数据依赖关系;最后自动生成带有OpenMP编译指导语句的并行程序.实验结果表明该方法对于某些含有跨迭代数据依赖关系的循环来说是有效的. 展开更多
关键词 OPENMP 自动并行化 抽象语法树文本 冗余信息消除 跨迭代数据依赖 预计算技术
在线阅读 下载PDF
自动并行化系统AFP的设计与实现
10
作者 王宏力 王忠 +1 位作者 邓方林 邓彬 《计算机工程与设计》 CSCD 北大核心 1999年第3期29-33,共5页
有效的自动并行化系统帮助用户充分利用并行计算机的硬件资源。文中介绍了我所研制的自动并行化系统AFP、其特色及所解决的关键技术。使用结果表明,AFP是一个高效实用型的自动并行化系统。
关键词 自动并行化系统 并行计算机 AFP 设计
在线阅读 下载PDF
循环携带反依赖的MPI自动并行化研究
11
作者 赵捷 赵荣彩 +1 位作者 韩林 许瑾晨 《计算机科学》 CSCD 北大核心 2012年第6期297-300,共4页
传统的面向MPI的自动并行化使用的依赖测试技术,只能确定代码中是否含有循环携带依赖,而不对循环携带依赖的类型进行判定。经研究发现,当循环携带的是反依赖时,代码仍然可以在一定条件下实现面向MPI的自动并行化。基于依赖测试方法和数... 传统的面向MPI的自动并行化使用的依赖测试技术,只能确定代码中是否含有循环携带依赖,而不对循环携带依赖的类型进行判定。经研究发现,当循环携带的是反依赖时,代码仍然可以在一定条件下实现面向MPI的自动并行化。基于依赖测试方法和数据流信息,通过创建合理的依赖数据副本,提出了一种循环携带反依赖的MPI自动并行方法。实验结果表明,所提出的方法能够有效识别存在循环携带反依赖的并行循环,将其作为后端生成MPI代码的依据可有效提高MPI程序的效率。 展开更多
关键词 自动并行化 依赖测试 MPI协议 反依赖 循环携带
在线阅读 下载PDF
自动并行化中不规则循环的通信代码生成
12
作者 傅立国 姚远 丁锐 《计算机应用》 CSCD 北大核心 2014年第4期1014-1018,共5页
不规则计算在大规模并行应用中广泛存在。在面向分布存储结构的自动并行化过程中,较难在编译时为不规则循环生成并行代码。并行代码中的通信代码对程序运行结果的正确性以及加速效果有着严重的影响。通过分析程序的数组重分布图,使用部... 不规则计算在大规模并行应用中广泛存在。在面向分布存储结构的自动并行化过程中,较难在编译时为不规则循环生成并行代码。并行代码中的通信代码对程序运行结果的正确性以及加速效果有着严重的影响。通过分析程序的数组重分布图,使用部分冗余的通信方式来维持不规则数组访问的生产者-消费者关系,可以在编译时为一类常见的不规则循环自动生成有效的通信代码。该方法使用计算分解和数组引用的访问表达式求解不规则数组在各处理器的本地定义集作为通信的数据集,分析针对此类不规则循环划分的通信策略,继而生成相应的通信代码。实验测试的结果取得了预期的加速效果,验证了方法的有效性。 展开更多
关键词 自动并行化 不规则循环 不规则数组 计算分解 部分冗余
在线阅读 下载PDF
自动并行化与数据自动迁移
13
作者 丁晓宁 朱怡安 康继昌 《计算机科学》 CSCD 北大核心 2001年第11期22-25,共4页
本文面向计算流体力学(CFD)提出了数据自动迁移的并行计算模型(ADM模型),符合该模型的并行 CFD程序能够根据计算节点的计算能力及负载轻重,自动将数据迁移至计算能力强、负载轻的计算节点,从而使得并行程序能够在网络计算平台上取得较... 本文面向计算流体力学(CFD)提出了数据自动迁移的并行计算模型(ADM模型),符合该模型的并行 CFD程序能够根据计算节点的计算能力及负载轻重,自动将数据迁移至计算能力强、负载轻的计算节点,从而使得并行程序能够在网络计算平台上取得较好的并行效率。本文还讨论了自动并行化系统对ADM模型的支持方法,最后给出了性能测试结果。 展开更多
关键词 自动并行化 数据迁移 负载平衡 网络计算 计算机网络
在线阅读 下载PDF
面向CFD的程序自动并行化工具APFC
14
作者 况正谦 康继昌 李志春 《计算机应用与软件》 CSCD 1999年第6期11-13,37,共4页
针对并行处理的热点问题,本文介绍了面向CFD的程序自动并行化工具APFC。APFC实现了数组共享变量的识别和相关性分析,能够自动搜索帧内同步和通信点,并自动生成并行划分后的节点源程序。经APFC处理的程序有很好的可移植性和较高的并行效率。
关键词 CFD 程序自动并行化 APFC 并行处理 并行计算机
在线阅读 下载PDF
面向MPPFortran的程序自动并行化
15
作者 唐新春 郭克榕 《计算机研究与发展》 EI CSCD 北大核心 1996年第8期566-573,共8页
MPPFortran是Cray公司为分布存储、全局编址的CrayT3DMPP系统推出的一种数据并行语言。本文首先介绍了MPPFortran的主要特点,然后以该语言为例,对面向MPP系统程序自动并行化的基本内容以及关键... MPPFortran是Cray公司为分布存储、全局编址的CrayT3DMPP系统推出的一种数据并行语言。本文首先介绍了MPPFortran的主要特点,然后以该语言为例,对面向MPP系统程序自动并行化的基本内容以及关键技术进行了分析和探讨。 展开更多
关键词 程序自动并行化 并行计算机 并行程序设计
在线阅读 下载PDF
程序自动并行化系统中IR的面向对象设计 被引量:3
16
作者 张瑜 黄波 朱传琪 《计算机工程》 CAS CSCD 北大核心 1999年第11期5-7,共3页
从构造一个高性能的程序自动并行化系统的需求出发,介绍了程序自动并行化系统AGASSIZ中IR(IntermediateRepresentation)的设计原则与设计方法,阐明了此种IR的设计给整个程序自动并行化系统的... 从构造一个高性能的程序自动并行化系统的需求出发,介绍了程序自动并行化系统AGASSIZ中IR(IntermediateRepresentation)的设计原则与设计方法,阐明了此种IR的设计给整个程序自动并行化系统的设计所带来的便利。 展开更多
关键词 程序自动并行化 IR 面向对象 并行编译
在线阅读 下载PDF
MPI自动并行化编译系统中消息传递代码生成算法 被引量:2
17
作者 陈达智 赵荣彩 +1 位作者 姚远 韩林 《计算机科学》 CSCD 北大核心 2012年第6期301-304,共4页
传统MPI自动并行化编译系统从数据重分布的角度,生成面向分布式存储系统的消息传递程序,但是大量数据重分布通信的额外开销导致其加速比低。为了解决此问题,在基于Open64的MPI自动并行化编译系统后端,提出了一种消息传递代码生成算法。... 传统MPI自动并行化编译系统从数据重分布的角度,生成面向分布式存储系统的消息传递程序,但是大量数据重分布通信的额外开销导致其加速比低。为了解决此问题,在基于Open64的MPI自动并行化编译系统后端,提出了一种消息传递代码生成算法。该算法以统一数据分布为中心,根据给定的并行化循环集和通信数组集,通过修改WHIRL表示的串行代码语法结构树,生成更精确的消息传递代码。实验结果表明,该算法能够较大程度地降低消息传递程序的通信开销,并且明显提升其加速比。 展开更多
关键词 MPI 自动并行化编译 分布式存储系统 消息传递代码 Open64 加速比
在线阅读 下载PDF
可扩展的自动并行化编译系统
18
作者 沈勤华 《计算机工程》 CAS CSCD 北大核心 2009年第8期94-96,共3页
介绍一种可扩展的自动并行化编译系统Agassiz,研究其架构设计及关键特性。该系统可以把串行程序转换为并行程序,并为编译优化技术的研究提供良好的平台,通过面向对象的设计和实现,能有效集成各种并行优化技术。实验结果表明,该系统具有... 介绍一种可扩展的自动并行化编译系统Agassiz,研究其架构设计及关键特性。该系统可以把串行程序转换为并行程序,并为编译优化技术的研究提供良好的平台,通过面向对象的设计和实现,能有效集成各种并行优化技术。实验结果表明,该系统具有良好的可扩展性。 展开更多
关键词 面向对象 自动并行化 编译器
在线阅读 下载PDF
自动并行化中不规则循环的代码生成
19
作者 丁锐 赵荣彩 +1 位作者 徐金龙 傅立国 《计算机科学》 CSCD 北大核心 2013年第12期9-14,44,共7页
许多大规模计算程序包含了不规则循环,但在面向分布存储的自动并行化中,以往的研究难以在编译时为不规则循环生成并行代码。针对一类常见的不规则循环提出了一种代码生成方法,该方法能在编译时将串行代码转换成等价的并行计算和通信代码... 许多大规模计算程序包含了不规则循环,但在面向分布存储的自动并行化中,以往的研究难以在编译时为不规则循环生成并行代码。针对一类常见的不规则循环提出了一种代码生成方法,该方法能在编译时将串行代码转换成等价的并行计算和通信代码,通过计算分解和数组引用的访问表达式来求解不规则循环在各处理器的本地定义集,并通过部分冗余的通信来满足不规则数组引用的生产者-消费者关系。实验结果表明,该方法是有效的,并对测试用例取得了预期的加速比。 展开更多
关键词 自动并行化 计算分解 不规则循环 部分冗余
在线阅读 下载PDF
自动寻找使多重串行循环并行化的幺模变换 被引量:3
20
作者 俞一峻 臧斌宇 +1 位作者 施武 朱传琪 《软件学报》 EI CSCD 北大核心 1999年第4期366-371,共6页
对于已知n维距离向量矩阵的多重串行循环,过去的并行化编译研究还缺乏寻找使循环外层并行化的幺模矩阵的可行算法.文章介绍了多重串行循环并行化的幺模变换方法,不仅从理论上证明满足外层并行化要求的合法幺模矩阵是存在的,而且通... 对于已知n维距离向量矩阵的多重串行循环,过去的并行化编译研究还缺乏寻找使循环外层并行化的幺模矩阵的可行算法.文章介绍了多重串行循环并行化的幺模变换方法,不仅从理论上证明满足外层并行化要求的合法幺模矩阵是存在的,而且通过构造性证明给出一个计算外层并行化幺模变换矩阵的可行算法,并探讨了扩大其适用范围于非完全嵌套和非常数相关距离循环的有效途径. 展开更多
关键词 自动并行化变换 幺模变换 并行编译
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部