期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
OpenMP程序中基于活跃变量分析的检查点优化
1
作者 刘洋 杨金民 《计算机工程与应用》 CSCD 北大核心 2016年第4期31-41,45,共12页
OpenMP程序通过做检查点来实现容错,现有检查点方法未考虑活跃变量的语义,通过原始值拷贝来保存活跃变量,存在检查点保存量过大的问题。对此提出数组活跃变量检查点优化算法。该算法基于程序分析,处理隐式定值和隐式引用,运用活跃变量... OpenMP程序通过做检查点来实现容错,现有检查点方法未考虑活跃变量的语义,通过原始值拷贝来保存活跃变量,存在检查点保存量过大的问题。对此提出数组活跃变量检查点优化算法。该算法基于程序分析,处理隐式定值和隐式引用,运用活跃变量分析法得出数组元素中的活跃变量,在适当的情况下采用由下标和数组首地址构成的表达式来表达数组元素,省略其原始值在检查点中的保存,从而减少检查点的数据保存量,达到降低检查点开销的目的。实验表明,该算法可以减少检查点的数据保存量,降低数组元素的数据保存量,达到降低检查点开销的目的,并且消除隐式定值和隐式引用带来的一些不良影响。 展开更多
关键词 openmp程序 并行复算 活跃变量 检查点
在线阅读 下载PDF
共享内存结构OpenMP并行程序的自动生成
2
作者 张平 赵荣彩 +1 位作者 李清宝 董春丽 《计算机科学》 CSCD 北大核心 2004年第12期189-191,共3页
有效的程序自动并行化系统能帮助用户充分利用并行计算机的硬件资源和提高并行程序设计的效率。OpenMP作为共享内存结构的编程标准,具有良好的性能和可移植性。本文介绍了基于SUIF的OpenMP并行程序自动生成工具OAGT的设计和实现,重点讨... 有效的程序自动并行化系统能帮助用户充分利用并行计算机的硬件资源和提高并行程序设计的效率。OpenMP作为共享内存结构的编程标准,具有良好的性能和可移植性。本文介绍了基于SUIF的OpenMP并行程序自动生成工具OAGT的设计和实现,重点讨论了其中所涉及的几个主要技术问题:循环分析、流水并行、归约操作、同步优化等。 展开更多
关键词 并行程序设计 共享内存 自动生成 流水并行 并行计算机 可移植性 编程 MP 问题 操作
在线阅读 下载PDF
基于MPI/OPENMP混合编程的三维粒子模拟并行优化 被引量:3
3
作者 颜小洋 张伟文 +1 位作者 布社辉 邓辉舫 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第4期71-78,共8页
针对MPI、OPENMP并行程序各自存在的缺陷,将MPI与OPENMP结合起来,实现了MPI/OPENMP混合并行编程;通过实验对MPI、OPENMP并行程序及MPI/OPENMP混合并行编程进行了分析.实验结果表明:MPI/OPENMP混合并行编程可以大大减少通信量,其效率和... 针对MPI、OPENMP并行程序各自存在的缺陷,将MPI与OPENMP结合起来,实现了MPI/OPENMP混合并行编程;通过实验对MPI、OPENMP并行程序及MPI/OPENMP混合并行编程进行了分析.实验结果表明:MPI/OPENMP混合并行编程可以大大减少通信量,其效率和加速比均优于纯MPI并行程序,克服了MPI并行程序中因粒子分布不均匀使负载不均衡而导致的程序性能下降的问题,使得可以利用集群中的更多结点来进行计算,缓解了MPI并行程序的通信延迟问题;同时,MPI/OPENMP混合并行编程克服了OPENMP并行程序依赖于单台计算机处理能力和存储空间的问题,大幅度提高了模拟规模. 展开更多
关键词 MPI并行程序 openmp并行程序 3DEMPM 并行计算
在线阅读 下载PDF
基于OpenMP的事务存储同步语义研究
4
作者 田祖伟 李勇帆 《计算机科学》 CSCD 北大核心 2009年第5期166-168,共3页
多核处理器环境下必须解决多核处理器的并行编程问题,才能够充分发挥多核处理器的性能。事务存储(Transactional Memory)机制提供了一种在多核环境下程序并行执行和同步的方法。已有的工作已将事务存储扩展到了OpenMP,为程序员提供满足... 多核处理器环境下必须解决多核处理器的并行编程问题,才能够充分发挥多核处理器的性能。事务存储(Transactional Memory)机制提供了一种在多核环境下程序并行执行和同步的方法。已有的工作已将事务存储扩展到了OpenMP,为程序员提供满足事务原子性、一致性和隔离性的共享存储访问。但当前事务存储的语义并不完善,事务间不能交换中间结果,不能实现锁的部分语义。提出并实现了一种基于开放嵌套的事务存储的同步语义,从而解决了事务间不能交换中间结果的问题,增强了扩展事务存储后OpenMP的并行编程能力。 展开更多
关键词 事务存储 openmp 多核处理器 共享存储并行编程
在线阅读 下载PDF
基于OpenMP的电磁场FDTD并行程序性能分析 被引量:7
5
作者 李正浩 周俊 刘大刚 《现代电子技术》 2008年第14期135-138,共4页
OpenMP是共享内存并行程序设计的工业标准,它通过一些编译指导语句能方便地将程序并行化,特别适合于在多线程的计算机上使用。针对一个采用电磁场FDTD算法的二维波导问题,首先对其计算方法和计算过程进行简单描述,其次讨论了几个影响其... OpenMP是共享内存并行程序设计的工业标准,它通过一些编译指导语句能方便地将程序并行化,特别适合于在多线程的计算机上使用。针对一个采用电磁场FDTD算法的二维波导问题,首先对其计算方法和计算过程进行简单描述,其次讨论了几个影响其并行程序执行效率的几个因素。结果表明,采取不同的并行方式,设定不同的调度策略,设置并行区线程数的大小均会影响并行程序的性能。因此,在使用OpenMP编写电磁场并行程序时,需要综合考虑各种因素的影响才能设计出高效的程序。 展开更多
关键词 openmp 并行程序 FDTD 影响因素
在线阅读 下载PDF
一种基于OpenMP和MPI的非序贯蒙塔卡罗暂态稳定评估的动态混合并行化方法 被引量:2
6
作者 于慧莉 李勤新 宫春明 《现代电力》 北大核心 2014年第2期31-36,共6页
为了提高暂态稳定性分析中非序贯蒙塔卡罗串行算法的计算效率,提出并实现了一种基于OpenMP和MPI的风险评估混合动态并行算法。利用动态规划规则将蒙塔卡罗抽样样本点以MPI方法分配给计算机集群上的多个PC进程,再在各进程内采用多线程的... 为了提高暂态稳定性分析中非序贯蒙塔卡罗串行算法的计算效率,提出并实现了一种基于OpenMP和MPI的风险评估混合动态并行算法。利用动态规划规则将蒙塔卡罗抽样样本点以MPI方法分配给计算机集群上的多个PC进程,再在各进程内采用多线程的并行计算模式对系统故障的分析处理的循环部分进行OpenMP并行分解。大量实验模型的测试和数据分析表明,在保证准确度的前提下,算法取得了理想的并行效率,普通集群最高达到了3.28倍的加速比,混合集群最高达到了5.06倍的加速比。 展开更多
关键词 暂态稳定 非序贯蒙塔卡罗 并行算法 MPI openmp 动态规划
在线阅读 下载PDF
基于OpenMP的电磁场FDTD多核并行程序设计 被引量:2
7
作者 吕忠亭 张玉强 崔巍 《现代电子技术》 2013年第23期168-170,共3页
探讨了基于OpenMP的电磁场FDTD多核并行程序设计的方法,以期实现该方法在更复杂的算法中应用具有更理想的性能提升。针对一个一维电磁场FDTD算法问题,对其计算方法与过程做了简单描述。在Fortran语言环境中,采用OpenMP+细粒度并行的方... 探讨了基于OpenMP的电磁场FDTD多核并行程序设计的方法,以期实现该方法在更复杂的算法中应用具有更理想的性能提升。针对一个一维电磁场FDTD算法问题,对其计算方法与过程做了简单描述。在Fortran语言环境中,采用OpenMP+细粒度并行的方式实现了并行化,即只对循环部分进行并行计算,并将该并行方法在一个三维瞬态场电偶极子辐射FDTD程序中进行了验证。该并行算法取得了较其他并行FDTD算法更快的加速比和更高的效率。结果表明基于OpenMP的电磁场FDTD并行算法具有非常好的加速比和效率。 展开更多
关键词 openmp 时域有限差分法 多核并行程序 程序设计
在线阅读 下载PDF
基于OpenMP的并行Fortran程序数据竞争静态检测方法 被引量:1
8
作者 葛优 金大海 宫云战 《小型微型计算机系统》 CSCD 北大核心 2023年第11期2377-2383,共7页
数据竞争是并行程序中最常见的问题,因为其在程序中存在着随机性和难以重现的问题,所以利用动态方法检测并不可靠.本文介绍了一种针对以OpenMP实现程序并行的数据竞争故障的静态检测方法.首先根据基于OpenMP的Fortran并行程序的语法和... 数据竞争是并行程序中最常见的问题,因为其在程序中存在着随机性和难以重现的问题,所以利用动态方法检测并不可靠.本文介绍了一种针对以OpenMP实现程序并行的数据竞争故障的静态检测方法.首先根据基于OpenMP的Fortran并行程序的语法和语义特性,构建并行程序的抽象语法树,并对控制流图进行扩展引入并行控制流图;然后将数据竞争问题抽象为一种故障模型,利用有限状态机来形式化的描述此类故障模型;最后对并行区域的潜在赋值操作进行并行数据流分析,在程序控制流图节点上进行故障状态机的状态转化来实现数据竞争的检测.该方法已在自研的缺陷检测系统(DTS)中应用,并通过DataRaceBench的实验数据证明本文方法可以有效的检测出数据竞争问题. 展开更多
关键词 openmp 静态分析 共享内存编程 数据竞争检测 并行数据流
在线阅读 下载PDF
基于共享存储和Gzip的并行压缩算法研究 被引量:8
9
作者 宋刚 蒋孟奇 +1 位作者 张云泉 刘胜飞 《计算机工程与设计》 CSCD 北大核心 2009年第4期781-784,共4页
Gzip无损压缩算法。尽管gzip算法能够取得很好的压缩比,但它在分析和压缩编码的过程需要进行大量的计算。为了缩短压缩时间,提出了一种基于共享存储的并行压缩策略。采用OpenMP标准和"生产者/消费者"模型实现了gzip的并行压... Gzip无损压缩算法。尽管gzip算法能够取得很好的压缩比,但它在分析和压缩编码的过程需要进行大量的计算。为了缩短压缩时间,提出了一种基于共享存储的并行压缩策略。采用OpenMP标准和"生产者/消费者"模型实现了gzip的并行压缩版本。在Beowulf集群中的一个SMP节点(双CPU)和曙光天阔服务器(4路双核)上的测试表明,并行化的gzip程序取得了极大的性能提升,尤其是大文件的压缩。 展开更多
关键词 共享存储 并行编程 数据压缩 openmp GZIP
在线阅读 下载PDF
多核并行编程技术在中文分词程序优化中的应用 被引量:2
10
作者 董丽丽 刘明生 袁香菊 《计算机工程与设计》 CSCD 北大核心 2010年第24期5231-5235,共5页
为了充分利用多核处理器的硬件资源和计算能力,提出了多核并行编程技术在中文分词程序中的优化方案。根据中文分词最大正向匹配算法的特点,由传统的串行程序,改为并行程序。利用多核并行编程模式的思想,设计了一个混合并行编程模式。通... 为了充分利用多核处理器的硬件资源和计算能力,提出了多核并行编程技术在中文分词程序中的优化方案。根据中文分词最大正向匹配算法的特点,由传统的串行程序,改为并行程序。利用多核并行编程模式的思想,设计了一个混合并行编程模式。通过Intel的性能分析工具,找出了该算法的热点和瓶颈,对其进行优化。实验结果表明,优化过后的执行时间较原来串行程序的执行时间缩短了50%~60%,同时提高了程序的加速性能,取得了良好的效果。 展开更多
关键词 多核并行 并行编程模式 程序优化 openmp 中文分词
在线阅读 下载PDF
面向同步规范的并行代码自动生成 被引量:3
11
作者 胡凯 张腾 +2 位作者 尚利宏 杨志斌 Jean-Pierre TALPIN 《软件学报》 EI CSCD 北大核心 2017年第7期1698-1712,共15页
随着对安全攸关实时系统功能与非功能要求的日益增加,使用多核技术将成为发展趋势.如何在多核平台条件下保证系统运行的可信任性及可靠性是学术上和应用上的关键问题.目前基于形式化方法的系统设计、验证以及自动代码生成已在单核平台... 随着对安全攸关实时系统功能与非功能要求的日益增加,使用多核技术将成为发展趋势.如何在多核平台条件下保证系统运行的可信任性及可靠性是学术上和应用上的关键问题.目前基于形式化方法的系统设计、验证以及自动代码生成已在单核平台上形成很多研究成果,但在多核平台上的研究仍面临许多科学问题.同步语言SIGNAL是一种被广泛应用于安全攸关实时系统功能设计的形式化方法,适用于对系统确定性并发行为的描述.SIGNAL编译器也支持将同步规范(synchronous specification)生成仿真代码,以对其进行验证与分析.然而,现有研究较少关注从SIGNAL同步规范到支持跨平台并行代码的生成方法.研究了面向SIGNAL同步规范的并行自动代码生成方法.提出了方程依赖图EDG的概念,将SIGNAL规范转换为EDG以分析其全局数据依赖关系;研究了对EDG进行任务划分获取规范中可以并行执行部分的算法;最后,以跨平台并行编程API-Open MP作为对象,结合程序中信号的时钟关系,将并行任务映射到Open MP并行代码,并进行了实例验证. 展开更多
关键词 同步规范 SIGNAL 并行程序 代码生成 openmp
在线阅读 下载PDF
一种跨平台的并行编程框架设计与实现 被引量:1
12
作者 李婷 徐云 +1 位作者 聂鹏宇 潘玮华 《计算机工程》 CAS CSCD 2014年第8期43-47,共5页
并行程序设计的复杂性及并行计算平台的多样性导致程序可移植性较差。为此,设计并实现一种跨平台、分层次的并行编程框架OpenCH。该框架通过两层并行函数库和层次化的API设计,对上层应用程序隐藏并行化细节,为基于不同计算平台的库函数... 并行程序设计的复杂性及并行计算平台的多样性导致程序可移植性较差。为此,设计并实现一种跨平台、分层次的并行编程框架OpenCH。该框架通过两层并行函数库和层次化的API设计,对上层应用程序隐藏并行化细节,为基于不同计算平台的库函数设计了统一的函数接口,使底层平台的变化对上层应用程序透明。根据底层函数库的开发,给出一种填充式的编程方法和任务调度系统。将OpenCH应用于遥感影像分类,实验结果证明,基于该框架开发的并行程序可运行于多种并行计算平台,并具有较高的并行加速比,编程框架本身造成的时间开销低于15%。 展开更多
关键词 并行计算 并行编程框架 跨平台 openmp编程 MPI编程 CUDA编程
在线阅读 下载PDF
基于CMP多核集群的混合并行编程技术研究 被引量:1
13
作者 王文义 王春霞 王杰 《计算机科学》 CSCD 北大核心 2014年第2期19-22,共4页
高性能科学计算(High Performance Science Computing,简称HPC)是验证某些理论和测试计算机系统处理能力的一种有效的实验手段。鉴于目前CMP(Chip Multi-processor)多核集群已变得越来越普及,尝试对由MPI和OpenMP两种不同并行编程技术... 高性能科学计算(High Performance Science Computing,简称HPC)是验证某些理论和测试计算机系统处理能力的一种有效的实验手段。鉴于目前CMP(Chip Multi-processor)多核集群已变得越来越普及,尝试对由MPI和OpenMP两种不同并行编程技术构成的混合编程模式做一些实验性的研究。通过对程序执行时间和加速比的实验数据分析,可以看出在多核和多节点集群上采用细粒度的混合并行编程方法较单一使用MPI并行编程方法更加合理和高效,也更能体现出系统硬软件的特性与优势。 展开更多
关键词 高性能计算 CMP多核集群 墙钟时间 MPI+openmp混合并行编程
在线阅读 下载PDF
基于三层混合编程模型的Petri网并行算法研究 被引量:2
14
作者 周杰 李文敬 《计算机科学》 CSCD 北大核心 2017年第B11期586-591,595,共7页
为解决多核机群Petri网并行化过程中,运用MPI+OPenMP混合编程实现同步会出现死锁的问题,提出了基于三层混合编程模型的Petri网并行算法。首先,根据事务内存的同步优势,在多核机群环境下构建MPI+OPenMP+STM的三层编程模型;然后,对Petri... 为解决多核机群Petri网并行化过程中,运用MPI+OPenMP混合编程实现同步会出现死锁的问题,提出了基于三层混合编程模型的Petri网并行算法。首先,根据事务内存的同步优势,在多核机群环境下构建MPI+OPenMP+STM的三层编程模型;然后,对Petri网的几何模型与代数模型的并行化进行分析,建立MPI+OPenMP+STM三层结构的Petri网并行模型,并对三层混合编程模型的Petri网并行算法进行设计与分析;最后,通过示例进行编程验证,该算法的运行效率明显优于其他编程模式,而且Petri网的规模越大,其并行计算的效果就越明显。因此,该算法是多核机群环境下模拟Petri网并行运行的一种高效且可行的算法。 展开更多
关键词 PETRI网 MPI+openmp+STM编程 Petri网并行化 Petri网并行模型 并行算法
在线阅读 下载PDF
针对特普利茨线性系统的多级并行算法
15
作者 张哲 《计算机工程》 CAS CSCD 北大核心 2011年第1期36-38,共3页
利用并行体系结构中不同层次级别的内存和计算单元,提出一种求解对称结构化特普利茨线性系统的多级并行算法。通过数学推导将特普利茨线性系统转换成柯西式线性系统,利用消息传递接口和开放多平台共享内存并行程序设计工具实现该算法,... 利用并行体系结构中不同层次级别的内存和计算单元,提出一种求解对称结构化特普利茨线性系统的多级并行算法。通过数学推导将特普利茨线性系统转换成柯西式线性系统,利用消息传递接口和开放多平台共享内存并行程序设计工具实现该算法,并通过实验验证其可行性。 展开更多
关键词 特普利茨矩阵 柯西式矩阵 多级并行程序设计 消息传递接口 开放多平台共享内存并行程序设计
在线阅读 下载PDF
一种基于循环并行模式的多核优化方法 被引量:3
16
作者 钟光清 郑灵翔 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第6期789-792,共4页
从并行编程模式角度出发,分析了计算稠密型程序基于多核平台的优化方法,并结合循环并行模式与OpenMP、Intel parallel studio工具实现了对部分连接神经演化(PARCONE)模型的多核优化.优化结果表明,基于循环并行模式的设计方法是实现计算... 从并行编程模式角度出发,分析了计算稠密型程序基于多核平台的优化方法,并结合循环并行模式与OpenMP、Intel parallel studio工具实现了对部分连接神经演化(PARCONE)模型的多核优化.优化结果表明,基于循环并行模式的设计方法是实现计算稠密型程序多核优化的一种快速有效方法. 展开更多
关键词 并行编程模式 循环并行 openmp 神经网络 多核优化
在线阅读 下载PDF
面向神威高性能多核处理器的并行编译优化方法 被引量:3
17
作者 周雍浩 徐金龙 +2 位作者 李斌 钱宏 聂凯 《计算机工程》 CAS CSCD 北大核心 2022年第9期130-138,共9页
在神威高性能多核服务器上,自动并行化编译系统为识别和申明程序中的并行性,产生的OpenMP程序没有经过充分的优化,其采用简单的fork-join模型,存在大量的并行循环嵌套,导致运行效率低。为提升自动并行化编译系统产生的OpenMP程序的运行... 在神威高性能多核服务器上,自动并行化编译系统为识别和申明程序中的并行性,产生的OpenMP程序没有经过充分的优化,其采用简单的fork-join模型,存在大量的并行循环嵌套,导致运行效率低。为提升自动并行化编译系统产生的OpenMP程序的运行效率,提出一种并行域重构优化技术。并行域重构技术通过合并程序中的并行域和扩展嵌套循环中的并行域范围,减少OpenMP程序的并行域数目,降低线程组频繁创建和合并等控制开销,将简单fork-join模型的OpenMP程序转换为性能更为高效的单程序多数据模型的OpenMP程序。实验结果表明,在新一代神威高性能多核服务器SW1621平台上,并行域重构技术在NPB3.3-OMP测试集和SPEC OMP2012测试集上的运行效率分别提高了10.77%和7.94%的,可有效提升自动并行化编译系统OpenMP程序的执行效率。 展开更多
关键词 神威高性能多核处理器 openmp编程 并行域重构 fork-join模型 单程序多数据模型
在线阅读 下载PDF
面向层次化NoC的混合并行编程模型 被引量:1
18
作者 曹祥 易伟 +2 位作者 潘红兵 高明伦 李丽 《计算机工程》 CAS CSCD 北大核心 2010年第13期278-280,共3页
为更好发挥多核处理器的硬件性能,针对层次化的片上网络架构,提出MPI/OpenMP混合并行编程模型。运用基于MPI的任务级并行模型实现片内簇间的高效通信,采用OpenMP模型实现簇内四核的通信、同步和数据交换。实验结果表明,与单一并行编程... 为更好发挥多核处理器的硬件性能,针对层次化的片上网络架构,提出MPI/OpenMP混合并行编程模型。运用基于MPI的任务级并行模型实现片内簇间的高效通信,采用OpenMP模型实现簇内四核的通信、同步和数据交换。实验结果表明,与单一并行编程模型相比,混合并行编程模型加速比提高了20%~50%。 展开更多
关键词 片上网络 消息传递接口 openmp模型 层次化 混合并行编程
在线阅读 下载PDF
基于二维结构化网格的可压缩流体并行算法研究 被引量:1
19
作者 皇甫永硕 刘杰 龚春叶 《计算机工程与科学》 CSCD 北大核心 2017年第9期1602-1609,共8页
基于二维/轴对称高精度可压缩多相流计算流体力学方法 MuSiC-CCASSIM的结构化网格部分,设计了区域并行分解方法;针对各处理器边界数据的通信,设计了阻塞式通信与非阻塞式通信并行算法;为了减少通信开销,设计了MPI/OpenMP混合并行优化算... 基于二维/轴对称高精度可压缩多相流计算流体力学方法 MuSiC-CCASSIM的结构化网格部分,设计了区域并行分解方法;针对各处理器边界数据的通信,设计了阻塞式通信与非阻塞式通信并行算法;为了减少通信开销,设计了MPI/OpenMP混合并行优化算法。在天河二号超级计算机上进行了测试,每个核固定网格规模为625*250,最多调用8 192核。测试数据表明,采用MPI/OpenMP混合并行算法、纯MPI非阻塞式通信并行算法和纯MPI阻塞式通信并行算法的程序的平均并行效率分别达到86%、83%和77%,三种算法都具有良好的可扩展性。 展开更多
关键词 并行计算 阻塞式通信 非阻塞式通信 MPI/openmp混合编程 天河计算机
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部