期刊文献+
共找到285篇文章
< 1 2 15 >
每页显示 20 50 100
基于OpenMP的硅晶体分子动力学模拟的空间分解着色及向量化研究
1
作者 傅游 韩昊 +3 位作者 孙月娇 梁建国 叶雨曦 花嵘 《计算机工程与科学》 CSCD 北大核心 2024年第9期1566-1575,共10页
作为材料领域虚拟过程工程研究的热点之一,硅晶体分子动力学采用Tersoff多体势进行模拟;多体势中粒子间相互作用计算量大,且数据之间存在依赖关系,在并行架构上高效、准确地进行大规模模拟面临写冲突和计算效率低2个挑战。为了解决以上... 作为材料领域虚拟过程工程研究的热点之一,硅晶体分子动力学采用Tersoff多体势进行模拟;多体势中粒子间相互作用计算量大,且数据之间存在依赖关系,在并行架构上高效、准确地进行大规模模拟面临写冲突和计算效率低2个挑战。为了解决以上问题,在OpenMP共享内存编程模型的基础上,结合硅晶体粒子特性实施了一系列面向硅晶体分子动力学应用的优化方法,以提高模拟效率:(1)在大规模线程级并行模拟过程中,利用空间分解图着色思想消除粒子之间的数据依赖,从而有效解决写冲突问题;(2)针对核心计算程序段,采用整体向量化的方式提高核心计算效率,并利用级数估计实现超越函数,以实现Tersoff多体势在多核处理器上的并行优化。实验结果表明,在X86平台上Tersoff多体势具有很好的优化潜力,空间分解图着色和向量化方法在硅晶体应用上具有可行性和可扩展性,能够有效地解决由数据交叉导致的写冲突以及计算密集型优化问题,最终加速比可达23.17。 展开更多
关键词 硅晶体 分子动力学模拟 空间分解着色 向量化 openmp
在线阅读 下载PDF
基于SMP集群的MPI+OpenMP混合编程模型研究 被引量:19
2
作者 潘卫 陈燎原 +3 位作者 张锦华 李永革 潘莉 夏凡 《计算机应用研究》 CSCD 北大核心 2009年第12期4592-4594,共3页
讨论了MPI+OpenMP混合编程模型的特点及其实现方法。建立了对拉普拉斯偏微分方程求解的混合并行算法,并在HL-2A高性能计算系统上同纯MPI算法作了性能方面的比较。结果表明,该混合并行算法具有更好的扩展性和加速比。
关键词 对称式多处理器集群 消息传递界面 openmp MPI+openmp HL-2A高性能计算系统
在线阅读 下载PDF
OpenMP任务调度开销及负载均衡分析 被引量:17
3
作者 赖建新 胡长军 +2 位作者 赵宇迪 王生原 张素琴 《计算机工程》 EI CAS CSCD 北大核心 2006年第18期58-60,共3页
任务调度是OpenMP规范的重要内容。在考虑调度开销、负载均衡等多方面因素的基础上,OpenMP规范制定了静态调度、动态调度、指数动态调度和运行时调度等不同策略。详细分析了在单次循环时间相等情况下,不同的OpenMP调度策略对额外开销和... 任务调度是OpenMP规范的重要内容。在考虑调度开销、负载均衡等多方面因素的基础上,OpenMP规范制定了静态调度、动态调度、指数动态调度和运行时调度等不同策略。详细分析了在单次循环时间相等情况下,不同的OpenMP调度策略对额外开销和负载均衡的影响;提出了选择不同任务调度策略的原则。 展开更多
关键词 openmp 任务调度 负载均衡 调度开销
在线阅读 下载PDF
基于OpenMP的三维显式物质点法并行化研究 被引量:14
4
作者 黄鹏 张雄 +1 位作者 马上 王汉奎 《计算力学学报》 EI CAS CSCD 北大核心 2010年第1期21-27,共7页
基于OpenMP技术开发了三维显式物质点并行程序MPM3DMP。为了避免节点更新阶段的数据竞争,采用区域分解法将背景网格分解为均匀的子域,每个线程负责一个子域的节点变量更新,然后将更新后的节点变量装配到整体。在质点更新阶段采用了循环... 基于OpenMP技术开发了三维显式物质点并行程序MPM3DMP。为了避免节点更新阶段的数据竞争,采用区域分解法将背景网格分解为均匀的子域,每个线程负责一个子域的节点变量更新,然后将更新后的节点变量装配到整体。在质点更新阶段采用了循环分解方法进行并行。针对Taylor杆碰撞的三种计算模型,在双Intel Woodcrest 4核CPU服务器下进行了测试:粗模型在4核下加速比为3.82,在8核下为6.23,中模型在4核下加速比为3.79,在8核下加速比为6.23;细模型在4核下加速比为3.75,8核下加速比为6.26。因此,本文的并行程序具有较好的并行效率和可扩展性。 展开更多
关键词 openmp 显式物质点法 区域分解法 循环分解方法 加速比
在线阅读 下载PDF
基于OpenMP的遥感影像并行ISODATA聚类研究 被引量:11
5
作者 刘扬 王鹏 +4 位作者 杨瑞 左宪禹 张周威 吴晓洋 渠涧涛 《计算机工程》 CAS CSCD 北大核心 2016年第7期238-243,250,共7页
针对传统影像分类算法执行效率较低,无法满足海量高分辨率遥感数据实时处理需求的问题,对资源三号卫星专题产品中遥感影像的迭代自组织数据分析算法进行分析与研究,设计一种基于OpenMP的并行ISODATA聚类算法(PIsodata Omp)。采用OpenMP... 针对传统影像分类算法执行效率较低,无法满足海量高分辨率遥感数据实时处理需求的问题,对资源三号卫星专题产品中遥感影像的迭代自组织数据分析算法进行分析与研究,设计一种基于OpenMP的并行ISODATA聚类算法(PIsodata Omp)。采用OpenMP技术优化ISODATA算法中的样本点聚类、聚类样本中心标准差计算,实现基于共享内存的单机多核并行化处理。实验结果表明,PIsodata Omp算法能在保证分类精度不变的情况下,明显提高资源三号卫星影像数据的处理速度。 展开更多
关键词 并行聚类 迭代自组织数据分析算法 openmp技术 遥感影像分类 多核处理
在线阅读 下载PDF
一种改进的OpenMP指导调度策略研究 被引量:17
6
作者 刘胜飞 张云泉 孙相征 《计算机研究与发展》 EI CSCD 北大核心 2010年第4期687-694,共8页
在科学计算中,循环结构是最重要的并行对象之一.考虑到负载平衡、调度开销等多方面因素,OpenMP标准提供静态调度、动态调度、指导调度和运行时调度等不同策略.针对指导调度策略不适合递减型循环结构的问题,提出一种改进的new_guided指... 在科学计算中,循环结构是最重要的并行对象之一.考虑到负载平衡、调度开销等多方面因素,OpenMP标准提供静态调度、动态调度、指导调度和运行时调度等不同策略.针对指导调度策略不适合递减型循环结构的问题,提出一种改进的new_guided指导调度策略,并在OMPi编译器上加以实现.New_guided调度策略的主要思想是对前半部分的循环采用静态调度,后半部分的循环采用指导调度.针对不同循环结构,在多核处理器上对不同调度策略进行评测.结果表明,在一般情况下,OpenMP默认的静态策略的调度性能最差;对于规则的循环结构和递增的循环结构,动态调度、指导调度和new_guided策略的性能差别不大;对于递减型的循环结构,动态调度和new_guided策略的性能相当,要优于指导调度策略;对于某些极不规则的随机循环结构,动态调度明显优于其他策略,new_guided策略的性能介于动态调度和指导调度之间. 展开更多
关键词 openmp 负载平衡 静态调度 动态调度 指导调度 OMPi
在线阅读 下载PDF
OpenMP多线程负载均衡调度策略研究与实现 被引量:14
7
作者 任小西 唐玲 李仁发 《计算机科学》 CSCD 北大核心 2010年第11期148-151,183,共5页
循环并行化是OpenMP并行化程序中最重要的部分,线程数、循环体大小、调度策略等是并行化过程需要考虑的主要因素。为了在调度开销与负载均衡之间获得更好的权衡,在OMPi编译器中实现了梯式trapezoid调度策略,以提高OpenMP多线程程序的运... 循环并行化是OpenMP并行化程序中最重要的部分,线程数、循环体大小、调度策略等是并行化过程需要考虑的主要因素。为了在调度开销与负载均衡之间获得更好的权衡,在OMPi编译器中实现了梯式trapezoid调度策略,以提高OpenMP多线程程序的运行性能。实验结果表明,梯式调度策略应用在递减以及某些极不规则的循环结构中,在适当的线程数下,与指数调度相比,该调度策略能表现出更好的性能。 展开更多
关键词 openmp 负载均衡 调度策略 梯式调度 OMPi
在线阅读 下载PDF
基于OpenMP的分子动力学并行算法的性能分析与优化 被引量:10
8
作者 白明泽 程丽 +1 位作者 豆育升 孙世新 《计算机应用》 CSCD 北大核心 2012年第1期163-166,共4页
为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三... 为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三角形方法。所提方法中每个线程所计算的粒子数固定,且粒子数目呈阶梯状上升,使得各线程能够错时到达临界区。从而使程序在临界区的闲置时间比Critical方法减半,加速比明显提高。 展开更多
关键词 分子动力学 并行计算 多核中央处理器 openmp 临界区
在线阅读 下载PDF
一种利用并行复算实现的OpenMP容错机制 被引量:7
9
作者 富弘毅 丁滟 +1 位作者 宋伟 杨学军 《软件学报》 EI CSCD 北大核心 2012年第2期411-427,共17页
基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提高并行程序容错性能.基于该故障恢复技术,提出了一种针对OpenMP并行程序的容错机制PR-OMP,有效解决... 基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提高并行程序容错性能.基于该故障恢复技术,提出了一种针对OpenMP并行程序的容错机制PR-OMP,有效解决了分段复算、复算负载重分布等问题;此外,还扩展了传统编译数据流分析技术,提出了针对OpenMP并行程序的数据流分析技术,并基于该技术计算状态保存开销进行优化.设计实现了用于支持PR-OMP的编译工具GiFT-OMP,并通过实验证明了PR-OMP机制及其支持工具的有效性,评估并分析了其性能和可扩展性. 展开更多
关键词 容错 openmp 并行复算 数据流分析
在线阅读 下载PDF
一种基于扩展数据流分析的OpenMP程序应用级检查点机制 被引量:7
10
作者 富弘毅 丁滟 +1 位作者 宋伟 杨学军 《计算机学报》 EI CSCD 北大核心 2010年第10期1809-1822,共14页
随着多核处理器体系结构在高性能计算领域日益广泛的应用,面向共享存储并行程序的容错问题成为研究的热点.近年来,检查点技术已经成为该领域占主导地位的容错机制.目前已有一些针对OpenMP程序检查点技术的研究工作,但其中绝大多数解决... 随着多核处理器体系结构在高性能计算领域日益广泛的应用,面向共享存储并行程序的容错问题成为研究的热点.近年来,检查点技术已经成为该领域占主导地位的容错机制.目前已有一些针对OpenMP程序检查点技术的研究工作,但其中绝大多数解决方案都依赖于特殊的运行时库或硬件平台.该文提出一种编译辅助的OpenMP应用级检查点,它是一种平台无关的方案,通过面向OpenMP的扩展数据流分析选择那些"必需"的变量保存到检查点映像,从而降低容错的开销,同时通过运行一种非阻塞式的协议维护检查点的全局一致性.文章讨论了该机制的各个关键问题,并通过实验评测以及与同类工作的比较,表明了该文所提出的检查点机制在容错性能方面的优势. 展开更多
关键词 容错 共享存储 openmp 应用级检查点 数据流分析
在线阅读 下载PDF
基于OpenMP求解无容量设施选址问题的并行PSO算法 被引量:7
11
作者 王大志 闫杨 +1 位作者 汪定伟 王洪峰 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第12期1681-1684,共4页
讨论无容量设施选址(UFL)问题,提出了一个基于OpenMP技术的并行多粒子群优化(PSO)算法.将整个种群分为若干子种群,同时利用局部信息来更新粒子速度,使得并行算法异步进行.算法运行一定代数后,每个子种群都会与其相邻种群交换最优粒子.... 讨论无容量设施选址(UFL)问题,提出了一个基于OpenMP技术的并行多粒子群优化(PSO)算法.将整个种群分为若干子种群,同时利用局部信息来更新粒子速度,使得并行算法异步进行.算法运行一定代数后,每个子种群都会与其相邻种群交换最优粒子.通过将并行多粒子群算法对OR-library中的标准测试问题进行测试,并将计算结果与串行多粒子群算法的计算结果进行比较.相比之下,并行多粒子群算法执行时间短,特别对于大规模的计算问题,所得结果有更好的鲁棒性. 展开更多
关键词 粒子群算法 无容量设施选址问题 并行计算 openmp 多种群
在线阅读 下载PDF
OpenMP并行算法在卫星重力场模型反演中的应用 被引量:8
12
作者 周浩 钟波 +1 位作者 罗志才 张坤 《大地测量与地球动力学》 CSCD 北大核心 2011年第5期123-127,共5页
利用卫星重力数据反演地球重力场需要解决重力场模型的高效计算问题。分析了最小二乘直接法求解重力场模型涉及的密集型计算任务,基于OpenMP实现了卫星重力场模型直接求解的并行算法。利用30天、5秒采样间隔的沿轨扰动位T和径向扰动重... 利用卫星重力数据反演地球重力场需要解决重力场模型的高效计算问题。分析了最小二乘直接法求解重力场模型涉及的密集型计算任务,基于OpenMP实现了卫星重力场模型直接求解的并行算法。利用30天、5秒采样间隔的沿轨扰动位T和径向扰动重力梯度Trr数据,分别反演了60阶次的卫星重力场模型,计算结果表明,OpenMP并行算法能够有效提高直接法求解卫星重力场模型的计算效率,并具有很好的稳定性。 展开更多
关键词 并行算法 重力场模型 卫星重力 重力梯度 openmp
在线阅读 下载PDF
基于MPI+OpenMP的三维声波方程正演模拟 被引量:5
13
作者 宋鹏 解闯 +3 位作者 李金山 谭军 刘伟 谭惠文 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第9期97-102,129,共7页
针对三维声波方程数值模拟的大计算量和大内存消耗问题,研究并实现了基于MPI+OpenMP的三维声波方程数值模拟并行算法,在PC-Cluster的计算节点间采用基于MPI的按炮分任务的多进程并行模式,在计算节点内采用基于OpenMP的按空间分任务的多... 针对三维声波方程数值模拟的大计算量和大内存消耗问题,研究并实现了基于MPI+OpenMP的三维声波方程数值模拟并行算法,在PC-Cluster的计算节点间采用基于MPI的按炮分任务的多进程并行模式,在计算节点内采用基于OpenMP的按空间分任务的多线程并行模式,以有效地利用计算和存储资源。3D-Overthrust模型的实验结果显示,基于MPI+OpenMP的三维声波方程数值模拟并行算法的计算效率与基于MPI的按炮分任务并行计算模式相当,但其内存消耗远远低于后者,其更适合于基于大模型或实际模型的三维模拟。 展开更多
关键词 三维声波方程 正演模拟 并行计算 MPI+openmp
在线阅读 下载PDF
OpenMP源程序级同步段负载监测方法与均衡策略 被引量:5
14
作者 李建江 舒继武 +1 位作者 陈永健 王鼎兴 《电子学报》 EI CAS CSCD 北大核心 2005年第5期852-856,共5页
 在详细阐述以同步段为最小分析单位对OpenMP程序进行负载监测与均衡的重要性之后,本文提出了源程序级同步段负载监测方法与均衡策略.其中源程序级同步段负载监测方法以隐含同步的显性化为基础,具有实现简单和易于确定有效监测区域的优...  在详细阐述以同步段为最小分析单位对OpenMP程序进行负载监测与均衡的重要性之后,本文提出了源程序级同步段负载监测方法与均衡策略.其中源程序级同步段负载监测方法以隐含同步的显性化为基础,具有实现简单和易于确定有效监测区域的优点.在获得负载分布信息之后,通过同步段性能评价、筛选、负载扫描与调整实现同步段的负载均衡,这是本文与现有OpenMP性能工具不同的地方.在负载均衡的过程中,根据加权剩余并行效率筛选出需要负载调整的同步段并对其负载进行扫描,最终确定出适合这些同步段的负载调度策略.实际测试结果表明本文提出的同步段负载监测方法与均衡策略是可行的. 展开更多
关键词 openmp 同步段 负载监测 负载均衡
在线阅读 下载PDF
MKL和OpenMP多核并行算法解算高阶地球重力场的效率分析 被引量:9
15
作者 陈秋杰 沈云中 张兴福 《大地测量与地球动力学》 CSCD 北大核心 2012年第5期118-123,共6页
将OpenMP并行运算库和Intel Math Kernel Library10.2科学计算库运用到高阶地球重力场反演,显著提高了计算效率。模拟结果表明:1)在以单历元为解算单元形成子法方程系数矩阵时,OpenMP可下三角压缩存储,其内存销耗和时间销耗均比较小;2)... 将OpenMP并行运算库和Intel Math Kernel Library10.2科学计算库运用到高阶地球重力场反演,显著提高了计算效率。模拟结果表明:1)在以单历元为解算单元形成子法方程系数矩阵时,OpenMP可下三角压缩存储,其内存销耗和时间销耗均比较小;2)当利用多个历元组成高维系数矩阵,然后再形成法方程时,MKL算法才能体现出高效性能;3)MKL求逆算法效率远高于OpenMP算法;4)综合利用OpenMP和MKL算法的优势,可显著提高高阶地球重力场反演的效率。 展开更多
关键词 MKL openmp 并行算法 地球重力场反演 计算效率
在线阅读 下载PDF
基于共享内存的高效OpenMP并行多层快速多极子算法 被引量:7
16
作者 潘小敏 皮维超 盛新庆 《北京理工大学学报》 EI CAS CSCD 北大核心 2012年第2期164-169,共6页
提出并实现了一种基于共享内存并行平台的OpenMP并行多层快速多极子算法.结合OpenMP并行算法开发的要点和多层快速多极子算法数据分布的特性,对多层快速多极子的填充矩阵模块、矩阵向量相乘中的远相互作用部分进行了OpenMP并行化设计.... 提出并实现了一种基于共享内存并行平台的OpenMP并行多层快速多极子算法.结合OpenMP并行算法开发的要点和多层快速多极子算法数据分布的特性,对多层快速多极子的填充矩阵模块、矩阵向量相乘中的远相互作用部分进行了OpenMP并行化设计.在分析调度方式和循环次序对计算效率的影响的基础上,提出了一种高效的OpenMP并行多层快速多极子方案.数值实验表明,并行算法与串行精度一致,OpenMP并行算法具有较好的并行效率. 展开更多
关键词 多层快速多极子(MLFMA) 并行 openmp 雷达散射截面积
在线阅读 下载PDF
多核构架下OpenMP多线程应用运行性能的研究 被引量:16
17
作者 徐磊 徐莹 张丹丹 《计算机工程与科学》 CSCD 北大核心 2009年第11期50-53,57,共5页
多核平台下,OpenMP线程在核间的动态迁移在一定程度上会导致应用程序性能的下降,如果将线程绑定在固定的核上运行,使其不再迁移,这种方法将有可能提升应用程序性能,达到充分利用多核平台的计算能力的目的。本文将介绍如何使用主流的编... 多核平台下,OpenMP线程在核间的动态迁移在一定程度上会导致应用程序性能的下降,如果将线程绑定在固定的核上运行,使其不再迁移,这种方法将有可能提升应用程序性能,达到充分利用多核平台的计算能力的目的。本文将介绍如何使用主流的编译器绑定接口以及Linux内核API的方式实现OpenMP线程与核之间的绑定,使用STREAM Benchmark和NPB在上海超级计算中心的"魔方"超级计算机刀片上测试、比较绑定前后的应用程序的性能。结果证明,使用绑定方案将有可能提升OpenMP应用程序的性能。 展开更多
关键词 多核openmp线程 绑定STREAM NPB
在线阅读 下载PDF
面向OpenMP和OpenTM应用的并行数据重用理论 被引量:3
18
作者 吴俊杰 杨学军 +1 位作者 刘光辉 唐玉华 《软件学报》 EI CSCD 北大核心 2010年第12期3011-3028,共18页
将经典的数据重用理论扩充到并行领域,分别提出了面向OpenMP和OpenTM应用的并行数据重用理论.针对重用在线程、事务中的关系,系统地讨论了并行应用中重用的分类、判定和求解方法.同时,应用这一理论研究了OpenTM循环的优化技术,以降低事... 将经典的数据重用理论扩充到并行领域,分别提出了面向OpenMP和OpenTM应用的并行数据重用理论.针对重用在线程、事务中的关系,系统地讨论了并行应用中重用的分类、判定和求解方法.同时,应用这一理论研究了OpenTM循环的优化技术,以降低事务被回退的风险.最后,使用并行数据重用理论分析和统计了SPEComp2001中的数据重用.并行数据重用理论可以用于指导面向多核存储共享结构的并行程序分析和编译优化技术研究. 展开更多
关键词 并行应用 重用 局部性 多核 openmp OpenTM
在线阅读 下载PDF
OpenMP在水动力数学模型并行计算中的应用 被引量:4
19
作者 李褆来 徐学军 +2 位作者 陈黎明 金秋 张铁军 《海洋工程》 CSCD 北大核心 2010年第3期112-116,122,共6页
采用PGI Fortran7.1-2(Portland Group)的OpenMP技术对二维水动力数学模型进行了并行优化试验。并行后,数学模型运行时间明显减少,在对同一算例的水流计算模拟中,串行和并行所需运行时间分别为5 336.781 s和3 454.296 s,平均加速比为1.... 采用PGI Fortran7.1-2(Portland Group)的OpenMP技术对二维水动力数学模型进行了并行优化试验。并行后,数学模型运行时间明显减少,在对同一算例的水流计算模拟中,串行和并行所需运行时间分别为5 336.781 s和3 454.296 s,平均加速比为1.56,平均并行计算节省时间36%,明显提高了水动力学数学模型的运算速度。 展开更多
关键词 openmp 并行计算 水动力学 数学模型 加速比
在线阅读 下载PDF
蒙特卡罗中子输运程序的MPI/OpenMP混合并行研究 被引量:3
20
作者 梁金刚 刘诗文 +1 位作者 徐琪 王侃 《原子能科学技术》 EI CAS CSCD 北大核心 2013年第B12期654-659,共6页
消息传递/共享内存混合并行方法具有适应分布共享式集群计算机的发展趋势、有助于解决蒙特卡罗计算内存问题、改善并行性能等优势。本文基于一维中子蒙特卡罗输运程序,实现MPI/OpenMP混合并行,研究影响混合并行性能的因素,提出针对共享... 消息传递/共享内存混合并行方法具有适应分布共享式集群计算机的发展趋势、有助于解决蒙特卡罗计算内存问题、改善并行性能等优势。本文基于一维中子蒙特卡罗输运程序,实现MPI/OpenMP混合并行,研究影响混合并行性能的因素,提出针对共享内存访问竞争、锁竞争、伪共享等问题的解决方法。测试结果表明,混合并行程序和纯粹MPI并行程序有相近的加速效果,同时大量节省了程序的内存使用,对于实现中子蒙特卡罗输运程序的大规模并行有重要意义。 展开更多
关键词 中子输运 蒙特卡罗 混合并行 MPI openmp 内存
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部