期刊文献+
共找到167篇文章
< 1 2 9 >
每页显示 20 50 100
一种利用并行复算实现的OpenMP容错机制 被引量:7
1
作者 富弘毅 丁滟 +1 位作者 宋伟 杨学军 《软件学报》 EI CSCD 北大核心 2012年第2期411-427,共17页
基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提高并行程序容错性能.基于该故障恢复技术,提出了一种针对OpenMP并行程序的容错机制PR-OMP,有效解决... 基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提高并行程序容错性能.基于该故障恢复技术,提出了一种针对OpenMP并行程序的容错机制PR-OMP,有效解决了分段复算、复算负载重分布等问题;此外,还扩展了传统编译数据流分析技术,提出了针对OpenMP并行程序的数据流分析技术,并基于该技术计算状态保存开销进行优化.设计实现了用于支持PR-OMP的编译工具GiFT-OMP,并通过实验证明了PR-OMP机制及其支持工具的有效性,评估并分析了其性能和可扩展性. 展开更多
关键词 容错 openmp 并行复算 数据流分析
在线阅读 下载PDF
MKL和OpenMP多核并行算法解算高阶地球重力场的效率分析 被引量:9
2
作者 陈秋杰 沈云中 张兴福 《大地测量与地球动力学》 CSCD 北大核心 2012年第5期118-123,共6页
将OpenMP并行运算库和Intel Math Kernel Library10.2科学计算库运用到高阶地球重力场反演,显著提高了计算效率。模拟结果表明:1)在以单历元为解算单元形成子法方程系数矩阵时,OpenMP可下三角压缩存储,其内存销耗和时间销耗均比较小;2)... 将OpenMP并行运算库和Intel Math Kernel Library10.2科学计算库运用到高阶地球重力场反演,显著提高了计算效率。模拟结果表明:1)在以单历元为解算单元形成子法方程系数矩阵时,OpenMP可下三角压缩存储,其内存销耗和时间销耗均比较小;2)当利用多个历元组成高维系数矩阵,然后再形成法方程时,MKL算法才能体现出高效性能;3)MKL求逆算法效率远高于OpenMP算法;4)综合利用OpenMP和MKL算法的优势,可显著提高高阶地球重力场反演的效率。 展开更多
关键词 MKL openmp 并行算法 地球重力场反演 计算效率
在线阅读 下载PDF
OpenMP在水动力数学模型并行计算中的应用 被引量:3
3
作者 李褆来 徐学军 +2 位作者 陈黎明 金秋 张铁军 《海洋工程》 CSCD 北大核心 2010年第3期112-116,122,共6页
采用PGI Fortran7.1-2(Portland Group)的OpenMP技术对二维水动力数学模型进行了并行优化试验。并行后,数学模型运行时间明显减少,在对同一算例的水流计算模拟中,串行和并行所需运行时间分别为5 336.781 s和3 454.296 s,平均加速比为1.... 采用PGI Fortran7.1-2(Portland Group)的OpenMP技术对二维水动力数学模型进行了并行优化试验。并行后,数学模型运行时间明显减少,在对同一算例的水流计算模拟中,串行和并行所需运行时间分别为5 336.781 s和3 454.296 s,平均加速比为1.56,平均并行计算节省时间36%,明显提高了水动力学数学模型的运算速度。 展开更多
关键词 openmp 并行计算 水动力学 数学模型 加速比
在线阅读 下载PDF
OpenMP在MM5中尺度模式中的应用试验 被引量:5
4
作者 张昕 季仲贞 王斌 《气候与环境研究》 CSCD 2001年第1期84-90,共7页
简要介绍了一种新的并行编程标准——OpenMP,通过与其他几种并行编程标准的比较,了解其优越与不足之处。详细介绍了 OpenMP在 PSU/ NCAR的中尺度模式MM5中的运用。分别用 OpenMP并行方式与 MPI并行... 简要介绍了一种新的并行编程标准——OpenMP,通过与其他几种并行编程标准的比较,了解其优越与不足之处。详细介绍了 OpenMP在 PSU/ NCAR的中尺度模式MM5中的运用。分别用 OpenMP并行方式与 MPI并行方式在 SGI Origin 2000上进行了并行效能测试。测试结果表明: OpenMP是一种简单、高效的并行编程标准,非常适合于气象科研与业务领域应用。 展开更多
关键词 openmp 并行计算 中尺度模式 并行加速比 并行效率 气象 数值大气预报
在线阅读 下载PDF
一种基于动态并行区的OpenMP程序开发模式 被引量:2
5
作者 李建江 舒继武 +2 位作者 陈永健 王鼎兴 郑纬民 《计算机研究与发展》 EI CSCD 北大核心 2006年第3期496-502,共7页
通常,OpenMP程序开发将开发过程、程序正确性检测和性能分析分离开来.为此,提出动态并行区的概念,并在此基础上提出一种新的OpenMP程序开发模式,将OpenMP程序的开发过程、正确性检测和性能分析紧密地联系起来.在OpenMP程序开发的每一阶... 通常,OpenMP程序开发将开发过程、程序正确性检测和性能分析分离开来.为此,提出动态并行区的概念,并在此基础上提出一种新的OpenMP程序开发模式,将OpenMP程序的开发过程、正确性检测和性能分析紧密地联系起来.在OpenMP程序开发的每一阶段,都能确保程序的正确性;同时,通过精确的性能分析与细微的性能调整,使得OpenMP程序的性能随开发的不断深入而逐步得到改进.据此开发的NPB2.3OpenMP Fortran版的实测结果显示出该模式的可行性. 展开更多
关键词 openmp 动态并行区 开发模式 正确性 性能
在线阅读 下载PDF
基于OpenMP的压缩感知并行处理算法 被引量:4
6
作者 巫小婷 邓家先 《计算机应用》 CSCD 北大核心 2012年第3期617-619,共3页
针对压缩感知重建算法复杂度高、运行时间长等缺点,提出一种应用于多核处理器的压缩感知并行算法。在认真分析压缩感知算法的基础上,利用OpenMP对压缩感知的编码测量和正交匹配追踪(OMP)算法进行并行处理,提升程序的性能。实验结果表明... 针对压缩感知重建算法复杂度高、运行时间长等缺点,提出一种应用于多核处理器的压缩感知并行算法。在认真分析压缩感知算法的基础上,利用OpenMP对压缩感知的编码测量和正交匹配追踪(OMP)算法进行并行处理,提升程序的性能。实验结果表明,随着线程数的增加,程序的执行效率显著提高,加速比呈线性增长;并且重构过程越复杂,其性能优化越明显。 展开更多
关键词 压缩感知 openmp 并行 正交匹配追踪 加速比
在线阅读 下载PDF
基于MPI+OpenMP的多层次并行偏移算法研究 被引量:8
7
作者 陈辉 孙雷鸣 +2 位作者 李录明 罗省贤 赵安军 《成都理工大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第5期528-534,共7页
根据PC集群的系统特性和叠前深度偏移的理论特点,提出了多层次并行单平方根和双平方根叠前深度偏移算法。从波动方程叠前深度偏移的概念和特征入手,针对单平方根和双平方根波动方程的实现特点,利用PC集群各节点内的每个内核,构建两类多... 根据PC集群的系统特性和叠前深度偏移的理论特点,提出了多层次并行单平方根和双平方根叠前深度偏移算法。从波动方程叠前深度偏移的概念和特征入手,针对单平方根和双平方根波动方程的实现特点,利用PC集群各节点内的每个内核,构建两类多层次并行叠前深度偏移算法。理论模型验证了其正确性,得到了较好的成像效果,不同类型的多层次并行偏移算法计算结果有所差异。多层次并行偏移算法是在实现MPI并行偏移的基础上,对集群各节点内核的充分利用,有利于提升PC集群的计算性能,为叠前深度偏移的实际推广奠定基础。 展开更多
关键词 MPI openmp 多层次并行 偏移
在线阅读 下载PDF
基于OpenMP的快速并行分层算法 被引量:9
8
作者 马旭龙 林峰 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第4期747-753,共7页
为了充分利用现有的多核CPU计算资源,提出一种基于OpenMP框架的快速并行分层算法,并对其性能进行讨论.该算法利用模型自然分组特征建立拓扑关系分组,使得模型拓扑数据结构的建立时间缩短;在此基础上,采用基于OpenMP的多线程计算,将拓扑... 为了充分利用现有的多核CPU计算资源,提出一种基于OpenMP框架的快速并行分层算法,并对其性能进行讨论.该算法利用模型自然分组特征建立拓扑关系分组,使得模型拓扑数据结构的建立时间缩短;在此基础上,采用基于OpenMP的多线程计算,将拓扑结构的建立过程和求取层片轮廓的过程并行化计算,可以取得接近CPU核数的加速比,因此分层时间明显降低.对于复杂三维模型的超大STL文件进行分层处理,实例计算表明文中算法是一种高效且易于实现的方法. 展开更多
关键词 增材制造 STL分层 openmp框架 并行分层算法
在线阅读 下载PDF
基于OpenMP的3维粒子模拟并行计算 被引量:1
9
作者 廖臣 李正浩 +3 位作者 周俊 刘大刚 张开春 刘盛纲 《强激光与粒子束》 EI CAS CSCD 北大核心 2010年第8期1919-1924,共6页
基于OpenMP标准分别设计了粒子模拟方法中电磁场计算、粒子运动求解、电荷密度和电流密度更新的并行计算实现算法。在多核计算机上对所设计并行算法进行了性能测试和分析,根据分析结果在3维并行粒子模拟软件CHIPIC3D上实现了基于OpenMP... 基于OpenMP标准分别设计了粒子模拟方法中电磁场计算、粒子运动求解、电荷密度和电流密度更新的并行计算实现算法。在多核计算机上对所设计并行算法进行了性能测试和分析,根据分析结果在3维并行粒子模拟软件CHIPIC3D上实现了基于OpenMP的并行计算功能,并应用其对一种扩展互作用振荡器进行了基于OpenMP的并行模拟和基于OpenMP/MPI混合模式的并行模拟。模拟结果表明并行算法正确并能取得较高的加速比。 展开更多
关键词 粒子模拟 openmp 并行计算 扩展互作用振荡器
在线阅读 下载PDF
基于OpenMP的压缩感知多描述并行处理算法 被引量:1
10
作者 巫小婷 邓家先 +1 位作者 任玉莉 杨扬 《计算机应用研究》 CSCD 北大核心 2013年第4期1278-1280,共3页
针对压缩感知算法重建时间长、图像重建质量不高等不足,在认真分析压缩感知算法的基础上,提出一种压缩感知多描述并行算法。为了提高系统运行速度和重建图像质量,将经过稀疏变换后的系数进行交织抽取,分成多个子图像,再利用OpenMP将子... 针对压缩感知算法重建时间长、图像重建质量不高等不足,在认真分析压缩感知算法的基础上,提出一种压缩感知多描述并行算法。为了提高系统运行速度和重建图像质量,将经过稀疏变换后的系数进行交织抽取,分成多个子图像,再利用OpenMP将子图像分配到各线程中并行实现分块压缩感知。实验结果表明,随着抽取数的增加,图像的重建质量呈上升趋势,在32-抽取时图像的重建质量比单抽取的高出了7.24 dB;随着线程数的增加,程序的执行效率不断提高,最高可达单线程的7.35倍,有效地解决了压缩感知算法重建时间长以及图像重建质量差的问题。 展开更多
关键词 压缩感知 多描述 openmp 并行 交织抽取 加速比
在线阅读 下载PDF
基于共享内存的高效OpenMP并行多层快速多极子算法 被引量:7
11
作者 潘小敏 皮维超 盛新庆 《北京理工大学学报》 EI CAS CSCD 北大核心 2012年第2期164-169,共6页
提出并实现了一种基于共享内存并行平台的OpenMP并行多层快速多极子算法.结合OpenMP并行算法开发的要点和多层快速多极子算法数据分布的特性,对多层快速多极子的填充矩阵模块、矩阵向量相乘中的远相互作用部分进行了OpenMP并行化设计.... 提出并实现了一种基于共享内存并行平台的OpenMP并行多层快速多极子算法.结合OpenMP并行算法开发的要点和多层快速多极子算法数据分布的特性,对多层快速多极子的填充矩阵模块、矩阵向量相乘中的远相互作用部分进行了OpenMP并行化设计.在分析调度方式和循环次序对计算效率的影响的基础上,提出了一种高效的OpenMP并行多层快速多极子方案.数值实验表明,并行算法与串行精度一致,OpenMP并行算法具有较好的并行效率. 展开更多
关键词 多层快速多极子(MLFMA) 并行 openmp 雷达散射截面积
在线阅读 下载PDF
基于OpenMP的Stewart并联机器人控制系统 被引量:1
12
作者 李昂 韩康 +1 位作者 霍琦 于慧莉 《传感器与微系统》 CSCD 2016年第7期67-69,72,共4页
针对Stewart并联机器人控制难度大的问题,实现了一种基于Open MP的Stewart并联机器人上位机控制系统,对机器人实现了快速有效直观的振动控制。系统共包含了动力学解算模块、数据传输模块和人机交互模块,不仅能够准确地计算出振动数据,... 针对Stewart并联机器人控制难度大的问题,实现了一种基于Open MP的Stewart并联机器人上位机控制系统,对机器人实现了快速有效直观的振动控制。系统共包含了动力学解算模块、数据传输模块和人机交互模块,不仅能够准确地计算出振动数据,控制机器人振动,而且也设计了简洁明了的用户界面,提升用户体验。为了提高软件的执行效率,还加入了Open MP多线程并行计算技术加速控制算法,最高达到了2.18倍的加速比。验证了软件计算的正确性、控制的稳定性和执行的高效性。 展开更多
关键词 并联机器人 openmp 并行计算 控制软件 动力学
在线阅读 下载PDF
基于OpenMP求解无容量设施选址问题的并行PSO算法 被引量:7
13
作者 王大志 闫杨 +1 位作者 汪定伟 王洪峰 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第12期1681-1684,共4页
讨论无容量设施选址(UFL)问题,提出了一个基于OpenMP技术的并行多粒子群优化(PSO)算法.将整个种群分为若干子种群,同时利用局部信息来更新粒子速度,使得并行算法异步进行.算法运行一定代数后,每个子种群都会与其相邻种群交换最优粒子.... 讨论无容量设施选址(UFL)问题,提出了一个基于OpenMP技术的并行多粒子群优化(PSO)算法.将整个种群分为若干子种群,同时利用局部信息来更新粒子速度,使得并行算法异步进行.算法运行一定代数后,每个子种群都会与其相邻种群交换最优粒子.通过将并行多粒子群算法对OR-library中的标准测试问题进行测试,并将计算结果与串行多粒子群算法的计算结果进行比较.相比之下,并行多粒子群算法执行时间短,特别对于大规模的计算问题,所得结果有更好的鲁棒性. 展开更多
关键词 粒子群算法 无容量设施选址问题 并行计算 openmp 多种群
在线阅读 下载PDF
基于OpenMP的飞秒强激光在空气中传输并行计算 被引量:2
14
作者 马存良 嘉明珍 林文斌 《强激光与粒子束》 EI CAS CSCD 北大核心 2015年第11期15-20,共6页
轴对称超短强激光在空气中的传输可以用2D+1维非线性薛定谔方程来描述,该方程一般可用FCN方法进行求解,即在时间上应用快速傅里叶变换方法、在空间横截面上采用Crank-Nicholson差分法。但由于计算非常耗时,传统串行的FCN方法只能计算强... 轴对称超短强激光在空气中的传输可以用2D+1维非线性薛定谔方程来描述,该方程一般可用FCN方法进行求解,即在时间上应用快速傅里叶变换方法、在空间横截面上采用Crank-Nicholson差分法。但由于计算非常耗时,传统串行的FCN方法只能计算强激光在百m量级距离上传输。基于OpenMP设计了求解2D+1维非线性薛定谔方程的并行方法及其程序。数值模拟结果证明了程序的正确性和较高的并行效率。当线程数为15时并行加速比为12。此并行方法可应用于模拟长距离的超短超强激光的传输。 展开更多
关键词 非线性薛定谔方程 飞秒强激光 openmp 并行计算
在线阅读 下载PDF
基于OpenMP的文件压缩与解压的并行设计模型 被引量:2
15
作者 胡荣 邹承明 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第8期2684-2690,共7页
在多核环境下,对文件压缩与解压并行算法进行研究,提出一种基于OpenMP的文件压缩处理并行设计模型。该模型由查找热点代码、并行化分析、并行建模、实现、调试等步骤组成。以动态哈夫曼算法为研究算法,将多核压缩处理并行设计模型应用... 在多核环境下,对文件压缩与解压并行算法进行研究,提出一种基于OpenMP的文件压缩处理并行设计模型。该模型由查找热点代码、并行化分析、并行建模、实现、调试等步骤组成。以动态哈夫曼算法为研究算法,将多核压缩处理并行设计模型应用到文件压缩与解压中。并在文件并行处理过程中,与数据分解法相结合对数据文件进行分割,将分解后的数据由主线程分给多个处理器上的多个子线程来并行处理,以此提高多核处理器的利用率并提高文件压缩效率。最后通过实验模拟验证模型以及算法性能。研究结果表明:在八核处理器下通过对文本文件、图像文件和音频文件等多种不同类型文件进行压缩解压试验,验证了动态Huffman并行算法与串行算法相比其加速比可以达到1.5~8.0倍,性能也得到很大提高。 展开更多
关键词 openmp 并行设计模型 多核多线程 Huffman并行算法
在线阅读 下载PDF
蒙特卡罗中子输运程序的MPI/OpenMP混合并行研究 被引量:3
16
作者 梁金刚 刘诗文 +1 位作者 徐琪 王侃 《原子能科学技术》 EI CAS CSCD 北大核心 2013年第B12期654-659,共6页
消息传递/共享内存混合并行方法具有适应分布共享式集群计算机的发展趋势、有助于解决蒙特卡罗计算内存问题、改善并行性能等优势。本文基于一维中子蒙特卡罗输运程序,实现MPI/OpenMP混合并行,研究影响混合并行性能的因素,提出针对共享... 消息传递/共享内存混合并行方法具有适应分布共享式集群计算机的发展趋势、有助于解决蒙特卡罗计算内存问题、改善并行性能等优势。本文基于一维中子蒙特卡罗输运程序,实现MPI/OpenMP混合并行,研究影响混合并行性能的因素,提出针对共享内存访问竞争、锁竞争、伪共享等问题的解决方法。测试结果表明,混合并行程序和纯粹MPI并行程序有相近的加速效果,同时大量节省了程序的内存使用,对于实现中子蒙特卡罗输运程序的大规模并行有重要意义。 展开更多
关键词 中子输运 蒙特卡罗 混合并行 MPI openmp 内存
在线阅读 下载PDF
基于MPI+OpenMP的三维声波方程正演模拟 被引量:5
17
作者 宋鹏 解闯 +3 位作者 李金山 谭军 刘伟 谭惠文 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第9期97-102,129,共7页
针对三维声波方程数值模拟的大计算量和大内存消耗问题,研究并实现了基于MPI+OpenMP的三维声波方程数值模拟并行算法,在PC-Cluster的计算节点间采用基于MPI的按炮分任务的多进程并行模式,在计算节点内采用基于OpenMP的按空间分任务的多... 针对三维声波方程数值模拟的大计算量和大内存消耗问题,研究并实现了基于MPI+OpenMP的三维声波方程数值模拟并行算法,在PC-Cluster的计算节点间采用基于MPI的按炮分任务的多进程并行模式,在计算节点内采用基于OpenMP的按空间分任务的多线程并行模式,以有效地利用计算和存储资源。3D-Overthrust模型的实验结果显示,基于MPI+OpenMP的三维声波方程数值模拟并行算法的计算效率与基于MPI的按炮分任务并行计算模式相当,但其内存消耗远远低于后者,其更适合于基于大模型或实际模型的三维模拟。 展开更多
关键词 三维声波方程 正演模拟 并行计算 MPI+openmp
在线阅读 下载PDF
基于OpenMP的三维并行Delaunay网格生成算法及实现 被引量:4
18
作者 张晓蒙 陆忠华 张鉴 《计算机应用研究》 CSCD 北大核心 2016年第12期3658-3662,共5页
针对大多数并行Delaunay网格生成算法无法充分利用多核共享内存结构的问题,在原有面向共享内存的二维并行算法基础上,根据三维问题的特点提出基于OpenMP的三维并行Delaunay网格生成算法。算法采用划分求解区域为方格的方法实现候选点集... 针对大多数并行Delaunay网格生成算法无法充分利用多核共享内存结构的问题,在原有面向共享内存的二维并行算法基础上,根据三维问题的特点提出基于OpenMP的三维并行Delaunay网格生成算法。算法采用划分求解区域为方格的方法实现候选点集的划分和并行插点。使用OpenMP对算法进行实现,并利用多种实现技术避免线程间的同步等待,提升算法效率。实验结果表明,该算法及所采用的实现技术可以在三维条件下快速生成大量网格单元,具有较高的并行效率,同时能够保证良好的网格质量。 展开更多
关键词 三维网格生成 DELAUNAY算法 并行计算 openmp
在线阅读 下载PDF
OpenMP多核计算技术在SAR图像处理中的应用 被引量:6
19
作者 程栋 王卫红 《计算机科学》 CSCD 北大核心 2017年第S1期161-163,187,共4页
SAR图像数据量大,常规识别算法复杂、处理耗时,难以满足实时性要求。针对这一问题,提出一种基于OpenMP多核计算的SAR图像目标分类算法。在分析基于模板匹配的SAR图像目标分类算法的基础上,给出基于OpenMP多核计算技术的图像处理并行处... SAR图像数据量大,常规识别算法复杂、处理耗时,难以满足实时性要求。针对这一问题,提出一种基于OpenMP多核计算的SAR图像目标分类算法。在分析基于模板匹配的SAR图像目标分类算法的基础上,给出基于OpenMP多核计算技术的图像处理并行处理框架,实现SAR图像目标分类算法的并行计算。最后,采用所提方法对3类目标进行分类识别实验,SAR图像分类识别的处理速度提高了8倍,表明了该方法是有效的。 展开更多
关键词 SAR图像 目标识别 并行计算 openmp
在线阅读 下载PDF
甘肃文县城关镇山体-沉积河谷三维地震动IBEM模拟
20
作者 刘中宪 卢飞龙 +1 位作者 边煜凯 黄振恩 《防灾减灾工程学报》 北大核心 2025年第1期1-12,共12页
针对镇域尺度甘肃文县城关镇山体-沉积河谷三维地震动模拟问题,利用边界元法求解无限域弹性波动问题时降维和自动满足弹性波无限远辐射的优势,将间接边界元法拓展到城关镇山间河谷场地三维地震动模拟。根据钻孔资料及高精度地形数据建... 针对镇域尺度甘肃文县城关镇山体-沉积河谷三维地震动模拟问题,利用边界元法求解无限域弹性波动问题时降维和自动满足弹性波无限远辐射的优势,将间接边界元法拓展到城关镇山间河谷场地三维地震动模拟。根据钻孔资料及高精度地形数据建立三维精细化模型,以平面P波和SV波作为输入,在频域内分析了城关镇山间河谷地形对地震动的放大效应。为提高计算效率,在计算耗时严重的散射波场构造和虚拟荷载求解部分采用OpenMP(Open Multi-Processing)并行编程,并通过与半解析解对比验证了方法的准确性。城关镇的模拟结果表明:(1)沉积河谷和山体均会放大地震动,但沉积河谷的放大效应更为明显,在P波入射下,沉积河谷和山体观测点的位移放大系数(地震动位移与入射波位移幅值的比值)最大值分别为19.64和3.66,SV波入射下则为14.13和3.48;(2)两侧山体对地震波的反射会加剧山间河谷的边缘效应,河谷边缘的地震动放大系数最大可达19.64;(3)沉积河谷地震动的空间分布随频率变化明显,随着频率的升高,强震区从河谷中心逐渐往边缘转变。研究可为此类场地的地震区划和抗震设防提供一定参考。 展开更多
关键词 间接边界元方法 山间河谷地形 放大效应 openmp并行
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部