期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于SMP集群的混合并行编程模型研究 被引量:15
1
作者 王惠春 朱定局 +1 位作者 曹学年 樊建平 《计算机工程》 CAS CSCD 北大核心 2009年第3期271-273,共3页
提出一种适用于SMP集群的混合MPI+OpenMP并行编程模型。该模型贴近于SMP集群的体系结构且综合了消息传递和共享内存2种编程模型的优势,能获得较好的性能。讨论该混合模型的实现机制以及MPI消息传递模型的特点。实验结果表明,在一定条件... 提出一种适用于SMP集群的混合MPI+OpenMP并行编程模型。该模型贴近于SMP集群的体系结构且综合了消息传递和共享内存2种编程模型的优势,能获得较好的性能。讨论该混合模型的实现机制以及MPI消息传递模型的特点。实验结果表明,在一定条件下,该混合并行编程模型是SMP集群的最优选择。 展开更多
关键词 SMP集群 并行计算 混合编程模型
在线阅读 下载PDF
基于SMP集群的三维网格多粒度混合并行编程模型 被引量:6
2
作者 于方 郑晓薇 孙晓鹏 《计算机应用与软件》 CSCD 2009年第3期138-140,166,共4页
为提高大规模三维网格并行算法的执行效率,针对SMP集群分布/共享两级内存层次结构的特点,介绍适用于SMP集群混合编程的不同实现方法。对三维网格模型最短路径问题的并行求解提出了多粒度混合并行编程模型,给出了实现该问题的MPI+OpenMP... 为提高大规模三维网格并行算法的执行效率,针对SMP集群分布/共享两级内存层次结构的特点,介绍适用于SMP集群混合编程的不同实现方法。对三维网格模型最短路径问题的并行求解提出了多粒度混合并行编程模型,给出了实现该问题的MPI+OpenMP混合并行算法,并在SMP集群上同粗粒度MPI(Message Passing Interface)并行算法做了性能比较。结果表明,采用该多粒度混合并行编程模型具有更好的加速比和运行效率。 展开更多
关键词 SMP集群 分布/共享内存 MPI+OPENMP 混合编程模型 三维网格
在线阅读 下载PDF
MPI+TBB混合并行编程模型在分子动力学中的应用 被引量:2
3
作者 白明泽 赵文辉 +2 位作者 豆育升 孙世新 温迪 《计算机应用研究》 CSCD 北大核心 2012年第5期1772-1774,1794,共4页
为了提高分子动力学模拟在对称多处理(SMP)集群上的计算速度,在分子动力学并行方法中引入MPI+TBB的混合并行编程模型。基于该模型,在分子动力学软件LAMMPS中设计并实现混合并行算法,在节点间采用MPI及空间分解技术实施进程级并行,节点... 为了提高分子动力学模拟在对称多处理(SMP)集群上的计算速度,在分子动力学并行方法中引入MPI+TBB的混合并行编程模型。基于该模型,在分子动力学软件LAMMPS中设计并实现混合并行算法,在节点间采用MPI及空间分解技术实施进程级并行,节点内采用TBB及临界区技术实施线程级并行。在SMP集群中的测试表明,该方法在体系较大以及节点数较多时可以明显减少通信时间,使加速比在纯MPI模型上提高45%。结果表明,MPI+TBB混合并行编程模型可促进分子动力学并行模拟且效率明显提升。 展开更多
关键词 分子动力学 混合并行编程模型 SMP集群 MPI 线程构建块
在线阅读 下载PDF
基于OpenMP/MPI并行编程模型的N体问题的优化实现 被引量:1
4
作者 祝永志 续士强 禹继国 《计算机工程与应用》 CSCD 北大核心 2016年第5期16-21,共6页
多核集群的层次化并行编程模型一直是高性能计算的研究热点。以SMP集群为例,从硬件上可分为节点间和节点内的两层架构。阐述了层次化并行编程的实现技术,针对N体问题算法进行了基于Hybrid并行编程模型的并行化研究。提出了一种块同步MPI... 多核集群的层次化并行编程模型一直是高性能计算的研究热点。以SMP集群为例,从硬件上可分为节点间和节点内的两层架构。阐述了层次化并行编程的实现技术,针对N体问题算法进行了基于Hybrid并行编程模型的并行化研究。提出了一种块同步MPI/Open MP细粒度N体问题的优化算法。基于曙光TC5000A集群,将该算法与传统的N体并行算法进行了执行时间与加速比的比较,得出了几句总结性具体论述。 展开更多
关键词 混合编程模型 块同步算法 N-体问题 性能优化
在线阅读 下载PDF
基于改进最小距离法的图像匹配并行算法设计 被引量:9
5
作者 邹国良 张石明 +1 位作者 陈长吉 王振华 《计算机工程》 CAS CSCD 北大核心 2018年第9期218-223,共6页
为充分利用多核计算资源提高图像匹配识别的实时性,设计一种基于改进最小距离法的图像匹配并行化算法。选取标准化欧氏距离来代替简单欧氏距离作为特征的相似性度量,同时在多核计算机上采用MPI+OpenMP混合编程模型对该算法进行仿真验证... 为充分利用多核计算资源提高图像匹配识别的实时性,设计一种基于改进最小距离法的图像匹配并行化算法。选取标准化欧氏距离来代替简单欧氏距离作为特征的相似性度量,同时在多核计算机上采用MPI+OpenMP混合编程模型对该算法进行仿真验证。结果表明,与基于最小距离法的图像匹配算法相比,该算法可以减少匹配误差和匹配运算时间,并且MPI+OpenMP混合编程模型具有较好的加速比和并行计算效率。 展开更多
关键词 图像匹配 决策理论 最小距离法 混合编程模型 多核计算机
在线阅读 下载PDF
面向通用一致性优化的通信高效的异步ADMM算法 被引量:2
6
作者 王冬霞 雷咏梅 张泽宇 《计算机科学》 CSCD 北大核心 2022年第11期309-315,共7页
分布式交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)是求解大规模机器学习问题使用最广泛的方法之一。现有大多数分布式ADMM算法都基于完整的模型更新。随着系统规模及数据量的不断增长,节点间的通信开销逐渐成... 分布式交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)是求解大规模机器学习问题使用最广泛的方法之一。现有大多数分布式ADMM算法都基于完整的模型更新。随着系统规模及数据量的不断增长,节点间的通信开销逐渐成为限制分布式ADMM算法发展的瓶颈。为了减少节点间通信开销,提出了一种通信高效的通用一致性异步分布式ADMM算法(General Form Consensus Asynchronous Distributed ADMM,GFC-ADADMM),该算法通过分析高维稀疏数据集的特性,节点间利用关联模型参数代替完整模型参数进行通信,并对模型参数进行过滤以进一步减少节点间传输负载。同时结合过时同步并行(Stale Synchronous Parallel,SSP)计算模型、allreude通信模型及混合编程模型的优势,利用异步allreduce框架并基于MPI/OpenMP混合编程模型实现GFC-ADADMM算法,提高算法计算与通信效率。文中利用GFC-ADADMM算法求解稀疏logistic回归问题,实验测试表明,与现有分布式ADMM算法相比,GFC-ADADMM算法可减少15%~63%的总运行时间,且算法收敛时可达到更高的准确率。 展开更多
关键词 分布式交替方向乘子法 通用一致性优化 稀疏allreduce 混合编程模型 LOGISTIC回归
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部