期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
FMM算法的并行化方法 被引量:2
1
作者 赖国明 杨圣云 袁德辉 《计算机应用与软件》 CSCD 北大核心 2007年第7期176-178,共3页
详细分析快速多极算法FMM(Fast Multipole Method)的基本原理,并对引力场的势函数的多极展开和泰勒局部展开进行了详细的推导。给出了串行FMM算法的伪码描述,并对其进行并行化分析、处理,对FMM算法进行了并行化研究。最后,在基于MPI的... 详细分析快速多极算法FMM(Fast Multipole Method)的基本原理,并对引力场的势函数的多极展开和泰勒局部展开进行了详细的推导。给出了串行FMM算法的伪码描述,并对其进行并行化分析、处理,对FMM算法进行了并行化研究。最后,在基于MPI的群集并行计算环境下进行大量的实验并采集实验数据,对算法进行并行化性能分析,得到较好的并行加速比和较高的并行效率。 展开更多
关键词 快速多极算法fmm 多极扩展 泰勒扩展 并行算法 加速比
在线阅读 下载PDF
多GPU混合结构下FMM近程算法的优化
2
作者 曹旻 田力 朱永华 《计算机工程与应用》 CSCD 2013年第8期37-42,91,共7页
近几年,在高性能计算领域,GPU+CPU混合结构成为许多高性能计算机的主要结构,得到了广泛的应用。由于混合结构的特殊性,分析了传统的阿姆达尔定律,将其推广到混合结构中。针对FMM算法中近程计算部分在multi-GPU+CPU混合结构中存在的任务... 近几年,在高性能计算领域,GPU+CPU混合结构成为许多高性能计算机的主要结构,得到了广泛的应用。由于混合结构的特殊性,分析了传统的阿姆达尔定律,将其推广到混合结构中。针对FMM算法中近程计算部分在multi-GPU+CPU混合结构中存在的任务均衡以及通信延时等问题,在混合结构阿姆达尔定律的指导下,提出了多GPU调度模型和两级流水模型。该调度模型能够有效地进行多个GPU之间负载的均衡,缓解近程计算的非均匀性所带来的问题;同时,两级流水模型使CPU和GPU可以并行工作,通过计算和访存的重叠,来隐藏访存带来的延时问题,提高运算部件的利用率。实验验证和数据的比较证明了上述优化的可行性,该优化方案进一步加速了算法的执行。 展开更多
关键词 混合结构 GPU 快速多极算法(fmm) Petfmm 流水线
在线阅读 下载PDF
多体问题FMM算法在加速部件FPGA研究与实现 被引量:4
3
作者 李琪刚 柴亚辉 +1 位作者 徐炜民 郑衍衡 《计算机工程与设计》 CSCD 北大核心 2011年第10期3391-3394,共4页
针对FPGA能较好满足高性能计算的异构多核、并行、低成本、低能耗要求,研究了高性能计算的重要的应用之一——多体问题。分析了多体问题应用广泛的FMM算法以及FMM算法的各个算粒,并在FPGA器件实现算粒,与多核CPU上实现这些算粒进行比较,... 针对FPGA能较好满足高性能计算的异构多核、并行、低成本、低能耗要求,研究了高性能计算的重要的应用之一——多体问题。分析了多体问题应用广泛的FMM算法以及FMM算法的各个算粒,并在FPGA器件实现算粒,与多核CPU上实现这些算粒进行比较,FPGA都获得了不错的加速比。分析了FPGA应用高性能计算的一些优势和当前面临的问题,对FPGA广泛应用高性能计算进行了初步探索。 展开更多
关键词 高性能计算 多体问题 fmm(快速多极算法) FPGA(现场可编程门阵列) 协处理器
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部