-
题名FMM算法的并行化方法
被引量:2
- 1
-
-
作者
赖国明
杨圣云
袁德辉
-
机构
韩山师范学院数学与信息技术学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2007年第7期176-178,共3页
-
文摘
详细分析快速多极算法FMM(Fast Multipole Method)的基本原理,并对引力场的势函数的多极展开和泰勒局部展开进行了详细的推导。给出了串行FMM算法的伪码描述,并对其进行并行化分析、处理,对FMM算法进行了并行化研究。最后,在基于MPI的群集并行计算环境下进行大量的实验并采集实验数据,对算法进行并行化性能分析,得到较好的并行加速比和较高的并行效率。
-
关键词
快速多极算法fmm
多极扩展
泰勒扩展
并行算法
加速比
-
Keywords
Fast muhipole method(fmm) Fast muhipole expansion Taylor expansion Parallel algorithm Speedup
-
分类号
TP319
[自动化与计算机技术—计算机软件与理论]
-
-
题名多GPU混合结构下FMM近程算法的优化
- 2
-
-
作者
曹旻
田力
朱永华
-
机构
上海大学计算机工程与科学学院
-
出处
《计算机工程与应用》
CSCD
2013年第8期37-42,91,共7页
-
基金
国家自然科学基金(No.61001163)
上海市教育委员会科研创新项目(No.09YZ09)
-
文摘
近几年,在高性能计算领域,GPU+CPU混合结构成为许多高性能计算机的主要结构,得到了广泛的应用。由于混合结构的特殊性,分析了传统的阿姆达尔定律,将其推广到混合结构中。针对FMM算法中近程计算部分在multi-GPU+CPU混合结构中存在的任务均衡以及通信延时等问题,在混合结构阿姆达尔定律的指导下,提出了多GPU调度模型和两级流水模型。该调度模型能够有效地进行多个GPU之间负载的均衡,缓解近程计算的非均匀性所带来的问题;同时,两级流水模型使CPU和GPU可以并行工作,通过计算和访存的重叠,来隐藏访存带来的延时问题,提高运算部件的利用率。实验验证和数据的比较证明了上述优化的可行性,该优化方案进一步加速了算法的执行。
-
关键词
混合结构
GPU
快速多极子算法(fmm)
Petfmm
流水线
-
Keywords
hybrid architecture
GPU
Fast Multipole Method(fmm)
Petfmm
pipelining
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名多体问题FMM算法在加速部件FPGA研究与实现
被引量:4
- 3
-
-
作者
李琪刚
柴亚辉
徐炜民
郑衍衡
-
机构
上海大学计算机工程与科学学院
华东交通大学信息工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2011年第10期3391-3394,共4页
-
基金
上海市重点学科建设基金项目(J50103)
-
文摘
针对FPGA能较好满足高性能计算的异构多核、并行、低成本、低能耗要求,研究了高性能计算的重要的应用之一——多体问题。分析了多体问题应用广泛的FMM算法以及FMM算法的各个算粒,并在FPGA器件实现算粒,与多核CPU上实现这些算粒进行比较,FPGA都获得了不错的加速比。分析了FPGA应用高性能计算的一些优势和当前面临的问题,对FPGA广泛应用高性能计算进行了初步探索。
-
关键词
高性能计算
多体问题
fmm(快速多极算法)
FPGA(现场可编程门阵列)
协处理器
-
Keywords
high performance calculation
N-bodyproblem
fmm
FPGA
coprocessor
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-