期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
并行时空处理模型下的快速N-body算法 被引量:3
1
作者 王伟 曾栩鸿 +2 位作者 王福焕 傅丽丽 曾国荪 《计算机科学与探索》 CSCD 2011年第11期1006-1013,共8页
图形处理器(graphic processing unit,GPU)的最新发展已经能够以低廉的成本提供高性能的通用计算。基于GPU的CUDA(compute unified device architecture)和OpenCL(open computing language)编程模型为程序员提供了充足的类似于C语言的... 图形处理器(graphic processing unit,GPU)的最新发展已经能够以低廉的成本提供高性能的通用计算。基于GPU的CUDA(compute unified device architecture)和OpenCL(open computing language)编程模型为程序员提供了充足的类似于C语言的应用程序接口(application programming interface,API),便于程序员发挥GPU的并行计算能力。采用图形硬件进行加速计算,通过一种新的GPU处理模型——并行时间空间模型,对现有GPU上的N-body实现进行了分析,从而提出了一种新的GPU上快速仿真N-body问题的算法,并在AMD的HD Radeon 5850上进行了实现。实验结果表明,相对于CPU上的实现,获得了400倍左右的加速;相对于已有GPU上的实现,也获得了2至5倍的加速。 展开更多
关键词 n-body 并行计算 通用图形处理器(GPGPU) 时间空间模型
在线阅读 下载PDF
BH算法的几点注记 被引量:2
2
作者 杨圣云 赖国明 霍红卫 《计算机工程与设计》 CSCD 北大核心 2006年第16期2979-2981,共3页
N-Body问题的直接计算方法的时间复杂度是O(2),BH算法的时间复杂度为O(log)[1]。BH算法利用质心近似计算降低了时间复杂度,但同时也降低了计算结果的准确度。为把与判断足够远的参数(=/)密切相关的计算结果的近似准确度控制在要求的范围... N-Body问题的直接计算方法的时间复杂度是O(2),BH算法的时间复杂度为O(log)[1]。BH算法利用质心近似计算降低了时间复杂度,但同时也降低了计算结果的准确度。为把与判断足够远的参数(=/)密切相关的计算结果的近似准确度控制在要求的范围内,应用多极扩展和Gauss数值积分方法给出了BH算法质心近似的数学解释以及误差与参数的关系,得出BH算法是FMM算法和Gauss数值积分的一个特例,并指出Gauss积分法中隐含的正交多项式较FMM中常用的che-byshev正交多项式更与求解的问题相关。 展开更多
关键词 n-body仿真 Barnes-Hut算法 多极扩展FMA Gauss积分法
在线阅读 下载PDF
FMM算法中问题规模与空间划分的关系分析 被引量:2
3
作者 曹旻 杨彩霞 《计算机工程与应用》 CSCD 北大核心 2011年第25期39-43,共5页
从编译优化和并行优化的角度出发,根据N-Body问题求解的FMM算法的原理,将算法分解为不同的子模块。详细分析了各子模块的计算特性,包括计算量分析、并行性分析、通信量分析和存储量分析。深入剖析问题规模与空间划分层数之间的关系,提... 从编译优化和并行优化的角度出发,根据N-Body问题求解的FMM算法的原理,将算法分解为不同的子模块。详细分析了各子模块的计算特性,包括计算量分析、并行性分析、通信量分析和存储量分析。深入剖析问题规模与空间划分层数之间的关系,提出基于问题规模的空间划分策略。以实验验证了空间划分策略的可行性。 展开更多
关键词 编译优化 N体(n-body)问题求解 快速多极子方法(FMM) 空间划分树
在线阅读 下载PDF
基于混合架构的FMM算法硬件加速
4
作者 曹旻 李海强 曹真 《计算机工程》 CAS CSCD 2012年第16期275-278,283,共5页
以高性能计算中的经典问题——多体问题的快速多极子(FMM)算法为例,分析FMM算法的各个步骤,根据计算、通信和存储特性将算法中的子过程归类。在CPU、GPU、FPGA和CELL上分别进行测试,提出执行FMM算法的混合可重构体系结构配置方案,并进... 以高性能计算中的经典问题——多体问题的快速多极子(FMM)算法为例,分析FMM算法的各个步骤,根据计算、通信和存储特性将算法中的子过程归类。在CPU、GPU、FPGA和CELL上分别进行测试,提出执行FMM算法的混合可重构体系结构配置方案,并进一步优化算法,分解任务流。针对不同任务流的特点,提出可行的解决方案。结果证明,该方案可提高算法效率。 展开更多
关键词 混合可重构计算机体系结构 加速部件 n-body问题 快速多极子算法 配置方案 任务流
在线阅读 下载PDF
FMM算法在Cell/B.E.处理器上实现的分析与验证 被引量:1
5
作者 唐振 张倬 +1 位作者 柴亚辉 徐炜民 《计算机工程与科学》 CSCD 北大核心 2011年第8期79-83,共5页
FMM算法[1]是基于树结构的,用于解决多体问题(N-Body)的经典算法。它将N-Body问题的计算复杂度由O(N2)降为O(N),并且能达到任意精度。通用CPU在计算规模较大的N-Body问题时需要耗费大量的时间。为了加速算法的执行,本文对FMM算法在Cell/... FMM算法[1]是基于树结构的,用于解决多体问题(N-Body)的经典算法。它将N-Body问题的计算复杂度由O(N2)降为O(N),并且能达到任意精度。通用CPU在计算规模较大的N-Body问题时需要耗费大量的时间。为了加速算法的执行,本文对FMM算法在Cell/B.E.处理器上的实现进行了分析与验证。首先从功能上将FMM算法分解为八个核心过程,在此基础上根据计算特点的不同,对八个核心过程进行归类,最后选取其中有代表性的核心步骤,阐述了其在Cell/B.E.上实现的可行性问题,以及部分核心步骤的设计和实现过程。实验结果表明,选定的FMM算法核心步骤在Cell/B.E.上可以获得相对通用CPU较高的加速比。 展开更多
关键词 FMM n-body Cell/B.E. 加速 分析和验证
在线阅读 下载PDF
基于定点压缩技术的双层粒子网格算法的设计与优化
6
作者 程盛淦 于浩然 +1 位作者 韦建文 林新华 《计算机科学》 CSCD 北大核心 2020年第8期56-61,共6页
现代天体物理学的研究离不开大规模N-body模拟。N-body模拟常用的算法之一是粒子网格(Particle-Mesh,PM)算法,但是PM算法需要消耗较多的内存容量。内存限制成为了N-body模拟在现代超算平台大规模扩展的瓶颈。因此,文中使用了利用定点压... 现代天体物理学的研究离不开大规模N-body模拟。N-body模拟常用的算法之一是粒子网格(Particle-Mesh,PM)算法,但是PM算法需要消耗较多的内存容量。内存限制成为了N-body模拟在现代超算平台大规模扩展的瓶颈。因此,文中使用了利用定点压缩技术减少内存消耗的方法,将存储每个N-body粒子相空间的内存消耗减少到最低6个字节,比传统PM算法低近一个数量级。文中实现了基于定点压缩技术的双层粒子网格算法,并使用包括混合精度计算、通信优化在内的方法对其性能进行了优化。这些优化技术显著降低了定点压缩带来的性能损耗,将压缩和解压在程序总耗时中的占比从21%降低至8%,并且在核心计算热点上达到了最高2.3倍的加速效果,使得程序在较低的内存消耗下保持较高的计算效率和扩展性。 展开更多
关键词 n-body模拟 粒子网格算法 混合精度计算 大规模并行
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部