期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
RKDG有限元GPU 算法及其重排加速技术
1
作者
高缓钦
陈红全
+1 位作者
张加乐
贾雪松
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2023年第8期32-42,共11页
为提升并行化求解Navier Stokes方程的效率,构建了高阶有限元单元及单元边界映射线程结构和对应的各类GPU核函数,成功地把RKDG方法移植到GPU架构,发展出RKDG有限元GPU并行算法。算法数据访存能兼容GPU快慢不一的存储器,尤其在结构网格上...
为提升并行化求解Navier Stokes方程的效率,构建了高阶有限元单元及单元边界映射线程结构和对应的各类GPU核函数,成功地把RKDG方法移植到GPU架构,发展出RKDG有限元GPU并行算法。算法数据访存能兼容GPU快慢不一的存储器,尤其在结构网格上,算法涉及的数据依赖区结构有序,能较好满足GPU对齐合并访问的要求。但在非结构网格上,非结构化的数据依赖区,影响到访存效率。基于此提出一种适合高阶有限元算法框架的单元分层重排加速技术,致力于网格的层化结构,提升GPU访存效率。具体基于初始网格拓扑,创建单元或单元边界对应的分层结构,逐层重排,汇总形成适合GPU对齐合并访问的数据存储结构。文中结合排序实例,给出了这一重排加速技术的具体实施过程。算例表明,发展的算法逼近的阶数符合预期,计算结果能与现有文献或实验结果接近,且最大GPU加速比可达67.47。此外,非结构网格算例证实,算法可处理较为复杂的几何边界,且所提重排技术可进一步赢得重排加速。
展开更多
关键词
RKDG方法
GPU
分层排序
非结构网格
Navier
Stokes方程
在线阅读
下载PDF
职称材料
间断Galerkin有限元隐式算法GPU并行化研究
2
作者
高缓钦
陈红全
+1 位作者
贾雪松
徐圣冠
《空气动力学学报》
CSCD
北大核心
2024年第2期21-33,I0001,共14页
为了提高间断伽辽金(discontinuous Galerkin,DG)有限元方法的计算效率,围绕求解Euler方程,构建了基于图形处理器(graphics processing unit,GPU)并行加速的隐式DG算法。算法结合Roe格式进行空间离散,采用人工黏性法处理激波等间断问题...
为了提高间断伽辽金(discontinuous Galerkin,DG)有限元方法的计算效率,围绕求解Euler方程,构建了基于图形处理器(graphics processing unit,GPU)并行加速的隐式DG算法。算法结合Roe格式进行空间离散,采用人工黏性法处理激波等间断问题,时间推进选用下上对称高斯-赛德尔(lower-upper symmetric Gauss-Seidel,LU-SGS)隐式格式。为了克服传统隐式格式固有的数据关联依赖问题,借助于本文提出的面向任意网格的单元着色分组技术,先给出了LUSGS隐式格式的并行化改造,使得隐式时间推进能按颜色组别依次并行,由于同一颜色组内算法已不存在数据关联,可以据此实现并行化。在此基础上,再结合DG算法局部紧致等特点,基于统一计算设备架构(compute unified device architecture,CUDA)编程模型,设计了依据单元的核函数,并构建了对应的线程与数据结构,给出了DG有限元隐式GPU并行算法。最后,发展的算法通过了多个二维和三维典型流动算例考核与性能测试,展示出隐式算法GPU加速的效果,且获得的计算结果能与现有的文献或实验数据接近。
展开更多
关键词
间断伽辽金方法
LU-SGS隐式格式
GPU并行化
单元着色分组
EULER方程
在线阅读
下载PDF
职称材料
题名
RKDG有限元GPU 算法及其重排加速技术
1
作者
高缓钦
陈红全
张加乐
贾雪松
机构
南京航空航天大学航空学院
非定常空气动力学与流动控制工信部重点实验室(南京航空航天大学)
出处
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2023年第8期32-42,共11页
基金
国家自然科学基金(11972189,12102188)。
文摘
为提升并行化求解Navier Stokes方程的效率,构建了高阶有限元单元及单元边界映射线程结构和对应的各类GPU核函数,成功地把RKDG方法移植到GPU架构,发展出RKDG有限元GPU并行算法。算法数据访存能兼容GPU快慢不一的存储器,尤其在结构网格上,算法涉及的数据依赖区结构有序,能较好满足GPU对齐合并访问的要求。但在非结构网格上,非结构化的数据依赖区,影响到访存效率。基于此提出一种适合高阶有限元算法框架的单元分层重排加速技术,致力于网格的层化结构,提升GPU访存效率。具体基于初始网格拓扑,创建单元或单元边界对应的分层结构,逐层重排,汇总形成适合GPU对齐合并访问的数据存储结构。文中结合排序实例,给出了这一重排加速技术的具体实施过程。算例表明,发展的算法逼近的阶数符合预期,计算结果能与现有文献或实验结果接近,且最大GPU加速比可达67.47。此外,非结构网格算例证实,算法可处理较为复杂的几何边界,且所提重排技术可进一步赢得重排加速。
关键词
RKDG方法
GPU
分层排序
非结构网格
Navier
Stokes方程
Keywords
RKDG method
GPU
multi-layered reordering
unstructured mesh
Navier Stokes equations
分类号
V211.3 [航空宇航科学与技术—航空宇航推进理论与工程]
在线阅读
下载PDF
职称材料
题名
间断Galerkin有限元隐式算法GPU并行化研究
2
作者
高缓钦
陈红全
贾雪松
徐圣冠
机构
南京航空航天大学航空学院
南京工业大学机械与动力工程学院
出处
《空气动力学学报》
CSCD
北大核心
2024年第2期21-33,I0001,共14页
基金
国家自然科学基金(11972189,12102185)。
文摘
为了提高间断伽辽金(discontinuous Galerkin,DG)有限元方法的计算效率,围绕求解Euler方程,构建了基于图形处理器(graphics processing unit,GPU)并行加速的隐式DG算法。算法结合Roe格式进行空间离散,采用人工黏性法处理激波等间断问题,时间推进选用下上对称高斯-赛德尔(lower-upper symmetric Gauss-Seidel,LU-SGS)隐式格式。为了克服传统隐式格式固有的数据关联依赖问题,借助于本文提出的面向任意网格的单元着色分组技术,先给出了LUSGS隐式格式的并行化改造,使得隐式时间推进能按颜色组别依次并行,由于同一颜色组内算法已不存在数据关联,可以据此实现并行化。在此基础上,再结合DG算法局部紧致等特点,基于统一计算设备架构(compute unified device architecture,CUDA)编程模型,设计了依据单元的核函数,并构建了对应的线程与数据结构,给出了DG有限元隐式GPU并行算法。最后,发展的算法通过了多个二维和三维典型流动算例考核与性能测试,展示出隐式算法GPU加速的效果,且获得的计算结果能与现有的文献或实验数据接近。
关键词
间断伽辽金方法
LU-SGS隐式格式
GPU并行化
单元着色分组
EULER方程
Keywords
discontinuous Galerkin
implicit LU-SGS scheme
GPU-parallelized
coloring method
Euler equations
分类号
V211.3 [航空宇航科学与技术—航空宇航推进理论与工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
RKDG有限元GPU 算法及其重排加速技术
高缓钦
陈红全
张加乐
贾雪松
《哈尔滨工业大学学报》
EI
CAS
CSCD
北大核心
2023
0
在线阅读
下载PDF
职称材料
2
间断Galerkin有限元隐式算法GPU并行化研究
高缓钦
陈红全
贾雪松
徐圣冠
《空气动力学学报》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部