-
题名面向DCU的流固耦合浸没边界算法异构实现
- 1
-
-
作者
商建东
熊威
华浩波
宋昭璐
郭恒亮
张军
-
机构
郑州大学国家超级计算郑州中心
郑州大学计算机与人工智能学院
郑州航空工业管理学院数学学院
南京航空航天大学航空学院
-
出处
《计算机工程》
北大核心
2025年第7期263-274,共12页
-
基金
河南省重大科技专项(221100210600)。
-
文摘
直接力浸没边界法是求解流固耦合问题的常见方法之一,其可以有效地处理复杂的几何形状,包括移动和变形的固体。然而,三维复杂流动模拟具有网格规模大、耗时多的特点,在单核处理器上使用传统的串行算法往往无法满足计算要求。目前,在国产平台上对流固耦合问题的研究较少,而在国产平台上实现直接力浸没边界算法能够丰富平台的应用生态。为此,使用国产DCU(Deep Compute Unit)加速器,基于CPU-DCU异构编程,设计并实现利用三维直接力浸没边界算法求解流固耦合问题的并行程序。首先,在CPU上实现串行算法并进行热点分析,对程序热点部分使用DCU加速器进行异构加速;其次,在异构实现的基础上,结合DCU硬件特性,使用共享内存、循环分块、调整访存顺序等优化手段对核函数进行优化;最后,通过圆球绕流和仿生鱼自主游动算例对程序进行正确性验证和性能测试。实验结果表明,在雷诺数分别为100和200时,圆球的阻力系数分别为1.11和0.78,计算结果均与相关文献吻合;在雷诺数为7142的仿生鱼自主游动实验中,游动稳定后的平均前进速度为0.396,该结果与相关文献结果一致。在圆球绕流实验中,在5033万网格规模下该并行程序较串行程序获得了83.7倍的加速效果。通过两类流固耦合数值实验,验证了CPU-DCU并行直接力浸没边界算法在国产异构平台上进行计算的有效性和准确性,这为国产平台上CFD(Computational Fluid Dynamics)算法的研究提供了坚实基础。
-
关键词
异构计算
dcu加速器件
访存优化
直接力浸没边界法
流固耦合
-
Keywords
heterogeneous computing
dcu accelerator components
memory access optimization
direct-forcing immersed boundary method
fluid-structure interaction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-