期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于八叉树细化的高效四面体网格生成
1
作者 刘金宝 高翔 +1 位作者 张翔 龚春叶 《空气动力学学报》 北大核心 2025年第8期50-58,I0001,共10页
非结构化四面体网格在复杂几何建模中具有重要应用价值,但现有方法多数需要先生成表面网格,再基于表面网格生成体网格,在大型复杂模型的高精度仿真中往往会出现三维网格生成出错或规模过大的情况。为了克服现有技术中网格生成效率低、... 非结构化四面体网格在复杂几何建模中具有重要应用价值,但现有方法多数需要先生成表面网格,再基于表面网格生成体网格,在大型复杂模型的高精度仿真中往往会出现三维网格生成出错或规模过大的情况。为了克服现有技术中网格生成效率低、鲁棒性较差、实现过程复杂等缺陷,本文提出了一种基于八叉树细化的非结构化四面体网格生成算法。算法采用改进的根四面体网格形状,在保证网格质量的同时使得初始网格单元形状一致,在表面拟合阶段采用网格形状调整和网格分裂两个步骤的实现方式。测试结果表明,本算法可以忽略部分几何模型缺陷,0.9~1.0高质量区间的网格单元占比明显高于其他方法,百万级网格生成耗时较传统方法减少80%以上。该算法能够高效地生成高质量网格,并克服了传统方法的局限性,为非结构化四面体网格生成领域的研究和应用提供了新的思路和参考。 展开更多
关键词 网格生成 非结构网格 八叉树算法 网格优化
在线阅读 下载PDF
面向科学工程计算的数模孔洞填充修复
2
作者 刘增晟 高翔 +2 位作者 张翔 徐传福 龚春叶 《国防科技大学学报》 北大核心 2025年第2期165-172,共8页
在网格生成软件处理几何模型过程中,针对几何表面信息缺失带来的孔洞问题,提出一种基于B样条曲面的填充修复方法。根据拓扑关系在给定的B样条曲线集中提取孔洞边界,针对单个孔洞包含的曲线采用曲线逼近拟合与组合技术进行预处理得到相... 在网格生成软件处理几何模型过程中,针对几何表面信息缺失带来的孔洞问题,提出一种基于B样条曲面的填充修复方法。根据拓扑关系在给定的B样条曲线集中提取孔洞边界,针对单个孔洞包含的曲线采用曲线逼近拟合与组合技术进行预处理得到相容曲线。由曲线构造单向插值直纹面与张量积曲面,然后将曲面通过布尔和操作生成双线性差值B样条曲面来修复孔洞。此外,为保证方法的健壮性,针对复杂的特殊孔洞,可进一步采用直纹面生成填充作为候补方法。实验结果表明,方法具有很好的通用性,能适用于真实工业数模中各类形态孔洞的脏几何修复,为后续的网格生成提供干净、封闭的几何模型。 展开更多
关键词 B样条 孔洞 双线性插值 网格生成
在线阅读 下载PDF
基于“天河二号”聚合通信卸载特性的MPI_Barrier优化
3
作者 朱琦 戴艺 +5 位作者 彭晋韬 谢旻 梁崇山 刘鹏 杨博 刘杰 《计算机工程与科学》 北大核心 2025年第3期400-411,共12页
Barrier作为消息传递接口MPI程序的基本操作,是确保程序正确执行的重要机制之一。目前已有的Barrier实现方案主要存在2个缺陷:首先,节点间同步存在大量冗余的数据路径传输开销;其次,节点内同步存在大量缓存失效的情况。为解决这些性能限... Barrier作为消息传递接口MPI程序的基本操作,是确保程序正确执行的重要机制之一。目前已有的Barrier实现方案主要存在2个缺陷:首先,节点间同步存在大量冗余的数据路径传输开销;其次,节点内同步存在大量缓存失效的情况。为解决这些性能限制,针对“天河二号”定制网络TH-Express聚合通信卸载特性,提出了基于GLEX NIC的Barrier加速和共享内存标志位重排列2种优化技术,有效减少了节点间同步开销,提高了节点内基于共享内存的同步效率。基于上述优化方法,重新设计了MPI_Barrier算法,并将其集成到MPI通信库中,并在国家超级计算长沙中心通过运行微基准测试程序和实际应用程序对所提优化方法进行性能测试,规模达到7168个节点。实验结果表明,优化后的MPI_Barrier集合操作获得了1.3~14.5倍的加速,并在应用级真实负载评测中,性能提升高达54%。 展开更多
关键词 MPI BARRIER 大规模并行应用 NIC聚合通信卸载
在线阅读 下载PDF
MIMD众核架构ILU分解并行算法优化研究
4
作者 石永振 莫淏天 +2 位作者 胡星宇 刘杰 王庆林 《计算机工程与科学》 北大核心 2025年第9期1544-1554,共11页
ILU分解被广泛应用于求解大规模稀疏线性系统,能够有效减少迭代次数、提高求解效率,但限于线性系统的数据依赖性和分解过程中计算访存的不规则,较难进行高效的并行优化。多指令多数据(MIMD)众核架构中众多并行计算线程可以执行不同的指... ILU分解被广泛应用于求解大规模稀疏线性系统,能够有效减少迭代次数、提高求解效率,但限于线性系统的数据依赖性和分解过程中计算访存的不规则,较难进行高效的并行优化。多指令多数据(MIMD)众核架构中众多并行计算线程可以执行不同的指令,对于控制流不规则的算法具有天然的适应性。基于MIMD众核架构PEZY-SC3s处理器开展ILU分解并行算法优化研究,提出了一种面向MIMD架构的ILU并行算法,并采用基于图着色的并行性优化、基于向量单元的访存优化、基于线程分组的负载平衡优化以及基于片上局部存储的数据局部性优化等措施来优化算法性能。实验结果表明,所提ILU并行分解算法与Intel^(R)Xeon^(R)4314 CPU上MKL实现和NVIDIA^(R)A30 GPU上cuSPARSE实现相比,分别获得了16.70与1.39的平均加速比。 展开更多
关键词 ILU分解 MIMD众核架构 并行计算
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部