期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
基于Seed-PCG法的列车-轨道-地基土三维随机振动GPU并行计算方法
1
作者 朱志辉 冯杨 +2 位作者 杨啸 李昊 邹有 《Journal of Central South University》 SCIE EI CAS CSCD 2024年第1期302-316,共15页
为了解决列车-轨道-地基土三维有限元模型随机多样本计算效率低的问题,本文提出了一种基于Seed-PCG法的高效并行计算方法。基于有限元法和虚拟激励法建立轨道不平顺激励下的三维列车-轨道-地基土耦合随机振动分析模型;针对车致地基土随... 为了解决列车-轨道-地基土三维有限元模型随机多样本计算效率低的问题,本文提出了一种基于Seed-PCG法的高效并行计算方法。基于有限元法和虚拟激励法建立轨道不平顺激励下的三维列车-轨道-地基土耦合随机振动分析模型;针对车致地基土随机振动分析产生的多右端项线性方程组求解问题,采用Seed-PCG方法进行求解。通过PCG方法求解种子系统得到的Krylov子空间进行投影,以改进其余线性方程组的初始解和对应的初始残量,有效提高了PCG法的收敛速度,最后,在MATLABCUDA混合平台上开发了并行计算程序。数值算例表明:相同计算平台下的该方法相比多点同步算法获得了104.2倍的加速;相比PCG法逐个求解方案减少了18%的迭代次数,获得了1.21倍的加速。 展开更多
关键词 Seed-PCG法 多右端项线性方程组 随机振动 gpu并行计算 列车-轨道-地基土耦合模型
在线阅读 下载PDF
基于GPU并行计算的浅水波运动数值模拟 被引量:15
2
作者 许栋 徐彬 +2 位作者 David PAyet 白玉川 及春宁 《计算力学学报》 CAS CSCD 北大核心 2016年第1期113-120,共8页
利用有限体积法求解描述水流运动的二维浅水方程组,模拟洪水波运动传播过程,并通过GPU并行计算技术对程序进行加速,建立了浅水运动高效模拟方法。数值模拟结果表明,基于本文提出的GPU并行策略以及通用并行计算架构(CUDA)支持,能够实现相... 利用有限体积法求解描述水流运动的二维浅水方程组,模拟洪水波运动传播过程,并通过GPU并行计算技术对程序进行加速,建立了浅水运动高效模拟方法。数值模拟结果表明,基于本文提出的GPU并行策略以及通用并行计算架构(CUDA)支持,能够实现相比CPU单核心最高112倍的加速比,为利用单机实现快速洪水预测以及防灾减灾决策提供有效支撑。此外,对基于GPU并行计算的浅水模拟计算精度进行了论证,并对并行性能优化进行了分析。利用所建模型模拟了溃坝洪水在三维障碍物间的传播过程。 展开更多
关键词 洪水波 二维浅水方程组 gpu并行计算 CUDA
在线阅读 下载PDF
GPU并行计算加速的实时可视外壳三维重建及其虚实交互 被引量:13
3
作者 邵绪强 聂霄 王保义 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2017年第1期52-61,共10页
针对现有的基于图像的三维重建方法难以实现真实物体的快速三维重建,无法满足虚实交互等应用需求的问题,提出一种基于GPU并行计算的实时三维重建及其虚实交互方法.首先把物体所在空间剖分成具有数据独立性的体素集合,结合可视外壳重建... 针对现有的基于图像的三维重建方法难以实现真实物体的快速三维重建,无法满足虚实交互等应用需求的问题,提出一种基于GPU并行计算的实时三维重建及其虚实交互方法.首先把物体所在空间剖分成具有数据独立性的体素集合,结合可视外壳重建算法和精确行进立方体算法并行遍历每个体素得到体素状态序列;然后并行压缩体素状态序列得到非空体素集合,对非空体素进行并行三角形网格化,并利用图形硬件的多重纹理映射和可编程功能进行基于像素的纹理映射;最后假定虚拟物体的粒子为运动受限的拉格朗日流体粒子,重建物体网格顶点为流体边界,通过流体动力学方程的并行光滑粒子动力学方法求解来计算虚实交互.实验结果表明,该方法在GPU上进行完全并行求解,在32×32×32的空间剖分精度下,实现了实时三维重建和20帧/s左右的虚实交互计算,适用于计算机图形学和虚拟现实等领域中的虚实交互应用. 展开更多
关键词 可视外壳 三维重建 gpu并行计算 虚实交互 实时模拟
在线阅读 下载PDF
一种基于GPU并行计算的无人机影像快速镶嵌方法 被引量:2
4
作者 李朋龙 丁忆 +3 位作者 胡艳 罗鼎 段松江 舒文强 《国土资源遥感》 CSCD 北大核心 2017年第4期57-63,共7页
提出了一种从匀光后无人机影像出发,以Voronoi图为镶嵌线网络,基于GPU并行计算的无人机影像快速镶嵌方法。首先,通过Wallis滤波处理影像间色彩不一致问题;然后,以测区影像位置自动生成Voronoi图镶嵌线网络;最后,基于GPU并行计算将无人... 提出了一种从匀光后无人机影像出发,以Voronoi图为镶嵌线网络,基于GPU并行计算的无人机影像快速镶嵌方法。首先,通过Wallis滤波处理影像间色彩不一致问题;然后,以测区影像位置自动生成Voronoi图镶嵌线网络;最后,基于GPU并行计算将无人机影像快速正射纠正并镶嵌。通过对230张空间分辨率为0.1 m的无人机影像进行快速纠正镶嵌,实验结果表明,该方法较传统方法效率有很大提升。 展开更多
关键词 影像匀光 无人机影像 正射纠正 影像镶嵌 gpu并行计算
在线阅读 下载PDF
基于SPH方法与GPU并行计算的复杂阶梯流数值模拟 被引量:3
5
作者 吴建松 李娜 +1 位作者 刘文雨 周世禄 《安全与环境学报》 CAS CSCD 北大核心 2019年第3期774-779,共6页
为了更有效地模拟和分析地铁站内复杂楼梯上洪水流动的动力学特征,采用光滑粒子流体动力学方法(SPH)并借助GPU并行计算技术对复杂形态(带1、2、3个休息平台的直行、直角转弯L型)阶梯上洪水流动特征和漫延过程进行数值建模和计算分析。基... 为了更有效地模拟和分析地铁站内复杂楼梯上洪水流动的动力学特征,采用光滑粒子流体动力学方法(SPH)并借助GPU并行计算技术对复杂形态(带1、2、3个休息平台的直行、直角转弯L型)阶梯上洪水流动特征和漫延过程进行数值建模和计算分析。基于SPH方法和GPU并行加速的复杂阶梯流模型的数值模拟结果表明:该模型不但可以计算获得更好的阶梯流流态,而且具有较高的计算效率;不同休息平台数、不同形态阶梯上洪水水流呈现差别较大的水流特征;该模型借助GPU并行加速,适合研究大尺度复杂楼梯上洪水漫延问题,可为分析和评估洪水水流对地铁站楼梯上被困人员疏散过程的影响提供有力的工具。 展开更多
关键词 安全工程 地铁站 洪水 阶梯流 光滑粒子流体动力学 gpu并行计算
在线阅读 下载PDF
基于光滑粒子流体动力学方法与GPU并行计算的阶梯流数值模拟 被引量:3
6
作者 吴建松 许声弟 胡啸峰 《科学技术与工程》 北大核心 2016年第23期59-63,共5页
为了更好地模拟分析地下空间阶梯流动力学规律和提升数值计算效率,利用光滑粒子流体动力学方法(SPH),并借助GPU并行计算技术对地下空间阶梯流进行数值建模和计算。基于GPU并行化加速的SPH地下空间阶梯流模型的数值计算结果表明:该模型... 为了更好地模拟分析地下空间阶梯流动力学规律和提升数值计算效率,利用光滑粒子流体动力学方法(SPH),并借助GPU并行计算技术对地下空间阶梯流进行数值建模和计算。基于GPU并行化加速的SPH地下空间阶梯流模型的数值计算结果表明:该模型不仅计算获得较好的阶梯流流态,而且计算效率大幅度提高,比串行SPH模型和移动粒子半隐方法(MPS)模型快数百倍,为研究大尺度城市街区洪水提供了一个比较有前景的研究途径。 展开更多
关键词 地下空间 阶梯流 光滑粒子流体动力学 gpu并行计算
在线阅读 下载PDF
基于GPU并行计算的雷达杂波模拟研究 被引量:6
7
作者 徐国伟 陈建 成怡 《计算机工程》 CAS CSCD 北大核心 2020年第11期306-314,共9页
现代雷达杂波模拟需使用杂波数据实时分析与处理回波信号,然而传统球不变随机过程(SIRP)方法生成杂波数据耗时较长。通过对SIRP方法进行改进,提出一种利用图形处理器(GPU)并行计算提升杂波生成实时性的方法。在计算统一设备架构(CUDA)下... 现代雷达杂波模拟需使用杂波数据实时分析与处理回波信号,然而传统球不变随机过程(SIRP)方法生成杂波数据耗时较长。通过对SIRP方法进行改进,提出一种利用图形处理器(GPU)并行计算提升杂波生成实时性的方法。在计算统一设备架构(CUDA)下,对相关相干K分布杂波算法进行多任务串-并行分析,采用cuBLAS库对细粒度卷积计算进行优化,利用OpenMP+CUDA多任务调度机制改进粗粒度任务并行计算,以提高CPU-GPU利用率并减少数据等待时间。实验结果表明,该方法生成杂波数据的实时性显著提升,且随着杂波数据量增大其加速效果更好,相较传统GPU方法计算速率提高61%。 展开更多
关键词 雷达杂波 gpu并行计算 球不变随机过程法 卷积计算 cuBLAS库
在线阅读 下载PDF
一种非线性显式分层壳单元及其GPU并行计算实现 被引量:2
8
作者 曹胜涛 李志山 杨志勇 《振动与冲击》 EI CSCD 北大核心 2019年第22期60-69,84,共11页
通用有限元程序ABAQUS的钢筋混凝土显式分层壳单元被广泛应用于剪力墙抗震性能分析,但存在两个缺陷:①只能得到混凝土受压损伤和受拉损伤,无法反映混凝土剪切损坏,因此不易根据损伤类型对结构进行优化;②基于CPU并行计算,大规模计算效... 通用有限元程序ABAQUS的钢筋混凝土显式分层壳单元被广泛应用于剪力墙抗震性能分析,但存在两个缺陷:①只能得到混凝土受压损伤和受拉损伤,无法反映混凝土剪切损坏,因此不易根据损伤类型对结构进行优化;②基于CPU并行计算,大规模计算效率较低。基于平面应力条件下的混凝土弹塑性损伤本构模型,根据混凝土损伤发展时的受力状态和工程实践需要将损伤分为受拉损伤、受压损伤和受剪损伤。结合可损伤分类的塑性损伤模型,给出了非线性壳元物理沙漏力和面内旋转力的构造方法,进而得到一种含面内旋转自由度的4节点24自由度四边形非线性显式分层壳单元。将该研究壳元在自主研发的基于CPU+GPU异构并行计算的非线性分析软件中完成开发实现;通过与ABAQUS benchmark算例结果对比,验证了开发内容的正确性;通过与剪力墙单调加载试验对比,验证了该研究壳元的合理性。分别采用自主研发软件和ABAQUS对上海地区某框架核心筒体系的超高层结构进行了罕遇地震非线性时程分析,结果表明:①自主研发软件与ABAQUS结果基本一致,而计算效率为ABAQUS计算效率的5.69倍;②自主研发软件得到的受拉损伤、受压损伤和受剪损伤损伤可更清晰地揭示核心筒在罕遇地震作用下的损坏演化规律和破坏模式。 展开更多
关键词 弹塑性损伤模型 混凝土损伤类型 非线性显式分层壳单元 剪力墙损坏模式 CPU+gpu并行计算
在线阅读 下载PDF
二维结构拓扑优化的GPU并行计算方法研究 被引量:2
9
作者 刘家彤 王春洁 +1 位作者 吴健 付志方 《机械设计与制造》 北大核心 2020年第1期123-126,131,共5页
针对结构拓扑优化中存在的计算量大,计算效率低的问题,以二维结构拓扑优化问题为研究对象,提出了一种GPU并行计算方法。通过对已有串行算法进行研究,结合GPU并行计算的基本特点,采用节点刚度方法计算结构刚度矩阵,相对于MATLAB向量化计... 针对结构拓扑优化中存在的计算量大,计算效率低的问题,以二维结构拓扑优化问题为研究对象,提出了一种GPU并行计算方法。通过对已有串行算法进行研究,结合GPU并行计算的基本特点,采用节点刚度方法计算结构刚度矩阵,相对于MATLAB向量化计算,该算法加速效果显著。以固体各向同性材料惩罚法进行结构拓扑优化为例,在CUDA平台下实现了对结构化网格二维拓扑优化问题的GPU并行计算,得到了清晰的拓扑构型,将该方法与现有计算方法进行对比,GPU并行计算速度有较大提升。 展开更多
关键词 拓扑优化 gpu并行计算 节点刚度 固体各向同性材料惩罚法 CUDA
在线阅读 下载PDF
基于GPU并行计算的风沙流SPH数值分析
10
作者 梁岚博 金阿芳 +1 位作者 闻腾腾 楚花明 《机床与液压》 北大核心 2021年第7期122-127,共6页
在研究风沙流动方面,光滑粒子流体动力学方法(SPH)的无网格性有着独有的优势。利用SPH方法研究风沙流动时,需要将整个计算区域离散成数量庞大的单个粒子,因此计算规模大、计算效率低。为提高SPH方法的计算效率,采用支持并行计算的CUDA平... 在研究风沙流动方面,光滑粒子流体动力学方法(SPH)的无网格性有着独有的优势。利用SPH方法研究风沙流动时,需要将整个计算区域离散成数量庞大的单个粒子,因此计算规模大、计算效率低。为提高SPH方法的计算效率,采用支持并行计算的CUDA平台,利用GPU大规模并行计算技术,实现SPH方法数值模拟时的加速运算。以二维气沙两相耦合模型作为数值算例,利用GPU并行计算详细分析颗粒群的运动规律。比较在不同粒子数下CPU与GPU的计算效率以及GPU线程数对计算效率的影响。对所得结果进行统计分析后,得到了单颗沙粒的典型抛物线形和变异的跃移轨迹。模拟结果证明:SPH-GPU并行计算技术能够应用在风沙流结构的数值模拟研究中。 展开更多
关键词 光滑粒子流体动力学方法 gpu并行计算 风沙流 跃移轨迹 数值模拟
在线阅读 下载PDF
三维连续-非连续并行计算方法及其在岩爆过程模拟中的应用 被引量:2
11
作者 王学滨 杜轩 +3 位作者 薛承宇 陈双印 廖裴彬 余保健 《水资源与水工程学报》 CSCD 北大核心 2024年第1期177-185,共9页
随着深部岩石工程的发展,岩爆变得越发严重。在岩爆的数值模拟方面,连续方法和非连续方法均具有一定的局限性。兼具二者优势的连续-非连续方法更具优势,且正在快速发展。基于CUDA对自主开发的三维拉格朗日元与离散元耦合连续-非连续方... 随着深部岩石工程的发展,岩爆变得越发严重。在岩爆的数值模拟方面,连续方法和非连续方法均具有一定的局限性。兼具二者优势的连续-非连续方法更具优势,且正在快速发展。基于CUDA对自主开发的三维拉格朗日元与离散元耦合连续-非连续方法进行了GPU并行加速。为了探索岩爆的机理和过程,模拟了不同静水压力、侧压系数和单元数目(最多达100×10^(4))条件下圆形洞室围岩V形坑的演化规律和单元弹射现象。考察了洞室围岩中裂纹的定量演化规律。研究表明:当静水压力较大时,基于芬纳公式的支护设计偏于不安全。由于V形坑的位置发生改变,V形坑的平均最大深度随着静水压力的增加先缓慢增加后快速增加。关于洞室围岩V形坑的模拟结果能与有关的实验结果、数值结果和现场观测结果吻合。上述研究很好地体现了岩爆并行计算较串行计算和商业软件计算的优势。 展开更多
关键词 岩爆 gpu并行计算 三维连续-非连续方法 V形坑 静水压力 侧压系数 洞室
在线阅读 下载PDF
基于GPU的车辆-轨道-地基土耦合系统3D随机振动并行计算方法 被引量:2
12
作者 朱志辉 夏禹涛 +1 位作者 王力东 刘禹兵 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第7期79-88,共10页
针对轨道不平顺随机特征导致车辆-轨道-地基土耦合系统随机分析计算效率低的问题,采用虚拟激励法降低大样本分析的计算量;针对耦合系统等效刚度矩阵的稀疏特性,采用行压缩(Compressed Sparse Row,CSR)格式存储大型稀疏矩阵,采用预处理... 针对轨道不平顺随机特征导致车辆-轨道-地基土耦合系统随机分析计算效率低的问题,采用虚拟激励法降低大样本分析的计算量;针对耦合系统等效刚度矩阵的稀疏特性,采用行压缩(Compressed Sparse Row,CSR)格式存储大型稀疏矩阵,采用预处理共轭梯度法(Preconditioned Conjugate Gradient,PCG)求解对称正定的等效静力平衡方程,最后通过MATLAB-CUDA(Compute Unified Device Architecture)混合平台开发基于GPU的并行计算程序.数值算例表明:基于MATLAB-CUDA混合平台求解等效静力平衡方程的效率是串行多点同步算法的86.13倍,大大缩短了随机振动分析的总计算时间,且内存占用小、易于在个人计算机上实施;采用PCG法求解车辆-轨道-地基土耦合系统形成的大型稀疏线性方程组时,建议以加速度指标作为迭代收敛精度的控制指标;可通过选取适当的迭代收敛精度,以达到计算精度和计算效率的平衡. 展开更多
关键词 随机振动 gpu并行计算 3D有限元法 虚拟激励法 车辆-轨道-地基土耦合模型
在线阅读 下载PDF
层流扩散燃烧在GPU上的并行计算和数值分析
13
作者 魏浩洋 曾国荪 丁春玲 《计算机应用》 CSCD 北大核心 2013年第9期2428-2431,2435,共5页
在实际工程应用中,使用传统的CPU串行计算来开展燃烧数值模拟往往难以满足对模拟速度的要求。利用GPU比CPU更强的计算能力,通过在交错网格上将燃烧物理方程离散化,使用预处理稳定双共轭梯度法(PBiCGSTAB)求解离散化方程,并且探索面向GP... 在实际工程应用中,使用传统的CPU串行计算来开展燃烧数值模拟往往难以满足对模拟速度的要求。利用GPU比CPU更强的计算能力,通过在交错网格上将燃烧物理方程离散化,使用预处理稳定双共轭梯度法(PBiCGSTAB)求解离散化方程,并且探索面向GPU编程的矩阵向量乘并行算法和逆矩阵向量乘并行算法,从而给出一种在GPU上数值求解层流扩散燃烧的可行方法。实验结果表明,GPU并行程序获得了相对串行CPU程序约10倍以上的加速效果,且计算结果与实际情况相符,因而所提方法是可行且高效的。 展开更多
关键词 层流扩散燃烧 数值模拟 gpu并行计算 预处理稳定双共轭梯度法 加速比
在线阅读 下载PDF
影像数据分布并行计算处理平台体系架构研究 被引量:3
14
作者 朱嘉舟 邵培南 陈景 《计算机工程》 CAS CSCD 北大核心 2017年第5期60-66,74,共8页
遥感影像数据并行处理系统大多依赖于国外商用产品,而国内自主化并行计算处理系统的任务流程化支撑能力以及并行计算性能难以适应规模化生产。为此,基于Hadoop的HDFS,MapReduce集群并行架构、CPU和GPU协同并行处理、内存映像、BMP等技术... 遥感影像数据并行处理系统大多依赖于国外商用产品,而国内自主化并行计算处理系统的任务流程化支撑能力以及并行计算性能难以适应规模化生产。为此,基于Hadoop的HDFS,MapReduce集群并行架构、CPU和GPU协同并行处理、内存映像、BMP等技术,提出流程驱动执行的高性能分布式并行计算处理平台体系架构。实验结果表明,工作站集群和工作站内多粒度混合的并行计算架构提高了平台并行处理性能,为海量遥感影像数据产品的批量生产提供一种自主化解决方案。 展开更多
关键词 大数据 Hadoop架构 HADOOP分布式文件系统 MAPREDUCE框架 gpu并行计算
在线阅读 下载PDF
基于有限体积法的河网水动力并行计算模型 被引量:11
15
作者 宋利祥 李清清 +2 位作者 胡晓张 杨芳 陈文龙 《长江科学院院报》 CSCD 北大核心 2019年第5期7-12,共6页
针对具有干河床、急缓流态交替的河网水动力模拟,采用MUSCL-Hancock有限体积格式离散Saint-Venant方程组,运用汊点水位预测-校正法处理河网汊点连接条件,建立了断面与河道完全数值解耦的复杂河网水动力模型。运用OpenMP和OpenACC编程模... 针对具有干河床、急缓流态交替的河网水动力模拟,采用MUSCL-Hancock有限体积格式离散Saint-Venant方程组,运用汊点水位预测-校正法处理河网汊点连接条件,建立了断面与河道完全数值解耦的复杂河网水动力模型。运用OpenMP和OpenACC编程模式分别实现了CPU,GPU并行计算。采用经典算例对模型计算精度进行了验证,采用珠三角河网实际算例对不同并行计算方式的加速效果进行了分析。算例研究表明,该模型具有良好的稳定性和计算效率,可适用于陡坡河道水动力模拟,具有较好的推广应用价值。 展开更多
关键词 河网 水动力模型 有限体积法 gpu并行计算 CPU并行计算 数值模拟
在线阅读 下载PDF
基于VS2012的并行计算实验平台搭建与实现 被引量:2
16
作者 陈华 王明君 《实验室研究与探索》 CAS 北大核心 2015年第2期125-127,共3页
结合最新的并行计算技术,基于VS2012搭建了Open MP、MPI、C++AMP、CUDA 6.0等四个并行实验平台,并对不同实验平台实现PI值计算。实验结果说明这种并行计算环境具有良好的性能与可扩展性;Open MP与MPI等CPU计算加速效果与CPU内核数目成比... 结合最新的并行计算技术,基于VS2012搭建了Open MP、MPI、C++AMP、CUDA 6.0等四个并行实验平台,并对不同实验平台实现PI值计算。实验结果说明这种并行计算环境具有良好的性能与可扩展性;Open MP与MPI等CPU计算加速效果与CPU内核数目成比例,C++AMP与CUDA 6.0等GPU计算加速效果与GPU物理计算核心数目成正比;同等条件下GPU物理计算核心数目远多于CPU核心数目,用GPU进行计算往往可获得更高的性价比。 展开更多
关键词 并行实验平台 VS2012 多核计算 gpu并行计算 MPI并行计算
在线阅读 下载PDF
复杂地质条件的间断有限元地震波数值模拟及GPU加速
17
作者 韩德超 刘卫华 +2 位作者 张春丽 袁媛 白鹏 《石油物探》 北大核心 2025年第4期639-652,共14页
间断Galerkin有限元方法(DGFEM)是一种具有较高模拟精度的有限元方法,但其算法编程难度大,其针对各类复杂介质的波动方程的算法目前未见统一的计算格式。为此,基于三角形非结构化网格以及局部Lax-Friedrichs数值流,构建了针对复杂介质... 间断Galerkin有限元方法(DGFEM)是一种具有较高模拟精度的有限元方法,但其算法编程难度大,其针对各类复杂介质的波动方程的算法目前未见统一的计算格式。为此,基于三角形非结构化网格以及局部Lax-Friedrichs数值流,构建了针对复杂介质波动方程模拟的DGFEM编程计算矩阵,并进一步得出了适用于各类复杂介质模拟的单一波场分量的通用计算格式。该通用计算格式能够有效提升DGFEM算法编程的可拓展性。基于该格式给出了DGFEM的通用CUDA核函数的构建方法,并形成CPU+GPU的二维DGFEM并行计算程序框架。通用CUDA核函数可以将DGFEM算法进一步延伸到更加复杂的介质以及三维情况。理论模型和复杂山地模型的数值实验结果表明,构建的通用计算格式和CUDA核函数可以准确模拟声波、弹性波、粘弹性波、孔隙弹性波方程描述的纵波、横波以及慢纵波等波现象。相比单核CPU模拟,二维DGFEM弹性波GPU计算加速比平均在100倍左右。同时,弹性波、粘弹性波、孔隙弹性波模拟耗时约为声波模拟的1.7,2.3,3.0倍。此结果可以指导复杂介质耦合条件模拟时多进程的负载平衡。 展开更多
关键词 间断Galerkin有限元方法 弹性波 粘弹性波 孔隙弹性波 数值模拟 gpu并行计算.
在线阅读 下载PDF
基于改进的GPU并行NSGA-Ⅲ的土地利用优化配置 被引量:13
18
作者 王海军 曾浩然 +2 位作者 张文婷 张彬 周玲慧 《农业工程学报》 EI CAS CSCD 北大核心 2020年第21期283-291,共9页
土地利用优化配置是实现土地资源可持续利用的重要途径。该研究根据地理单元发展演变特点对基于参考点的非支配排序的遗传算法进行针对性改进,并耦合多目标优化方法,构建了土地利用空间优化模型。针对目前空间优化模型耗时过长,效率低... 土地利用优化配置是实现土地资源可持续利用的重要途径。该研究根据地理单元发展演变特点对基于参考点的非支配排序的遗传算法进行针对性改进,并耦合多目标优化方法,构建了土地利用空间优化模型。针对目前空间优化模型耗时过长,效率低的问题,该研究将GPU(Graphics Processing Unit,GPU)并行计算和土地利用优化配置模型有机结合,提升模型的优化效率。选取武汉市东西湖区进行实证研究,对比了模型在CPU(Central Processing Unit,CPU)串行计算和GPU并行计算2种方式下的运行耗时,并从最终优化结果中选取生态保护优先和经济发展优先2种典型方案进行分析。结果表明:1)GPU并行计算能够显著提升模型的优化效率,模型运行耗时由原来的158.08 h缩短到了1.68 h;2)模型能够统筹协调多个目标,对研究区域土地的数量结构和空间布局进行合理配置,为规划决策者提供多个可行方案。生态保护优先方案中,生态效益降低了6.16%,经济效益增长了13.64%;经济发展优先方案中,生态效益降低了6.19%,经济效益增长了15.86%。 展开更多
关键词 土地利用 优化 非支配排序 遗传算法 gpu并行计算 武汉市东西湖区
在线阅读 下载PDF
基于GPU的大状态密码S盒差分性质评估方法 被引量:1
19
作者 张润莲 张密 +1 位作者 武小年 舒瑞 《计算机应用》 CSCD 北大核心 2024年第9期2785-2790,共6页
大状态的密码S盒能够为对称密码算法提供更好的混淆性,但对大状态S盒的性质评估开销巨大。为高效评估大状态密码S盒的差分性质,提出基于GPU并行计算的大状态密码S盒差分性质评估方法。该方法基于现有的差分均匀度计算方法,针对16比特S... 大状态的密码S盒能够为对称密码算法提供更好的混淆性,但对大状态S盒的性质评估开销巨大。为高效评估大状态密码S盒的差分性质,提出基于GPU并行计算的大状态密码S盒差分性质评估方法。该方法基于现有的差分均匀度计算方法,针对16比特S盒的差分均匀度和32比特S盒的差分性质,分别设计GPU并行方案,通过优化GPU并行粒度和负载均衡提高了核函数和GPU的执行效率,并缩短了计算时间。测试结果表明,相较于CPU方法和GPU并行方法,所提方法大幅降低了大状态S盒差分性质评估的计算时间,提高了对大状态S盒差分性质的评估效率:对16比特S盒差分均匀度的计算时间为0.3 min;对32比特S盒的单个输入差分的最大输出差分概率计算时间约5 min,对它的差分性质计算时间约2.6 h。 展开更多
关键词 密码S盒 差分密码分析 差分均匀度 最大输出差分概率 gpu并行计算
在线阅读 下载PDF
基于GPU并行的厦门附近海域潮波传播数值模拟研究 被引量:9
20
作者 孟江山 路川藤 +1 位作者 罗小峰 丁伟 《中国水利水电科学研究院学报》 北大核心 2021年第4期424-433,共10页
厦门周边海域岛屿众多,潮汐汊道交错,水流运动复杂,本文针对该海域开展基于GPU并行的潮波传播精细化模拟研究。基于GPU并行算法构建了厦门附近海域高分辨率二维潮流数学模型,计算效率与单核CPU相比,可提高约180倍。模拟计算了2019年全... 厦门周边海域岛屿众多,潮汐汊道交错,水流运动复杂,本文针对该海域开展基于GPU并行的潮波传播精细化模拟研究。基于GPU并行算法构建了厦门附近海域高分辨率二维潮流数学模型,计算效率与单核CPU相比,可提高约180倍。模拟计算了2019年全年厦门周边海域的潮波传播,研究表明,厦门岛附近潮量主要来自厦门湾,潮波自外海向九龙江口方向传播,高潮位逐渐升高,低潮位逐渐降低。同安湾方向潮波受厦门湾和围头湾两股潮波影响,其潮波特性与围头湾更为相似。厦门海域M2分潮占绝对主导地位,其振幅占所有分潮的41.2%,全日分潮K1分潮振幅值最大,同安湾与九龙江口M2分潮振幅接近,K1分潮九龙江口振幅较大,潮波变形程度同安湾较大。 展开更多
关键词 gpu并行计算 潮波传播 厦门海域 潮波变形
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部