期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
计及铁心非线性的变压器空间动态磁场加速计算方法 被引量:1
1
作者 司马文霞 孙佳琪 +3 位作者 杨鸣 邹德旭 彭庆军 王劲松 《电工技术学报》 北大核心 2025年第5期1559-1574,共16页
快速获得变压器空间磁场动态分布是构建变压器数字孪生体的基础之一,然而现有快速计算方法难以快速、准确地获得铁心饱和工况下的磁场分布特性。因此,该文提出了计及铁心非线性的变压器空间动态磁场加速计算方法。首先,构建变压器电磁... 快速获得变压器空间磁场动态分布是构建变压器数字孪生体的基础之一,然而现有快速计算方法难以快速、准确地获得铁心饱和工况下的磁场分布特性。因此,该文提出了计及铁心非线性的变压器空间动态磁场加速计算方法。首先,构建变压器电磁场路耦合仿真模型,对关键变量进行参数化扫描,仿真获得不同非线性工况下的大量磁场数据,构建涉及铁心非线性工况的主磁通和漏磁通数据集;其次,提出融合卷积神经网络(CNN)和长短期记忆网络(LSTM)的双分支深度学习模型,训练提取磁场数据的空间和时间特征,解决主、漏磁通差异大造成的模型训练难题;最后,利用模型获得输入电压、电流与内部空间磁场分布的非线性映射关系,实现空间动态磁场的加速计算,为变压器数字孪生体的构建提供了快速获得磁场数据的方法。 展开更多
关键词 非线性 卷积神经网络 长短期记忆网络 磁场 加速计算
在线阅读 下载PDF
基于GPU的B样条曲面加速计算 被引量:2
2
作者 黄鑫 李胜 +1 位作者 程惠阁 汪国平 《系统仿真学报》 CAS CSCD 北大核心 2006年第z1期1-4,共4页
图形处理器(GPU)可编程性能的不断提高使得在三维几何造型系统中出现了越来越多的基于GPU的应用。提出了一个基于GPU片元程序计算B样条曲面的加速算法。通过测试算法在GPU上计算B样条曲面的时间与基于CPU的传统算法相比较,表明提出的基... 图形处理器(GPU)可编程性能的不断提高使得在三维几何造型系统中出现了越来越多的基于GPU的应用。提出了一个基于GPU片元程序计算B样条曲面的加速算法。通过测试算法在GPU上计算B样条曲面的时间与基于CPU的传统算法相比较,表明提出的基于GPU的加速算法效率明显高于传统算法。同时提出的算法具有良好的易用性和可扩展性,可以应用到Bézier曲面、NURBS曲面等其他参数曲面的加速计算中。 展开更多
关键词 B样条曲面 GPU 片元程序 加速计算
在线阅读 下载PDF
基于Vulkan的电大复杂目标电磁散射SBR计算方法与GPU加速技术
3
作者 王思凡 吴扬 +5 位作者 贾浩文 胡志明 申子昂 徐若锋 梁达 赵雷 《电波科学学报》 北大核心 2025年第3期457-463,共7页
提出了一种基于Vulkan架构的弹跳射线(shooting and bouncing ray,SBR)加速计算方法,用于电大复杂目标雷达散射截面的快速计算。设计了高效的Vulkan计算着色器,充分利用GPU硬件光追,显著提升了SBR法中光线求交的计算速度;引入了双命令... 提出了一种基于Vulkan架构的弹跳射线(shooting and bouncing ray,SBR)加速计算方法,用于电大复杂目标雷达散射截面的快速计算。设计了高效的Vulkan计算着色器,充分利用GPU硬件光追,显著提升了SBR法中光线求交的计算速度;引入了双命令缓冲机制,使得CPU与GPU能够高效协同工作,从而加速多角度扫描任务的执行;在虚拟孔径面上划分互不干扰的子任务,进一步提升了多GPU并行的利用效率。实验结果表明:所提出方法在计算电大复杂目标雷达散射截面时相较于FEKO RL-GO方法实现了40倍以上的加速;双命令缓冲机制提升了约42%的多角度扫描速度;双GPU计算并行效率超过90%。 展开更多
关键词 雷达散射截面(RCS) 弹跳射线(SBR)法 光线追踪 GPU加速计算 电大复杂目标
在线阅读 下载PDF
电推进粒子网格法模拟中计算加速方法的研究综述 被引量:1
4
作者 汤海滨 潘若剑 +2 位作者 毛仁凡 崔云蔚 任军学 《推进技术》 EI CAS CSCD 北大核心 2024年第8期1-25,共25页
粒子网格法(PIC)模拟电推进装置等离子体时具有很强的第一性,但是模拟过程中计算负载很大,故PIC模拟的计算加速方法不可或缺。本文从电推进装置基本性质、低温等离子体物理特性和PIC算法特点作为切入点,明确了PIC方法在电推进装置模拟... 粒子网格法(PIC)模拟电推进装置等离子体时具有很强的第一性,但是模拟过程中计算负载很大,故PIC模拟的计算加速方法不可或缺。本文从电推进装置基本性质、低温等离子体物理特性和PIC算法特点作为切入点,明确了PIC方法在电推进装置模拟过程中计算负载高的原因;结合国内外的研究现状,从建模、时空尺度、算法与并行三个层面介绍了对应计算加速方法的原理和效果;对各类计算加速方法进行了总结和展望。 展开更多
关键词 电推进 PIC模拟 计算加速方法 并行计算 综述
在线阅读 下载PDF
基于CUDA的加速MATLAB计算研究 被引量:9
5
作者 刘绍波 刘明贵 张国华 《计算机应用研究》 CSCD 北大核心 2010年第6期2140-2143,共4页
介绍了NVIDIA公司新的编程框架CUDA的特点以及CUDA加速MATLAB的方法,测试了CUDA加速岩土工程中常用的算法如矩阵计算、快速傅里叶变换、支持向量机。随后分析了数据规模、算法复杂性与加速效果的关系,指出了基于CUDA的MATLAB加速计算的... 介绍了NVIDIA公司新的编程框架CUDA的特点以及CUDA加速MATLAB的方法,测试了CUDA加速岩土工程中常用的算法如矩阵计算、快速傅里叶变换、支持向量机。随后分析了数据规模、算法复杂性与加速效果的关系,指出了基于CUDA的MATLAB加速计算的应用前景。测试结果表明,CUDA方式相对传统计算方式的最好加速效果分别达到了22.39倍、46.88倍、51.32倍,证明了CUDA加速计算的有效性。 展开更多
关键词 统一计算设备架构 MATLAB 加速计算
在线阅读 下载PDF
基于YARN集群的计算加速部件扩展支持 被引量:6
6
作者 李钦 朱延超 +1 位作者 刘轶 钱德沛 《计算机研究与发展》 EI CSCD 北大核心 2016年第6期1263-1270,共8页
以GPU和Intel MIC为代表的计算加速部件已在科学计算、图形图像处理等领域得到了广泛的应用,其在基于云平台的高性能计算及大数据处理等方向也具有广泛的应用前景.YARN是新一代Hadoop分布式计算框架,其对计算资源的分配调度主要针对CPU... 以GPU和Intel MIC为代表的计算加速部件已在科学计算、图形图像处理等领域得到了广泛的应用,其在基于云平台的高性能计算及大数据处理等方向也具有广泛的应用前景.YARN是新一代Hadoop分布式计算框架,其对计算资源的分配调度主要针对CPU,缺少对计算加速部件的支持.在YARN中添加计算加速部件需要解决多个难点,分别是计算加速部件资源如何调度以及异构节点间如何共享问题、多个任务同时调用计算加速部件而引起的资源争用问题和集群中对计算加速部件的状态监控与管理问题.为了解决这些问题,提出了动态节点捆绑策略、流水线式的计算加速部件任务调度等,实现了YARN对计算加速部件的支持,并通过实验验证了其有效性. 展开更多
关键词 分布式系统 YARN 计算加速部件 混合异构节点 图形图像处理器 节点捆绑 任务调度
在线阅读 下载PDF
零知识证明硬件加速研究综述
7
作者 谢明东 郝萌 +2 位作者 杨洪伟 何慧 张伟哲 《信息安全研究》 CSCD 北大核心 2024年第7期594-601,共8页
零知识证明(zeroknowledge proofs,ZKP)是一种允许证明者向验证者证明某一陈述正确性而无需泄露任何其他信息的密码学协议.主要介绍了零知识证明的加速研究,尤其关注了基于二次算术程序(QAP quadratic arithmetic program)和内积证明(in... 零知识证明(zeroknowledge proofs,ZKP)是一种允许证明者向验证者证明某一陈述正确性而无需泄露任何其他信息的密码学协议.主要介绍了零知识证明的加速研究,尤其关注了基于二次算术程序(QAP quadratic arithmetic program)和内积证明(inner product argument,IPA)的ZKP.研究表明,零知识证明的计算效率可以通过硬件加速技术显著提高,包括使用GPU,ASIC,FPGA等.首先介绍了零知识证明的定义与分类及目前零知识证明应用所遇到的困难.其次详细讨论了不同硬件系统的加速方法、实现原理及其相对于传统CPU的性能提升.例如,cuZK和GZKP利用GPU实现了多标量乘法(multiscalar multiplication,MSM)和数论变换(number theoretic transform,NTT),而PipeZK,PipeMSM,BSTMSM则通过ASIC和FPGA加速这些计算过程.此外,也提到了零知识证明在区块链中隐藏交易细节等方面的应用案例,如ZCash的隐秘交易.最后,提出了未来研究的方向,包括加速更多类型的ZKP和将硬件加速应用到实际的应用场景中,以解决效率低下问题,推动零知识证明技术的广泛应用. 展开更多
关键词 零知识证明 硬件加速计算 并行计算 密码学协议 区块链隐私
在线阅读 下载PDF
面向特定应用的计算加速器虚拟化
8
作者 陈莉丽 沈立 +2 位作者 王志英 肖侬 姚益平 《计算机研究与发展》 EI CSCD 北大核心 2011年第11期2103-2110,共8页
近年来,专用指令集处理器(application specific instruction set processor,ASIP)在嵌入式系统中得到了越来越广泛的应用.这些ASIP提供了面向某个领域定制硬件计算加速器的功能.通过利用加速器提供的扩展指令,可以大幅提升ASIP面向领... 近年来,专用指令集处理器(application specific instruction set processor,ASIP)在嵌入式系统中得到了越来越广泛的应用.这些ASIP提供了面向某个领域定制硬件计算加速器的功能.通过利用加速器提供的扩展指令,可以大幅提升ASIP面向领域的处理能力.然而,这些计算加速器只能加速那些在编译时加入了扩展指令的应用程序.对于在编译时没有加入扩展指令的应用而言,得不到任何性能提升.利用软件动态二进制翻译来解决这一问题,即将计算加速器虚拟化.与传统的静态编译方法所不同的是,以动态虚拟化方式利用计算加速器面临许多新的问题.针对这些问题,提出了一系列解决方法,并用实验加以验证. 展开更多
关键词 计算加速 动态二进制翻译 特定应用 虚拟化 专用指令集处理器
在线阅读 下载PDF
基于非均匀变分节块法的pin-by-pin计算加速算法研究 被引量:1
9
作者 张滕飞 吴宏春 +4 位作者 曹良志 李云召 刘晓晶 熊进标 柴翔 《原子能科学技术》 EI CAS CSCD 北大核心 2019年第7期1160-1164,共5页
计算效率是制约pin-by-pin计算工程应用的主要因素之一。本文利用三维扩散的非均匀变分节块法的非均匀节块的描述能力,在不改变原问题栅元均匀化材料分布的前提下,将传统pin-by-pin计算中使用的均匀材料细网剖分方式替代为非均匀材料粗... 计算效率是制约pin-by-pin计算工程应用的主要因素之一。本文利用三维扩散的非均匀变分节块法的非均匀节块的描述能力,在不改变原问题栅元均匀化材料分布的前提下,将传统pin-by-pin计算中使用的均匀材料细网剖分方式替代为非均匀材料粗网剖分方式(粗网加速方法),既能保证pin-by-pin的计算分辨率,又能显著降低红-黑迭代所需的浮点数操作数目,减小内迭代的计算代价。针对外迭代,运用广义矩阵分离加速(GPM)算法和粗网有限差分(CMFD)算法提高源迭代的收敛速度,降低计算时间。数值结果表明,提出的加速算法能在保证计算精度的前提下,有效提高pin-by-pin计算的效率。 展开更多
关键词 加速pin-by-pin计算 非均匀变分节块法 粗网加速方法 广义矩阵分离加速算法 粗网有限差分算法
在线阅读 下载PDF
可扩展的桌面问题求解环境计算加速中间件
10
作者 王炎武 陈虎 +1 位作者 戴葵 奚建清 《计算机工程》 CAS CSCD 北大核心 2010年第9期32-34,40,共4页
为利用多种高性能计算资源的计算能力,设计一种可扩展的桌面问题求解环境计算加速中间件,采用应用层、中间层和计算层3层结构,以降低系统设计的复杂度,支持多种并行后端、分布式扩展以及并行后端的即插即用。用该加速中间件进行Matlab中... 为利用多种高性能计算资源的计算能力,设计一种可扩展的桌面问题求解环境计算加速中间件,采用应用层、中间层和计算层3层结构,以降低系统设计的复杂度,支持多种并行后端、分布式扩展以及并行后端的即插即用。用该加速中间件进行Matlab中的LU分解实验,结果证明了其有效性。 展开更多
关键词 中间件 桌面问题求解环境计算加速 高性能计算
在线阅读 下载PDF
基于物理的流体动画加速技术的研究进展 被引量:13
11
作者 柳有权 王章野 +2 位作者 朱鉴 常元章 吴恩华 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2013年第3期312-321,共10页
基于物理的流体动画技术一直是计算机图形学领域里最为活跃的研究方向之一,且其最近几年的发展非常迅猛.然而由于该技术需要求解复杂的非线性运动方程,而实时性又是计算机图形应用的一个重要需求,因此如何提升其计算效率始终是个挑战性... 基于物理的流体动画技术一直是计算机图形学领域里最为活跃的研究方向之一,且其最近几年的发展非常迅猛.然而由于该技术需要求解复杂的非线性运动方程,而实时性又是计算机图形应用的一个重要需求,因此如何提升其计算效率始终是个挑战性问题.文中对目前基于物理的流体动画技术在加速技术方面的研究进展进行了详细地分析和总结,针对计算过程的每一个步骤分别进行了剖析,从流场元素的高效表达、紧凑的计算网格、高效计算方法、硬件并行处理等方面做了详细展开,并由此给出一些启示性思路,如混合表达的方法等,以实现实时的流体动画效果. 展开更多
关键词 纳维斯-托克斯方程 流体动画 加速计算 混合表达
在线阅读 下载PDF
电气主接线可靠性评估矩阵算法的加速技术研究 被引量:5
12
作者 鲁宗相 郭永基 《中国电力》 CSCD 北大核心 2004年第5期47-50,共4页
为得到实用化的电气主接线可靠性评估软件,要求算法必须达到对不同主接线型式的普适性和计算分析的高效性。基于邻接矩阵的最小路集/割集算法是一种用于电气主接线评估的新算法,适用于各种主接线型式的可靠性评估。文中对邻接矩阵算法... 为得到实用化的电气主接线可靠性评估软件,要求算法必须达到对不同主接线型式的普适性和计算分析的高效性。基于邻接矩阵的最小路集/割集算法是一种用于电气主接线评估的新算法,适用于各种主接线型式的可靠性评估。文中对邻接矩阵算法的加速计算技术进行了深入研究。通过最小路集/割集矩阵的稀疏化处理,最小路集矩阵的降维处理及最小割集的快速搜索等3项技术,有效地提高了算法的计算速度。经实例测试,计算效率比常规矩阵算法提高至少6倍,达到电气主接线评估软件的快速性要求。 展开更多
关键词 电气主接线 可靠性评估 矩阵算法 加速计算技术 最小路集/割集算法
在线阅读 下载PDF
基于GPU加速技术的非结构流域雨洪数值模型 被引量:36
13
作者 侯精明 张兆安 +4 位作者 马利平 张大伟 向立云 汪煜 李继成 《水科学进展》 EI CAS CSCD 北大核心 2021年第4期567-576,共10页
为高效高精度地模拟流域雨洪过程,应用动力波法求解二维圣维南方程,并耦合水文过程,建立了包含流域降雨产流、汇流、下渗以及洪水演进等过程的高性能流域雨洪数值模型。该模型的优势在于使用非结构网格,可较好地处理不规则边界,准确贴... 为高效高精度地模拟流域雨洪过程,应用动力波法求解二维圣维南方程,并耦合水文过程,建立了包含流域降雨产流、汇流、下渗以及洪水演进等过程的高性能流域雨洪数值模型。该模型的优势在于使用非结构网格,可较好地处理不规则边界,准确贴合复杂地形表面,使得模型能精确计算模拟流域雨洪过程,同时引入GPU技术加速计算,使得大尺度流域雨洪计算成为可能。最后,将模型应用于V型经典算例及2个实际流域雨洪算例,所得结果与实测吻合较好,计算所用时间较短,表明该模型可以快速且精确模拟流域雨洪过程。研究结果有助于实现对实际流域雨洪灾害进行合理高效的预测,为应急抢险工作提供有力支撑。 展开更多
关键词 雨洪过程 非结构网格 GPU加速计算 动力波法 数值模拟
在线阅读 下载PDF
基于网格运动统计算法和最佳缝合线的密集重复结构图像快速拼接方法 被引量:13
14
作者 牟琦 唐洋 +1 位作者 李占利 李洪安 《计算机应用》 CSCD 北大核心 2020年第1期239-244,共6页
针对常用的图像拼接算法对具有密集重复结构的图像会产生大量误匹配点从而出现明显鬼影且耗时较长的问题,将网格运动统计(GMS)算法与最佳缝合线算法相结合,提出了一种密集重复结构的图像快速拼接方法。首先,在图像的重叠区域提取大量粗... 针对常用的图像拼接算法对具有密集重复结构的图像会产生大量误匹配点从而出现明显鬼影且耗时较长的问题,将网格运动统计(GMS)算法与最佳缝合线算法相结合,提出了一种密集重复结构的图像快速拼接方法。首先,在图像的重叠区域提取大量粗匹配点;接着,采用GMS算法进行精匹配,然后在此基础上估计变换模型;最后,采用基于动态规划思想的最佳缝合线算法完成图像拼接。实验结果表明,将所提算法应用于两组具有密集重复结构的图像上,不仅可以有效消除鬼影,得到理想的拼接效果,而且显著减少了拼接时间;平均拼接速度分别是传统尺度不变特征变换(SIFT)和加速稳健特征(SURF)算法的7.4倍和3.2倍,分别是结合区域分块的SIFT算法和SURF算法的4.1倍和1.4倍。所提算法能够有效地消除密集重复结构拼接时的鬼影,同时缩短了拼接时间。 展开更多
关键词 图像拼接 网格加速计算法(GMS) 特征精匹配 最佳缝合线 图像融合
在线阅读 下载PDF
GPU加速电子剪切散斑干涉图像处理 被引量:4
15
作者 邵珩 周勇 +1 位作者 祁俊峰 聂中原 《液晶与显示》 CAS CSCD 北大核心 2019年第10期1021-1029,共9页
电子剪切散斑干涉是在电子散斑干涉基础上发展起来的一种测量位移导数的新方法,尤其适合于无损检测实时测量。由于噪声干扰,测量得到的相位差图有大量噪点需要滤波去除。滤波处理计算量大,采用CPU计算需要很长时间完成。为缩短滤波时间... 电子剪切散斑干涉是在电子散斑干涉基础上发展起来的一种测量位移导数的新方法,尤其适合于无损检测实时测量。由于噪声干扰,测量得到的相位差图有大量噪点需要滤波去除。滤波处理计算量大,采用CPU计算需要很长时间完成。为缩短滤波时间,实现实时滤波处理,对四步相移法和Butterworth低通滤波、正余弦均值滤波和复数均值滤波算法,利用GPU并行计算能力强和存储带宽高的特性,开发了基于GPU加速计算的解相位差和滤波算法。对比基于CPU的解相位差和滤波计算,GPU加速计算将图像总体处理时间约1.9s(i7 6500U)降低到了239~366ms(GeForce940MX)或86~116ms(Quadro P3000),且正余弦均值滤波和复数均值滤波算法均可以通过降低滤波次数缩短滤波时间,从而保证在性能较弱的GPU上也能将计算时间压缩到0.2s内,满足实时图像处理的需求。 展开更多
关键词 电子剪切散斑干涉 图像处理 滤波 GPU加速计算
在线阅读 下载PDF
CNN景象匹配算法的加速设计与FPGA实现
16
作者 王晓峰 李超然 +4 位作者 路坤锋 栾天娇 姚娜 周辉 谢宇嘉 《计算机科学》 CSCD 北大核心 2023年第11期8-14,共7页
基于卷积神经网络的景象匹配算法较传统方法具有更高的匹配精度、更好的适应性以及更强的抗干扰能力。但是,该算法有海量的计算与存储需求,导致在边缘端部署存在巨大困难。为了提升计算实时性,文中设计并实现了一种高效的边缘端加速计... 基于卷积神经网络的景象匹配算法较传统方法具有更高的匹配精度、更好的适应性以及更强的抗干扰能力。但是,该算法有海量的计算与存储需求,导致在边缘端部署存在巨大困难。为了提升计算实时性,文中设计并实现了一种高效的边缘端加速计算方案。在分析算法的计算特性与整体架构的基础上,基于Winograd快速卷积方法,设计了一种面向特征匹配层的专用加速器,并提出了利用专用加速器与深度学习处理器流水线式计算特征匹配层和特征提取网络的整体加速方案。在Xilinx的ZCU102开发板上进行实验发现,专用加速器的峰值算力达到576 GOPS,实际算力达422.08 GOPS,DSP的使用效率达4.5 Ope-ration/clock。加速计算系统的峰值算力达1600 GOPS,将CNN景象匹配算法的吞吐时延降低至157.89 ms。实验结果表明,该加速计算方案能高效利用FPGA的计算资源,实现CNN景象匹配算法的实时计算。 展开更多
关键词 加速计算 景象匹配算法 深度学习 FPGA Winograd算法 专用加速
在线阅读 下载PDF
矿井提升机转子电阻计算中修正系数K的精确值
17
作者 龚幼民 《煤炭工程》 1982年第7期14-,共1页
《煤矿设计》在1979年第1期刊登了我写的“交流绞车起动电阻按预定加速计算方法的改进”一文,提出利用一个较简单的公式直接计算出公比在文中将K值取为0.9。现经过电子计算机几千次运算分析,得出K值为0.936,按此值计算公比q将更为精确。
关键词 转子电阻 矿井提升机 加速计算 精确值 修正系数 煤矿设计 文中
在线阅读 下载PDF
基于ZYNQ平台的YOLOv3压缩和加速 被引量:2
18
作者 郭文旭 苏远歧 刘跃虎 《计算机应用》 CSCD 北大核心 2021年第3期669-676,共8页
高精度物体检测网络急剧增加的参数和计算量使得它们很难在车辆和无人机等端侧设备上直接部署使用。针对这一问题,从网络压缩和计算加速两方面入手,提出了一种面向残差网络的新型压缩方案来实现YOLOv3的压缩,并通过ZYNQ平台对这一压缩... 高精度物体检测网络急剧增加的参数和计算量使得它们很难在车辆和无人机等端侧设备上直接部署使用。针对这一问题,从网络压缩和计算加速两方面入手,提出了一种面向残差网络的新型压缩方案来实现YOLOv3的压缩,并通过ZYNQ平台对这一压缩后的网络进行加速。首先,提出了包括网络裁剪和网络量化两方面的网络压缩算法。网络裁剪方面,给出了针对残差结构的裁剪策略来将网络剪枝分为通道剪枝和残差链剪枝两个粒度,解决了通道剪枝无法应对残差连接的局限性,进一步降低了模型的参数量;网络量化方面,实现了一种基于相对熵的模拟量化方法,以通道为单位对参数进行量化,在线统计模型的参数分布与参数量化造成的信息损失,从而辅助选择最优量化策略来减少量化过程的精度损失。然后,在ZYNQ平台上设计并改进了8比特的卷积加速模块,从而优化了片上缓存结构并结合Winograd算法实现了压缩后YOLOv3的加速。实验结果表明,所提压缩算法较YOLOv3 tiny能够进一步降低模型尺寸,但检测精度提升了7个百分点;同时ZYNQ平台上的硬件加速方法获得了比其他平台更高的能耗比,从而推进了YOLOv3以及其他残差网络在ZYNQ端侧的实际部署。 展开更多
关键词 物体检测 神经网络压缩 计算加速 网络剪枝 网络量化 ZYNQ平台
在线阅读 下载PDF
基于“分段-组合”残差神经网络的超声速氢气零维点火计算方法 被引量:1
19
作者 陈尔达 宋昊宇 +3 位作者 郭明明 田野 乐嘉陵 张华 《推进技术》 EI CAS CSCD 北大核心 2023年第12期91-101,共11页
受限于发动机燃烧数值模拟需要长时间超级计算机运行的问题,发展了一种基于“分段-组合”残差神经网络的氢气零维点火计算方法。以氢气零维点火算例为基础,基于自主研发的高超声速内外流耦合数值模拟软件AHL3D构建数据集。数据集中输入... 受限于发动机燃烧数值模拟需要长时间超级计算机运行的问题,发展了一种基于“分段-组合”残差神经网络的氢气零维点火计算方法。以氢气零维点火算例为基础,基于自主研发的高超声速内外流耦合数值模拟软件AHL3D构建数据集。数据集中输入变量为超声速工况下的温度、压强及8种组分质量分数的初始状态值,输出变量为3000个时刻点的温度、压强及8种组分质量分数状态值。构建了一种“分段”训练、“组合”预测的残差神经网络框架。算法首先将高维输入数据进行降维训练,再将“分段”模型预测后的参数冻结形成“组合”模型。与氢燃料直接计算相比,实验结果表明“分段-组合”残差神经网络可显著提升计算效率,对于11组分29反应的反应动力学模型可获得9.13倍的计算加速比,均方根误差降到了7.85×10^(-5),氢燃料参数的预测精度都高于98%,计算效率及精度优于现有的神经网络燃烧计算方法。 展开更多
关键词 “分段-组合”模型 残差神经网络 零维点火 数值模拟 计算加速
在线阅读 下载PDF
基于GPU的生物大分子计算平台的构建与优化
20
作者 俞伟 宁璐璐 许菲 《食品与生物技术学报》 CAS CSCD 北大核心 2017年第10期1101-1105,共5页
通过生物大分子计算平台对分子动力学的模拟运算,计算值可以描述分子的运动轨迹,从而揭示原子间的内在关系,但这一过程较为复杂且昂贵。作者研究了较低投入下大分子计算平台的构建与优化,在并行GPU条件和CUDA体系下使用AMBER软件包完成... 通过生物大分子计算平台对分子动力学的模拟运算,计算值可以描述分子的运动轨迹,从而揭示原子间的内在关系,但这一过程较为复杂且昂贵。作者研究了较低投入下大分子计算平台的构建与优化,在并行GPU条件和CUDA体系下使用AMBER软件包完成分子动力学的模拟运算。通过对两个大分子体系的运算,实验结果表明计算平台达到了60倍的计算加速,实现了较高的加速性能,完成了高性价比的高性能计算平台的建设。 展开更多
关键词 生物大分子 分子动力学 计算加速 图形处理单元
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部