期刊文献+
共找到62篇文章
< 1 2 4 >
每页显示 20 50 100
图形处理器(GPU)加速时域有限元的二维辐射计算 被引量:5
1
作者 刘昆 王晓斌 廖成 《电波科学学报》 EI CSCD 北大核心 2008年第1期111-114,共4页
时域有限元方法是在电磁场与微波工程领域广泛应用的方法之一。然而,时域有限元在大型机上运行时都是相当缓慢的。对时域有限元计算的硬件加速的研究已经开始进行。与同一代技术的CPU比较,目前一般用户的图形加速卡(GPU)对时域有限元的... 时域有限元方法是在电磁场与微波工程领域广泛应用的方法之一。然而,时域有限元在大型机上运行时都是相当缓慢的。对时域有限元计算的硬件加速的研究已经开始进行。与同一代技术的CPU比较,目前一般用户的图形加速卡(GPU)对时域有限元的加速可以达到CPU的近4倍左右。以OpenGL作为应用编程接口(API),使用一个标准的商业图形卡编程解决二维时域有限元的辐射问题。 展开更多
关键词 图形加速卡(GPU) 时域有限元(TD-FEM) 通用计算图形处理单元 (GPGPU)
在线阅读 下载PDF
“基于GPU的图形处理及其通用计算”专辑征文通知
2
《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2009年第3期375-375,共1页
关键词 通用计算 图形处理 GPU 专辑
在线阅读 下载PDF
基于可编程图形处理器的实时烟雾控制模拟 被引量:3
3
作者 湛永松 杨明浩 +1 位作者 石民勇 费广正 《工程图学学报》 CSCD 北大核心 2008年第4期60-64,共5页
提出一种基于可编程图形处理器(GPU)有效控制烟雾模拟过程的实时算法。对于给定的烟雾当前状态和目标状态,该算法以自然的烟雾流动方式实现状态之间的转换。根据Navier-Stokes方程定义烟雾流体场的物理模型,通过调整方程中的风力项以达... 提出一种基于可编程图形处理器(GPU)有效控制烟雾模拟过程的实时算法。对于给定的烟雾当前状态和目标状态,该算法以自然的烟雾流动方式实现状态之间的转换。根据Navier-Stokes方程定义烟雾流体场的物理模型,通过调整方程中的风力项以达到控制目的。风力项由驱动力和聚合力组成,驱动力促使烟朝着目标密度分布运动,聚合力则用于抵消烟的扩散现象。烟雾的速度和密度参量被整合为纹理颜色通道,并传送到像素程序中由GPU完成计算。该算法无需保证两状态之间转移为最优,从而消除了非线性优化所带来的计算成本。实验表明该算法能实时高效地模拟两种烟雾状态之间的转换。 展开更多
关键词 计算机应用 烟雾控制模拟 流体力学 纳维-斯托克斯方程 图形处理单元
在线阅读 下载PDF
新型汉字图形处理系统
4
作者 王令朝 《电信科学》 1985年第5期64-,共1页
最近,日本NIC公司开发了一种新型5号汉字图形处理系统。该系统是综合性办公自动化系统,能够满足从新闻、杂志出版直至企业内部打印工作等的全部要求。与原有的汉字图形处理系统相比,该设备具有以下特点: 1.它是以具有印刷功能的通用计... 最近,日本NIC公司开发了一种新型5号汉字图形处理系统。该系统是综合性办公自动化系统,能够满足从新闻、杂志出版直至企业内部打印工作等的全部要求。与原有的汉字图形处理系统相比,该设备具有以下特点: 1.它是以具有印刷功能的通用计算机为基础的信息处理装置。 展开更多
关键词 图形处理系统 打印工作 通用计算 办公自动化系统 信息处理装置 朝鲜文 数字的
在线阅读 下载PDF
GPU通用计算在LBM方法中的应用 被引量:1
5
作者 王凯 封卫兵 晁媛 《计算机工程与设计》 CSCD 北大核心 2009年第19期4513-4515,4535,共4页
提出了一种结合GPU通用计算与计算流体力学中的LBM算法来模拟二维流场的方法。根据GPU通用计算和LBM方法的基本原理,利用OpenGL的离屏渲染技术FBO和Cg语言,基于LBM方法中的D2Q9模型对二维方腔流进行数值模拟,并设计出基于OpenGL的GPU通... 提出了一种结合GPU通用计算与计算流体力学中的LBM算法来模拟二维流场的方法。根据GPU通用计算和LBM方法的基本原理,利用OpenGL的离屏渲染技术FBO和Cg语言,基于LBM方法中的D2Q9模型对二维方腔流进行数值模拟,并设计出基于OpenGL的GPU通用计算的二维流场数值计算框架。实验结果表明,利用GPU模拟与CPU模拟流场的数值结果相当吻合,特别地,利用GPU进行数值模拟实验的速度是利用CPU的4倍左右。 展开更多
关键词 图形处理单元 图形处理单元通用计算 格子波尔兹曼方法 OPENGL 帧缓冲对象
在线阅读 下载PDF
基于GPU的图形电磁计算加速算法 被引量:14
6
作者 杨正龙 金林 李蔚清 《电子学报》 EI CAS CSCD 北大核心 2007年第6期1056-1060,共5页
本文利用现代图形加速卡中GPU(Graphics Process Unit)的可编程管线,实现了图形电磁计算(GRECO)方法.与原有的方法相比,在利用物理光学和物理绕射理论的基础上,计算速度提高了20倍左右.并且利用GPU实现了射线追踪算法,用于目标上多次散... 本文利用现代图形加速卡中GPU(Graphics Process Unit)的可编程管线,实现了图形电磁计算(GRECO)方法.与原有的方法相比,在利用物理光学和物理绕射理论的基础上,计算速度提高了20倍左右.并且利用GPU实现了射线追踪算法,用于目标上多次散射的计算,使得GRECO方法可以快速计算具有凹腔结构目标的电磁散射.本方法对于目标识别和逆合成孔径成像等方面的研究具有重要的应用价值. 展开更多
关键词 电磁散射 图形电磁计算 图形处理单元(GPU)
在线阅读 下载PDF
汽轮机排汽系数通用计算方法的研究 被引量:16
7
作者 陈海平 刘吉臻 张春发 《中国电机工程学报》 EI CSCD 北大核心 2003年第9期193-197,共5页
以质量单元为基础,在科学分析其汽水分布特性的基础上,应用能量平衡思想及现代矩阵理论,导出了汽轮机排汽系数计算的通用方程式,从而使排汽系数的分析计算更为严谨与科学,并有效地简化了热力系统的计算,该方法具有分析与计算方便、简洁... 以质量单元为基础,在科学分析其汽水分布特性的基础上,应用能量平衡思想及现代矩阵理论,导出了汽轮机排汽系数计算的通用方程式,从而使排汽系数的分析计算更为严谨与科学,并有效地简化了热力系统的计算,该方法具有分析与计算方便、简洁、准确性高、通用性强等特点。 展开更多
关键词 汽轮机 排汽系数 通用计算方法 热力系统 质量单元 反平衡法
在线阅读 下载PDF
大规模稀疏矩阵的主特征向量计算优化方法 被引量:3
8
作者 王伟 陈建平 +2 位作者 曾国荪 俞莉花 谭一鸣 《计算机科学与探索》 CSCD 2012年第2期118-124,共7页
矩阵主特征向量(principal eigenvectors computing,PEC)的求解是科学与工程计算中的一个重要问题。随着图形处理单元通用计算(general-purpose computing on graphics pro cessing unit,GPGPU)的兴起,利用GPU来优化大规模稀疏矩阵的图... 矩阵主特征向量(principal eigenvectors computing,PEC)的求解是科学与工程计算中的一个重要问题。随着图形处理单元通用计算(general-purpose computing on graphics pro cessing unit,GPGPU)的兴起,利用GPU来优化大规模稀疏矩阵的图形处理单元求解得到了广泛关注。分别从应用特征和GPU体系结构特征两方面分析了PEC运算的性能瓶颈,提出了一种面向GPU的稀疏矩阵存储格式——GPU-ELL和一个针对GPU的线程优化映射策略,并设计了相应的PEC优化执行算法。在ATI HD Radeon5850上的实验结果表明,相对于传统CPU,该方案获得了最多200倍左右的加速,相对于已有GPU上的实现,也获得了2倍的加速。 展开更多
关键词 图形处理单元通用计算(GPGPU) 主特征向量计算 稀疏矩阵向量乘 线程优化
在线阅读 下载PDF
火电机组辅助汽水系统定量分析的通用模型 被引量:30
9
作者 陈海平 刘吉臻 +1 位作者 张春发 石维柱 《中国电机工程学报》 EI CSCD 北大核心 2005年第12期98-102,共5页
以质量单元为基础,通过严谨的数学推演,提出了火电机组辅助汽水系统定量分析计算的通用模型,该模型全面考虑了辅助汽水系统组成特点,具有分析与计算方便、简洁、准确性高、通用性强等特点;不仅为编制通用的热力系统计算软件提供了依据,... 以质量单元为基础,通过严谨的数学推演,提出了火电机组辅助汽水系统定量分析计算的通用模型,该模型全面考虑了辅助汽水系统组成特点,具有分析与计算方便、简洁、准确性高、通用性强等特点;不仅为编制通用的热力系统计算软件提供了依据,而且为火电机组的节能降耗,特别是辅助汽水系统的定量分析计算提供了新的理论基础,并通过实例进行了验证。 展开更多
关键词 汽水系统 火电机组 通用模型 定量分析 分析计算 质量单元 组成特点 计算软件 热力系统 节能降耗 理论基础 准确性 通用
在线阅读 下载PDF
单元级别并行有限元法求解工程涡流场的关键问题研究 被引量:7
10
作者 唐任远 吴东阳 谢德馨 《电工技术学报》 EI CSCD 北大核心 2014年第5期1-8,共8页
单元级别并行有限元方法(EBE-PFEM)目前尚未在工程涡流场求解中得到应用。由于含有不同导电媒质的工程涡流问题经有限元离散化得到的方程组呈现病态性质,给EBE-PFEM这一有效方法的应用造成了困难。本文从数学模型选择与算法实施两方面... 单元级别并行有限元方法(EBE-PFEM)目前尚未在工程涡流场求解中得到应用。由于含有不同导电媒质的工程涡流问题经有限元离散化得到的方程组呈现病态性质,给EBE-PFEM这一有效方法的应用造成了困难。本文从数学模型选择与算法实施两方面出发对此提出了解决方案。将修正矢量磁位法及二阶矢量位法应用于涡流问题的数学模型中,能够简化问题的数学模型并改善涡流场离散化方程组的性质;而采用EBE-PFEM法求解该方程组,可以解决工程涡流场分析的存储规模庞大、求解困难的问题。文中并给出了EBE-PFEM法在GPU(图形处理单元)上的实现过程。 展开更多
关键词 单元级别并行有限元法 图形处理单元 三维涡流场 二阶矢量位 并行计算
在线阅读 下载PDF
基于BRDF和GPU并行计算的全局光照实时渲染 被引量:7
11
作者 王芳 秦磊华 《图学学报》 CSCD 北大核心 2016年第5期583-591,共9页
基于光线追踪,将屏幕图像像素分解为投射光线与场景对象交点面片辐射亮度和纹理贴图的合成,每个面片的辐射亮度计算基于双向反射分布函数(BRDF)基的线性组合,并通过图形处理器(GPU)处理核心并行绘制进行加速,最后与并行计算的纹理映射... 基于光线追踪,将屏幕图像像素分解为投射光线与场景对象交点面片辐射亮度和纹理贴图的合成,每个面片的辐射亮度计算基于双向反射分布函数(BRDF)基的线性组合,并通过图形处理器(GPU)处理核心并行绘制进行加速,最后与并行计算的纹理映射结果进行合成。提出了一种基于BRDF和GPU并行计算的全局光照实时渲染算法,利用GPU并行加速,在提高绘制效率的前提下,实现动态交互材质的全局光照实时渲染。重点研究:对象表面对光线的多次反射用BRDF基的线性组合来表示,将非线性问题转换为线性问题,从而提高绘制效率;利用GPU并行加速,分别计算对象表面光辐射能量和纹理映射及其线性组合,进一步提高计算效率满足实时绘制需求。 展开更多
关键词 全局光照 图形处理单元 双向反射分布函数 渲染方程 并行计算
在线阅读 下载PDF
基于GPU的Landsat8实时解压缩处理技术 被引量:2
12
作者 杨仁忠 张洁 +1 位作者 韦宏卫 石璐 《计算机工程》 CAS CSCD 北大核心 2016年第3期301-307,共7页
根据Landsat8卫星下行数据的特点,结合RICE无损数据压缩算法和CUDA编程技术,提出一种基于图像处理单元(GPU)的实时解压缩处理系统方案,采用统一计算设备架构和流水线式解压缩结构进行任务分解及CUDA优化。测试结果表明,与基于CPU的解压... 根据Landsat8卫星下行数据的特点,结合RICE无损数据压缩算法和CUDA编程技术,提出一种基于图像处理单元(GPU)的实时解压缩处理系统方案,采用统一计算设备架构和流水线式解压缩结构进行任务分解及CUDA优化。测试结果表明,与基于CPU的解压缩方案相比,基于GPU的解压缩系统获得7.45倍的加速比,能够达到Landsat8卫星下行数据实时解压缩处理速度要求的1.8倍以上,解压缩的图像数据正确率高且成本较低。 展开更多
关键词 无损数据压缩算法 实时解压缩 图形处理单元 卫星下行数据 并行计算
在线阅读 下载PDF
GPU加速窦房结计算机仿真的实现及优化 被引量:1
13
作者 张虹 郑霄 赵丹 《西安交通大学学报》 EI CAS CSCD 北大核心 2014年第7期60-64,共5页
针对窦房结电生理计算机仿真运算量巨大、耗时长的问题,提出了基于高性能图形处理单元(GPU)实现并行计算及优化的方法。首先考虑窦房结细胞中央和边缘的差异,构建了一维非匀质窦房结组织模型;利用算子分裂方法使模型的解算任务具备并行... 针对窦房结电生理计算机仿真运算量巨大、耗时长的问题,提出了基于高性能图形处理单元(GPU)实现并行计算及优化的方法。首先考虑窦房结细胞中央和边缘的差异,构建了一维非匀质窦房结组织模型;利用算子分裂方法使模型的解算任务具备并行性。根据具体解算过程提出了三种并行化策略,并对其中耗时最短的策略从线程块设置、数据交换频率以及存储模式等方面进行了进一步优化。结果表明:对于500个细胞的仿真,CUDA程序较串行程序的执行时间下降了60%,进一步优化后,CUDA程序的执行时间可下降84%;窦房结组织越大,GPU的加速效果越明显。结果验证了GPU加速解算方法可显著提高窦房结模型的解算速度,降低实际执行时间。 展开更多
关键词 图形处理单元 并行计算 窦房结 计算机仿真
在线阅读 下载PDF
星载ScanSAR成像处理技术研究 被引量:1
14
作者 陈仁元 雍延梅 +1 位作者 孙晓晖 钟雪莲 《雷达科学与技术》 2013年第2期136-140,共5页
由于天线在不同的子带进行扫描,星载扫描模式不能像条带模式那样,获得连续的方位向相位历史,利用条带模式高精度处理算法(如距离-多普勒算法)处理ScanSAR数据,通过在脉冲扫描间隔中填零,把扫描数据看成中间填零的相干脉冲串序列,等效成... 由于天线在不同的子带进行扫描,星载扫描模式不能像条带模式那样,获得连续的方位向相位历史,利用条带模式高精度处理算法(如距离-多普勒算法)处理ScanSAR数据,通过在脉冲扫描间隔中填零,把扫描数据看成中间填零的相干脉冲串序列,等效成条带SAR数据,利用条带模式的处理算法进行成像。针对填零后的数据,数据量大,可以采用基于通用图形处理单元的并行处理技术,加快处理速度。对填零处理形成的栅瓣调制,通过滤波进行消除。这样处理的图像和条带模式的图像具有相同的辐射和几何分布特性,有效抑制扇贝效应带来的影响。对实测星载ScanSAR数据进行成像处理,试验结果表明该方法的有效性。 展开更多
关键词 扫描模式 处理算法 通用图形处理单元 栅瓣调制
在线阅读 下载PDF
三维不规则窦房结电生理模型的建立及其图形实现
15
作者 张虹 刘袁 +1 位作者 刘炀 金印彬 《西安交通大学学报》 EI CAS CSCD 北大核心 2017年第5期43-47,共5页
针对窦房结三维电生理建模复杂、仿真运算量大等问题,提出了一种有效的解决方法。首先利用建模软件建立右心房三维不规则立体模型,再利用网格划分软件剖分为四面体网格,最后根据网格的位置赋予窦房结和心房细胞属性建立电生理模型。数... 针对窦房结三维电生理建模复杂、仿真运算量大等问题,提出了一种有效的解决方法。首先利用建模软件建立右心房三维不规则立体模型,再利用网格划分软件剖分为四面体网格,最后根据网格的位置赋予窦房结和心房细胞属性建立电生理模型。数值解算时采用算子分裂法和有限体积法,分别对反应-扩散方程和单纯描述电扩布的微分方程进行了处理,同时利用高性能图形处理单元(GPU)在CUDA(compute unified device architecture)编程环境下实现程序的并行加速。另外,从减少CPU和GPU间的数据交换频率、参量存储方式等多方面对程序加以优化。计算结果表明,所建模型无论是单细胞动作电位还是膜电位的传导均符合正常的电生理特征。通过与串行程序及基于4核8线程CPU编写的共享内存式OpenMP并行程序进行比较,基于GPU的CUDA程序可将运行耗时减少90%以上,CPU和GPU间的数据交换仅占总耗时的3%,且组织模型越大,网格划分越细致,GPU的加速效果愈显著。 展开更多
关键词 图形处理单元 并行计算 窦房结 有限体积法
在线阅读 下载PDF
高次三角形单元的可视化显示
16
作者 刘永军 李宏男 林皋 《计算机应用与软件》 CSCD 北大核心 2003年第10期60-61,共2页
高次三角形单元在有限元计算中起着重要作用 ,本文提出一种画高次三角形单元云图的新方法。自然坐标系中的等腰直角三角形母元被均匀划分为N2 个等腰直角子三角形 ,根据映射到屏幕上的子三角形形心处的温度计算颜色 ,然后进行填充。实... 高次三角形单元在有限元计算中起着重要作用 ,本文提出一种画高次三角形单元云图的新方法。自然坐标系中的等腰直角三角形母元被均匀划分为N2 个等腰直角子三角形 ,根据映射到屏幕上的子三角形形心处的温度计算颜色 ,然后进行填充。实践表明 ,文中方法十分有效。 展开更多
关键词 三维图形 消隐技术 颜色填充 高次三角形单元 可视化显示 图形处理 计算
在线阅读 下载PDF
图数据库中基于GPU的图分析计算方法 被引量:3
17
作者 钱裳云 邵志远 +1 位作者 郑然 陈继林 《计算机工程》 CAS CSCD 北大核心 2021年第6期52-59,共8页
现有的图数据库对于在线分析操作大多采用基于CPU的分布式图计算引擎(如GraphX),但CPU核心数量有限的不足会导致计算效率低下,同时集群间的同步也会产生额外的通信开销。通过使用图形处理单元(GPU)对图计算进行加速,设计并实现图处理系... 现有的图数据库对于在线分析操作大多采用基于CPU的分布式图计算引擎(如GraphX),但CPU核心数量有限的不足会导致计算效率低下,同时集群间的同步也会产生额外的通信开销。通过使用图形处理单元(GPU)对图计算进行加速,设计并实现图处理系统RockGraph。该系统能够根据用户需求从图数据库中提取出包含核心信息的子图,经过数据格式转换后,利用JNI工具调用动态链接库,采用超显存GPU图计算框架进行在线分析,并将计算结果写回图数据库。实验结果表明,与基于CPU的分布式图计算系统相比,RockGraph的图分析效率可提高3倍~5倍。 展开更多
关键词 图数据库 图分析计算 图形处理单元 子图提取 超显存计算
在线阅读 下载PDF
一种基于GPU的移动对象并行处理框架 被引量:2
18
作者 韦春丹 龚奕利 李文海 《计算机应用与软件》 CSCD 2016年第10期223-229,共7页
PGrid是一个基于格网索引的移动对象并行处理框架。通过分析PGrid框架不利于在GPU上并行的因素,提出基于GPU的无锁并行处理G-LFPP(GPU Based Lock Free Parallel Processing)框架。采用基于操作分解/聚类的无锁更新策略,消除更新过程中... PGrid是一个基于格网索引的移动对象并行处理框架。通过分析PGrid框架不利于在GPU上并行的因素,提出基于GPU的无锁并行处理G-LFPP(GPU Based Lock Free Parallel Processing)框架。采用基于操作分解/聚类的无锁更新策略,消除更新过程中并发控制对更新性能的影响;为了实现细粒度并行查询,提出基于候选集映射表和查询确认表的快速查询索引。实验表明,该方法更新和查询策略有利于大规模线程并发处理更新和查询。当移动对象的数量达到千万级时,更新速率和查询速率仍然可以超过每秒1100万次和110万次。与PGrid相比,并发处理更新和查询的速度提高了6.61倍。 展开更多
关键词 并行计算 图形处理单元 异构计算 格网索引 移动对象数据库
在线阅读 下载PDF
边缘计算设备的性能功耗测量与分析 被引量:6
19
作者 袁佳伟 宋庆增 +2 位作者 王雪纯 姜文超 金光浩 《计算机工程》 CAS CSCD 北大核心 2021年第2期233-238,245,共7页
为解决将数据传回服务器端计算时带来的延迟问题,需将神经网络结构进行调整后部署在边缘计算设备上,但当前对边缘设备性能功耗的测量不够全面。为分析和评测边缘计算设备EDGE TPU计算板的性能与功耗,采用神经网络模型和Roofline模型测... 为解决将数据传回服务器端计算时带来的延迟问题,需将神经网络结构进行调整后部署在边缘计算设备上,但当前对边缘设备性能功耗的测量不够全面。为分析和评测边缘计算设备EDGE TPU计算板的性能与功耗,采用神经网络模型和Roofline模型测量其性能,利用外置功耗测量设备测量其功耗计算性能功耗比。实验结果表明,EDGE TPU计算板能以较快的速度量化神经网络模型,执行速度与能耗节省均优于TX2和NANO,根据TX2的Roofline模型对VGG16网络进行优化后,其在TX2上的运行速度达到原来的8倍左右。 展开更多
关键词 边缘计算 EDGE TPU计算 图形处理单元 Roofline模型 现场可编程逻辑门阵列
在线阅读 下载PDF
基于负载均衡的CPU-GPU异构计算平台任务调度策略 被引量:5
20
作者 方娟 章佳兴 《北京工业大学学报》 CAS CSCD 北大核心 2020年第7期782-787,共6页
针对中央处理单元-图形处理单元(central processing unit-graphics processing unit,CPU-GPU)异构计算系统中,CPU和GPU负载不均导致系统性能降低的问题,提出了一种基于队列的混合调度策略.该策略通过探测获得CPU和GPU处理指定任务的计... 针对中央处理单元-图形处理单元(central processing unit-graphics processing unit,CPU-GPU)异构计算系统中,CPU和GPU负载不均导致系统性能降低的问题,提出了一种基于队列的混合调度策略.该策略通过探测获得CPU和GPU处理指定任务的计算能力,将计算任务按照探测比例分配给CPU和GPU;将并行任务存入双向队列,以降低调度带来的额外开销.结果表明,使用该策略的基准测试程序系统性能平均提升了28.07%.总体而言,该调度策略能够缩短CPU与GPU完成各自计算任务后的等待时间,有效平衡系统CPU与GPU之间的负载,提升系统性能. 展开更多
关键词 中央处理单元-图形处理单元(central processing unit-graphics processing unit CPU-GPU) 异构计算 高性能计算 任务调度 负载均衡 负载感知
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部