期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
图形处理器上CSB^+-树索引的并行构建算法
1
作者 刘勇 奚建清 +2 位作者 黄东平 贾连印 苗德成 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期123-127,134,共6页
为提高缓存敏感CSB+-树索引的操作效率,在图形处理器(GPU)上研究CSB+-树的并行构建和查询性能.通过分析索引树内部节点的每一键与对应叶子节点的映射关系,提出了一种一次性并行构建CSB+-树所有内部节点键值的无锁并行算法,以最大并行度... 为提高缓存敏感CSB+-树索引的操作效率,在图形处理器(GPU)上研究CSB+-树的并行构建和查询性能.通过分析索引树内部节点的每一键与对应叶子节点的映射关系,提出了一种一次性并行构建CSB+-树所有内部节点键值的无锁并行算法,以最大并行度来快速构建索引树.该算法通过设计GPU平台上支持CSB+-树的索引数据任意伸缩的动态数组来解决GPU上不能动态分配显存空间的问题,通过在索引内部节点的边界增加填充位来减少线程块的线程分支数,从而提高CSB+-树的查询效率.实验结果表明,文中所提算法的运行时间比基于单个节点和基于树层的并行算法分别提高了31.0和1.4倍. 展开更多
关键词 并行算法 图形处理器 CSB +-树索引 动态数组 查询效率
在线阅读 下载PDF
基于图形处理器的射线追踪数字重建影像方法 被引量:2
2
作者 刘操 汪俊 +2 位作者 吴章文 勾成俊 侯氢 《中国测试》 CAS 北大核心 2012年第2期81-84,共4页
为提高肿瘤放射治疗计划系统中数字重建影像部分的计算效率,采用基于图形处理器的并行计算技术,对数字重建影像过程中最耗费计算机时的两部分,即由计算机断层扫描获取射野坐标系中的模体密度分布和射线追踪生成数字重建影像图像,实现了... 为提高肿瘤放射治疗计划系统中数字重建影像部分的计算效率,采用基于图形处理器的并行计算技术,对数字重建影像过程中最耗费计算机时的两部分,即由计算机断层扫描获取射野坐标系中的模体密度分布和射线追踪生成数字重建影像图像,实现了加速计算。在常用的个人计算机上,它们分别能够达到14~50和20~90倍的加速,对于实施实时治疗计划有重要实用价值。 展开更多
关键词 放射治疗 数字影像重建 射线追踪 图形处理器 中央处理器
在线阅读 下载PDF
图形处理器通用计算的实现与验证 被引量:3
3
作者 齐记 杨孔庆 杨磊 《计算机工程与应用》 CSCD 北大核心 2009年第33期67-69,共3页
讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提... 讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提供了可能。 展开更多
关键词 图形处理器(GPU) 图形处理器通用计算技术(GPGPU) 中央处理器(CPU)
在线阅读 下载PDF
基于CPU-GPU的超音速流场N-S方程数值模拟
4
作者 卢志伟 张皓茹 +3 位作者 刘锡尧 王亚东 张卓凯 张君安 《中国机械工程》 北大核心 2025年第9期1942-1950,共9页
为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并... 为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并行计算速度明显高于CPU串行计算速度,其加速比随流场网格规模的增大而明显提高。GPU并行计算可以有效提高超音速流场的计算速度,为超音速飞行器的设计、优化、性能评估及其研发提供一种强有力的并行计算方法。 展开更多
关键词 超音速流场 中央处理器-图形处理器 异构计算 有限差分
在线阅读 下载PDF
基于嵌入式CPU-GPU的高清鱼眼视频实时校正系统 被引量:4
5
作者 公维理 《计算机工程与应用》 CSCD 北大核心 2016年第14期172-179,201,共9页
在安防监控领域,需要鱼眼实时监控系统实现360°×180°大范围高质量无死角全景实时监控,现有的鱼眼校正系统存在成本较高,灵活性差,特别是清晰度不高和实时性差等方面的问题。针对如何提高全景高清鱼眼视频校正的实时性问... 在安防监控领域,需要鱼眼实时监控系统实现360°×180°大范围高质量无死角全景实时监控,现有的鱼眼校正系统存在成本较高,灵活性差,特别是清晰度不高和实时性差等方面的问题。针对如何提高全景高清鱼眼视频校正的实时性问题,提出了基于嵌入式平台STi H418的CPU-GPU高速通信协议和基于可编程着色器的嵌入式CPU-GPU内存共享方法,并利用GPU的纹理映射技术实现了全景高清鱼眼视频实时校正系统。实验结果表明,与相关校正系统相比,该系统很好地兼顾到算法效率、图像校正效果和完整性,可以完全满足360°×180°的全景高清(400万像素,2 048×2 048p30)鱼眼视频实时监控,而且与使用PC服务器相比嵌入式系统降低了系统整体成本,ARM CPU软件生成更新校正算法和可事时实时和事后的虚拟PTZ提高系统灵活性和稳定性,因此该系统具有很高的实用价值。 展开更多
关键词 全景高清鱼眼视频实时校正 嵌入式中央处理器-图形处理器(CPU-GPU) 线性等距球面透视投影 纹理映射
在线阅读 下载PDF
基于多核CPU-GPU异构平台的并行Agent仿真 被引量:4
6
作者 余文广 王维平 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第8期1716-1722,共7页
多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,... 多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,还缺乏一般性的理论方法来指导并行Agent仿真将多核CPU和GPU的计算资源充分利用起来。通过分析多核CPU-GPU异构并行架构的特点,在方法论层面上建立了并行Agent仿真在多核CPU-GPU异构平台下的多层负载分配模型,并根据基于Agent的仿真的执行结构,提出了对基于Agent的仿真的计算结构、数据结构进行重构的方法,以适应异构的硬件架构。最后对基于多核CPU-GPU的并行Agent仿真性能进行了实验分析。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 异构平台
在线阅读 下载PDF
多核CPU-GPU异构平台下并行Agent仿真负载均衡方法 被引量:3
7
作者 王维平 余文广 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第11期2366-2373,共8页
多核中央处理器(central processing unit,CPU)-图形处理器(graphic processing unit,GPU)异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CP... 多核中央处理器(central processing unit,CPU)-图形处理器(graphic processing unit,GPU)异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CPU-GPU异构平台下并行Agent仿真的负载均衡问题,建立了面向多核CPU-GPU的并行Agent仿真多层负载分配模型,提出了基于带约束的k-means空间聚类算法的并行Agent仿真静态负载划分方法和动态负载均衡策略,并给出了划分子集间的可交互性判定,以过滤掉大量不会发生交互关系的Agent之间的交互判定计算。最后通过实验验证了本文提出方法的有效性。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 负载均衡
在线阅读 下载PDF
使用CUDA平台关于并行高斯-约当消去法的研究与比较 被引量:3
8
作者 毛飞 陈智骏 +1 位作者 梁效斐 曹奇英 《计算机应用与软件》 CSCD 2011年第9期269-271,共3页
使用CUDA平台,提出在通用图形处理器(GPGPU)上实现并行的全选主元、归一和消去等操作,加速实现并行全选主元高斯-约当消去法求解线性方程组的一种基本方法。该方法在CPU上完成解向量的恢复。根据NVIDIA公司最新Fermi架构图形处理器的特... 使用CUDA平台,提出在通用图形处理器(GPGPU)上实现并行的全选主元、归一和消去等操作,加速实现并行全选主元高斯-约当消去法求解线性方程组的一种基本方法。该方法在CPU上完成解向量的恢复。根据NVIDIA公司最新Fermi架构图形处理器的特点,通过一系列的优化设计,使通用GPGPU相对Intel最新架构CPU的加速比超过了6.5倍,比Intel上一代CPU的加速比超过了10倍。 展开更多
关键词 CUDA 并行计算 通用图形处理器 全选主元高斯-约当消去法
在线阅读 下载PDF
一种面向OpenCL架构的矩阵-向量乘并行算法与实现 被引量:2
9
作者 肖汉 周清雷 姚鹏姿 《小型微型计算机系统》 CSCD 北大核心 2019年第1期26-30,共5页
矩阵-向量乘法算法的时间复杂度大,传统计算方法的实时性和跨平台性难以保证.本文提出一种基于开放式计算语言(Open Computing Language,OpenCL)的矩阵-向量乘并行算法,矩阵-向量乘法过程被分解成若干具有不同粒度的子任务.根据相应的... 矩阵-向量乘法算法的时间复杂度大,传统计算方法的实时性和跨平台性难以保证.本文提出一种基于开放式计算语言(Open Computing Language,OpenCL)的矩阵-向量乘并行算法,矩阵-向量乘法过程被分解成若干具有不同粒度的子任务.根据相应的并行度,每个工作组进行矩阵中的行块与列向量的乘积,每个工作项进行行块中行向量与列向量的乘积,并把计算任务分别分配到计算单元和处理单元进行处理.实验结果表明,与基于CPU的串行算法、基于OpenMP并行算法和基于统一计算设备架构(Compute Unified Device Architecture,CUDA)并行算法性能相比,矩阵-向量乘并行算法在OpenCL架构下NVIDIA图形处理器(Graphic Processing Unit,GPU)计算平台上分别获得了20. 86倍、6. 39倍和1. 49倍的加速比.验证了提出的并行优化方法的有效性和性能可移植性. 展开更多
关键词 矩阵-向量乘 图形处理器 开放式计算语言 并行算法
在线阅读 下载PDF
基于点-单元接触模式的水平岩层运动连续-非连续方法模拟 被引量:5
10
作者 王学滨 薛承宇 岑子豪 《山东科技大学学报(自然科学版)》 CAS 北大核心 2022年第6期40-49,共10页
采场上覆岩层的开裂和破断在力学上可归结为连续介质向非连续介质转化或非连续介质进一步演化。正确模拟采场上覆岩层运动过程对于岩层稳定性控制和有关灾害预防具有极其重要的意义。介绍了历时10年自主开发的拉格朗日元与离散元耦合方... 采场上覆岩层的开裂和破断在力学上可归结为连续介质向非连续介质转化或非连续介质进一步演化。正确模拟采场上覆岩层运动过程对于岩层稳定性控制和有关灾害预防具有极其重要的意义。介绍了历时10年自主开发的拉格朗日元与离散元耦合方法的基本原理,以及以此为基础最新发展的水平岩层运动计算方法。以接触-摩擦模块为例进行介绍。采用点-单元接触模式取代单元-单元接触模式,以起到精简算法和适于图形处理器(GPU)并行计算的目的。通过3个采场算例,展现了该方法的优势。该方法适于研究采动条件下岩层的变形、开裂、离层、破断和冒落等,具有需要参数少且参数容易获取的特点。 展开更多
关键词 水平岩层 岩层运动 图形处理器(GPU) 拉格朗日元与离散元耦合方法 -单元接触模式
在线阅读 下载PDF
异构计算平台上列存储系统的并行连接优化策略 被引量:4
11
作者 丁祥武 陈金鑫 王梅 《计算机工程与应用》 CSCD 北大核心 2017年第5期73-80,共8页
GPU以及集成式的CPU-GPU架构凭借其强大的并行处理能力和可编程流水线方式,已经成为数据库领域的研究热点。为充分利用异构平台的并行计算能力,提升列存储系统的查询性能,在研究异构平台结构特性的基础上,首先提出了GPU多线程平台上进... GPU以及集成式的CPU-GPU架构凭借其强大的并行处理能力和可编程流水线方式,已经成为数据库领域的研究热点。为充分利用异构平台的并行计算能力,提升列存储系统的查询性能,在研究异构平台结构特性的基础上,首先提出了GPU多线程平台上进行连接的数据划分策略——ICMD(Improved CMD),利用GPU流处理器并行处理各个子空间上的连接,然后利用任务评估分配模型实现查询负载的动态分配,使得查询操作能在多核CPU、GPU上高效并行执行。同时利用片上全局同步机制、局部内存重用技术优化ICMD连接算法。最后采用SSB基准测试集测试,结果表明:Intel~?HD Graphics 4600平台上并行连接查询相比于CPU版本获得了35%的性能提升,较GPU查询引擎的Ocelot性能上提升了18%。 展开更多
关键词 多核中央处理器-图形处理器(CPU-GPU) 处理器 异构编程 列存储 改进协调模块分布(ICMD) 任务动态评估分配
在线阅读 下载PDF
地震叠前逆时偏移算法的CPU/GPU实施对策 被引量:83
12
作者 李博 刘红伟 +4 位作者 刘国峰 佟小龙 刘洪 郭建 裴江云 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2010年第12期2938-2943,共6页
相较于单程波偏移算法而言,逆时偏移成像方法以其物理基础为依托优势,几十年来一直备受国内外地球物理学家的青睐.目前的逆时偏移(RTM)若直接采用双程波动方程进行延拓,尽管可以回避上下行波的分离处理,然就已有算法而言,其计算量和I/O... 相较于单程波偏移算法而言,逆时偏移成像方法以其物理基础为依托优势,几十年来一直备受国内外地球物理学家的青睐.目前的逆时偏移(RTM)若直接采用双程波动方程进行延拓,尽管可以回避上下行波的分离处理,然就已有算法而言,其计算量和I/O(输入/输出)量却是最大的.针对此问题,本文在分析现行逆时偏移的多种算法基础上,提出利用CPU/GPU(中央处理器/图形处理器)作为数值计算核心,建立随机边界模型,从而克服存储I/O难题和提高计算效率.在实际的数据测试中,本文的方法可以大幅度的提高计算效率和减少存储单元,从而促使其高效地应用于生产实际. 展开更多
关键词 逆时偏移 波动方程 随机边界 中央处理器 图形处理器
在线阅读 下载PDF
GPU加速的八叉树体绘制算法 被引量:8
13
作者 苏超轼 赵明昌 张向文 《计算机应用》 CSCD 北大核心 2008年第5期1232-1235,1239,共5页
提出一种针对物体空间为序体绘制的空域跳过算法:采用双层次空间跳过,先以规则的数据分块作粗略地跳过,再以八叉树获得更高粒度的优化。该方法进一步解决了超过可用纹理内存容量的大规模体数据实时绘制问题,允许实时改变传递函数。针对... 提出一种针对物体空间为序体绘制的空域跳过算法:采用双层次空间跳过,先以规则的数据分块作粗略地跳过,再以八叉树获得更高粒度的优化。该方法进一步解决了超过可用纹理内存容量的大规模体数据实时绘制问题,允许实时改变传递函数。针对该算法引入的CPU高负载瓶颈,提出一种新算法,在图形处理器(GPU)内快速计算采样面片,平衡了CPU与GPU间的运算负载。结合上述两种算法,实现高效的大规模体数据绘制并无损图像质量。 展开更多
关键词 体绘制 纹理采样面 立方体-面片求交 层次化绘制 图形处理器
在线阅读 下载PDF
基于GPU的加速船舶轨迹相似性度量与聚类
14
作者 刘奕 李湘 +3 位作者 李之琛 周备 许鹏 刘敬贤 《中国航海》 CSCD 北大核心 2023年第2期33-39,45,共8页
针对使用中央处理器(Central Processing Unit, CPU)硬件实现密度聚类、相似性度量等算法提取船舶习惯航迹的过程中存在复杂度高、计算时间长等方面的不足,提出使用图形处理器(Graphics Processing Unit, GPU)高性能计算及GPU优化算法... 针对使用中央处理器(Central Processing Unit, CPU)硬件实现密度聚类、相似性度量等算法提取船舶习惯航迹的过程中存在复杂度高、计算时间长等方面的不足,提出使用图形处理器(Graphics Processing Unit, GPU)高性能计算及GPU优化算法以提升船舶轨迹相似性度量与聚类的速度性能,大幅缩短船舶轨迹特征提取过程中的时间开销。利用长江南槽交汇水域船舶自动识别系统(Automatic Identification System, AIS)动态船舶轨迹信息进行方法验证,通过对比传统基于CPU的方法验证了所提出的基于GPU的船舶轨迹相似性度量及聚类算法存在较优的速度性能,为快速提取研究水域中的船舶特征提供新的理论依据。 展开更多
关键词 水路运输 船舶自动识别系统 中央处理器 图形处理器 加速相似性度量 加速聚类
在线阅读 下载PDF
基于PBO的地形绘制
15
作者 谭德林 谭良 《计算机工程与设计》 CSCD 北大核心 2011年第7期2545-2547,2552,共4页
为了进一步解放CPU,以便更多地去利用GPU的性能,提出了一种基于PBO的地形绘制。该地形绘制在Geomipmap-ping地形绘制算法的基础上引入了PBO,其过程是纹理在CPU的控制下直接被送到PBO,在GPU的控制下再从PBO把数据复制到纹理对象。同时为... 为了进一步解放CPU,以便更多地去利用GPU的性能,提出了一种基于PBO的地形绘制。该地形绘制在Geomipmap-ping地形绘制算法的基础上引入了PBO,其过程是纹理在CPU的控制下直接被送到PBO,在GPU的控制下再从PBO把数据复制到纹理对象。同时为了适应PBO的异步传输机制,引入了双PBO机制。实验结果表明,基于PBO的地形绘制不但充分利用了GPU的性能,同时也极大程度地解放了CPU,使CPU能直接进行其它的工作,基于PBO的地形绘制算法符合当前以GPU为核心的地形绘制。 展开更多
关键词 中央处理器 图形处理器 双PBO机制 地形绘制 Geomipmapping算法
在线阅读 下载PDF
异构集群中CPU与GPU协同调度算法的设计与实现 被引量:7
16
作者 高原 顾文杰 +3 位作者 丁雨恒 彭晖 陈泊宇 顾雯轩 《计算机工程与设计》 北大核心 2020年第2期592-600,F0003,共10页
为有效提高异构的CPU/GPU集群计算性能,提出一种支持异构集群的CPU与GPU协同计算的两级动态调度算法。根据各节点计算能力评测结果和任务请求动态分发数据,在节点内CPU和GPU之间动态调度任务,使用数据缓存和数据处理双队列机制,提高异... 为有效提高异构的CPU/GPU集群计算性能,提出一种支持异构集群的CPU与GPU协同计算的两级动态调度算法。根据各节点计算能力评测结果和任务请求动态分发数据,在节点内CPU和GPU之间动态调度任务,使用数据缓存和数据处理双队列机制,提高异构集群的传输和处理效率。该算法实现了集群各节点“能者多劳”,避免了单节点性能瓶颈造成的任务长尾现象。实验结果表明,该算法较传统MPI/GPU并行计算性能提高了11倍。 展开更多
关键词 异构 集群 中央处理器 图形处理器 协同调度 算法
在线阅读 下载PDF
多核CPU和GPU加速分子动力学模拟 被引量:6
17
作者 林江宏 林锦贤 吕暾 《计算机应用》 CSCD 北大核心 2011年第3期843-847,共5页
在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了... 在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了计算机的处理能力。性能测试结果表明,相对于优化后的CPU串行计算,多核CPU-GPU异构并行计算模型有强大的性能优势,特别是将占整个程序执行时间90%的作用力的计算移植到GPU上执行,获得了最高可达12倍的计算加速比。 展开更多
关键词 分子动力学 图形处理器 多核中央处理器 AMBER力场 计算统一设备架构 OPENMP
在线阅读 下载PDF
我国自主研发成功精度更高的石油勘探“CT”
18
作者 李宗华 《断块油气田》 CAS 北大核心 2011年第2期182-182,共1页
我国科学家经多年努力。近日自主研发成功一种质量和效率更高的地震成像系统,为更准更快地石油勘探提供了可能。在科技部和国家自然科学基金相关项目的支持下,中科院地质与地球物理研究所和北京吉星吉达科技有限公司联合研制成功“油... 我国科学家经多年努力。近日自主研发成功一种质量和效率更高的地震成像系统,为更准更快地石油勘探提供了可能。在科技部和国家自然科学基金相关项目的支持下,中科院地质与地球物理研究所和北京吉星吉达科技有限公司联合研制成功“油气勘探GPU(图形处理器)/CPU(中央处理器)协同并行计算系统”——“吉星”。 展开更多
关键词 石油勘探 自主研发 地球物理研究所 CT 精度 并行计算系统 中央处理器 图形处理器
在线阅读 下载PDF
科技 拾贝
19
《现代情报》 1989年第3期41-42,共2页
单片超级计算机 1989年4月,美国英特尔公司推出一种叫做80860的超级新产品,它不仅能使一台普通的个人计算机变为功能很强的图形工作站,而且某些功能堪与超级计算机相媲美。 80860首次将中央处理器、存储器和图形单元组合在一个芯片上,... 单片超级计算机 1989年4月,美国英特尔公司推出一种叫做80860的超级新产品,它不仅能使一台普通的个人计算机变为功能很强的图形工作站,而且某些功能堪与超级计算机相媲美。 80860首次将中央处理器、存储器和图形单元组合在一个芯片上,是64位微处理机,采用Unix操作系统。 展开更多
关键词 超级计算机 个人计算机 处理 科技 新产品 中央处理器 操作系统 图形工作站 单元组合 存储器
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部