期刊文献+
共找到69篇文章
< 1 2 4 >
每页显示 20 50 100
图形处理器通用计算关键技术研究综述 被引量:28
1
作者 王海峰 陈庆奎 《计算机学报》 EI CSCD 北大核心 2013年第4期757-772,共16页
当前图形处理器的通用计算取得长足发展,为适应通用计算图形处理器在硬件体系结构和软件支持方面完成相应调整和改变,面对各种应用领域中数据规模增大的趋势,多GPU系统和GPU集群的研究应用日趋增多.以流处理器及图形处理器硬件体系为依... 当前图形处理器的通用计算取得长足发展,为适应通用计算图形处理器在硬件体系结构和软件支持方面完成相应调整和改变,面对各种应用领域中数据规模增大的趋势,多GPU系统和GPU集群的研究应用日趋增多.以流处理器及图形处理器硬件体系为依据,介绍学术和工业领域中流处理器及图形处理器体系变化趋势.从软件编程环境、硬件计算与通信等方面展开讨论,阐述通用计算中图形处理器的关键问题,包括编程模型及语言的发展和方向,存储模型的量化研究、访存模式和行为的优化以及分布式存储管理的热点问题,典型通信原型系统的对比及通信难点的分析,GPU片内和片间的负载均衡,可靠性和容错计算,GPU功耗评测及低功耗优化的研究进展.综述在海量数据处理、智能计算、复杂网络、集群应用领域中图形处理器的研究进展及成果.总结在通用计算发展中存在的技术问题和未来挑战. 展开更多
关键词 图形处理器 通用计算 可编程性 GPU集群
在线阅读 下载PDF
图形处理器用于通用计算的技术、现状及其挑战 被引量:141
2
作者 吴恩华 《软件学报》 EI CSCD 北大核心 2004年第10期1493-1504,共12页
多年来计算机图形处理器(GPU)以大大超过摩尔定律的速度高速发展.图形处理器的发展极大地提高了计算机图形处理的速度和图形质量,并促进了与计算机图形相关应用领域的快速发展.与此同时,图形处理器绘制流水线的高速度和并行性以及近年... 多年来计算机图形处理器(GPU)以大大超过摩尔定律的速度高速发展.图形处理器的发展极大地提高了计算机图形处理的速度和图形质量,并促进了与计算机图形相关应用领域的快速发展.与此同时,图形处理器绘制流水线的高速度和并行性以及近年来发展起来的可编程功能为图形处理以外的通用计算提供了良好的运行平台,这使得基于GPU的通用计算成为近两三年来人们关注的一个研究热点.从介绍GPU的发展历史及其现代GPU的基本结构开始,阐述GPU用于通用计算的技术原理,以及其用于通用计算的主要领域和最新发展情况,并详细地介绍了GPU在流体模拟和代数计算、数据库应用、频谱分析等领域的应用和技术,包括在流体模拟方面的研究工作.还对GPU应用的软件工具及其最新发展作了较详细的介绍.最后,展望了GPU应用于通用计算的发展前景,并从硬件和软件两方面分析了这一领域未来所面临的挑战. 展开更多
关键词 图形处理器(graphics PROCESSING unit 简称GPU) 通用计算 可编程性 实时计算 处理
在线阅读 下载PDF
基于图形处理器的通用计算技术的研究 被引量:2
3
作者 戴长江 张尤赛 《现代电子技术》 2013年第4期157-161,共5页
为了研究基于PC的图形处理器(GPU)的通用计算技术,采用了基于纹理映射的经典GPU通用计算方法,进行了二维图像离散卷积和三维纹理映射体绘制的实验。实验证明了经典GPU通用计算技术在合适的算法设计基础上能够显著提升程序的运算速度,得... 为了研究基于PC的图形处理器(GPU)的通用计算技术,采用了基于纹理映射的经典GPU通用计算方法,进行了二维图像离散卷积和三维纹理映射体绘制的实验。实验证明了经典GPU通用计算技术在合适的算法设计基础上能够显著提升程序的运算速度,得出了基于CPU+GPU的异构计算模式可以成为高性能计算的一种选择的结论,展望了基于图形处理器的通用计算技术在未来的发展。 展开更多
关键词 图形处理器 gpgpu 纹理映射 并行计算 异构计算
在线阅读 下载PDF
基于图形处理器(GPU)的通用计算 被引量:227
4
作者 吴恩华 柳有权 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2004年第5期601-612,共12页
伴随着PC级微机的崛起和普及 ,多年来计算机图形的大部分应用发生了从工作站向微机的大转移 ,这种转移甚至发生在像虚拟现实、计算机仿真这样的实时 (中、小规模 )应用中 这一切的发生从很大程度上源自于图形处理硬件的发展和革新 近年... 伴随着PC级微机的崛起和普及 ,多年来计算机图形的大部分应用发生了从工作站向微机的大转移 ,这种转移甚至发生在像虚拟现实、计算机仿真这样的实时 (中、小规模 )应用中 这一切的发生从很大程度上源自于图形处理硬件的发展和革新 近年来 ,随着图形处理器 (GPU)性能的大幅度提高以及可编程特性的发展 ,人们首先开始将图形流水线的某些处理阶段以及某些图形算法从CPU向GPU转移 除了计算机图形学本身的应用 ,涉及到其他领域的计算 ,以至于通用计算近 2~ 3年来成为GPU的应用之一 ,并成为研究热点 文中从若干图形硬件发展的历史开始 ,介绍和分析最新GPU在通用计算方面的应用及其技术原理和发展状况 。 展开更多
关键词 图形处理器 通用计算 GPU 图形硬件 可编程性 代数运算 性能分析
在线阅读 下载PDF
基于图形处理器的通用计算模式 被引量:9
5
作者 王磊 张春燕 《计算机应用研究》 CSCD 北大核心 2009年第6期2356-2358,共3页
针对GPU图形处理的特点,分析其应用于通用计算的并行处理机制和数据映射,提出了一种GPU通用计算模式的映射机制和一般性设计方法,并针对GPU的吞吐量、数据流处理能力和基本数学运算能力等进行性能测试,为GPU通用计算的算法设计、实现和... 针对GPU图形处理的特点,分析其应用于通用计算的并行处理机制和数据映射,提出了一种GPU通用计算模式的映射机制和一般性设计方法,并针对GPU的吞吐量、数据流处理能力和基本数学运算能力等进行性能测试,为GPU通用计算的算法设计、实现和性能优化提供参考依据。 展开更多
关键词 图形处理器 通用计算 图形流水线
在线阅读 下载PDF
图形处理器在通用计算中的应用 被引量:4
6
作者 张健 陈瑞 《计算机工程与设计》 CSCD 北大核心 2009年第14期3359-3361,共3页
基于图形处理器(GPU)的计算统一设备体系结构(compute unified device architecture,CUDA)构架,阐述了GPU用于通用计算的原理和方法。在Geforce8800 GT下,完成了矩阵乘法运算实验。实验结果表明,随着矩阵阶数的递增,无论是GPU还是CPU处... 基于图形处理器(GPU)的计算统一设备体系结构(compute unified device architecture,CUDA)构架,阐述了GPU用于通用计算的原理和方法。在Geforce8800 GT下,完成了矩阵乘法运算实验。实验结果表明,随着矩阵阶数的递增,无论是GPU还是CPU处理,速度都在减慢。数据增加100倍后,GPU上的运算时间仅增加了3.95倍,而CPU的运算时间增加了216.66倍。 展开更多
关键词 图形处理器 计算统一设备体系结构 通用计算 矩阵乘法 矩阵阶数
在线阅读 下载PDF
图形处理器在分层聚类算法中的通用计算研究 被引量:1
7
作者 李琳 李肯立 朱雅丽 《计算机应用研究》 CSCD 北大核心 2008年第8期2319-2321,2327,共4页
ROCK是一种采用数据点间的公共链接数来衡量相似度的分层聚类方法,该方法对于高维、稀疏特征的分类数据具有高效的聚类效果。其邻接度矩阵计算是影响时间复杂度的关键步骤,将图形处理器(GPU)强大的浮点运算和超强的并行计算能力应用于... ROCK是一种采用数据点间的公共链接数来衡量相似度的分层聚类方法,该方法对于高维、稀疏特征的分类数据具有高效的聚类效果。其邻接度矩阵计算是影响时间复杂度的关键步骤,将图形处理器(GPU)强大的浮点运算和超强的并行计算能力应用于此步骤,而其余步骤由CPU完成。基于GPU的ROCK算法的运算效率在AMD 643500+CPU和NVIDIAGeForce 6800 GT显卡的硬件环境下经过实验测试,证明其运算速度比完全采用CPU计算速度要快。改进的分层聚类算法适合在数据流环境下对大量数据进行实时高效的聚类的操作。 展开更多
关键词 聚类分析 图形处理器 通用计算 分层聚类
在线阅读 下载PDF
图形处理器通用计算的实现与验证 被引量:3
8
作者 齐记 杨孔庆 杨磊 《计算机工程与应用》 CSCD 北大核心 2009年第33期67-69,共3页
讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提... 讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提供了可能。 展开更多
关键词 图形处理器(GPU) 图形处理器通用计算技术(gpgpu) 中央处理器(CPU)
在线阅读 下载PDF
图形处理器(GPU)加速时域有限元的二维辐射计算 被引量:5
9
作者 刘昆 王晓斌 廖成 《电波科学学报》 EI CSCD 北大核心 2008年第1期111-114,共4页
时域有限元方法是在电磁场与微波工程领域广泛应用的方法之一。然而,时域有限元在大型机上运行时都是相当缓慢的。对时域有限元计算的硬件加速的研究已经开始进行。与同一代技术的CPU比较,目前一般用户的图形加速卡(GPU)对时域有限元的... 时域有限元方法是在电磁场与微波工程领域广泛应用的方法之一。然而,时域有限元在大型机上运行时都是相当缓慢的。对时域有限元计算的硬件加速的研究已经开始进行。与同一代技术的CPU比较,目前一般用户的图形加速卡(GPU)对时域有限元的加速可以达到CPU的近4倍左右。以OpenGL作为应用编程接口(API),使用一个标准的商业图形卡编程解决二维时域有限元的辐射问题。 展开更多
关键词 图形加速卡(GPU) 时域有限元(TD-FEM) 通用计算图形处理单元 (gpgpu)
在线阅读 下载PDF
图形处理器在数据库技术中的应用 被引量:4
10
作者 杨珂 罗琼 石教英 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2009年第8期1349-1360,共12页
综述了图形处理器上的通用计算(GPGPU)技术以及利用图形处理器(GPU)进行数据库处理的工作.将GPU技术的发展划分为固定功能架构、分离渲染架构和统一渲染架构3个时代,归纳了GPGPU技术的难点和现状.对于3个时代的GPU,分别论述其体系结构... 综述了图形处理器上的通用计算(GPGPU)技术以及利用图形处理器(GPU)进行数据库处理的工作.将GPU技术的发展划分为固定功能架构、分离渲染架构和统一渲染架构3个时代,归纳了GPGPU技术的难点和现状.对于3个时代的GPU,分别论述其体系结构带来的机会与存在的局限,提出了相应的通用计算模型.综述了GPU用于数据库领域的相关研究,这些应用包括谓词、布尔组合和聚集、排序、连接、多维索引等.根据GPU技术的推动因素展望了GPGPU技术的趋势,归纳了GPU技术可以被利用的3个层面:图形流水线和通用并行计算、交互式多媒体、图形学理论与方法.以数据库技术为例展望了在每个层面上通用计算的趋势. 展开更多
关键词 图形处理器 通用计算 数据库技术
在线阅读 下载PDF
地震叠前时间偏移的一种图形处理器提速实现方法 被引量:74
11
作者 李博 刘国峰 刘洪 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2009年第1期245-252,共8页
新近发展的图形处理器(GPU,Graphic Processing Unit)通用计算技术,现已日趋实用成型,并获得诸多应用领域的广泛关注.对油气勘探专项资料处理技术的运用而言,概因GPU与中央处理器(CPU)的计算性能的甚大差异,致使GPU这一通用计算技... 新近发展的图形处理器(GPU,Graphic Processing Unit)通用计算技术,现已日趋实用成型,并获得诸多应用领域的广泛关注.对油气勘探专项资料处理技术的运用而言,概因GPU与中央处理器(CPU)的计算性能的甚大差异,致使GPU这一通用计算技术在石油工业中的应用研究正在有效开展.本文仅借助于油气勘探中广泛使用的叠前时间偏移,旨在于扼要阐明其基于GPU应用的有效性;文中还提出一种利用GPU实现地震叠前时间偏移的软件构件方法,并针对非对称走时叠前时间偏移所拓展的应用软件提供一种具体实现架构.与以往用个人计算机(PC,Personal Computer)或者PC集群所用的叠前时间偏移相比,本文方法可甚大地提高计算效率,从而在石油物探资料处理中可显著地节约计算成本和维护费用.文中实际例证也表明,基于GPU进行高性能并行计算,当是适应目前石油工业中大规模计算需求的一个重要发展途径. 展开更多
关键词 非对称走时叠前时间偏移 图形处理器 GPU通用计算 统一计算设备架构
在线阅读 下载PDF
基于图形处理器的电力系统稀疏线性方程组求解方法 被引量:9
12
作者 周挺辉 赵文恺 +2 位作者 严正 徐得超 江涵 《电力系统自动化》 EI CSCD 北大核心 2015年第2期74-80,共7页
针对电力系统大规模线性方程组的稀疏特点,提出了基于图形处理器(GPU)的直接求解方法。该方法首先利用基于先排序的分块对角加边形式(BBDF)划分方法对方程组系数矩阵进行分割,形成具有粗粒度和细粒度两层并行结构的线性方程组,然后... 针对电力系统大规模线性方程组的稀疏特点,提出了基于图形处理器(GPU)的直接求解方法。该方法首先利用基于先排序的分块对角加边形式(BBDF)划分方法对方程组系数矩阵进行分割,形成具有粗粒度和细粒度两层并行结构的线性方程组,然后利用GPU的线程块和线程并行特性对其分别予以求解。将上述方法应用到电力系统暂态稳定计算中,并对其加速效果进行了测试。测试结果表明,在目前普及的设备上,所提方法可获得3~4倍的加速比;在高端设备上,能够获得7~8倍的加速比。 展开更多
关键词 电力系统 并行计算 暂态稳定计算 图形处理器 稀疏技术 加速比
在线阅读 下载PDF
基于图形处理器的广义最小残差迭代法在电力系统暂态仿真中的应用 被引量:6
13
作者 唐聪 严正 周挺辉 《电网技术》 EI CSCD 北大核心 2013年第5期1365-1371,共7页
文中对电力系统暂态仿真算法及并行化设计进行了研究,针对图形处理器(graphic processing unit,GPU)的特性,应用广义最小残差法(generalized minimal residual,GMRES)提出一种基于GPU的电力系统暂态仿真并行算法。该算法采用预处理算法... 文中对电力系统暂态仿真算法及并行化设计进行了研究,针对图形处理器(graphic processing unit,GPU)的特性,应用广义最小残差法(generalized minimal residual,GMRES)提出一种基于GPU的电力系统暂态仿真并行算法。该算法采用预处理算法对暂态仿真计算过程中的系数矩阵进行预处理,降低条件数以提升收敛速度,经预处理后的线性方程组通过GMRES算法在GPU上并行求解,针对暂态仿真计算中线性方程组稀疏性的特点,算法应用稀疏存储技术以节省计算量和内存占用空间。测试表明,所提出的GPU并行算法与PSAT软件计算结果近似;相对CPU串行程序,当算例规模足够大时,GPU并行算法的加速效果明显,实测最高加速比为3.3。 展开更多
关键词 暂态仿真 处理 广义最小残差法 图形处理器 并行计算 统一计算设备架构 稀疏技术
在线阅读 下载PDF
基于图形处理器的划分聚类算法效率研究 被引量:2
14
作者 李琳 李肯立 《计算机应用研究》 CSCD 北大核心 2009年第4期1276-1278,共3页
提出一种利用GPU(图形处理器)和CPU的协同计算模式来提高划分聚类算法enhanced_K-means的计算效率。利用GPU多个子素处理器可以并行计算的特性,将算法中比较耗时的欧氏距离计算与比较、中心点改变后簇中没有发生变化的点集合判断步骤由... 提出一种利用GPU(图形处理器)和CPU的协同计算模式来提高划分聚类算法enhanced_K-means的计算效率。利用GPU多个子素处理器可以并行计算的特性,将算法中比较耗时的欧氏距离计算与比较、中心点改变后簇中没有发生变化的点集合判断步骤由GPU执行,算法其余步骤由CPU执行,使聚类效率得到显著提高。在配有Pentium4 3.4 GHz CPU和NVIDIAGeForce7800GT显卡的硬件环境下经过实验测试,证明其运算速度比完全采用CPU计算速度要快。这种改进的划分聚类算法适合在数据流环境下对大量数据进行实时高效聚类操作。 展开更多
关键词 聚类分析 图形处理器 通用计算 划分聚类
在线阅读 下载PDF
基于图形处理器的点云快速光顺 被引量:1
15
作者 张连伟 刘大学 +3 位作者 刘肖琳 李焱 徐昕 贺汉根 《计算机工程与科学》 CSCD 北大核心 2011年第4期86-92,共7页
点云数据光顺是点模型数字几何处理的一个重要研究内容。在海量数据规模应用中,不仅需要较高的光顺质量,而且需要有快速的处理速度。传统的基于CPU的光顺算法串行地处理每个采样点,导致巨大的时间开销。本文提出一种适应于图形处理器的... 点云数据光顺是点模型数字几何处理的一个重要研究内容。在海量数据规模应用中,不仅需要较高的光顺质量,而且需要有快速的处理速度。传统的基于CPU的光顺算法串行地处理每个采样点,导致巨大的时间开销。本文提出一种适应于图形处理器的点云快速光顺算法,将多个采样点处的协方差矩阵组织成一个大规模稀疏矩阵,以纹理图像的形式保存该稀疏矩阵,在像素程序中利用图形处理器强大的并行计算能力迭代求解协方差矩阵的最小特征值与特征向量,并据此计算光顺的速度和方向。实验在配有GeForce 8600GTS显卡的平台上进行。实验结果表明,基于GPU的点云光顺算法较之基于CPU的算法能够显著提高计算效率,从而为快速点云处理提供了良好的支持。 展开更多
关键词 图形处理器 光顺 通用计算 邻域 协方差矩阵
在线阅读 下载PDF
图形处理器协同运算的视频处理架构 被引量:2
16
作者 张磊 王广生 《现代电子技术》 2008年第20期134-138,共5页
多媒体视频处理的任务繁重,计算量大,很多算法无法在仅使用一颗CPU的条件下达到实时处理的速度。设计一套图形处理器协同运算的视频处理架构,它采用图形处理器与中央处理器配合,共同完成视频计算的任务。这种架构可以大大加速处理速度,... 多媒体视频处理的任务繁重,计算量大,很多算法无法在仅使用一颗CPU的条件下达到实时处理的速度。设计一套图形处理器协同运算的视频处理架构,它采用图形处理器与中央处理器配合,共同完成视频计算的任务。这种架构可以大大加速处理速度,并减轻中央处理器的负担。 展开更多
关键词 图形处理器 GPU通用计算 视频处理 GPU架构
在线阅读 下载PDF
基于图形处理器的层次聚类算法效率研究
17
作者 李琳 李肯立 《计算机工程与应用》 CSCD 北大核心 2008年第31期53-56,共4页
鉴于Larsen等人利用图形处理器(GPU)的多纹理技术做矩阵运算操作,以实现GPU在矩阵相乘方面的通用计算,提出一种利用GPU和CPU的协同处理模式,应用在基于层次聚类的动态近邻选择模型的聚类算法(DNNS)中,将算法中比较耗时的邻接度矩阵计算... 鉴于Larsen等人利用图形处理器(GPU)的多纹理技术做矩阵运算操作,以实现GPU在矩阵相乘方面的通用计算,提出一种利用GPU和CPU的协同处理模式,应用在基于层次聚类的动态近邻选择模型的聚类算法(DNNS)中,将算法中比较耗时的邻接度矩阵计算步骤交由GPU完成,而算法其余步骤由CPU执行,从而使算法的聚类效率得到显著提高。在配有Pentium IV 3.4G CPU和NVIDIA GeForce 7800GT显卡的硬件环境下经过实验测试,证明这种协同处理模式下的运算速度比完全采用CPU计算速度要快25%左右。这种改进的层次聚类算法适合在数据流环境下对大量数据进行实时高效聚类操作。 展开更多
关键词 图形处理器 通用计算 划分聚类
在线阅读 下载PDF
多图形处理器上Lattice-Boltzmann方法的加速 被引量:2
18
作者 吴亮 钟诚文 +3 位作者 郑彦奎 刘沙 卓丛山 陈效鹏 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第11期1932-1939,共8页
为了提高计算流体领域中复杂流动现象模拟计算的高效性和准确性,充分利用图形硬件的并行性,提出一种在单机多图形处理器下基于CUDA架构的Lattice Boltzmann方法(LBM)的模拟算法.采用区域划分策略将域上的LBM网格平均分配到不同的GPU设备... 为了提高计算流体领域中复杂流动现象模拟计算的高效性和准确性,充分利用图形硬件的并行性,提出一种在单机多图形处理器下基于CUDA架构的Lattice Boltzmann方法(LBM)的模拟算法.采用区域划分策略将域上的LBM网格平均分配到不同的GPU设备上,在分区边界处搭接一层网格以方便计算该处网格的迁移过程,减少GPU间的通信量,并合理地利用CUDA存储层次架构中的全局内存和纹理内存为计算网格分配设备空间;采用多线程技术,用每个线程控制不同的GPU设备,同时引入线程同步机制信号量实现线程间的数据通信同步控制,按照LBM方程组的求解过程实现模拟计算.实验结果表明,双GPU将计算加速到单GPU的1.77倍左右,同时将流场计算网格规模从单GPU下的4160×4160扩大到双GPU下的6144×6144. 展开更多
关键词 CUDA 多线程技术 LATTICE BOLTZMANN方法 图形处理器 信号量 并行计算
在线阅读 下载PDF
不规则任务在图形处理器集群上的调度策略 被引量:3
19
作者 平凡 汤小春 +1 位作者 潘彦宇 李战怀 《计算机应用》 CSCD 北大核心 2021年第11期3295-3301,共7页
针对大量的资源需求少且并行度高的不规则任务集合,利用图形处理器(GPU)来加速处理是目前的主流。然而现有的不规则任务调度策略要么采用独占GPU的方式,要么使用传统的优化方法将任务映射到GPU设备上。前者导致GPU资源的闲置,后者不能... 针对大量的资源需求少且并行度高的不规则任务集合,利用图形处理器(GPU)来加速处理是目前的主流。然而现有的不规则任务调度策略要么采用独占GPU的方式,要么使用传统的优化方法将任务映射到GPU设备上。前者导致GPU资源的闲置,后者不能最大限度利用GPU计算资源。在分析了现存问题的基础上,采用多背包优化思想,使更多的不规则任务以最佳的方式共享GPU设备。首先,针对GPU集群的特点,给出了由调度器、执行器组成的分布式GPU作业调度框架;然后,以GPU显存为代价,设计了一种基于GPU计算资源的扩展贪心调度(EGS)算法,该算法将尽可能多的不规则任务调度到多个可用的GPU上,以最大限度地利用GPU计算资源,并解决了GPU资源的闲置问题;最后,使用实际基准程序随机生成目标任务集来验证所提调度策略的有效性。实验结果表明,与传统的贪心算法、最早完成时间(MCT)算法和Min-min算法相比,当任务数量等于1000时,EGS算法的执行时长分别平均降低至原来的58%、64%和80%,并且能有效提升GPU资源利用率。 展开更多
关键词 图形处理器通用计算 独立任务 任务调度策略 调度框架 资源利用率
在线阅读 下载PDF
基于图形处理器的相位校正稳像
20
作者 王洪 刘歆浏 +2 位作者 周勇 骆云志 刘治红 《光电工程》 CAS CSCD 北大核心 2011年第8期27-34,共8页
由于稳像算法中的运动估计占据整个算法60%~80%的运算量,并随着图像分辨率的提高,实时稳定连续图像序列的难度不断增加。本文提出一种基于图形处理器的相位校正策略,根据相位校正稳像算法数学模型,利用图像处理器统一并行架构与像素单... 由于稳像算法中的运动估计占据整个算法60%~80%的运算量,并随着图像分辨率的提高,实时稳定连续图像序列的难度不断增加。本文提出一种基于图形处理器的相位校正策略,根据相位校正稳像算法数学模型,利用图像处理器统一并行架构与像素单线程模式,设计交叠复合相位运动估计结构,提升并行线程同步性能,缩短FFT并行运算时间;同时通过改变并行线程的尺度,调整图形处理器的存储方式,提升数据存储器的访问性能,改进了相位运动估计的并发性,可高品质估算视频需要稳定的旋转,平移等变量,以达到高速稳定1k×1k分辨率的灰度连续视频的目的。实验证明,平均稳定一帧图像时间约为10ms,有效提升了视频稳定的效率,增强了相位图像稳定工程应用的可能性。 展开更多
关键词 稳像 通用图形处理器(gpgpu) 相位校正 FFT 运动估计
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部