期刊文献+
共找到55篇文章
< 1 2 3 >
每页显示 20 50 100
基于梯度自适应光照模型的统一计算设备构架实时体绘制技术研究
1
作者 龚剑 贠照强 +1 位作者 秦安 冯前进 《南方医科大学学报》 CAS CSCD 北大核心 2010年第9期2156-2160,共5页
医学体绘制技术中,在组织轮廓清晰显示的前提下,同时显示组织内部和外部结构是非常困难的。因为增加透明度会造成结构之间的混淆,而剖切显示则会带来结构上下文信息的缺失。针对上述问题,提出了一种基于体素梯度的自适应光照模型,该模... 医学体绘制技术中,在组织轮廓清晰显示的前提下,同时显示组织内部和外部结构是非常困难的。因为增加透明度会造成结构之间的混淆,而剖切显示则会带来结构上下文信息的缺失。针对上述问题,提出了一种基于体素梯度的自适应光照模型,该模型中环境光等参数根据体素梯度自动调整;同时采用统一计算设备构架(Compute Unified Device Architecture)技术对算法进行加速。实验结果表明,该方法在保证实时交互的同时,能够达到保留组织上下文信息的效果。 展开更多
关键词 体绘制 统一计算设备构架 光照模型 GPU
在线阅读 下载PDF
统一计算设备架构并行图割算法用于肝脏肿瘤图像分割 被引量:4
2
作者 李拴强 冯前进 《中国生物医学工程学报》 CAS CSCD 北大核心 2010年第5期641-647,共7页
统一计算设备架构(CUDA)技术使GPU通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。在研究了CUDA的设计思想和编程方式的基础上,对图割算... 统一计算设备架构(CUDA)技术使GPU通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。在研究了CUDA的设计思想和编程方式的基础上,对图割算法进行了并行改造,并在CUDA上实现了其并行化。结合肝脏肿瘤的特点,引入感兴趣区域,改进了交互方法,实现了对肝脏肿瘤的分割。实验结果表明,该方法分割结果准确,鲁棒性强,执行效率高,易于交互和扩展。 展开更多
关键词 统一计算设备架构(cuda) 图割 肝脏肿瘤 分割
在线阅读 下载PDF
基于CUDA加速动态规划优化全景拼接的刮板输送机直线状态监测 被引量:2
3
作者 李博 侍守伊 +4 位作者 张建军 夏蕊 王学文 崔卫秀 倪强 《工矿自动化》 北大核心 2025年第1期45-51,60,共8页
为提高井下复杂恶劣环境下刮板输送机直线状态监测精度和实时性,提出了一种基于统一计算设备架构(CUDA)加速动态规划优化全景拼接的刮板输送机直线状态监测方法。首先,同步2路摄像头获取的刮板输送机图像的帧数、分辨率参数,对输入的视... 为提高井下复杂恶劣环境下刮板输送机直线状态监测精度和实时性,提出了一种基于统一计算设备架构(CUDA)加速动态规划优化全景拼接的刮板输送机直线状态监测方法。首先,同步2路摄像头获取的刮板输送机图像的帧数、分辨率参数,对输入的视频流进行暗通道清晰化处理,以消除井下煤尘、水雾等的干扰。其次,使用ORB算法检测和计算2路视频帧的特征点和描述子,通过K最近邻(KNN)匹配计算特征点间的匹配对,利用设置阈值比例的方法过滤错误的匹配点,使用随机抽样一致(RANSAC)算法计算出用于图像透视变换的单应性矩阵。然后,基于CUDA将读取Sobel算子、计算梯度、计算总能量差异、循环初始化权重与路径、寻找最佳接缝线分配到不同的线程中,并定义计算能量图和寻找最佳接缝线的核函数,完成2路图像沿接缝线融合的全景拼接。最后,使用霍夫变换方法对全景拼接的刮板输送机图像中部槽挡煤板进行直线拟合,并将拟合的直线绘制在全景拼接图像上,以反映刮板输送机的直线状态。实验及测试结果表明,CUDA加速动态规划优化全景拼接痕迹不明显,且处理速度快;通过霍夫变换对中部槽挡煤板拟合的直线与刮板输送机直线具有较好的一致性,可用于刮板输送机直线状态监测。 展开更多
关键词 刮板输送机直线状态监测 cuda加速 动态规划 全景拼接 霍夫变换 统一计算设备架构
在线阅读 下载PDF
面向CPU+GPU异构计算的SIFT特征匹配并行算法 被引量:11
4
作者 肖汉 郭运宏 周清雷 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第11期1732-1737,共6页
依据图形处理器(GPU)计算特点和任务划分的特点,提出主从模型的CPU+GPU异构计算的处理模式.通过分析和定义问题中的并行化数据结构,描述计算任务到统一计算设备架构(CUDA)的映射机制,把问题或算法划分成多个子任务,并对划分的子任务给... 依据图形处理器(GPU)计算特点和任务划分的特点,提出主从模型的CPU+GPU异构计算的处理模式.通过分析和定义问题中的并行化数据结构,描述计算任务到统一计算设备架构(CUDA)的映射机制,把问题或算法划分成多个子任务,并对划分的子任务给出合理的调度算法.结果表明,在GeForce GTX 285上实现的尺度不变特征变换(SIFT)并行算法相比CPU上的串行算法速度提升了近30倍. 展开更多
关键词 遥感影像 特征匹配 图形处理器(GPU) 统一计算设备架构(cuda) 尺度不变特征变换(SIFT)
在线阅读 下载PDF
基于CUDA的超声二维声场EFIT仿真 被引量:2
5
作者 宋波 李威 廉国选 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2019年第7期1322-1328,共7页
随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场... 随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场仿真的基础上,基于GPU实现了仿真模型的并行计算,介绍了GPU程序的设计流程和参数优化方法,包括纹理内存使用、吸收边界优化和数据传输优化。对比了相同条件下CPU和GPU仿真计算的耗时和平均计算效率,定量分析了GPU对于EFIT模型效率的提升。比对结果表明,EFIT具有良好的并行计算条件,采用并行计算方法能够有效提升模型计算速度,对于复杂声场仿真应用具有广阔的应用前景。 展开更多
关键词 并行计算 弹性动力学有限积分算法(EFIT) 二维声场 图形处理器(GPU) 计算设备统一构架(cuda)
在线阅读 下载PDF
基于CUDA的眼底图像快速自动配准与拼接 被引量:3
6
作者 王玉亮 沈建新 +1 位作者 廖文和 张运海 《中国机械工程》 EI CAS CSCD 北大核心 2013年第13期1749-1754,共6页
针对眼底图像对比度低、光照不均匀、视场局限及不同视场间存在几何畸变等特点,提出一种基于CUDA的眼底图像快速自动配准与拼接算法。该算法利用CUDA加快了各视场眼底图像同态滤波增强的速度及增强后各有效视场的SIFT特征提取与相互匹... 针对眼底图像对比度低、光照不均匀、视场局限及不同视场间存在几何畸变等特点,提出一种基于CUDA的眼底图像快速自动配准与拼接算法。该算法利用CUDA加快了各视场眼底图像同态滤波增强的速度及增强后各有效视场的SIFT特征提取与相互匹配的速度,并加快了结合透视变换模型的RANSAC算法进行的匹配点对提纯速度、周围视场与中央视场变换矩阵的计算速度,配准、融合后得到了眼底全景图像。实际的眼底照相机获取图像的自动配准与拼接表明,该算法可以快速、高精度地实现不同视场眼底图像的自动配准与拼接,算法速度是未采用CUDA的算法的10~30倍,精度达到像素级,具有很好的鲁棒性。 展开更多
关键词 计算统一设备架构(cuda) 尺度不变特征变换 图像配准 图像拼接
在线阅读 下载PDF
CUDA架构下大规模稠密线性方程组的并行求解 被引量:7
7
作者 杨梅 李志民 曹大勇 《计算机工程与应用》 CSCD 北大核心 2011年第32期27-30,共4页
在Gauss-Jordan消去法的基础上,给出了一种适应于CUDA架构的改进Gauss-Jordan消去并行算法。通过分析该方法的处理过程以及CUDA架构的相应限制,在CUDA的grid-block-thread三层组织结构的基础上,从算法构造的角度提出了grid-strip-group-... 在Gauss-Jordan消去法的基础上,给出了一种适应于CUDA架构的改进Gauss-Jordan消去并行算法。通过分析该方法的处理过程以及CUDA架构的相应限制,在CUDA的grid-block-thread三层组织结构的基础上,从算法构造的角度提出了grid-strip-group-block-thread五层结构,给出了基础行以及全局基础行等概念,并构建了适应于CUDA架构的Gauss-Jordan消去法的并行版本,在最高维数为4000维的大规模稠密线性方程组的算例求解上与串行Gauss-Jordan消去法进行了比较,实验结果表明,该算法能够充分利用GPU的硬件特性,有效地降低了大规模稠密线性方程组的求解时间。 展开更多
关键词 计算统一设备架构(cuda) 并行算法 改进Gauss-Jordan消去法 大规模稠密线性方程组
在线阅读 下载PDF
基于SMP集群的MPI+CUDA模型的研究与实现 被引量:10
8
作者 许彦芹 陈庆奎 《计算机工程与设计》 CSCD 北大核心 2010年第15期3408-3412,共5页
为了研究GPU的通用计算能力和适合SMP集群的编程模型,首次提出MPI+CUDA多粒度混合并行编程的新方法,节点间采用MPI实现粗粒度并行,节点内采用CUDA实现细粒度并行的混合编程方式。利用此方法在搭建的3节点SMP集群环境中,测试了大规模矩... 为了研究GPU的通用计算能力和适合SMP集群的编程模型,首次提出MPI+CUDA多粒度混合并行编程的新方法,节点间采用MPI实现粗粒度并行,节点内采用CUDA实现细粒度并行的混合编程方式。利用此方法在搭建的3节点SMP集群环境中,测试了大规模矩阵乘问题的并行计算能力。实验结果表明,该方法能够显著提升并行效率,同时证明MPI+CUDA混合编程模型能够充分发挥SMP集群节点间分布式存储和节点内共享内存的优势,为装有CUDA-enabled GPU的SMP集群提供了一种有效的并行策略。 展开更多
关键词 消息传递接口 统一计算设备架构 集群 混合编程 支持cuda的GPU
在线阅读 下载PDF
基于CUDA的三维数据场航路规划方法 被引量:1
9
作者 笪良龙 臧涛 +1 位作者 杨廷武 刘贝 《计算机工程》 CAS CSCD 北大核心 2009年第19期245-247,共3页
针对数据量庞大、复杂的三维数据场环境下航路规划速度偏低的问题,提出一种基于统一计算设备架构(CUDA)的三维数据场航路规划方法。该方法以三维水下声场为威胁模型,水下航行的潜艇为背景,运用CUDA对大规模数据场环境下对航路进行规划,... 针对数据量庞大、复杂的三维数据场环境下航路规划速度偏低的问题,提出一种基于统一计算设备架构(CUDA)的三维数据场航路规划方法。该方法以三维水下声场为威胁模型,水下航行的潜艇为背景,运用CUDA对大规模数据场环境下对航路进行规划,对可并行计算部分与CUDA进行计算,仿真结果证明该方法可以提高规划速率、优化初始航路。 展开更多
关键词 航路规划 统一计算设备架构(cuda) 航路优化
在线阅读 下载PDF
基于CUDA的邻近粒子搜索算法研究 被引量:3
10
作者 刘丹 陈捷捷 《计算机工程与应用》 CSCD 2012年第18期53-56,共4页
在粒子方法中,运用邻近粒子搜索算法可以快速获取每个粒子的邻近粒子信息。由于粒子方法模拟一个体系的行为所采用的粒子数据是十分庞大的,对计算机的运算速度提出了挑战。研究了GPU的计算能力和CUDA开发环境,利用GPU的并行多线程处理技... 在粒子方法中,运用邻近粒子搜索算法可以快速获取每个粒子的邻近粒子信息。由于粒子方法模拟一个体系的行为所采用的粒子数据是十分庞大的,对计算机的运算速度提出了挑战。研究了GPU的计算能力和CUDA开发环境,利用GPU的并行多线程处理技术,提出了一种并行邻近粒子搜索算法。实验结果表明,基于CUDA的并行邻近粒子搜索算法,加快了邻近粒子搜索过程,显著地减少了计算时间,成功实现了硬件加速,可获取290以上的加速比,对大规模粒子系统呈现出高效的处理能力。 展开更多
关键词 统一计算设备框架(cuda) 图形处理单元(GPU) 粒子方法 邻近粒子搜索
在线阅读 下载PDF
基于CUDA的并行布谷鸟搜索算法设计与实现 被引量:2
11
作者 韦向远 杨辉华 谢谱模 《计算机科学与探索》 CSCD 2014年第6期665-673,共9页
布谷鸟搜索(cuckoo search,CS)算法是近几年发展起来的智能元启发式算法,已经被成功应用于多种优化问题中。针对CS算法在求解大数据、大规模复杂问题时,计算时间过长的问题,提出了一种基于统一计算设备架构(compute unified device arch... 布谷鸟搜索(cuckoo search,CS)算法是近几年发展起来的智能元启发式算法,已经被成功应用于多种优化问题中。针对CS算法在求解大数据、大规模复杂问题时,计算时间过长的问题,提出了一种基于统一计算设备架构(compute unified device architecture,CUDA)的并行布谷鸟搜索算法。该算法的并行实现采用任务并行与数据并行相结合的方式,利用图形处理器(graphic processing unit,GPU)线程块与线程分别映射布谷鸟个体与个体的每一维数据,并行实现CS算法中的鸟巢位置更新、个体适应度评估、鸟巢重建、寻找最优个体操作。整个CS算法的寻优迭代过程完全通过GPU实现,降低了算法计算过程中CPU与GPU的通信开销。对4个经典基准测试函数进行了仿真实验,结果表明,相比标准CS算法,基于CUDA架构的并行CS算法在求解收敛性一致的前提下,在求解速度上获得了高达110倍的计算加速比。 展开更多
关键词 布谷鸟搜索算法 并行计算 图形处理器(GPU) 统一计算设备架构(cuda) GRAPHIC processing unit (GPU) compute UNIFIED device architecture (cuda)
在线阅读 下载PDF
利用CUDA实现矢量地图栅格化的并行处理 被引量:3
12
作者 程博艳 刘强 +1 位作者 李小文 张涛 《测绘通报》 CSCD 北大核心 2014年第11期97-101,共5页
为了解决矢量地图栅格化的计算效率问题,提出了基于计算统一设备架构(CUDA)实现矢量地图栅格化的并行处理方案。根据矢量地图中多边形的数目和图形处理器(GPU)的硬件性能,定义并行执行的线程数目,每一个线程对相应的多边形进行边填充栅... 为了解决矢量地图栅格化的计算效率问题,提出了基于计算统一设备架构(CUDA)实现矢量地图栅格化的并行处理方案。根据矢量地图中多边形的数目和图形处理器(GPU)的硬件性能,定义并行执行的线程数目,每一个线程对相应的多边形进行边填充栅格化。试验结果表明,加速比达到了10倍以上,相比中央处理器(CPU)栅格化的处理方法,运算效率有显著提升。 展开更多
关键词 矢量栅格化 边填充法 图形处理器(GPU) 计算统一设备架构(cuda)
在线阅读 下载PDF
CUDA加速的地图代数并行算法 被引量:1
13
作者 张剑波 周斯波 张帅 《桂林理工大学学报》 CAS 北大核心 2011年第1期139-143,共5页
针对传统地图代数实现方法应用于海量栅格数据计算时效率低下的问题,在一种全新的GPU并行编程模型CUDA上,利用地图代数算子体现出来的基于栅格点集、处理流程相对固定、数据处理具有内在的并行性等特点,将传统的串行算法映射到GPU并行... 针对传统地图代数实现方法应用于海量栅格数据计算时效率低下的问题,在一种全新的GPU并行编程模型CUDA上,利用地图代数算子体现出来的基于栅格点集、处理流程相对固定、数据处理具有内在的并行性等特点,将传统的串行算法映射到GPU并行处理架构上,旨在从串行算法的并行化映射、计算机图形处理器资源的自适应参数调整等多角度来研究地图代数空间并行算法的实现机制,为空间分析算法的优化研究提供一种新的解决思路。 展开更多
关键词 地图代数 统一计算设备架构(cuda) 并行计算
在线阅读 下载PDF
运动估计搜索算法的CUDA优化与实现 被引量:1
14
作者 陈佐 陈汉 季加良 《计算机工程与应用》 CSCD 北大核心 2010年第32期171-176,共6页
针对H.264压缩编码中计算量大以及最为耗时的运动估计搜索算法的特点,利用图形处理器的并行优化思想,研究基于CUDA计算平台的运动估计搜索算法GEA(全域消除算法)的并行化处理方法,并对其中的并行设计、数据处理、结果反馈等关键技术问题... 针对H.264压缩编码中计算量大以及最为耗时的运动估计搜索算法的特点,利用图形处理器的并行优化思想,研究基于CUDA计算平台的运动估计搜索算法GEA(全域消除算法)的并行化处理方法,并对其中的并行设计、数据处理、结果反馈等关键技术问题,进行了详细论述。最后通过实验数据对算法运行效率进行对比分析。实验结果表明GPU中的GEA搜索算法运动搜索性能较之CPU中有显著提高。 展开更多
关键词 统一计算设备架构(cuda) 运动估计 全域消除算法(GEA) 并行计算
在线阅读 下载PDF
CUDA平台下信息熵多种群遗传算法设计
15
作者 李正夫 王希诚 +2 位作者 李克秋 姚翔 董悦丽 《计算机工程与应用》 CSCD 北大核心 2016年第1期12-16,共5页
为了进一步提高信息熵多种群遗传算法的计算效率,缩短计算时间,提出了一种基于CUDA平台的信息熵多种群遗传算法。通过分析原算法的并行因素,结合CUDA开发平台,对原算法进行适合GPU加速的并行化处理,实现了遗传算子、惩罚函数和空间收缩... 为了进一步提高信息熵多种群遗传算法的计算效率,缩短计算时间,提出了一种基于CUDA平台的信息熵多种群遗传算法。通过分析原算法的并行因素,结合CUDA开发平台,对原算法进行适合GPU加速的并行化处理,实现了遗传算子、惩罚函数和空间收缩因子等的并行计算,有效地提高了算法效率。例题数值测试表明,在保持了快速收敛特性和计算精度的前提下,CUDA并行算法相对于原算法具有很高的加速效率。 展开更多
关键词 统一计算设备架构(cuda) 并行计算 遗传算法 信息熵 多种群
在线阅读 下载PDF
CUDA平台下LISP2算法垃圾收集并行研究
16
作者 张聪品 吴长茂 赵理莉 《计算机工程与应用》 CSCD 北大核心 2010年第33期75-77,138,共4页
为了提高垃圾收集效率,降低垃圾收集耗费时间,提出一种基于LISP2算法的并行节点复制垃圾收集算法,给出了在CUDA环境下该算法的实现。实验结果显示,该算法在CUDA环境下能有效提高垃圾收集效率。
关键词 垃圾收集 基于统一计算设备架构(cuda) 图形处理器(GPU) LISP2算法 并行
在线阅读 下载PDF
利用CUDA提高内存数据聚类效能的研究
17
作者 董丽丽 董玮 张翔 《计算机工程与应用》 CSCD 北大核心 2015年第22期243-251,共9页
提出一种新的聚类算法AIK-Means,利用CUDA技术加速算法执行效率,并优化内存方法,可在有限时间内进行多次聚类;将Chameleon层次聚类算法用于解决K-Means算法的初始聚类中心敏感问题;在多次聚类结果中用FP-Tree进行关联分析,提高聚类有效... 提出一种新的聚类算法AIK-Means,利用CUDA技术加速算法执行效率,并优化内存方法,可在有限时间内进行多次聚类;将Chameleon层次聚类算法用于解决K-Means算法的初始聚类中心敏感问题;在多次聚类结果中用FP-Tree进行关联分析,提高聚类有效性。将算法应用到某集团心理学MMPI数据测试,实验结果表明AIK-Means算法在执行效率和聚类有效性上具有良好的效果。 展开更多
关键词 统一计算设备架构(cuda) Chameleon层次聚类算法 K-Means聚类算法 频繁模式树(FP-Tree) 明尼苏达多项人格测验(MMPI)
在线阅读 下载PDF
CUDA架构下的快速Wallis影像增强算法
18
作者 肖汉 吴庆双 冯娜 《沈阳工业大学学报》 EI CAS 2011年第3期293-298,共6页
针对图像增强通常需要较大的计算量、用传统方法难于进行实时处理的问题,提出了一种基于图形处理器加速的Wallis变换影像增强方法.借助于图形处理器较强的运算能力,利用CUDA并行计算架构在PC机上实现了快速Wallis图像滤波算法,包括图形... 针对图像增强通常需要较大的计算量、用传统方法难于进行实时处理的问题,提出了一种基于图形处理器加速的Wallis变换影像增强方法.借助于图形处理器较强的运算能力,利用CUDA并行计算架构在PC机上实现了快速Wallis图像滤波算法,包括图形处理器(GPU)上任务分解、大规模计算核心的分解方法,结合使用共享存储器、全局存储器对算法进行加速,使用线程块内的共享存储器较好地解决了同一计算子空间的各线程同步问题.对比了CPU和GPU计算Wallis影像变换的时间,结果表明,随着图像分辨率的增大,Wallis并行算法可以把计算速度提高40倍.该方法具有较好的实时性,可大大提高图像增强过程的处理速度,显著地减少了计算时间. 展开更多
关键词 图形处理器 统一计算设备架构 单指令多线程 Wallis变换 影像增强 cuda 并行 滤波
在线阅读 下载PDF
基于CUDA的双三次B样条缩放方法 被引量:8
19
作者 桂叶晨 冯前进 +1 位作者 刘磊 陈武凡 《计算机工程与应用》 CSCD 北大核心 2009年第1期183-185,194,共4页
Nvidia在GeForce 8系列显卡上推出的CUDA(统一计算设备架构)技术使GPU通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。研究了CUDA的设计... Nvidia在GeForce 8系列显卡上推出的CUDA(统一计算设备架构)技术使GPU通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。研究了CUDA的设计思想和编程方式,改进了基于双三次B样条曲面的图像缩放算法,使用多个线程将计算中耗时的B样条重采样部分改造成SIMD模式,并分别采用CUDA中全局存储器和共享存储器策略在CUDA上完成图像缩放的全过程。实验结果表明,基于CUDA的B样条曲面并行插值方法成功实现了硬件加速,相对于CPU上运行的B样条缩放算法,其执行效率明显提高,易于扩展,对于大规模数据处理呈现出良好的实时处理能力。 展开更多
关键词 双三次B样条 统一计算设备架构(cuda) 图形处理器(GPU) 图像缩放 重采样
在线阅读 下载PDF
基于CUDA的图像匹配算法 被引量:3
20
作者 周冰园 陈庆奎 +1 位作者 高丽萍 秦川 《计算机工程与应用》 CSCD 北大核心 2015年第12期165-170,共6页
为解决目前已有的图像匹配算法不适用于对实时性要求很强的应用,提出了PLS(Partial Least Squares)与余弦定理相结合的并行化图像匹配算法。该算法在CUDA架构下,对图像矩阵分块,分块后每个小块图像存入共享存储器处理并提取每个小块图... 为解决目前已有的图像匹配算法不适用于对实时性要求很强的应用,提出了PLS(Partial Least Squares)与余弦定理相结合的并行化图像匹配算法。该算法在CUDA架构下,对图像矩阵分块,分块后每个小块图像存入共享存储器处理并提取每个小块图像特征,通过合并后图像特征采用余弦定理计算图像的相似度,从而找出匹配图像。实验表明,CUDA架构下可以实现图像的并行匹配,与CPU上串行匹配相比,时效性提高了百倍以上。 展开更多
关键词 统一设备计算架构(cuda) GPU技术 偏最小二乘(PLS)方法 并行计算 余弦定理 图像匹配
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部