期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于MPI的大规模栅格影像并行瓦片化算法 被引量:7
1
作者 刘世永 陈荦 +2 位作者 熊伟 吴烨 李军 《计算机工程与应用》 CSCD 北大核心 2018年第1期48-53,111,共7页
当前主流GIS软件以及互联网地图应用在Web GIS(网络地理信息系统)解决方案中都广泛采用地图切片(又称瓦片),切片处理服务是实现影像在Web GIS上快速无缝浏览的关键技术。针对目前传统算法以及商业GIS软件在大数据量栅格影像快速瓦片化... 当前主流GIS软件以及互联网地图应用在Web GIS(网络地理信息系统)解决方案中都广泛采用地图切片(又称瓦片),切片处理服务是实现影像在Web GIS上快速无缝浏览的关键技术。针对目前传统算法以及商业GIS软件在大数据量栅格影像快速瓦片化方面的不足,提出一种名为ParaTile的高效栅格影像快速瓦片化方法,ParaTile基于MPI共享外存的并行技术,利用多进程对原始栅格影像进行数据划分,每个进程对其所划分的区域进行独立读写和计算,而后再按照TMS或者Google Tile定义的标准将瓦片进行编码输出。实验采用不同级别大小的遥感影像进行测试,结果表明ParaTile在面对不同规模的数据时,无论从速度还是算法稳定性上都较现有算法和工具具有显著优势,特别是当数据量越大时,这种优势愈加明显。 展开更多
关键词 栅格影像 并行瓦片化 消息传递接口(MPI)
在线阅读 下载PDF
一种面向循环优化和非规则代码段的粗粒度半自动并行化方法 被引量:4
2
作者 刘松 赵博 +1 位作者 蒋庆 伍卫国 《计算机学报》 EI CSCD 北大核心 2017年第9期2127-2147,共21页
多核架构已成为当今的主流,而大量传统的串行程序和遗留软件无法充分利用多核处理器的并行计算性能.人工改写这些遗留软件工作量繁重、成本高昂,自动实现程序并行化的技术成为学术和工业界研究的热点.该文提出了一种新颖的面向一般程序... 多核架构已成为当今的主流,而大量传统的串行程序和遗留软件无法充分利用多核处理器的并行计算性能.人工改写这些遗留软件工作量繁重、成本高昂,自动实现程序并行化的技术成为学术和工业界研究的热点.该文提出了一种新颖的面向一般程序的for循环优化和非规则代码段的粗粒度半自动并行化方法.该方法通过程序动态分析,根据程序的控制流和数据依赖信息将源程序代码映射成可计算单元(CU)图,从中提取出可并行执行的非规则代码段.同时针对程序中for循环部分,提出了一种基于局部性分析的分块收益模型,有效地选择具有收益的循环代码实施循环分块优化;提出了一种基于cache均匀映射的最优分块因子大小选择算法UMC-TSS,以生成优化的分块代码,充分利用cache性能并实现分块的粗粒度并行.该文实现了一个基于LLVM编译架构的C/C++源码到Intel TBB并行源码转换的半自动化工具,它在AST上进行深度代码重构,只需少量的人工干预即可生成高效的并行代码.为了验证该文方法的有效性,从4组不同的基准测试集上选取18个具有代表性的测试程序在一台Intel Xeon多核服务器上进行了一系列实验,在循环级和任务级并行性能上分别获得平均10.95和4.45的加速比.和目前最先进的一种最优分块大小算法相比,UMC-TSS算法平均提升了4%的分块代码性能.实验结果还表明由源到源代码转换工具生成的Intel TBB并行代码具有良好的并行性和可扩展性. 展开更多
关键词 半自动并行化 循环分块 局部性分析 最优分块大小 源到源代码转换
在线阅读 下载PDF
大规模变网格三维地震正演MPI并行策略与实现 被引量:8
3
作者 蔡志成 顾汉明 +3 位作者 成景旺 刘春成 刘志斌 刘少勇 《石油地球物理勘探》 EI CSCD 北大核心 2017年第3期468-476,共9页
三维波动方程数值模拟是复杂储层波场特征分析和地震响应识别模式建立的重要手段。针对大规模三维模型正演模拟面临的内存消耗巨大、计算耗时长的问题,使用MPI并行技术将模型切割计算,同时为了对局部复杂区域进行精细模拟,引入变网格算... 三维波动方程数值模拟是复杂储层波场特征分析和地震响应识别模式建立的重要手段。针对大规模三维模型正演模拟面临的内存消耗巨大、计算耗时长的问题,使用MPI并行技术将模型切割计算,同时为了对局部复杂区域进行精细模拟,引入变网格算法对速度场进行局部加密,从空间上有效提高模拟精度;设计了适用于三维变网格算法的MPI并行子区域划分策略,降低了计算网格点数和内存需求。模型试算表明基于MPI并行变网格方法进行大规模三维正演数值模拟减少了内存消耗、提高了计算效率。 展开更多
关键词 MPI并行 三维波动方程正演 变网格 并行子区域 划分策略
在线阅读 下载PDF
高精度大口径光栅拼接装置的控制算法 被引量:8
4
作者 邵忠喜 张庆春 +1 位作者 白清顺 富宏亚 《光学精密工程》 EI CAS CSCD 北大核心 2009年第1期158-165,共8页
采用宏/微结合双驱动的少自由度并联进给结构,给出了一种光栅拼接装置设计算法。宏动部分是5PTS-1PPS型并联机构,采用步进电机驱动滚珠丝杠形式的进给机构;微动部分是5TSP-1PPS型并联机构,采用压电陶瓷驱动柔性铰链形式的进给机构;二者... 采用宏/微结合双驱动的少自由度并联进给结构,给出了一种光栅拼接装置设计算法。宏动部分是5PTS-1PPS型并联机构,采用步进电机驱动滚珠丝杠形式的进给机构;微动部分是5TSP-1PPS型并联机构,采用压电陶瓷驱动柔性铰链形式的进给机构;二者串联构成光栅拼接机构。计算了宏动部分和微动部分的并联机构自由度,利用并联机构运动学的逆解推导出该装置的控制算法,并根据控制算法进行了宏动、微动机构点位控制的运动学仿真。为了提高机构的定位精度,分析了机构的系统误差并提出了误差修正方法。最后,将以上算法应用到光栅拼接装置中。实验结果表明:宏动部分最大移动定位误差为3.6μm,最大转动定位误差为4.4μrad;微动部分最大移动定位误差为0.06μm,最大转动定位误差为1.2μrad;基本满足光栅拼接系统的精度要求。 展开更多
关键词 光栅拼接 运动学逆解 并联机构 自由度分析
在线阅读 下载PDF
面向局部性和并行优化的循环分块技术 被引量:11
5
作者 刘松 伍卫国 +1 位作者 赵博 蒋庆 《计算机研究与发展》 EI CSCD 北大核心 2015年第5期1160-1176,共17页
循环分块是一种广泛用于改善数据局部性和开发并行性的程序变换优化技术.主要分为2类:固定分块技术和参数化分块技术,系统地总结了这2类技术,并分析了其优缺点.由于分块大小的选择会严重影响分块代码的性能,因此介绍分析了选择最优分块... 循环分块是一种广泛用于改善数据局部性和开发并行性的程序变换优化技术.主要分为2类:固定分块技术和参数化分块技术,系统地总结了这2类技术,并分析了其优缺点.由于分块大小的选择会严重影响分块代码的性能,因此介绍分析了选择最优分块大小的各种方法.此外,总结了循环分块在多级分块、并行性开发和不完美嵌套循环等方面应用的各项技术.通过对循环分块技术当前研究现状的分析,得出如下结论:1)循环分块技术中的计算复杂度和生成代码效率问题还未得到完全解决,如何利用循环边界有效地约束迭代空间并提高数据局部性还需要更深入的研究;2)最优分块大小的选择依然是一个开放式难题,研究清楚分级存储架构中每级分块对性能的影响具有重要的意义;3)从循环分块的应用角度,如何有效地构建面向任意嵌套循环集的自动分块代码生成系统,同时充分利用深度共享存储资源和多核架构实现分块代码的高并行度,也是一个需要深入研究的问题. 展开更多
关键词 循环分块 最优分块大小 程序变换 并行性 性能优化
在线阅读 下载PDF
D3DPR:基于Direct3D9的并行图形绘制系统 被引量:1
6
作者 刘真 石教英 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2007年第8期995-1001,共7页
根据Direct3D9图形库的特征,提出了支持Direct3D9应用程序级透明并行图形绘制系统D3DPR的系统结构及其实现原理.D3DPR分为资源分配和资源绘制2类逻辑节点.通过资源分配节点并行图形库DPGL的截取技术和资源绘制节点的重构技术,任何单机的... 根据Direct3D9图形库的特征,提出了支持Direct3D9应用程序级透明并行图形绘制系统D3DPR的系统结构及其实现原理.D3DPR分为资源分配和资源绘制2类逻辑节点.通过资源分配节点并行图形库DPGL的截取技术和资源绘制节点的重构技术,任何单机的Direct3D9应用程序都不需要经过修改即可实时转变为由PC集群并行绘制,从而得到更高的绘制性能和高分辨率的多屏拼接显示效果,为用户提供具有更强真实感和沉浸感的虚拟环境. 展开更多
关键词 Direct3D9 并行图形绘制 多屏拼接 多流 绘制资源 截取 重构
在线阅读 下载PDF
基于循环分块的流水粒度优化算法 被引量:1
7
作者 刘晓娴 赵荣彩 +1 位作者 丁锐 李雁冰 《计算机应用》 CSCD 北大核心 2013年第8期2171-2176,共6页
当计算划分层迭代数目较大,或是循环体单次迭代工作量较大,但可用的并行线程数目较小时,传统的基于循环分块的流水粒度优化方法无法进行处理。为此,提出一种基于循环分块减小流水粒度的方法,并根据流水并行循环的代价模型实现最优流水... 当计算划分层迭代数目较大,或是循环体单次迭代工作量较大,但可用的并行线程数目较小时,传统的基于循环分块的流水粒度优化方法无法进行处理。为此,提出一种基于循环分块减小流水粒度的方法,并根据流水并行循环的代价模型实现最优流水粒度的求解,设计实现了一个流水计算粒度的优化算法。对有限差分松弛法(FDR)的波前循环和时域有限差分法(FDTD)中典型循环的测试表明,与传统的流水粒度选择方法相比,所提算法能够得到更优的循环分块大小。 展开更多
关键词 自动并行化 流水并行 流水粒度 循环分块 代价模型
在线阅读 下载PDF
基于多面体模型的编译“黑魔法” 被引量:13
8
作者 赵捷 李颖颖 赵荣彩 《软件学报》 EI CSCD 北大核心 2018年第8期2371-2396,共26页
基于多面体模型的编译技术发展近30年,已经在多个开源编译器和商业编译器中得到了应用和实现.与传统的编译优化模型相比,多面体模型具备应用范围广、表示能力强、优化空间大等优点,代表了程序自动并行化领域众多方向最先进的水平,成为... 基于多面体模型的编译技术发展近30年,已经在多个开源编译器和商业编译器中得到了应用和实现.与传统的编译优化模型相比,多面体模型具备应用范围广、表示能力强、优化空间大等优点,代表了程序自动并行化领域众多方向最先进的水平,成为国际上多个编译研发团队的研究热点;同时,多面体模型抽象程度高、实现难度大、面临问题多的特征,阻碍了基于该模型的编译技术在发展相对滞后地区的普及,形成国内专门从事该问题研究的团队屈指可数的现象.为了打开多面体模型的"黑盒子",首先描述了多面体模型的原理,揭示了基于多面体模型的编译流程,并指出了该领域的主要研究内容;接下来,从程序并行性、数据局部性和其他领域上的扩展应用这3个方面对该领域上的研究进展进行了介绍;最后,对该研究领域当前面临的挑战和潜在的研究方向进行了总结.研究目的是通过回顾和总结基于多面体模型的编译技术研究进展,为国内编译研发团队提供重要参考,以期推动我国在该领域上的发展. 展开更多
关键词 多面体模型 并行性 局部性 依赖 调度 代码生成 循环分块 数组压缩
在线阅读 下载PDF
基于FPGA的卷积神经网络硬件加速器设计 被引量:6
9
作者 黄沛昱 赵强 李煜龙 《计算机应用与软件》 北大核心 2023年第3期38-44,共7页
为了提高中小规模设备卷积神经网络的推理速度,提出一种基于FPGA的卷积神经网络硬件加速器设计方案。针对模型中的卷积运算单元,该硬件加速器采用输入、输出二维循环展开和循环分块的方法,设计128个并行乘法器单元。模型的输入输出接口... 为了提高中小规模设备卷积神经网络的推理速度,提出一种基于FPGA的卷积神经网络硬件加速器设计方案。针对模型中的卷积运算单元,该硬件加速器采用输入、输出二维循环展开和循环分块的方法,设计128个并行乘法器单元。模型的输入输出接口采用双缓存设计,通过乒乓操作,降低数据传输带来的时间延迟。同时,采用16位定点量化模型中权重参数,偏置参数和输入输出特征图的像素值。实验结果表明,与通用CPU酷睿i5-4440处理器相比,在COCO数据集上准确率几乎不变的情况下,计算性能提高5.77倍。在系统时钟频率为150 MHz时,硬件加速器的计算性能达到28.88 GOPS。 展开更多
关键词 卷积神经网络 FPGA 循环展开 循环分块 并行乘法器单元 双缓存设计
在线阅读 下载PDF
面向异构多核处理器的的循环分块 被引量:4
10
作者 李雁冰 赵荣彩 +1 位作者 赵博 黄品丰 《计算机工程与设计》 北大核心 2015年第1期168-173,共6页
将OpenACC编程模型用于异构多核处理器时,由于异构多核处理器加速设备内存有限,操作大量数据的代码不能获得很好的加速。针对这一问题,在OpenACC中引入循环分块子句,对循环进行分块处理,使每个循环块使用的数据能够存储在设备内存中;提... 将OpenACC编程模型用于异构多核处理器时,由于异构多核处理器加速设备内存有限,操作大量数据的代码不能获得很好的加速。针对这一问题,在OpenACC中引入循环分块子句,对循环进行分块处理,使每个循环块使用的数据能够存储在设备内存中;提出面向异构多核处理器的循环分块子句生成算法,并在基于Open64的"源-源"自动并行化系统Auto-ACC中进行实现。测试结果表明,在异构多核处理器上,扩展的循环分块子句及所提生成算法能够对程序进行明显的加速。 展开更多
关键词 异构多核处理器 循环分块 数据重用 OpenACC 自动并行化
在线阅读 下载PDF
基于双缓冲队列的海量地形数据并行处理方法 被引量:1
11
作者 陈小潘 渠涧涛 +2 位作者 赵亚萌 王鹏 陈玉林 《郑州大学学报(工学版)》 CAS 北大核心 2016年第3期6-10,共5页
海量地形数据处理过程中,硬件的性能优势不能得到充分利用,已成为制约大规模地形绘制速度的瓶颈.针对这一问题,分析了影响硬件处理能力发挥的关键因素,采用双缓冲队列的设计思路,提出了一种支持海量地形数据的并行处理方法,即将大规模... 海量地形数据处理过程中,硬件的性能优势不能得到充分利用,已成为制约大规模地形绘制速度的瓶颈.针对这一问题,分析了影响硬件处理能力发挥的关键因素,采用双缓冲队列的设计思路,提出了一种支持海量地形数据的并行处理方法,即将大规模地形绘制分为数据处理和渲染绘制两个独立的过程,分别进行并行处理:设立两个缓冲队列,将数据的读、写操作区分开来;充分考虑了瓦片加载的优先级,并据此进行任务分配.实验表明,该方法有效地提升了大规模地形绘制的整体速度. 展开更多
关键词 海量地形数据 双缓冲队列 并行化 大规模地形绘制 瓦片加载
在线阅读 下载PDF
分片式流处理器上存储系统的设计与实现 被引量:1
12
作者 汪芳 安虹 +2 位作者 徐光 许牧 姚平 《计算机工程》 CAS CSCD 北大核心 2010年第11期217-220,共4页
针对"存储墙"问题,从提高片外带宽使用率的角度出发,为分片式流处理器设计实现数据并行存储系统。该存储系统通过多级调度能有效减少片外访存的次数,降低片外带宽的需求。软件模拟和仿真验证的结果表明,在不同工作负载特征下... 针对"存储墙"问题,从提高片外带宽使用率的角度出发,为分片式流处理器设计实现数据并行存储系统。该存储系统通过多级调度能有效减少片外访存的次数,降低片外带宽的需求。软件模拟和仿真验证的结果表明,在不同工作负载特征下,通过设计参数的优化选择,该设计能够充分挖掘存储访问的行局部性和体间并行性,从而提高带宽的使用效率。 展开更多
关键词 分片式流处理器 数据并行存储系统 片外带宽
在线阅读 下载PDF
基于平铺数据流的可配置神经网络加速器 被引量:3
13
作者 李艺煌 马胜 +2 位作者 郭阳 陈桂林 徐睿 《计算机工程与科学》 CSCD 北大核心 2019年第6期963-972,共10页
卷积神经网络已经是公认最好的用于深度学习的算法,被广泛地应用于图像识别、自动翻译和广告推荐。由于神经网络结构规模的逐渐增大,使其具有大量的神经元和突触,所以,使用专用加速硬件挖掘神经网络的并行性已经成为了热门的选择。在硬... 卷积神经网络已经是公认最好的用于深度学习的算法,被广泛地应用于图像识别、自动翻译和广告推荐。由于神经网络结构规模的逐渐增大,使其具有大量的神经元和突触,所以,使用专用加速硬件挖掘神经网络的并行性已经成为了热门的选择。在硬件设计中,经典的平铺结构实现了很高的性能,但是平铺结构的单元利用率很低。目前,随着众多深度学习应用对硬件性能要求的逐渐提高,加速器对单元利用率也具有越来越严格的要求。为了在平铺数据流结构上获得更高的单元利用率,可以调换并行的顺序,采用并行输入特征图和输出通道的方式来提高计算的并行性。但是,随着神经网络运算对硬件性能要求的提高,运算单元阵列必然会越来越大。当阵列大小增加到一定程度,相对单一的并行方式会使利用率逐渐下降。这就需要硬件可以开发更多的神经网络并行度,从而抑制单元空转。同时,为了适应不同的网络结构,要求硬件阵列对神经网络的运算是可配置的。但是,可配置硬件会极大地增加硬件开销和数据的调度难度。提出了一种基于平铺结构加速器的并行度可配置的神经网络加速器。为了减少硬件复杂度,提出了部分配置的技术,既能满足大型单元阵列下单元利用率的提升,也能尽可能地减少硬件额外开销。在阵列大小超过512之后,硬件单元利用率平均可以维持在82%~90%。同时加速器性能与单元阵列数量基本成线性比例上升。 展开更多
关键词 神经网络 平铺数据流 可配置 单元利用率 并行性
在线阅读 下载PDF
预制构件瓷砖铺贴并联机器人运动学分析 被引量:2
14
作者 马宏 耿明超 +2 位作者 王占英 刘今越 周敬钧 《河北科技大学学报》 CAS 北大核心 2024年第6期662-668,共7页
针对装配式建筑预制构件瓷砖自动铺贴的需求,设计了一种基于并联机构的瓷砖抓取、振实一体式的机器人新构型。首先,设计了由3个分支组成的铺贴机器人,其每个分支中包含2个不同类型的作动器,分别对应机器人的抓取工作模式和振动工作模式... 针对装配式建筑预制构件瓷砖自动铺贴的需求,设计了一种基于并联机构的瓷砖抓取、振实一体式的机器人新构型。首先,设计了由3个分支组成的铺贴机器人,其每个分支中包含2个不同类型的作动器,分别对应机器人的抓取工作模式和振动工作模式;其次,结合机构的布置特点,分析了机构的自由度特性,推导了其位置正、反解;再次,针对广义坐标,采用等效运动旋量表描述闭环四杆机构的运动特性,将振动工作模式下的铺贴机器人瞬时等效为3-R RC并联机构;最后,基于旋量代数推导了机器人等效机构的运动学一、二阶影响系数,并给出了相应的数值算例。结果表明,铺贴机器人有较大的工作空间,结合不同频率和幅值的振动输出,能够实现瓷砖抓取、振实一体化。所提出的瓷砖铺贴机器人具有一定可行性,为瓷砖自动铺贴的进一步研究与应用提供了参考。 展开更多
关键词 工业机器人技术 预制构件 瓷砖铺贴 并联机构 运动学
在线阅读 下载PDF
格子玻尔兹曼方法计算程序的循环优化技术研究
15
作者 崔元桢 刘松 +1 位作者 王倩 伍卫国 《计算机学报》 EI CSCD 北大核心 2020年第6期1086-1102,共17页
格子玻尔兹曼方法(Lattice Boltzmann Method,LBM)在计算流体力学领域中得到广泛应用,但传统的LBM计算程序耗时巨大,如何优化LBM的计算程序具有重要研究意义.现有的优化方法较少关注LBM计算程序中时间步迭代中潜在的大量数据重用收益,... 格子玻尔兹曼方法(Lattice Boltzmann Method,LBM)在计算流体力学领域中得到广泛应用,但传统的LBM计算程序耗时巨大,如何优化LBM的计算程序具有重要研究意义.现有的优化方法较少关注LBM计算程序中时间步迭代中潜在的大量数据重用收益,造成计算性能损失.本文通过对LBM计算程序核心循环代码进行循环优化,将其巨大的迭代空间划分成满足cache容量的分块,从而提高数据重用性,同时开发粗粒度循环并行性.分块大小在对迭代空间划分时起到了影响性能的关键作用.本文根据LBM的程序特征提出了一种混合的分块大小选择方法——LBM_TSS方法.该方法从LBM计算程序的访存行为、局部性收益、并行效率以及同步开销四个方面进行静态分析,在约束条件限定的搜索空间内进一步对分块大小寻优,从而计算出性能最优的分块大小.本文在一个共享内存多核系统上对LBM_TSS方法的有效性进行了全面的验证和分析.实验结果表明,在最优情况下,采用LBM_TSS方法计算的分块大小所实现的LBM循环优化方法,与其他3种LBM并行优化方法相比,将LBM程序性能提高了16.79%. 展开更多
关键词 格子玻尔兹曼方法 局部性优化 并行优化 分块大小选择
在线阅读 下载PDF
多面体模型中分裂分块算法的设计与实现 被引量:2
16
作者 李颖颖 赵捷 庞建民 《计算机学报》 EI CSCD 北大核心 2020年第6期1010-1023,共14页
循环分块是一种提升程序局部性的循环变换技术.多面体模型中实现了简单的平行四边形分块,但这种分块形状无法有效进行分块之间的并行.为了解决循环分块的块间并行问题,研究人员提出了分裂分块、钻石分块等各种复杂的分块形状.其中,钻石... 循环分块是一种提升程序局部性的循环变换技术.多面体模型中实现了简单的平行四边形分块,但这种分块形状无法有效进行分块之间的并行.为了解决循环分块的块间并行问题,研究人员提出了分裂分块、钻石分块等各种复杂的分块形状.其中,钻石分块已经在多面体模型编译器中得到了实现,但分裂分块由于设计复杂,目前还没有一个有效的实现算法.本文设计了一种分裂分块算法,基于平行四边形分块实现分裂,避免了传统分裂分块依赖于非仿射表达式的问题,并在多面体模型编译器PPCG中对该算法进行了实现.实验对涵盖各种情况的stencil计算进行了测试,并分别在CPU和GPU架构上生成分裂分块代码.结果表明,本文提出的算法能在CPU架构上与当前最先进的钻石分块性能相当;同时,分裂分块将PPCG在GPU上生成的代码性能提高2.7倍~5.6倍. 展开更多
关键词 多面体模型 循环分块 分裂分块 stencil计算:并行计算
在线阅读 下载PDF
面向虚拟地球系统的多尺度影像瓦片数据实时创建技术 被引量:1
17
作者 洪宇 刘金 +2 位作者 康林冲 姜晓轶 孔祥勤 《长江科学院院报》 CSCD 北大核心 2016年第11期73-77,共5页
针对传统虚拟地球系统对多分辨率影像预先切片构建瓦片金字塔,导致的数据通用性差、数据更新效率低等问题,提出了一种实时创建多尺度影像瓦片数据的改进技术。设计并构建多尺度影像金字塔模型,对影像进行逻辑上的裁剪和接边处理,并将多... 针对传统虚拟地球系统对多分辨率影像预先切片构建瓦片金字塔,导致的数据通用性差、数据更新效率低等问题,提出了一种实时创建多尺度影像瓦片数据的改进技术。设计并构建多尺度影像金字塔模型,对影像进行逻辑上的裁剪和接边处理,并将多尺度影像金字塔工程发布为数据服务,基于多核处理器设计影像切片并行算法实现用户实时响应请求。采用World Wind虚拟地球系统选择广东及海南区域的多源影像进行试验,试验结果证明该技术能够方便地管理影像数据,满足虚拟地球系统的并发访问需求,并能极大地提高数据更新效率。 展开更多
关键词 虚拟地球系统 多尺度影像 瓦片金字塔 实时创建 并行计算
在线阅读 下载PDF
基于机群的拼贴显示系统的软件结构
18
作者 李颖敏 胡明昌 《计算机工程与应用》 CSCD 北大核心 2002年第1期108-110,199,共4页
利用计算机系统控制多个图形部件,驱动多个投影仪得到基于投影拼贴的显示,是突破现有显示技术制约,实现千万像素以上的高清晰度大尺寸显示的有效手段。目前采用PC机群系统来驱动拼贴显示系统的方式由于其较高的性能价格比正日益成为主... 利用计算机系统控制多个图形部件,驱动多个投影仪得到基于投影拼贴的显示,是突破现有显示技术制约,实现千万像素以上的高清晰度大尺寸显示的有效手段。目前采用PC机群系统来驱动拼贴显示系统的方式由于其较高的性能价格比正日益成为主流的选择,但是这种实现方式同时需要更复杂的分布式显示软件的支持。该文分析比较了几种基于机群的拼贴显示系统的软件结构并在此基础上提出了一种新的适合并行程序环境的软件接口。 展开更多
关键词 拼贴显示 并行程序 软件接口
在线阅读 下载PDF
一种并行中英文混合多模式匹配算法 被引量:1
19
作者 王震 李仁发 +1 位作者 李彦彪 田峥 《计算机工程》 CAS CSCD 2014年第4期318-320,F0003,共4页
针对中英文混合文本的匹配准确性及大规模数据文本的匹配效率等问题,基于经典的线索化完全哈希特里树算法,提出一种并行化的中英文混合多模式文本匹配算法。采用拆分文本降低多模式匹配算法的串行度,进而在拆分出的小文本上并行地执行... 针对中英文混合文本的匹配准确性及大规模数据文本的匹配效率等问题,基于经典的线索化完全哈希特里树算法,提出一种并行化的中英文混合多模式文本匹配算法。采用拆分文本降低多模式匹配算法的串行度,进而在拆分出的小文本上并行地执行文本匹配。通过并行化预处理过程,设计新的存储结构。实验结果表明,该算法在保证结果正确的前提下,执行效率高于经典的串行匹配算法,当数据规模达到226个字符时,可以获得8倍以上的加速比。 展开更多
关键词 多模式匹配 中英文混合 特里树 图形处理单元 并行计算 统一计算设备架构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部