期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
面向稀疏计算的领域特定语言设计与实现 被引量:1
1
作者 胡燕婷 郑启龙 《小型微型计算机系统》 CSCD 北大核心 2024年第5期1241-1248,共8页
在稀疏计算领域应用模型的开发过程中,低层次的编程接口需要用户对底层硬件和算法模型同时具有全面、深入的了解.这种要求造成了稀疏计算领域的高门槛特性,不利于非专业人员的开发工作.为了降低稀疏计算领域的学习门槛,简化稀疏计算编程... 在稀疏计算领域应用模型的开发过程中,低层次的编程接口需要用户对底层硬件和算法模型同时具有全面、深入的了解.这种要求造成了稀疏计算领域的高门槛特性,不利于非专业人员的开发工作.为了降低稀疏计算领域的学习门槛,简化稀疏计算编程,提高编程的效率,本文提出了一种基于领域特定语言的解决方案,命名为Sparse Computing Programming Solutions:SCPS.SCPS设计和实现了专门的语法规则体系Sparse Computation by Domain Language:SCDL,并配备了相应的语法检查器.其次,SCPS会根据用户对数据和任务的划分进行代码优化,通过代码自动生成器将用户编写的应用模型转换为相关硬件的计算代码.为了提供良好的跨平台特性,代码生成器最终将生成相应模型的OpenCL代码.大规模的实验结果表明,使用SCDL语言构建的代码量仅为对应OpenCL代码的1/15,有效地提高了稀疏计算编程的效率.同时,实验证明了与串行代码相比,自动生成的代码能够达到优化的效果. 展开更多
关键词 领域特定语言 稀疏计算 语法检查 代码自动生成 opencl
在线阅读 下载PDF
开放式计算语言加速的分段前缀和并行算法
2
作者 肖汉 李彩林 +1 位作者 郭宝云 周清雷 《科学技术与工程》 北大核心 2019年第31期215-221,共7页
针对数值计算中前缀和运算数据量大、耗时巨大这一难题,提出了一种基于开放式计算语言(open computing language,OpenCL)的分段式前缀和并行算法。首先进行了分段式前缀和算法的并行性分析,对任务进行了层次化分解与组合,设计了两级并... 针对数值计算中前缀和运算数据量大、耗时巨大这一难题,提出了一种基于开放式计算语言(open computing language,OpenCL)的分段式前缀和并行算法。首先进行了分段式前缀和算法的并行性分析,对任务进行了层次化分解与组合,设计了两级并行的分段式前缀和算法;然后通过OpenCL编程将前缀和并行算法映射到CPU+GPU系统平台上,实现了层次化并行前缀和处理;最后,根据计算单元(compute unit,CU)的资源条件,增加CU中本地存储器的分配,通过改进工作节点的访问模式来降低bank冲突,提高访存速度。实验结果表明,与基于AMD Opteron 2439 SE CPU的串行算法、基于OpenMP(open multi-processing)并行算法和基于统一计算设备架构并行算法性能相比,前缀和并行算法在OpenCL架构下NVIDIA Tesla C2075计算平台上分别获得了33.51倍、6.26倍和2.41倍的加速比。验证了提出的并行优化方法的有效性和性能可移植性。 展开更多
关键词 分段式前缀和 图形处理器 开放计算语言 并行算法 性能优化
在线阅读 下载PDF
开放式计算机数控系统的构建 被引量:5
3
作者 高军礼 李迪 +1 位作者 郑时雄 冯寿廷 《组合机床与自动化加工技术》 北大核心 2004年第5期55-57,共3页
文章首先指出了研究多轴数控加工技术的重要现实意义和深远意义。对CNC的开放性、开放标准、系统建模、实时性进行了分析研究 ,在此基础上创新性地提出了一种基于WinCE和DSP的开放式CNC的构建方案。
关键词 开放 计算机数控系统 数控加工 统一建模语言 windows CE操作系统 数字信号处理器
在线阅读 下载PDF
基于开放运算语言加速的数字全息卷积重建算法实现 被引量:1
4
作者 罗洪艳 周珞一 +2 位作者 赵震 郭洪 冯晓波 《电子与信息学报》 EI CSCD 北大核心 2022年第9期3258-3265,共8页
针对数字全息重建算法计算速度慢、实时应用能力弱以及现有GPU加速策略跨平台移植性差等问题,该文提出一种利用开放运算语言(OpenCL)架构提高数字全息重建算法执行效率的方案。该方案充分利用OpenCL架构的异构协同计算能力,对数字全息... 针对数字全息重建算法计算速度慢、实时应用能力弱以及现有GPU加速策略跨平台移植性差等问题,该文提出一种利用开放运算语言(OpenCL)架构提高数字全息重建算法执行效率的方案。该方案充分利用OpenCL架构的异构协同计算能力,对数字全息卷积重建算法进行CPU+GPU的异构运行设计,并采用数据并行模式编程实现。针对不同分辨率数字全息图、不同GPU加速平台的测试结果表明,该加速策略的平均执行时间均比CPU低1个数量级,最高总加速比达到54.2,并行运算加速比甚至高达94.7,且具有规模增长性及良好的跨平台特性,加速效率显著,更加适用于数字全息技术的工程化实现及实时性应用场合。 展开更多
关键词 数字全息 重建算法 开放运算语言 并行计算
在线阅读 下载PDF
基于OpenCL的累积汇流并行计算
5
作者 龙满生 罗文浪 《计算机工程与应用》 CSCD 2014年第3期22-29,116,共9页
大尺度、高分辨率数字地形数据应用需求的增长,给计算密集型的累积汇流等数字地形分析算法带来了新的挑战。针对CPU/GPU(Graphics Processing Unit)异构计算平台的特点,提出了一种基于OpenCL(Open Computing Language)的多流向累积汇流... 大尺度、高分辨率数字地形数据应用需求的增长,给计算密集型的累积汇流等数字地形分析算法带来了新的挑战。针对CPU/GPU(Graphics Processing Unit)异构计算平台的特点,提出了一种基于OpenCL(Open Computing Language)的多流向累积汇流算法的并行化策略,具有更好的平台独立性和可移植性,简化了CPU/GPU异构平台下的并行应用程序设计。累积汇流并行算法包括时空独立型的流量分配和空间依赖型的累积入流两个过程,均定义为OpenCL内核并交由OpenCL设备并行执行,其中累积入流过程借助流量转移矩阵由递归式转换为迭代式来实现并行计算。与基于流量转移矩阵的并行汇流算法相比,尽管基于单元入度矩阵的并行汇流算法可以降低迭代过程中的计算冗余,但需要采用具有较大延迟的原子操作以及需要更多的迭代次数,在有限的GPU计算资源下,两种算法性能差异不明显。实验结果表明,并行累积汇流算法在NVIDIA GeForce GT 650M GPU上获得了较好的加速比,加速性能随格网尺度增加而有所增加,其中流量分配获得了约50~70倍的加速比,累积入流获得了10~20倍的加速比,展示了利用OpenCL在GPU等并行计算设备上进行大规模数字地形分析的潜在优势。 展开更多
关键词 并行计算 累积汇流 图形处理器 开放计算语言
在线阅读 下载PDF
基于异构平台的图像中值滤波的OpenCL加速算法 被引量:3
6
作者 肖诗洋 王镭 +1 位作者 杜莹 肖汉 《河北大学学报(自然科学版)》 CAS 北大核心 2024年第1期92-103,共12页
图像噪声降低了图像信噪比和质量,去噪是图像处理工作的重要环节之一.本文提出了一种基于开放式计算语言(OpenCL)架构的图像中值滤波快速降噪并行算法.介绍了OpenCL体系结构特点和中值滤波处理流程.根据图形处理器(GPU)的并发结构特点,... 图像噪声降低了图像信噪比和质量,去噪是图像处理工作的重要环节之一.本文提出了一种基于开放式计算语言(OpenCL)架构的图像中值滤波快速降噪并行算法.介绍了OpenCL体系结构特点和中值滤波处理流程.根据图形处理器(GPU)的并发结构特点,对图像中值滤波功能模块进行了并行优化,降低了算法复杂度.通过充分激活NDRange索引空间中的工作组和工作项来提高数据访问效率,优化内核工作组配置参数,实现了中值滤波器的并行处理.实验结果表明,在图像质量保持不变的情况下,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,图像中值滤波并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了29.74、17.29、1.15倍的加速比.验证了算法的有效性和平台的可移植性,基本满足应用的实时性处理要求. 展开更多
关键词 中值滤波 椒盐噪声 图形处理器 开放计算语言 并行算法
在线阅读 下载PDF
基于OpenCL的异构系统并行编程 被引量:23
7
作者 詹云 赵新灿 谭同德 《计算机工程与设计》 CSCD 北大核心 2012年第11期4191-4195,4293,共6页
针对异构处理器在传统通用计算中利用率低的问题,提出基于开放计算语言OpenCL(open computing language)的新的通用计算技术,它提供了统一的编程模型。介绍了OpenCL的特点、架构及实现原理等,并提出OpenCL性能优化策略。将OpenCL与计算... 针对异构处理器在传统通用计算中利用率低的问题,提出基于开放计算语言OpenCL(open computing language)的新的通用计算技术,它提供了统一的编程模型。介绍了OpenCL的特点、架构及实现原理等,并提出OpenCL性能优化策略。将OpenCL与计算统一设备架构CUDA(compute unified device architecture)及其它通用计算技术进行对比。对比结果表明,OpenCL能够充分发挥异构处理平台上各种处理器的性能潜力,充分合理地分配任务,为进行大规模并行计算提供了新的强有力的工具。 展开更多
关键词 异构处理器 通用计算 开放计算语言(opencl) 性能优化 计算统一设备架构(CUDA)
在线阅读 下载PDF
面向OpenCL架构的Harris角点检测算法 被引量:7
8
作者 肖汉 马歌 周清雷 《计算机科学》 CSCD 北大核心 2014年第7期306-309,321,共5页
Harris角点检测算法是计算机视觉领域中使用非常广泛的点特征提取算法,它计算简单,稳定性强,但运算速度慢。当前已有算法优化研究一般只针对单一硬件平台,它们很难实现在不同平台上的高效运行。为此提出一种基于开放式计算语言(OpenCL)... Harris角点检测算法是计算机视觉领域中使用非常广泛的点特征提取算法,它计算简单,稳定性强,但运算速度慢。当前已有算法优化研究一般只针对单一硬件平台,它们很难实现在不同平台上的高效运行。为此提出一种基于开放式计算语言(OpenCL)设计思想的Harris角点检测并行算法,其采用图形处理器(GPU)中共享存储器、常量存储器和锁页内存机制在OpenCL框架下完成影像角点检测的全过程。实验结果表明,基于OpenCL的Harris角点检测并行算法相比CPU上的串行算法可获得的加速比高达77倍,执行效率明显提高,对于大规模数据处理表现出良好的实时处理能力。 展开更多
关键词 图形处理器 开放计算语言 影像 角点检测 HARRIS算子
在线阅读 下载PDF
Jini在开放系统中的应用研究 被引量:4
9
作者 任立勇 卢军 卢显良 《计算机应用》 CSCD 北大核心 2002年第5期45-47,共3页
开放系统的复杂性使设备管理和配置成为一件非常繁琐费时的工作。Jini通过为网络设备提供即插即用能力来实现简化配置和管理工作 ,但开放系统中存在大量设备无法直接加入Jini环境 ,为此提出一种增强的Jini应用网关JALGW来实现非Jini设... 开放系统的复杂性使设备管理和配置成为一件非常繁琐费时的工作。Jini通过为网络设备提供即插即用能力来实现简化配置和管理工作 ,但开放系统中存在大量设备无法直接加入Jini环境 ,为此提出一种增强的Jini应用网关JALGW来实现非Jini设备的即插即用。在分析了JALGW的原理基础上 ,对JALGW的功能扩展。 展开更多
关键词 Jini 开放系统 网关 即插即用 计算机系统 JAVA语言
在线阅读 下载PDF
面向OpenCL的GPGPU微基准测试程序集的研究与实现 被引量:2
10
作者 杨海燕 史晓华 +3 位作者 孙清越 晏望龙 严鑫 金茂忠 《系统工程与电子技术》 EI CSCD 北大核心 2013年第12期2631-2642,共12页
随着通用图形处理器(general-purpose graphics processing unit,GPGPU)的广泛应用,GPGPU成为当前实现计算并行化的主要硬件平台之一。开放计算语言(open computing language,OpenCL)是一个开放的、面向异构系统平台的并行计算标准,支... 随着通用图形处理器(general-purpose graphics processing unit,GPGPU)的广泛应用,GPGPU成为当前实现计算并行化的主要硬件平台之一。开放计算语言(open computing language,OpenCL)是一个开放的、面向异构系统平台的并行计算标准,支持在包括图形处理器(graphics processing unit,GPU)在内的多种微处理器架构上开发和运行并行程序。针对OpenCL平台开发了一套较完整的GPGPU微基准测试程序集,全面测试了GPU的单精浮点运算能力、GPU体系结构中各类存储单元的读写带宽及最佳访问模式等。这些面向OpenCL的GPGPU微基准测试程序,对OpenCL及GPGPU软件架构的设计者及使用者,均具有重要的实用和参考价值。 展开更多
关键词 计算机系统结构 微基准测试程序集 通用图形处理器 开放计算语言
在线阅读 下载PDF
新一代开放系统及互操作性研究 被引量:5
11
作者 张云勇 刘锦德 《系统工程与电子技术》 EI CSCD 北大核心 2002年第8期94-97,共4页
经历 2 0世纪 90年代的持续实践 ,采用“开放系统”的思想来集成大型的计算机系统已成为技术界不争的事实。然而 ,技术的发展使得传统的开放系统面临严峻的挑战 ,需要新的标准、技术来使开放系统体现高度的智能协作性及移动性。基于完... 经历 2 0世纪 90年代的持续实践 ,采用“开放系统”的思想来集成大型的计算机系统已成为技术界不争的事实。然而 ,技术的发展使得传统的开放系统面临严峻的挑战 ,需要新的标准、技术来使开放系统体现高度的智能协作性及移动性。基于完善的开放系统的实际形成有赖于“互操作性”的实现这一原因 ,以互操作性为研究对象 ,以移动agent为研究工具 ,探讨了新一代开放系统实现机制以及未来发展的前景。 展开更多
关键词 开放系统 互操作性 移动AGENT 智能协作性 AGENT通信语言 计算
在线阅读 下载PDF
基于OpenCL的加速鲁棒特征算法并行实现 被引量:3
12
作者 郭景 陈贤富 《中国科学技术大学学报》 CAS CSCD 北大核心 2017年第10期808-816,共9页
加速鲁棒特征算法(speed up robust features,SURF)的时间复杂度大,传统串行计算的方法,实时性难以保证.针对上述问题,提出一种基于OpenCL架构的SURF并行实现方法.首先对算法中的积分图的计算、Hessian响应图、特征点主方向、特征点描... 加速鲁棒特征算法(speed up robust features,SURF)的时间复杂度大,传统串行计算的方法,实时性难以保证.针对上述问题,提出一种基于OpenCL架构的SURF并行实现方法.首先对算法中的积分图的计算、Hessian响应图、特征点主方向、特征点描述等步骤实施数据并行和任务并行处理,并给出详细的算法流程.接着从OpenCL架构的数据传输、内存访问以及负载均衡等方面优化算法性能.实验结果表明,该算法对不同分辨率的图片均实现了10倍以上的加速比,一些高分辨率的图片甚至可以达到39.5倍,并且算法适用于多种通用计算平台. 展开更多
关键词 加速鲁棒特征 开放运算语言 图像处理器 并行计算
在线阅读 下载PDF
基于OpenCL的尺度不变特征变换算法的并行设计与实现 被引量:3
13
作者 许川佩 王光 《计算机应用》 CSCD 北大核心 2016年第7期1801-1806,共6页
针对尺度不变特征变换(SIFT)算法实时性差的问题,提出了利用开放式计算语言(Open CL)并行优化的SIFT算法。首先,通过对原算法各步骤进行组合拆分、重构特征点在内存中的数据索引等方式对原算法进行并行化重构,使得算法的中间计算结... 针对尺度不变特征变换(SIFT)算法实时性差的问题,提出了利用开放式计算语言(Open CL)并行优化的SIFT算法。首先,通过对原算法各步骤进行组合拆分、重构特征点在内存中的数据索引等方式对原算法进行并行化重构,使得算法的中间计算结果能够完全在显存中完成交互;然后,采用复用全局内存对象、共享局部内存、优化内存读取等策略对原算法各步骤进行并行设计,提高数据读取效率,降低传输延时;最后,利用Open CL语言在图形处理单元(GPU)上实现了SIFT算法的细粒度并行加速,并在中央处理器(CPU)上完成了移植。与原SIFT算法配准效果相近时,并行化的算法在GPU和CPU平台上特征提取速度分别提升了10.51~19.33和2.34~4.74倍。实验结果表明,利用Open CL并行加速的SIFT算法能够有效提高图像配准的实时性,并能克服统一计算设备架构(CUDA)因移植困难而不能充分利用异构系统中多种计算核心的缺点。 展开更多
关键词 尺度不变特征变换算法 开放计算语言 复用内存对象 细粒度并行 异构系统
在线阅读 下载PDF
网格计算及其在大型数值计算中的应用
14
作者 李繁 刘锋英 林才寿 《控制工程》 CSCD 北大核心 2013年第S1期54-57,共4页
针对在没有超级计算机的情况下,通过共享网络将不同地点的大量计算机互联,将各处计算机的多余处理器能力合在一起,形成巨大的处理能力,从而形成虚拟的超级计算机,使得"虚拟化的"、无缝的资源共享成为可能,从而支持不同组织和... 针对在没有超级计算机的情况下,通过共享网络将不同地点的大量计算机互联,将各处计算机的多余处理器能力合在一起,形成巨大的处理能力,从而形成虚拟的超级计算机,使得"虚拟化的"、无缝的资源共享成为可能,从而支持不同组织和部门之间的协作,解决大型数值计算的问题。并以网格计算工具包Globus Toolkit为基础,在网格基本原理的指导下,运行了一个具体的网格应用实例,求解了"素性判定"、"高精度运算"等问题,验证了该方法的正确性。 展开更多
关键词 网格计算 开放网格服务体系结构 开放网格服务基础设施 Web服务定义语言
在线阅读 下载PDF
基于OpenCL的图像灰度化并行算法研究 被引量:10
15
作者 肖汉 郭宝云 +1 位作者 李彩林 肖诗洋 《江西师范大学学报(自然科学版)》 CAS 北大核心 2020年第5期462-471,共10页
随着图像数据量的增加,传统单核处理器或多处理器结构的计算方式已无法满足图像灰度化实时处理需求.该文利用图像处理器(GPU)在异构并行计算的优势,提出了基于开放式计算语言(OpenCL)的图像灰度化并行算法.通过分析加权平均图像灰度化... 随着图像数据量的增加,传统单核处理器或多处理器结构的计算方式已无法满足图像灰度化实时处理需求.该文利用图像处理器(GPU)在异构并行计算的优势,提出了基于开放式计算语言(OpenCL)的图像灰度化并行算法.通过分析加权平均图像灰度化数据处理的并行性,对任务进行了层次化分解,设计了2级并行的并行算法并映射到“CPU+GPU”异构计算平台上.实验结果显示:图像灰度化并行算法在OpenCL架构下NVIDIA GPU计算平台上相比串行算法、多核CPU并行算法和CUDA并行算法的性能分别获得了27.04倍、4.96倍和1.21倍的加速比.该文提出的并行优化方法的有效性和性能可移植性得到了验证. 展开更多
关键词 图像灰度化 加权平均 图形处理器 开放计算语言 并行算法
在线阅读 下载PDF
试论多媒体时代的开放教育
16
作者 金振坤 《开放教育研究》 1996年第3期1-3,42,共4页
信息高速公路、多媒体技术已成为当今社会的热门话题。多媒体在教育中的魅力胜过以往的任何一种媒体,而对未来多媒体时代的教育更是众说纷云,莫衷一是。笔者认为,不管什么样的崇论宏议,切不可忘记,多媒体和以往的任何一种媒体一样,不过... 信息高速公路、多媒体技术已成为当今社会的热门话题。多媒体在教育中的魅力胜过以往的任何一种媒体,而对未来多媒体时代的教育更是众说纷云,莫衷一是。笔者认为,不管什么样的崇论宏议,切不可忘记,多媒体和以往的任何一种媒体一样,不过是一种工具,一种技术,它随着教育科学技术的发展而产生,又反过来为教育科学技术的发展而服务。对于教育来说,没有一种绝对完美无缺的能独步天下的媒体。媒体会给教育带来多大影响完全是由媒体本身的特性和功能来决定的。 展开更多
关键词 开放教育 多媒体时代 学习者 多媒体教材 计算机互联网络 教育科学技术 教育信息传播 多媒体技术 有声语言 计算机接口
在线阅读 下载PDF
基于OpenCL的MD5破解算法 被引量:5
17
作者 翁捷 吴强 杨灿群 《计算机工程》 CAS CSCD 北大核心 2011年第4期119-121,共3页
在基于GPU的异构平台上,采用开放计算语言(OpenCL)实现破解算法,利用分轮生成攻击密码、图形渲染管线加速存取以及多密码并行等方法对算法进行优化,在Intel四核CPU Q8230(2.3 GHz)和一片NVIDIA GT200组成的平台上进行实验。实验结果表明... 在基于GPU的异构平台上,采用开放计算语言(OpenCL)实现破解算法,利用分轮生成攻击密码、图形渲染管线加速存取以及多密码并行等方法对算法进行优化,在Intel四核CPU Q8230(2.3 GHz)和一片NVIDIA GT200组成的平台上进行实验。实验结果表明,在相同CPU平台上该算法能够获得高于破解软件John the ripper 17倍的破解速度。 展开更多
关键词 开放计算语言 带随机数的MD5算法 图形处理器 强力攻击
在线阅读 下载PDF
异构平台上基于OpenCL的矩阵乘并行算法 被引量:3
18
作者 肖汉 肖诗洋 +1 位作者 李彩林 周清雷 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第11期147-153,共7页
在分析开放式计算语言(OpenCL)平台底层硬件构架的基础上,从数据本地化、计算资源利用率和访存带宽利用率等多个不同角度优化了矩阵乘算法,并实现了矩阵乘算法在OpenCL架构下的加速.实验数据显示,与基于CPU的单线程算法、基于OpenMP多... 在分析开放式计算语言(OpenCL)平台底层硬件构架的基础上,从数据本地化、计算资源利用率和访存带宽利用率等多个不同角度优化了矩阵乘算法,并实现了矩阵乘算法在OpenCL架构下的加速.实验数据显示,与基于CPU的单线程算法、基于OpenMP多线程算法和基于统一计算设备架构(CUDA)并行算法相比,基于OpenCL架构的矩阵乘并行算法效率更高. 展开更多
关键词 矩阵乘 图形处理器 开放计算语言 并行算法
在线阅读 下载PDF
一种面向OpenCL架构的矩阵-向量乘并行算法与实现 被引量:2
19
作者 肖汉 周清雷 姚鹏姿 《小型微型计算机系统》 CSCD 北大核心 2019年第1期26-30,共5页
矩阵-向量乘法算法的时间复杂度大,传统计算方法的实时性和跨平台性难以保证.本文提出一种基于开放式计算语言(Open Computing Language,OpenCL)的矩阵-向量乘并行算法,矩阵-向量乘法过程被分解成若干具有不同粒度的子任务.根据相应的... 矩阵-向量乘法算法的时间复杂度大,传统计算方法的实时性和跨平台性难以保证.本文提出一种基于开放式计算语言(Open Computing Language,OpenCL)的矩阵-向量乘并行算法,矩阵-向量乘法过程被分解成若干具有不同粒度的子任务.根据相应的并行度,每个工作组进行矩阵中的行块与列向量的乘积,每个工作项进行行块中行向量与列向量的乘积,并把计算任务分别分配到计算单元和处理单元进行处理.实验结果表明,与基于CPU的串行算法、基于OpenMP并行算法和基于统一计算设备架构(Compute Unified Device Architecture,CUDA)并行算法性能相比,矩阵-向量乘并行算法在OpenCL架构下NVIDIA图形处理器(Graphic Processing Unit,GPU)计算平台上分别获得了20. 86倍、6. 39倍和1. 49倍的加速比.验证了提出的并行优化方法的有效性和性能可移植性. 展开更多
关键词 矩阵-向量乘 图形处理器 开放计算语言 并行算法
在线阅读 下载PDF
面向CPUs-GPUs系统的OpenCL任务调度框架 被引量:5
20
作者 王浩 王浩枫 《计算机工程与设计》 北大核心 2022年第7期1955-1963,共9页
为解决OpenCL多任务环境的自适应调度问题,分析资源竞争导致的内核执行效率下降情况,提出一个可在CPU-GPU异构平台上高效调度多个程序内核的OpenCL任务调度框架。通过随机森林模型分析OpenCL任务在不同设备上的运行状态,提出一套量化Ope... 为解决OpenCL多任务环境的自适应调度问题,分析资源竞争导致的内核执行效率下降情况,提出一个可在CPU-GPU异构平台上高效调度多个程序内核的OpenCL任务调度框架。通过随机森林模型分析OpenCL任务在不同设备上的运行状态,提出一套量化OpenCL内核数据传输的公式,提高OpenCL任务分析的准确性;采用负载均衡程度和单任务调度时间混合指标策略,保证系统执行效率,保障单个任务的执行效率。通过实验验证该框架的良好性能,实验结果表明,在不同程度的资源竞争的情况下,与两种常见的调度策略相比,该框架在负载均衡和任务执行效率指标方面均有提升。 展开更多
关键词 开放计算语言 资源竞争 任务调度 异构系统 机器学习 任务分析 负载均衡
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部