期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
用数据驱动的编程模型并行多重网格应用 被引量:2
1
作者 郭杰 高希然 +2 位作者 陈莉 傅游 刘颖 《计算机科学》 CSCD 北大核心 2020年第8期32-40,共9页
多重网格是数值计算领域中一种加速迭代收敛的重要技术,被广泛应用。近年来,大规模并行计算系统向多核化、异构众核化发展,多重网格应用也亟须适应新的并行计算平台。文中采用一种数据驱动的任务并行语言AceMesh将遗产的NAS MG程序移植... 多重网格是数值计算领域中一种加速迭代收敛的重要技术,被广泛应用。近年来,大规模并行计算系统向多核化、异构众核化发展,多重网格应用也亟须适应新的并行计算平台。文中采用一种数据驱动的任务并行语言AceMesh将遗产的NAS MG程序移植到“天河二号”和“神威·太湖之光”两种不同架构的国产超算平台上,展示了使用该语言对计算循环、通信代码的任务并行方法,验证了AceMesh语言的跨平台性能可移植性。文中定性地分析了该应用的任务图特征和计算-通信重叠的特点,并分别在两个并行计算平台上将其与现有编程模型MPI/OpenMP和MPI/OpenACC进行性能对比,分析了AceMesh任务图并行程序对访存性能和通信-计算重叠的优化效果。实验数据表明,相比传统的并行编程方法,AceMesh在“神威·太湖之光”和“天河二号”平台上分别最高获得了1.19X和1.85X的性能加速。最后,针对该应用在不同网格层的通信特点以及通信序列化导致大量通信不能隐藏的问题,提出了未来的研究方向。 展开更多
关键词 多重网格 MPI遗产应用 数据驱动的任务并行编程模型 异构众核 计算-通信重叠
在线阅读 下载PDF
任务并行编程模型研究与进展 被引量:29
2
作者 王蕾 崔慧敏 +1 位作者 陈莉 冯晓兵 《软件学报》 EI CSCD 北大核心 2013年第1期77-90,共14页
任务并行编程模型是近年来多核平台上广泛研究和使用的并行编程模型,旨在简化并行编程和提高多核利用率.首先,介绍了任务并行编程模型的基本编程接口和支持机制;然后,从3个角度,即并行性表达、数据管理和任务调度介绍任务并行编程模型... 任务并行编程模型是近年来多核平台上广泛研究和使用的并行编程模型,旨在简化并行编程和提高多核利用率.首先,介绍了任务并行编程模型的基本编程接口和支持机制;然后,从3个角度,即并行性表达、数据管理和任务调度介绍任务并行编程模型的研究问题、困难和最新研究成果;最后展望了任务并行未来的研究方向. 展开更多
关键词 任务并行 并行编程模型 任务窃取调度 并行性表达
在线阅读 下载PDF
MapReduce并行编程模型研究综述 被引量:189
3
作者 李建江 崔健 +2 位作者 王聃 严林 黄义双 《电子学报》 EI CAS CSCD 北大核心 2011年第11期2635-2642,共8页
MapReduce并行编程模型通过定义良好的接口和运行时支持库,能够自动并行执行大规模计算任务,隐藏底层实现细节,降低并行编程的难度.本文对MapReduce的国内外相关研究现状进行了综述,阐述和分析了当前国内外与MapReduce相关的典型研究成... MapReduce并行编程模型通过定义良好的接口和运行时支持库,能够自动并行执行大规模计算任务,隐藏底层实现细节,降低并行编程的难度.本文对MapReduce的国内外相关研究现状进行了综述,阐述和分析了当前国内外与MapReduce相关的典型研究成果的特点和不足,重点对MapReduce涉及的关键技术(包括:模型改进、模型针对不同平台的实现、任务调度、负载均衡和容错)的研究现状进行了深入的分析.本文最后还对MapReduce未来的发展趋势进行了展望. 展开更多
关键词 MAPREDUCE 并行编程模型 运行时支持库 海量数据处理
在线阅读 下载PDF
数据密集型计算编程模型研究进展 被引量:39
4
作者 王鹏 孟丹 +1 位作者 詹剑锋 涂碧波 《计算机研究与发展》 EI CSCD 北大核心 2010年第11期1993-2002,共10页
作为一种新兴的计算模式,云计算受到了学术界和产业界的广泛关注.云计算以互联网服务和应用为中心,服务提供者需要存储和分析海量数据.为了能够低成本高效率地处理Web量级数据,主要的互联网公司都在由商品化服务器组成的大规模集群系统... 作为一种新兴的计算模式,云计算受到了学术界和产业界的广泛关注.云计算以互联网服务和应用为中心,服务提供者需要存储和分析海量数据.为了能够低成本高效率地处理Web量级数据,主要的互联网公司都在由商品化服务器组成的大规模集群系统上研发了分布式编程系统.编程模型可以降低开发人员在大规模集群上编程的难度,并让程序充分利用集群资源,但设计这样的编程模型面临巨大挑战.首先说明了数据密集型计算的特点,并指出了编程模型要解决的基本问题;接着深入介绍了国际上代表性的编程模型,并对这些编程模型的特点进行了比较和分析;最后对当前所面临的问题和今后的发展趋势进行了总结和展望. 展开更多
关键词 云计算 数据密集型计算 编程模型 数据并行 海量数据处理 MAPREDUCE
在线阅读 下载PDF
MapReduce并行编程模型研究综述 被引量:24
5
作者 杜江 张铮 +1 位作者 张杰鑫 邰铭 《计算机科学》 CSCD 北大核心 2015年第S1期537-541 564,564,共6页
MapReduce并行编程模型的出现简化了并行编程的复杂度。通过调用方便的接口和运行时支持库,MapReduce并行编程模型可令大规模并行计算任务自动并发地执行而不必关心底层的具体实现细节,从而令MapReduce并行编程模型在大规模中低性能集... MapReduce并行编程模型的出现简化了并行编程的复杂度。通过调用方便的接口和运行时支持库,MapReduce并行编程模型可令大规模并行计算任务自动并发地执行而不必关心底层的具体实现细节,从而令MapReduce并行编程模型在大规模中低性能集群中发挥出色的计算能力,且可节约成本。对国内外关于MapReduce并行编程模型的研究现状进行了综述,分析了目前国内外相关研究成果的优缺点,并对MapReduce并行编程模型的未来发展进行了展望。 展开更多
关键词 MAPREDUCE 并行编程模型 并行计算 海量数据处理
在线阅读 下载PDF
模型-数据混合驱动的电网安全特征选择和知识发现关键技术与工程应用 被引量:55
6
作者 黄天恩 郭庆来 +3 位作者 孙宏斌 赵乃岩 王彬 郭文鑫 《电力系统自动化》 EI CSCD 北大核心 2019年第1期95-101,208,共8页
随着可再生能源的大规模并网、需求响应的逐步实现,电网运行方式的复杂性和波动性不断攀升,电力系统的安全运行正面临新的需求与挑战。因此,基于人工智能技术,在广东电网建立了"模型—数据混合驱动的电网安全特征选择和知识发现平... 随着可再生能源的大规模并网、需求响应的逐步实现,电网运行方式的复杂性和波动性不断攀升,电力系统的安全运行正面临新的需求与挑战。因此,基于人工智能技术,在广东电网建立了"模型—数据混合驱动的电网安全特征选择和知识发现平台",保证电网安全、稳定、经济运行。文中首先定义了电网安全特征和知识,阐述了模型—数据混合驱动的思想与具体实现方法,并分析了降低误差的手段;其次阐释了平台的并行计算技术;接着设计了平台的软硬件架构;最后,展示了平台在广东电网的实际应用效果,结果表明:(1)从运行规则制定层面,将运行专家离线制定粗放运行规则的模式,变革为人工智能在线发现精细运行规则的模式;(2)从运行规则应用层面,将调度员人工判定运行规则的模式,变革为人工智能实时判定运行规则的模式。 展开更多
关键词 模型驱动 数据驱动 并行计算 分布式平台 人工智能
在线阅读 下载PDF
面向地震数据处理的并行与分布式编程框架 被引量:17
7
作者 赵长海 晏海华 +2 位作者 王宏琳 史晓华 王雷 《石油地球物理勘探》 EI CSCD 北大核心 2010年第1期146-155,共10页
本文提出了一个适用于地震资料处理的并行与分布式编程框架GeoPF。该框架构建在集群系统之上,采用粗粒度数据并行执行模型,它可以调度串行语言编写的处理模块,同时运行在多个计算节点或者单个节点内的多个CPU核上,隐藏了计算节点及其CP... 本文提出了一个适用于地震资料处理的并行与分布式编程框架GeoPF。该框架构建在集群系统之上,采用粗粒度数据并行执行模型,它可以调度串行语言编写的处理模块,同时运行在多个计算节点或者单个节点内的多个CPU核上,隐藏了计算节点及其CPU核的调度、通讯与节点故障恢复、模块之间的数据传输等并行编程细节。经过实验评估,GeoPF框架从串行到并行的线性加速性能有所提高,处理相同任务的时间从21h33min缩减到15min27s,效果显著。GeoPF与商用的地震数据处理系统相比,在业务流程方面有一些相同特点,其不同之处就是GeoPF的处理模块具有自动并行特点,而大部分地震处理模块只能是串行方式。 展开更多
关键词 并行执行模型 地震数据处理 编程框架 分布式 计算节点 地震资料处理 数据处理系统 串行方式
在线阅读 下载PDF
军事任务推演的时空模型与驱动机制 被引量:7
8
作者 李欢 马伯宁 孔龙星 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第3期138-143,共6页
针对军事信息系统的作战任务推演需求,提出了一种基于时空事件序列的、较为完备的高效任务推演方法。论述了基于层次化分解的任务表达机制与实体化策略;针对保障数据定制问题提出了面向任务的时空数据应用模型,以任务最小需求为准则对... 针对军事信息系统的作战任务推演需求,提出了一种基于时空事件序列的、较为完备的高效任务推演方法。论述了基于层次化分解的任务表达机制与实体化策略;针对保障数据定制问题提出了面向任务的时空数据应用模型,以任务最小需求为准则对一体化时空数据集进行多维筛选,有效降低数据的冗余度;详细讨论了时空事件序列模型的定义及其在军事任务推演中的数据驱动模式;结合具体仿真实例进行了应用探讨。原型系统的实现证明了该思路的有效性和可行性。 展开更多
关键词 军事信息系统 任务推演 时空数据模型 数据驱动
在线阅读 下载PDF
多核处理器并行编程模型的研究与设计 被引量:17
9
作者 曹折波 李青 《计算机工程与设计》 CSCD 北大核心 2010年第13期2999-3002,3056,共5页
为了在多核处理器上充分利用多核资源以提升程序性能,研究了多核处理器的体系结构和多核环境下可能影响并行程序性能的因素,实现了基于任务的并行编程模型。该模型提供了单任务数据并行和多任务并行两种并行处理方式,其中单任务数据并... 为了在多核处理器上充分利用多核资源以提升程序性能,研究了多核处理器的体系结构和多核环境下可能影响并行程序性能的因素,实现了基于任务的并行编程模型。该模型提供了单任务数据并行和多任务并行两种并行处理方式,其中单任务数据并行使用cache块技术划分数据集,多任务并行使用任务密取的任务调度策略。用该模型实现了计算斐波那契数列的递归算法,实验结果表明,使用该模型编写多核并行程序可以达到较高的相对于串行计算的加速比。 展开更多
关键词 多核处理器 并行程序 并行编程模型 cache块技术 任务密取
在线阅读 下载PDF
任务驱动数据挖掘方法的提出及在低阻油层识别中的应用 被引量:3
10
作者 许长福 李雄炎 +2 位作者 谭锋奇 于红岩 李洪奇 《吉林大学学报(地球科学版)》 EI CAS CSCD 北大核心 2012年第1期39-46,共8页
为了解决数据挖掘算法的高效性、工具智能性与所获取知识无效性之间的矛盾,同时使所获取知识能有效地解决地层评价领域中的各种疑难问题,提出任务驱动数据挖掘方法。结合数据挖掘的概念和技术,阐述了任务驱动数据挖掘的概念和基本原理,... 为了解决数据挖掘算法的高效性、工具智能性与所获取知识无效性之间的矛盾,同时使所获取知识能有效地解决地层评价领域中的各种疑难问题,提出任务驱动数据挖掘方法。结合数据挖掘的概念和技术,阐述了任务驱动数据挖掘的概念和基本原理,分为建立数据仓库、数据预处理、选择特征子集、形成模型、模型评估、模型修正和模型发布等7个部分,是一个循环迭代的过程,直到构建能有效解决目标任务的预测模型为止。并以低阻油层的识别为例,详述整个分析处理过程,结合决策树形成的白盒模型和支持向量机构建的黑盒模型综合识别目标区的低阻油层,获得了准确率大于90%的识别效果。 展开更多
关键词 任务驱动数据挖掘 低阻油层 分类算法 决策树 支持向量机 预测模型 储层
在线阅读 下载PDF
数据驱动的过程模型 被引量:5
11
作者 李冰 宁汝新 《机械科学与技术》 CSCD 北大核心 1999年第2期324-326,共3页
产品数据管理应基于集成的产品数据模型的过程模型。该模型不但能够提供产品生命周期中所需的所有产品本身的信息,而且还应包含全生命周期中各相关过程的全部信息,本文从并行工程的基本思想出发,讨论了一种集成的产品模型——数据驱... 产品数据管理应基于集成的产品数据模型的过程模型。该模型不但能够提供产品生命周期中所需的所有产品本身的信息,而且还应包含全生命周期中各相关过程的全部信息,本文从并行工程的基本思想出发,讨论了一种集成的产品模型——数据驱动的过程模型,该模型以过程为核心,以数据为驱动源,对产品开发过程中所涉及的各种信息实现统一、动态的描述和管理。 展开更多
关键词 产品数据管理 并行工程 数据驱动的过程模型
在线阅读 下载PDF
新一代神威处理器上高效任务流并行系统 被引量:1
12
作者 傅游 杜雷明 +1 位作者 高希然 陈莉 《计算机科学》 CSCD 北大核心 2024年第12期137-146,共10页
我国自主研制的新一代神威超级计算机相比前一代的神威太湖之光,具有更强大的内存系统和更高的计算密度,其主力编程模型仍然是块同步(Bulk Synchronous Parallelism,BSP)模型。顺序任务流(Sequential Task Flow,STF)模型基于数据流信息... 我国自主研制的新一代神威超级计算机相比前一代的神威太湖之光,具有更强大的内存系统和更高的计算密度,其主力编程模型仍然是块同步(Bulk Synchronous Parallelism,BSP)模型。顺序任务流(Sequential Task Flow,STF)模型基于数据流信息实现对串行程序的自动任务并行,并通过任务间的细粒度同步实现异步并行,相比于BSP模型的全局同步,并行度更高,负载更均衡。STF模型为用户高效使用神威平台提供了一种新选择。但在众核系统上,STF模型的运行时开销会直接影响并行程序性能。首先,分析新一代神威处理器影响STF模型高效实现的两个特征;然后,利用处理器架构的独有特性,提出一种基于代理的数据流构图机制以实现模型的构图需求,以及一种无锁的集中式任务调度机制以优化调度开销。最后,基于以上技术,为AceMesh模型实现了高效的任务流并行系统。实验表明,实现的任务流并行系统相比传统运行时支持优势显著,在细粒度任务场景下最高加速2.37倍;AceMesh性能高于神威平台的OpenACC模型,对典型应用的加速最高达到2.07倍。 展开更多
关键词 顺序任务模型 异构众核并行 任务调度 数据并行 块同步模型
在线阅读 下载PDF
基于智能优化算法引擎的可演进星群智能任务规划
13
作者 杜永浩 黎磊 +2 位作者 徐世龙 陈名 陈盈果 《电子与信息学报》 北大核心 2025年第6期1645-1657,共13页
自21世纪以来,我国航天事业快速发展,遥感卫星已成为国土资源普查以及防灾减灾的关键资源。然而,点群、多频和大区域等复杂目标需求的涌现、卫星资源的差异化以及多类复杂目标一体化调度,对现有卫星任务规划技术提出了挑战。针对该问题... 自21世纪以来,我国航天事业快速发展,遥感卫星已成为国土资源普查以及防灾减灾的关键资源。然而,点群、多频和大区域等复杂目标需求的涌现、卫星资源的差异化以及多类复杂目标一体化调度,对现有卫星任务规划技术提出了挑战。针对该问题,该文设计了一种可演进星群智能任务规划引擎架构,以解决异构星群多元目标的一体化调度问题。通过深入研究模型与算法,实现了“约束-决策-收益”模型的解耦,开发了“全局演化+局部搜索+数据驱动”的优化算法模块。在模型层面,通过目标分解来生成标准任务,并构建了多元复杂目标调度模型。在算法层面,提出了一种基于双模型演化的学习型模因算法(LMA),包括初始解生成策略、全局优化策略及通用化邻域搜索算子模板,增强了解的多样性和全局探索能力。此外,通过数据驱动优化策略和动态多阶段快速插入策略满足了动态调度需求。实验结果表明,该算法在求解质量和速度上均优于经典算法和先进算法,并具有良好的鲁棒性。消融实验验证了初始解生成策略、双模型演进及数据驱动策略的有效性。在不同难度的场景中,该算法能够快速提供高质量的调度方案,展示了其在航天任务调度中的应用潜力。 展开更多
关键词 数据驱动优化 多维复杂目标 学习型模因算法 模型-算法解耦合 星群任务规划
在线阅读 下载PDF
采用数据驱动机制的多核处理器 被引量:2
14
作者 毕卓 徐云川 王镇 《上海交通大学学报》 EI CAS CSCD 北大核心 2013年第1期81-85,共5页
针对当前工艺条件下多核处理器存在程序并行性不足的问题,设计了一种采用数据驱动机制、支持函数语言风格编程的多核处理器,包括通用处理器核、数据驱动模块和片内路由器.其中:通用处理器核用于执行常规程序;数据驱动模块用于检测数据... 针对当前工艺条件下多核处理器存在程序并行性不足的问题,设计了一种采用数据驱动机制、支持函数语言风格编程的多核处理器,包括通用处理器核、数据驱动模块和片内路由器.其中:通用处理器核用于执行常规程序;数据驱动模块用于检测数据的完备性;片内路由器则可提供处理器核之间及簇之间的通信.实验结果表明,所设计的多核处理器能够支持C语言"函数式语言"风格的编程模板.每个C代码段执行纯函数的操作,消除了函数间的共享变量,使得并行编程的复杂度有所降低.同时,所采用的数据驱动机制没有执行顺序的严格限制,充分挖掘了算法潜在的并行性.经测试,数据驱动多核处理器的加速比随着计算资源的增加而增大,从而验证了数据流计算机的加速倍数随处理器数目增加而线性增长的结论. 展开更多
关键词 数据驱动 并行编程模型 数据流机 多核处理器
在线阅读 下载PDF
面向国产高性能众核处理器的编程模型
15
作者 陈虎 周鹏灵 《计算机应用》 CSCD 北大核心 2023年第11期3517-3526,共10页
在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一... 在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一方面基于消息队列机制开发国产高性能众核处理器的线程级并行机制;另一方面基于单指令多数据流(SIMD)编程模型开发从核上的数据级并行性。首先,对国产高性能众核处理器体系结构进行抽象;其次,设计模型的消息队列机制,并为程序员提供一套异构并行编程接口,如系统参数接口、从核线程控制接口、消息队列接口、SIMD抽象接口;最后,在上述基础上形成全新的高性能计算软件开发模型和方法,方便用户开发基于国产高性能众核处理器的并行计算软件。性能传输测试结果表明,在国产众核处理器上,当启动核数较少时,所提模型的传输带宽普遍达到了峰值直接内存访问(DMA)带宽的90%;当启动的核数较多时,消息队列模型的传输带宽普遍达到了峰值DMA带宽的70%。在矩阵乘法实验中,与系统原语传输矩阵并计算的性能相比,所提模型的性能达到前者的90%;在口令猜测系统中,所提模型的代码性能与直接使用最底层的接口开发的代码性能基本持平。所提通用编程模型和支撑框架使高性能计算(HPC)软件开发更简易,并且具有更好的可移植性,可为促进国产自主HPC软件研发提供帮助。 展开更多
关键词 国产众核处理器 单指令多数据 并行编程模型 SW26010 消息队列模型
在线阅读 下载PDF
UPPA:面向异构众核系统的统一并行编程架构 被引量:5
16
作者 吴树森 董小社 +2 位作者 王宇菲 王龙翔 朱正东 《计算机学报》 EI CSCD 北大核心 2020年第6期990-1009,共20页
主流异构并行编程方法如CUDA和OpenCL,其编程抽象层次低,编程接口靠近底层,无法为用户屏蔽底层硬件和运行时细节,导致编程逻辑复杂,编程困难易错.同时应用性能绑定于底层运行时环境,在硬件架构变化时需要根据硬件特征进行针对性改动和优... 主流异构并行编程方法如CUDA和OpenCL,其编程抽象层次低,编程接口靠近底层,无法为用户屏蔽底层硬件和运行时细节,导致编程逻辑复杂,编程困难易错.同时应用性能绑定于底层运行时环境,在硬件架构变化时需要根据硬件特征进行针对性改动和优化,无法保证上层应用的统一.为了简化异构并行编程,提高编程效率,实现上层应用的统一和跨平台,本文提出了一种面向异构众核系统的高层统一并行编程架构UPPA(Unified Parallel Programming Architecture).架构中首先提出了数据关联计算编程模型,实现了不同层级不同模式并行性的统一描述,简化了异构并行编程逻辑,提供了高层统一的并行编程抽象;继而设计了数据关联计算描述语言为用户提供简便易用的统一编程接口,通过高层语义结构保留了应用的并行特征,可以指导编译和运行时系统实现向不同硬件架构的自动映射,保证了上层应用的统一,并采用C语言兼容的语法提供针对高层语义结构的语言扩展,保证编程接口的易学易用;最后提供了基于OpenCL的编译和运行时原型系统,以OpenCL为中间语言实现了高层应用在不同异构系统上的执行,提供了良好的跨平台特性.我们使用数据关联计算描述语言对Parboil和Rodinia测试集中的多个测试用例进行了重构,并在NVIDIA GPU和Intel MIC两种异构平台上进行了验证测试.每个测试用例重构的代码量与测试集提供的串行代码相当,仅为测试集OpenCL代码的13%~64%,有效地降低了异构编程的工作量.在编译和运行时系统的支持下,重构代码无需改动就可以在两种平台上执行.相比于人工编写且经过优化的测试集OpenCL代码,重构代码在GPU和MIC两种平台下分别能够达到其性能的91%~100%和76%~98%,这表明了本文方法的有效性和编译与运行时系统的高效. 展开更多
关键词 异构并行编程 数据关联计算 并行编程模型 统一编程架构 OPENCL
在线阅读 下载PDF
基于多谓词选择的海量XML数据并行查询方法 被引量:3
17
作者 闫威 马宗民 《小型微型计算机系统》 CSCD 北大核心 2015年第7期1415-1420,共6页
为了解决海量XML数据查询的问题,提出了MapReduce编程模型下多谓词选择的查询处理方法.该方法并行查询海量XML数据,产生的并行查询结果满足用户给定的多谓词查询要求.提出海量XML数据的存储方法,将海量XML数据划分为众多XML数据块存储到... 为了解决海量XML数据查询的问题,提出了MapReduce编程模型下多谓词选择的查询处理方法.该方法并行查询海量XML数据,产生的并行查询结果满足用户给定的多谓词查询要求.提出海量XML数据的存储方法,将海量XML数据划分为众多XML数据块存储到HDFS中.提出MapReduce编程模型下基于多谓词选择的Map逻辑算法和Reduce逻辑算法,实现海量XML数据的并行查询处理.进一步提出基于多谓词选择的MapReduce查询优化方法,减少系统的数据传输量,提高了系统的性能.最后,通过实验验证了所提方法的有效性. 展开更多
关键词 海量XML数据 MapReduce编程模型 多谓词选择 并行查询
在线阅读 下载PDF
流处理器结构上数据并行类应用的开发和评估 被引量:1
18
作者 王其刚 安虹 +2 位作者 徐光 周丽萍 汪芳 《小型微型计算机系统》 CSCD 北大核心 2008年第9期1698-1703,共6页
流处理器体系结构是一种针对流应用中固有的计算和数据流动特点提出的一种新型的处理器体系结构,它结合了向量和超长指令字体系结构的特点,能有效地加速流应用的执行,而它的适用领域一直是当前国际上的热点讨论问题.本文从数据并行应用... 流处理器体系结构是一种针对流应用中固有的计算和数据流动特点提出的一种新型的处理器体系结构,它结合了向量和超长指令字体系结构的特点,能有效地加速流应用的执行,而它的适用领域一直是当前国际上的热点讨论问题.本文从数据并行应用4个不同领域——数字信号处理、科学计算、网络和安全、以及多媒体处理选取了4个典型应用,详细剖析了这些应用在流体系结构上的流并行程序设计过程,归纳出数据并行类应用的流化步骤和方法,通过实验对这类应用在流体系结构上的适用性做出评估. 展开更多
关键词 数据并行应用 编程模型 适用性
在线阅读 下载PDF
一种类数据流驱动的可重构众核流处理器设计 被引量:1
19
作者 许牧 安虹 +1 位作者 汤旭龙 周伟 《小型微型计算机系统》 CSCD 北大核心 2013年第6期1359-1364,共6页
传统的片上多核结构存在着计算资源粒度固定的缺点,无法满足应用在不同阶段对计算资源的差异化需求.针对上述问题,本文设计了运行时逻辑核可调整的可重构众核流处理器及流程序映射方案,以期满足应用各个阶段对计算资源的需求,且不造成... 传统的片上多核结构存在着计算资源粒度固定的缺点,无法满足应用在不同阶段对计算资源的差异化需求.针对上述问题,本文设计了运行时逻辑核可调整的可重构众核流处理器及流程序映射方案,以期满足应用各个阶段对计算资源的需求,且不造成资源浪费.通过在时钟精确软件模拟器上评估不同类型应用的性能表现,分析了处理器主要设计参数对性能的影响.实验结果表明,与具有同样计算资源的固定粒度流处理器相比,本文设计的可重构众核流处理器能够获得10%-30%的性能提升. 展开更多
关键词 可重构 众核处理器 数据驱动 编程模型
在线阅读 下载PDF
基于异构GPU集群的并行分布式编程解决方案 被引量:1
20
作者 李佳佳 胡新明 吴百锋 《计算机应用与软件》 CSCD 北大核心 2014年第9期28-31,176,共5页
由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU已经成为超级计算机和高性能计算(HPC)集群的主流加速器。随着处理单元的发展和集群节点的拓展,GPU集群不仅在节点层面呈现异构化,节点内也趋于异构化,大大... 由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU已经成为超级计算机和高性能计算(HPC)集群的主流加速器。随着处理单元的发展和集群节点的拓展,GPU集群不仅在节点层面呈现异构化,节点内也趋于异构化,大大提高了在GPU集群中编程的复杂度。主流GPU异构集群系统大多采用针对GPU的异构计算编程模型与面向分布式内存的消息传递模型的简单结合方式,这种方式使得GPU集群程序设计缺乏确定的准则,往往是低效而且易错的。为了提高在GPU集群中编程的效率,降低编程复杂度,以及实现平台无关性,提出一套异构GPU集群的并行分布式编程的解决方案。该方案通过采用扩展语言方法提出了编程框架DISPAR,并实现了预处理器系统StreamCC。实验证明了其可行性。 展开更多
关键词 GPU集群 编程模型 数据并行
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部