期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于值-剖面的OpenMP运行时优化系统
1
作者 黄春 杨学军 《计算机工程与科学》 CSCD 2006年第12期124-128,共5页
本文设计并实现了一个基于值-剖面的Open MP运行时优化系统CCRG OpenMP。它能够根据常见的值的组合优化并行区域,并且在运行时只有并行区代码需要重编译和管理。CCRG OpenMP基于动态重编译技术,避免了目前静态多版本技术的不足。同时,值... 本文设计并实现了一个基于值-剖面的Open MP运行时优化系统CCRG OpenMP。它能够根据常见的值的组合优化并行区域,并且在运行时只有并行区代码需要重编译和管理。CCRG OpenMP基于动态重编译技术,避免了目前静态多版本技术的不足。同时,值-剖面的收集和分析由独立的动态优化器线程完成,降低了动态重编译引入的开销。SPEC OMP2001基准测试表明,我们基于值-剖面的Open MP优化系统能够较大地提高程序性能。 展开更多
关键词 OPENMP 值-剖面 运行时优化
在线阅读 下载PDF
数据流Java并行程序设计模型的设计、实现及运行时优化 被引量:6
2
作者 刘弢 范彬 +1 位作者 吴承勇 张兆庆 《软件学报》 EI CSCD 北大核心 2008年第9期2181-2190,共10页
提出了一种具有数据流特征的Java并行程序设计模型,并针对该模型提出了一种基于运行时信息反馈的自适应优化算法,使得运行时系统可以利用数据流程序所暴露出的数据并行性,加速程序的运行.此外,在该模型中加入了数据流多态的概念,扩展了... 提出了一种具有数据流特征的Java并行程序设计模型,并针对该模型提出了一种基于运行时信息反馈的自适应优化算法,使得运行时系统可以利用数据流程序所暴露出的数据并行性,加速程序的运行.此外,在该模型中加入了数据流多态的概念,扩展了该模型的面向对象特性.在一个实际的开放源码Java虚拟机中实现了上述程序设计模型及优化方法.在实际多核多线程机器上的实验结果表明,所提出的程序设计模型及优化能够充分利用硬件的并行处理能力,显著地提高了程序的性能. 展开更多
关键词 数据流 并行程序设计模型 可管理运行环境 运行时优化
在线阅读 下载PDF
减小运行时优化开销的方法 被引量:1
3
作者 郭振宇 刘利 +1 位作者 陈彧 汤志忠 《计算机工程》 EI CAS CSCD 北大核心 2006年第24期63-65,120,共4页
运行时优化在程序运行期间,根据采集到的相关信息,确定程序的热点并进行优化,从而加速程序的执行。然而,运行时优化本身有一定的开销,有时候会抵消甚至超出优化得到的效果。该文设计和实现了一个基于SMP/IPF(英特尔安腾系列)/Linux架构... 运行时优化在程序运行期间,根据采集到的相关信息,确定程序的热点并进行优化,从而加速程序的执行。然而,运行时优化本身有一定的开销,有时候会抵消甚至超出优化得到的效果。该文设计和实现了一个基于SMP/IPF(英特尔安腾系列)/Linux架构的自适应二进制代码优化/编译框架,其中包含了运行时优化。分析了运行时优化的阶段和开销,并介绍了在设计和实现该框架的过程中,为减小这种开销所提出的思路和采用的方法。 展开更多
关键词 运行时优化 优化开销 持续优化
在线阅读 下载PDF
一种集成于超算作业调度系统应用的并行参数优化方法
4
作者 张文帅 李会民 +1 位作者 李京 潘必才 《计算机工程》 北大核心 2025年第7期59-67,共9页
随着高性能计算体系结构的发展,软件与硬件都具有多层的并行结构。当不同纵向层级与横向分组的计算任务被划分到不同节点的不同处理器时,存在非常多的分配方式。这些分配方式一般在运行时由用户输入的多个并行参数来确定,并对计算效率... 随着高性能计算体系结构的发展,软件与硬件都具有多层的并行结构。当不同纵向层级与横向分组的计算任务被划分到不同节点的不同处理器时,存在非常多的分配方式。这些分配方式一般在运行时由用户输入的多个并行参数来确定,并对计算效率影响很大。随着计算规模与复杂度的提升,多个并行参数的可配置空间越来越大,用户越来越难以确定最佳的并行参数值。这类运行时优化问题在科学计算应用中较为普遍,但相关的研究与解决方法比较少见。以VASP(Vienna Ab initio Simulation Package)应用为例,首先分析了该应用的多层并行结构,展示了不同并行参数配置引发的巨大运行速度差异。然后提出了一个基于约化并行效率指标的全自动运行优化方法,其不仅可以帮助用户简单快捷地确定最佳应用并行参数,而且可以帮助用户确定最佳的计算资源使用量,使应用可以高效率地扩展到大规模的并行计算中。最后将该优化方法与计算集群作业调度系统相融合应用于用户提交的真实VASP计算作业。统计结果表明,该方法显著提升了作业运行速度与超算资源的使用效率,具有很好的工程应用前景。 展开更多
关键词 并行计算 作业调度 运行时优化 超级计算 VASP应用
在线阅读 下载PDF
多核机群下基于神经网络的MPI运行时参数优化 被引量:3
5
作者 王洁 曾宇 张建林 《计算机科学》 CSCD 北大核心 2010年第6期229-232,共4页
多核处理器的新特性给MPI应用带来了新的优化空间,其中调优MPI运行时参数被证明是优化MPI应用的有效方法。然而最优的运行时参数不仅与多核机群的体系结构有关,也决定于MPI应用的程序特征。提出并分析了一种在给定多核机群下基于人工神... 多核处理器的新特性给MPI应用带来了新的优化空间,其中调优MPI运行时参数被证明是优化MPI应用的有效方法。然而最优的运行时参数不仅与多核机群的体系结构有关,也决定于MPI应用的程序特征。提出并分析了一种在给定多核机群下基于人工神经网络的优化模型,用于自动为未知的MPI程序预测接近最优的运行时参数。两个不同基准的实验证明了本方法的有效性。实验证明,基于本方法得到的运行时参数所产生的加速比平均达到了实际最大加速比的95%以上。 展开更多
关键词 多核机群 MPI 运行参数优化 神经网络
在线阅读 下载PDF
CUDA程序到Cell平台的源代码移植
6
作者 岳峰 庞建民 +1 位作者 张一弛 余勇 《计算机工程》 CAS CSCD 2012年第24期279-282,共4页
相对于传统的串行程序移植,并行系统间的代码移植因体系结构间的巨大差异而变得极为复杂。为此,针对统一计算设备架构(CUDA)程序向其他异构多核平台的移植,提出CUDA架构到Cell的映射方案。通过模型映射、并行粒度提升、共享变量清除和... 相对于传统的串行程序移植,并行系统间的代码移植因体系结构间的巨大差异而变得极为复杂。为此,针对统一计算设备架构(CUDA)程序向其他异构多核平台的移植,提出CUDA架构到Cell的映射方案。通过模型映射、并行粒度提升、共享变量清除和运行时优化,使CUDA程序的大规模并行线程可以在Cell平台上正确执行。实验结果证明,翻译后的程序在Cell的执行效率可达到Cell平台上手动编写程序的72%。 展开更多
关键词 源代码移植 异构多核 模型映射 共享变量清除 运行时优化
在线阅读 下载PDF
面向E级计算的功耗管理技术 被引量:3
7
作者 高剑刚 龚道永 +5 位作者 吴伟 郑岩 朱琪 王飞 郑方 金利峰 《计算机学报》 EI CAS CSCD 北大核心 2022年第7期1373-1383,共11页
E级计算机的构建面临严峻的“功耗墙”问题.为了应对功耗挑战,本文面向神威E级系统提出了一套低功耗管理体系.该体系采用软硬件协同的多层次低功耗管理机制,主要技术包括高能效基础设施设计、低功耗编译优化和细粒度功耗运行时管理,在... E级计算机的构建面临严峻的“功耗墙”问题.为了应对功耗挑战,本文面向神威E级系统提出了一套低功耗管理体系.该体系采用软硬件协同的多层次低功耗管理机制,主要技术包括高能效基础设施设计、低功耗编译优化和细粒度功耗运行时管理,在系统功耗量化监测技术支撑下实现软硬件协同能耗控制集成,具有功能层次多、覆盖面广、节能效果明显的特点.本文基于神威E级原型超级计算机进行了系统验证,实验结果证明本文提出的低功耗管理体系能够显著降低系统功耗,并且可扩展性良好,在大规模系统中具有广泛的适应性,能够支撑E级计算机绿色运行. 展开更多
关键词 E级计算机 异构众核处理器 功耗管理 编译优化 运行时优化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部