检索结果-维普期刊中文期刊服务平台

一种面向异构并行系统的最大功耗管理方法被引量：3: 1; 作者王桂彬杜静唐滔《软件学报》 EI CSCD 北大核心 2013年第10期2460-2472,共13页; 高功耗已成为制约高性能计算机发展的重要问题之一.近年来,大量研究关注于如何在满足系统功耗约束的条件下优化系统执行性能.然而,已有方法大都针对同构系统,未考虑异构处理器之间的功耗或速度差异,难以高效应用于基于加速器的异构系统... 展开更多; 关键词异构并行系统最大功耗管理任务调度动态电压频率调节; 在线阅读下载PDF 职称材料

面向国产异构DCU平台的大规模并行矩量法研究被引量：1: 2; 作者贾瑞鹏林中朝 +2 位作者左胜张玉杨美红《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期76-83,共8页; 面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配... 展开更多; 关键词高阶矩量法国产异构并行系统深度计算处理器异构协同并行计算; 在线阅读下载PDF 职称材料

并行异构系统中的一种高效任务调度算法被引量：4: 3; 作者蒋韵联孙广中许胤龙《计算机工程》 CAS CSCD 北大核心 2007年第11期39-41,共3页; 并行分布计算是当前计算机科学的热点之一。调度算法是影响分布式计算的关键因素,也是一个具有挑战性的课题。调度算法是将有通信关系的任务按顺序分配给不同的处理器。提出了一种基于区间插入和任务复制的高效启发式算法,通过对各种随... 展开更多; 关键词异构并行系统启发式算法任务复制; 在线阅读下载PDF 职称材料

基于通信感知任务划分的异构系统低功耗优化方法: 4; 作者王桂彬《小型微型计算机系统》 CSCD 北大核心 2011年第12期2504-2510,共7页; 针对由通用微处理器和专用加速部件构成的异构并行系统,提出结合通信感知的并行任务划分和动态电压频率调节技术的异构系统能耗优化方法,该方法旨在将并行任务图划分并映射在异构处理单元,在满足性能约束的条件下最小化系统能耗.在目前... 展开更多; 关键词低功耗优化异构并行系统任务划分动态电压频率调节; 在线阅读下载PDF 职称材料

异构系统雷达任务调度算法仿真被引量：1: 5; 作者展红英王磊曹建蜀《小型微型计算机系统》 CSCD 北大核心 2014年第5期1137-1141,共5页; 针对传统单处理器处理复杂多样雷达任务效果欠佳问题,提出在分布式异构系统中结合改进指派算法和匈牙利算法的优点并行调度雷达任务的算法.在原始指派问题每次给每个处理器指派一项任务基础上,改进算法引入处理器雷达任务堆积量实时检... 展开更多; 关键词分布式异构系统并行调度匈牙利算法负载平衡任务堆积量阈值负载实时检测; 在线阅读下载PDF 职称材料

CPU-GPU系统中基于剖分的全局性能优化方法被引量：10: 6; 作者张保董小社 +3 位作者白秀秀曹海军刘超梅一多《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第2期17-23,共7页; 针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优... 展开更多; 关键词 CPU-GPU异构并行系统全局优化 3级优化 3级剖分; 在线阅读下载PDF 职称材料

Programming for scientific computing on peta-scale heterogeneous parallel systems 被引量：1: 7; 作者杨灿群吴强 +2 位作者唐滔王锋薛京灵《Journal of Central South University》 SCIE EI CAS 2013年第5期1189-1203,共15页; Peta-scale high-perfomlance computing systems are increasingly built with heterogeneous CPU and GPU nodes to achieve higher power efficiency and computation throughput. While providing unprecedented capabilities to co... 展开更多; 关键词 heterogeneous parallel system programming framework scientific computing GPU computing molecular dynamic; 在线阅读下载PDF 职称材料

题名一种面向异构并行系统的最大功耗管理方法被引量：3: 1; 作者王桂彬杜静唐滔; 机构国防科学技术大学计算机学院电子信息系统复杂电磁环境效应国家重点实验室; 出处《软件学报》 EI CSCD 北大核心 2013年第10期2460-2472,共13页; 基金国家高技术研究发展计划(863)(2012AA01A301) 国家重点基础研究发展计划(973)(2011CB309705-1) +1 种基金国家自然科学基金(60903059 61303063); 文摘高功耗已成为制约高性能计算机发展的重要问题之一.近年来,大量研究关注于如何在满足系统功耗约束的条件下优化系统执行性能.然而,已有方法大都针对同构系统,未考虑异构处理器之间的功耗或速度差异,难以高效应用于基于加速器的异构系统.对当前异构并行系统执行模型进行了抽象,并提出了融合两级功耗控制机制的系统功耗管理框架,自顶向下依次为系统级功耗控制器和异构处理引擎功耗控制器.在异构处理引擎功耗控制中,针对类OpenMP并行循环,首先分析了异构多处理器在满足功耗约束条件下达到性能最优的条件.基于该结果,给出了功耗受限的并行循环划分算法,该方法通过协调并行循环调度和动态电压频率调节技术以优化异构并行处理.在系统级功耗控制中,建立了异构处理引擎效能评估方法,以此作为功耗划分的依据,在兼顾并发应用公平性的同时,提高系统整体执行效能.最后,基于典型CPU-GPU异构系统验证了方法的有效性.; 关键词异构并行系统最大功耗管理任务调度动态电压频率调节; Keywords heterogeneous parallel system peak power management task scheduling dynamic voltage/frequency scaling; 分类号 TP302 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名面向国产异构DCU平台的大规模并行矩量法研究被引量：1: 2; 作者贾瑞鹏林中朝左胜张玉杨美红; 机构西安电子科技大学电子工程学院齐鲁工业大学计算机科学与技术学院; 出处《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期76-83,共8页; 基金陕西省重点研发计划(2023-ZDLGY-09,2022ZDLGY02-01,2021GXLH-02) 中央高校基本科研业务费专项资金(QTZX23018)。; 文摘面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配的问题,实现了矩量法异构并行计算过程的负载均衡。采用细粒度任务划分策略与异步通信技术,对深度计算处理器计算过程进行了流水线优化设计,实现了计算与通信重叠,提升了矩量法异构协同计算的效率。通过与有限元法的仿真结果对比,验证了CPU+DCU异构并行矩量法的准确性。基于国产深度计算处理器异构平台的可扩展性分析结果表明,与单纯CPU计算相比,所实现的CPU+DCU异构协同计算方法能够获得5.5~7.0倍的加速效果,且在国家超级计算西安中心能够实现全系统运行,并行规模从360节点扩展到3 600节点(共1 036 800个处理器核心),并行效率可以达到约73.5%。; 关键词高阶矩量法国产异构并行系统深度计算处理器异构协同并行计算; Keywords method of moments domestic heterogeneous platforms deep computing unit(DCU) parallel algorithm; 分类号 TN820 [电子电信—信息与通信工程]; 在线阅读下载PDF 职称材料

题名并行异构系统中的一种高效任务调度算法被引量：4: 3; 作者蒋韵联孙广中许胤龙; 机构中国科学技术大学计算机科学与技术系高性能计算与应用省部共建重点实验室; 出处《计算机工程》 CAS CSCD 北大核心 2007年第11期39-41,共3页; 基金国家自然科学基金资助重点项目(60533020); 文摘并行分布计算是当前计算机科学的热点之一。调度算法是影响分布式计算的关键因素,也是一个具有挑战性的课题。调度算法是将有通信关系的任务按顺序分配给不同的处理器。提出了一种基于区间插入和任务复制的高效启发式算法,通过对各种随机任务图和高斯迭代任务图进行模拟,与已有算法相比,新算法的效率有很大的提高。; 关键词异构并行系统启发式算法任务复制; Keywords Heterogeneous parallel system Heuristic algorithm Task duplication; 分类号 TP301 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名基于通信感知任务划分的异构系统低功耗优化方法: 4; 作者王桂彬; 机构国防科学技术大学计算机学院并行与分布处理国家重点实验室; 出处《小型微型计算机系统》 CSCD 北大核心 2011年第12期2504-2510,共7页; 基金国家自然科学基金项目(60921062)资助; 文摘针对由通用微处理器和专用加速部件构成的异构并行系统,提出结合通信感知的并行任务划分和动态电压频率调节技术的异构系统能耗优化方法,该方法旨在将并行任务图划分并映射在异构处理单元,在满足性能约束的条件下最小化系统能耗.在目前典型异构并行系统中,主处理器与加速部件大都通过系统总线连接,必然引入不可忽略的通信开销,因此通信感知的任务划分技术是该问题的关键.提出了基于整数线性规划的静态最优能耗优化方法和基于遗传算法的动态能耗优化方法.并通过一个典型科学计算应用验证了本文方法的有效性.; 关键词低功耗优化异构并行系统任务划分动态电压频率调节; Keywords low-power optimization heterogeneous parallel system task partition dynamic voltage and frequency scaling; 分类号 TP314 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名异构系统雷达任务调度算法仿真被引量：1: 5; 作者展红英王磊曹建蜀; 机构电子科技大学电子科学技术研究院; 出处《小型微型计算机系统》 CSCD 北大核心 2014年第5期1137-1141,共5页; 基金中央高校科研基本业务费(ZYGX2011J130)资助; 文摘针对传统单处理器处理复杂多样雷达任务效果欠佳问题,提出在分布式异构系统中结合改进指派算法和匈牙利算法的优点并行调度雷达任务的算法.在原始指派问题每次给每个处理器指派一项任务基础上,改进算法引入处理器雷达任务堆积量实时检测技术,设定处理器任务堆积量阈值,每次对空闲的和任务堆积量小于阈值的节点分配任务,其它处理节点不分配.对不同任务堆积量阈值和不同处理性能差别的集群利用改进算法仿真并与原始算法仿真结果对比,改进算法明显缩短了任务处理时间,改进了系统环境负载平衡,且对处理性能差别较大的集群雷达任务并行调度改进效果更好.; 关键词分布式异构系统并行调度匈牙利算法负载平衡任务堆积量阈值负载实时检测; Keywords parallel scheduling in distributed heterogeneous systems Hungarian algorithm load balancing task accumulation thresh-old workload real-time detection; 分类号 TP338 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名CPU-GPU系统中基于剖分的全局性能优化方法被引量：10: 6; 作者张保董小社白秀秀曹海军刘超梅一多; 机构西安交通大学电子与信息工程学院; 出处《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第2期17-23,共7页; 基金国家高技术研究发展计划资助项目(2009AA01A135 2009AA01Z108) 中央高校基本科研业务费专项资金资助项目(08142007); 文摘针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优化过程划分为访存级、内核加速级和数据划分级3级优化;针对3级优化剖分工具库提供了3级剖分机制,通过运行时的剖分技术获取剖分信息;策略配置模块根据所获取的信息指导用户在每级优化中选择合适的优化策略.实验证明,基于剖分的全局性能优化方法可以明确地指导将应用移植到CPU-GPU异构并行系统上的全局优化过程,利用该优化方法后,以矩阵相乘和傅里叶变换为例的应用性能提升明显,最终性能相对于访存级优化最高可提高30%左右.; 关键词 CPU-GPU异构并行系统全局优化 3级优化 3级剖分; Keywords CPU-GPU heterogeneous parallel system global optimization third-level optimization third-level profiling; 分类号 TP399 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名Programming for scientific computing on peta-scale heterogeneous parallel systems 被引量：1: 7; 作者杨灿群吴强唐滔王锋薛京灵; 机构 State Key Laboratory of High Performance Computing(National University of Defense Technology) School of Computer Science and Engineering; 出处《Journal of Central South University》 SCIE EI CAS 2013年第5期1189-1203,共15页; 基金 Project(61170049) supported by the National Natural Science Foundation of China Project(2012AA010903) supported by the National High Technology Research and Development Program of China; 文摘 Peta-scale high-perfomlance computing systems are increasingly built with heterogeneous CPU and GPU nodes to achieve higher power efficiency and computation throughput. While providing unprecedented capabilities to conduct computational experiments of historic significance, these systems are presently difficult to program. The users, who are domain experts rather than computer experts, prefer to use programming models closer to their domains （e.g., physics and biology） rather than MPI and OpenME This has led the development of domain-specific programming that provides domain-specific programming interfaces but abstracts away some performance-critical architecture details. Based on experience in designing large-scale computing systems, a hybrid programming framework for scientific computing on heterogeneous architectures is proposed in this work. Its design philosophy is to provide a collaborative mechanism for domain experts and computer experts so that both domain-specific knowledge and performance-critical architecture details can be adequately exploited. Two real-world scientific applications have been evaluated on TH-IA, a peta-scale CPU-GPU heterogeneous system that is currently the 5th fastest supercomputer in the world. The experimental results show that the proposed framework is well suited for developing large-scale scientific computing applications on peta-scale heterogeneous CPU/GPU systems.; 关键词 heterogeneous parallel system programming framework scientific computing GPU computing molecular dynamic; Keywords 计算系统科学应用异构系统 PETA 编程模型并行系统超级计算机领域专家; 分类号 TP338.6 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	一种面向异构并行系统的最大功耗管理方法	王桂彬杜静唐滔	《软件学报》 EI CSCD 北大核心	2013	3	在线阅读下载PDF 职称材料
2	面向国产异构DCU平台的大规模并行矩量法研究	贾瑞鹏林中朝左胜张玉杨美红	《西安电子科技大学学报》 EI CAS CSCD 北大核心	2024	1	在线阅读下载PDF 职称材料
3	并行异构系统中的一种高效任务调度算法	蒋韵联孙广中许胤龙	《计算机工程》 CAS CSCD 北大核心	2007	4	在线阅读下载PDF 职称材料
4	基于通信感知任务划分的异构系统低功耗优化方法	王桂彬	《小型微型计算机系统》 CSCD 北大核心	2011	0	在线阅读下载PDF 职称材料
5	异构系统雷达任务调度算法仿真	展红英王磊曹建蜀	《小型微型计算机系统》 CSCD 北大核心	2014	1	在线阅读下载PDF 职称材料
6	CPU-GPU系统中基于剖分的全局性能优化方法	张保董小社白秀秀曹海军刘超梅一多	《西安交通大学学报》 EI CAS CSCD 北大核心	2012	10	在线阅读下载PDF 职称材料
7	Programming for scientific computing on peta-scale heterogeneous parallel systems	杨灿群吴强唐滔王锋薛京灵	《Journal of Central South University》 SCIE EI CAS	2013	1	在线阅读下载PDF 职称材料