期刊文献+
共找到653篇文章
< 1 2 33 >
每页显示 20 50 100
Windows下基于ProActive并行计算的关键技术 被引量:8
1
作者 董明刚 梁正友 《计算机工程》 EI CAS CSCD 北大核心 2006年第19期105-107,共3页
针对现有并行计算技术的不足,提出了基于ProActive的Windows平台下的并行计算方法,对Windows平台下并行计算的结构、节点的动态部署、并行程序设计方法、并行任务调度等关键技术进行了研究,并初步实现了一个系统原型。实验证明该方案是... 针对现有并行计算技术的不足,提出了基于ProActive的Windows平台下的并行计算方法,对Windows平台下并行计算的结构、节点的动态部署、并行程序设计方法、并行任务调度等关键技术进行了研究,并初步实现了一个系统原型。实验证明该方案是可行的和有效的。 展开更多
关键词 proactive 并行程序设计 SSH 动态部署
在线阅读 下载PDF
基于ProActive的容错调度器设计与实现
2
作者 梁正友 孙宇 《计算机应用》 CSCD 北大核心 2008年第2期371-373,共3页
在分布式计算系统中保证并行应用计算的正确性及提高计算系统中动态资源的利用率是一个重要的研究问题。在原有的基于ProActive的并行计算平台上,引入呼吸通信机制、故障节点发现机制和子任务重新调度机制,设计和实现了一个容错调度系... 在分布式计算系统中保证并行应用计算的正确性及提高计算系统中动态资源的利用率是一个重要的研究问题。在原有的基于ProActive的并行计算平台上,引入呼吸通信机制、故障节点发现机制和子任务重新调度机制,设计和实现了一个容错调度系统。实验表明该调度器在部分节点出现故障的情况下,能保证并行计算的正确性,并具有较好的性能。 展开更多
关键词 并行计算 调度 容错 proactive
在线阅读 下载PDF
基于ProActive的分布式并行WebSpider设计
3
作者 张林才 梁正友 《计算机工程》 CAS CSCD 北大核心 2008年第19期47-48,52,共3页
单机Web Spider的数据采集速度较慢,采用MPI技术或直接用Java开发分布式Web Spider代价较高。该文利用ProActive中间件提供的主动对象技术、网络并行计算技术、自动部署机制设计实现了P-Spider分布式并行Web Spider。实验结果表明,该P-S... 单机Web Spider的数据采集速度较慢,采用MPI技术或直接用Java开发分布式Web Spider代价较高。该文利用ProActive中间件提供的主动对象技术、网络并行计算技术、自动部署机制设计实现了P-Spider分布式并行Web Spider。实验结果表明,该P-Spider采集速率是单机多线程Web Spider的2.2倍。 展开更多
关键词 WEB Spider程序 proactive中间件 并行 分布式
在线阅读 下载PDF
Programming for scientific computing on peta-scale heterogeneous parallel systems 被引量:1
4
作者 杨灿群 吴强 +2 位作者 唐滔 王锋 薛京灵 《Journal of Central South University》 SCIE EI CAS 2013年第5期1189-1203,共15页
Peta-scale high-perfomlance computing systems are increasingly built with heterogeneous CPU and GPU nodes to achieve higher power efficiency and computation throughput. While providing unprecedented capabilities to co... Peta-scale high-perfomlance computing systems are increasingly built with heterogeneous CPU and GPU nodes to achieve higher power efficiency and computation throughput. While providing unprecedented capabilities to conduct computational experiments of historic significance, these systems are presently difficult to program. The users, who are domain experts rather than computer experts, prefer to use programming models closer to their domains (e.g., physics and biology) rather than MPI and OpenME This has led the development of domain-specific programming that provides domain-specific programming interfaces but abstracts away some performance-critical architecture details. Based on experience in designing large-scale computing systems, a hybrid programming framework for scientific computing on heterogeneous architectures is proposed in this work. Its design philosophy is to provide a collaborative mechanism for domain experts and computer experts so that both domain-specific knowledge and performance-critical architecture details can be adequately exploited. Two real-world scientific applications have been evaluated on TH-IA, a peta-scale CPU-GPU heterogeneous system that is currently the 5th fastest supercomputer in the world. The experimental results show that the proposed framework is well suited for developing large-scale scientific computing applications on peta-scale heterogeneous CPU/GPU systems. 展开更多
关键词 heterogeneous parallel system programming framework scientific computing GPU computing molecular dynamic
在线阅读 下载PDF
基于天河互连的并行文件系统网络驱动
5
作者 董勇 邬会军 +3 位作者 杨梨花 张伟 王睿伯 周恩强 《计算机工程与科学》 北大核心 2025年第3期392-399,共8页
并行文件系统是高性能计算机系统软件栈的重要组成部分。面向高速网络的驱动是并行文件系统提供高效数据访问的关键环节。设计实现了基于天河高速互连网络TH-Express的并行文件网络驱动GLND,在并行化、通信协议以及容错3方面进行了有针... 并行文件系统是高性能计算机系统软件栈的重要组成部分。面向高速网络的驱动是并行文件系统提供高效数据访问的关键环节。设计实现了基于天河高速互连网络TH-Express的并行文件网络驱动GLND,在并行化、通信协议以及容错3方面进行了有针对性的优化,采用VP粒度并行,配合适度均衡的流水线划分,实现了高吞吐率;根据消息大小差异等因素自适应地选择底层通信协议,实现NUMA感知的内存管理机制;通过自适应调节的超时机制来避免软件异常超时对通信操作的影响。实验结果表明,在相同硬件条件下,GLND相比于TCP的写带宽平均提升了23.69%,读带宽平均提升了79.25%。 展开更多
关键词 并行文件系统 互连网络 网络编程接口
在线阅读 下载PDF
分布存储并行程序变异算子有效性评估
6
作者 田甜 王苗苗 +1 位作者 李成龙 巩敦卫 《电子学报》 北大核心 2025年第3期864-877,共14页
变异测试通过注入变异算子生成变异体模拟软件中的潜在缺陷,是提高软件质量的关键技术.大量变异体及其执行成本制约着变异测试的研究进展和在工业领域的应用.选择有效的变异算子是减少变异体数量的主要途径.针对分布存储并行程序,本文... 变异测试通过注入变异算子生成变异体模拟软件中的潜在缺陷,是提高软件质量的关键技术.大量变异体及其执行成本制约着变异测试的研究进展和在工业领域的应用.选择有效的变异算子是减少变异体数量的主要途径.针对分布存储并行程序,本文提出变异算子有效性评价准则.从顽固变异体、崩溃变异体和等价变异体3个方面对变异体进行分类;基于不同变异体对测试数据质量的影响,定义变异算子有效性评价准则,分析不同变异算子的有效性.实验结果表明,使用本文提出的评价准则能够选择合理的变异算子,基于这些变异算子能够生成更多的有效变异体和尽可能少的无效变异体,在保持变异测试有效性的前提下,平均减少了22.61%的变异体,提高了变异测试效率. 展开更多
关键词 分布存储 并行程序 变异测试 变异算子 变异体
在线阅读 下载PDF
基于强化学习与遗传算法的机器人并行拆解序列规划方法 被引量:2
7
作者 汪开普 马晓艺 +2 位作者 卢超 殷旅江 李新宇 《国防科技大学学报》 北大核心 2025年第2期24-34,共11页
在拆解序列规划问题中,为了提高拆解效率、降低拆解能耗,引入了机器人并行拆解模式,构建了机器人并行拆解序列规划模型,并设计了基于强化学习的遗传算法。为了验证模型的正确性,构造了混合整数线性规划模型。算法构造了基于目标导向的... 在拆解序列规划问题中,为了提高拆解效率、降低拆解能耗,引入了机器人并行拆解模式,构建了机器人并行拆解序列规划模型,并设计了基于强化学习的遗传算法。为了验证模型的正确性,构造了混合整数线性规划模型。算法构造了基于目标导向的编解码策略,以提高初始解的质量;采用Q学习来选择算法迭代过程中的最佳交叉策略和变异策略,以增强算法的自适应能力。在一个34项任务的发动机拆解案例中,通过与四种经典多目标算法对比,验证了所提算法的优越性;分析所得拆解方案,结果表明机器人并行拆解模式可以有效缩短完工时间,并降低拆解能耗。 展开更多
关键词 拆解序列规划 机器人并行拆解 混合整数线性规划模型 遗传算法 强化学习
在线阅读 下载PDF
面向国产异构众核系统的Parallel C语言设计与实现 被引量:10
8
作者 何王全 刘勇 +2 位作者 方燕飞 魏迪 漆锋滨 《软件学报》 EI CSCD 北大核心 2017年第4期764-785,共22页
异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、... 异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、提升并行程序的性能都具有重要的意义.提出统一架构的多模式并行编程模型,包括异构融合的加速运算模型和按同构方式编程的自主运算模型,根据编程模型设计了Parallel C语言,能够有效地描述国产众核系统的异构并行性.与其他众核系统上MPI+X的使用模式相比,编程和系统优化都具有全局视角,在多级局部性描述、单边消息、兼容已有多核应用等方面具有特色;基于Open64构建了Parallel C编译系统,全面支持加速运算模型和自主运算模型,提出并实现了数据布局与自动DMA、编译指导的线程代理和拓扑位置感知的集合通信等优化.Micro Benchmark和实际应用在神威太湖之光计算机系统上的测试数据结果表明:Parallel C语言和编译系统具有良好的性能和可扩展性,能够有效支撑大型应用. 展开更多
关键词 异构众核 编程模型 并行语言 parallel C 编译器 消息传递
在线阅读 下载PDF
基于并行化分解与闭环修正的含氢综合能源系统运行优化
9
作者 柴纪强 刘洪 +2 位作者 吴一恒 何星瑭 王国栋 《电力系统及其自动化学报》 北大核心 2025年第11期105-114,共10页
针对含氢综合能源系统(integrated energysystem,IES)长周期运行优化中其混合整数线性规划(mixed-integer linearprogramming,MILP)模型存在因布尔变量规模庞大导致的“组合爆炸”问题,提出一种基于并行化分解与闭环修正的运行优化方法... 针对含氢综合能源系统(integrated energysystem,IES)长周期运行优化中其混合整数线性规划(mixed-integer linearprogramming,MILP)模型存在因布尔变量规模庞大导致的“组合爆炸”问题,提出一种基于并行化分解与闭环修正的运行优化方法。首先,构建了含氢IES多能耦合的长周期经济运行模型。其次,提出一种精度无损的两阶段迭代求解方法:主阶段利用储能荷电状态(state-of-charge,SOC)序列将大规模长周期MILP模型分解为多个并行可解的小规模子问题,显著降低计算复杂度并释放硬件并行潜力;子阶段基于主阶段输出的布尔变量构建线性规划模型,快速修正储能SOC参考轨迹并反馈。仿真结果表明,该方法有效平衡了含氢IES中长期优化问题的计算效率与优化精度(误差低于0.01%),同时保留了源荷全时序精确耦合特性,弥补了传统典型日法或启发式算法的精度损失。 展开更多
关键词 含氢综合能源系统 混合整数线性规划 并行化分解 高精度求解
在线阅读 下载PDF
基于并行计算的轨迹快速优化方法研究
10
作者 王天一 赵吉松 《西北工业大学学报》 北大核心 2025年第4期659-667,共9页
直接配点法通过对控制变量和状态变量都进行离散将轨迹优化问题转化为非线性规划(nonlinear programming, NLP)进行求解。在求解NLP时,需要反复计算NLP的一阶/二阶偏导数和动力学系统在各离散点处的值,计算量比较大。针对该问题,提出如... 直接配点法通过对控制变量和状态变量都进行离散将轨迹优化问题转化为非线性规划(nonlinear programming, NLP)进行求解。在求解NLP时,需要反复计算NLP的一阶/二阶偏导数和动力学系统在各离散点处的值,计算量比较大。针对该问题,提出如下解决策略:引入超对偶数方法准确识别NLP二阶偏导数矩阵的稀疏型,确定其中非零元素的位置;采用多核并行方式快速计算NLP的一阶/二阶偏导数的非零元素以及动力学系统在各离散点处的值;在C++环境下采用OpenMP方式进行编程计算,从编程语言角度进一步提高计算效率。仿真结果表明,文中方法给出的策略在不影响精度的情况下,均能显著提高轨迹优化效率。 展开更多
关键词 轨迹优化 非线性规划 稀疏 超对偶数 并行计算
在线阅读 下载PDF
Two-phase heuristic for vehicle routing problem with drones in multi-trip and multi-drop mode
11
作者 MA Huawei HU Xiaoxuan ZHU Waiming 《Journal of Systems Engineering and Electronics》 2025年第4期1024-1036,共13页
As commercial drone delivery becomes increasingly popular,the extension of the vehicle routing problem with drones(VRPD)is emerging as an optimization problem of inter-ests.This paper studies a variant of VRPD in mult... As commercial drone delivery becomes increasingly popular,the extension of the vehicle routing problem with drones(VRPD)is emerging as an optimization problem of inter-ests.This paper studies a variant of VRPD in multi-trip and multi-drop(VRP-mmD).The problem aims at making schedules for the trucks and drones such that the total travel time is minimized.This paper formulate the problem with a mixed integer program-ming model and propose a two-phase algorithm,i.e.,a parallel route construction heuristic(PRCH)for the first phase and an adaptive neighbor searching heuristic(ANSH)for the second phase.The PRCH generates an initial solution by con-currently assigning as many nodes as possible to the truck–drone pair to progressively reduce the waiting time at the rendezvous node in the first phase.Then the ANSH improves the initial solution by adaptively exploring the neighborhoods in the second phase.Numerical tests on some benchmark data are conducted to verify the performance of the algorithm.The results show that the proposed algorithm can found better solu-tions than some state-of-the-art methods for all instances.More-over,an extensive analysis highlights the stability of the pro-posed algorithm. 展开更多
关键词 vehicle routing problem with drones(VRPD) mixed integer program parallel route construction heuristic(PRCH) adaptive neighbor searching heuristic(ANSH).
在线阅读 下载PDF
基于月度电量数据自适应伪增强的多海上风电场联合竞价博弈模型
12
作者 符杨 李仪 +3 位作者 葛晓琳 凡婉秋 魏书荣 刘璐洁 《电力自动化设备》 北大核心 2025年第1期1-8,共8页
为降低随机性导致海上风电参与中长期电力市场竞争时面临的电量风险,提出一种基于月度电量数据自适应伪增强的多海上风电场中长期联合竞价博弈模型。考虑多海上风电场月度电量空间相关性对联合竞价策略的影响,利用带有自适应伪增强机制... 为降低随机性导致海上风电参与中长期电力市场竞争时面临的电量风险,提出一种基于月度电量数据自适应伪增强的多海上风电场中长期联合竞价博弈模型。考虑多海上风电场月度电量空间相关性对联合竞价策略的影响,利用带有自适应伪增强机制的生成对抗网络模拟多海上风电场月度电量预测误差场景,以增强小样本的多样性并减少对抗生成网络的过拟合现象;针对计及空间相关性与合作成本导致联盟收益函数不满足超可加性的问题,引入最优联盟结构的概念以求得总收益最大的联盟划分方式,并利用并行处理与联盟有效拆分的概念对求解算法进行改进,提高了执行效率;在分配联盟收益时,考虑到Shapley值法不能体现成员的真实贡献与重要程度,引入图合作博弈中的A-T解对分配方案进行改进,避免了不满足超可加性联盟的收益参与分配的问题。算例仿真结果验证了所提模型与方法的优越性以及收益分配方案的合理性。 展开更多
关键词 海上风电 电力市场 生成对抗网络 合作博弈 并行动态规划 A-T解
在线阅读 下载PDF
一种异构多核系统动态调度协处理器设计
13
作者 曾树铭 倪伟 《合肥工业大学学报(自然科学版)》 北大核心 2025年第2期185-195,共11页
为研究异构多核片上系统(multi-processor system on chip,MPSoC)在密集并行计算任务中的潜力,文章设计并实现了一种适用于粗粒度数据特征、面向任务级并行应用的异构多核系统动态调度协处理器,采用了片上缓存、任务输出的多级写回管理... 为研究异构多核片上系统(multi-processor system on chip,MPSoC)在密集并行计算任务中的潜力,文章设计并实现了一种适用于粗粒度数据特征、面向任务级并行应用的异构多核系统动态调度协处理器,采用了片上缓存、任务输出的多级写回管理、任务自动映射、通讯任务乱序执行等机制。实验结果表明,该动态调度协处理器不仅能够实现任务级乱序执行等基本设计目标,还具有极低的调度开销,相较于基于动态记分牌算法的调度器,运行多个子孔径距离压缩算法的时间降低达17.13%。研究结果证明文章设计的动态调度协处理器能够有效优化目标场景下的任务调度效果。 展开更多
关键词 动态调度 硬件调度器 异构多核系统 任务级并行 编程模型 片上缓存 片上网络
在线阅读 下载PDF
Implementing Higher-Order Gamma on a Massively Parallel computer-A Case study
14
作者 Linpeng Huang Kam Wing Ng, Yongqiang Sun(Department of Computer Science and EngineeringShanghai Jiao Tong University, Shanghai 200030, P. R. China)(Department of Computer Science, The Chinese University of Hong Kong, Hong Kong) 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 1995年第3期56-62,共7页
Gamma is a kernel programming language with an elegant chemical reaction metaphor in whichprograms are described in terms of multiset rewriting. Gamma formalism allows one to describe analgorithm without introducing a... Gamma is a kernel programming language with an elegant chemical reaction metaphor in whichprograms are described in terms of multiset rewriting. Gamma formalism allows one to describe analgorithm without introducing artificial sequentiality and leads to the derivation of a parallel solution to agiven problem naturally. However, the difficulty of incorporating control strategies makes Gamma not onlyhard for one to define any sophisticated approaches but also impossible to reach a decent level of efficiencyin any direct implementation. Recently, a higherorder multiset programming paradigm, named higher--order Gamma, is introduced by Metayer to alleviate these problems. In this paper, we investigate the possibility of implementing higherorder Gamma on Maspar, a massively data parallel computer. The results showthat a program written in higher--order Gamma can be transformed naturally toward an efficientimplementation on a real parallel machine. 展开更多
关键词 Massively parallel Computation GAMMA programming paradigm
在线阅读 下载PDF
A Trace-state Based Approach to Specification and Design of Parallel Programs
15
作者 He Jifeng Oxford University Computing LaboratoryProgramming Research Group Parks Road, Oxford OXl 3QD, England 《计算机工程》 CAS CSCD 北大核心 1996年第S1期91-105,共15页
In this paper they deal with the issue of specification and design of parallel communicatingprocesses. A trace-state based model is introduced to describe the behaviour of concurrent programs. They presenta formal sys... In this paper they deal with the issue of specification and design of parallel communicatingprocesses. A trace-state based model is introduced to describe the behaviour of concurrent programs. They presenta formal system based on that model to achieve hierarchical and modular development and verification methods. Anumber of refinement rules are used to decompose the specification into smaller ones and calculate program fromthe 展开更多
关键词 COMM A Trace-state Based Approach to Specification and Design of parallel Programs
在线阅读 下载PDF
平行流交叉口车道控制与信号配时组合优化 被引量:4
16
作者 宋浪 王健 +1 位作者 杨璐 安实 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第8期1647-1658,共12页
为了提升平行流交叉口实际应用的灵活性,提出车道控制与信号配时组合优化方法,将单向、非对称双向、对称双向、三向、四向设置与布设方向组合共16种方案整合到优化模型中,通过修正交通冲突矩阵自动生成相位相序方案.构建混合整数线性规... 为了提升平行流交叉口实际应用的灵活性,提出车道控制与信号配时组合优化方法,将单向、非对称双向、对称双向、三向、四向设置与布设方向组合共16种方案整合到优化模型中,通过修正交通冲突矩阵自动生成相位相序方案.构建混合整数线性规划模型,实现交叉口设置方案选择、车道分配和信号配时的组合优化.结果表明,在各种流量场景下,对称双向、三向、四向设置方案相较于常规交叉口分别能够提升约20%、20%、50%的通行能力,单向、非对称双向设置方案通行能力与常规交叉口接近,说明平行流交叉口不宜采用单向、非对称双向设置.四向设置方案通行能力的提升幅度最大,最大值能达到70.51%.对称双向和三向设置方案的通行能力提升相差不大,但三向设置在不对称流量场景中的表现优于对称双向设置. 展开更多
关键词 交通工程 控制方法 混合整数线性规划 平行流交叉口 移位左转
在线阅读 下载PDF
面向GPU并行编程的线程同步综述 被引量:3
17
作者 高岚 赵雨晨 +2 位作者 张伟功 王晶 钱德沛 《软件学报》 EI CSCD 北大核心 2024年第2期1028-1047,共20页
并行计算已成为主流趋势.在并行计算系统中,同步是关键设计之一,对硬件性能的充分利用至关重要.近年来,GPU(graphic processing unit,图形处理器)作为应用最为广加速器得到了快速发展,众多应用也对GPU线程同步提出更高要求.然而,现有GP... 并行计算已成为主流趋势.在并行计算系统中,同步是关键设计之一,对硬件性能的充分利用至关重要.近年来,GPU(graphic processing unit,图形处理器)作为应用最为广加速器得到了快速发展,众多应用也对GPU线程同步提出更高要求.然而,现有GPU系统却难以高效地支持真实应用中复杂的线程同步.研究者虽然提出了很多支持GPU线程同步的方法并取得了较大进展,但GPU独特的体系结构及并行模式导致GPU线程同步的研究仍然面临很多挑战.根据不同的线程同步目的和粒度对GPU并行编程中的线程同步进行分类.在此基础上,围绕GPU线程同步的表达和执行,首先分析总结GPU线程同步存在的难以高效表达、错误频发、执行效率低的关键问题及挑战;而后依据不同的GPU线程同步粒度,从线程同步表达方法和性能优化方法两个方面入手,介绍近年来学术界和产业界对GPU线程竞争同步及合作同步的研究,对现有研究方法进行分析与总结.最后,指出GPU线程同步未来的研究趋势和发展前景,并给出可能的研究思路,从而为该领域的研究人员提供参考. 展开更多
关键词 通用图形处理器(GPGPU) 并行编程 线程同步 性能优化
在线阅读 下载PDF
一种面向舰船结构毁伤的大变形流固耦合数值计算方法 被引量:5
18
作者 王杰 王景焘 +3 位作者 黄超 伍洋 刘娜 张磐 《计算力学学报》 CAS CSCD 北大核心 2024年第2期335-343,共9页
水下爆炸导致舰船结构毁伤是一个复杂的非线性大变形流固耦合过程,高精度的流固耦合计算是获得高置信模拟结果的关键。基于浸没边界思想,本文提出一种面向大变形壳理论的流固耦合数值方法,可精确刻画流固耦合界面并高效求解流固界面约... 水下爆炸导致舰船结构毁伤是一个复杂的非线性大变形流固耦合过程,高精度的流固耦合计算是获得高置信模拟结果的关键。基于浸没边界思想,本文提出一种面向大变形壳理论的流固耦合数值方法,可精确刻画流固耦合界面并高效求解流固界面约束方程。基于该方法,本文提出了完整的适用于水下爆炸舰船结构毁伤的大变形流固耦合数值计算方案,并基于大规模并行编程框架,研发形成适用于舰船结构毁伤的流固耦合大规模并行计算软件。与泰勒平板理论解和水下爆炸结构冲击响应实验数据等进行对比表明,本文方法可有效模拟大变形流固耦合工程问题,具备较高数值求解精度。在此基础上,完成了水下爆炸整船结构毁伤过程大规模数值模拟。该方法可有效应用于舰船毁伤等级评估,应用前景广阔。 展开更多
关键词 大变形流固耦合 浸没边界法 舰船结构毁伤 并行编程框架
在线阅读 下载PDF
一类加工需要额外资源的平行机调度问题的算法设计
19
作者 江明月 简苏平 +2 位作者 崔晓龙 万龙 董建明 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2024年第3期321-327,335,共8页
给出了一类加工需要额外资源的平行机调度问题的精确算法。针对在平行机上加工的工件,除需要机器资源外,还需要一个单位额外资源的问题,考虑额外资源的种类和数量有限,以给出问题的最优调度使工件的完工时间最小为目标。该问题源于地球... 给出了一类加工需要额外资源的平行机调度问题的精确算法。针对在平行机上加工的工件,除需要机器资源外,还需要一个单位额外资源的问题,考虑额外资源的种类和数量有限,以给出问题的最优调度使工件的完工时间最小为目标。该问题源于地球观测卫星的数据下载,在智能制造和信息处理等领域亦有广泛应用。给出了该问题的整数规划模型、最优解下界和分支定界算法;给出了一种有效的分支策略以避免重复分支,设计了相应的定界方法以提高算法的收敛速度。通过小规模实例和大量的数值仿真实验,验证了算法的正确性和在不同参数配置下的有效性。 展开更多
关键词 平行机调度问题 额外资源 整数规划模型 分支定界算法
在线阅读 下载PDF
基于采样的并行程序性能测量分析工具研究
20
作者 胡家瑞 石京燕 郭超奇 《计算机工程与应用》 CSCD 北大核心 2024年第21期286-296,共11页
在实际运行中,并行计算程序的性能常常在理论峰值与预期存在较大差距。使用性能分析工具进行程序调优是解决这一问题的高效手段。然而,程序员和开发者在使用性能分析工具时往往面临选择困难、配置和使用复杂等挑战。研究基于采样的并行... 在实际运行中,并行计算程序的性能常常在理论峰值与预期存在较大差距。使用性能分析工具进行程序调优是解决这一问题的高效手段。然而,程序员和开发者在使用性能分析工具时往往面临选择困难、配置和使用复杂等挑战。研究基于采样的并行程序性能分析工具有助于解决上述问题。相比于插桩技术,基于异步采样的性能工具可以更好地控制测量开销和测量数据大小。着重研究了三种典型的基于采样的性能分析工具:VTune Profiler、HPCToolkit和Nsight Systems,分析了其原理和功能,并且结合VASP等实际应用程序对工具的软硬件分析能力和并行编程分析能力进行了详细的探究和对比。根据这些工具在不同的应用场景下表现出的不同适用性和分析效果,提出了综合运用多种工具进行性能分析的方案,为开发者和程序员提供有益的参考。 展开更多
关键词 性能分析工具 异步采样 硬件性能计数器 并行程序 程序调优
在线阅读 下载PDF
上一页 1 2 33 下一页 到第
使用帮助 返回顶部