期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
异构计算系统中能量感知利润最大化在线算法 被引量:1
1
作者 张庆辉 李伟东 张学杰 《郑州大学学报(理学版)》 CAS 北大核心 2024年第1期47-52,共6页
异构计算系统中的任务调度仅以能耗优化为目标,往往会忽略最大完工时间带来的负面影响。此外,庞大的机器与任务数量为调度决策带来了极大的时间成本。以异构计算系统管理者单位时间收益最大化为目标,建立了考虑任务包的能量感知利润最... 异构计算系统中的任务调度仅以能耗优化为目标,往往会忽略最大完工时间带来的负面影响。此外,庞大的机器与任务数量为调度决策带来了极大的时间成本。以异构计算系统管理者单位时间收益最大化为目标,建立了考虑任务包的能量感知利润最大化问题模型,并为之设计了一种高效的在线算法。每到达一个用户,该在线算法能够通过系统当前状态构造多个线性方程组,并求得利润最大的解,即当前用户提交任务的分配策略。同时计算了该算法的运行时间复杂度为O(nm 4)。通过与另外两种常用算法进行对比,提出的在线算法能够在多项式时间内,得到目标值拟最优的调度方案。 展开更多
关键词 异构计算系统 作业调度 能量感知 负载均衡 任务包
在线阅读 下载PDF
异构计算系统中弹性节能调度策略研究 被引量:12
2
作者 朱晓敏 贺川 +1 位作者 王建江 江建清 《计算机学报》 EI CSCD 北大核心 2012年第6期1313-1326,共14页
目前,节能已成为异构计算系统中减少电量开销、提高系统可靠性和保护环境的重要研究内容.传统的节能调度策略侧重于研究如何节能而忽略了用户对任务完成时间的期望,使得任务执行效果受到较大影响.特别是当系统负载较重时,由于电压调节... 目前,节能已成为异构计算系统中减少电量开销、提高系统可靠性和保护环境的重要研究内容.传统的节能调度策略侧重于研究如何节能而忽略了用户对任务完成时间的期望,使得任务执行效果受到较大影响.特别是当系统负载较重时,由于电压调节缺乏自适应性,导致在某些情况下(如应急服务)的任务执行效果不可容忍.文中提出一种弹性节能调度策略(Elastic Energy-Aware Scheduling,EEAS),用于动态调度异构计算系统中非周期、独立任务.EEAS策略根据系统负载情况在系统节能与用户期望之间进行权衡,即当系统负载较重时,EEAS优先考虑用户期望,通过动态调整计算节点局部队列中等待任务的执行电压提高任务完成率;当系统负载较轻时,EEAS在尽量满足用户期望的基础上最大限度地降低任务执行电压以实现节能.文中通过大量的模拟实验比较了EEAS、GEA、HVEA和LVEA的性能.实验结果表明,EEAS的调度质量优于其他策略,可有效提高系统弹性. 展开更多
关键词 异构计算系统 调度 节能 弹性 动态电压调整
在线阅读 下载PDF
异构计算系统任务调度的遗传算法及改进 被引量:11
3
作者 王小英 赵海 +3 位作者 陈英革 张文波 尹震宇 张晓丹 《系统仿真学报》 EI CAS CSCD 北大核心 2006年第1期26-32,共7页
提出一种新的染色体编码方法——逆排序消出结点法RSEEN,确保染色体对应的任务分配调度为合理调度,不必在遗传操作过程中不断地验证和调整基因以保证染色体的有效性,简化了遗传操作,使优良基因更易保全并传递给后代,种群的进化过程更接... 提出一种新的染色体编码方法——逆排序消出结点法RSEEN,确保染色体对应的任务分配调度为合理调度,不必在遗传操作过程中不断地验证和调整基因以保证染色体的有效性,简化了遗传操作,使优良基因更易保全并传递给后代,种群的进化过程更接近自然的进化法则。另外,还采用了启发式变异方法,加速了算法的收敛性。同时,构造本算法是以异构计算系统模型为基础的,充分考虑了任务间数据交换的开销和处理机间的差异,算法的应用更有普遍意义。 展开更多
关键词 任务调度 异构计算系统 遗传算法 染色体编码 逆排序消出结点法
在线阅读 下载PDF
异构计算系统中独立任务调度的混合遗传算法 被引量:9
4
作者 钟一文 杨建刚 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2004年第11期1080-1083,共4页
有效的任务调度是异构计算系统获取高性能的关键因素之一 ,由于任务调度问题是NP 困难的 ,为了获取尽可能好的解 ,文献中存在许多启发式调度算法 .针对异构计算系统的独立任务调度问题 ,基于遗传算法和最小完成时间算法MCT(MinimumCompl... 有效的任务调度是异构计算系统获取高性能的关键因素之一 ,由于任务调度问题是NP 困难的 ,为了获取尽可能好的解 ,文献中存在许多启发式调度算法 .针对异构计算系统的独立任务调度问题 ,基于遗传算法和最小完成时间算法MCT(MinimumCompletionTime) ,提出一种新的混合遗传算法 ,它采用遗传算法来进化任务调度的优先队列 ,然后再使用MCT算法把优先队列解码为一个有效的调度 ,与文献中其它算法进行比较表明 ,它不但能产生更好的调度结果 ,而且有很好的收敛速度 . 展开更多
关键词 独立任务调度 异构计算系统 混合遗传算法 最小完成时间
在线阅读 下载PDF
异构计算系统的任务调度算法SMT-GA 被引量:7
5
作者 陆鑫达 郑飞 陈楚询 《小型微型计算机系统》 CSCD 北大核心 1999年第4期241-245,共5页
给出一种对异构计算系统(HCS)进行任务映射与调度的遗传算法——SMT-GA算法.首先对HCS任务调度问题作出形式描述,然后分别介绍SMT-GA算法的总体框架,染色体设计,从染色体获取调度方案的方法,染色体适合度函数... 给出一种对异构计算系统(HCS)进行任务映射与调度的遗传算法——SMT-GA算法.首先对HCS任务调度问题作出形式描述,然后分别介绍SMT-GA算法的总体框架,染色体设计,从染色体获取调度方案的方法,染色体适合度函数设计,交叉与变异遗传操作算子设计等.最后给出算法实现情况及实验结果分析与结论等. 展开更多
关键词 异构计算系统 任务调度 SMT-GA 算法
在线阅读 下载PDF
异构计算系统的三元模型与性能分析 被引量:3
6
作者 郑飞 陆鑫达 《上海交通大学学报》 EI CAS CSCD 北大核心 1997年第8期12-15,共4页
基于异构计算系统(HCS)体系结构的双层异构性,提出一种描述HCS体系结构的三元模型,其本质是对HCS各类性能模型作出划分.推导并分析HCS〈0,2*。
关键词 性能分析 三元模型 计算机网络 异构计算系统
在线阅读 下载PDF
同型异构计算系统的加速比模型 被引量:2
7
作者 郑飞 陆鑫达 《软件学报》 EI CSCD 北大核心 1997年第A00期434-440,共7页
本文提出同型异构计算系统HCS-MOST的概念,并利用作者最近提出的描述异构计算系统HCS体系结构的三元模型将它划分为3大子类。
关键词 加速比 异构计算系统 计算机网络
在线阅读 下载PDF
一种异构计算系统中考虑通信冲突的有效任务调度算法
8
作者 万剑怡 孙永强 薛锦云 《小型微型计算机系统》 CSCD 北大核心 2002年第2期133-135,共3页
任务调度是异构计算的核心问题之一 .现有的异构计算系统的任务调度算法基本上没有考虑任务通信时可能在同一通道中发生冲突的情况 ,因而造成任务调度的结果与实际运行结果之间的差异 .本文提出了一种异构计算系统中的基于表调度 (list ... 任务调度是异构计算的核心问题之一 .现有的异构计算系统的任务调度算法基本上没有考虑任务通信时可能在同一通道中发生冲突的情况 ,因而造成任务调度的结果与实际运行结果之间的差异 .本文提出了一种异构计算系统中的基于表调度 (list scheduling)的启发式任务调度算法 ,该算法考虑了任务通信中通道冲突的情况 ,在不提高算法复杂度的同时提高了任务调度的性能 . 展开更多
关键词 异构计算系统 启发式算法 通信冲突 有效任务调度算法 计算
在线阅读 下载PDF
异构计算系统的表调度式任务映射与调度算法
9
作者 陆鑫达 郑飞 《上海交通大学学报》 EI CAS CSCD 北大核心 1998年第10期53-57,共5页
研究了在异构计算系统(HCS)中利用表调度式算法进行任务映射与调度.给出两种异构静态优先级表调度式任务映射算法(HSP和GHSP),以及一种异构动态优先级表调度式任务映射算法(BHDP).实验结果表明,GHSP算法对... 研究了在异构计算系统(HCS)中利用表调度式算法进行任务映射与调度.给出两种异构静态优先级表调度式任务映射算法(HSP和GHSP),以及一种异构动态优先级表调度式任务映射算法(BHDP).实验结果表明,GHSP算法对于粗中粒度DAG的调度效果稍好于HSP算法,而BHDP算法对于粗粒度和细粒度DAG的调度效果均明显优于HSP和GHSP算法. 展开更多
关键词 任务映射 任务凋度 异构计算系统 表调度式算法
在线阅读 下载PDF
第Ⅱ类同型异构计算系统的新加速比模型
10
作者 郑飞 陆鑫达 《电子学报》 EI CAS CSCD 北大核心 1999年第5期56-58,65,共4页
我们最近提出了同型异构计算系统HCSMOST的概念,将它划分成三大类,并分别推导出它们的加速比模型.本文采用一种不同的应用任务模型来研究其中的第Ⅱ类HCS〈0,m,0〉系统,得出它的新加速比模型,并以HCS〈0,... 我们最近提出了同型异构计算系统HCSMOST的概念,将它划分成三大类,并分别推导出它们的加速比模型.本文采用一种不同的应用任务模型来研究其中的第Ⅱ类HCS〈0,m,0〉系统,得出它的新加速比模型,并以HCS〈0,18,0〉系统为例,对具有不同并行性分布的计算任务获得的计算结果进行分析讨论. 展开更多
关键词 异构计算系统 性能模型 网络并行计算 HCS-MOST
在线阅读 下载PDF
嵌入式异构智能计算系统的PCIe总线传输带宽优化
11
作者 喻绪邦 吴济文 +2 位作者 夏宏 莫昊 赵二虎 《计算机应用》 北大核心 2025年第9期2913-2918,共6页
近年来随着人工智能(AI)技术的发展,深度学习算法和专用AI处理器芯片已日益广泛地应用于边缘端和物端数据信号处理系统,如何在赋能系统高智能计算能力的同时,实现异构处理器之间高带宽、低延时的数据传输,已成为亟须解决的核心技术之一... 近年来随着人工智能(AI)技术的发展,深度学习算法和专用AI处理器芯片已日益广泛地应用于边缘端和物端数据信号处理系统,如何在赋能系统高智能计算能力的同时,实现异构处理器之间高带宽、低延时的数据传输,已成为亟须解决的核心技术之一。因此,设计一种集成寒武纪MLU220芯片、国产飞腾FT2000/4型CPU和Xilinx XC7K325T现场可编程门阵列(FPGA)的嵌入式异构智能计算系统,系统异构处理器之间采用PCIe(Peripheral Component Interconnect express)总线实现高速互联与数据传输。此外,提出一种Linux下的PCIe总线Scatter-Gather DMA(Direct Memory Access)传输优化技术,通过基于双缓冲的预取技术和基于工作队列的中断处理,有效提高CPU与FPGA异构处理器之间的PCIe总线数据传输带宽。系统图像传输测试结果表明,CPU与FPGA异构处理器之间的PCIe2.0 X4总线传输10张2048×1024灰度图像数据时,所提系统在DMA双通道上的读写速率分别达到了1610 MB/s和1655 MB/s,为PCIe2.0 X4总线理论带宽值的81%和83%,验证了所设计系统的实用性和先进性。 展开更多
关键词 PCIe总线 异构计算系统 Scatter-Gather DMA DMA多通道 图像传输
在线阅读 下载PDF
基于GPU的zk-SNARK中多标量乘法的并行计算方法 被引量:1
12
作者 王锋 柴志雷 +2 位作者 花鹏程 丁冬 王宁 《计算机应用研究》 CSCD 北大核心 2024年第6期1735-1742,共8页
针对zk-SNARK(zero-knowledge succinct non-interactive argument of knowledge)中计算最为耗时的多标量乘法(multiscalar multiplication,MSM),提出了一种基于GPU的MSM并行计算方案。首先,对MSM进行细粒度任务分解,提升算法本身的计... 针对zk-SNARK(zero-knowledge succinct non-interactive argument of knowledge)中计算最为耗时的多标量乘法(multiscalar multiplication,MSM),提出了一种基于GPU的MSM并行计算方案。首先,对MSM进行细粒度任务分解,提升算法本身的计算并行性,以充分利用GPU的大规模并行计算能力。采用共享内存对同一窗口下的子MSM并行规约减少了数据传输开销。其次,提出了一种基于底层计算模块线程级任务负载搜索最佳标量窗口的窗口划分方法,以最小化MSM子任务的计算开销。最后,对标量形式转换所用数据存储结构进行优化,并通过数据重叠传输和通信时间隐藏,解决了大规模标量形式转换过程的时延问题。该MSM并行计算方法基于CUDA在NVIDIA GPU上进行了实现,并构建了完整的零知识证明异构计算系统。实验结果表明:所提出的方法相比目前业界最优的cuZK的MSM计算模块获得了1.38倍的加速比。基于所改进MSM的整体系统比业界流行的Bellman提升了186倍,同时比业界最优的异构版本Bellperson提升了1.96倍,验证了方法的有效性。 展开更多
关键词 简洁非交互式零知识证明 多标量乘法 CUDA 异构计算系统 并行计算
在线阅读 下载PDF
基于多层感知机-注意力模型的功耗预测算法
13
作者 敬超 全育涛 陈艳 《计算机应用》 北大核心 2025年第8期2646-2655,共10页
虽然异构计算系统的应用可以加快神经网络参数的处理,但系统功耗也随之剧增。良好的功耗预测方法是异构系统优化功耗和处理多类型工作负载的基础,基于此,通过改进多层感知机-注意力模型,提出一种面向CPU/GPU异构计算系统多类型工作负载... 虽然异构计算系统的应用可以加快神经网络参数的处理,但系统功耗也随之剧增。良好的功耗预测方法是异构系统优化功耗和处理多类型工作负载的基础,基于此,通过改进多层感知机-注意力模型,提出一种面向CPU/GPU异构计算系统多类型工作负载的功耗预测算法。首先,考虑服务器功耗与系统特征,建立一种基于特征的工作负载功耗模型;其次,针对现有的功耗预测算法不能解决系统特征与系统功耗之间的长程依赖的问题,提出一种改进的基于多层感知机-注意力模型的功耗预测算法Prophet,该算法改进多层感知机实现各个时刻的系统特征的提取,并使用注意力机制综合这些特征,从而有效解决系统特征与系统功耗之间的长程依赖问题;最后,在实际系统中开展相关实验,将所提算法分别与MLSTM_PM(Power consumption Model based on Multi-layer Long Short-Term Memory)和ENN_PM(Power consumption Model based on Elman Neural Network)等功耗预测算法对比。实验结果表明,Prophet具有较高的预测精准性,与MLSTM_PM算法相比,在工作负载blk、memtest和busspd上将平均相对误差(MRE)分别降低了1.22、1.01和0.93个百分点,并且具有较低的复杂度,表明了所提算法的有效性及可行性。 展开更多
关键词 异构计算系统 负载特征 多层感知机 注意力机制 功耗预测
在线阅读 下载PDF
异构系统中的综合性启发式任务调度算法 被引量:2
14
作者 赵欢 江文 李学辉 《计算机应用》 CSCD 北大核心 2010年第5期1316-1320,共5页
任务的单个属性常作为基于优先驱动的表调度算法的优先级,针对这种方法常出现优先级相同的情况,提出一个综合性启发式算法HCPFS。算法分三个优先级选择任务进行调度,从高到低依次为:关键路径上的任务、就绪任务到出口任务的路径长度和... 任务的单个属性常作为基于优先驱动的表调度算法的优先级,针对这种方法常出现优先级相同的情况,提出一个综合性启发式算法HCPFS。算法分三个优先级选择任务进行调度,从高到低依次为:关键路径上的任务、就绪任务到出口任务的路径长度和后继任务数。调度过程中,算法采用任务复制和空闲时间区段任务插入的方法。采用随机生成图法和任务图集进行了算法模拟和比较,实验数据表明HCPFS算法具有更好的调度性能。 展开更多
关键词 异构计算系统 综合性启发式算法 关键路径 任务复制
在线阅读 下载PDF
异构系统中改进的遗传调度算法 被引量:1
15
作者 高原 顾星 +1 位作者 杨群 柯何杨 《计算机工程》 CAS CSCD 2012年第19期142-146,共5页
针对以往调度算法无法准确反映任务的优先级的问题,提出一种改进的遗传调度算法。将任务的ranku属性值应用于染色体的构造方法中,即根据ranku属性值降序排列得到染色体的任务序列,使重要任务优先获得调度,从而得到优质的初始种群,为遗... 针对以往调度算法无法准确反映任务的优先级的问题,提出一种改进的遗传调度算法。将任务的ranku属性值应用于染色体的构造方法中,即根据ranku属性值降序排列得到染色体的任务序列,使重要任务优先获得调度,从而得到优质的初始种群,为遗传算法提供合适的迭代起点。实验结果表明,该算法能有效提高初始种群的质量,获得更好的调度性能。 展开更多
关键词 任务调度 异构计算系统 遗传算法 调度算法 初始种群
在线阅读 下载PDF
基于线程池的GPU任务并行计算模式研究 被引量:23
16
作者 李涛 董前琨 +3 位作者 张帅 孔令晏 康宏 杨愚鲁 《计算机学报》 EI CSCD 北大核心 2018年第10期2175-2192,共18页
GPU已经成为具有高并发高内存带宽的通用协处理器,但是GPU与CPU在体系结构和编程模型上存在很大差异,导致CPU-GPU异构计算系统的编程复杂度提高,即使采用统一计算设备架构(CUDA)提供的kernel并发技术和多流技术也较难充分控制和利用GPU... GPU已经成为具有高并发高内存带宽的通用协处理器,但是GPU与CPU在体系结构和编程模型上存在很大差异,导致CPU-GPU异构计算系统的编程复杂度提高,即使采用统一计算设备架构(CUDA)提供的kernel并发技术和多流技术也较难充分控制和利用GPU上的计算资源,难以有效地处理不规则的并行应用问题.为从体系结构角度探索GPU硬件支持的页锁定内存和统一虚拟地址空间等特征,该文提出了CPU辅助任务调度管理下的基于线程池技术的GPU任务并行计算模型CAGTP,实现了CPU-GPU异构计算系统上的共享内存式程序设计.提出并设计了CPU端的任务队列、计算线程块级任务调度器、任务槽和GPU端的任务复用kernel函数等机制,实现了CPU与GPU间的高效细粒度任务交互,避免了原生CUDA程序中多次启停kernel函数的开销,有效地支持了GPU上的细粒度不规则并行任务计算,而且利用模型API接口函数能够降低CPU-GPU异构计算系统的编程难度.实验结果表明,CAGTP模型中任务调度的开销是kernel函数调用的5%,有效提升了通用矩阵乘、乔列斯基分解和K均值、T近邻等典型线性代数和机器学习算法的计算性能;CAGTP模型易于扩展使用多块GPU,且在性能差异较大的多个GPU之间达到负载均衡,能够高效求解混合任务和具有不规则并行性的应用问题. 展开更多
关键词 异构计算系统 统一计算设备架构 线程池 任务并行 任务复用函数
在线阅读 下载PDF
基于任务复制与预调度的混合列表调度算法
17
作者 严长宇 张磊 《计算机工程》 CAS CSCD 北大核心 2024年第12期124-132,共9页
在异构计算系统中,高效的任务调度算法是实现高性能的重要条件。列表调度算法是一类经典静态启发式算法,用于解决任务调度问题。在异构环境下由于任务的计算成本以及通信成本存在差异,因此任务调度问题比同构系统中更为复杂。该领域的... 在异构计算系统中,高效的任务调度算法是实现高性能的重要条件。列表调度算法是一类经典静态启发式算法,用于解决任务调度问题。在异构环境下由于任务的计算成本以及通信成本存在差异,因此任务调度问题比同构系统中更为复杂。该领域的研究目标主要集中在较低时间复杂度下缩短调度长度。为此,提出一种基于任务复制和预调度的混合列表调度算法DPLS。采用任务复制策略,有选择性地将当前任务的关键前驱任务复制调度至相同的处理器上,减少当前任务对关键前驱任务依赖性数据通信的等待时间,进而缩短任务完成时间。DPLS算法包括预调度和二次调度2个阶段,预调度算法生成基础调度方案,二次调度算法在此基础上尝试生成更优的调度方案,改进任务优先级的计算方式,将任务自身执行成本的影响考虑到优先级计算过程中,使得任务优先级更加合理。实验结果表明,DPLS与经典算法具有相同的时间复杂度,对于n个任务和p个处理器的时间复杂度为O(n^(2)·p),能够生成调度长度更短的方案,相较于HEFT和PEFT分别实现了12.563%和7.786%的性能提升。 展开更多
关键词 任务调度 异构计算系统 任务复制 预调度 列表调度
在线阅读 下载PDF
基于动态适应度的独立任务调度算法 被引量:4
18
作者 王秀丽 宁正元 《计算机应用》 CSCD 北大核心 2006年第12期3001-3003,共3页
在分析现有启发式调度算法的优缺点的基础上,综合考虑负载平衡和使尽可能多的任务调度到更适合它的机器上,提出了基于动态适应度(DFD)的调度算法,任务的DFD描述了最早完成时间所在机器对任务的适应程度,本算法以任务的DFD为优先级,优先... 在分析现有启发式调度算法的优缺点的基础上,综合考虑负载平衡和使尽可能多的任务调度到更适合它的机器上,提出了基于动态适应度(DFD)的调度算法,任务的DFD描述了最早完成时间所在机器对任务的适应程度,本算法以任务的DFD为优先级,优先调度DFD高的任务。与参考文献中其他算法进行比较表明,本算法能产生更好的调度结果。 展开更多
关键词 异构计算系统 独立任务调度 动态适应度 最早完成时间
在线阅读 下载PDF
基于CMP+GPU的并行离散事件仿真技术初探 被引量:1
19
作者 姚益平 唐文杰 +1 位作者 廖建 蔡斐华 《系统仿真学报》 CAS CSCD 北大核心 2014年第8期1627-1632,共6页
随着应用的不断深入,仿真对计算机综合性能的要求越来越高。异构计算系统的出现为并行离散事件仿真带来了重要的机遇和挑战,如何高效充分利用系统资源,提高仿真运行效率成为当前亟待解决的关键问题。从技术角度介绍了利用CMP和GPU进行... 随着应用的不断深入,仿真对计算机综合性能的要求越来越高。异构计算系统的出现为并行离散事件仿真带来了重要的机遇和挑战,如何高效充分利用系统资源,提高仿真运行效率成为当前亟待解决的关键问题。从技术角度介绍了利用CMP和GPU进行并行仿真加速的研究进展,分析了传统高性能仿真技术难以充分利用异构计算系统资源的问题,在此基础上就如何利用异构计算系统进行并行离散事件仿真提出了具体建议和展望。 展开更多
关键词 并行离散事件仿真 CMP GPU 异构计算系统
在线阅读 下载PDF
动态自由节点滞后的任务调度算法
20
作者 王涛 曾志文 陈志刚 《计算机工程》 CAS CSCD 北大核心 2009年第12期38-40,共3页
任务调度是异构计算系统的核心问题之一。调度问题是一个NP完全问题,为获得次优解,出现了很多启发式的算法。分析表调度的典型算法,发现存在一些不足,提出一种新的方法——动态自由节点滞后调度算法,采用动态判断自由节点并对它们滞后调... 任务调度是异构计算系统的核心问题之一。调度问题是一个NP完全问题,为获得次优解,出现了很多启发式的算法。分析表调度的典型算法,发现存在一些不足,提出一种新的方法——动态自由节点滞后调度算法,采用动态判断自由节点并对它们滞后调度,让对任务图调度长度影响更大的节点被优先调度,从而缩短调度长度,分析和实验结果表明该算法要优于ETF,MCP和BDCP算法。 展开更多
关键词 动态自由节点 滞后 任务调度 异构计算系统
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部