期刊文献+
共找到68篇文章
< 1 2 4 >
每页显示 20 50 100
基于RISC-V VLIW架构的混合指令调度算法
1
作者 李奕瑾 杜绍敏 +3 位作者 赵家程 王雪莹 查永权 崔慧敏 《软件学报》 北大核心 2025年第9期3937-3953,共17页
指令级并行是处理器体系结构研究的经典难题.VLIW架构是数字信号处理器领域中提升指令级并行的一种常用架构.VLIW架构的指令发射顺序是由编译器决定的,因此其指令级并行的性能强依赖于编译器的指令调度.为了探索RISC-V VLIW架构的扩展潜... 指令级并行是处理器体系结构研究的经典难题.VLIW架构是数字信号处理器领域中提升指令级并行的一种常用架构.VLIW架构的指令发射顺序是由编译器决定的,因此其指令级并行的性能强依赖于编译器的指令调度.为了探索RISC-V VLIW架构的扩展潜力,丰富RISC-V生态,研究RISC-V VLIW架构的指令调度算法优化.针对单个调度区域,整数线性规划调度算法能够得到调度最优解但复杂度较高,表调度算法复杂度较低但无法得到调度最优解.为了结合两种调度算法的优点,提出了一种IPC理论模型指导的混合指令调度算法,即通过IPC理论模型定位到表调度未达最优解的调度区域,再对该调度区域进一步实施整数线性规划调度算法.该理论模型基于数据流分析技术协同考虑指令依赖和硬件资源,能够以线性复杂度给出IPC的理论上界.混合调度的核心在于IPC理论模型的准确性,理论模型准确率为95.74%.在给定的测评基准上,提出的理论模型应用于混合指令调度时,能够平均认定94.62%的调度区域在表调度下已达最优解,因此仅有5.38%的调度区域需再进行整数线性规划调度.该混合调度算法能够以接近表调度的复杂度达到整数线性规划调度的调度效果. 展开更多
关键词 RISC-V 超长指令字(VLIW) 整数线性规划(ILP) 表调度 理论模型
在线阅读 下载PDF
基于龙芯2F体系结构的BLAS库优化 被引量:13
2
作者 顾乃杰 李凯 +1 位作者 陈国良 吴超 《中国科学技术大学学报》 CAS CSCD 北大核心 2008年第7期854-859,共6页
在KD-50-I平台上,基于常用优化技术,根据龙芯2F体系结构的特点,在数据预取、指令调度方面,针对高性能计算机系统中能有效解决线性代数问题的子程序集合BLAS,提出了新的优化技术,充分发挥龙芯2F处理器的性能,实现了高性能的BLAS.实际测... 在KD-50-I平台上,基于常用优化技术,根据龙芯2F体系结构的特点,在数据预取、指令调度方面,针对高性能计算机系统中能有效解决线性代数问题的子程序集合BLAS,提出了新的优化技术,充分发挥龙芯2F处理器的性能,实现了高性能的BLAS.实际测试表明,高性能BLAS在750 MHz的龙芯2F处理器(双精度浮点峰值3 Gflops)上HPL实测峰值达到1.47 GHz,比原始BLAS提高了6倍以上,比ATLAS提高了45%. 展开更多
关键词 BLAS 龙芯2F KD-50-Ⅰ 数据预取 指令调度
在线阅读 下载PDF
考虑卫星指令上注的两阶段应急任务规划 被引量:9
3
作者 靳鹏 王超超 +2 位作者 夏维 杨斌 汤航 《系统工程与电子技术》 EI CSCD 北大核心 2019年第4期810-818,共9页
多星对地观测应急任务具有突发性和高时效性,不同于常规任务的任务规划,应急任务规划需快速响应任务需求。考虑多星应急任务规划指令上注和数据下传这两个制约应急任务规划的关键因素,设计了基于固定周期的决策统筹规划和基于测控站的... 多星对地观测应急任务具有突发性和高时效性,不同于常规任务的任务规划,应急任务规划需快速响应任务需求。考虑多星应急任务规划指令上注和数据下传这两个制约应急任务规划的关键因素,设计了基于固定周期的决策统筹规划和基于测控站的局部调整规划相结合的任务规划调度策略。在满足应急任务尽早下传的条件下,提出一种两阶段算法来解决不确定到达的应急任务的动态规划问题。最后通过实验验证了所提算法解决应急任务规划的有效性。 展开更多
关键词 指令上注 调度策略 应急任务规划 两阶段求解算法
在线阅读 下载PDF
协作式全局指令调度与寄存器分配 被引量:3
4
作者 吴承勇 连瑞琦 +1 位作者 张兆庆 乔如良 《计算机学报》 EI CSCD 北大核心 2000年第5期493-499,共7页
指令级并行是现代高性能处理器的重要特征 .对于发挥这类处理器所具有的并行处理能力来说 ,编译器有至关重要的影响 .文中讨论指令级并行编译中的核心问题——全局指令调度与寄存器分配 ,并以作者为一种新型的显式并行体系结构微处理器... 指令级并行是现代高性能处理器的重要特征 .对于发挥这类处理器所具有的并行处理能力来说 ,编译器有至关重要的影响 .文中讨论指令级并行编译中的核心问题——全局指令调度与寄存器分配 ,并以作者为一种新型的显式并行体系结构微处理器研制的编译系统为背景 ,介绍了此类编译器后端设计中面临的指令调度与寄存器分配的时序问题 。 展开更多
关键词 指令级并行 全局指令调度 寄存器分配 编译系统
在线阅读 下载PDF
基于Trace-Cache的多级动态优化框架设计 被引量:4
5
作者 唐遇星 邓鹍 周兴铭 《电子学报》 EI CAS CSCD 北大核心 2005年第11期1946-1951,共6页
对指令集进行扩展和添加新功能部件是提高处理器性能的有效途径.为了充分利用新的体系结构扩展,已有应用必需经过全新的优化编译.对于跨体系结构优化而言,二进制翻译已经被证明是一种行之有效的技术.本文结合trace技术和动态二进制翻译... 对指令集进行扩展和添加新功能部件是提高处理器性能的有效途径.为了充分利用新的体系结构扩展,已有应用必需经过全新的优化编译.对于跨体系结构优化而言,二进制翻译已经被证明是一种行之有效的技术.本文结合trace技术和动态二进制翻译优化技术,提出一种多级动态优化框架结构,无需静态重新优化编译,在程序动态运行期间,引入多级动态优化方法和扩展指令调度.模拟结果显示该结构具有能有效形成大尺寸的指令调度窗口,准确选择热点代码及优化方法,有效提升旧有应用性能的优点,并有实现灵活,可扩展好等特点. 展开更多
关键词 TRACE 动态优化 指令调度 指令级并行
在线阅读 下载PDF
面向异构众核从核的数学函数库访存优化方法 被引量:6
6
作者 许瑾晨 郭绍忠 +1 位作者 黄永忠 王磊 《计算机科学》 CSCD 北大核心 2014年第6期12-17,共6页
数学库函数算法的特性致使函数存在大量的访存,而当前异构众核的从核结构采用共享主存的方式实现数据访问,从而严重影响了从核的访存速度,因此异构众核结构中数学库函数的性能无法满足高性能计算的要求。为了有效解决此问题,提出了一种... 数学库函数算法的特性致使函数存在大量的访存,而当前异构众核的从核结构采用共享主存的方式实现数据访问,从而严重影响了从核的访存速度,因此异构众核结构中数学库函数的性能无法满足高性能计算的要求。为了有效解决此问题,提出了一种基于访存指令的调度策略,亦即将访存延迟有效地隐藏于计算延迟中,以提高基于汇编实现的数学函数库的函数性能;结合动态调用方式,利用从核本地局部数据存储空间LDM(local data memory),提出了一种提高访存速度的ldm_call算法。两种优化技术在共享存储结构下具有普遍适用性,并能够有效减少函数访存开销,提高访存速度。实验表明,两种技术分别能够平均提高函数性能16.08%和37.32%。 展开更多
关键词 异构众核 数学函数库 访存优化 指令调度 局部数据存储空间
在线阅读 下载PDF
多模式智能教学系统教学规划与模式调度研究 被引量:6
7
作者 李益才 张小真 《计算机工程与设计》 CSCD 北大核心 2005年第4期1083-1087,共5页
具有多种教学模式的智能教学系统为适应不同学生的学习风格和学习要求,具有其它智能教学系统不可替代的优势,其关键问题之一是要解决教学规划和教学模式调度问题。提出了多模式智能教学系统的教学规划及教学模式调度的解决方案,以知识... 具有多种教学模式的智能教学系统为适应不同学生的学习风格和学习要求,具有其它智能教学系统不可替代的优势,其关键问题之一是要解决教学规划和教学模式调度问题。提出了多模式智能教学系统的教学规划及教学模式调度的解决方案,以知识点关系图为基础提出了全局教学规划算法,根据对学生学习的评价和教学资源的相关特征为学生选择合适的教学模式并激活之。实验证明这种解决方案能取得令人满意的效果。 展开更多
关键词 智能教学系统 教学规划 教学模式调度 人工智能
在线阅读 下载PDF
密码协处理器指令级并行编译研究 被引量:2
8
作者 高飞 李红燕 张永福 《计算机应用研究》 CSCD 北大核心 2010年第5期1633-1637,共5页
立足于处理器体系结构的研究,结合可重构设计技术以确保密码处理的灵活性是密码协处理器研究的重要方法,其中如何提升密码协处理器的性能是至关重要的问题。基于VLIW体系结构以及可重构设计技术,设计专用指令密码协处理器。编译器作为... 立足于处理器体系结构的研究,结合可重构设计技术以确保密码处理的灵活性是密码协处理器研究的重要方法,其中如何提升密码协处理器的性能是至关重要的问题。基于VLIW体系结构以及可重构设计技术,设计专用指令密码协处理器。编译器作为密码协处理器的重要组成部分,重点研究了密码协处理器指令级并行编译技术,通过提高指令级并行度来提升密码协处理器的性能。 展开更多
关键词 密码协处理器 超长指令字 可重构计算 指令级并行 指令调度
在线阅读 下载PDF
基于互补谓词的编译优化 被引量:2
9
作者 胡定磊 陈书明 +1 位作者 王凤芹 刘春林 《电子学报》 EI CAS CSCD 北大核心 2006年第7期1280-1286,共7页
许多通用和嵌入式高性能处理器都支持谓词执行,利用谓词执行可以简化程序的控制结构,而且指令调度、寄存器分配也可以利用谓词提高效率.基于二进制决策图(BDD)的谓词分析系统,提出了一种利用互补谓词机制对控制结构进行优化的方法;对传... 许多通用和嵌入式高性能处理器都支持谓词执行,利用谓词执行可以简化程序的控制结构,而且指令调度、寄存器分配也可以利用谓词提高效率.基于二进制决策图(BDD)的谓词分析系统,提出了一种利用互补谓词机制对控制结构进行优化的方法;对传统着色图寄存器分配算法进行改进,给出了一种利用互补谓词机制建立统一简化干涉图的新算法,减少了代码溢出;利用互补谓词的特性指导指令调度,使之更加有效利用资源,并对目标体系结构进行了改进以支持指令调度.最后在YHFT-DSP/700芯片的编译器上对所提优化方法的有效性进行了验证. 展开更多
关键词 编译器 互补谓词 谓词分析 指令调度 寄存器分配
在线阅读 下载PDF
自动映射多循环程序到有限FPGA资源的参数化流水线模板 被引量:2
10
作者 董亚卓 窦勇 +1 位作者 宋健 刘明政 《计算机学报》 EI CSCD 北大核心 2009年第1期152-160,共9页
FPGA为加速计算密集型应用提供了一个灵活高效的平台.然而,由于片上资源有限,在一些情况下,需要将大规模应用中包括的多个循环程序分别映射到FPGA上执行,当一个循环程序执行完毕后,需要重新配置FPGA以执行下一个循环程序,FPGA重构过程... FPGA为加速计算密集型应用提供了一个灵活高效的平台.然而,由于片上资源有限,在一些情况下,需要将大规模应用中包括的多个循环程序分别映射到FPGA上执行,当一个循环程序执行完毕后,需要重新配置FPGA以执行下一个循环程序,FPGA重构过程在整个程序执行过程中占用了较多时间.文中设计了一个参数化流水线模板,并提出了相应的指令分配调度策略,实现了自动将多循环程序顺序映射到目标FPGA片上系统,同时在程序切换时,不需要进行FPGA重构.实验结果表明,对每个循环程序,文中设计的流水线模板能达到与专用硬件结构相当的执行节拍,同时节约了程序切换时的重构时间. 展开更多
关键词 循环 FPGA 流水线模板 指令调度
在线阅读 下载PDF
面向总线的低功耗优化方法探究 被引量:3
11
作者 刘钱 何炎祥 +1 位作者 廖希密 陈勇 《计算机工程与应用》 CSCD 2014年第12期42-47,共6页
随着社会信息化水平的不断提高,信息产业的快速发展,由此带来了能源的消耗也越来越高。特别是芯片集成度越来越高,系统应用越来越复杂,这就使得功耗问题成为嵌入式系统必须面对的一个关键问题。单纯的硬件功耗优化已经不能满足要求,基... 随着社会信息化水平的不断提高,信息产业的快速发展,由此带来了能源的消耗也越来越高。特别是芯片集成度越来越高,系统应用越来越复杂,这就使得功耗问题成为嵌入式系统必须面对的一个关键问题。单纯的硬件功耗优化已经不能满足要求,基于软件的功耗优化取得了很好的成效。在编译阶段,通过减少总线的翻转次数来降低系统的功耗。针对指令地址总线,结合遗传算法进行函数段的分配,结合相关的编码策略,减少总线翻转,从而降低其功耗。针对数据总线,使用蚁群算法进行指令调度,用0-1翻转编码,有效减少了其总线翻转,降低了功耗。这种基于数据总线和地址总线的优化算法,能够在特定的实验平台下通过实验验证,算法对于总线功耗的优化效率大约为25%左右。 展开更多
关键词 低功耗 编译优化 总线编码 指令调度
在线阅读 下载PDF
同时多线程结构的2级调度策略 被引量:2
12
作者 王晶 樊晓桠 +1 位作者 张盛兵 王海 《西北工业大学学报》 EI CAS CSCD 北大核心 2007年第3期433-437,共5页
微处理器的发展已经迈入多线程时代。在同时多线程(SMT)结构中,多个线程共享一个取指单元和指令队列(IQ),如何提高有效取指带宽和IQ利用率是关键问题。论文详细分析了SMT中导致IQ阻塞的因素,以及它们对IPC的影响。基于线程预构思想,将导... 微处理器的发展已经迈入多线程时代。在同时多线程(SMT)结构中,多个线程共享一个取指单元和指令队列(IQ),如何提高有效取指带宽和IQ利用率是关键问题。论文详细分析了SMT中导致IQ阻塞的因素,以及它们对IPC的影响。基于线程预构思想,将导致IQ阻塞的多个因素分开考虑,提出将线程调度分成预构取指调度和队列取指调度的2级调度。采用基于置信度的线程调度策略用于线程预构,采用基于阈值门限的调度策略用于队列取指。仿真结果表明,2级调度策略与ICOUNT策略相比,错误路径指令可减少18.22%(取指级)、5.93%(执行级),IQ阻塞的概率减少27%(整数队列),IPC提高9.4%。 展开更多
关键词 同时多线程 指令队列 置信度估计 取指调度 线程调度
在线阅读 下载PDF
可重构指令集处理器的代码优化生成算法研究 被引量:1
13
作者 张惠臻 王超 +1 位作者 李曦 周学海 《计算机研究与发展》 EI CSCD 北大核心 2012年第9期2018-2026,共9页
可重构指令集处理器能够适应多变的计算任务在性能和灵活性两方面的要求,而传统的编译后端技术无法为其生成高效的可执行代码,需要有新的代码生成方法.针对传统编译后端代码生成三阶段方法进行扩展的代码混合优化生成算法正是这样一种方... 可重构指令集处理器能够适应多变的计算任务在性能和灵活性两方面的要求,而传统的编译后端技术无法为其生成高效的可执行代码,需要有新的代码生成方法.针对传统编译后端代码生成三阶段方法进行扩展的代码混合优化生成算法正是这样一种方法.该算法很大程度地复用了原有的三阶段代码生成过程,同时针对可重构指令集具有动态性的特点,根据系统硬件资源和重构配置,扩展了针对可重构指令代码生成的优化处理,从而能够获得切合可重构指令集处理器体系结构特性的可执行代码.相关实验与分析说明了该算法针对硬件重构得到的新平台所做的可重构指令代码生成是有效的,能够较好地提高应用程序在新平台上的执行性能. 展开更多
关键词 可重构指令集处理器 编译后端 代码生成 指令选择 指令调度 性能优化
在线阅读 下载PDF
基于网络负载特征感知的数据流指令调度机制研究 被引量:2
14
作者 冯煜晶 欧焱 +3 位作者 叶笑春 范东睿 谭旭 唐志敏 《高技术通讯》 EI CAS 北大核心 2018年第11期885-898,共14页
研究了数据流架构的指令调度策略,基于当前普遍采用的数据流指令调度机制,提出了支持模式切换的动态指令调度机制。由于数据流架构执行模式具有并行化特点,同一时刻存在大量并行传递的数据和并行的计算,网络传输负载呈现出非均匀的分布... 研究了数据流架构的指令调度策略,基于当前普遍采用的数据流指令调度机制,提出了支持模式切换的动态指令调度机制。由于数据流架构执行模式具有并行化特点,同一时刻存在大量并行传递的数据和并行的计算,网络传输负载呈现出非均匀的分布模式。局部网络传输压力过大导致数据流节点中的处理单元内部出现流水线停顿,片上网络(NoC)的局部传输效率降低,从而影响数据流架构的网络传输延迟、计算部件的利用率和整体的执行效率,因此针对原有的指令调度策略提出改进方案。针对网络负载的动态变化实时调整指令调度策略,从而达到缓解网络局部拥塞,提高网络传输效率的目的。本研究使用数据流模拟器对提出的机制进行验证,实验结果表明,采用本文提出的指令调度机制,数据流网络的传输延迟平均降低了12. 8%,计算部件的利用率平均提高了14. 4%,数据流架构的整体性能平均提高了14. 7%。 展开更多
关键词 数据流架构 动态指令调度 片上网络(NoC) 网络负载 单元利用率
在线阅读 下载PDF
基于汇编代码的指令调度器的设计与实现 被引量:2
15
作者 田祖伟 李勇帆 《计算机科学》 CSCD 北大核心 2009年第3期45-47,89,共4页
随着嵌入式处理器在各个领域的广泛应用,嵌入式软件的复杂度越来越高。充分发掘嵌入式处理器的性能,需要高级编译优化技术的支持。指令调度是编译器发掘程序指令级并行性的关键技术之一。设计并实现了一个基于汇编代码的指令调度器。实... 随着嵌入式处理器在各个领域的广泛应用,嵌入式软件的复杂度越来越高。充分发掘嵌入式处理器的性能,需要高级编译优化技术的支持。指令调度是编译器发掘程序指令级并行性的关键技术之一。设计并实现了一个基于汇编代码的指令调度器。实验结果表明,在TECC嵌入式编译器中集成指令调度器后可显著提高程序的性能。 展开更多
关键词 指令调度 编译优化 汇编代码 表调度
在线阅读 下载PDF
同时多线程结构的线程预构 被引量:2
16
作者 张盛兵 王晶 《西北工业大学学报》 EI CAS CSCD 北大核心 2007年第2期159-163,共5页
同时多线程结构中,多个线程共享一个取指单元。要选择最合适的取指线程,需要在调度策略里综合考虑流水线反馈条件或者预测流水线行为,这是非常困难的。提出了线程预构的概念,把线程取指调度分解为线程预构调度和就绪线程取指调度,分别... 同时多线程结构中,多个线程共享一个取指单元。要选择最合适的取指线程,需要在调度策略里综合考虑流水线反馈条件或者预测流水线行为,这是非常困难的。提出了线程预构的概念,把线程取指调度分解为线程预构调度和就绪线程取指调度,分别解决错误路径取指问题和指令队列阻塞问题。提出了线程缓冲的链表结构,实现了线程预构的概念,与国际公认的基准SMT结构相比,IPC平均提高9.39%。 展开更多
关键词 同时多线程处理器 取指策略 线程预构 线程缓冲区 线程调度
在线阅读 下载PDF
基于谓词代码的编译优化技术研究 被引量:1
17
作者 田祖伟 孙光 《计算机科学》 CSCD 北大核心 2010年第5期130-133,138,共5页
程序中大量分支指令的存在,严重制约了体系结构和编译器开发并行性的能力。有效发掘指令级并行性的一个主要挑战是要克服分支指令带来的限制。利用谓词执行可有效地删除分支,将分支指令转换为谓词代码,从而扩大了指令调度的范围并且删... 程序中大量分支指令的存在,严重制约了体系结构和编译器开发并行性的能力。有效发掘指令级并行性的一个主要挑战是要克服分支指令带来的限制。利用谓词执行可有效地删除分支,将分支指令转换为谓词代码,从而扩大了指令调度的范围并且删除了分支误测带来的性能损失。阐述了基于谓词代码的指令调度、软件流水、寄存器分配、指令归并等编译优化技术。设计并实现了一个基于谓词代码的指令调度算法。实验表明,对谓词代码进行编译优化,能有效提高指令并行度,缩短代码执行时间,提高程序性能。 展开更多
关键词 编译优化 指令级并行 谓词代码 指令调度
在线阅读 下载PDF
基于硬件动态指令调度的椭圆曲线并行运算 被引量:1
18
作者 陈华锋 沈海斌 严晓浪 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2007年第11期1778-1781,共4页
提出了一种在特征为2的有限域上并行快速实现椭圆曲线密码(ECC)点乘运算的方法,利用硬件动态指令调度技术,同时采用指令级并行和线程级并行,提高了并行运算的性能.基于该方法设计架构并监控运算部件的工作情况,在译码阶段之前动态生成... 提出了一种在特征为2的有限域上并行快速实现椭圆曲线密码(ECC)点乘运算的方法,利用硬件动态指令调度技术,同时采用指令级并行和线程级并行,提高了并行运算的性能.基于该方法设计架构并监控运算部件的工作情况,在译码阶段之前动态生成点乘运算指令序列,从而通过动态指令调度消除了不能通过旁路技术或直接通路技术来避免数据冲突停顿所带来的性能损失.基于现场可编程门阵列(FPGA)的实现结果表明,利用该方法实现伽罗瓦域GF(2193)上的椭圆曲线点乘运算需要22.7μs. 展开更多
关键词 流水线 硬件动态指令调度 射影Montgomery点乘算法
在线阅读 下载PDF
分簇VLIW结构下利用数据依赖图优化调度的研究 被引量:1
19
作者 杨旭 何虎 孙义和 《计算机学报》 EI CSCD 北大核心 2011年第1期182-192,共11页
应用的需求促使如今的处理器必须尽可能高地利用程序中所存在的指令级并行度,然而,高指令级并行的硬件和指令调度技术会给寄存器资源带来极大的压力.要在单一寄存器堆的情况下,既维持高的指令级并行度,又保持高的运行时钟频率是一件非... 应用的需求促使如今的处理器必须尽可能高地利用程序中所存在的指令级并行度,然而,高指令级并行的硬件和指令调度技术会给寄存器资源带来极大的压力.要在单一寄存器堆的情况下,既维持高的指令级并行度,又保持高的运行时钟频率是一件非常困难的事情,这是因为,当指令级并行度足够高时,在单一寄存器堆情况下,寄存器堆访问端口数目的限制会使得对寄存器堆的访问时间成为制约性能提高的关键因素.为了在利用高的指令级并行度的同时维持高的运行时钟频率,可以将寄存器堆和功能单元划分到不同的簇中.每一个簇中的功能单元可以直接访问簇内的寄存器堆,而簇间的数据交互则需要占用专用的资源来进行.因此,分簇结构下的编译器不仅要通过调度实现最大程序的指令级并行度,还应该对指令的分簇进行细致的安排以限制簇间的数据交互.该文致力于通过对数据依赖图(Data Dependence Graph)分析和划分,从而在最小化簇间的数据交互的同时,平衡各簇的利用情况,提高能够获得的指令级并行度,从而优化分簇式VLIW结构的调度性能.实验结果证明,该文所提出的方法可以极大地减少簇间的数据交互量,提高所能获得的指令级并行度,从而对调度结果的性能加以改善. 展开更多
关键词 分簇 VLIW结构 数据依赖图 指令调度 簇间数据交互
在线阅读 下载PDF
指令调度中的寄存器重命名技术 被引量:1
20
作者 张军超 张兆庆 《计算机工程》 CAS CSCD 北大核心 2005年第23期8-10,共3页
指令间的依赖关系是阻碍指令调度发挥作用,进而影响指令级并行的主要障碍。寄存器重命名是解决控制依赖和数据依赖的一种重要技术。研究并实现了一种指令调度中的寄存器重命名技术。它在164.gzip和186.crafty上分别取得了约5%和3%的加... 指令间的依赖关系是阻碍指令调度发挥作用,进而影响指令级并行的主要障碍。寄存器重命名是解决控制依赖和数据依赖的一种重要技术。研究并实现了一种指令调度中的寄存器重命名技术。它在164.gzip和186.crafty上分别取得了约5%和3%的加速比。 展开更多
关键词 寄存器重命名 指令凋度 依赖
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部