-
题名面向按序执行处理器的预执行指导的数据预取方法
被引量:1
- 1
-
-
作者
党向磊
王箫音
佟冬
陆俊林
程旭
王克义
-
机构
北京大学微处理器研究开发中心
北京大学微处理器及系统教育部工程研究中心
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2012年第11期2145-2151,共7页
-
基金
"核高基"重大专项(No.2009ZX01029-001-002)
中国博士后科学基金(No.20110490208)
-
文摘
为提高按序执行处理器的访存性能,本文提出一种预执行指导的数据预取方法(PEDP).PEDP利用跨距预取器对规则的访存模式进行预取,并在发生L2 Cache失效后通过预执行后续指令对不规则的访存模式进行精确的预取,从而结合两者的优势提高预取覆盖率.同时,PEDP利用预执行过程中提前捕获的真实访存信息指导跨距预取器的预取过程.在预执行的指导下,跨距预取器可以对预执行能够产生的符合跨距访存模式的地址更早地发起预取请求,从而改善预取及时性.此外,为进一步优化上述指导过程,PEDP使用更新过滤器有效去除指导过程中对跨距预取器的有害更新,从而提高预取准确率.实验结果表明,在平均情况下,PEDP将基准处理器的性能提升33.0%.与跨距预取和预执行各自单独使用相比,PEDP将性能分别提高16.2%和7.3%.
-
关键词
数据预取
预执行
访存延迟包容
按序执行处理器
-
Keywords
prefetching
pre-execution
memory latency tolerance
in-order processors
-
分类号
TP302.7
[自动化与计算机技术—计算机系统结构]
-
-
题名一种针对位操作密集应用的扩展指令自动选择方法
被引量:3
- 2
-
-
作者
张吉豫
刘先华
谭明星
程旭
丛京生
-
机构
微处理器及系统教育部工程研究中心
北京大学信息科学技术学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2012年第2期209-214,共6页
-
基金
国家"核高基"重大科技专项课题(No.2009ZX01036-001-003
No.2009ZX01029-001-002)
-
文摘
本文提出一种结合位操作分析和变换的扩展指令自动选择方法.该方法在数据流图中引入新的位操作中间表示结点,可精简地描述位访问操作.编译器可对程序数据流图进行选择性循环展开和位操作分析优化,并将其转换为带有直接表示位赋值操作结点的数据流图.实验结果表明,基于新的数据流图进行扩展指令选择可有效提升位操作密集型应用的性能.
-
关键词
指令系统扩展
自动选择
位操作变换
-
Keywords
insa-uction-set extension
automatic selection
bitwise operation transformation
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种混合型值关联间接跳转预测机制
被引量:1
- 3
-
-
作者
谭明星
刘先华
张吉豫
佟冬
程旭
-
机构
北京大学信息科学技术学院
微处理器及系统教育部工程研究中心
北京大学深圳研究生院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2012年第11期2298-2302,共5页
-
基金
国家核高基重大专项(No.2009ZX01029-001-002
No.2009ZX01036-001-003)
北京市自然科学基金(No.4123098)
-
文摘
准确的间接跳转预测对现代处理器的性能和能耗有效性都具有重要意义.本文提出了一种混合型值关联间接跳转预测机制,通过混合使用多种关联信息以降低间接跳转误预测率.该机制一方面依赖于编译器根据高层次数据流信息识别间接跳转指令所对应的初始关联数据值.另一方面,该机制针对间接跳转预测的不同场景分别设计了两类关联信息:单一数据值和值历史,并实现了一种低开销的硬件结构,该硬件结构在运行时刻根据不同应用场景动态选择最佳关联信息引导间接跳转预测.实验结果表明,相对于传统的BTB预测器和最新的VBBI预测器,本文机制能够有效降低误预测率,提高程序性能并降低系统能耗.
-
关键词
转移预测
间接跳转
值关联
混合型预测器
-
Keywords
branch prediction
indirect jump
value correlation
hybrid prediction
-
分类号
TP302.7
[自动化与计算机技术—计算机系统结构]
-
-
题名一种降低末级高速缓存污染的软件控制插入策略
被引量:1
- 4
-
-
作者
黄涛
王晶
管雪涛
钟祺
王克义
-
机构
北京大学信息科学技术学院微处理器及系统教育部工程研究中心
北京大学深圳研究生院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2012年第12期2433-2438,共6页
-
基金
国家科技重大专项(No.2009ZX01029-001-002
No.2009ZX01036-001-003)
-
文摘
现有高速缓存替换算法大多无法有效识别数据的局部性特征,导致高速缓存内即将被访问到的数据可能被未来不会被访问到的数据所替换,造成高速缓存污染问题.末级高速缓存污染引发的性能损失随着处理器和存储器之间性能差距的扩大而不断增大,成为制约系统性能提升的重要瓶颈之一.本文针对末级高速缓存污染问题,在剖视分析访存密集型程序的页一级访存行为基础上,提出一种软件控制末级高速缓存插入策略.本方法通过控制和指导页一级数据插入位置,限制局部性差的数据页在末级高速缓存中的访问空间,达到降低末级高速缓存污染的目的.实验结果表明,相对于LRU和DIP策略,本文方法能够有效降低末级高速缓存失效率,提高程序性能.
-
关键词
末级高速缓存
剖视
插入策略
-
Keywords
last level cache
profiling
insertion policy
-
分类号
TP302.1
[自动化与计算机技术—计算机系统结构]
-
-
题名基于优化回溯模型的无重叠模调度算法
- 5
-
-
作者
谭明星
刘先华
张吉豫
程旭
-
机构
北京大学信息科学技术学院
微处理器及系统教育部工程研究中心
北京大学深圳研究生院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2012年第8期1681-1686,共6页
-
基金
国家核高基重大专项(No.2009ZX01029-001-002
No.2009ZX01036-001-003)
北京市自然科学基金(No.4123098)
-
文摘
软件流水技术通过重组循环体来挖掘指令级并行性,模调度是一类广泛使用的软件流水调度算法.传统模调度算法通常会产生变量活跃域重叠和寄存器压力增大问题,无法适用于嵌入式处理器.本文面向嵌入式处理器特性,建立了一种优化回溯模型,并基于该回溯模型提出了一种面向嵌入式处理器的无重叠模调度算法(NOn-Over-lapped Iterative Modulo Scheduling,简称NOOI).NOOI算法使用循环相关反依赖消除变量活跃域重叠,并使用依赖约束和资源约束回溯模型消解节点冲突,从而提高了模调度的有效性.实验结果表明,NOOI模调度算法能够有效改进模调度成功率和循环启动间距,并提高程序性能.
-
关键词
嵌入式处理器
软件流水
模调度
回溯模型
-
Keywords
embedded processor
software pipelining
modulo scheduling
backtracking model
-
分类号
TP302.7
[自动化与计算机技术—计算机系统结构]
-