期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
14
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
32位同时多线程微处理器的ALU设计
1
作者
刘权胜
杨洪斌
吴悦
《计算机工程与设计》
CSCD
北大核心
2008年第11期2831-2833,共3页
针对传统ALU存在较大硬件资源浪费的缺点,提出了一种指令执行并行度宽、资源利用率高的同时多线程ALU。同时多线程ALU由7个并行的部件组成。每个部件高效的执行两个线程的指令。这种由7个部分组成的分布式ALU提高了指令并行执行的宽度,...
针对传统ALU存在较大硬件资源浪费的缺点,提出了一种指令执行并行度宽、资源利用率高的同时多线程ALU。同时多线程ALU由7个并行的部件组成。每个部件高效的执行两个线程的指令。这种由7个部分组成的分布式ALU提高了指令并行执行的宽度,大大降低了水平浪费和垂直浪费。对微处理器ALU进行功能验证与仿真,并用综合工具完成逻辑综合。
展开更多
关键词
同时多线程
微处理器
算术逻辑单元
仿真
验证
综合
在线阅读
下载PDF
职称材料
同时多线程微处理器分布式保留站结构的数据流技术
2
作者
杨洪斌
吴悦
刘权胜
《应用科学学报》
CAS
CSCD
北大核心
2008年第2期188-193,共6页
为提高同时多线程微处理器数据流指令高效并行执行性能,提出一种7个部分组成的分布式保留站结构.分布式保留站结构的同时多线程微处理器中采用了线程独占重排序缓冲的提交机制及能够快速访问且硬件复杂度低的寄存器堆.两线程指令执行的...
为提高同时多线程微处理器数据流指令高效并行执行性能,提出一种7个部分组成的分布式保留站结构.分布式保留站结构的同时多线程微处理器中采用了线程独占重排序缓冲的提交机制及能够快速访问且硬件复杂度低的寄存器堆.两线程指令执行的结果表明数据流指令的并行度得到明显提高.对保留站、重排序缓冲提交机制及寄存器堆协同工作的功能进行验证与仿真,用综合工具完成逻辑综合.
展开更多
关键词
同时多线程
微处理器
保留站
重排序缓冲
寄存器
执行部件
在线阅读
下载PDF
职称材料
同时多线程微处理器结构的性能功耗研究
被引量:
2
3
作者
郭松柳
汪东升
汤志忠
《计算机工程与应用》
CSCD
北大核心
2008年第28期4-8,共5页
为同时多线程微处理器结构建立的准确的功耗评估模型,将可给出该结构中各部件的功耗使用情况,进而可通过调整部件电压或优化部件结构的方法,达到减少整体功耗的目的;同时,此功耗评估模型也可以作为高层功耗优化研究的测试平台,为系统级...
为同时多线程微处理器结构建立的准确的功耗评估模型,将可给出该结构中各部件的功耗使用情况,进而可通过调整部件电压或优化部件结构的方法,达到减少整体功耗的目的;同时,此功耗评估模型也可以作为高层功耗优化研究的测试平台,为系统级、软件级功耗优化研究提供支持。
展开更多
关键词
同时多线程
微处理器
(
smt
)
功耗评估模型
CPU模拟器
在线阅读
下载PDF
职称材料
多核、多线程处理器的低功耗设计技术研究
被引量:
15
4
作者
张骏
樊晓桠
刘松鹤
《计算机科学》
CSCD
北大核心
2007年第10期301-305,共5页
随着微处理器设计技术和半导体制造工艺的进步,芯片的规模和复杂度急剧增大,超高的功耗密度时系统稳定性造成很大影响,功耗壁垒已经成为提升微处理器性能的最大障碍。本文介绍了低功耗设计的基本原理、研究内容、设计方法,分析了CMP和SM...
随着微处理器设计技术和半导体制造工艺的进步,芯片的规模和复杂度急剧增大,超高的功耗密度时系统稳定性造成很大影响,功耗壁垒已经成为提升微处理器性能的最大障碍。本文介绍了低功耗设计的基本原理、研究内容、设计方法,分析了CMP和SMT体系结构的功耗需求和特性,讨论了不同的功耗优化策略在两种体系结构下的适用程度以及对性能造成的影响。针对多核、多线程体系结构,着重从系统级、结构级和电路级等不同抽象层次时典型的功耗优化技术做了讨论。最后,展望了未来微处理器低功耗设计技术的发展趋势。
展开更多
关键词
多核
多线程
微处理器
低功耗
在线阅读
下载PDF
职称材料
面向FT1000微处理器的STREAM并行计算与优化
被引量:
4
5
作者
迟利华
胡庆丰
+3 位作者
刘杰
甘新标
蒋杰
晏益慧
《计算机工程与科学》
CSCD
北大核心
2014年第12期2267-2271,共5页
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小...
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序。基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式。数据测试结果表明,优化后的STREAM的性能比原始串行程序性能提高了19.2%-64.2%。优化后,并行程序的最高访存性能达到8.5GB/s,对比优化前的最高访存性能最大提高了22.7%。
展开更多
关键词
多线程
微处理器
STREAM测试程序
性能优化
在线阅读
下载PDF
职称材料
实时微处理器体系结构综述
被引量:
5
6
作者
石伟
张明
+1 位作者
郭御风
龚锐
《计算机工程与科学》
CSCD
北大核心
2015年第5期857-864,共8页
实时应用已经成为嵌入式应用中一类快速崛起的典型应用。作为实时系统的核心部件,实时微处理器体系结构是微处理器领域的一个重要研究方向。与通用处理器追求最大吞吐量不同,实时处理器要求具有紧凑且可计算的最坏执行时间。传统的实时...
实时应用已经成为嵌入式应用中一类快速崛起的典型应用。作为实时系统的核心部件,实时微处理器体系结构是微处理器领域的一个重要研究方向。与通用处理器追求最大吞吐量不同,实时处理器要求具有紧凑且可计算的最坏执行时间。传统的实时处理器往往采用较为简单的处理器结构,避免复杂结构引入执行时间的不确定性。随着实时应用对处理器性能需求越来越高,实时处理器正逐渐向多线程与多核结构发展。在多线程与多核处理器中,共享资源竞争导致实时系统的确定性变差,对实时处理器体系结构带来了更大挑战。对实时微处理器体系结构进行综述,首先从指令集、微体系结构、存储、I/O、任务调度等多个方面对传统实时处理器进行分析;然后分别对采用多线程与多核结构的高性能实时处理器展开分析;最后对几种商用实时处理器结构进行比较,总结实时处理器发展现状与未来发展趋势。
展开更多
关键词
实时
微处理器
可预测性
及时性
体系结构
多线程
多核
在线阅读
下载PDF
职称材料
基于现代通用处理器的数据库优化综述
被引量:
4
7
作者
邓亚丹
景宁
熊伟
《计算机科学》
CSCD
北大核心
2009年第8期17-20,共4页
随着硬件技术的不断发展,计算机性能不断加强,数据库的性能也日益提高。但也造成了一些新问题,比如Cache延迟的加剧、Cache访问冲突等。针对这些新问题,按照各种优化技术的分类,深入分析了近10年来现代处理器用于数据库算法优化的各种...
随着硬件技术的不断发展,计算机性能不断加强,数据库的性能也日益提高。但也造成了一些新问题,比如Cache延迟的加剧、Cache访问冲突等。针对这些新问题,按照各种优化技术的分类,深入分析了近10年来现代处理器用于数据库算法优化的各种研究成果,并展望了未来基于新硬件的数据库优化的发展趋势。
展开更多
关键词
CACHE优化
多线程
优化
多核
处理器
smt
在线阅读
下载PDF
职称材料
SMA处理器中的持续优化技术
8
作者
邓鹍
窦勇
周兴铭
《计算机研究与发展》
EI
CSCD
北大核心
2002年第9期1087-1092,共6页
前瞻多线程结构 (SMA)是在超标量前瞻执行技术和多线程技术的基础上结合了二者的优点而发展起来的 .首先研究了 SMA模型的特点 ,指出了 3个关键性能要素 :现场负载不均衡、线程间控制前瞻失效与线程间数据前瞻失效 .为了有效地开发 SMA...
前瞻多线程结构 (SMA)是在超标量前瞻执行技术和多线程技术的基础上结合了二者的优点而发展起来的 .首先研究了 SMA模型的特点 ,指出了 3个关键性能要素 :现场负载不均衡、线程间控制前瞻失效与线程间数据前瞻失效 .为了有效地开发 SMA结构的潜能 ,引入了若干启发式规则 ,设计了基于线程的动态轮廓采样机制 ,并在此基础上实现了一个持续优化框架原型 .对上述优化规则的模拟表明 ,该优化原型能够较好地完成线程优化任务 ,有效地开发 SMA结构的性能潜力 .
展开更多
关键词
SMA
处理器
持续优化技术
前瞻
多线程
结构
动态Profile
微处理器
指令级并行技术
在线阅读
下载PDF
职称材料
SMA:前瞻性多线程体系结构
被引量:
4
9
作者
肖刚
周兴铭
+1 位作者
徐明
邓鹍
《计算机学报》
EI
CSCD
北大核心
1999年第6期582-590,共9页
提出了一种新的ILP处理器体系结构——前瞻性多线程体系结构,简称SMA.它结合了前瞻性执行机制和多线程执行机制,以整个线程为步长进行前瞻性执行,多个线程并行执行并且共享处理器硬件资源.这样,处理器既通过组合每个线程的...
提出了一种新的ILP处理器体系结构——前瞻性多线程体系结构,简称SMA.它结合了前瞻性执行机制和多线程执行机制,以整个线程为步长进行前瞻性执行,多个线程并行执行并且共享处理器硬件资源.这样,处理器既通过组合每个线程的指令窗口形成一个大的动态指令窗口,开发出程序中更大的ILP,又利用多线程执行机制屏蔽各种长延迟操作,达到较高的资源利用率;介绍了SMA执行模型,并讨论了SMA处理器的实现和其中的关键技术.这些关键技术包括:线程控制、分布式寄存器重命名、指令发射执行、中断处理和处理器对编译优化的要求.性能分析结果表明SMA处理器可以适应各种不同类型的程序,以达到高性能,如果采用较好的编译支持和线程预测算法。
展开更多
关键词
前瞻性执行
多线程
SMA
体系结构
微处理器
在线阅读
下载PDF
职称材料
编译指导的多线程低功耗技术研究
被引量:
7
10
作者
赵荣彩
唐志敏
+1 位作者
张兆庆
Guang R.Gao
《计算机研究与发展》
EI
CSCD
北大核心
2002年第12期1572-1579,共8页
多线程和低功耗将是研究下一代微处理器结构所要解决和实现的重点目标之一 .提出了一个在 SMT体系结构中通过动态调整 CPU执行频率降低功耗的计算模型 ,进一步分析和讨论了如何在编译时识别具有可使处理部件降低频率执行的期望区间 ,并...
多线程和低功耗将是研究下一代微处理器结构所要解决和实现的重点目标之一 .提出了一个在 SMT体系结构中通过动态调整 CPU执行频率降低功耗的计算模型 ,进一步分析和讨论了如何在编译时识别具有可使处理部件降低频率执行的期望区间 ,并给出了调整频率和能量分析的计算模型以及编译实现策略 ,目的是在不降低或不明显降低程序执行性能的情况下 ,显著降低处理器的功率 /能量消耗 .理论上该模型也可以用于
展开更多
关键词
多线程
低功耗技术
微处理器
体系结构
编译优化
在线阅读
下载PDF
职称材料
多线程体系结构的几个核心问题
被引量:
1
11
作者
徐明
李磊
周兴铭
《计算机工程与科学》
CSCD
1999年第4期22-26,共5页
多线程计算机是控制流计算机与数据流计算机发展的融合,它是一种多指令流多数据流(MIMD)计算机,其特征首先表现在体系结构上。本文分析了多线程体系结构若干核心问题,并对多线程计算机的性能评价方法展开了初步的探讨。
关键词
多线程
计算机
多线程
体系结构
微处理器
在线阅读
下载PDF
职称材料
EDSMT微体系结构研究
被引量:
3
12
作者
蒋江
邢座程
张民选
《计算机工程与科学》
CSCD
2005年第4期87-91,共5页
本文提出了一种多线程微处理器微体系结构EDSMT。EDSMT有效结合显示并行指令计算 EPIC和动态同时多线程DSMT技术,通过软、硬件协同的方式充分开发和有效支持多个层次的并行性。EDSMT能够降低硬件设计的复杂性,提高微处理器性能。
关键词
微处理器
ED
smt
微体系结构
多线程
处理器
在线阅读
下载PDF
职称材料
CMT模拟器的设计与实现
被引量:
1
13
作者
杨华
崔刚
+1 位作者
吴智博
刘宏伟
《计算机工程》
CAS
CSCD
北大核心
2007年第19期251-252,255,共3页
片上多线程(CMT)是未来高性能处理器的发展方向,而软件模拟是处理器体系结构研究和设计中不可或缺的技术手段。该文基于SimpleScalar工具集设计并实现了CMT节拍级模拟器——OpenSimCMT,对CMT体系结构的设计和评测提供支持。OpenSimCMT...
片上多线程(CMT)是未来高性能处理器的发展方向,而软件模拟是处理器体系结构研究和设计中不可或缺的技术手段。该文基于SimpleScalar工具集设计并实现了CMT节拍级模拟器——OpenSimCMT,对CMT体系结构的设计和评测提供支持。OpenSimCMT特点如下:(1)支持同时多线程(SMT)和片上多处理器(CMP)的模拟;(2)架构开放,配置灵活,可根据具体研究目标随时进行扩展,添加新的模拟内容及相关统计;(3)功能全面,对线程间资源竞争与共享、各功能单元、流水段、分支预测、多级cache等全方位模拟,模拟结果准确。
展开更多
关键词
片上
多线程
模拟
微处理器
高性能
在线阅读
下载PDF
职称材料
低功耗编译的若干相关技术
14
作者
连瑞琦
张兆庆
《计算机科学》
CSCD
北大核心
2004年第8期164-167,共4页
本文综述低功耗编译相关技术。首先简要介绍了若干低功耗领域的基本术语之后,总结出了可用于降低功耗的三类编译手段:选取有助于降低功耗的传统优化,考虑功耗因素改造现有优化技术和通过编译制导配合硬件降低功耗。其次简单介绍了多线...
本文综述低功耗编译相关技术。首先简要介绍了若干低功耗领域的基本术语之后,总结出了可用于降低功耗的三类编译手段:选取有助于降低功耗的传统优化,考虑功耗因素改造现有优化技术和通过编译制导配合硬件降低功耗。其次简单介绍了多线程系统和功耗模型的相关研究,最后,文章给出了低功耗编译领域研究的若干有潜力的方面,供有志进行这方面研究的研究人员参考。
展开更多
关键词
低功耗
多线程
系统
微处理器
能量
功率
编译优化
在线阅读
下载PDF
职称材料
题名
32位同时多线程微处理器的ALU设计
1
作者
刘权胜
杨洪斌
吴悦
机构
上海大学计算机工程与科学学院
出处
《计算机工程与设计》
CSCD
北大核心
2008年第11期2831-2833,共3页
基金
上-海应用材料研究与发展基金项目(06SA18)。
文摘
针对传统ALU存在较大硬件资源浪费的缺点,提出了一种指令执行并行度宽、资源利用率高的同时多线程ALU。同时多线程ALU由7个并行的部件组成。每个部件高效的执行两个线程的指令。这种由7个部分组成的分布式ALU提高了指令并行执行的宽度,大大降低了水平浪费和垂直浪费。对微处理器ALU进行功能验证与仿真,并用综合工具完成逻辑综合。
关键词
同时多线程
微处理器
算术逻辑单元
仿真
验证
综合
Keywords
simultaneous multithreading
processor
ALU (arithmetic logicalunit)
simulation
validation
synthesis
分类号
TP332.2 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
同时多线程微处理器分布式保留站结构的数据流技术
2
作者
杨洪斌
吴悦
刘权胜
机构
上海大学计算机工程与科学学院
出处
《应用科学学报》
CAS
CSCD
北大核心
2008年第2期188-193,共6页
基金
上海应用材料研究与发展基金资助项目(No.06SA18)
文摘
为提高同时多线程微处理器数据流指令高效并行执行性能,提出一种7个部分组成的分布式保留站结构.分布式保留站结构的同时多线程微处理器中采用了线程独占重排序缓冲的提交机制及能够快速访问且硬件复杂度低的寄存器堆.两线程指令执行的结果表明数据流指令的并行度得到明显提高.对保留站、重排序缓冲提交机制及寄存器堆协同工作的功能进行验证与仿真,用综合工具完成逻辑综合.
关键词
同时多线程
微处理器
保留站
重排序缓冲
寄存器
执行部件
Keywords
simultaneous multithreading processor, reservation, reorder buffer, register, implementation unit
分类号
TP332 [自动化与计算机技术—计算机系统结构]
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
同时多线程微处理器结构的性能功耗研究
被引量:
2
3
作者
郭松柳
汪东升
汤志忠
机构
微处理器与片上系统技术研究中心
清华大学计算机科学与技术系高性能计算研究所
出处
《计算机工程与应用》
CSCD
北大核心
2008年第28期4-8,共5页
基金
国家自然科学基金No.60573100~~
文摘
为同时多线程微处理器结构建立的准确的功耗评估模型,将可给出该结构中各部件的功耗使用情况,进而可通过调整部件电压或优化部件结构的方法,达到减少整体功耗的目的;同时,此功耗评估模型也可以作为高层功耗优化研究的测试平台,为系统级、软件级功耗优化研究提供支持。
关键词
同时多线程
微处理器
(
smt
)
功耗评估模型
CPU模拟器
Keywords
Simultaneous Multithreading(
smt
)
power estimation model
CPU simulator
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
多核、多线程处理器的低功耗设计技术研究
被引量:
15
4
作者
张骏
樊晓桠
刘松鹤
机构
西北工业大学计算机学院
长安大学信息工程学院
出处
《计算机科学》
CSCD
北大核心
2007年第10期301-305,共5页
基金
国家自然科学基金项目(60573107)
国家自然科学基金项目(60573143)资助
文摘
随着微处理器设计技术和半导体制造工艺的进步,芯片的规模和复杂度急剧增大,超高的功耗密度时系统稳定性造成很大影响,功耗壁垒已经成为提升微处理器性能的最大障碍。本文介绍了低功耗设计的基本原理、研究内容、设计方法,分析了CMP和SMT体系结构的功耗需求和特性,讨论了不同的功耗优化策略在两种体系结构下的适用程度以及对性能造成的影响。针对多核、多线程体系结构,着重从系统级、结构级和电路级等不同抽象层次时典型的功耗优化技术做了讨论。最后,展望了未来微处理器低功耗设计技术的发展趋势。
关键词
多核
多线程
微处理器
低功耗
Keywords
Multi-core, Multithreading, Microprocessor, Low power
分类号
TP368.1 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
面向FT1000微处理器的STREAM并行计算与优化
被引量:
4
5
作者
迟利华
胡庆丰
刘杰
甘新标
蒋杰
晏益慧
机构
国防科学技术大学并行与分布处理重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2014年第12期2267-2271,共5页
基金
国家863计划资助项目(2012AA01A301)
国家自然科学基金资助项目(60970033
91430218)
文摘
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序。基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式。数据测试结果表明,优化后的STREAM的性能比原始串行程序性能提高了19.2%-64.2%。优化后,并行程序的最高访存性能达到8.5GB/s,对比优化前的最高访存性能最大提高了22.7%。
关键词
多线程
微处理器
STREAM测试程序
性能优化
Keywords
multithreaded processor
STREAM benchmark
performance optimization
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
实时微处理器体系结构综述
被引量:
5
6
作者
石伟
张明
郭御风
龚锐
机构
国防科学技术大学计算机学院
出处
《计算机工程与科学》
CSCD
北大核心
2015年第5期857-864,共8页
基金
国家自然科学基金资助项目(61402497
61202481
+1 种基金
61202123
61202122)
文摘
实时应用已经成为嵌入式应用中一类快速崛起的典型应用。作为实时系统的核心部件,实时微处理器体系结构是微处理器领域的一个重要研究方向。与通用处理器追求最大吞吐量不同,实时处理器要求具有紧凑且可计算的最坏执行时间。传统的实时处理器往往采用较为简单的处理器结构,避免复杂结构引入执行时间的不确定性。随着实时应用对处理器性能需求越来越高,实时处理器正逐渐向多线程与多核结构发展。在多线程与多核处理器中,共享资源竞争导致实时系统的确定性变差,对实时处理器体系结构带来了更大挑战。对实时微处理器体系结构进行综述,首先从指令集、微体系结构、存储、I/O、任务调度等多个方面对传统实时处理器进行分析;然后分别对采用多线程与多核结构的高性能实时处理器展开分析;最后对几种商用实时处理器结构进行比较,总结实时处理器发展现状与未来发展趋势。
关键词
实时
微处理器
可预测性
及时性
体系结构
多线程
多核
Keywords
real-time processor
predictability
timeliness
architecture
multi-threading
multi-core
分类号
TP302 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于现代通用处理器的数据库优化综述
被引量:
4
7
作者
邓亚丹
景宁
熊伟
机构
国防科技大学电子科学与工程学院
出处
《计算机科学》
CSCD
北大核心
2009年第8期17-20,共4页
基金
国家高技术研究发展计划863重点项目(2007AA120400)资助
文摘
随着硬件技术的不断发展,计算机性能不断加强,数据库的性能也日益提高。但也造成了一些新问题,比如Cache延迟的加剧、Cache访问冲突等。针对这些新问题,按照各种优化技术的分类,深入分析了近10年来现代处理器用于数据库算法优化的各种研究成果,并展望了未来基于新硬件的数据库优化的发展趋势。
关键词
CACHE优化
多线程
优化
多核
处理器
smt
Keywords
Cache optimization, Multithreaded optimization, CMP,
smt
分类号
TP311.131 [自动化与计算机技术—计算机软件与理论]
TP273 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
SMA处理器中的持续优化技术
8
作者
邓鹍
窦勇
周兴铭
机构
国防科学技术大学并行与分布处理重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2002年第9期1087-1092,共6页
基金
国家自然科学基金资助 ( 6 99330 30 )
文摘
前瞻多线程结构 (SMA)是在超标量前瞻执行技术和多线程技术的基础上结合了二者的优点而发展起来的 .首先研究了 SMA模型的特点 ,指出了 3个关键性能要素 :现场负载不均衡、线程间控制前瞻失效与线程间数据前瞻失效 .为了有效地开发 SMA结构的潜能 ,引入了若干启发式规则 ,设计了基于线程的动态轮廓采样机制 ,并在此基础上实现了一个持续优化框架原型 .对上述优化规则的模拟表明 ,该优化原型能够较好地完成线程优化任务 ,有效地开发 SMA结构的性能潜力 .
关键词
SMA
处理器
持续优化技术
前瞻
多线程
结构
动态Profile
微处理器
指令级并行技术
Keywords
speculative multithread architecture, compiler optimization, dynamic profiles
分类号
TP332 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
SMA:前瞻性多线程体系结构
被引量:
4
9
作者
肖刚
周兴铭
徐明
邓鹍
机构
国防科学技术大学并行与分布处理国家重点实验室
出处
《计算机学报》
EI
CSCD
北大核心
1999年第6期582-590,共9页
基金
湖南省院士基金
文摘
提出了一种新的ILP处理器体系结构——前瞻性多线程体系结构,简称SMA.它结合了前瞻性执行机制和多线程执行机制,以整个线程为步长进行前瞻性执行,多个线程并行执行并且共享处理器硬件资源.这样,处理器既通过组合每个线程的指令窗口形成一个大的动态指令窗口,开发出程序中更大的ILP,又利用多线程执行机制屏蔽各种长延迟操作,达到较高的资源利用率;介绍了SMA执行模型,并讨论了SMA处理器的实现和其中的关键技术.这些关键技术包括:线程控制、分布式寄存器重命名、指令发射执行、中断处理和处理器对编译优化的要求.性能分析结果表明SMA处理器可以适应各种不同类型的程序,以达到高性能,如果采用较好的编译支持和线程预测算法。
关键词
前瞻性执行
多线程
SMA
体系结构
微处理器
Keywords
Superscalar, speculative execution, multithreading, register renaming.
分类号
TP332.03 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
编译指导的多线程低功耗技术研究
被引量:
7
10
作者
赵荣彩
唐志敏
张兆庆
Guang R.Gao
机构
中国科学院计算技术研究所系统结构室
美国特拉华大学电子与计算机工程系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2002年第12期1572-1579,共8页
基金
国家"八六三"高技术研究发展计划基金资助 (2 0 0 1AA1110 70 )
文摘
多线程和低功耗将是研究下一代微处理器结构所要解决和实现的重点目标之一 .提出了一个在 SMT体系结构中通过动态调整 CPU执行频率降低功耗的计算模型 ,进一步分析和讨论了如何在编译时识别具有可使处理部件降低频率执行的期望区间 ,并给出了调整频率和能量分析的计算模型以及编译实现策略 ,目的是在不降低或不明显降低程序执行性能的情况下 ,显著降低处理器的功率 /能量消耗 .理论上该模型也可以用于
关键词
多线程
低功耗技术
微处理器
体系结构
编译优化
Keywords
low power, computer architecture, compiler optimization, multithreading
分类号
TP332 [自动化与计算机技术—计算机系统结构]
TP314 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
多线程体系结构的几个核心问题
被引量:
1
11
作者
徐明
李磊
周兴铭
机构
并行与分布处理国家重点实验室
出处
《计算机工程与科学》
CSCD
1999年第4期22-26,共5页
文摘
多线程计算机是控制流计算机与数据流计算机发展的融合,它是一种多指令流多数据流(MIMD)计算机,其特征首先表现在体系结构上。本文分析了多线程体系结构若干核心问题,并对多线程计算机的性能评价方法展开了初步的探讨。
关键词
多线程
计算机
多线程
体系结构
微处理器
Keywords
multithreaded computer,multithreaded architecture,MIMD.
分类号
TP332 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
EDSMT微体系结构研究
被引量:
3
12
作者
蒋江
邢座程
张民选
机构
国防科技大学计算机学院
出处
《计算机工程与科学》
CSCD
2005年第4期87-91,共5页
基金
国家自然科学基金资助项目(60376018
60273069)
国家自然科学基金重大研究计划(90207011)
文摘
本文提出了一种多线程微处理器微体系结构EDSMT。EDSMT有效结合显示并行指令计算 EPIC和动态同时多线程DSMT技术,通过软、硬件协同的方式充分开发和有效支持多个层次的并行性。EDSMT能够降低硬件设计的复杂性,提高微处理器性能。
关键词
微处理器
ED
smt
微体系结构
多线程
处理器
Keywords
multithreading
smt
EPIC
microarchitecture
分类号
TP332 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
CMT模拟器的设计与实现
被引量:
1
13
作者
杨华
崔刚
吴智博
刘宏伟
机构
哈尔滨工业大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第19期251-252,255,共3页
基金
国家自然科学基金资助项目(60503015)
文摘
片上多线程(CMT)是未来高性能处理器的发展方向,而软件模拟是处理器体系结构研究和设计中不可或缺的技术手段。该文基于SimpleScalar工具集设计并实现了CMT节拍级模拟器——OpenSimCMT,对CMT体系结构的设计和评测提供支持。OpenSimCMT特点如下:(1)支持同时多线程(SMT)和片上多处理器(CMP)的模拟;(2)架构开放,配置灵活,可根据具体研究目标随时进行扩展,添加新的模拟内容及相关统计;(3)功能全面,对线程间资源竞争与共享、各功能单元、流水段、分支预测、多级cache等全方位模拟,模拟结果准确。
关键词
片上
多线程
模拟
微处理器
高性能
Keywords
CMT
simulation
microprocessor
high-performance
分类号
TN47 [电子电信—微电子学与固体电子学]
在线阅读
下载PDF
职称材料
题名
低功耗编译的若干相关技术
14
作者
连瑞琦
张兆庆
机构
中国科学院计算技术研究所系统结构室
出处
《计算机科学》
CSCD
北大核心
2004年第8期164-167,共4页
文摘
本文综述低功耗编译相关技术。首先简要介绍了若干低功耗领域的基本术语之后,总结出了可用于降低功耗的三类编译手段:选取有助于降低功耗的传统优化,考虑功耗因素改造现有优化技术和通过编译制导配合硬件降低功耗。其次简单介绍了多线程系统和功耗模型的相关研究,最后,文章给出了低功耗编译领域研究的若干有潜力的方面,供有志进行这方面研究的研究人员参考。
关键词
低功耗
多线程
系统
微处理器
能量
功率
编译优化
Keywords
Low-power
Compilation
Multi-thread
分类号
TP332 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
32位同时多线程微处理器的ALU设计
刘权胜
杨洪斌
吴悦
《计算机工程与设计》
CSCD
北大核心
2008
0
在线阅读
下载PDF
职称材料
2
同时多线程微处理器分布式保留站结构的数据流技术
杨洪斌
吴悦
刘权胜
《应用科学学报》
CAS
CSCD
北大核心
2008
0
在线阅读
下载PDF
职称材料
3
同时多线程微处理器结构的性能功耗研究
郭松柳
汪东升
汤志忠
《计算机工程与应用》
CSCD
北大核心
2008
2
在线阅读
下载PDF
职称材料
4
多核、多线程处理器的低功耗设计技术研究
张骏
樊晓桠
刘松鹤
《计算机科学》
CSCD
北大核心
2007
15
在线阅读
下载PDF
职称材料
5
面向FT1000微处理器的STREAM并行计算与优化
迟利华
胡庆丰
刘杰
甘新标
蒋杰
晏益慧
《计算机工程与科学》
CSCD
北大核心
2014
4
在线阅读
下载PDF
职称材料
6
实时微处理器体系结构综述
石伟
张明
郭御风
龚锐
《计算机工程与科学》
CSCD
北大核心
2015
5
在线阅读
下载PDF
职称材料
7
基于现代通用处理器的数据库优化综述
邓亚丹
景宁
熊伟
《计算机科学》
CSCD
北大核心
2009
4
在线阅读
下载PDF
职称材料
8
SMA处理器中的持续优化技术
邓鹍
窦勇
周兴铭
《计算机研究与发展》
EI
CSCD
北大核心
2002
0
在线阅读
下载PDF
职称材料
9
SMA:前瞻性多线程体系结构
肖刚
周兴铭
徐明
邓鹍
《计算机学报》
EI
CSCD
北大核心
1999
4
在线阅读
下载PDF
职称材料
10
编译指导的多线程低功耗技术研究
赵荣彩
唐志敏
张兆庆
Guang R.Gao
《计算机研究与发展》
EI
CSCD
北大核心
2002
7
在线阅读
下载PDF
职称材料
11
多线程体系结构的几个核心问题
徐明
李磊
周兴铭
《计算机工程与科学》
CSCD
1999
1
在线阅读
下载PDF
职称材料
12
EDSMT微体系结构研究
蒋江
邢座程
张民选
《计算机工程与科学》
CSCD
2005
3
在线阅读
下载PDF
职称材料
13
CMT模拟器的设计与实现
杨华
崔刚
吴智博
刘宏伟
《计算机工程》
CAS
CSCD
北大核心
2007
1
在线阅读
下载PDF
职称材料
14
低功耗编译的若干相关技术
连瑞琦
张兆庆
《计算机科学》
CSCD
北大核心
2004
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部