期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
EDSMT微体系结构研究 被引量:3
1
作者 蒋江 邢座程 张民选 《计算机工程与科学》 CSCD 2005年第4期87-91,共5页
本文提出了一种多线程微处理器微体系结构EDSMT。EDSMT有效结合显示并行指令计算 EPIC和动态同时多线程DSMT技术,通过软、硬件协同的方式充分开发和有效支持多个层次的并行性。EDSMT能够降低硬件设计的复杂性,提高微处理器性能。
关键词 微处理器 EDsmt 微体系结构 多线程处理器
在线阅读 下载PDF
超标量处理器中引入SMT技术的性能分析研究 被引量:1
2
作者 史莉雯 樊晓桠 黄小平 《计算机工程与应用》 CSCD 北大核心 2009年第5期13-15,共3页
同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"... 同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"为基础,引入SMT技术,在基本不改变内部结构大小、不增加执行功能部件、仅做一些必要修改的前提条件下进行研究。通过仿真不同的线程数和各种线程组合,进行性能分析。尽管存在制约性能提升的一些因素,引入SMT技术后依然获得了最高约50%的性能增加。 展开更多
关键词 超标量处理器 同时多线程 每周期完成的指令数(IPC)
在线阅读 下载PDF
面向SMT体系结构的片上资源分配策略研究
3
作者 张骏 樊晓桠 刘松鹤 《计算机科学》 CSCD 北大核心 2008年第6期135-138,共4页
SMT处理器通过同时执行来自多个线程中的指令来提高性能,所有线程通过竞争共享的方式来最大化片上资源的利用率。然而,SMT处理器的集中控制结构所固有的线延迟约束和多个线程对片上资源持有的不均衡性使得设计者不得不考虑在线程间进行... SMT处理器通过同时执行来自多个线程中的指令来提高性能,所有线程通过竞争共享的方式来最大化片上资源的利用率。然而,SMT处理器的集中控制结构所固有的线延迟约束和多个线程对片上资源持有的不均衡性使得设计者不得不考虑在线程间进行资源分配,来减少通信延迟和可能出现的线程饥饿。本文介绍了针对SMT体系结构片上资源分配的基本原理、研究内容;分析了片上资源分配对SMT体系结构造成的影响;从显式和隐式两个角度讨论了SMT体系结构片上资源分配策略的运行机制和设计方法;举例分析了POWER5处理器的动态资源平衡策略;最后,展望了SMT处理器片上资源分配的未来发展趋势。 展开更多
关键词 同时多线程 处理器 资源划分
在线阅读 下载PDF
OpenSMT:一个同时多线程处理器模拟器的设计和实现 被引量:4
4
作者 路放 安虹 +1 位作者 梁博 任建 《计算机科学》 CSCD 北大核心 2006年第1期158-163,共6页
同时多线程(SMT)技术是目前微处理器体系结构的研究热点之一。为了支持对 SMT 技术和基于 SMT 核的单芯片多处理器(CMP)体系结构技术的深入研究,我们在广泛使用的超标体系结构模拟器 SimpkScalar 的基础上.通过对 SMT 结构的关键特性进... 同时多线程(SMT)技术是目前微处理器体系结构的研究热点之一。为了支持对 SMT 技术和基于 SMT 核的单芯片多处理器(CMP)体系结构技术的深入研究,我们在广泛使用的超标体系结构模拟器 SimpkScalar 的基础上.通过对 SMT 结构的关键特性进行适当的抽象,开发了一个 SMT 体系结构模拟器 OpenSMT。本文介绍了该模拟器主要的设计思想和实现方法,包括多个线程上下文结构的表示、超标量流水线各个阶段的模拟,以及模拟器设计和实现时需要解决的几个关键问题等。初步的应用研究表明,与现有可免费获得的研究用 SMT 模拟器相比,该模拟器能够较好地平衡模拟性能、灵活性和精度三个基本设计目标.实现了执行驱动、易于扩展指令集结构、艮好的用户接口、灵活的软件结构、适宜评估更广泛的 SMT、体系结构设计空间等设计要求。 展开更多
关键词 处理器模拟器 同时多线程 软件模型 结构模型 性能评价
在线阅读 下载PDF
基于同时多线程的IFSBSMT取指策略研究
5
作者 李静梅 关海洋 《计算机科学》 CSCD 北大核心 2012年第8期311-315,共5页
取指策略直接影响处理器的指令吞吐率。针对传统处理器取指策略存在取指带宽利用不均衡、指令队列冲突率高的缺点,提出基于同时多线程处理器的取指策略IFSBSMT。该策略以线程的IPC值为基础,选取优先级高的线程进行取指,并利用预取指令... 取指策略直接影响处理器的指令吞吐率。针对传统处理器取指策略存在取指带宽利用不均衡、指令队列冲突率高的缺点,提出基于同时多线程处理器的取指策略IFSBSMT。该策略以线程的IPC值为基础,选取优先级高的线程进行取指,并利用预取指令条数预算的方式分配取指带宽,采取线程IPC值和L2Cache缺失率的双优先级动态资源分配机制分配处理器的系统资源。研究结果表明,IFSBSMT策略有效地解决了取指带宽、指令队列冲突及资源浪费问题,进一步提高了指令吞吐率,且具有较好的取指公平性。 展开更多
关键词 同时多线程 取指策略 IFSBsmt 取指带宽 指令队列冲突 双优先级动态资源分配
在线阅读 下载PDF
浮点与整数资源区别分配的SMT处理器取指策略
6
作者 蒋生健 胡向东 杨剑新 《计算机工程》 CAS CSCD 北大核心 2017年第4期46-51,共6页
在同时多线程处理器中,各线程对于浮点和整数资源需求不同,合理分配线程的共享资源是提升处理器整体性能的重要因素。为此,提出一种浮点与整数资源区别分配的取指策略,合理分配各个线程对于浮点和整数资源的使用情况。实验结果表明,与IC... 在同时多线程处理器中,各线程对于浮点和整数资源需求不同,合理分配线程的共享资源是提升处理器整体性能的重要因素。为此,提出一种浮点与整数资源区别分配的取指策略,合理分配各个线程对于浮点和整数资源的使用情况。实验结果表明,与ICOUNT,STALL等策略相比,该策略在算术平均IPC和调和平均IPC方面均取得一定的性能提升,同时其在处理浮点和整数混合型程序时也具有优势。 展开更多
关键词 同时多线程 取指策略 资源分配 线程级并行 浮点 整数
在线阅读 下载PDF
一种改进的SMT模拟器——支持Oracle机制和多种取指策略
7
作者 唐新民 董岚 +2 位作者 季振洲 唐朔飞 崔光佐 《计算机工程与应用》 CSCD 北大核心 2005年第14期57-60,共4页
模拟器是计算机系统设计中非常重要的一种技术。O racle研究能够用来确定所研究问题的最优或最差情况,为正常研究提供有用的辅助信息。但是现在常用的一些同步多线程(SM T)模拟器都不能提供支持O racle研究所需的信息。文章结合原有模... 模拟器是计算机系统设计中非常重要的一种技术。O racle研究能够用来确定所研究问题的最优或最差情况,为正常研究提供有用的辅助信息。但是现在常用的一些同步多线程(SM T)模拟器都不能提供支持O racle研究所需的信息。文章结合原有模拟器的基础,提供了一种新的支持O racle研究的模拟平台。同时原SM T模拟器只支持ICO UNT这一种取指策略,文章在原模拟器基础上,又增加了BR COU NT和M ISSCO UNT这两种通用的取指策略。 展开更多
关键词 同步多线程 模拟器 Oracle研究 取指策略
在线阅读 下载PDF
同时多线程技术 被引量:8
8
作者 刘权胜 杨洪斌 吴悦 《计算机工程与设计》 CSCD 北大核心 2008年第4期963-967,共5页
同时多线程技术结合了超标量处理器与多线程处理器两者的优点,通过增加很少的硬件资源,把一个物理核映射为多个逻辑核,成为一种研制高性能处理器的重要途径。重点介绍了同时多线程处理器出现的原因、优点、基本组成结构、当前的研究成... 同时多线程技术结合了超标量处理器与多线程处理器两者的优点,通过增加很少的硬件资源,把一个物理核映射为多个逻辑核,成为一种研制高性能处理器的重要途径。重点介绍了同时多线程处理器出现的原因、优点、基本组成结构、当前的研究成果及影响,并探讨了当前同时多线程技术的发展趋势。 展开更多
关键词 模型 处理器 多线程 同时多线程 同时多线程处理器
在线阅读 下载PDF
一种与缓冲区紧耦合的环形循环滑动窗口的数据流抽取算法 被引量:10
9
作者 詹英 吴春明 王宝军 《电子学报》 EI CAS CSCD 北大核心 2011年第4期894-898,共5页
许多应用领域产生数据流的流量不断增大,需要挖掘系统提供更有效的数据流抽取策略来应对数据处理能力与流速之间的矛盾.本文构造了基于环形缓冲区循环的逻辑滑动窗口(环形循环滑动窗口),将环形缓冲区和环形循环滑动窗口紧耦合,提出了基... 许多应用领域产生数据流的流量不断增大,需要挖掘系统提供更有效的数据流抽取策略来应对数据处理能力与流速之间的矛盾.本文构造了基于环形缓冲区循环的逻辑滑动窗口(环形循环滑动窗口),将环形缓冲区和环形循环滑动窗口紧耦合,提出了基于环形循环滑动窗口的数据流抽取算法.实验表明这是适合数据流流动和方便数据流挖掘的数据流抽取模型,能够提升数据流抽取速度和保证数据流的挖掘持续正常实施. 展开更多
关键词 数据流 环形循环滑动窗口 环形缓冲区 多线程
在线阅读 下载PDF
汽车变速箱性能检测系统的设计 被引量:10
10
作者 王志鹏 马孝江 +2 位作者 张志新 蔡悦 李吉 《机械科学与技术》 CSCD 北大核心 2002年第1期45-46,49,共3页
随着汽车工业的迅猛发展 ,变速箱作为汽车的重要传动部件 ,其操作性、传动性与安全性日显重要 ,因此本研究所研制和开发了“汽车变速箱性能检测系统”。本文首先从整体上介绍了该系统的构成 ,其次详细论述了信号测试系统的测试参数和测... 随着汽车工业的迅猛发展 ,变速箱作为汽车的重要传动部件 ,其操作性、传动性与安全性日显重要 ,因此本研究所研制和开发了“汽车变速箱性能检测系统”。本文首先从整体上介绍了该系统的构成 ,其次详细论述了信号测试系统的测试参数和测试原理 ,最后详细介绍了软件系统的体系结构以及各子系统的功能 。 展开更多
关键词 实时性 性能检测系统 体系结构 多线程 并发性 汽车
在线阅读 下载PDF
龙芯2号处理器的同时多线程设计 被引量:10
11
作者 李祖松 许先超 +1 位作者 胡伟武 唐志敏 《计算机学报》 EI CSCD 北大核心 2009年第11期2265-2273,共9页
提出了适合龙芯2号处理器的同时多线程处理器模型,并介绍了具体的微体系结构设计以及相应的Linux操作系统的实现方案.通过在设计的龙芯2号同时多线程处理器上启动Linux操作系统,并运行应用程序,例如SPEC CPU2000,进行性能评测.结果表明... 提出了适合龙芯2号处理器的同时多线程处理器模型,并介绍了具体的微体系结构设计以及相应的Linux操作系统的实现方案.通过在设计的龙芯2号同时多线程处理器上启动Linux操作系统,并运行应用程序,例如SPEC CPU2000,进行性能评测.结果表明,龙芯2号同时多线程处理器通过挖掘线程级并行性,将龙芯2号处理器的性能提高了31.1%. 展开更多
关键词 龙芯2 同时多线程 微体系结构 LINUX操作系统
在线阅读 下载PDF
同时多线程处理器上的Cache性能分析与优化 被引量:2
12
作者 隋秀峰 吴俊敏 陈国良 《小型微型计算机系统》 CSCD 北大核心 2009年第1期159-163,共5页
同时多线程(SMT)是一种延迟容忍的体系结构,它在每个周期内可以执行多个线程的多条指令.在SMT处理器上,对于片上共享存储这个复杂的结构资源,至今还没有很好的共享和冲突解决方案.本文着重研究了在多个并发执行的线程间划分共享Cache所... 同时多线程(SMT)是一种延迟容忍的体系结构,它在每个周期内可以执行多个线程的多条指令.在SMT处理器上,对于片上共享存储这个复杂的结构资源,至今还没有很好的共享和冲突解决方案.本文着重研究了在多个并发执行的线程间划分共享Cache所存在的问题,指出基于LRU策略的传统Cache会根据需要隐式地划分共享Cache,这在某些情况下会导致全局性能的下降.针对这一问题并且考虑到SMT处理器上对Cache访问带宽的需求,本文提出采用一种多模块多体的Cache结构设计方案.并且在一个修改过的SMT模拟器上对该设计方案进行了性能评价.实验结果显示,相比于基于LRU策略的传统Cache,这一结构可以将一个4路SMT处理器的IPC提高9%. 展开更多
关键词 同时多线程 高速缓存 仿真
在线阅读 下载PDF
基于现代通用处理器的数据库优化综述 被引量:4
13
作者 邓亚丹 景宁 熊伟 《计算机科学》 CSCD 北大核心 2009年第8期17-20,共4页
随着硬件技术的不断发展,计算机性能不断加强,数据库的性能也日益提高。但也造成了一些新问题,比如Cache延迟的加剧、Cache访问冲突等。针对这些新问题,按照各种优化技术的分类,深入分析了近10年来现代处理器用于数据库算法优化的各种... 随着硬件技术的不断发展,计算机性能不断加强,数据库的性能也日益提高。但也造成了一些新问题,比如Cache延迟的加剧、Cache访问冲突等。针对这些新问题,按照各种优化技术的分类,深入分析了近10年来现代处理器用于数据库算法优化的各种研究成果,并展望了未来基于新硬件的数据库优化的发展趋势。 展开更多
关键词 CACHE优化 多线程优化 多核处理器 smt
在线阅读 下载PDF
一种支持同时多线程的VLIW DSP架构 被引量:12
14
作者 沈钲 孙义和 《电子学报》 EI CAS CSCD 北大核心 2010年第2期352-358,共7页
本文提出了一种支持同时多线程的动态分发超长指令字(VLIW)数字信号处理器(DSP)架构.该DSP架构上可以同时运行多个线程,功能单元可以执行来自多个线程的指令,有效地提高DSP的指令吞吐率.为了使多个线程的指令更有效地调度分发到功能单元... 本文提出了一种支持同时多线程的动态分发超长指令字(VLIW)数字信号处理器(DSP)架构.该DSP架构上可以同时运行多个线程,功能单元可以执行来自多个线程的指令,有效地提高DSP的指令吞吐率.为了使多个线程的指令更有效地调度分发到功能单元,该DSP架构还支持指令动态分发,由硬件分发单元而不是编译器来完成多线程指令的动态分配.实验结果表明,相比于单线程而言,本文提出的VLIW DSP架构可以提高功能单元利用率,隐藏存储器访问时延,使处理器的指令吞吐率平均提高约26.89%. 展开更多
关键词 同时多线程 超长指令字 数字信号处理器
在线阅读 下载PDF
龙芯2号同时多线程处理器的软硬件接口设计 被引量:2
15
作者 李祖松 许先超 +1 位作者 胡伟武 唐志敏 《软件学报》 EI CSCD 北大核心 2007年第7期1806-1817,共12页
随着生产工艺的提高,芯片上能集成越来越多的晶体管,多线程技术也逐步成为一种主流的处理器体系结构技术,而多线程处理器的软硬件接口也就成为急需解决的问题.在分析同时多线程的软件需求的基础上,提出龙芯2号同时多线程处理器的软硬件... 随着生产工艺的提高,芯片上能集成越来越多的晶体管,多线程技术也逐步成为一种主流的处理器体系结构技术,而多线程处理器的软硬件接口也就成为急需解决的问题.在分析同时多线程的软件需求的基础上,提出龙芯2号同时多线程处理器的软硬件接口协同设计解决方案,给出相应的操作系统实现方案.同时,在Linux2.4.20的基础上实现了龙芯2号同时多线程处理器相应的操作系统.通过运行SPEC CPU2000等测试程序进行性能评测,充分说明实现软硬件接口的龙芯2号同时多线程处理器极大地提高了多进程负载的性能.分析和设计方案不仅适用于同时多线程处理器,而且对于片内多核处理器的设计也有借鉴作用. 展开更多
关键词 龙芯2号 同时多线程 微体系结构 LINUX操作系统
在线阅读 下载PDF
一种具有QoS特性的同时多线程处理器取指策略 被引量:4
16
作者 何立强 刘志勇 《计算机研究与发展》 EI CSCD 北大核心 2006年第11期1980-1984,共5页
同时多线程处理器通过每时钟周期从多个运行的线程取指令执行,从而极大地提高了处理器的性能.建议了一种具有QoS特性的同时多线程处理器取指策略,并讨论了其在QoS管理方面的问题.该策略的核心思想是利用线程的优先级和流速来同时控制线... 同时多线程处理器通过每时钟周期从多个运行的线程取指令执行,从而极大地提高了处理器的性能.建议了一种具有QoS特性的同时多线程处理器取指策略,并讨论了其在QoS管理方面的问题.该策略的核心思想是利用线程的优先级和流速来同时控制线程的取指过程,从而满足线程在执行速度上的QoS需求.与传统的基于纯优先级的取指策略相比,该策略不但具有QoS特性,同时还可以更加有效地分配取指带宽,从而能获得更高的处理器性能.该策略的物理实现非常简单.模拟实验的结果表明,该策略在提供QoS支持的基础上,可以在传统的基于优先级的取指策略ICOUNT的基础上提高15%的系统性能. 展开更多
关键词 同时多线程处理器 取指策略 服务质量
在线阅读 下载PDF
RSA踪迹驱动指令Cache计时攻击研究 被引量:3
17
作者 陈财森 王韬 +1 位作者 郭世泽 周平 《软件学报》 EI CSCD 北大核心 2013年第7期1683-1694,共12页
指令Cache攻击是基于获取算法执行路径的一种旁路攻击方式.首先,通过分析原有RSA指令Cache计时攻击存在可行性不高且能够获取的幂指数位不足等局限性,建立了新的基于监视整个指令Cache而不只是监视特定指令Cache的踪迹驱动计时攻击模型... 指令Cache攻击是基于获取算法执行路径的一种旁路攻击方式.首先,通过分析原有RSA指令Cache计时攻击存在可行性不高且能够获取的幂指数位不足等局限性,建立了新的基于监视整个指令Cache而不只是监视特定指令Cache的踪迹驱动计时攻击模型;然后,提出了一种改进的基于SWE算法窗口大小特征的幂指数分析算法;最后,在实际环境下,利用处理器的同步多线程能力确保间谍进程与密码进程能够同步运行.针对OpenSSLv.0.9.8f中的RSA算法执行指令Cache计时攻击实验,实验结果表明:新的攻击模型在实际攻击中具有更好的可操作性;改进的幂指数分析算法能够进一步缩小密钥搜索空间,提高了踪迹驱动指令Cache计时攻击的有效性.对于一个512位的幂指数,新的分析算法能够比原有分析算法多恢复出大约50个比特位. 展开更多
关键词 指令Cache计时攻击 旁路攻击 RSA密码算法 踪迹驱动 同步多线程
在线阅读 下载PDF
同时多线程结构的2级调度策略 被引量:2
18
作者 王晶 樊晓桠 +1 位作者 张盛兵 王海 《西北工业大学学报》 EI CAS CSCD 北大核心 2007年第3期433-437,共5页
微处理器的发展已经迈入多线程时代。在同时多线程(SMT)结构中,多个线程共享一个取指单元和指令队列(IQ),如何提高有效取指带宽和IQ利用率是关键问题。论文详细分析了SMT中导致IQ阻塞的因素,以及它们对IPC的影响。基于线程预构思想,将导... 微处理器的发展已经迈入多线程时代。在同时多线程(SMT)结构中,多个线程共享一个取指单元和指令队列(IQ),如何提高有效取指带宽和IQ利用率是关键问题。论文详细分析了SMT中导致IQ阻塞的因素,以及它们对IPC的影响。基于线程预构思想,将导致IQ阻塞的多个因素分开考虑,提出将线程调度分成预构取指调度和队列取指调度的2级调度。采用基于置信度的线程调度策略用于线程预构,采用基于阈值门限的调度策略用于队列取指。仿真结果表明,2级调度策略与ICOUNT策略相比,错误路径指令可减少18.22%(取指级)、5.93%(执行级),IQ阻塞的概率减少27%(整数队列),IPC提高9.4%。 展开更多
关键词 同时多线程 指令队列 置信度估计 取指调度 线程调度
在线阅读 下载PDF
同时多微线程体系结构研究 被引量:1
19
作者 李祖松 许先超 +1 位作者 胡伟武 唐志敏 《计算机研究与发展》 EI CSCD 北大核心 2007年第5期768-774,共7页
随着生产工艺的提高,芯片上能集成越来越多的晶体管,多线程技术也逐步成为一种主流的处理器体系结构技术.提出一种融合同时多线程技术和微线程技术的新型体系结构同时多微线程(simul-taneous multi-microthreading,SMMT),并给出同时多... 随着生产工艺的提高,芯片上能集成越来越多的晶体管,多线程技术也逐步成为一种主流的处理器体系结构技术.提出一种融合同时多线程技术和微线程技术的新型体系结构同时多微线程(simul-taneous multi-microthreading,SMMT),并给出同时多微线程体系结构的实现方案.SMMT有效结合同时多线程技术硬件代价小和微线程技术能够加速单进程应用的优点,通过软硬件协同的方式充分挖掘单进程程序的微线程级并行性.通过在设计的龙芯2号同时多微线程处理器上进行性能评测,结果表明,同时多微线程体系结构能够有效地加速单进程的程序,以很小的硬件代价显著地提高了处理器的性能. 展开更多
关键词 同时多微线程 龙芯2 同时多线程 微线程 体系结构
在线阅读 下载PDF
ARP:同时多线程处理器中共享Cache自适应运行时划分机制 被引量:3
20
作者 隋秀峰 吴俊敏 陈国良 《计算机研究与发展》 EI CSCD 北大核心 2008年第7期1269-1277,共9页
同时多线程是一种延迟容忍的体系结构,采用共享的二级Cache,在每个周期内可以执行多个线程的多条指令,这就会增加对存储层次的压力.文中主要研究了SMT处理器中多个并发执行的线程之间共享Cache的划分问题,尤其是Cache共享中的公平性问... 同时多线程是一种延迟容忍的体系结构,采用共享的二级Cache,在每个周期内可以执行多个线程的多条指令,这就会增加对存储层次的压力.文中主要研究了SMT处理器中多个并发执行的线程之间共享Cache的划分问题,尤其是Cache共享中的公平性问题以及它和吞吐量之间的关系.传统的LRU策略会根据线程的需要隐式地划分共享Cache,给具有较高需求的线程分配较多的Cache空间,对Cache的管理具有不公平性,从而会引起线程饿死、优先级反转等问题.实现了一种自适应、运行时划分机制(ARP)来管理共享Cache.ARP采用公平性作为划分的度量,并且使用动态划分算法来优化公平性,该算法具有易于实现,所需剖析较少的特点,硬件上使用经典的监控器来收集每个线程的栈距离信息,其存储开销不到0.25%.实验结果显示,与基于LRU的Cache划分相比,ARP可以将一个2路SMT处理器的公平性提高2.26倍,而将吞吐量平均提高14.75%. 展开更多
关键词 同时多线程 共享高速缓存 动态划分 动态组采样 高速缓存公平性
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部