期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
萤火虫2:一种多态并行机的硬件体系结构 被引量:16
1
作者 李涛 杨婷 +5 位作者 易学渊 蒲林 钱博文 黄光新 黄虎才 韩俊刚 《计算机工程与科学》 CSCD 北大核心 2014年第2期191-200,共10页
提出了一种新型的多态高效并行阵列机结构——萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机... 提出了一种新型的多态高效并行阵列机结构——萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机能够实现效率很高的线程级并行运算、数据级并行运算和分布式指令级并行运算。尤其值得指出的是,此种阵列机的流处理性能堪与专用集成电路匹敌。该结构还能有效实现静态与动态数据流计算,可以高效实现图形、图像和数字信号处理任务。 展开更多
关键词 阵列机 多态处理器 计算机图形 图像处理 信号处理 数据级并行 线程级并行
在线阅读 下载PDF
基于TMS320C6201的并行高速实时数字脉冲压缩系统研究 被引量:8
2
作者 李方慧 龙腾 毛二可 《电子学报》 EI CAS CSCD 北大核心 2001年第9期1272-1275,共4页
线性调频脉冲是最经典的大时宽-带宽积信号形式,但是这种信号的数字处理需要极大的处理量.本文研制了一个基于TMS320C6201的高速实时数字脉冲压缩系统,具有1600MIPS处理能力.针对TMS320C6201的特点... 线性调频脉冲是最经典的大时宽-带宽积信号形式,但是这种信号的数字处理需要极大的处理量.本文研制了一个基于TMS320C6201的高速实时数字脉冲压缩系统,具有1600MIPS处理能力.针对TMS320C6201的特点,提出了在VLIW体系结构下,提高FFT并行运算效率的方法,从而使系统完成512点数字脉冲压缩的时间仅为124us,基本达到TMS320C6201的性能极限.针对系统定点运算的问题,提出了定点FFT的改进算法,可以兼顾运算速度和精度的要求;对所提出的定点算法的误差进行了理论分析,并在实际的系统中验证了理论分析的结果.研究并解决了系统实现中高速电路等关键技术问题.目前,该系统已成功应用于某雷达系统中,长期工作稳定可靠. 展开更多
关键词 数字信号处理 线性调频 数字脉冲压缩 TMS320C6201 雷达
在线阅读 下载PDF
LU分解在众核结构仿真器上的指令级调度研究 被引量:5
3
作者 余磊 刘志勇 +1 位作者 宋风龙 叶笑春 《系统仿真学报》 CAS CSCD 北大核心 2011年第12期2603-2610,共8页
随着集成电路工艺的发展,众核处理器体系结构逐渐成为计算机体系结构设计者的研究热点。众核体系结构通过任务级的并行来提升整个处理器的性能。然而,指令级的并行性仍然是众核设计者需要认真考虑的问题。对浮点运算效率和加速比进行了... 随着集成电路工艺的发展,众核处理器体系结构逐渐成为计算机体系结构设计者的研究热点。众核体系结构通过任务级的并行来提升整个处理器的性能。然而,指令级的并行性仍然是众核设计者需要认真考虑的问题。对浮点运算效率和加速比进行了形式化描述,验证了进行指令级调度的必要性。对处理器核内流水线进行详细分析,指出了指令级调度的一般性问题。提出了在众核结构上使用指令级调度和软件流水的方法。针对Splash2程序集里的LU分解算法,使用众核结构的硬件支持,在Scratched Pad Memory(SPM)上给出了调度指令的方案。在众核仿真器Godson-T上仿真了经过指令级调度后的算法,当使用64个线程处理512×512的矩阵时,程序性能达到调度前性能的4倍。 展开更多
关键词 计算机体系结构 众核 加速比 指令级并行 LU分解
在线阅读 下载PDF
VLIW处理器ISA建模与辅助软件优化技术 被引量:3
4
作者 严迎建 叶建森 +1 位作者 刘军伟 徐劲松 《计算机工程与设计》 CSCD 北大核心 2009年第11期2727-2729,2752,共4页
在基于VLIW结构的分组密码专用处理器设计过程中,研究了VLIW处理器的指令集体系结构建模技术。设计了一个指令精确的指令集模拟器,通过附加一个流水线相关及停顿统计模块,实现了周期精确的程序运行统计和流水线停顿统计。结合指令集模... 在基于VLIW结构的分组密码专用处理器设计过程中,研究了VLIW处理器的指令集体系结构建模技术。设计了一个指令精确的指令集模拟器,通过附加一个流水线相关及停顿统计模块,实现了周期精确的程序运行统计和流水线停顿统计。结合指令集模拟器、汇编器以及调试器,设计了一个面向VLIW处理器的辅助程序优化环境。利用模拟器和调试器来评估程序的指令级并行度以及资源占用情况,辅助程序开发者优化VLIW处理器程序,从而达到软硬件协作开发VLIW处理器指令级并行性的最终目的。 展开更多
关键词 超长指令字(VLIW) 处理器建模 指令集体系结构 指令集模拟器 指令级并行
在线阅读 下载PDF
高性能微处理器设计技术 被引量:2
5
作者 康宝祥 栾贵兴 《小型微型计算机系统》 CSCD 北大核心 1994年第10期1-10,共10页
最近几年,微处理器设计技术迅速发展,高性能微处理器已经成为当代各类计算机系统的主要支柱。本文首先简要回顾微处理器的发展过程,然后着重介绍微处理器的设计技术,接着概述微处理器的应用,最后介绍国内情况并提出几点看法。
关键词 体系结构 微处理器 设计
在线阅读 下载PDF
一种超椭圆曲线密码处理器并行结构设计 被引量:2
6
作者 方跃坚 沈晴霓 吴中海 《计算机研究与发展》 EI CSCD 北大核心 2013年第11期2383-2388,共6页
提出了一种超椭圆曲线密码处理器并行结构设计.处理器由多个具有相同结构的核组成,每个核由一个控制器、一个寄存器文件、一个运算单元组成.多个独立的核之间通过寄存器共享进行通信来协作完成复杂运算.每个运算单元执行自定义多操作数... 提出了一种超椭圆曲线密码处理器并行结构设计.处理器由多个具有相同结构的核组成,每个核由一个控制器、一个寄存器文件、一个运算单元组成.多个独立的核之间通过寄存器共享进行通信来协作完成复杂运算.每个运算单元执行自定义多操作数指令A(B+C)+D,并在指令产生过程和执行时对指令进行灵活配置.该设计可以实现核之间的指令级并行处理和不同指令执行阶段的流水线处理.在FPGA上的实验结果表明,与以往研究相比,该设计可以实现对超椭圆曲线密码点乘运算更高的加速. 展开更多
关键词 超椭圆曲线密码系统 并行结构 自定义指令 指令级并行 流水线技术 FPGA
在线阅读 下载PDF
新型体系结构概念──虚拟寄存器与并行的指令处理部件 被引量:3
7
作者 李三立 廖恒 《小型微型计算机系统》 CSCD 北大核心 1995年第6期6-11,共6页
随着程序对地址空间的需求日益提高,研究者提出了虚拟存储器概念,使程序访问的地址空间免受物理存储器的限制、随着面向寄存器的RISC技术发展以及多发射结构中指令调度的日益重要,我们提出了虚拟寄存器的新概念,使寄存器空间不... 随着程序对地址空间的需求日益提高,研究者提出了虚拟存储器概念,使程序访问的地址空间免受物理存储器的限制、随着面向寄存器的RISC技术发展以及多发射结构中指令调度的日益重要,我们提出了虚拟寄存器的新概念,使寄存器空间不受物理寄存器堆大小的束缚,有利于指令调度和寄存器重新命名技术,提高指令级并行性ILP。此外,现代新型RISC处理机都着重于加强数据处理部件中的执行并行度,忽略了放在存储器中指令的处理。我们提出了与数据处理部件能并行工作的指令处理部件设计;经过预处理的指令流提供给处理数据的多执行部件,从而可以进一步显著提高指令级并行性ILP。 展开更多
关键词 虚拟寄存器 指令处理部件 微处理机 体系结构
在线阅读 下载PDF
一个新的多分支全局软件流水方法 被引量:1
8
作者 汤志忠 张赤红 陈刚 《软件学报》 EI CSCD 北大核心 1996年第1期16-24,共9页
在指令级并行性很高的体系结构中,为了得到比较好的并行优化效果,通常需要设置多个分支控制机构,本文提出一个新的支持多个分支操作并行执行的全局软件流水方法──GPMB.并用衡量全局软件流水方法性能的两个主要参数:时间开销... 在指令级并行性很高的体系结构中,为了得到比较好的并行优化效果,通常需要设置多个分支控制机构,本文提出一个新的支持多个分支操作并行执行的全局软件流水方法──GPMB.并用衡量全局软件流水方法性能的两个主要参数:时间开销和空间开销把我们的方法与其它几种全局软件流水方法进行了比较.模拟实验结果表明:GPMB方法的时间开销和空间开销都比较小,所需要的硬件支持也比较少. 展开更多
关键词 多分支循环 软件流水 指令级 程序 并行性
在线阅读 下载PDF
一个支持多分支循环最优执行的VLIW体系结构
9
作者 汤志忠 张赤红 +1 位作者 苏伯珙 赵巍 《计算机研究与发展》 EI CSCD 北大核心 1995年第8期1-9,共9页
本文首先提出一个能够支持多分支循环程序最优执行的VLIW体系结构模型,然后在这个模型的基础上设计了一个新的主要用于数字信号处理及图象处理应用领域的单片体系结构──URPR-2。在这个体系结构中,属于不同路径和不同循环... 本文首先提出一个能够支持多分支循环程序最优执行的VLIW体系结构模型,然后在这个模型的基础上设计了一个新的主要用于数字信号处理及图象处理应用领域的单片体系结构──URPR-2。在这个体系结构中,属于不同路径和不同循环体的多个分支操作可以在一个节拍内同时被执行,因此可以在更大范围内开发指令级并行性。同时还提出了一种叫作流水控制黑板的机制来支持条件分支操作。URPR-2不仅能够以很高的速度执行只含有基本块的循环程序,而且还能够以较低的时间及空间开销来运行含有多个分支的循环程序。 展开更多
关键词 VLIW 体系结构 多分支循环 流水控制黑板
在线阅读 下载PDF
一个VLIW体系结构的单片多处理机
10
作者 汤志忠 张赤红 《计算机研究与发展》 EI CSCD 北大核心 1993年第10期1-8,共8页
本文介绍一个采用VLIW 超长指令字体系结构的高性能单片多处理机,在这个体系结构中采用流水寄存器堆来消除循环程序内的数据相关,从而使程序能够在指令级以极高的并行度并行运行。模拟实验结果表明这个体系结构具有很高的运算速度和很... 本文介绍一个采用VLIW 超长指令字体系结构的高性能单片多处理机,在这个体系结构中采用流水寄存器堆来消除循环程序内的数据相关,从而使程序能够在指令级以极高的并行度并行运行。模拟实验结果表明这个体系结构具有很高的运算速度和很好的性能价格比。 展开更多
关键词 VLIW 体系结构 单片多处理机
在线阅读 下载PDF
RISC多发射结构中循环优化的软件流水算法 被引量:1
11
作者 罗玉华 李三立 《计算机学报》 EI CSCD 北大核心 1993年第9期692-700,共9页
软件流水技术是一种很有效的循环优化方法。本文综述了软件流水的基本思想和算法分类;详细描述了三个典型的算法——LAM的算法,完善流水法和增强流水调度法;从时间优化效益,空间效益和计算复杂度等方面对它们作了分析比较;最后,对软件... 软件流水技术是一种很有效的循环优化方法。本文综述了软件流水的基本思想和算法分类;详细描述了三个典型的算法——LAM的算法,完善流水法和增强流水调度法;从时间优化效益,空间效益和计算复杂度等方面对它们作了分析比较;最后,对软件流水技术作了评价。 展开更多
关键词 多发射结构 软件流水 循环优化
在线阅读 下载PDF
数据并行计算机体系结构研究
12
作者 王鹏飞 张发存 段敬红 《计算机工程》 CAS CSCD 北大核心 2011年第15期249-251,共3页
通过对国内外并行计算机体系结构的分析与研究,提出一种面向多媒体应用的嵌入式数据并行计算机体系结构模型,将可重构总线与PIM技术相结合,弥补传统PIM体系结构下处理元之间通信复杂度高、结构可适应性弱等不足。描述其主要部件的功能... 通过对国内外并行计算机体系结构的分析与研究,提出一种面向多媒体应用的嵌入式数据并行计算机体系结构模型,将可重构总线与PIM技术相结合,弥补传统PIM体系结构下处理元之间通信复杂度高、结构可适应性弱等不足。描述其主要部件的功能和结构,定义该体系结构计算机的指令集,通过一个典型的算法样例介绍其汇编语言程序组成和并行计算过程。 展开更多
关键词 PIM技术 数据并行体系结构 可重构总线 处理元阵列 指令集体系结构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部