期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
面向密码流体系结构的超长指令字可重构研究 被引量:2
1
作者 严迎建 王寿成 +1 位作者 徐进辉 陈韬 《电子与信息学报》 EI CSCD 北大核心 2017年第1期206-212,共7页
可重构密码流体系结构是一种面向密码运算的新型体系结构,但存在着超长指令字(VLIW)代码稀疏和Kernel体积过大的问题。该文以可重构密码流处理架构S-RCCPA为研究平台,通过大量密码算法在S-RCCPA架构上的适配分析,提出了VLIW可重构技术,... 可重构密码流体系结构是一种面向密码运算的新型体系结构,但存在着超长指令字(VLIW)代码稀疏和Kernel体积过大的问题。该文以可重构密码流处理架构S-RCCPA为研究平台,通过大量密码算法在S-RCCPA架构上的适配分析,提出了VLIW可重构技术,并设计了Kernel级指令集、VLIW可重构算法及指令可重构单元。实验证明,该技术能够有效提高VLIW的指令密度,同时降低了VLIW的指令宽度,使得整个Kernel体积减小了约33.3%,并将微码存储器的容量由96 k B降为64 k B,有效降低芯片整体面积和系统功耗。 展开更多
关键词 密码流处理器 Kernel级指令 超长指令字 可重构 指令密度
在线阅读 下载PDF
一种适用于低功耗超长指令字DSP处理器的硬件循环缓冲设计(英文) 被引量:1
2
作者 苏叶华 刘建 陈杰 《电子器件》 CAS 2007年第5期1866-1869,1873,共5页
提出了用于VLI WDSP处理器的硬件循环缓冲器的设计.该DSP处理器在结构上利用了在信号处理程序中循环经常出现这一特点,专门设计了硬件循环处理模块用来消除因循环跳转造成的流水线等待,以达到循环的零开销处理从而提高DSP的性能.设计过... 提出了用于VLI WDSP处理器的硬件循环缓冲器的设计.该DSP处理器在结构上利用了在信号处理程序中循环经常出现这一特点,专门设计了硬件循环处理模块用来消除因循环跳转造成的流水线等待,以达到循环的零开销处理从而提高DSP的性能.设计过程中为了减小硬件开销,对循环的长度特点进行了分析,把循环分类两类并用不同的方法处理.结果表明循环跳转的处理是在独立模块中操作,没有造成流水线的等待提高了性能,该硬件循环的面积是3 .8 k逻辑门. 展开更多
关键词 超大规模集成电路 硬件循环 零开销 信号处理器 指令缓冲器 超长指令字
在线阅读 下载PDF
基于超长指令字的顶点染色处理器设计 被引量:1
3
作者 徐起超 杜慧敏 刘青楠 《微电子学与计算机》 CSCD 北大核心 2018年第10期13-18,共6页
为了提高嵌入式图形处理器GPU(Graphic Process Unit)中顶点染色处理器,设计了一款超长指令字格式的可编程顶点染色处理器,采用六级流水线实现,每条指令在同一个周期最多执行7种操作,软硬件协同设计,降低了功耗.采用基于FPGA的验证方式... 为了提高嵌入式图形处理器GPU(Graphic Process Unit)中顶点染色处理器,设计了一款超长指令字格式的可编程顶点染色处理器,采用六级流水线实现,每条指令在同一个周期最多执行7种操作,软硬件协同设计,降低了功耗.采用基于FPGA的验证方式,可编程顶点染色处理器在Xilinx Virtex-7FPGAs V2000T上最大工作频率达到50MHz,顶点的处理速度达到0.16M/s,处理一个顶点平均44个周期,在Synopsys公司Design Compiler工具130μm工艺综合下,主频150MHz,功耗约为177.742 8mW. 展开更多
关键词 图形处理器 顶点染色 超长指令字(VLIW) 可编程
在线阅读 下载PDF
用超长指令实现DCT的新算法 被引量:11
4
作者 李学明 李继 《电子学报》 EI CAS CSCD 北大核心 2003年第7期1074-1077,共4页
本文介绍一种新的DCT计算方法 ,它以现有的DCT快速算法为基础 ,利用超长指令的并行特征来提高DCT计算的性能 .仿真结果表明 :该方法的运算速度比普通的DCT计算方法提高 73 % ,即便同快速算法相比 ,也可以提高 2
关键词 离散余弦变换 超长指令字 并行算法
在线阅读 下载PDF
BWDSP100数字信号处理器的指令缓存器设计 被引量:4
5
作者 刘小明 朱艳 《中国集成电路》 2013年第4期48-50,56,共4页
本文介绍了一种应用于高性能数字信号处理器BWDSP100的指令缓存器。该指令缓存器支持超长指令字,共有三级缓冲,每级缓冲包含16个指令槽。该指令缓存器可高效完成指令执行行的提取、拼接及废弃等操作,可有效提高DSP的指令执行效率。
关键词 信号处理器 指令缓存器 超长指令字
在线阅读 下载PDF
VLIW处理器的变长指令跨边界派发窗设计
6
作者 王东旭 汪东 万江华 《电讯技术》 北大核心 2024年第12期2038-2043,共6页
针对传统超长指令字(Very Long Instruction Word,VLIW)处理器代码体积增大会显著降低处理器性能的问题,设计了一种八流出新型变长指令跨边界派发窗。该派发窗兼容压缩指令派发功能,支持压缩指令和整字指令混合派发,有效减小了处理器代... 针对传统超长指令字(Very Long Instruction Word,VLIW)处理器代码体积增大会显著降低处理器性能的问题,设计了一种八流出新型变长指令跨边界派发窗。该派发窗兼容压缩指令派发功能,支持压缩指令和整字指令混合派发,有效减小了处理器代码体积。同时该派发窗引入指令跨边界派发机制,进一步排出指令间无用气泡。通过搭建派发窗仿真模型,并基于DSP/VoLIB库进行仿真,结果显示,采用新型变长指令跨边界派发窗能够充分发挥指令级并行优势。经编译器调度优化后,库中典型程序体积比传统派发窗平均降低约19.26%,处理器性能提升约15.4%。 展开更多
关键词 超长指令字(VLIW) 指令派发 指令压缩 跨边界派发窗
在线阅读 下载PDF
软件无线电数字信号处理器体系结构研究 被引量:4
7
作者 刘衡竹 莫方政 +4 位作者 张波涛 赵恒 刘冬培 陈艇 周理 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第5期6-11,共6页
软件无线电因被认为是无线通信技术未来的发展趋势而受到广泛关注。目前数字信号处理器是软件无线电发展的瓶颈。通过分析、比较目前几种较为典型的软件无线电数字信号处理器结构,归纳总结各种结构各自设计出发点和优缺点,并对软件无线... 软件无线电因被认为是无线通信技术未来的发展趋势而受到广泛关注。目前数字信号处理器是软件无线电发展的瓶颈。通过分析、比较目前几种较为典型的软件无线电数字信号处理器结构,归纳总结各种结构各自设计出发点和优缺点,并对软件无线电数字信号处理器的发展趋势做了展望。 展开更多
关键词 软件无线电数信号处理器 可重构 指令多数据 超长指令字
在线阅读 下载PDF
MAP-CA宽带数字信号处理器的原理及其应用 被引量:2
8
作者 游林儒 李永红 +1 位作者 毕淑娥 李晓文 《电子技术应用》 北大核心 2002年第8期50-54,共5页
介绍赤道公司(Equator)的MAP—CA宽带数字信号处理器,提出了一种宽带应用中高性能的单芯片解决方案,给出一个应用实例。
关键词 信号处理器 宽带 超长指令字 媒体加速处理器 MAP-CA-BSP
在线阅读 下载PDF
基于ARM指令集的通用DSP中指令相关处理方法 被引量:3
9
作者 王旭 付家为 何虎 《微电子学与计算机》 CSCD 北大核心 2016年第9期10-14,共5页
针对现有处理器中指令相关检测模块占用面积大、延时长和功耗高等问题,提出了一套用于通用数字信号处理器中指令相关的检测方法,并且提出了指令相关的解决办法.通过设定一组锁定标识,可以检测同一周期内多条指令能否同时发射,也可以检... 针对现有处理器中指令相关检测模块占用面积大、延时长和功耗高等问题,提出了一套用于通用数字信号处理器中指令相关的检测方法,并且提出了指令相关的解决办法.通过设定一组锁定标识,可以检测同一周期内多条指令能否同时发射,也可以检测不同流水级的各组指令之间的相关性,实现指令的动态调度.利用超长指令字(VLIW)与超标量融合的方式,在不增加硬件开销的前提下,解决指令相关的问题.经过基于GEM5的仿真平台进行验证,结合实例证明了该方法的可行性. 展开更多
关键词 指令相关 锁定标识 动态调度 超长指令字
在线阅读 下载PDF
宽带多媒体数字信号处理器——MAP-CA
10
作者 张旭东 张海昆 杨守峰 《世界电子元器件》 2002年第6期21-23,共3页
近年来,高速DSP(Digital Signal Processor)发展很快,尤其是VLIW(超长指令字)结构成为高端DSP的主流技术,除了传统的通用DSP产品采用VLIW技术外,针对多媒体应用的专门化通用可编程DSP也有了长足进展,例如Philips的Tri-Media系列和Equato... 近年来,高速DSP(Digital Signal Processor)发展很快,尤其是VLIW(超长指令字)结构成为高端DSP的主流技术,除了传统的通用DSP产品采用VLIW技术外,针对多媒体应用的专门化通用可编程DSP也有了长足进展,例如Philips的Tri-Media系列和Equator的MAP_CA系列等,在我国都已经开始应用于多媒体系统设计中,本文以MAP_CA为例,分析一下这类多媒体处理器的特点和应用. 展开更多
关键词 信号处理器 超长指令字 多媒体信号 多媒体处理器 MAP-CA
在线阅读 下载PDF
数字信号处理器分布式寄存器的写回设计
11
作者 邵铮 谢憬 +1 位作者 王琴 毛志刚 《微电子学与计算机》 CSCD 北大核心 2013年第7期24-27,共4页
针对分布式寄存器文件应用于高性能超长指令字(VLIW)数字信号处理器而造成的分支流水线与写回控制信号的同步问题,提出了一种面向分布式本地寄存器文件的写回策略.其中包括指令执行周期的产生,写回信号缓存以及写回控制单元.采用了面积... 针对分布式寄存器文件应用于高性能超长指令字(VLIW)数字信号处理器而造成的分支流水线与写回控制信号的同步问题,提出了一种面向分布式本地寄存器文件的写回策略.其中包括指令执行周期的产生,写回信号缓存以及写回控制单元.采用了面积功耗性能评估方法,结果证明了该策略能充分发挥分布式寄存器文件在功耗方面的优势,相对于运用集中式寄存器文件可以减少50%的功耗,同时对于传统流水线写回控制方法可以节省60%的面积开销. 展开更多
关键词 分布式寄存器 写回 超长指令字 流水线
在线阅读 下载PDF
一种适用于VLIW数字信号处理器的嵌入调试结构
12
作者 雷庭 何虎 孙义和 《微电子学与计算机》 CSCD 北大核心 2010年第7期1-6,共6页
超长指令字(Very Lone Instruction Word,VLIW)结构是数字信号处理器(DSP)设计中的一种常用结构.用户在开发应用程序的过程中常常会出现错误,查找并修复错误的调试过程要求芯片具有硬件调试功能.对此提出了一种适用于VLIW结构DSP的嵌入... 超长指令字(Very Lone Instruction Word,VLIW)结构是数字信号处理器(DSP)设计中的一种常用结构.用户在开发应用程序的过程中常常会出现错误,查找并修复错误的调试过程要求芯片具有硬件调试功能.对此提出了一种适用于VLIW结构DSP的嵌入调试结构,通过为数不多的调试接口,能够观察芯片的内部信号,设置芯片的状态,控制程序执行过程,从而实现芯片的硬件调试.最后,在一款VLIW结构的DSP——THUASDSP2004上,实现了提出的嵌入调试结构. 展开更多
关键词 信号处理器 超长指令字 调试
在线阅读 下载PDF
一种高效的指令缓存单元架构及其性能分析(英文)
13
作者 Sheraz Anjum 陈杰 《电子器件》 CAS 2007年第5期1861-1865,共5页
为了提高高速DSP或通用处理器的程序执行速度,描述了一种指令缓存单元的有效架构,特别是实现细节和性能分析.因所提出的指令缓存单元是为一种高性能VLIW结构的DSP核而设计,使用了并行的标签比较逻辑和寄存器堆的结构,芯片面积、关键路... 为了提高高速DSP或通用处理器的程序执行速度,描述了一种指令缓存单元的有效架构,特别是实现细节和性能分析.因所提出的指令缓存单元是为一种高性能VLIW结构的DSP核而设计,使用了并行的标签比较逻辑和寄存器堆的结构,芯片面积、关键路径延迟、功耗都大大减小.该指令缓存单元使用高层次的RTL(使用Verilog)编码,并由Synopsys的Design Compiler综合,使用不同的StarCoreTM基准程序测试比较,并进行性能分析.比较结果表明,所提出的结构是有效的,适合用于任何高速的处理器核. 展开更多
关键词 指令缓存单元(ICU) 超长指令字(VLIW) 信号处理器(DSP) 性能分析 最近未使用(LRU)算法 比较逻辑
在线阅读 下载PDF
基于CEVA-XC4500 DSP平台5G-LDPC码编码实现
14
作者 吴思远 陈成 +1 位作者 姜明 徐安来 《无线电工程》 2024年第2期457-462,共6页
低密度奇偶校验(Low-Density Parity-Check,LDPC)码是第五代移动通信技术(5th Generation Mobile Communication Technology,5G)系统采用的信道编码技术之一,用于业务信道高速数据传输,具有很强的抗干扰能力和纠错能力。5G-LDPC码编译... 低密度奇偶校验(Low-Density Parity-Check,LDPC)码是第五代移动通信技术(5th Generation Mobile Communication Technology,5G)系统采用的信道编码技术之一,用于业务信道高速数据传输,具有很强的抗干扰能力和纠错能力。5G-LDPC码编译码在嵌入式平台的实现是一个值得关注的研究方向。CEVA-XC4500数字信号处理(Digital Signal Processing,DSP)芯片具有极低功耗、高密度计算、集成了超长指令字(Very Long Instruction Word,VLIW)和单指令多数据(Single Instruction Multiple Data,SIMD)矢量功能的特点。针对CEVA-XC4500 DSP矢量汇编指令和内联指令集的特点,提出一系列针对5G-LDPC码编码的代码优化方法,使其满足5G-LDPC码编码工程应用指标要求。仿真结果表明,优化后的5G-LDPC码编码在CEVA-XC4500 DSP内核上表现良好,中长块编码吞吐率超过100 Mb/s、核心矩阵吞吐率超过1 Gb/s,最大吞吐率达到250 Mb/s、最大核心矩阵吞吐率达到1.6 Gb/s。如果CEVA-XC4500 DSP芯片的最大数据位宽将来能进一步增大,吞吐率可以做得更好。该5G-LDPC码编码的代码优化方法为其他信道编码在类似嵌入式平台的实现提供了参考。 展开更多
关键词 CEVA-XC4500 DSP 超长指令字 指令多数据 5G-低密度奇偶校验码编码 矢量化
在线阅读 下载PDF
一种支持同时多线程的VLIW DSP架构 被引量:11
15
作者 沈钲 孙义和 《电子学报》 EI CAS CSCD 北大核心 2010年第2期352-358,共7页
本文提出了一种支持同时多线程的动态分发超长指令字(VLIW)数字信号处理器(DSP)架构.该DSP架构上可以同时运行多个线程,功能单元可以执行来自多个线程的指令,有效地提高DSP的指令吞吐率.为了使多个线程的指令更有效地调度分发到功能单元... 本文提出了一种支持同时多线程的动态分发超长指令字(VLIW)数字信号处理器(DSP)架构.该DSP架构上可以同时运行多个线程,功能单元可以执行来自多个线程的指令,有效地提高DSP的指令吞吐率.为了使多个线程的指令更有效地调度分发到功能单元,该DSP架构还支持指令动态分发,由硬件分发单元而不是编译器来完成多线程指令的动态分配.实验结果表明,相比于单线程而言,本文提出的VLIW DSP架构可以提高功能单元利用率,隐藏存储器访问时延,使处理器的指令吞吐率平均提高约26.89%. 展开更多
关键词 同时多线程 超长指令字 信号处理器
在线阅读 下载PDF
定制VLIW结构实现四精度浮点基本函数 被引量:1
16
作者 雷元武 窦勇 +1 位作者 倪时策 周杰 《电子学报》 EI CAS CSCD 北大核心 2012年第9期1715-1722,共8页
本文针对科学应用中基本函数种类多、实现复杂、使用频率低的特点,提出一种定制VLIW结构四精度浮点基本函数协处理器(QPC-Processor).该结构通过显示并行技术挖掘基本函数实现算法的并行性,在同一硬件平台上通过元操作的不同组合来计算... 本文针对科学应用中基本函数种类多、实现复杂、使用频率低的特点,提出一种定制VLIW结构四精度浮点基本函数协处理器(QPC-Processor).该结构通过显示并行技术挖掘基本函数实现算法的并行性,在同一硬件平台上通过元操作的不同组合来计算多种基本函数.同时,本文还提出基本函数元操作序列到定制VLIW指令的映射算法,指导基本函数的设计.最后,在FPGA平台上进行验证.实验结果表明,相对软件实现,单个QPC-Processor能够取得6倍以上的加速比,而且,QFC-Processor在同一硬件平台上实现多种类型的算法,弥补单一算法的不足,获得较高的硬件资源利用率. 展开更多
关键词 四精度浮点算术 超长指令字 基本函数 CORDIC算法
在线阅读 下载PDF
一种基于HXDSP的移位器查找表技术 被引量:1
17
作者 叶鸿 顾乃杰 +2 位作者 林传文 张孝慈 陈瑞 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2019年第10期2044-2050,共7页
高性能信号处理应用的快速发展,对相应处理器的运算速度及吞吐效率提出了巨大挑战。移位器是数字信号处理器(DSP)上的重要部件,通过为移位器设计额外专用随机存取存储器(RAM)和查找表(LUT),并对其指令集及架构进行优化调整,从而达到提... 高性能信号处理应用的快速发展,对相应处理器的运算速度及吞吐效率提出了巨大挑战。移位器是数字信号处理器(DSP)上的重要部件,通过为移位器设计额外专用随机存取存储器(RAM)和查找表(LUT),并对其指令集及架构进行优化调整,从而达到提高处理器使用效率和传输速率的目的。此外,基于移位器与相应查找表指令,可在数据暂存的同时进行移位、提取、算术与逻辑运算处理,将部分数据运算的过程直接合并在对移位器RAM的数据存读取过程中,显著地提高了运算部件的使用效率。结果表明:基于移位器查找表的暂存技术可以达到与传输总线接近的吞吐率,对信号处理算法快速傅里叶变换(FFT)可以达到加速比约为1. 15~1. 20的性能提升效果。 展开更多
关键词 信号处理器(DSP) 移位器 查找表(LUT) 指令多数据流(SIMD) 超长指令字(VLIW)
在线阅读 下载PDF
分支预测与值预测在VLIW处理器中的实现 被引量:1
18
作者 李笑天 郭德源 何虎 《微电子学与计算机》 CSCD 北大核心 2015年第1期54-59,共6页
为了降低超长指令字(VLIW)架构的平均跳转开销和平均访存时延,并减少VLIW程序的代码体积,提出了一种全新的将分支预测与值预测技术应用于VLIW架构的方法.首先分析现有超标量(Superscalar)架构中动态预测技术与VLIW架构中指令静态并行之... 为了降低超长指令字(VLIW)架构的平均跳转开销和平均访存时延,并减少VLIW程序的代码体积,提出了一种全新的将分支预测与值预测技术应用于VLIW架构的方法.首先分析现有超标量(Superscalar)架构中动态预测技术与VLIW架构中指令静态并行之间所存在的矛盾;通过拓展原有跳转指令和读内存指令,使之与不同的延时槽个数相对应,并根据不同的指令来阻塞流水线或延时写回寄存器,从而解决动态预测技术造成VLIW架构静态调度周期错乱的问题.基于Gem5仿真平台和清华大学Magnolia VLIW数字信号处理器(DSP)的基准测试程序实验表明,该分支预测与值预测技术能显著地提高VLIW架构的性能,缩小VLIW程序的代码体积. 展开更多
关键词 超长指令字架构 分支预测 值预测 动态预测
在线阅读 下载PDF
多态并行阵列机中处理单元的设计与实现 被引量:2
19
作者 李涛 刘应天 乔虹 《西安邮电大学学报》 2015年第3期21-28,共8页
针对新型多态并行阵列机,设计一种专用处理单元。该处理单元采用四级流水线的超长指令字结构,指令系统采用无寄存器文件的直接寻址方式,加入独有的阻塞-非阻塞模式和邻接共享存储实现分布式指令并行和流处理运算,使用特殊指令完成PE间... 针对新型多态并行阵列机,设计一种专用处理单元。该处理单元采用四级流水线的超长指令字结构,指令系统采用无寄存器文件的直接寻址方式,加入独有的阻塞-非阻塞模式和邻接共享存储实现分布式指令并行和流处理运算,使用特殊指令完成PE间通信以及MIMD和SIMD的快速切换。实验结果表明,该处理单元能够实现运算模式分区并发执行和切换,工作最大频率可达167MHz.。 展开更多
关键词 阵列结构 处理单元 超长指令字 阻塞标志 数据通信
在线阅读 下载PDF
基于BWDSP100的传播分簇算法研究与实现 被引量:4
20
作者 王昊 黄光红 王向前 《中国集成电路》 2014年第8期24-28,共5页
BWDSP100是一款SIMD和VLIW架构高性能DSP,它的指令级并行性主要通过指令分簇和软件流水来实现。本文针对BWDSP100的特点,提出了一种新的分簇算法——传播分簇,该算法考虑了负载均衡和特殊ABI规则,不会产生簇间转移指令。实验结果表明,... BWDSP100是一款SIMD和VLIW架构高性能DSP,它的指令级并行性主要通过指令分簇和软件流水来实现。本文针对BWDSP100的特点,提出了一种新的分簇算法——传播分簇,该算法考虑了负载均衡和特殊ABI规则,不会产生簇间转移指令。实验结果表明,该分簇方法在Open64编译器上的实现可以取得比传统方法更好的效果。 展开更多
关键词 信号处理器 超长指令字 指令级并行 分簇
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部