期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一种面向VLIW指令压缩的寄存器分配算法 被引量:1
1
作者 朱少波 姚庆栋 +1 位作者 洪享 史册 《计算机工程》 CAS CSCD 北大核心 2003年第20期154-156,共3页
针对VLIW结构的指令压缩方法,通过对编译中间代码的深入分析和总结,提出一种改进的寄存器分配算法,该算法在线性扫描的基础上,对寄存器的选择添加约束条件,应用该算法能够使得目标代码中寄存器的编号尽量靠近,从而达到更好的压缩... 针对VLIW结构的指令压缩方法,通过对编译中间代码的深入分析和总结,提出一种改进的寄存器分配算法,该算法在线性扫描的基础上,对寄存器的选择添加约束条件,应用该算法能够使得目标代码中寄存器的编号尽量靠近,从而达到更好的压缩效果。 展开更多
关键词 超长指令 寄存器分配 线性扫描 指令压缩 VLIW 算法
在线阅读 下载PDF
分布式并行绘制系统中几何指令流压缩的研究与实现 被引量:7
2
作者 金哲凡 杨建 石教英 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2002年第9期824-828,共5页
对分布式并行绘制系统的几何指令流进行压缩能缓解网络带宽瓶颈 .对操作码使用 L ZW算法 ,对法向量使用球面对称网格剖分算法 ,对颜色和位置数据使用 DPCM型预测编码算法 ,根据位置数据的特殊性 ,使用了 4类预测器和自适应量化算法 .对... 对分布式并行绘制系统的几何指令流进行压缩能缓解网络带宽瓶颈 .对操作码使用 L ZW算法 ,对法向量使用球面对称网格剖分算法 ,对颜色和位置数据使用 DPCM型预测编码算法 ,根据位置数据的特殊性 ,使用了 4类预测器和自适应量化算法 .对几何指令流组合使用多种压缩算法取得了良好的效果 ,在几何模型质量基本没有损失的情况下 ,指令平均长度压缩到原来的 1/ 3左右 ,执行速度达到了 4 0 0指令 / 展开更多
关键词 分布式并行绘制系统 几何指令压缩 LZW DPCM 预测 量化 图形处理 计算机
在线阅读 下载PDF
VLIW处理器的变长指令跨边界派发窗设计
3
作者 王东旭 汪东 万江华 《电讯技术》 北大核心 2024年第12期2038-2043,共6页
针对传统超长指令字(Very Long Instruction Word,VLIW)处理器代码体积增大会显著降低处理器性能的问题,设计了一种八流出新型变长指令跨边界派发窗。该派发窗兼容压缩指令派发功能,支持压缩指令和整字指令混合派发,有效减小了处理器代... 针对传统超长指令字(Very Long Instruction Word,VLIW)处理器代码体积增大会显著降低处理器性能的问题,设计了一种八流出新型变长指令跨边界派发窗。该派发窗兼容压缩指令派发功能,支持压缩指令和整字指令混合派发,有效减小了处理器代码体积。同时该派发窗引入指令跨边界派发机制,进一步排出指令间无用气泡。通过搭建派发窗仿真模型,并基于DSP/VoLIB库进行仿真,结果显示,采用新型变长指令跨边界派发窗能够充分发挥指令级并行优势。经编译器调度优化后,库中典型程序体积比传统派发窗平均降低约19.26%,处理器性能提升约15.4%。 展开更多
关键词 超长指令字(VLIW) 指令派发 指令压缩 跨边界派发窗
在线阅读 下载PDF
一种面向DSP深度压缩指令的数据竞争检测方法 被引量:1
4
作者 余巧艳 刘鹏 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2005年第10期1501-1506,共6页
针对数字信号处理器(DSP)深度压缩的指令结构不归整性,难以从指令二进制码中快速提取相关信息的问题,提出分类检测DSP指令间数据竞争的方法.利用不同功能的指令涉及不同寄存器的特点,在分层译码电路和旁路电路辅助下,及时检测出数据竞争... 针对数字信号处理器(DSP)深度压缩的指令结构不归整性,难以从指令二进制码中快速提取相关信息的问题,提出分类检测DSP指令间数据竞争的方法.利用不同功能的指令涉及不同寄存器的特点,在分层译码电路和旁路电路辅助下,及时检测出数据竞争,产生流水线停顿信号,准确定位出产生数据竞争的指令类型.综合结果证明在分层译码配合下,分类检测方法比指令全译码后作检测,速度提高了18.89%.DSP常用程序证明这种方法能有效地覆盖所有出现的数据竞争,保证基于流水的DSP的正确计算.分类检测数据竞争法比指令中源操作数的比特域与目的操作数的比特域作比较的检测方法更适合于采用深度压缩指令的DSP,物理实现更简单. 展开更多
关键词 数字信号处理器 数据竞争 深度压缩指令 分层译码 旁路电路
在线阅读 下载PDF
面向网络报文转发的RISC-V压缩指令定制 被引量:1
5
作者 吕倩茹 王彦鹏 +1 位作者 曹壮 文梅 《计算机工程与科学》 CSCD 北大核心 2018年第3期381-387,共7页
指令流发射和指令Cache失效是处理器能量耗散的两个重要原因。松耦合的RISC指令集所产生的程序加剧了这样的能耗,而在片上Cache有限的网络设备如路由器、交换机中,因为指令流而遭受的性能下降和功耗增加更为严重。面向网络报文转发这一... 指令流发射和指令Cache失效是处理器能量耗散的两个重要原因。松耦合的RISC指令集所产生的程序加剧了这样的能耗,而在片上Cache有限的网络设备如路由器、交换机中,因为指令流而遭受的性能下降和功耗增加更为严重。面向网络报文转发这一重要的网络功能服务,分析了网络报文转发的指令特性,并基于RISC-V指令集架构,重定制了RV32C压缩指令扩展集。经过Spike模拟器测试,优化后压缩率缩减至70%,动态指令压缩率为90%,同时在同等Cache条件下,使用定制压缩指令的指令Cache失效率比标准RISC-V降低了30%~70%。 展开更多
关键词 压缩指令 网络报文转发 RISC-V
在线阅读 下载PDF
一种基于VLIW结构的高性能变长指令发射机制 被引量:1
6
作者 杨惠 陈书明 《计算机研究与发展》 EI CSCD 北大核心 2013年第10期2239-2246,共8页
指令压缩技术能够克服传统超长指令字(very long instruction word,VLIW)结构的指令高速缓冲(cache)中长指令字密度低的缺陷,使长指令字中的各条指令能紧密地排列在高速缓冲行(cache line)中,但可能导致长指令字分置于两个cache line,... 指令压缩技术能够克服传统超长指令字(very long instruction word,VLIW)结构的指令高速缓冲(cache)中长指令字密度低的缺陷,使长指令字中的各条指令能紧密地排列在高速缓冲行(cache line)中,但可能导致长指令字分置于两个cache line,使其不能同时参与取指与发射,从而成为处理器的性能瓶颈.受到分置cache line的影响,传统提升循环效率的软件流水方法性能下降.高性能变长指令发射窗的机制能够解决分离指令字带来的取指发射问题,为取指流水线提供高效连续的指令流,特别地,该机制缓存循环的一次迭代,硬件支持循环的软件流水,有效地增强VLIW结构的数字信号处理器(digital signal processor,DSP)的性能.通过搭建时钟精确的处理器仿真模型,并基于DSP?IMG库上进行仿真,结果显示,采用两级指令发射窗机制,平均性能提高约21.89%. 展开更多
关键词 超长指令 指令发射 指令压缩 软件流水 取指流水线
在线阅读 下载PDF
A reconfigurable computing architecture for 5G communication 被引量:1
7
作者 GUO Yang LIU Zi-Jun +2 位作者 YANG Lei LI Huan WANG Dong-lin 《Journal of Central South University》 SCIE EI CAS CSCD 2019年第12期3315-3327,共13页
5G baseband signal processing places greater real-time and reliability requirements on hardware.Based on the architecture of the MaPU,a reconfigurable computing architecture is proposed according to the characteristic... 5G baseband signal processing places greater real-time and reliability requirements on hardware.Based on the architecture of the MaPU,a reconfigurable computing architecture is proposed according to the characteristics of the 5G baseband signal processing.A dedicated instruction set for 5G baseband signal processing is proposed.The corresponding functional units are designed for reuse of hardware resources.A redirected register file is proposed to address latency and power consumption issues in internetwork.A two-dimensional code compression scheme is proposed for cases in which the use ratio of instruction memory is low.The access mode of the data memory is extended,the performance is improved and the power consumption is reduced.The throughput of 5G baseband processing algorithm is one to two orders of magnitude higher than that of the TMS320C6670 with less power consumption.The silicon area evaluated by layout is 5.8 mm2,which is 1/6 of the MaPU’s.The average power consumption is 0.7 W,which is 1/5 of the MaPU’s. 展开更多
关键词 5G communication instruction set register file code compression THROUGHPUT power consumption
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部