期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
专用指令集处理器(ASIP)行为级设计方法研究 被引量:4
1
作者 陈艾 周学海 +2 位作者 李曦 王志刚 王峰 《计算机工程与应用》 CSCD 北大核心 2004年第29期44-46,152,共4页
由专用指令集处理器(ASIP)构成的片上系统(SoC)具有高效、灵活等优点。有效的ASIP行为级设计方法对于SoC设计具有重大意义。该文对ASIP行为级设计方法进行研究,提出了一种基于体系结构描述语言(ADL)的ASIP行为级设计方法,并介绍了基于... 由专用指令集处理器(ASIP)构成的片上系统(SoC)具有高效、灵活等优点。有效的ASIP行为级设计方法对于SoC设计具有重大意义。该文对ASIP行为级设计方法进行研究,提出了一种基于体系结构描述语言(ADL)的ASIP行为级设计方法,并介绍了基于该方法的可视化ASIP行为级设计平台xptools。 展开更多
关键词 专用指令集处理器 可重定向模拟 体系结构描述语言 设计空间搜索
在线阅读 下载PDF
配置流驱动计算体系结构指导下的ASIP设计 被引量:3
2
作者 李勇 王志英 +1 位作者 赵学秘 岳虹 《计算机研究与发展》 EI CSCD 北大核心 2007年第4期714-721,共8页
为了兼顾嵌入式处理器设计中的灵活性与高效性,提出配置流驱动计算体系结构.在体系结构设计中将软/硬件界面下移,使功能单元之间的互连网络对编译器可见,并由编译器来完成传输路由,从而支持复杂但更为高效的互连网络.在该体系结构指导下... 为了兼顾嵌入式处理器设计中的灵活性与高效性,提出配置流驱动计算体系结构.在体系结构设计中将软/硬件界面下移,使功能单元之间的互连网络对编译器可见,并由编译器来完成传输路由,从而支持复杂但更为高效的互连网络.在该体系结构指导下,提出一种支持段式可重构互连网络的专用指令集处理器(ASIP)设计方法.该方法应用到密码领域的3类ASIP设计中表明,与简单总线互连相比,在不影响性能的前提下,可平均节约53%的互连功耗和38.7%的总线数量,从而达到减少总线数量、降低互连功耗的目的. 展开更多
关键词 配置流驱动计算体系结构 传输触发体系结构 专用指令集处理器 嵌入式处理器
在线阅读 下载PDF
专用指令集处理器(ASIP)系统级设计研究 被引量:4
3
作者 杨君 李曦 +1 位作者 王志刚 周学海 《系统工程与电子技术》 EI CSCD 北大核心 2006年第10期1572-1577,共6页
嵌入式系统的应用多样性和设计时效性特征对专用指令集处理器(application specific instructure setprocessor,ASIP)体系结构设计提出了挑战。提出一种ASIP设计平台A2IDE,它将ASIP的系统级设计任务划分为指令集、流水线和微结构三个层... 嵌入式系统的应用多样性和设计时效性特征对专用指令集处理器(application specific instructure setprocessor,ASIP)体系结构设计提出了挑战。提出一种ASIP设计平台A2IDE,它将ASIP的系统级设计任务划分为指令集、流水线和微结构三个层次,并采用体系结构描述语言驱动软件工具集自动生成和各层次上的设计空间搜索。对A2IDE的特点、架构进行了描述,并通过实验初步证明了A2IDE平台的有效性。 展开更多
关键词 专业指令集处理器 体系结构描述语言 设计空间搜索
在线阅读 下载PDF
传输触发体系结构指导下的ASIP自动生成 被引量:2
4
作者 赵学秘 王志英 +1 位作者 岳虹 陆洪毅 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2006年第10期1491-1496,共6页
提出传输触发体系结构(TTA)指导下的专用指令集处理器自动生成方法,可有效地解决指令集生成、可重定向编译和微结构设计等问题.TTA只包括一种指令即传输指令,避免了指令集生成的问题;在该方法的软件工具链中,语义翻译和调度相互独立,调... 提出传输触发体系结构(TTA)指导下的专用指令集处理器自动生成方法,可有效地解决指令集生成、可重定向编译和微结构设计等问题.TTA只包括一种指令即传输指令,避免了指令集生成的问题;在该方法的软件工具链中,语义翻译和调度相互独立,调度器无需关心语义,解决了可重定向编译的问题;微结构设计遵循统一模板,其寄存器传输级描述可自动生成.另外,针对应用的性能优化与连接优化过程是自动完成的.在密码算法领域的应用验证了该方法的有效性. 展开更多
关键词 专用指令集处理器 传输触发体系结构 设计自动化 可重定向编译 微体系结构 嵌入式处理器
在线阅读 下载PDF
一种定制指令集处理器ASIP评估指标权重抽取技术 被引量:1
5
作者 王志刚 李曦 +1 位作者 周学海 余洁 《中国科学技术大学学报》 CAS CSCD 北大核心 2007年第2期184-188,共5页
针对现有的评估方法中,人为指定指标权重而导致的评估准确性低的问题,基于模糊数学中模糊判断矩阵的相关理论,提出一套ASIP评估指标权重的抽取方法.首先利用模糊矩阵对评估指标中任意两个指标的重要程度作出判断,并将判断的可靠程度量化... 针对现有的评估方法中,人为指定指标权重而导致的评估准确性低的问题,基于模糊数学中模糊判断矩阵的相关理论,提出一套ASIP评估指标权重的抽取方法.首先利用模糊矩阵对评估指标中任意两个指标的重要程度作出判断,并将判断的可靠程度量化,然后利用偏差函数求解最接近于ASIP设计者提供的模糊判断矩阵的一致性矩阵,从而获得ASIP评估指标权重. 展开更多
关键词 定制指令集处理器 asip多指标评估 asip评估指标权重抽取 模糊判断矩阵 判断可靠度
在线阅读 下载PDF
专用指令集处理器(ASIP)评估方法研究 被引量:1
6
作者 余洁 刘方方 周学海 《计算机工程与设计》 CSCD 北大核心 2010年第22期4835-4838,4850,共5页
针对专用指令集处理器(ASIP)评估具有多属性维数、多目标类型、多数据类型的特点,提出一种基于比较的评估方法。在评估的不同阶段,选取不同的参照指标,对数据进行处理、集结,从而获取候选方案的排序向量。根据评估目标类型和数据信息类... 针对专用指令集处理器(ASIP)评估具有多属性维数、多目标类型、多数据类型的特点,提出一种基于比较的评估方法。在评估的不同阶段,选取不同的参照指标,对数据进行处理、集结,从而获取候选方案的排序向量。根据评估目标类型和数据信息类型选取特定的参照数据,进行数据信息与参照数据的比较;利用模糊矩阵对评估指标的重要程度进行两两比较,并对其进行一致性判断和修正,获取指标权值向量;最后,利用有序加权平均法获取各候选方案的综合属性值,并提出区间比较度的概念,为评估提供量化依据。实例计算表明了该方法的有效性。 展开更多
关键词 专用指令集处理器 多指标评估 指标接近度 区间比较度 模糊权重判断矩阵
在线阅读 下载PDF
传输触发结构ASIP软件工具的自动定制 被引量:1
7
作者 沈立 吕雅帅 王志英 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2008年第6期730-736,共7页
软件工具在ASIP设计中扮演了非常重要的角色,自动定制软件工具对于提高ASIP设计的自动化程度意义重大.详细分析了传输触发结构(TTA)ASIP软件工具的自动定制问题,提出了扩展指令、目标代码编码、保留表等关键体系结构描述信息的自动生成... 软件工具在ASIP设计中扮演了非常重要的角色,自动定制软件工具对于提高ASIP设计的自动化程度意义重大.详细分析了传输触发结构(TTA)ASIP软件工具的自动定制问题,提出了扩展指令、目标代码编码、保留表等关键体系结构描述信息的自动生成方法.其中,扩展指令信息通过合并相关基准指令的语法树及其他描述信息获得;目标代码编码通过对功能单元端口和寄存器端口分类并顺序编号获得;指令保留表则通过分析指令执行过程中数据传输的时序与资源使用情况获得.实验结果表明,该方法灵活简单,当ASIP的指令集和其他体系结构信息变化时可以自动生成相应的软件工具,并能够保证软件工具的效率. 展开更多
关键词 传输触发结构 专用指令集处理器 软件工具 体系结构描述信息
在线阅读 下载PDF
一种基于ASIP方法的互连IP节点设计
8
作者 赵宏智 李占才 +1 位作者 齐悦 王沁 《计算机工程》 CAS CSCD 北大核心 2008年第2期258-260,共3页
在研究多种互连IP节点功能的基础上,提出使用专用指令集处理器(ASIP)方法设计互连IP节点的基本功能集合,使得设计者可以实现对互连IP节点基本功能的复用,并添加定制设计以满足具体应用对互连IP节点的特定要求。ASIP方法允许设计者以编... 在研究多种互连IP节点功能的基础上,提出使用专用指令集处理器(ASIP)方法设计互连IP节点的基本功能集合,使得设计者可以实现对互连IP节点基本功能的复用,并添加定制设计以满足具体应用对互连IP节点的特定要求。ASIP方法允许设计者以编程的方式灵活地实现互连策略。DTV系统中一种互连IP节点的电路设计、仿真与综合结果验证了该设计的有效性。 展开更多
关键词 专用指令集处理器(asip) 互连IP节点 复用
在线阅读 下载PDF
基于算子的ASIP声码器设计与实现
9
作者 荆涛 王沁 《北京交通大学学报》 EI CAS CSCD 北大核心 2007年第5期15-18,共4页
在数字语音通信的声码器设计中,针对体系结构优化、指令集生成等问题,提出了一种基于算子的ASIP声码器设计方式,对其设计关键技术进行了讨论,并通过一个基于SELP算法的声码器设计实例与仿真结果加以验证,该声码器在20 MHz主频下完成0.6 ... 在数字语音通信的声码器设计中,针对体系结构优化、指令集生成等问题,提出了一种基于算子的ASIP声码器设计方式,对其设计关键技术进行了讨论,并通过一个基于SELP算法的声码器设计实例与仿真结果加以验证,该声码器在20 MHz主频下完成0.6 kbps的SELP算法的平均功耗为200 mW,完成编解码的运算复杂度为12.5 MIPS. 展开更多
关键词 专用指令集处理器 声码器 算子 超长指令字
在线阅读 下载PDF
一个新型ASIP编译器的设计和实现 被引量:1
10
作者 任坤 严晓浪 +1 位作者 秦兴 孙玲玲 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2008年第4期553-557,共5页
为了满足专用指令处理器(ASIP)存储器约束和代码执行的实时性要求,提出了一种同时考虑代码选择和寄存器分配的代码综合生成算法,同步处理代码生成的子问题.该算法基于最优化原理,把无环有向图(DAG)的所有节点构造成一个调度矩阵,把寻找... 为了满足专用指令处理器(ASIP)存储器约束和代码执行的实时性要求,提出了一种同时考虑代码选择和寄存器分配的代码综合生成算法,同步处理代码生成的子问题.该算法基于最优化原理,把无环有向图(DAG)的所有节点构造成一个调度矩阵,把寻找代码优化的问题转化成在调度DAG中寻找一条优化路径,大大降低了算法的时间复杂度.并应用算法构造了一个编译器后端,测试表明,该算法能够正确地生成目标代码,和传统的分步优化算法相比,减小了目标代码的空间尺寸,降低了寄存器溢出的几率. 展开更多
关键词 专用指令处理器编译器 代码生成 调度无环有向图 动态规划
在线阅读 下载PDF
基于二进制插桩的ASIP处理器指令集混合仿真方法
11
作者 邱吉 高翔 +2 位作者 彭飞 汪文祥 蒋毅飞 《计算机研究与发展》 EI CSCD 北大核心 2012年第S1期330-335,共6页
指令集仿真器在ASIP处理器硅前软件开发中发挥着重要的作用,但使用传统仿真方法的指令集仿真器仿真速度较慢.基于二进制插桩,提出了ASIP处理器指令集混合仿真方法,以混合仿真的方式,使基础指令直接运行在宿主机上,仅对扩展指令仿真,从... 指令集仿真器在ASIP处理器硅前软件开发中发挥着重要的作用,但使用传统仿真方法的指令集仿真器仿真速度较慢.基于二进制插桩,提出了ASIP处理器指令集混合仿真方法,以混合仿真的方式,使基础指令直接运行在宿主机上,仅对扩展指令仿真,从而降低仿真开销,提升仿真速度.实验表明,采用此方法对主流高清音视频解码软件进行仿真的平均速度达到了1058.5MIPS,是采用当前先进的动态二进制翻译仿真方法仿真器速度的34.7倍. 展开更多
关键词 指令集仿真 专用指令集处理器 混合仿真 二进制插桩
在线阅读 下载PDF
面向安全领域的低功耗ASIP设计
12
作者 黄伟 韩军 +1 位作者 王帅 曾晓洋 《计算机工程》 CAS CSCD 北大核心 2011年第24期120-122,共3页
提出一种面向安全领域的专用指令集处理器(ASIP)设计方案,ASIP的指令ROM被划分成两部分,在某些指令下可以关闭其中一块以节省功耗,采用门控时钟技术降低寄存器堆中各个寄存器的功耗,对当前指令周期中EXE级内部空闲功能单元的输入操作数... 提出一种面向安全领域的专用指令集处理器(ASIP)设计方案,ASIP的指令ROM被划分成两部分,在某些指令下可以关闭其中一块以节省功耗,采用门控时钟技术降低寄存器堆中各个寄存器的功耗,对当前指令周期中EXE级内部空闲功能单元的输入操作数进行锁存,避免该功能单元的信号翻转,从而降低其动态功耗。实验结果表明,该方案能够使ASIP核心功能单元的功耗降低30%,系统整体功耗降低16%。 展开更多
关键词 加密算法 低功耗 专用指令集处理器 加密运算单元
在线阅读 下载PDF
基于ASIP平台的H.264环内去块效应滤波器实现
13
作者 李德贤 秦兴 +1 位作者 严晓浪 彭剑英 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2008年第4期608-611,666,共5页
针对H.264/AVC环内去块效应滤波器算法中分支密集、分支判断条件产生复杂,以及可变阶数有限冲击响应(FIR)滤波算法复杂度高等性能瓶颈,基于专用指令集处理器(ASIP)Schubert平台提出了加法舍入移位指令和两级条件比较指令,并给出了... 针对H.264/AVC环内去块效应滤波器算法中分支密集、分支判断条件产生复杂,以及可变阶数有限冲击响应(FIR)滤波算法复杂度高等性能瓶颈,基于专用指令集处理器(ASIP)Schubert平台提出了加法舍入移位指令和两级条件比较指令,并给出了其专用数据通路的设计实现.根据算法分支执行分布情况优化了算法中分支选择部分的实现,保证了代码的高并行度.时钟精确指令集仿真器的运行结果表明,完成强度为4的4×4像素块边界滤波需要140个时钟周期,而完成强度小于4的边界滤波需要100个时钟周期.运行1/4共享中间格式(QCIF)测试序列时,较x264中的Intel MMX指令实现性能有48%-63%的提升.实验结果表明,使用ASIP实现,可以显著提高去块效应滤波的性能;同时由于其可编程性,可以适应多个视频标准. 展开更多
关键词 H.264/AVC 去块效应滤波 专用指令集处理器
在线阅读 下载PDF
AES专用指令处理器的研究与实现 被引量:10
14
作者 夏辉 贾智平 +3 位作者 张峰 李新 陈仁海 EdwinH.-M.Sha 《计算机研究与发展》 EI CSCD 北大核心 2011年第8期1554-1562,共9页
随着加密算法在嵌入式可信计算领域的广泛应用,如何提高其执行效率成为研究的热点问题.高级加密标准(AES)凭借其在安全性、费用开销和可执行性等方面的内在优势,成为使用最为广泛的对称密钥加密算法.采用指令集架构(ISA)扩展优化的方法... 随着加密算法在嵌入式可信计算领域的广泛应用,如何提高其执行效率成为研究的热点问题.高级加密标准(AES)凭借其在安全性、费用开销和可执行性等方面的内在优势,成为使用最为广泛的对称密钥加密算法.采用指令集架构(ISA)扩展优化的方法对AES算法进行指令扩展优化.基于电子系统级(ESL)方法设计流程,使用基于LISA语言的处理器生成工具构建了一个高效AES专用指令处理器(AES_ASIP)模型,最终实现于FPGA中.经过一系列的仿真和验证,对比ARM处理器指令集架构,实验结果显示AES_ASIP以增加少许硬件资源为代价,提高了算法58.4x%的执行效率并节省了47.4x%的指令代码存储空间. 展开更多
关键词 AES 电子系统级 指令集架构 专用指令处理器 FPGA
在线阅读 下载PDF
嵌入式领域ECC专用指令处理器的研究 被引量:6
15
作者 夏辉 于佳 +3 位作者 秦尧 程相国 陈仁海 潘振宽 《计算机学报》 EI CSCD 北大核心 2017年第5期1092-1108,共17页
与其他公钥密码算法相比,椭圆曲线密码算法(Elliptic Curve Cryptography,ECC)具有抗攻击能力强、计算量小以及处理速度快等优点,已成为下一代公钥密码体制的标准.随着ECC在嵌入式领域的应用日益广泛,如何提高其执行效率成为目前研究的... 与其他公钥密码算法相比,椭圆曲线密码算法(Elliptic Curve Cryptography,ECC)具有抗攻击能力强、计算量小以及处理速度快等优点,已成为下一代公钥密码体制的标准.随着ECC在嵌入式领域的应用日益广泛,如何提高其执行效率成为目前研究的热点问题.文中提出了一套通用的专用指令处理器(Application Specific Instruction Processor,ASIP)的设计验证方案,并将该方案应用于ECC,从而大幅提升其在硬件资源受限的嵌入式环境中的执行效率.首先借鉴并实现了OpenSSL公开的ECC软件优化方案,并结合处理器平台的特点对大整数乘法运算和多项式平方运算进行了进一步优化.其次对优化后的算法进行基本指令块(Basic Instruction Block,BIB)的划分并转化为数据流图(Data Flow Graph,DFG),在DFG图中依照专用指令设计规则引入近似最优解方法查找可优化指令块.对该类指令块设计相应的专用指令,以实现处理器原有基础指令集架构的扩展.再次基于电子系统级(Electronic System Level,ESL)设计方法依次设计并仿真验证ECC_ASIP的系统级模型和Verilog寄存器传输级(Register Transfer Level,RTL)模型.最后将验证通过的RTL级处理器模型进行综合、布局布线,转换成相对应的门级电路并统计模型使用的硬件资源信息,烧写到FPGA(Field-Programmable Gate Array)平台完成ECC_ASIP的移植操作和性能验证.与ARM11处理器平台下算法实现的性能表现进行对比,实验结果显示,ECC_ASIP牺牲了9.23x%的硬件扩展资源,将算法实现的运算速度提高了2.74x倍,指令代码存储空间减少了59.36x%. 展开更多
关键词 椭圆曲线密码 专用指令处理器 近似最优解方法 指令集架构扩展 FPGA
在线阅读 下载PDF
一种面向多媒体和通信应用的处理器指令集及架构实现 被引量:4
16
作者 王志君 梁利平 +3 位作者 吴凯 王光玮 洪钦智 罗汉青 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第10期108-114,共7页
提出了一种面向多媒体和通信应用的CPU和DSP一体化计算的指令集架构,并设计实现了一款基于该指令集架构的VLIW DSP处理器.该CPU和DSP融合指令集架构中的CPU指令兼容已有MIPS 4KC指令集,DSP指令为自主设计.针对多媒体和通信常用算法中并... 提出了一种面向多媒体和通信应用的CPU和DSP一体化计算的指令集架构,并设计实现了一款基于该指令集架构的VLIW DSP处理器.该CPU和DSP融合指令集架构中的CPU指令兼容已有MIPS 4KC指令集,DSP指令为自主设计.针对多媒体和通信常用算法中并行度高等特点,提出了多条基于像素操作、向量操作和复数操作的DSP指令,并详细说明了实现这些指令的关键功能模块的电路实现方法.实验结果表明,在多媒体的插值、重建以及通信的滤波、FFT等算法上,采用本文提出的面对特定应用的指令集具有较明显的优势.流片测试结果证明该指令集架构可实现且有效. 展开更多
关键词 面向特定应用指令集架构 CPU和DSP一体化 处理器 通信 多媒体
在线阅读 下载PDF
一种FFT并行处理机的设计与实现 被引量:2
17
作者 张犁 李双飞 +1 位作者 石光明 李甫 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2010年第4期630-635,共6页
专用指令集处理器具有数字信号处理器的可编程性和专用处理电路的高速性,以专用指令集处理器为核心构成的阵列式并行处理系统在高速实时处理方面有着非常重要的应用.为此,提出了一种基于专用指令集处理器的快速傅里叶变换并行处理机实... 专用指令集处理器具有数字信号处理器的可编程性和专用处理电路的高速性,以专用指令集处理器为核心构成的阵列式并行处理系统在高速实时处理方面有着非常重要的应用.为此,提出了一种基于专用指令集处理器的快速傅里叶变换并行处理机实现方法.设计了基于精简指令集处理器体系结构的可编程处理单元,以其为核心构成并行处理系统,采用通信矩阵解决了并行系统内各个处理单元间的数据交换问题,实现了1 024点快速傅里叶变换的并行处理.实验结果表明,在快速傅里叶变换处理方面,其处理速度比典型数字信号处理器提高30%,且具有系统并行规模大、功能灵活可变、设计复杂程度适当、设计重复利用性好的优点,非常适合在现场可编程逻辑门阵列中以SoC的形式实现. 展开更多
关键词 专用指令集处理器 快速傅里叶变换 精简指令集处理器 并行处理 数据通信
在线阅读 下载PDF
面向椭圆曲线密码的处理器并行体系结构研究与设计 被引量:4
18
作者 杨晓辉 戴紫彬 +1 位作者 李淼 张永福 《通信学报》 EI CSCD 北大核心 2011年第5期70-77,共8页
在研究椭圆曲线密码算法的处理特征以及有限域层上的并行调度算法基础上,采用指令级并行和数据级并行方法,提出了面向椭圆曲线密码的并行处理器体系结构模型,并就模型的存储结构进行了分析。基于该模型实现了一款验证原型,在FPGA上成功... 在研究椭圆曲线密码算法的处理特征以及有限域层上的并行调度算法基础上,采用指令级并行和数据级并行方法,提出了面向椭圆曲线密码的并行处理器体系结构模型,并就模型的存储结构进行了分析。基于该模型实现了一款验证原型,在FPGA上成功进行了验证测试并在0.18μm CMOS工艺标准单元库下进行逻辑综合以及布局布线。实验证明提出的并行处理器体系结构既能保证椭圆曲线密码算法应用的灵活性,又能够达到较高的性能。 展开更多
关键词 椭圆曲线密码 专用指令处理器 并行体系结构 验证原型
在线阅读 下载PDF
面向专用指令集处理器设计的软硬件协同验证 被引量:2
19
作者 严迎建 杨志峰 任方 《计算机工程》 CAS CSCD 北大核心 2010年第6期241-243,共3页
为提高专用指令集处理器设计中的验证效率和覆盖率,将专用指令集处理器的寄存器传输级设计验证与汇编器、指令集模拟器等软件开发工具的测试相结合,提出一种软硬件协同验证方法。该方法按照覆盖率要求由软件自动产生测试程序和数据,将... 为提高专用指令集处理器设计中的验证效率和覆盖率,将专用指令集处理器的寄存器传输级设计验证与汇编器、指令集模拟器等软件开发工具的测试相结合,提出一种软硬件协同验证方法。该方法按照覆盖率要求由软件自动产生测试程序和数据,将利用汇编器产生的机器指令输入到指令集模拟器和硬件仿真工具分别进行软硬件仿真,通过软硬件仿真结果自动比对得出联合验证结果。实践证明,该方法能够有效提高验证效率和覆盖率,缩短验证周期。 展开更多
关键词 专用指令集处理器 硬件仿真 指令集模拟器 软硬件协同验证
在线阅读 下载PDF
一种应用定制指令集可重构结构及FFT算法映射优化 被引量:4
20
作者 刘磊 杨子煜 +1 位作者 沈剑良 李思昆 《国防科技大学学报》 EI CAS CSCD 北大核心 2012年第6期39-45,共7页
现代无线通信应用对FFT计算吞吐率与灵活性需求越来越高,针对传统方案实现FFT计算时难以兼顾性能与灵活性的问题,提出一种应用定制指令集可重构结构ASRA,实现了FFT算法在该结构上的映射优化。ASRA在静态多发射处理器内紧耦合应用定制的... 现代无线通信应用对FFT计算吞吐率与灵活性需求越来越高,针对传统方案实现FFT计算时难以兼顾性能与灵活性的问题,提出一种应用定制指令集可重构结构ASRA,实现了FFT算法在该结构上的映射优化。ASRA在静态多发射处理器内紧耦合应用定制的混合粒度可重构硬件作为扩展功能单元簇,通过运行时重构动态切换扩展指令集。ASRA采用多体便笺存储器、多端口便笺管理单元及可重构互连构成片上缓存系统,结合多体并行访问、循环级乒乓交替、读/写流水化等技术有效提高了访存带宽;静态多发射和运行时语境管理机制支持核心循环的硬件自动流水执行和软流水执行,开发了指令级、数据级和循环级等多层次并行性。实验结果表明,ASRA大幅提升了FFT计算吞吐率,且支持的FFT计算参数更加灵活,而增加的面积开销相对较小。 展开更多
关键词 应用定制 运行时重构 傅里叶变换
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部