期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
RISC-V指令集架构及其应用综述
1
作者 刘小罗 林洪怡 刘盼 《中国集成电路》 2025年第3期16-20,49,共6页
传统指令集架构(Instruction Set Architecturem,ISA)因为高昂的版权、指令复杂性和兼容性的问题,越来越限制了计算机技术广泛应用。而精简指令集计算-V(Reduced Instruction Set Computer-Five,RISC-V)是一种全新的免费开源指令集,因... 传统指令集架构(Instruction Set Architecturem,ISA)因为高昂的版权、指令复杂性和兼容性的问题,越来越限制了计算机技术广泛应用。而精简指令集计算-V(Reduced Instruction Set Computer-Five,RISC-V)是一种全新的免费开源指令集,因其开放性、灵活性和高效性受到广泛关注。通过对比分析,我们揭示了RISC-V与传统指令集的区别,系统回顾了RISC-V指令集的发展历程及主要特性,重点探讨了其在不同领域中的强大潜力与广发的应用价值。 展开更多
关键词 risc-V芯片 开源指令集 计算机体系结构 risc-V应用
在线阅读 下载PDF
基于RISC-V的NMS算法指令扩展与硬件实现
2
作者 徐俊杰 张加宏 +3 位作者 魏敬和 刘国柱 何键 赵伟 《集成电路应用》 2024年第10期16-18,共3页
阐述针对图像识别过程中的NMS小算力算法,提出一种新的硬件加速方案。方案权衡加速效果与硬件开销,根据NMS算法所涉及的核心计算内容,扩展专用的RISC-V复合运算指令模块,基于开源的CPU核心扩展硬件结构,并对比基本核心加速器与扩展核心... 阐述针对图像识别过程中的NMS小算力算法,提出一种新的硬件加速方案。方案权衡加速效果与硬件开销,根据NMS算法所涉及的核心计算内容,扩展专用的RISC-V复合运算指令模块,基于开源的CPU核心扩展硬件结构,并对比基本核心加速器与扩展核心加速器性能。新扩展核心实现相同功能软件负载指令数缩减36.5%,周期数缩减55.2%。 展开更多
关键词 图像识别 硬件加速器 NMS算法 risc-V 指令集扩展
在线阅读 下载PDF
基于RISC-V架构的行人定位SoC系统设计
3
作者 喻胜 史超凡 《太赫兹科学与电子信息学报》 2024年第9期959-966,共8页
行人定位方法中,捷联式惯导定位系统需要处理惯性测量单元(IMU)传感器的数据,通过算法处理后得到行人的位置,因此对于芯片实时性以及低功耗有很高的要求。由于行人定位算法大多基于浮点传感器数据开发,一般要求终端设备能够处理浮点数... 行人定位方法中,捷联式惯导定位系统需要处理惯性测量单元(IMU)传感器的数据,通过算法处理后得到行人的位置,因此对于芯片实时性以及低功耗有很高的要求。由于行人定位算法大多基于浮点传感器数据开发,一般要求终端设备能够处理浮点数据。第五代精简指令集(RISC-V)架构作为一种开源架构,能节约架构授权费,在物联网领域有着广泛应用,并且其浮点(F)和向量(V)等高性能扩展指令能够很好地满足行人定位算法对实时性的要求。针对行人定位系统的特定性能要求,提出了一种基于浮点内核向量处理器优化RISC-V架构的行人定位片上系统(SoC),并在实际系统中进行验证。与多个准32位架构RISC-V处理器以及高层次综合组件(HLS)生成的算法专用IP(locate_IP)的标准处理器方案的性能对比分析表明,该设计实现了34倍的性能提升以及5.6倍的能效提升,满足了微终端的要求。 展开更多
关键词 行人定位系统 第五代精简指令集计算 现场可编程逻辑阵列 片上系统
在线阅读 下载PDF
基于RISC的MPEG-4音频解码软件优化 被引量:1
4
作者 梅优良 刘鹏 +1 位作者 周建 陈科明 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2007年第4期603-606,692,共5页
为了提高MPEG-4先进音频编码(AAC)的解码效率,提出了在通用32位精简指令集计算机(reduced in-struction set computing,RISC)上实现MPEG-4 AAC低复杂度框架解码的软件优化技术.解码过程可以分成比特流解码部分和运算部分.应用存储器分... 为了提高MPEG-4先进音频编码(AAC)的解码效率,提出了在通用32位精简指令集计算机(reduced in-struction set computing,RISC)上实现MPEG-4 AAC低复杂度框架解码的软件优化技术.解码过程可以分成比特流解码部分和运算部分.应用存储器分层结构加速比特流解码;基于运算过程、对象和乘法运算的优化技术提高运算部分的解码效率.结果表明,在35 MHz的处理器频率上实现了立体声实时解码,提高了解码效率. 展开更多
关键词 MPEG-4 先进音频编码 精简指令集计算机 瞬时噪声整形
在线阅读 下载PDF
基于CISC/RISC的混合指令集构建 被引量:2
5
作者 陈瑞森 《现代电子技术》 2007年第16期49-52,共4页
CISC与RISC是微处理器设计中的2种主要指令体系,他们各具优势,共存共融是其发展方向之一。首先介绍了硬件上基于CISC/RISC的混合架构设计,然后重点具体介绍CISC/RISC混合指令集的构建方法,并以65C02S的指令集为例,通过仿真说明了按该方... CISC与RISC是微处理器设计中的2种主要指令体系,他们各具优势,共存共融是其发展方向之一。首先介绍了硬件上基于CISC/RISC的混合架构设计,然后重点具体介绍CISC/RISC混合指令集的构建方法,并以65C02S的指令集为例,通过仿真说明了按该方法构建的混合指令集在基于CISC/RISC混合架构的硬件上运行具有良好的优势。 展开更多
关键词 CISC risc 指令集 微处理器
在线阅读 下载PDF
RISC-V指令集子集RV32I的译码电路设计与优化
6
作者 陈勇 毛宇鹏 +2 位作者 朱玉全 黄盛杰 陈宇宸 《电子器件》 CAS 北大核心 2023年第2期297-302,共6页
面向RISC-V处理器五级流水线数据通路,设计了基于FPGA的RISC-V指令集子集RV32I的指令译码电路。电路分为主译码电路和程序计数器输入选择(PCSel)译码电路,使用Verilog HDL编程设计,并进行了系列优化:使用时序约束工具分析时序状态,设定... 面向RISC-V处理器五级流水线数据通路,设计了基于FPGA的RISC-V指令集子集RV32I的指令译码电路。电路分为主译码电路和程序计数器输入选择(PCSel)译码电路,使用Verilog HDL编程设计,并进行了系列优化:使用时序约束工具分析时序状态,设定约束后对电路进行综合,降低电路延迟;利用无关项化简组合逻辑,减少模块输入输出项,减少电路级联;构建独立的32位串并行数值比较器;插入流水线,提高电路工作频率。电路基于FPGA芯片CycloneⅣEP4CE6F17C6进行设计,使用Quartus Prime 17.1对电路进行仿真,仿真结果表明:在Slow 1200 m V 85℃条件下,指令译码电路达到295.6 MHz的工作频率,相比同类设计具有高速和低资源消耗的特点。 展开更多
关键词 risc-V RV32I指令集 指令译码电路
在线阅读 下载PDF
基于RISC-V的卷积神经网络处理器设计与实现 被引量:5
7
作者 傅思扬 陈华 郁发新 《微电子学与计算机》 北大核心 2020年第4期49-54,共6页
针对卷积神经网络对于运算资源需求的不断增长,和传统的硬件卷积加速方案在功耗、面积敏感的边缘计算领域难以应用的问题,设计并实现了一个低功耗嵌入式卷积神经网络加速处理器.目标处理器基于RISC-V指令集架构,内核扩展4条自定义神经... 针对卷积神经网络对于运算资源需求的不断增长,和传统的硬件卷积加速方案在功耗、面积敏感的边缘计算领域难以应用的问题,设计并实现了一个低功耗嵌入式卷积神经网络加速处理器.目标处理器基于RISC-V指令集架构,内核扩展4条自定义神经网络指令,并在硬件层面实现加速处理.该卷积神经网络处理器最大程度的复用了原RISC-V的数据通路和功能模块,减小了额外的功耗和芯片面积等资源开销.目标处理器通过RISC-V官方标准测试集验证,并对MNIST手写数据集进行识别测试,正确率达到97.23%.在TSMC 40nm标准数字工艺下,目标处理器面积仅为0.34 mm^(2,),动态功耗仅为11.1μw/MHz,与同期处理器相比,面积和功耗方面均具有一定优势. 展开更多
关键词 处理器 卷积神经网络 定制指令集 risc-V
在线阅读 下载PDF
基于Verilog-HDL的RISC/DSP微处理器IP核的设计 被引量:3
8
作者 陈芙蓉 张向文 曹梅双 《微电子学与计算机》 CSCD 北大核心 2009年第11期70-73,共4页
设计了一种新的既能用作通用微处理器又能用于32位定点DSP运算的RISC/DSP架构.DSP操作与ALU运算共享寄存器组,并行执行.为了提高该处理器的性能又不增加硬件复杂性,运用了可变长度的指令来提高代码密度,四级流水线提高程序执行效率,有... 设计了一种新的既能用作通用微处理器又能用于32位定点DSP运算的RISC/DSP架构.DSP操作与ALU运算共享寄存器组,并行执行.为了提高该处理器的性能又不增加硬件复杂性,运用了可变长度的指令来提高代码密度,四级流水线提高程序执行效率,有限状态机来快速响应中断/例外.所有的模块都是基于Verilog-HDL语言,经过EDA工具的综合分析后给出了整机的RTL视图和功能仿真波形图. 展开更多
关键词 risc DSP 微处理器 有限状态机 RTL
在线阅读 下载PDF
面向RISC-V指令集架构处理器的代码压缩技术 被引量:2
9
作者 程战涛 梁峰 张国和 《微电子学与计算机》 2021年第6期13-19,共7页
针对嵌入式系统处理器代码量指数式增长带来的设计与验证难题,提出一种适用于RISC-V指令集架构处理器的Bitmask代码压缩技术.结合RISC-V指令集特点,设计了混合编码与分离字典相结合的Bitmask代码压缩算法;在不影响处理器结构和Cache工... 针对嵌入式系统处理器代码量指数式增长带来的设计与验证难题,提出一种适用于RISC-V指令集架构处理器的Bitmask代码压缩技术.结合RISC-V指令集特点,设计了混合编码与分离字典相结合的Bitmask代码压缩算法;在不影响处理器结构和Cache工作机制的基础上,设计精简的硬件解压缩单元,减小了嵌入式系统处理器所需的程序内存空间.采用面向RISC-V指令集的混合编码压缩指令格式,减小原始指令码的码字长度,改善了代码压缩率;采用分离的两个字典结构,在不影响代码压缩率的前提下,减小了硬件解压缩延迟.结果表明,在RISC-V指令集架构上不增加过多硬件开销的情况下,代码压缩率平均为61.1%,大大减小了处理器所需的程序内存空间. 展开更多
关键词 嵌入式系统处理器 risc-V指令集 代码压缩技术 硬件解压缩单元
在线阅读 下载PDF
基于RISC-V指令扩展的低开销SM4算法设计与实现 被引量:9
10
作者 陈锐 李冰 刘向东 《电子器件》 CAS 北大核心 2021年第1期108-113,共6页
为了保障工业物联网采集数据的机密性,同时考虑到物联网终端设备资源受限与成本低廉的特点,提出以软硬件协同设计的方式实现SM4算法,以平衡资源开销、性能和延时。在开源RISC-V指令集的基础上,增加了两条自定义指令以实现密钥扩展和加... 为了保障工业物联网采集数据的机密性,同时考虑到物联网终端设备资源受限与成本低廉的特点,提出以软硬件协同设计的方式实现SM4算法,以平衡资源开销、性能和延时。在开源RISC-V指令集的基础上,增加了两条自定义指令以实现密钥扩展和加解密算法的轮函数,设计了一款低开销的SM4指令功能单元硬件电路结构。从时钟周期精确的仿真结果来看,与无扩展指令的实现相比,延时缩减81.72%,吞吐率提升4.47倍。从SMIC 180 nm工艺下综合结果来看,SM4指令功能单元仅占用了1684门,与参考文献相比,资源开销至少降低38.9%。 展开更多
关键词 工业物联网 SM4 risc-V 指令扩展 加密
在线阅读 下载PDF
三级流水线RISC-V处理器设计与验证 被引量:10
11
作者 折如义 李炳辉 姜佩贺 《电子技术应用》 2020年第5期44-49,共6页
RISC-V作为一种开源精简指令集架构,自发布以来便得到了大量关注。设计了一种三级流水线的RISC-V处理器。其中,采用静态预测BTFN技术处理流水线执行中的分支情况,采用前向旁路传播技术解决数据冒险问题,同时,采用资源共享的办法,复用寄... RISC-V作为一种开源精简指令集架构,自发布以来便得到了大量关注。设计了一种三级流水线的RISC-V处理器。其中,采用静态预测BTFN技术处理流水线执行中的分支情况,采用前向旁路传播技术解决数据冒险问题,同时,采用资源共享的办法,复用寄存器堆、加法器、选择器等模块,使设计面积得到一定的优化。在VCS和Verdi等EDA工具中,使用RV32I整数运算指令集对处理器进行了仿真测试,结果表明,所设计的处理器功能正确,达到预定目标。 展开更多
关键词 risc-V指令集 流水线 处理器
在线阅读 下载PDF
基于RISC-V架构的条形码识别控制器的设计
12
作者 马颖颖 施隆照 +1 位作者 魏陈鸿 林伟峰 《中国集成电路》 2022年第4期30-36,共7页
基于RISC-V架构设计了一个具有条形码识别功能的控制器,采用两级流水线架构,支持RV32EC指令集。通过外设控制模块扩展条形码识别接口,并为其配置中断响应端口,可用中断或查询方式读取条形码识别结果,并可通过写控制字方式进行处理模式设... 基于RISC-V架构设计了一个具有条形码识别功能的控制器,采用两级流水线架构,支持RV32EC指令集。通过外设控制模块扩展条形码识别接口,并为其配置中断响应端口,可用中断或查询方式读取条形码识别结果,并可通过写控制字方式进行处理模式设定,以及实时监测图像识别的工作状态等。在VCS平台上进行了仿真测试,验证了控制器逻辑功能的正确性,并在FPGA开发板上,实现了软硬件协同仿真验证。 展开更多
关键词 risc-V指令集 RV32EC指令集 条形码识别
在线阅读 下载PDF
基于PUF的安全处理器指令混淆与总线加密方法
13
作者 陈备 黄紫山 贺章擎 《电子器件》 2024年第6期1457-1464,共8页
针对高安全敏感处理器面临总线监听、数据篡改、代码注入等类型的恶意攻击,导致机密信息容易被窃取的问题,提出了一种基于PUF的安全处理器指令混淆和总线数据加密方案。该方案利用PUF模块生成高可靠的海量密钥,对基于RISC-V的处理器指... 针对高安全敏感处理器面临总线监听、数据篡改、代码注入等类型的恶意攻击,导致机密信息容易被窃取的问题,提出了一种基于PUF的安全处理器指令混淆和总线数据加密方案。该方案利用PUF模块生成高可靠的海量密钥,对基于RISC-V的处理器指令操作码进行混淆,同时对其总线数据进行“一次一密”异或加密。实验结果表明,所提出的指令混淆方法的时间开销小,CPU占用率低,硬件资源消耗少,同时总线加密方法在数据吞吐量性能上占有较大优势。与同类技术相比,所提出方法在实现处理器指令集和总线数据防护的同时,大幅降低了处理器开销,增强了处理器的不可克隆性。 展开更多
关键词 物理不可克隆函数 微处理器指令集 总线加密认证 risc-V
在线阅读 下载PDF
一种基于并行处理器的快速车道线检测系统及FPGA实现 被引量:6
14
作者 李元金 张万成 吴南健 《电子与信息学报》 EI CSCD 北大核心 2010年第12期2901-2906,共6页
该文提出了一种并行的快速车道线检测系统。该系统包含一个32×32的处理器单元(PE)阵列和双RISC子系统。PE阵列实现车道线图像像素级并行预处理,获取图像边缘特征,双RISC核子系统根据边缘特征实现两条车道线直线参数的并行检测,从... 该文提出了一种并行的快速车道线检测系统。该系统包含一个32×32的处理器单元(PE)阵列和双RISC子系统。PE阵列实现车道线图像像素级并行预处理,获取图像边缘特征,双RISC核子系统根据边缘特征实现两条车道线直线参数的并行检测,从而使得检测过程的每一步都是并行进行,显著提高检测速率。该系统用FPGA实现。实验结果表明本系统具有良好的鲁棒性且可达到每秒50帧的检测速率,满足了车道偏离预警系统实时性要求,具备重要的应用价值。 展开更多
关键词 图像处理 车道线检测 并行 FPGA 精简指令集计算机(risc)
在线阅读 下载PDF
一种FFT并行处理机的设计与实现 被引量:2
15
作者 张犁 李双飞 +1 位作者 石光明 李甫 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2010年第4期630-635,共6页
专用指令集处理器具有数字信号处理器的可编程性和专用处理电路的高速性,以专用指令集处理器为核心构成的阵列式并行处理系统在高速实时处理方面有着非常重要的应用.为此,提出了一种基于专用指令集处理器的快速傅里叶变换并行处理机实... 专用指令集处理器具有数字信号处理器的可编程性和专用处理电路的高速性,以专用指令集处理器为核心构成的阵列式并行处理系统在高速实时处理方面有着非常重要的应用.为此,提出了一种基于专用指令集处理器的快速傅里叶变换并行处理机实现方法.设计了基于精简指令集处理器体系结构的可编程处理单元,以其为核心构成并行处理系统,采用通信矩阵解决了并行系统内各个处理单元间的数据交换问题,实现了1 024点快速傅里叶变换的并行处理.实验结果表明,在快速傅里叶变换处理方面,其处理速度比典型数字信号处理器提高30%,且具有系统并行规模大、功能灵活可变、设计复杂程度适当、设计重复利用性好的优点,非常适合在现场可编程逻辑门阵列中以SoC的形式实现. 展开更多
关键词 专用指令集处理器 快速傅里叶变换 精简指令集处理器 并行处理 数据通信
在线阅读 下载PDF
标志预访问和组选择历史相结合的低功耗指令cache 被引量:6
16
作者 张宇弘 王界兵 +1 位作者 严晓浪 汪乐宇 《电子学报》 EI CAS CSCD 北大核心 2004年第8期1286-1289,共4页
指令cache是处理器的主要耗能部件之一 .研究发现 ,在指令顺序执行的情况下 ,访问同一cache行只需要访问一次标志存储器 ,因此标志存储器存在大量空闲周期 .本方法利用标志存储器的空闲周期来预先访问地址连续的下一个cache行的标志 ,... 指令cache是处理器的主要耗能部件之一 .研究发现 ,在指令顺序执行的情况下 ,访问同一cache行只需要访问一次标志存储器 ,因此标志存储器存在大量空闲周期 .本方法利用标志存储器的空闲周期来预先访问地址连续的下一个cache行的标志 ,从而预先获得cache行命中和组选择信息 ,这样当真正取下一行的指令时 ,根据获得的该cache行的标志信息就无需访问没有被选中的数据存储器 .预先访问标志存储器的另一个优点是可以加入组预测算法来减少对标志存储器的访问 .为了减少短距离跳转时对cache的访问 ,环形历史缓冲区 (CHB)保存了部分组选择结果来获得跳转目标地址的cache行信息 .该方法没有性能损失 ,而且具有硬件实现简单 ,硬件代价小等优点 .该方法已被应用于 2 5 0MHz的RISC处理器中 . 展开更多
关键词 CACHE 低功耗 CPU 微体系结构
在线阅读 下载PDF
CMOS星敏感器图像驱动及实时星点定位算法 被引量:8
17
作者 郝雪涛 江洁 张广军 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2005年第4期381-384,共4页
利用CMOS图像传感器技术的低功耗和开发简单等优点,设计了新型CMOS星敏感器的图像采集驱动电路.该电路设计以现场可编程门阵列(FPGA)为核心,配以静态存储器和并口通讯功能,实现了图像的采集、存储和输出.同时根据4连通域图像分割的原理,... 利用CMOS图像传感器技术的低功耗和开发简单等优点,设计了新型CMOS星敏感器的图像采集驱动电路.该电路设计以现场可编程门阵列(FPGA)为核心,配以静态存储器和并口通讯功能,实现了图像的采集、存储和输出.同时根据4连通域图像分割的原理,在FPGA内部设计了一个数字电路模块,以实现该星敏感器的实时星点定位功能.该模块由于采用了流水线结构,可以和图像采集同步完成星点质心定位算法,减少了向星敏感器数据处理单元中的精简指令集计算机(RISC)的数据传输量和RISC进行星图跟踪和识别的工作量,提高了星敏感器的总体工作性能.对比软件处理结果,对星敏感器的图像采集和质心算法硬件电路进行了验证. 展开更多
关键词 传感器 图像采集 数字电路 质心
在线阅读 下载PDF
基于ARM的冗余惯性测量组合的方案设计 被引量:1
18
作者 许化龙 夏克寒 曲从善 《航天控制》 CSCD 北大核心 2004年第6期71-74,83,共5页
介绍了冗余惯性测量组合的优缺点 ,总结了工程实现过程中会遇到的关键问题。在此基础上 ,设计了一个嵌入式系统 ,对冗余惯性测量组合的测量数据先执行故障检测、隔离、重构及数据融合等运算 ,再输出给弹载计算机 。
关键词 惯性测量组合 冗余设计 risc ARM
在线阅读 下载PDF
标量乘法的FPGA实现
19
作者 王峰 邹候文 《现代电子技术》 2007年第22期32-35,共4页
从实际应用出发,研究了椭圆曲线标量乘法算法的FPGA的实现。采用P1363推荐的GF(2163)上的Koblitz曲线,首先设计了一个精简指令集的微处理器IP核,利用此指令集编程实现标量乘法,最终实现的标量乘法需要8 830个ALUT和5 575个register,运... 从实际应用出发,研究了椭圆曲线标量乘法算法的FPGA的实现。采用P1363推荐的GF(2163)上的Koblitz曲线,首先设计了一个精简指令集的微处理器IP核,利用此指令集编程实现标量乘法,最终实现的标量乘法需要8 830个ALUT和5 575个register,运行一次标量乘法的时间为184.52μs。与其他文献的标量乘法运算的硬件实现相比,实现的标量乘法运算在资源速度综合方面具有较大的优势。 展开更多
关键词 椭圆曲线密码体制 标量乘法 IP核 精简指令集 FPGA
在线阅读 下载PDF
基于ARM和DSP的微机线路保护装置 被引量:1
20
作者 张小伟 《舰船电子对抗》 2012年第5期104-107,共4页
在微机线路保护中,利用数字信号处理器(DSP)高效快速的数字信号处理能力和嵌入式先进的精简指令集芯片机器(ARM)处理器强大的以太网通信功能,采用DSP+ARM9的双中央处理器(CPU)的硬件结构,两者之间采用双口随机存储器(RAM)进行数据交换... 在微机线路保护中,利用数字信号处理器(DSP)高效快速的数字信号处理能力和嵌入式先进的精简指令集芯片机器(ARM)处理器强大的以太网通信功能,采用DSP+ARM9的双中央处理器(CPU)的硬件结构,两者之间采用双口随机存储器(RAM)进行数据交换。软件设计基于嵌入式Linux操作系统,移植了Bootloader、内核,构建了Ramdisk的根文件系统,并移植了应用程序。 展开更多
关键词 线路保护 先进的精简指令集芯片机器 数字信号处理器 随机存储器
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部