期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于蚁群优化算法的虚拟现场可编程门阵列部署策略 被引量:1
1
作者 许英鑫 孙磊 +1 位作者 赵建成 郭松辉 《计算机应用》 CSCD 北大核心 2020年第3期747-752,共6页
针对可重构密码资源池中,如何在最少的现场可编程门阵列(FPGA)上部署虚拟FPGA(vFPGA)的问题,结合FPGA的工作特点和应用场景的需求,在传统蚁群算法的基础上进行了优化,提出了一个基于蚁群优化(ACO)算法的vFPGA部署策略。首先,通过赋予蚂... 针对可重构密码资源池中,如何在最少的现场可编程门阵列(FPGA)上部署虚拟FPGA(vFPGA)的问题,结合FPGA的工作特点和应用场景的需求,在传统蚁群算法的基础上进行了优化,提出了一个基于蚁群优化(ACO)算法的vFPGA部署策略。首先,通过赋予蚂蚁资源状态感知的能力实现各个FPGA之间的负载均衡,同时避免频繁的vFPGA迁移;其次,设计预留空间,有效减少因为租户需求动态变化带来的服务等级协议(SLA)冲突;最后,对CloudSim进行功能扩展,使用合成的工作流进行仿真实验,对该策略性能进行评估。实验结果表明,所提策略可以在保证系统服务质量的前提下,提高FPGA资源利用率,减少FPGA使用量。 展开更多
关键词 云计算 现场可编程门阵列虚拟 虚拟现场可编程门阵列部署 蚁群优化算法 局部可重构
在线阅读 下载PDF
基于现场可编程门阵列与Labview的脉冲电源控制系统设计 被引量:7
2
作者 李家强 黄懿赟 +2 位作者 冯虎林 潘圣民 王邓辉 《核聚变与等离子体物理》 CAS CSCD 北大核心 2019年第2期139-143,共5页
介绍了基于现场可编程门阵列(FPGA)的等离子体磁约束脉冲电源控制系统的设计与实现。该控制系统采用了虚拟仪器技术、嵌入式控制技术、串行通信技术、光电隔离技术等,提高了系统抗干扰性能以及可编程性,实现了多个脉冲电源模块开关器件... 介绍了基于现场可编程门阵列(FPGA)的等离子体磁约束脉冲电源控制系统的设计与实现。该控制系统采用了虚拟仪器技术、嵌入式控制技术、串行通信技术、光电隔离技术等,提高了系统抗干扰性能以及可编程性,实现了多个脉冲电源模块开关器件间的逻辑互锁、参数设置以及远程监控等功能。控制系统具体由实验室虚拟仪器集成环境(Labview)编写的上位机界面、由硬件语言Verilog HDL 编写的下位机以及专用的光电隔离转换电路组成,用于实现多个脉冲电源充放电的时序控制。实验证明了系统在复杂电磁环境下,运行稳定,性能良好。 展开更多
关键词 现场可编程门阵列 实验室虚拟仪器集成环境 脉冲电源 逻辑互锁 光电隔离
在线阅读 下载PDF
高速可编程网络创新实验设备设计与实现
3
作者 崔波 刘中金 +3 位作者 李勇 苏厉 金德鹏 曾烈光 《计算机工程》 CAS CSCD 2014年第5期313-316,共4页
面向下一代网络的新协议和体系架构研究是当前网络研究的重要组成部分,而基于实际设备的实验验证是证明研究结果正确性的主要途径。针对基于软件或传统网络设备的验证方式在有效性、灵活性等方面的不足,提出一种支持网络创新实验验证的... 面向下一代网络的新协议和体系架构研究是当前网络研究的重要组成部分,而基于实际设备的实验验证是证明研究结果正确性的主要途径。针对基于软件或传统网络设备的验证方式在有效性、灵活性等方面的不足,提出一种支持网络创新实验验证的高速网络硬件设备解决方案。该方案基于现场可编程门阵列设计,将控制平面与数据平面解耦合,同时采用高性能的网络与存储模块,满足网络创新实验对设备可编程、高性能、灵活管理控制等方面的需求。基于此方案设计并实现TNIP网络处理板卡。实验结果证明,该板卡支持高达16 Gb/s的网络通信,可以应用于复杂的网络创新实验。 展开更多
关键词 网络设备 网络创新 实验平台 可编程硬件 现场可编程门阵列设计 虚拟
在线阅读 下载PDF
基于虚拟可重构电路的演化硬件 被引量:11
4
作者 丁国良 原亮 +1 位作者 赵强 褚杰 《计算机工程》 CAS CSCD 北大核心 2008年第7期243-244,256,共3页
针对演化硬件中高效的染色体编码问题,该文采用虚拟可重构电路(VRC)实现内进化方式的演化硬件。VRC是由可重配置功能块(CFB)组成的阵列,CFB之间通过多路选择开关电路建立信号传输通道。染色体可以对CFB的功能选择和多路选择开关... 针对演化硬件中高效的染色体编码问题,该文采用虚拟可重构电路(VRC)实现内进化方式的演化硬件。VRC是由可重配置功能块(CFB)组成的阵列,CFB之间通过多路选择开关电路建立信号传输通道。染色体可以对CFB的功能选择和多路选择开关状态直接进行编码,以此减少自身的长度。实例证明了该方法的有效性。 展开更多
关键词 演化硬件 现场可编程门阵列 虚拟可重构电路 IP核
在线阅读 下载PDF
基于FPGA的AFDX虚拟链路层实现方法 被引量:5
5
作者 刘晓胜 刘建平 刘博 《计算机工程》 CAS CSCD 2012年第19期233-237,共5页
航空电子全双工交换式以太网(AFDX)为航空电子设备之间的数据交换提供电气和协议标准。在研究AFDX虚拟链路层协议的基础上,提出一种基于现场可编程门阵列(FPGA)的AFDX虚拟链路层软件设计框架,给出基于FPGA的AFDX虚拟链路层发送模块和接... 航空电子全双工交换式以太网(AFDX)为航空电子设备之间的数据交换提供电气和协议标准。在研究AFDX虚拟链路层协议的基础上,提出一种基于现场可编程门阵列(FPGA)的AFDX虚拟链路层软件设计框架,给出基于FPGA的AFDX虚拟链路层发送模块和接收模块的设计与软件实现,应用结果表明,该设计框架可促进AFDX端系统的研发。 展开更多
关键词 航空电子全双工交换式以太网 端系统 协议栈 虚拟链路层 现场可编程门阵列
在线阅读 下载PDF
高性能双通道稀疏采样虚拟示波器研制 被引量:2
6
作者 姜斌 唐禹 +2 位作者 包建荣 唐向宏 朱芳 《实验室研究与探索》 CAS 北大核心 2022年第3期144-149,共6页
虚拟仪器技术可有效降低电子类实验室建设的测试仪器投入。针对高校实验教学需求,研制了一款双通道虚拟示波器。该示波器硬件电路采用STM32+FPGA架构,结合压缩感知的随机采样完成低功耗信号采样及恢复,获得采样率200MS/s,带宽100MB功能... 虚拟仪器技术可有效降低电子类实验室建设的测试仪器投入。针对高校实验教学需求,研制了一款双通道虚拟示波器。该示波器硬件电路采用STM32+FPGA架构,结合压缩感知的随机采样完成低功耗信号采样及恢复,获得采样率200MS/s,带宽100MB功能的信号展示功能。在有限的硬件资源基础上,开发了信号发生器、频谱仪等功能,增强了实用性。相比现有同类产品,该示波器具有功耗低、配置灵活、信号测试带宽大及扩展性强等优势,具有较大应用价值。 展开更多
关键词 虚拟仪器 双通道 压缩采样 现场可编程门阵列 实验教学
在线阅读 下载PDF
基于虚拟仪器的阻抗参数测量系统的研究 被引量:4
7
作者 李凤婷 李冶 +1 位作者 孟兆海 刘名扬 《实验室研究与探索》 CAS 北大核心 2017年第4期141-145,208,共6页
设计了一种基于FPGA和虚拟仪器技术的阻抗测量系统。其原理为利用DDS直接数字频率合成技术设计实现系统的激励信号与基准信号,通过V-I法将阻抗转换为电压进行测量,利用相敏检波器滤除交流信号,便于对电压进行采集,再通过A/D进行转换,并... 设计了一种基于FPGA和虚拟仪器技术的阻抗测量系统。其原理为利用DDS直接数字频率合成技术设计实现系统的激励信号与基准信号,通过V-I法将阻抗转换为电压进行测量,利用相敏检波器滤除交流信号,便于对电压进行采集,再通过A/D进行转换,并通过总线实现系统与微处理器的数据通信,最后以Lab VIEW软件进行数据处理,通过软件界面进行数据显示和系统控制,从而实现对各个参数的测量和显示。系统采用虚拟仪器与计算机相结合的方式代替传统仪器,不仅操作简单方便,而且便于控制。另外,该系统具有测量精度高,容易实现的特点,并且广泛适用于实验研究与工业测控等相关领域。 展开更多
关键词 现场可编程门阵列 直接数字合成器 虚拟仪器 阻抗测量 高精度
在线阅读 下载PDF
基于CPU-FPGA异构平台的虚拟同步并网逆变器实时仿真算法设计 被引量:16
8
作者 吴盼 汪可友 +1 位作者 徐晋 李国杰 《电力系统保护与控制》 EI CSCD 北大核心 2020年第14期85-94,共10页
随着电力系统中电力电子器件的广泛应用,对于小步长(≤2μs)电磁暂态实时仿真的需求逐渐增加。此时,单独依靠CPU已难以满足其要求,转而结合现场可编程门阵列(Field Programmable Gate Array,FPGA)来实现是一大趋势。搭建了适用于虚拟同... 随着电力系统中电力电子器件的广泛应用,对于小步长(≤2μs)电磁暂态实时仿真的需求逐渐增加。此时,单独依靠CPU已难以满足其要求,转而结合现场可编程门阵列(Field Programmable Gate Array,FPGA)来实现是一大趋势。搭建了适用于虚拟同步并网逆变器系统实时仿真的CPU-FPGA异构计算平台。其中,FPGA电路部分采用优化EMTP(Electro-Magnetic Transient Program)流程实现,综合利用恒导纳开关建模、支路拆分并行处理及矩阵化流程计算来优化仿真实时性能。CPU控制部分采用虚拟同步控制,并设计了与FPGA异步通信的数据交互接口。最后,针对该并网逆变器系统进行小步长实时仿真,与Simulink离线仿真结果相对比,同时分析平台实时性能与FPGA上资源消耗,验证了基于所提平台实现虚拟同步并网逆变器系统实时仿真的准确性与有效性。 展开更多
关键词 并网逆变器系统 实时仿真 虚拟同步控制 电磁暂态仿真算法 现场可编程门阵列
在线阅读 下载PDF
基于FPGA和LabVIEW的虚拟频率特性测试仪设计 被引量:4
9
作者 郭睿楠 李冶 王义涛 《实验室研究与探索》 CAS 北大核心 2016年第5期101-104,126,共5页
为了提高数据分析处理能力和充分利用计算机资源,设计了一种基于现场可编程门阵列(FPGA)和Lab VIEW开发环境的虚拟频率特性测试仪。遵循模块化理念搭建了以单片机为控制单元,USB芯片为通信单元的硬件电路,FPGA实现数据存储和时钟控制等... 为了提高数据分析处理能力和充分利用计算机资源,设计了一种基于现场可编程门阵列(FPGA)和Lab VIEW开发环境的虚拟频率特性测试仪。遵循模块化理念搭建了以单片机为控制单元,USB芯片为通信单元的硬件电路,FPGA实现数据存储和时钟控制等功能,提高了电路的集成度。采用数据流思想,在图形化编程软件Lab VIEW中开发了人机交互界面,可以操作仪器发出扫频信号,显示频率特性曲线,还能对数据进行分析,得到用户感兴趣的参数,同时支持数据的存储功能。实验结果表明,仪器能够满足教学领域的要求。与同类设计相比,该方案具有成本低,灵活性高等优点。 展开更多
关键词 现场可编程门阵列 频率特性测试仪 虚拟仪器 LABVIEW
在线阅读 下载PDF
基于SOPC技术的嵌入式PLC虚拟机设计 被引量:2
10
作者 王盛长 林浒 陶耀东 《计算机工程与设计》 CSCD 北大核心 2010年第20期4361-4364,4371,共5页
设计了一种新型的基于可编程片上系统(SOPC)技术的嵌入式可编程逻辑控制器。介绍了嵌入式PLC的总体结构,并且对核心部分PLC虚拟机的实现分别从硬件和软件两个方面进行了详细阐述,其中运用Nios Ⅱ软核作为处理器,μC/OS-II实时操作系统... 设计了一种新型的基于可编程片上系统(SOPC)技术的嵌入式可编程逻辑控制器。介绍了嵌入式PLC的总体结构,并且对核心部分PLC虚拟机的实现分别从硬件和软件两个方面进行了详细阐述,其中运用Nios Ⅱ软核作为处理器,μC/OS-II实时操作系统作为虚拟机运行平台,实现了逻辑控制器的实时控制功能。系统以现场可编程门阵列(field programmable gataarray,FPGA)为平台开发的逻辑控制器简化了平台硬件结构,具有开放、使用方便、可自定义外设和本身结构紧凑等特点,可以灵活的实现定制应用。 展开更多
关键词 可编程片上系统 ΜC/OS-II 现场可编程门阵列 嵌入式PLC 虚拟
在线阅读 下载PDF
基于FPGA与LabVIEW的虚拟示波存储系统设计 被引量:1
11
作者 石英 陈心浩 +1 位作者 倪文军 何彦娉 《实验室研究与探索》 CAS 北大核心 2023年第4期21-26,33,共7页
针对传统示波器难以采集信号数据、不易便携、价格较贵等问题,设计了一种基于FPGA与LabVIEW的虚拟示波存储系统。虚拟示波器存储系统由下位机数据采集器和上位机应用程序构成,其中系统下位机以FPGA为核心,支持USB接口通信与供电的数据... 针对传统示波器难以采集信号数据、不易便携、价格较贵等问题,设计了一种基于FPGA与LabVIEW的虚拟示波存储系统。虚拟示波器存储系统由下位机数据采集器和上位机应用程序构成,其中系统下位机以FPGA为核心,支持USB接口通信与供电的数据采集器,可同时对双路高频小信号进行转换与传输,且每个通道最高采样频率可达60 MHz,数据传输速率可达480 Mb/s;系统上位机基于LabVIEW软件,开发了系统应用程序,不仅实现与优化了传统示波器波形显示、参数测量等常用功能,还实现了信号数据采集功能。通过实验测试与对比分析表明,虚拟示波存储系统可以快速、准确地测量信号幅频参数、显示信号波形和采集信号数据,能够对峰峰值50 mV以上、1 MHz以内的信号幅度和频率进行准确测量,准确度优于传统示波器。 展开更多
关键词 虚拟示波器 数据采集 现场可编程门阵列 LABVIEW 通用串行总线
在线阅读 下载PDF
基于张量虚拟机的深度神经网络模型加速方法 被引量:1
12
作者 申云飞 申飞 +1 位作者 李芳 张俊 《计算机应用》 CSCD 北大核心 2023年第9期2836-2844,共9页
随着人工智能(AI)技术的蓬勃发展,深度神经网络(DNN)模型被大规模应用到各类移动端与边缘端。然而,边缘端算力低、内存容量小,且实现模型加速需要深入掌握边缘端硬件知识,这增加了模型的部署难度,也限制了模型的推广应用。因此,基于张... 随着人工智能(AI)技术的蓬勃发展,深度神经网络(DNN)模型被大规模应用到各类移动端与边缘端。然而,边缘端算力低、内存容量小,且实现模型加速需要深入掌握边缘端硬件知识,这增加了模型的部署难度,也限制了模型的推广应用。因此,基于张量虚拟机(TVM)提出一种DNN加速与部署方法,从而实现卷积神经网络(CNN)模型在现场可编程门阵列(FPGA)上的加速,并在分心驾驶分类应用场景下验证了所提方法的可行性。通过计算图优化方法减小了模型的访存和计算开销,通过模型量化方法减小了模型尺寸,通过计算图打包方法将卷积计算卸载到FPGA上执行以提高模型推理速度。与微处理器(MPU)相比,所提方法可使ResNet50和ResNet18在MPU+FPGA上的推理时间分别减少88.63%和77.53%;而在AUC(American University in Cairo)数据集上,相较于MPU,两个模型在MPU+FPGA上的top1推理精度仅下降了0.26和0.16个百分点。可见,所提方法可以降低不同模型在FPGA上的部署难度。 展开更多
关键词 张量虚拟 深度神经网络 现场可编程门阵列 边缘设备 模型部署 模型加速
在线阅读 下载PDF
基于FPGA的电力电子恒导纳开关模型修正算法及实时仿真架构 被引量:3
13
作者 王钦盛 王灿 +1 位作者 潘学伟 梁亮 《电力系统自动化》 EI CSCD 北大核心 2024年第1期150-159,共10页
电力电子实时仿真是目前电力电子系统研究过程中的重要工具。为设计一套经济、可靠的电力电子实时仿真系统,文中搭建了一个以现场可编程门阵列(FPGA)为计算核心的硬件平台,并提出了配套的电磁仿真算法和FPGA架构设计。首先,推导了一种... 电力电子实时仿真是目前电力电子系统研究过程中的重要工具。为设计一套经济、可靠的电力电子实时仿真系统,文中搭建了一个以现场可编程门阵列(FPGA)为计算核心的硬件平台,并提出了配套的电磁仿真算法和FPGA架构设计。首先,推导了一种简洁电磁暂态程序(EMTP)算法,用于提高传统离线算法的并行度。其次,从数值算法的角度分析恒导纳开关模型的虚拟功率损耗问题,提出了一种初始误差修正算法,消除了功率损耗。再次,串联以上算法,设计了一种基于状态机框架的数字信号处理(DSP)硬核资源复用FPGA架构,以硬件资源复用的方式实现了资源的高效利用,在不损失速度的同时提高了FPGA的利用效率。最后,通过多个实时仿真算例验证了所提方法的有效性和正确性。 展开更多
关键词 电磁暂态仿真 实时仿真 电力电子开关 虚拟功率损耗 现场可编程门阵列 资源复用
在线阅读 下载PDF
基于电磁仿生概念的静电放电注入损伤防护模型设计 被引量:18
14
作者 满梦华 巨政权 +3 位作者 原青云 周永学 原亮 刘尚合 《高电压技术》 EI CAS CSCD 北大核心 2011年第2期375-381,共7页
随着半导体制造工艺水平和电路集成度的不断提高,加之电磁环境日趋复杂、多变,使得应用于电子系统的传统电磁防护和抗扰方式的不足正日渐突出,导致典型现场可编程逻辑门阵列(FPGA)芯片的电磁抗扰度逐渐下降。以广泛应用的FPGA为研究对象... 随着半导体制造工艺水平和电路集成度的不断提高,加之电磁环境日趋复杂、多变,使得应用于电子系统的传统电磁防护和抗扰方式的不足正日渐突出,导致典型现场可编程逻辑门阵列(FPGA)芯片的电磁抗扰度逐渐下降。以广泛应用的FPGA为研究对象,针对典型近场危害源静电放电(ESD)的防护问题,利用试验方法模拟人ESD注入FPGA芯片对其内部电路造成损伤的过程,建立FPGA受ESD损伤的行为级故障模型,结果表明,电子系统与生物系统受损过程具有某些相似的规律。进而基于电磁仿生学的思想,设计了具有冗余机制和结构自组织功能的虚拟细胞模型,利用遗传算法实现故障自修复的功能。最后利用马尔可夫模型分析其稳态可用度,证明在随机ESD事件频繁发生并导致电路损伤时,此模型仍能保持较高的可用度和安全性。 展开更多
关键词 电磁仿生 静电放电 现场可编程逻辑门阵列 故障模型 虚拟细胞 可靠性 马尔科夫模型
在线阅读 下载PDF
基于FPGA的在线硬件实践教学平台的设计 被引量:9
15
作者 崔贯勋 《实验室研究与探索》 CAS 北大核心 2017年第4期153-156,195,共5页
在对当前计算机硬件类实验课程存在的问题进行系统分析的基础上,以虚拟仿真、云计算和FPGA为切入点,从技术角度阐述了SPOE实践教学云平台所需的关键技术、平台架构、仿真模型及平台运行模式,设计并实现了基于FPGA和云计算技术的SPOE模... 在对当前计算机硬件类实验课程存在的问题进行系统分析的基础上,以虚拟仿真、云计算和FPGA为切入点,从技术角度阐述了SPOE实践教学云平台所需的关键技术、平台架构、仿真模型及平台运行模式,设计并实现了基于FPGA和云计算技术的SPOE模式下的实践教学云平台,有助于学生自主学习和探究学习,有效提高学生的学习效率,并进一步加强学生的思维创新能力、系统综合和系统分析能力的培养。 展开更多
关键词 云平台 虚拟仿真 计算机硬件实践教学 现场可编程门阵列 多课程贯通
在线阅读 下载PDF
一种导航计算机检测设备 被引量:1
16
作者 马迎建 韩玉敏 潘江江 《电子测量技术》 2008年第12期89-91,共3页
本文提出了基于虚拟仪器技术和自动化测试技术相结合的导航计算机检测设备。设备的上位机运行LabVIEW程序产生载体姿态信号,将信号通过RS232传输,最后在基于FPGA的硬件电路上产生与真实陀螺相同的输出信号。被测导航计算机在此输入信号... 本文提出了基于虚拟仪器技术和自动化测试技术相结合的导航计算机检测设备。设备的上位机运行LabVIEW程序产生载体姿态信号,将信号通过RS232传输,最后在基于FPGA的硬件电路上产生与真实陀螺相同的输出信号。被测导航计算机在此输入信号下工作并给出导航计算的输出结果。数据采集由上位机完成,并以此评判导航计算机的状态,完成现场快速测试和故障诊断。本文主要论述上位机的工作,对FPGA的应用也作了简单介绍。 展开更多
关键词 导航计算机 虚拟仪器 现场可编程逻辑门阵列 LABVIEW 陀螺仪
在线阅读 下载PDF
基于FPGA的SPOE实践教学云平台的设计与实现 被引量:1
17
作者 崔贯勋 《实验技术与管理》 CAS 北大核心 2017年第1期146-149,共4页
为了使SPOC教学模式能在对实践有较强要求的课程中得到推广,在对SPOE进行系统分析的基础上,以虚拟仿真、云计算和FPGA为切入点,从技术角度阐述了SPOE实践教学云平台所需的关键技术、平台架构、仿真模型及平台运行模式,设计并实现了基于F... 为了使SPOC教学模式能在对实践有较强要求的课程中得到推广,在对SPOE进行系统分析的基础上,以虚拟仿真、云计算和FPGA为切入点,从技术角度阐述了SPOE实践教学云平台所需的关键技术、平台架构、仿真模型及平台运行模式,设计并实现了基于FPGA和云计算技术、SPOE模式下的实践教学云平台,并将该实验教学平台应用到重庆理工大学相关课程实验教学中,取得了良好的效果。 展开更多
关键词 云平台 虚拟仿真 实践教学 现场可编程门阵列
在线阅读 下载PDF
新型电磁辐射检测系统设计 被引量:2
18
作者 张振佳 卓力 +2 位作者 张一鸣 余飞 张玉涛 《传感器与微系统》 CSCD 2015年第9期83-86,共4页
针对目前我国电磁环境检测系统的功能局限和操作不便等不足,设计了一种新型的自动化电磁检测系统。系统采用集成化设计方法,以现场可编程门阵列(FPGA)作为底层硬件控制平台,由虚拟仪器开发操作界面。该系统具有宽频带、高精度、功能多... 针对目前我国电磁环境检测系统的功能局限和操作不便等不足,设计了一种新型的自动化电磁检测系统。系统采用集成化设计方法,以现场可编程门阵列(FPGA)作为底层硬件控制平台,由虚拟仪器开发操作界面。该系统具有宽频带、高精度、功能多样、智能性强等优点,能满足"单人—单机—单站"的检测要求。通过对样机的设计与测试,验证了本系统具有很高的稳定性和精确度,为电磁污染的检测提供了一种新型设备。 展开更多
关键词 电磁辐射检测 软硬一体 虚拟仪器 LABVIEW 现场可编程门阵列
在线阅读 下载PDF
一种面向FPGA异构计算的高效能KV加速器 被引量:1
19
作者 孙征征 兰亚柱 付斌章 《计算机工程与科学》 CSCD 北大核心 2016年第8期1574-1580,共7页
网络功能虚拟化等新兴应用的蓬勃发展对Key-Value查询的能效提出了更高要求。传统的解决方法要么采用基于软件Hash表,要么采用专用的三态内容可寻址存储器(TCAM)芯片进行加速。其中,软件方法实现成本低,但是在数据冲突较高时会导致查表... 网络功能虚拟化等新兴应用的蓬勃发展对Key-Value查询的能效提出了更高要求。传统的解决方法要么采用基于软件Hash表,要么采用专用的三态内容可寻址存储器(TCAM)芯片进行加速。其中,软件方法实现成本低,但是在数据冲突较高时会导致查表性能急速下降;硬件TCAM方法具有优良的时间特性,但其价格昂贵、耗能巨大。目前,随着基于现场可编程门阵列FPGA的异构计算技术的高速发展,利用系统已经提供的FPGA资源对基于软件实现的Hash表结构进行加速成为一种性价比更佳的解决方案。探讨如何利用FPGA上的RAM资源来实现一种具有高扩展性和高能效比的TCAM逻辑。与传统的TCAM结构不同,提出的架构支持查表范围的动态缩放,从而可以有效减少查表功耗。为了验证方案的有效性,利用Virtex-7系列FPGA对本文方案进行实现和评估,并与软件查表的性能进行详细比较。实验表明,本文方案吞吐量可达到234 Mpps,查表延迟为25.56ns。相比软件的方法,吞吐量提高780倍,延迟降低240倍。 展开更多
关键词 网络功能虚拟 Key—Value查询 三态内容可寻址存储器 现场可编程门阵列
在线阅读 下载PDF
面向细粒度FPGA管理的CNN异构加速框架 被引量:2
20
作者 郭开诚 吴承刚 +2 位作者 张伟丰 戚正伟 管海兵 《计算机学报》 EI CAS CSCD 北大核心 2021年第12期2529-2541,共13页
近年来,现场可编程逻辑门阵列(FPGA)由于其灵活的可定制性和优秀的并行性,在硬件加速卷积神经网络(CNN)的研究和应用中吸引了广泛的关注.这些工作主要集中在两方面:对特定硬件加速模块的设计和优化以及对一类网络模型的通用加速硬件设计... 近年来,现场可编程逻辑门阵列(FPGA)由于其灵活的可定制性和优秀的并行性,在硬件加速卷积神经网络(CNN)的研究和应用中吸引了广泛的关注.这些工作主要集中在两方面:对特定硬件加速模块的设计和优化以及对一类网络模型的通用加速硬件设计.前者一般是基于数据流的针对固定网络的设计,通过牺牲通用性来换取性能;后者一般是基于指令集能够加速一类模型的设计,通过牺牲性能来换取通用性.为了能够灵活地应对不同的需求,本文提出一种通过管理不同粒度算子来平衡性能与通用性的fGrain框架.该框架一方面利用底层基于数据流的算子设计来充分发挥硬件性能,另一方面通过虚拟化层来管理算子映射提供灵活性.实验表明,相比GPU推理延迟至多有25%的提升,而虚拟化性能损失仅在1.3%以下. 展开更多
关键词 卷积神经网络 现场可编程逻辑门阵列 机器学习系统 用户态虚拟 开放编程语言
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部