期刊文献+
共找到257篇文章
< 1 2 13 >
每页显示 20 50 100
基于FPGA的MobileNetV1目标检测加速器设计 被引量:2
1
作者 严飞 郑绪文 +2 位作者 孟川 李楚 刘银萍 《现代电子技术》 北大核心 2025年第1期151-156,共6页
卷积神经网络是目标检测中的常用算法,但由于卷积神经网络参数量和计算量巨大导致检测速度慢、功耗高,且难以部署到硬件平台,故文中提出一种采用CPU与FPGA融合结构实现MobileNetV1目标检测加速的应用方法。首先,通过设置宽度超参数和分... 卷积神经网络是目标检测中的常用算法,但由于卷积神经网络参数量和计算量巨大导致检测速度慢、功耗高,且难以部署到硬件平台,故文中提出一种采用CPU与FPGA融合结构实现MobileNetV1目标检测加速的应用方法。首先,通过设置宽度超参数和分辨率超参数以及网络参数定点化来减少网络模型的参数量和计算量;其次,对卷积层和批量归一化层进行融合,减少网络复杂性,提升网络计算速度;然后,设计一种八通道核间并行卷积计算引擎,每个通道利用行缓存乘法和加法树结构实现卷积运算;最后,利用FPGA并行计算和流水线结构,通过对此八通道卷积计算引擎合理的复用完成三种不同类型的卷积计算,减少硬件资源使用量、降低功耗。实验结果表明,该设计可以对MobileNetV1目标检测进行硬件加速,帧率可达56.7 f/s,功耗仅为0.603 W。 展开更多
关键词 卷积神经网络 目标检测 fpga MobileNetV1 并行计算 硬件加速
在线阅读 下载PDF
A computational method for post-construction settlement of high-speed railway bridge pile foundation considering soil creep effect 被引量:12
2
作者 冯胜洋 魏丽敏 +1 位作者 何重阳 何群 《Journal of Central South University》 SCIE EI CAS 2014年第7期2921-2927,共7页
Based on reasonable assumptions that simplified the calculational model,a simple and practical method was proposed to calculate the post-construction settlement of high-speed railway bridge pile foundation by using th... Based on reasonable assumptions that simplified the calculational model,a simple and practical method was proposed to calculate the post-construction settlement of high-speed railway bridge pile foundation by using the Mesri creep model to describe the soil characteristics and the Mindlin-Geddes method considering pile diameter to calculate the vertical additional stress of pile bottom.A program named CPPS was designed for this method to calculate the post-construction settlement of a high-speed railway bridge pile foundation.The result indicates that the post-construction settlement in 100 years meets the requirements of the engineering specifications,and in the first two decades,the post-construction settlement is about 80% of its total settlement,while the settlement in the rest eighty years tends to be stable.Compared with the measured settlement after laying railway tracks,the calculational result is closed to that of the measured,and the results are conservative with a high computational accuracy.It is noted that the method can be used to calculate the post-construction settlement for the preliminary design of high-speed railway bridge pile foundation. 展开更多
关键词 high-speed railway bridge pile foundation post-construction settlement Mesri creep model simplified computational method
在线阅读 下载PDF
一种基于FPGA的SVPWM硬件架构及其计算速度优化 被引量:1
3
作者 刘德平 辛云川 刘子旭 《郑州大学学报(工学版)》 CAS 北大核心 2024年第3期96-102,共7页
为了提高七段式两电平SVPWM算法的调制速度并减少逻辑资源的使用量,提出了一种基于FPGA的SVPWM硬件架构。在该硬件架构输入参考电压后,首先,进行基于Clarke逆变换的坐标变换,通过一系列加法运算构建出含有三相占空比的3组中间变量,同时... 为了提高七段式两电平SVPWM算法的调制速度并减少逻辑资源的使用量,提出了一种基于FPGA的SVPWM硬件架构。在该硬件架构输入参考电压后,首先,进行基于Clarke逆变换的坐标变换,通过一系列加法运算构建出含有三相占空比的3组中间变量,同时通过2个异或运算从上述硬件布线中得到简化后的2 bit扇区判断条件;然后,根据简化后的2 bit扇区判断条件从以上3组中间变量中筛选出三相占空比,并进行钳位保护,按照自然采样法输出PWM。以上过程形成一个整体,在FPGA中只需3次触发,便能在2个时钟周期内完成从参考电压输入到三相PWM输出的整个过程,有效提高了计算速度。此外,还给出了该硬件架构在不同的FPGA平台下的资源使用情况,与其他方法相比,LUT使用量由至少500个缩减至300个左右,逻辑资源使用量降低。通过仿真与实物试验,验证了所提硬件架构的有效性。 展开更多
关键词 SVPWM 硬件架构 Clarke逆变换 fpga 计算速度优化
在线阅读 下载PDF
基于FPGA并行实现SVM训练的可重构计算系统 被引量:1
4
作者 彭卫东 郭威 魏麟 《计算机科学》 CSCD 北大核心 2024年第S02期786-792,共7页
针对支持向量机在处理大规模数据集时所面临的计算复杂度高和训练时间长的问题,设计了一种基于FPGA并行实现支持向量机训练的可重构计算系统,并分析了不同量化方式下的硬件资源消耗与加速性能。通过采用随机梯度下降法训练支持向量机,... 针对支持向量机在处理大规模数据集时所面临的计算复杂度高和训练时间长的问题,设计了一种基于FPGA并行实现支持向量机训练的可重构计算系统,并分析了不同量化方式下的硬件资源消耗与加速性能。通过采用随机梯度下降法训练支持向量机,使得需要求解的维度与样本的维度相关联,相较于传统的基于二次规划的求解方法可以显著降低计算复杂性。同时,利用基于FPGA的可重构硬件平台设计了专用并行计算结构以加速支持向量机的训练过程。对设计的完整系统进行了软硬件联合仿真,在4个公共数据集上的仿真结果表明,整体模型预测准确率达到90%以上;在训练阶段,相较于采用相同算法的软件实现,所提出的浮点数表示下硬件实现的单个样本处理时间至少减少了2个数量级;定点数表示下硬件实现的单个样本处理时间最大减小了3个数量级;与基于二次规划问题求解的硬件实现相比,单个样本处理速度最快提升了394倍。 展开更多
关键词 现场可编程逻辑门阵列 支持向量机 可重构系统 并行计算 随机梯度下降法
在线阅读 下载PDF
基于FPGA的新能源低压直流配电系统暂态实时仿真研究 被引量:1
5
作者 王守相 张春雨 赵倩宇 《电工技术学报》 EI CSCD 北大核心 2024年第17期5365-5378,5393,共15页
对新能源低压直流配电系统开展暂态实时仿真研究对优化其运行控制具有重要作用。由于现场可编程门阵列(FPGA)内部集成了大量具有不同功能的电路,FPGA正成为电力系统暂态实时仿真领域主要的计算载体之一。该文面向新能源低压直流配电系... 对新能源低压直流配电系统开展暂态实时仿真研究对优化其运行控制具有重要作用。由于现场可编程门阵列(FPGA)内部集成了大量具有不同功能的电路,FPGA正成为电力系统暂态实时仿真领域主要的计算载体之一。该文面向新能源低压直流配电系统的暂态实时仿真需求,开发了一种基于FPGA的包含小型分布式风力发电、光伏发电以及蓄电池储能单元的新能源低压直流配电系统暂态实时仿真器。首先,研究构建了分布式发电单元和典型控制回路的计算模块,利用FPGA的并行计算特性并结合“算法-结构-有效匹配(AAA)”理念建立了底层模块串并联混合求解结构;然后,在节点分析法的框架下,建立了一种结合矩阵LDU分解和有向无环图(DAG)的电气系统节点电导矩阵并行求解方法;最后,在建立电气系统与控制系统并行求解架构的基础上,开发了一种基于FPGA的新能源低压直流配电系统暂态实时仿真器,通过将其仿真结果与PSCAD/EMTDC离线仿真平台的计算结果进行对比,验证了所开发暂态实时仿真器的有效性和准确性。 展开更多
关键词 现场可编程门阵列(fpga) 实时仿真 分布式发电 低压直流配电系统 并行计算
在线阅读 下载PDF
基于FPGA的卷积神经网络和视觉Transformer通用加速器 被引量:1
6
作者 李天阳 张帆 +2 位作者 王松 曹伟 陈立 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第6期2663-2672,共10页
针对计算机视觉领域中基于现场可编程逻辑门阵列(FPGA)的传统卷积神经网(CNN)络加速器不适配视觉Transformer网络的问题,该文提出一种面向卷积神经网络和Transformer的通用FPGA加速器。首先,根据卷积和注意力机制的计算特征,提出一种面... 针对计算机视觉领域中基于现场可编程逻辑门阵列(FPGA)的传统卷积神经网(CNN)络加速器不适配视觉Transformer网络的问题,该文提出一种面向卷积神经网络和Transformer的通用FPGA加速器。首先,根据卷积和注意力机制的计算特征,提出一种面向FPGA的通用计算映射方法;其次,提出一种非线性与归一化加速单元,为计算机视觉神经网络模型中的多种非线性和归一化操作提供加速支持;然后,在Xilinx XCVU37P FPGA上实现了加速器设计。实验结果表明,所提出的非线性与归一化加速单元在提高吞吐量的同时仅造成很小的精度损失,ResNet-50和ViT-B/16在所提FPGA加速器上的性能分别达到了589.94 GOPS和564.76 GOPS。与GPU实现相比,能效比分别提高了5.19倍和7.17倍;与其他基于FPGA的大规模加速器设计相比,能效比有明显提高,同时计算效率较对比FPGA加速器提高了8.02%~177.53%。 展开更多
关键词 计算机视觉 卷积神经网络 TRANSFORMER fpga 硬件加速器
在线阅读 下载PDF
基于FPGA的永磁同步电机零计算延迟扩张控制集模型预测电流控制 被引量:1
7
作者 杨辰宇 刘凯 +1 位作者 胡铭觐 花为 《中国电机工程学报》 EI CSCD 北大核心 2024年第S01期264-273,共10页
该文基于现场可编程门阵列(field-programmable gate array,FPGA),为永磁同步电机驱动提出一种扩张控制集模型预测电流控制策略(model predictive current control,MPCC)。由于在每个控制周期内只有8个基本电压矢量可供选择,传统有限控... 该文基于现场可编程门阵列(field-programmable gate array,FPGA),为永磁同步电机驱动提出一种扩张控制集模型预测电流控制策略(model predictive current control,MPCC)。由于在每个控制周期内只有8个基本电压矢量可供选择,传统有限控制集模型预测电流控制(finite control set MPCC,FCS-MPCC)稳态性能较低。为此,文中采用具有818个可选矢量的ECS来实现更精细的电压输出。为减轻因电压矢量大幅增加而带来的计算负担,设计一种简化的最优矢量搜索策略,且可推广用于其他多目标成本函数。基于算法固有并行性,将所提ECS-MPCC方法在FPGA中进行实现,使电流环总控制时间缩短至0.59μs,从而可以消除计算延迟,提高电流环动态性能。最后,通过仿真和实验,验证所提ECS-MPCC策略的有效性。实验结果表明,与传统FCS-MPCC相比,ECS-MPCC的相电流总谐波失真降低77%。 展开更多
关键词 模型预测控制 扩张控制集 零计算延迟 现场可编程门阵列实施 永磁同步电机
在线阅读 下载PDF
基于FPGA的稀疏卷积神经网络加速器设计 被引量:1
8
作者 李宁 肖昊 《电子测量技术》 北大核心 2024年第5期1-8,共8页
剪枝是一种减少卷积神经网络权重和计算量的有效方法,为CNN的高效部署提供了解决方案。但是,剪枝后的稀疏CNN中权重的不规则分布使硬件计算单元之间的计算负载各不相同,降低了硬件的计算效率。文章提出一种细粒度的CNN模型剪枝方法,该... 剪枝是一种减少卷积神经网络权重和计算量的有效方法,为CNN的高效部署提供了解决方案。但是,剪枝后的稀疏CNN中权重的不规则分布使硬件计算单元之间的计算负载各不相同,降低了硬件的计算效率。文章提出一种细粒度的CNN模型剪枝方法,该方法根据硬件加速器的架构将整体权重分成若干个局部权重组,并分别对每一组局部权重进行独立剪枝,得到的稀疏CNN在加速器上实现了计算负载平衡。此外,设计一种具有高效PE结构和稀疏度可配置的稀疏CNN加速器并在FPGA上实现,该加速器的高效PE结构提升了乘法器的吞吐率,同时可配置性使其可灵活地适应不同稀疏度的CNN计算。实验结果表明,提出的剪枝算法可将CNN的权重参数减少50%~70%,同时精度损失不到3%。相比于密集型加速器,提出的加速器最高可实现3.65倍的加速比;与其他的稀疏型加速器研究相比,本研究的加速器在硬件效率上提升28%~167%。 展开更多
关键词 卷积神经网络 硬件加速器 稀疏计算 fpga
在线阅读 下载PDF
YOMANet-Accel:面向边缘端人车检测的轻量化算法加速器
9
作者 陈宁江 卢耀宗 《电子与信息学报》 北大核心 2025年第8期2895-2908,共14页
针对自动驾驶边缘计算场景中行人车辆检测任务面临的模型计算复杂度高、参数量大导致的部署难题,该文提出一种轻量化神经网络模型YOMANet(Yolo Model Adaptation Network),基于异构FPGA平台设计YOMANet加速器(YOMANet-Accel),实现边缘... 针对自动驾驶边缘计算场景中行人车辆检测任务面临的模型计算复杂度高、参数量大导致的部署难题,该文提出一种轻量化神经网络模型YOMANet(Yolo Model Adaptation Network),基于异构FPGA平台设计YOMANet加速器(YOMANet-Accel),实现边缘端人车检测的算法加速。YOMANet算法的主干网络采用轻量型网络MobileNetv2以大幅压缩模型参数量,颈部网络使用深度可分离卷积来代替常规卷积以提升训练速度,并在头部网络嵌入基于归一化的注意力模块(NAM)以增强网络对细节信息的捕获能力。为将YOMANet算法部署到现场可编程门阵列(FPGA)平台,该文针对卷积运算在任务层设计循环分块以调整内循环和外循环的顺序,在运算层对处理引擎单元(PE)设计乘加树,使得多个乘加运算可以同时执行,提高数据的并行计算效率。同时,针对数据存储过程采用双缓存机制来减少数据传输时延,对权重参数和激活函数进行int8数据量化以降低资源消耗。实验结果表明,YOMANet算法在训练平台上的检测精度和检测速度表现优异,对小目标和遮挡目标具备较好的检测能力,有效减少了误检和漏检情况的发生。算法部署到硬件平台后,YOMANet-Accel的目标检测效果保持在较高水平,硬件资源的能效比表现良好,有效发挥了FPGA的并行优势。 展开更多
关键词 行人与车辆检测 边缘计算 轻量化 异构fpga加速
在线阅读 下载PDF
用FPGA实现浮点FFT处理器的研究 被引量:12
10
作者 王远模 赵宏钟 +1 位作者 张军 付强 《国防科技大学学报》 EI CAS CSCD 北大核心 2004年第6期61-64,共4页
针对定点FFT处理器精度不高的缺点,提出了浮点格式FFT处理器的FPGA硬件实现方案。详细阐述了FFT处理器的自定制浮点格式确定、算法选择和浮点加法实现等关键技术。该处理器已投入使用,工作性能稳定,系统时钟80MHz,完成1024点FFT IFFT运... 针对定点FFT处理器精度不高的缺点,提出了浮点格式FFT处理器的FPGA硬件实现方案。详细阐述了FFT处理器的自定制浮点格式确定、算法选择和浮点加法实现等关键技术。该处理器已投入使用,工作性能稳定,系统时钟80MHz,完成1024点FFT IFFT运算只需64μs,误差小于-80dB。 展开更多
关键词 fpga FFT 蝶形运算
在线阅读 下载PDF
一种基于FPGA的可重构计算系统设计 被引量:11
11
作者 吴冬冬 杨晓君 +1 位作者 刘新春 江先阳 《计算机工程与应用》 CSCD 北大核心 2006年第21期74-77,共4页
介绍可重构计算的概念和基于SRAM工艺的FPGA器件的特点。设计了一种基于FPGA器件的可重构计算系统,着重讲述了该系统的在线重配置电路的总体结构,FIFO、FPGA配置逻辑模块、控制寄存器和控制逻辑等功能模块及系统的工作流程。最后探讨了... 介绍可重构计算的概念和基于SRAM工艺的FPGA器件的特点。设计了一种基于FPGA器件的可重构计算系统,着重讲述了该系统的在线重配置电路的总体结构,FIFO、FPGA配置逻辑模块、控制寄存器和控制逻辑等功能模块及系统的工作流程。最后探讨了可重构计算相关研究面临的问题和发展方向。 展开更多
关键词 可重构计算 fpga 在线重配置
在线阅读 下载PDF
采用FPGA的机器视觉系统发展现状与趋势 被引量:17
12
作者 原魁 肖晗 何文浩 《计算机工程与应用》 CSCD 北大核心 2010年第36期1-6,共6页
采用FPGA作为主要运算器件的嵌入式视觉系统具有高性能、低功耗、结构紧凑等特点,是计算机视觉的研究热点之一,有着广阔的应用前景。文章对近年来国内外基于FPGA的嵌入式视觉系统方面有代表性的研究成果进行了介绍,并对相关研究领域目... 采用FPGA作为主要运算器件的嵌入式视觉系统具有高性能、低功耗、结构紧凑等特点,是计算机视觉的研究热点之一,有着广阔的应用前景。文章对近年来国内外基于FPGA的嵌入式视觉系统方面有代表性的研究成果进行了介绍,并对相关研究领域目前存在的主要问题以及发展趋势进行了讨论。 展开更多
关键词 机器视觉 嵌入式系统 现场可编程门阵列(fpga) 硬件计算 并行计算
在线阅读 下载PDF
基于FPGA的开放式教学CPU的设计与测试系统 被引量:14
13
作者 李山山 汤志忠 周继群 《计算机工程与应用》 CSCD 北大核心 2005年第14期98-100,198,共4页
设计并实现了一个CPU设计与测试实验装置,适合于计算机原理和系统结构课程的综合实验。该实验装置采用EDA工具在FPGA上实现了CPU设计,应用M CU和上位机软件对所设计的CPU进行了监控和调试,保证了CPU在实验系统上能够运行起来。
关键词 CPU设计与测试 fpga 计算机原理 系统结构 单片机
在线阅读 下载PDF
FPGA实现高速FFT处理器的设计 被引量:23
14
作者 韩颖 王旭 吴嗣亮 《电讯技术》 北大核心 2003年第2期74-78,共5页
介绍了采用Xilinx公司的Virtex -II系列FPGA设计高速FFT处理器的实现方法及技巧。充分利用Virtex -II芯片的硬件资源 ,减少复杂逻辑 ,采用流水方式对复数数据实现了加窗、FFT、求模平方三种运算。整个设计采用流水与并行方式尽量避免瓶... 介绍了采用Xilinx公司的Virtex -II系列FPGA设计高速FFT处理器的实现方法及技巧。充分利用Virtex -II芯片的硬件资源 ,减少复杂逻辑 ,采用流水方式对复数数据实现了加窗、FFT、求模平方三种运算。整个设计采用流水与并行方式尽量避免瓶颈的出现 ,提高系统时钟频率 ,达到高速处理。实验表明此处理器既有专用ASIC电路的快速性 ,又有DSP器件的灵活性的特点 。 展开更多
关键词 数字信号处理 现场可编程门阵列 快速傅里叶变换 加窗运算 求模平方运算 FFT处理器
在线阅读 下载PDF
基于FPGA/Nios-Ⅱ的矩阵运算硬件加速器设计 被引量:32
15
作者 许芳 席毅 +1 位作者 陈虹 靳伟伟 《电子测量与仪器学报》 CSCD 2011年第4期377-383,共7页
针对复杂算法中矩阵运算量大,计算复杂,耗时多,制约算法在线计算性能的问题,从硬件实现角度,研究基于FPGA/Nios-Ⅱ的矩阵运算硬件加速器设计,实现矩阵并行计算。首先根据矩阵运算的算法分析,设计了矩阵并行计算的硬件实现结构,并在Model... 针对复杂算法中矩阵运算量大,计算复杂,耗时多,制约算法在线计算性能的问题,从硬件实现角度,研究基于FPGA/Nios-Ⅱ的矩阵运算硬件加速器设计,实现矩阵并行计算。首先根据矩阵运算的算法分析,设计了矩阵并行计算的硬件实现结构,并在Modelsim中进行功能模块的仿真,然后将功能模块集成一个自定制组件,并通过Avalon总线与NiosⅡ主处理器通信,作为硬件加速器。最后在FPGA芯片中构建SoPC系统,并在Altera DE3开发板中进行矩阵实时计算测试。测试结果验证了基于FPGA/Nios-Ⅱ矩阵运算硬件加速器的正确性、可行性以及较高的计算性能。 展开更多
关键词 fpga/Nios-Ⅱ 矩阵运算 硬件加速器 并行计算 实时测试验
在线阅读 下载PDF
基于FPGA模型机的组合逻辑控制器 被引量:10
16
作者 高艳 富坤 +2 位作者 罗淑贞 李钦 耿跃华 《实验室研究与探索》 CAS 北大核心 2015年第4期86-91,共6页
目前的模型机控制器大多采用微程序控制方式,而组合逻辑控制方式执行速度较快,在精简指令系统中被广泛应用。本文采用QuartusⅡ和Cyclone FPGA构建模型机的组合逻辑控制器。首先,通过设计模型机的指令系统、指令流程、控制信号等,列出... 目前的模型机控制器大多采用微程序控制方式,而组合逻辑控制方式执行速度较快,在精简指令系统中被广泛应用。本文采用QuartusⅡ和Cyclone FPGA构建模型机的组合逻辑控制器。首先,通过设计模型机的指令系统、指令流程、控制信号等,列出各控制信号的逻辑表达式,并对逻辑表达式进行化简;其次,通过QuartusⅡ软件,利用原理图输入法设计组合逻辑控制器的指令译码器和组合逻辑电路模块,并搭配好各自的时序电路,形成完整的模型机控制器;最后把编译好的原理图文件下载到Altera DE2实验板上进行验证。此设计应用了可编程逻辑器件,提高了指令的执行速度,增强了设计的灵活性,且将该控制器与运算器等部件搭建,形成完整的模型机应用于计算机组成原理课程的实验教学中,能很好地提高学生的思维能力和动手能力。 展开更多
关键词 模型机 fpga 组合逻辑控制器 指令系统 计算机组成原理
在线阅读 下载PDF
基于FPGA的“计算机组成原理”实践教学的改革 被引量:19
17
作者 葛桂萍 肖铁军 +1 位作者 陈才扣 马学文 《实验技术与管理》 CAS 北大核心 2018年第4期12-15,共4页
针对"计算机组成原理"实践教学中存在的问题,围绕改革实验设备,开发基于FPGA全新实验平台;强化实践教学,构建多层次实践教学体系;加强实验过程的组织管理,完善考核机制等方面对"计算机组成原理"课程实践教学的改革... 针对"计算机组成原理"实践教学中存在的问题,围绕改革实验设备,开发基于FPGA全新实验平台;强化实践教学,构建多层次实践教学体系;加强实验过程的组织管理,完善考核机制等方面对"计算机组成原理"课程实践教学的改革作了深入的分析和探讨,并对今后的实践教学进一步改革作了一定的思考。 展开更多
关键词 fpga 计算机组成原理 实验平台 实践教学体系 实验考核方法
在线阅读 下载PDF
动态部分重配置及其FPGA实现 被引量:9
18
作者 李涛 刘培峰 杨愚鲁 《计算机工程》 EI CAS CSCD 北大核心 2006年第14期224-226,共3页
动态部分重配置充分利用了FPGA芯片提供的可重配置功能,提高了FPGA芯片的利用率,减小了FPGA芯片的配置时间,有效地提高了系统的整体性能。该文介绍了动态部分重配置的两种实现方法,并在Spartan-ⅡFPGA上进行了验证。
关键词 fpga Spartan—Ⅱ 可重配置计算 动态部分重配置
在线阅读 下载PDF
基于FPGA的人工神经网络实现方法的研究 被引量:10
19
作者 杨银涛 汪海波 +1 位作者 张志 周建华 《现代电子技术》 2009年第18期170-174,共5页
基于FPGA的神经网络实现方法已成为实际实时应用神经网络的一种途径。本文就十多年来基于FPGA的ANN实现作一个系统的总结,例举关键的技术问题,给出详细的数据分析,引用相关的最新研究成果,对不同的实现方法和思想进行讨论分析,并说明存... 基于FPGA的神经网络实现方法已成为实际实时应用神经网络的一种途径。本文就十多年来基于FPGA的ANN实现作一个系统的总结,例举关键的技术问题,给出详细的数据分析,引用相关的最新研究成果,对不同的实现方法和思想进行讨论分析,并说明存在的问题以及改善方法,强调神经网络FPGA实现的发展方向和潜力及提出自己的想法。另外,还指出基于FPGA实现神经网络存在的瓶颈制约,最后对今后的研究趋势作出估计。 展开更多
关键词 fpga 可重构计算 BP算法 神经网络 FPNA
在线阅读 下载PDF
基于FPGA的AES核设计 被引量:7
20
作者 韩津生 林家骏 +1 位作者 周文锦 叶建武 《计算机工程与科学》 CSCD 北大核心 2013年第3期80-84,共5页
AES在安全性、高性能、高效率、易用性和灵活性等方面都具有显著的优点,随着业界对计算性能要求的不断提高,在FPGA上实现AES加解密硬核的研究得到了越来越多的关注。在深入分析AES算法的基础上,提出了基于FPGA的AES全流水硬件核设计模... AES在安全性、高性能、高效率、易用性和灵活性等方面都具有显著的优点,随着业界对计算性能要求的不断提高,在FPGA上实现AES加解密硬核的研究得到了越来越多的关注。在深入分析AES算法的基础上,提出了基于FPGA的AES全流水硬件核设计模型。模型中改进了ae数据块和轮运算的硬件设计结构,有效地提高了AES硬核的计算性能。在Altera公司EP4CE40F23C6FPGA上的硬件实现结果显示,该AES硬核的硬件资源消耗为6413个LE和80个M9K,工作频率为310MHz,计算吞吐率为9.92Gbps,获得了非常好的计算加速效果。 展开更多
关键词 AES 全流水线 计算加速 fpga
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部