期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
BP神经网络FPGA实现结构的优化设计 被引量:10
1
作者 谭会生 徐界铭 张驾祥 《计算机工程与应用》 CSCD 北大核心 2022年第21期264-271,共8页
为了实现反向传播(back propagation,BP)神经网络的现场可编程门阵列(field programmable gate array,FPGA)处理速度的提升和资源消耗的降低,提出一种总体设计和关键模块融合优化的BP神经网络的FPGA实现结构。利用定点数据量化和流水线... 为了实现反向传播(back propagation,BP)神经网络的现场可编程门阵列(field programmable gate array,FPGA)处理速度的提升和资源消耗的降低,提出一种总体设计和关键模块融合优化的BP神经网络的FPGA实现结构。利用定点数据量化和流水线结构,提高系统的处理速度;采用二次方程多段拟合Sigmoid激活函数,降低计算复杂度;通过调整并行转串行模块与激活函数模块的处理顺序,减少了95%的激活函数模块的使用,降低了资源消耗;采用一种网络原始权值读取与更新权值存储交替流水进行的双端口RAM存取方法,以提高数据存取的速度、降低存储资源消耗。经过对硬件优化设计的字符和服装识别实验验证,结果表明,优化后的总逻辑单元使用率为原来的31%。在FPGA中优化结构实现单样本前向传播与反向传播所用时间为24.332μs,为软件MATLAB实现时间的45.63%,提高了BP神经网络的运算速度。 展开更多
关键词 BP神经网络 现场可编程门阵列(FPGA) 硬件实现结构 流水线 并行结构
在线阅读 下载PDF
交通速度预测时空图卷积网络及其FPGA实现研究 被引量:1
2
作者 谭会生 杨威 严舒琪 《电子测量技术》 北大核心 2024年第18期108-119,共12页
时空图卷积网络(STGCN)通过图卷积和时间卷积捕获交通数据的空间依赖性和时间依赖性,可有效提升交通速度预测的精度。但是硬件实现交通速度预测STGCN具有计算量大难以满足实际应用的实时性要求、资源消耗大导致成本增高等问题,在优化交... 时空图卷积网络(STGCN)通过图卷积和时间卷积捕获交通数据的空间依赖性和时间依赖性,可有效提升交通速度预测的精度。但是硬件实现交通速度预测STGCN具有计算量大难以满足实际应用的实时性要求、资源消耗大导致成本增高等问题,在优化交通速度预测STGCN模型基础上,提出了一种交通速度预测STGCN的FPGA实现结构组合优化的方法。首先,通过轻量化裁剪和预测数据位宽的精确选择,对交通速度预测STGCN进行了模型优化,以降低计算复杂度和资源消耗,并经过Python仿真验证其可行性。其次,通过采用流水线、并行计算和数据交替流水存取等组合优化策略,提出了一种交通速度预测STGCN的FPGA实现结构组合优化的方法,以提升系统计算速度。最后,使用Verilog编程对交通速度预测STGCN进行了FPGA的实现仿真和硬件测试。利用PeMSD7(M)数据集进行实验,结果显示FPGA实现单数据交通速度预测的时间为355.5μs,相比CPU、GPU平台及FPGA设计方案1对比,其处理速度最大分别提高了25.9倍、6.7倍和3.5倍,证明了交通速度预测STGCN的FPGA实现结构组合优化方法,在保持预测准确性的前提下可较大幅度的提升系统处理速度。 展开更多
关键词 交通速度预测 时空图卷积网络 FPGA 硬件实现结构 流水线 并行结构
在线阅读 下载PDF
某测向系统中MUSIC算法的FPGA实现 被引量:7
3
作者 徐德琛 刘志文 徐友根 《北京理工大学学报》 EI CAS CSCD 北大核心 2010年第9期1107-1111,共5页
针对多信号分类(MUSIC)算法计算复杂度高,难以实时实现的特点,给出了适用于均匀圆阵的实数化预处理算法和实用的空间谱定义,并选择了适合硬件实现的特征值分解算法和排序算法;另外,基于某测向系统给出了MUSIC算法FPGA实现的总体结构和... 针对多信号分类(MUSIC)算法计算复杂度高,难以实时实现的特点,给出了适用于均匀圆阵的实数化预处理算法和实用的空间谱定义,并选择了适合硬件实现的特征值分解算法和排序算法;另外,基于某测向系统给出了MUSIC算法FPGA实现的总体结构和执行流程,并重点讨论了大矩阵特征值分解和空间谱计算的硬件结构设计.验证结果表明,该FPGA实现能够完成MUSIC算法的准确、快速计算. 展开更多
关键词 MUSIC算法 测向 现场可编程门阵列(FPGA) 算法选择及优化 硬件实现结构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部