期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
BP神经网络FPGA实现结构的优化设计
被引量:
10
1
作者
谭会生
徐界铭
张驾祥
《计算机工程与应用》
CSCD
北大核心
2022年第21期264-271,共8页
为了实现反向传播(back propagation,BP)神经网络的现场可编程门阵列(field programmable gate array,FPGA)处理速度的提升和资源消耗的降低,提出一种总体设计和关键模块融合优化的BP神经网络的FPGA实现结构。利用定点数据量化和流水线...
为了实现反向传播(back propagation,BP)神经网络的现场可编程门阵列(field programmable gate array,FPGA)处理速度的提升和资源消耗的降低,提出一种总体设计和关键模块融合优化的BP神经网络的FPGA实现结构。利用定点数据量化和流水线结构,提高系统的处理速度;采用二次方程多段拟合Sigmoid激活函数,降低计算复杂度;通过调整并行转串行模块与激活函数模块的处理顺序,减少了95%的激活函数模块的使用,降低了资源消耗;采用一种网络原始权值读取与更新权值存储交替流水进行的双端口RAM存取方法,以提高数据存取的速度、降低存储资源消耗。经过对硬件优化设计的字符和服装识别实验验证,结果表明,优化后的总逻辑单元使用率为原来的31%。在FPGA中优化结构实现单样本前向传播与反向传播所用时间为24.332μs,为软件MATLAB实现时间的45.63%,提高了BP神经网络的运算速度。
展开更多
关键词
BP神经网络
现场可编程门阵列(FPGA)
硬件实现结构
流水线
并行
结构
在线阅读
下载PDF
职称材料
交通速度预测时空图卷积网络及其FPGA实现研究
被引量:
1
2
作者
谭会生
杨威
严舒琪
《电子测量技术》
北大核心
2024年第18期108-119,共12页
时空图卷积网络(STGCN)通过图卷积和时间卷积捕获交通数据的空间依赖性和时间依赖性,可有效提升交通速度预测的精度。但是硬件实现交通速度预测STGCN具有计算量大难以满足实际应用的实时性要求、资源消耗大导致成本增高等问题,在优化交...
时空图卷积网络(STGCN)通过图卷积和时间卷积捕获交通数据的空间依赖性和时间依赖性,可有效提升交通速度预测的精度。但是硬件实现交通速度预测STGCN具有计算量大难以满足实际应用的实时性要求、资源消耗大导致成本增高等问题,在优化交通速度预测STGCN模型基础上,提出了一种交通速度预测STGCN的FPGA实现结构组合优化的方法。首先,通过轻量化裁剪和预测数据位宽的精确选择,对交通速度预测STGCN进行了模型优化,以降低计算复杂度和资源消耗,并经过Python仿真验证其可行性。其次,通过采用流水线、并行计算和数据交替流水存取等组合优化策略,提出了一种交通速度预测STGCN的FPGA实现结构组合优化的方法,以提升系统计算速度。最后,使用Verilog编程对交通速度预测STGCN进行了FPGA的实现仿真和硬件测试。利用PeMSD7(M)数据集进行实验,结果显示FPGA实现单数据交通速度预测的时间为355.5μs,相比CPU、GPU平台及FPGA设计方案1对比,其处理速度最大分别提高了25.9倍、6.7倍和3.5倍,证明了交通速度预测STGCN的FPGA实现结构组合优化方法,在保持预测准确性的前提下可较大幅度的提升系统处理速度。
展开更多
关键词
交通速度预测
时空图卷积网络
FPGA
硬件实现结构
流水线
并行
结构
在线阅读
下载PDF
职称材料
某测向系统中MUSIC算法的FPGA实现
被引量:
7
3
作者
徐德琛
刘志文
徐友根
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2010年第9期1107-1111,共5页
针对多信号分类(MUSIC)算法计算复杂度高,难以实时实现的特点,给出了适用于均匀圆阵的实数化预处理算法和实用的空间谱定义,并选择了适合硬件实现的特征值分解算法和排序算法;另外,基于某测向系统给出了MUSIC算法FPGA实现的总体结构和...
针对多信号分类(MUSIC)算法计算复杂度高,难以实时实现的特点,给出了适用于均匀圆阵的实数化预处理算法和实用的空间谱定义,并选择了适合硬件实现的特征值分解算法和排序算法;另外,基于某测向系统给出了MUSIC算法FPGA实现的总体结构和执行流程,并重点讨论了大矩阵特征值分解和空间谱计算的硬件结构设计.验证结果表明,该FPGA实现能够完成MUSIC算法的准确、快速计算.
展开更多
关键词
MUSIC算法
测向
现场可编程门阵列(FPGA)
算法选择及优化
硬件实现结构
在线阅读
下载PDF
职称材料
题名
BP神经网络FPGA实现结构的优化设计
被引量:
10
1
作者
谭会生
徐界铭
张驾祥
机构
湖南工业大学轨道交通学院
长沙理工大学近地空间电磁环境监测与建模湖南省普通高校重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2022年第21期264-271,共8页
基金
湖南省教育厅科学研究项目(20A163)
长沙理工大学近地空间电磁环境监测与建模湖南省普通高校重点实验室开放基金(N201903)。
文摘
为了实现反向传播(back propagation,BP)神经网络的现场可编程门阵列(field programmable gate array,FPGA)处理速度的提升和资源消耗的降低,提出一种总体设计和关键模块融合优化的BP神经网络的FPGA实现结构。利用定点数据量化和流水线结构,提高系统的处理速度;采用二次方程多段拟合Sigmoid激活函数,降低计算复杂度;通过调整并行转串行模块与激活函数模块的处理顺序,减少了95%的激活函数模块的使用,降低了资源消耗;采用一种网络原始权值读取与更新权值存储交替流水进行的双端口RAM存取方法,以提高数据存取的速度、降低存储资源消耗。经过对硬件优化设计的字符和服装识别实验验证,结果表明,优化后的总逻辑单元使用率为原来的31%。在FPGA中优化结构实现单样本前向传播与反向传播所用时间为24.332μs,为软件MATLAB实现时间的45.63%,提高了BP神经网络的运算速度。
关键词
BP神经网络
现场可编程门阵列(FPGA)
硬件实现结构
流水线
并行
结构
Keywords
BP neural network
field programmable gate array(FPGA)
hardware implementation structure
pipeline
parallel structure
分类号
TP273 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
交通速度预测时空图卷积网络及其FPGA实现研究
被引量:
1
2
作者
谭会生
杨威
严舒琪
机构
湖南工业大学轨道交通学院
出处
《电子测量技术》
北大核心
2024年第18期108-119,共12页
基金
湖南省教育厅科学研究重点项目(20A163)
湖南省学位与研究生教学改革研究项目(2022JGYB183)资助。
文摘
时空图卷积网络(STGCN)通过图卷积和时间卷积捕获交通数据的空间依赖性和时间依赖性,可有效提升交通速度预测的精度。但是硬件实现交通速度预测STGCN具有计算量大难以满足实际应用的实时性要求、资源消耗大导致成本增高等问题,在优化交通速度预测STGCN模型基础上,提出了一种交通速度预测STGCN的FPGA实现结构组合优化的方法。首先,通过轻量化裁剪和预测数据位宽的精确选择,对交通速度预测STGCN进行了模型优化,以降低计算复杂度和资源消耗,并经过Python仿真验证其可行性。其次,通过采用流水线、并行计算和数据交替流水存取等组合优化策略,提出了一种交通速度预测STGCN的FPGA实现结构组合优化的方法,以提升系统计算速度。最后,使用Verilog编程对交通速度预测STGCN进行了FPGA的实现仿真和硬件测试。利用PeMSD7(M)数据集进行实验,结果显示FPGA实现单数据交通速度预测的时间为355.5μs,相比CPU、GPU平台及FPGA设计方案1对比,其处理速度最大分别提高了25.9倍、6.7倍和3.5倍,证明了交通速度预测STGCN的FPGA实现结构组合优化方法,在保持预测准确性的前提下可较大幅度的提升系统处理速度。
关键词
交通速度预测
时空图卷积网络
FPGA
硬件实现结构
流水线
并行
结构
Keywords
traffic speed prediction
spatio-temporal graph convolutional network
FPGA
hardware implementation structure
pipeline
parallel structure
分类号
TN791 [电子电信—电路与系统]
在线阅读
下载PDF
职称材料
题名
某测向系统中MUSIC算法的FPGA实现
被引量:
7
3
作者
徐德琛
刘志文
徐友根
机构
北京理工大学信息与电子学院
出处
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2010年第9期1107-1111,共5页
文摘
针对多信号分类(MUSIC)算法计算复杂度高,难以实时实现的特点,给出了适用于均匀圆阵的实数化预处理算法和实用的空间谱定义,并选择了适合硬件实现的特征值分解算法和排序算法;另外,基于某测向系统给出了MUSIC算法FPGA实现的总体结构和执行流程,并重点讨论了大矩阵特征值分解和空间谱计算的硬件结构设计.验证结果表明,该FPGA实现能够完成MUSIC算法的准确、快速计算.
关键词
MUSIC算法
测向
现场可编程门阵列(FPGA)
算法选择及优化
硬件实现结构
Keywords
multiple signal classification (MUSIC)
direction finding (DF)
field programme gate array(FPGA)
algorithm selection and optimization
hardware implementation architecture
分类号
TN953.3 [电子电信—信号与信息处理]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
BP神经网络FPGA实现结构的优化设计
谭会生
徐界铭
张驾祥
《计算机工程与应用》
CSCD
北大核心
2022
10
在线阅读
下载PDF
职称材料
2
交通速度预测时空图卷积网络及其FPGA实现研究
谭会生
杨威
严舒琪
《电子测量技术》
北大核心
2024
1
在线阅读
下载PDF
职称材料
3
某测向系统中MUSIC算法的FPGA实现
徐德琛
刘志文
徐友根
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2010
7
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部