期刊文献+
共找到8,866篇文章
< 1 2 250 >
每页显示 20 50 100
基于FPGA的MobileNetV1目标检测加速器设计 被引量:3
1
作者 严飞 郑绪文 +2 位作者 孟川 李楚 刘银萍 《现代电子技术》 北大核心 2025年第1期151-156,共6页
卷积神经网络是目标检测中的常用算法,但由于卷积神经网络参数量和计算量巨大导致检测速度慢、功耗高,且难以部署到硬件平台,故文中提出一种采用CPU与FPGA融合结构实现MobileNetV1目标检测加速的应用方法。首先,通过设置宽度超参数和分... 卷积神经网络是目标检测中的常用算法,但由于卷积神经网络参数量和计算量巨大导致检测速度慢、功耗高,且难以部署到硬件平台,故文中提出一种采用CPU与FPGA融合结构实现MobileNetV1目标检测加速的应用方法。首先,通过设置宽度超参数和分辨率超参数以及网络参数定点化来减少网络模型的参数量和计算量;其次,对卷积层和批量归一化层进行融合,减少网络复杂性,提升网络计算速度;然后,设计一种八通道核间并行卷积计算引擎,每个通道利用行缓存乘法和加法树结构实现卷积运算;最后,利用FPGA并行计算和流水线结构,通过对此八通道卷积计算引擎合理的复用完成三种不同类型的卷积计算,减少硬件资源使用量、降低功耗。实验结果表明,该设计可以对MobileNetV1目标检测进行硬件加速,帧率可达56.7 f/s,功耗仅为0.603 W。 展开更多
关键词 卷积神经网络 目标检测 fpga MobileNetV1 并行计算 硬件加速
在线阅读 下载PDF
基于国产DSP和FPGA的高速信号处理板硬件电路设计 被引量:2
2
作者 孙艳萍 边晨通 +1 位作者 屈文涛 宋淑军 《仪表技术与传感器》 北大核心 2025年第5期33-38,共6页
针对目前高速信号处理板多选用国外芯片,国产化程度较低的问题,文中基于DSP和FPGA芯片完成了高速信号处理板国产化设计。首先考虑高速信号处理板应用于人工智能、图像处理等领域,是一种高精度和复杂运算的场景,因此选择DSP芯片FTDOC35BB... 针对目前高速信号处理板多选用国外芯片,国产化程度较低的问题,文中基于DSP和FPGA芯片完成了高速信号处理板国产化设计。首先考虑高速信号处理板应用于人工智能、图像处理等领域,是一种高精度和复杂运算的场景,因此选择DSP芯片FTDOC35BB_FT_M6678为主设计信号处理模块,选择FPGA芯片FMQL45T900为主设计控制单元模块;然后在CANDENCE软件中进一步采用分布式设计硬件电路,完成了高速信号接口模块、DDR3存储模块、EMIF模块的电路设计;最后使用CCS5.5集成开发环境对高速信号处理板各个接口及外设进行了测试。测试指标均达到要求,证明该高速信号处理板国产化设计切实可行,加速了高速信号处理板的国产化进程。 展开更多
关键词 国产化 fpga DSP 高速信号
在线阅读 下载PDF
基于FPGA的脉冲激光告警系统设计
3
作者 张瑞 武振涛 +3 位作者 薛鹏 杨帅 徐承雨 王志斌 《激光杂志》 北大核心 2025年第6期29-35,共7页
针对脉冲激光被广泛应用于编码通信、精确制导、高功率毁伤等激光武器的情况,且目前缺少对脉冲激光威胁进行有效告警的措施,为此提出了一种基于FPGA的脉冲激光告警系统。通过增加积分时间在帧周期内的占比来提高脉冲捕获概率,采用图像... 针对脉冲激光被广泛应用于编码通信、精确制导、高功率毁伤等激光武器的情况,且目前缺少对脉冲激光威胁进行有效告警的措施,为此提出了一种基于FPGA的脉冲激光告警系统。通过增加积分时间在帧周期内的占比来提高脉冲捕获概率,采用图像差分提高信噪比,并快速提取光斑坐标,最后以查表的形式读出来袭激光的方位、俯仰角度。利用FPGA并行处理的优势,能保证对脉冲激光的实时响应。实验结果表明,该系统在220 mW@1064 nm激光器模拟输入的条件下,对脉冲宽度范围为100 ns~100μs的脉冲激光实现告警,测量角度误差小于0.3°,对单脉冲的捕获概率能达到97%,并能实现1064 nm、1313 nm、1550 nm等常用激光波长的识别。 展开更多
关键词 激光告警 脉冲激光 数据处理 fpga
在线阅读 下载PDF
基于正规基的大规模S盒FPGA设计与实现
4
作者 张磊 李国元 +2 位作者 洪睿鹏 王建新 肖超恩 《密码学报(中英文)》 北大核心 2025年第4期854-869,共16页
传统上的分组密码S盒硬件实现采用查表法,其实现效果受到芯片资源的限制.针对16-bit大规模S盒在FPGA硬件实现中资源消耗大的问题,本文提出了基于复合域中正规基的S盒构造方法,研究使用较少的硬件资源实现16-bit S盒.首先,设计了基于复... 传统上的分组密码S盒硬件实现采用查表法,其实现效果受到芯片资源的限制.针对16-bit大规模S盒在FPGA硬件实现中资源消耗大的问题,本文提出了基于复合域中正规基的S盒构造方法,研究使用较少的硬件资源实现16-bit S盒.首先,设计了基于复合域的16-bit S盒构造实现方案,构建了线性的同构映射矩阵及其逆矩阵.其次,通过映射矩阵使有限域GF(2^(16))的乘法逆转换到复合域GF((((2^(2))^(2))^(2))^(2))上,进而将非线性的高维乘法逆简化为低维子域运算.然后,通过分析各级复合域不同参数对S盒实现的影响,筛选最优参数.最后,结合所提出的16-bit S盒构造实现框架,本文利用Xilinx公司的Vivado开发工具,以MK-3算法的16-bit S盒为例进行了FPGA仿真验证与性能分析.结果表明,本文构造方法实现的MK-3算法S盒需要186个LUT,时钟频率为114.129 MHz,在时钟频率/LUT的性能指标下达到了0.61360.同目前已公开文献同类方法中的最优实现性能0.43538相比,性能提升了40.93%.本文的16-bit S盒实现方案能够在降低硬件资源消耗的同时保持密码算法较高的运行频率,对有基于有限域构造的S盒的高效软硬件实现具有一定的参考价值. 展开更多
关键词 大规模S盒 复合域 正规基 MK-3算法 fpga
在线阅读 下载PDF
基于FPGA的4K视频板间传输显示系统
5
作者 严飞 蒋晔 +2 位作者 张丽娟 王鹏 刘银萍 《液晶与显示》 北大核心 2025年第8期1145-1153,共9页
随着4K超高清视频技术在医疗、安防等领域的广泛应用,现场可编程门阵列(FPGA)常被协同用于处理大型的超高清视频图像任务。针对使用高速收发器8b/10b编码方式的数据带宽利用率低的问题,提出一种基于FPGA的4K视频板间传输显示系统。该系... 随着4K超高清视频技术在医疗、安防等领域的广泛应用,现场可编程门阵列(FPGA)常被协同用于处理大型的超高清视频图像任务。针对使用高速收发器8b/10b编码方式的数据带宽利用率低的问题,提出一种基于FPGA的4K视频板间传输显示系统。该系统设计以FPGA为核心,结合STM32微控制器与GSV2011编解码芯片实现对数据传输方式的控制,并对GTX的硬件接口进行了优化。多通道GTX收发器使用64b/66b编码方式,根据4K视频流时序设计编码发送、解码接收逻辑实现传输功能。此外,设计多通道数据同步、DDR多帧缓存等逻辑,有效解决因信道偏斜导致的多通道数据传输偏差与读写时钟速率不匹配导致的显示帧撕裂问题。实验结果表明,该系统能够高效稳定地实现4K@60 Hz视频的板间传输实时显示,硬件资源消耗较低,且相较8b/10b编码的有效带宽减少3.12 Gb/s,为多个FPGA协同处理超高清视频场景提供灵活高效、成本更低的传输方案,具有良好的工程应用价值。 展开更多
关键词 fpga 4K视频 GTX收发器 64b/66b编码
在线阅读 下载PDF
基于ARM+FPGA的机载信息管理处理机设计
6
作者 王健 郭霖佯 +4 位作者 何自豪 周立辉 陈家福 李欣琦 周浩 《火力与指挥控制》 北大核心 2025年第4期85-92,共8页
为实现飞机在执行战术任务时对格式化链路消息的接收处理、态势信息综合处理、载机平台信息采集、指令应答与信息回传、雷达目标定位等功能,设计一种基于ARM+FPGA架构机载信息管理处理机。介绍机载信息管理处理机具体功能和应用,从硬件... 为实现飞机在执行战术任务时对格式化链路消息的接收处理、态势信息综合处理、载机平台信息采集、指令应答与信息回传、雷达目标定位等功能,设计一种基于ARM+FPGA架构机载信息管理处理机。介绍机载信息管理处理机具体功能和应用,从硬件和软件设计两个方面对系统结构进行详细阐述,完成机载信息综合处理模块、RS422和ARINC429相关接口的软硬件设计工作,使得机载信息管理处理机能够实时处理机载电台、显控机、雷达、导航系统等相关设备的信息,并根据系统通信协议的要求完成各类型系统数据的实时接收、解析、检索和发送任务。通过对系统的联调联试和测试工作,发现达到系统各项指标要求并验证了其可行性和稳定性。 展开更多
关键词 机载处理机 RS422 ARINC429 fpga ARM
在线阅读 下载PDF
基于FPGA的SM4异构加速系统
7
作者 张全新 李可 +1 位作者 邵雨洁 谭毓安 《信息网络安全》 北大核心 2025年第7期1021-1031,共11页
国密SM4算法是WAPI无线网络标准中广泛使用的加密算法。目前,针对SM4加解密的研究主要集中于硬件实现结构优化,以提高吞吐量和安全性。同时,大数据和5G通信技术的发展对数据加解密的带宽和实时性提出了更高的要求。基于此背景,文章提出... 国密SM4算法是WAPI无线网络标准中广泛使用的加密算法。目前,针对SM4加解密的研究主要集中于硬件实现结构优化,以提高吞吐量和安全性。同时,大数据和5G通信技术的发展对数据加解密的带宽和实时性提出了更高的要求。基于此背景,文章提出一种基于FPGA的SM4异构加速系统,使用硬件实现SM4算法,并优化加解密性能;采用流式高速数据传输架构,支持多个SM4核并行工作,充分利用系统带宽;设计可配置接口,连接SM4与传输架构,提供足够的灵活性。系统于Xilinx XCVU9P FPGA上实现,支持随时更改SM4的负载和模式。测试得到SM4的最大工作频率为462 MHz,系统吞吐量高达92 Gbit/s,延迟仅为266μs。实验结果表明,与其他现有工作相比,该系统能获得更高的SM4工作频率和系统吞吐量,满足高带宽和低延迟的SM4加速需求。 展开更多
关键词 国密SM4算法 fpga 硬件加速 传输架构
在线阅读 下载PDF
基于FPGA的大点数脉压模块设计与实现
8
作者 刘国满 刘雨玄 +3 位作者 付琦允 冯易 汪奕 王俊岭 《北京理工大学学报》 北大核心 2025年第5期539-546,共8页
针对雷达系统长脉宽信号的大点数脉冲压缩内存占用过大、计算过程复杂的问题,提出一种可避免数据转置的脉冲压缩处理流程及一种适用于FPGA的实现方法和延时计算模型,并以此为基础设计和实现了支持128K点窗长的脉冲压缩模块.实验结果表明... 针对雷达系统长脉宽信号的大点数脉冲压缩内存占用过大、计算过程复杂的问题,提出一种可避免数据转置的脉冲压缩处理流程及一种适用于FPGA的实现方法和延时计算模型,并以此为基础设计和实现了支持128K点窗长的脉冲压缩模块.实验结果表明,模块处理延时低于1700μs,可支持最大脉宽4 ms、带宽10 MHz的信号,与传统IP核方法相比,减少至少50%处理延时和至少40%内存资源消耗,仅适度增加了乘法器资源消耗,提高了大点数脉压算法在FPGA中的可实现性. 展开更多
关键词 脉冲压缩 fpga 大点数FFT FFT级联
在线阅读 下载PDF
一种用于高性能FPGA的多功能I/O电路
9
作者 罗旸 刘波 +3 位作者 曹正州 谢达 张艳飞 单悦尔 《半导体技术》 北大核心 2025年第3期265-272,共8页
为了满足等效系统门数为亿门级现场可编程门阵列(FPGA)的高速率、多功能数据传输需求,设计了一种用于高性能FPGA的多功能输入输出(I/O)电路,工作电压为0.95 V,单个I/O电路的最高数据传输速率为2 Gbit/s。通过在输入逻辑电路中设计同一... 为了满足等效系统门数为亿门级现场可编程门阵列(FPGA)的高速率、多功能数据传输需求,设计了一种用于高性能FPGA的多功能输入输出(I/O)电路,工作电压为0.95 V,单个I/O电路的最高数据传输速率为2 Gbit/s。通过在输入逻辑电路中设计同一边沿流水技术的双倍数据速率(DDR)电路,可以使数据不仅能在相同的时钟沿输出,而且能在同一个时钟周期输出。通过分级采样结合时钟分频和偏移技术,仅需4个时钟周期即可完成8∶1数据的转换。另外,该I/O电路还可以对数据输入输出的延时进行调节,采用粗调和细调相结合的方式,共提供512个延时抽头,并且延时的分辨率达到4 ps。仿真和实测结果表明,该多功能I/O电路能为高性能FPGA提供灵活、多协议的高速数据传输功能。 展开更多
关键词 现场可编程门阵列(fpga) 输入输出(I/O)电路 多电平标准 双倍数据速率(DDR) 串并转换器(SerDes)
在线阅读 下载PDF
基于FPGA的功率器件封装缺陷实时检测
10
作者 谭会生 吴文志 张杰 《半导体技术》 北大核心 2025年第10期1048-1056,共9页
针对基于机器视觉的功率器件封装缺陷检测技术实时性差、计算资源消耗较高的问题,基于现场可编程门阵列(FPGA)设计了一种功率器件封装缺陷实时检测器。首先,提出一种基于深度可分离卷积(DSConv)的轻量化Mini-DSCNet卷积网络,使用深度卷... 针对基于机器视觉的功率器件封装缺陷检测技术实时性差、计算资源消耗较高的问题,基于现场可编程门阵列(FPGA)设计了一种功率器件封装缺陷实时检测器。首先,提出一种基于深度可分离卷积(DSConv)的轻量化Mini-DSCNet卷积网络,使用深度卷积和逐点卷积代替标准卷积。仿真结果表明,该模型的浮点运算量(FLOPs)和参数量(Params)分别约为MobileNetV1的4.375%和0.021%,准确率约为91.80%。其次,采用定点量化算法将浮点数权重量化为有符号定点数,测试结果表明,其平均误差约为0.483%。最后,采用多通道并行流水线架构优化设计,降低了系统的资源消耗,提高了系统的处理速度。实验结果显示,在100 MHz时钟频率下,该检测器的推理速度分别约为CPU的17.10倍、GPU的2.47倍,显著提升了功率器件封装缺陷检测的实时性。 展开更多
关键词 功率器件 封装缺陷检测 Mini-DSCNet卷积网络 现场可编程门阵列(fpga) 硬件加速
在线阅读 下载PDF
基于FPGA的改进Sobel算子图像实时边缘检测系统
11
作者 于波 田亚洲 +1 位作者 任金贝 李华宇 《仪表技术与传感器》 北大核心 2025年第3期116-121,共6页
为了解决嵌入式软件不能对图像进行实时处理以及对带有噪声的图像处理效果不佳的问题,设计了基于改进Sobel算子的图像实时边缘检测系统,该系统在传统Sobel算子的基础上增加了检测方向和角度模板,并结合SCCB传输协议进行实时图像边缘检测... 为了解决嵌入式软件不能对图像进行实时处理以及对带有噪声的图像处理效果不佳的问题,设计了基于改进Sobel算子的图像实时边缘检测系统,该系统在传统Sobel算子的基础上增加了检测方向和角度模板,并结合SCCB传输协议进行实时图像边缘检测,进一步提高视频图像的传输速度和质量。系统以FPGA作为数字主控核心,使用OV5640摄像头采集图像,将采集的图像数据缓存到视频图像处理模块,对该模块进行色彩空间转换和Sobel边缘检测工作,将边缘检测的图像数据缓存到SDRAM读写控制模块,VGA驱动模块从SDRAM中读取数据并控制VGA显示器对边缘检测结果进行显示。实验结果表明:该系统能够完成对图像边缘检测的实时快速精确识别,相较于传统的Sobel算法,改进后的算法在处理复杂图像和噪声点较多的图像方面更有优势,适合低延时以及噪声干扰较为严重的场合。 展开更多
关键词 实时边缘检测 fpga SCCB SOBEL算子 SDRAM
在线阅读 下载PDF
基于FPGA的PCB缺陷检测系统设计与实现
12
作者 任喜伟 刘嘉玥 +1 位作者 余杰 孙悦 《仪表技术与传感器》 北大核心 2025年第3期58-64,71,共8页
为应对传统印刷电路板(PCB)缺陷检测方法存在的检测速度慢、准确率低等问题,设计了基于FPGA的PCB缺陷检测系统。系统采用CMOS OV5640传感器采集PCB图像数据,并对采集的图像进行灰度化、滤波及边缘检测等图像预处理。提出了改进的灰度拉... 为应对传统印刷电路板(PCB)缺陷检测方法存在的检测速度慢、准确率低等问题,设计了基于FPGA的PCB缺陷检测系统。系统采用CMOS OV5640传感器采集PCB图像数据,并对采集的图像进行灰度化、滤波及边缘检测等图像预处理。提出了改进的灰度拉伸算法,通过整体线性拉伸灰度值,图像对比度显著增强;提出了改进的边缘检测算法,扩展传统Sobel边缘检测2算子至8算子边缘检测,提高图像边缘信息的清晰度,增强图像分析与识别的准确性。系统将预处理后的PCB图像和标准模板图像存储在SDRAM中,采用背景差分比算法进行缺陷检测,并选用EP4CE10F17C8N芯片实现系统各模块的FPGA设计。实验结果表明:改进的检测系统在检测精度方面较其他方法显著提升,且相比于PCB缺陷检测软件,FPGA硬件处理速度明显提高。 展开更多
关键词 图像处理 fpga 背景差分算法 缺陷检测
在线阅读 下载PDF
基于FPGA的SATA图像采集系统的设计与实现
13
作者 王振 黄春平 陈威威 《电子测量技术》 北大核心 2025年第14期26-34,共9页
本文设计并实现了一个基于FPGA的高速图像采集与存储系统,旨在解决高速图像数据采集和存储过程中的性能瓶颈。系统通过Camera Link接口接收高速图像数据,并利用FPGA实现SATA协议控制器以高效稳定地存储至SATA硬盘。图像采集模块采用Xili... 本文设计并实现了一个基于FPGA的高速图像采集与存储系统,旨在解决高速图像数据采集和存储过程中的性能瓶颈。系统通过Camera Link接口接收高速图像数据,并利用FPGA实现SATA协议控制器以高效稳定地存储至SATA硬盘。图像采集模块采用Xilinx FPGA内置的LVDS收发器及特定原语(如IDELAYE3和ISERDESE3)直接处理Camera Link协议,取代传统专用芯片。在MicroBlaze中设计了一个轻量级文件系统,以实现SATA控制器的配置和数据流的控制。通过集成以太网模块,系统能够实时导出数据至上位机。开发了C#上位机软件,提供可视化的文件系统界面,用于管理和监控磁盘及文件操作。实验验证表明,SATA控制器实现了高达504.8 MB/s的写入速率和542.0 MB/s的读取速率。在400 MB/s的数据采集速率下,系统表现出了优异的性能和可靠性,适用于高性能图像采集与存储应用。 展开更多
关键词 fpga 图像采集 SATA 高速存储 文件系统
在线阅读 下载PDF
基于三维混沌系统的图像加密及FPGA实现
14
作者 闫少辉 姜嘉伟 崔宇 《计算机工程与科学》 北大核心 2025年第4期686-694,共9页
提出一种基于FPGA的混沌系统实现方法,并成功将其应用在图像加密任务。基于改进的Bao混沌系统,利用改进的欧拉算法对混沌系统进行离散化,使用Verilog语言进行硬件设计;通过寄存器传输级RTL电路及ModelSim时序仿真验证混沌系统在软件设... 提出一种基于FPGA的混沌系统实现方法,并成功将其应用在图像加密任务。基于改进的Bao混沌系统,利用改进的欧拉算法对混沌系统进行离散化,使用Verilog语言进行硬件设计;通过寄存器传输级RTL电路及ModelSim时序仿真验证混沌系统在软件设计层面的准确性。利用离散化的混沌序列在FPGA中对图像进行加密和相应密钥的解密,并通过VGA正确显示,验证了加密方案的可行性。在硬件层面成功实现混沌系统及图像加解密,为混沌加密技术在FPGA中的进一步应用奠定了基础。 展开更多
关键词 混沌系统 fpga实现 Verilog设计 图像加密
在线阅读 下载PDF
基于FPGA的实时Bayer绿平衡算法与实现
15
作者 张弘 刘翰阳 +2 位作者 李旭亮 杨一帆 李亚伟 《应用光学》 北大核心 2025年第4期786-792,共7页
绿通道间不均衡缺陷是一种Bayer图像的典型缺陷,通过绿平衡算法进行校正可以抑制该问题,从而减轻解马赛克后的彩色图像出现的迷宫噪声,提高图像平滑区域的观感。随着图像设备向着高分辨率、大面阵发展,原有的绿平衡算法难以满足低延迟... 绿通道间不均衡缺陷是一种Bayer图像的典型缺陷,通过绿平衡算法进行校正可以抑制该问题,从而减轻解马赛克后的彩色图像出现的迷宫噪声,提高图像平滑区域的观感。随着图像设备向着高分辨率、大面阵发展,原有的绿平衡算法难以满足低延迟、高像素分辨率等需求,提出了一种基于FPGA(fieldprogrammablegatearray)的实时绿平衡算法。通过图像局部梯度对绿通道不均衡敏感的平滑区域进行提取,从而完成绿通道不均衡校正,在保证分辨率的同时去除了迷宫噪声,且整体延迟不大于2行数据传输的时间。算法针对FPGA硬件特点完成了从前端感光相机、缓存到图像处理、最终输出图像的系统设计,并能够兼容其他图像处理功能。实验结果表明:本文算法在实现微秒级延迟的同时保持了图像像素级纹理信息的分辨率,并对不同程度的绿通道不均衡缺陷和不同场景鲁棒性优异。 展开更多
关键词 Bayer阵列 绿通道校正 串扰校正 实时图像处理 fpga
在线阅读 下载PDF
基于FPGA的可调节OFDM发射机设计与实现
16
作者 王晓君 刘安 《现代电子技术》 北大核心 2025年第17期29-34,共6页
正交频分复用系统参数众多、设计灵活,可以根据不同用途、信道环境设计出很多不同的OFDM系统。传统的发射机设计采用确定的码率对信道进行编码,并使用众多数字调制方式中的一种对数据进行调制以实现单一速率的发射机设计。在此基础上,... 正交频分复用系统参数众多、设计灵活,可以根据不同用途、信道环境设计出很多不同的OFDM系统。传统的发射机设计采用确定的码率对信道进行编码,并使用众多数字调制方式中的一种对数据进行调制以实现单一速率的发射机设计。在此基础上,考虑到信号传输面对的情况复杂多变且突发事件较多,结合多种编码与调制技术实现速率可调节的OFDM发射系统。基带部分采用IEEE 802.11a协议中OFDM帧格式设计搭建基带信号传输系统,完成时序仿真。射频部分通过软件完成AD9361寄存器的配置,实现AD9361软件无线电模块与Zynq-7000开发板之间实时的OFDM信号传输。可调节的编码调制方案和高灵活性AD9361射频芯片增强了软件无线电平台的可移植性,简化了OFDM发射端机的硬件设计,具有广阔的应用前景。 展开更多
关键词 可调节OFDM IEEE 802.11a协议 软件无线电 fpga AD9361 ZYNQ-7000
在线阅读 下载PDF
核脉冲峰值序列轻量化神经网络核素识别模型及其FPGA加速方法
17
作者 李超 石睿 +3 位作者 曾树鑫 徐鑫华 魏雨鸿 庹先国 《强激光与粒子束》 北大核心 2025年第5期139-149,共11页
放射性核素已在核医疗、核安保及无损检测等领域中广泛应用,而对其准确识别是放射性核素定性检测的基础。在便携式核素识别仪中,基于传统能谱分析方法存在延迟高、识别率低等不足。提出一种基于核脉冲峰值序列的核素识别轻量化神经网络... 放射性核素已在核医疗、核安保及无损检测等领域中广泛应用,而对其准确识别是放射性核素定性检测的基础。在便携式核素识别仪中,基于传统能谱分析方法存在延迟高、识别率低等不足。提出一种基于核脉冲峰值序列的核素识别轻量化神经网络模型及其FPGA硬件加速方法,通过引入深度可分离卷积和倒残差模块,并使用全局平均池化替代传统全连接层,构建了一种轻量化、高效的神经网络模型。针对网络训练数据集,通过蒙特卡罗工具包Geant4构建NaI(Tl)探测器模型,获取模拟能谱,再由核脉冲信号模拟仿真器根据能谱产生核脉冲信号序列,构建了16种核脉冲信号数据。最后,将训练好的模型通过量化、融合与并行计算等优化方法部署到PYNQ-Z2异构芯片,实现加速。实验结果表明,模型识别精度可达98.3%,相较传统卷积神经网络模型提高了13.2%,参数量仅为2 128。FPGA优化加速后单次识别耗时0.273 ms,功耗为1.94 W。 展开更多
关键词 核素识别 核信号 神经网络 fpga 硬件加速
在线阅读 下载PDF
基于FPGA的多通道微弱振动信号采集系统
18
作者 王红亮 高春林 林宏 《仪表技术与传感器》 北大核心 2025年第8期60-63,84,共5页
针对多体飞行器分离时分离面恶劣的力学影响问题,设计了以FPGA为核心,包括前端微振动传感器和变换器的多通道微弱振动信号采集系统,用于测量多体飞行器分离面径向微振动加速度。系统使用AD7616芯片采集压阻式传感器及变换器接收的微振... 针对多体飞行器分离时分离面恶劣的力学影响问题,设计了以FPGA为核心,包括前端微振动传感器和变换器的多通道微弱振动信号采集系统,用于测量多体飞行器分离面径向微振动加速度。系统使用AD7616芯片采集压阻式传感器及变换器接收的微振动信号,使用2片8 GB的NAND FLASH对采集的数据进行存储,为保证传输过程中数据的正确性,对存储前后的数据采用RS编码和解码,通过RS422或千兆以太网接口与地面设备进行通信,完成加速度信号数据的回读及分析。试验结果表明:采集存储器可以正确采集存储6路微振动模拟信号,并绘制各通道的模拟量曲线,工作稳定,可靠度高,满足设计要求。 展开更多
关键词 微振动采集 千兆以太网接口 RS422总线接口 fpga AD7616 NAND FLASH
在线阅读 下载PDF
轻量化卷积神经网络硬件加速设计及FPGA实现 被引量:1
19
作者 李珍琪 王强 +4 位作者 齐星云 赖明澈 赵言亢 陆亿行 黎渊 《计算机工程与科学》 北大核心 2025年第4期582-591,共10页
近年来,卷积神经网络CNN在计算机视觉等领域取得了显著的成效。然而,通常CNN的网络结构复杂,计算量庞大,难以在计算资源和功耗受限的便携式设备上实现。而FPGA具有较高的并行度、能效比和可重构性,已成为在便携式设备上加速CNN推理最有... 近年来,卷积神经网络CNN在计算机视觉等领域取得了显著的成效。然而,通常CNN的网络结构复杂,计算量庞大,难以在计算资源和功耗受限的便携式设备上实现。而FPGA具有较高的并行度、能效比和可重构性,已成为在便携式设备上加速CNN推理最有效的计算平台之一。设计了一种可配置为不同网络结构的卷积神经网络加速器,并从数据复用、基于行缓存的流水线优化和基于加法树的低延迟卷积技术3个方面对加速器的延迟和功耗进行了优化。以轻量化神经网络YOLOv2-tiny为例,在领航者ZYNQ-7020开发板上构建了一个实时目标检测系统。实验结果表明,整个设计的资源消耗占用为88%,功耗消耗为2.959 W,满足便携设备低硬件消耗及低功耗设计要求,在416×256的图像分辨率下,实现了3.91 fps的检测速度。 展开更多
关键词 卷积神经网络 fpga加速 加速器 便携设备
在线阅读 下载PDF
基于改进秩一先验的图像去雾算法及其FPGA实现
20
作者 胡浩丰 王子涵 +1 位作者 魏龙超 李校博 《应用光学》 北大核心 2025年第5期1011-1023,共13页
图像去雾算法能够将雾霾环境下采集到的低质图像还原为清晰图像,但随着图像分辨率的增加和算法复杂度的提高,实际应用中算法的实时性难以保证。针对这一问题,研究并改进了一种复杂度低的秩一先验(rank-one prior,ROP)算法,并通过可编程... 图像去雾算法能够将雾霾环境下采集到的低质图像还原为清晰图像,但随着图像分辨率的增加和算法复杂度的提高,实际应用中算法的实时性难以保证。针对这一问题,研究并改进了一种复杂度低的秩一先验(rank-one prior,ROP)算法,并通过可编程门阵列(field programmable gate array,FPGA)硬件平台提高算法执行效率。首先利用FPGA并行处理优势,通过引入空间相关性与暗通道先验的约束,排除近景与高亮区域的干扰;再通过优化散射率图的估计方法,解决了原ROP算法复原后图像中的伪影问题,同时减少硬件资源的占用;最后根据估计的环境光值与散射率图求解,得到去雾后的清晰图像。实验结果表明,本文改进的算法能够提升雾霾和水下等散射场景图像的观感,复原结果图像色彩更加真实、细节更多。将该算法搭载在ZYNQ7020开发板(21 K个逻辑门资源、28.9%块存储器资源),处理1080 pixel图像用时54 ms,实现了实时性处理的需求,在自动驾驶、深海探测等领域具有广泛应用。 展开更多
关键词 图像去雾 秩一先验 透射率图 现场可编辑逻辑门阵列 实时性
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部