期刊文献+
共找到87篇文章
< 1 2 5 >
每页显示 20 50 100
基于FPGA并行实现SVM训练的可重构计算系统 被引量:1
1
作者 彭卫东 郭威 魏麟 《计算机科学》 CSCD 北大核心 2024年第S02期786-792,共7页
针对支持向量机在处理大规模数据集时所面临的计算复杂度高和训练时间长的问题,设计了一种基于FPGA并行实现支持向量机训练的可重构计算系统,并分析了不同量化方式下的硬件资源消耗与加速性能。通过采用随机梯度下降法训练支持向量机,... 针对支持向量机在处理大规模数据集时所面临的计算复杂度高和训练时间长的问题,设计了一种基于FPGA并行实现支持向量机训练的可重构计算系统,并分析了不同量化方式下的硬件资源消耗与加速性能。通过采用随机梯度下降法训练支持向量机,使得需要求解的维度与样本的维度相关联,相较于传统的基于二次规划的求解方法可以显著降低计算复杂性。同时,利用基于FPGA的可重构硬件平台设计了专用并行计算结构以加速支持向量机的训练过程。对设计的完整系统进行了软硬件联合仿真,在4个公共数据集上的仿真结果表明,整体模型预测准确率达到90%以上;在训练阶段,相较于采用相同算法的软件实现,所提出的浮点数表示下硬件实现的单个样本处理时间至少减少了2个数量级;定点数表示下硬件实现的单个样本处理时间最大减小了3个数量级;与基于二次规划问题求解的硬件实现相比,单个样本处理速度最快提升了394倍。 展开更多
关键词 现场可编程逻辑门阵列 支持向量机 可重构系统 并行计算 随机梯度下降法
在线阅读 下载PDF
一种基于FPGA的SVPWM硬件架构及其计算速度优化 被引量:1
2
作者 刘德平 辛云川 刘子旭 《郑州大学学报(工学版)》 CAS 北大核心 2024年第3期96-102,共7页
为了提高七段式两电平SVPWM算法的调制速度并减少逻辑资源的使用量,提出了一种基于FPGA的SVPWM硬件架构。在该硬件架构输入参考电压后,首先,进行基于Clarke逆变换的坐标变换,通过一系列加法运算构建出含有三相占空比的3组中间变量,同时... 为了提高七段式两电平SVPWM算法的调制速度并减少逻辑资源的使用量,提出了一种基于FPGA的SVPWM硬件架构。在该硬件架构输入参考电压后,首先,进行基于Clarke逆变换的坐标变换,通过一系列加法运算构建出含有三相占空比的3组中间变量,同时通过2个异或运算从上述硬件布线中得到简化后的2 bit扇区判断条件;然后,根据简化后的2 bit扇区判断条件从以上3组中间变量中筛选出三相占空比,并进行钳位保护,按照自然采样法输出PWM。以上过程形成一个整体,在FPGA中只需3次触发,便能在2个时钟周期内完成从参考电压输入到三相PWM输出的整个过程,有效提高了计算速度。此外,还给出了该硬件架构在不同的FPGA平台下的资源使用情况,与其他方法相比,LUT使用量由至少500个缩减至300个左右,逻辑资源使用量降低。通过仿真与实物试验,验证了所提硬件架构的有效性。 展开更多
关键词 SVPWM 硬件架构 Clarke逆变换 fpga 计算速度优化
在线阅读 下载PDF
一种基于FPGA的可重构计算系统设计 被引量:11
3
作者 吴冬冬 杨晓君 +1 位作者 刘新春 江先阳 《计算机工程与应用》 CSCD 北大核心 2006年第21期74-77,共4页
介绍可重构计算的概念和基于SRAM工艺的FPGA器件的特点。设计了一种基于FPGA器件的可重构计算系统,着重讲述了该系统的在线重配置电路的总体结构,FIFO、FPGA配置逻辑模块、控制寄存器和控制逻辑等功能模块及系统的工作流程。最后探讨了... 介绍可重构计算的概念和基于SRAM工艺的FPGA器件的特点。设计了一种基于FPGA器件的可重构计算系统,着重讲述了该系统的在线重配置电路的总体结构,FIFO、FPGA配置逻辑模块、控制寄存器和控制逻辑等功能模块及系统的工作流程。最后探讨了可重构计算相关研究面临的问题和发展方向。 展开更多
关键词 可重构计算 fpga 在线重配置
在线阅读 下载PDF
动态部分重配置及其FPGA实现 被引量:9
4
作者 李涛 刘培峰 杨愚鲁 《计算机工程》 EI CAS CSCD 北大核心 2006年第14期224-226,共3页
动态部分重配置充分利用了FPGA芯片提供的可重配置功能,提高了FPGA芯片的利用率,减小了FPGA芯片的配置时间,有效地提高了系统的整体性能。该文介绍了动态部分重配置的两种实现方法,并在Spartan-ⅡFPGA上进行了验证。
关键词 fpga Spartan—Ⅱ 可重配置计算 动态部分重配置
在线阅读 下载PDF
基于FPGA的动态可重构系统设计与实现 被引量:21
5
作者 南希 龚龙庆 +1 位作者 田卫 李潇 《现代电子技术》 2009年第6期4-7,11,共5页
近年来,随着计算机技术的发展,尤其是现场可编程门阵列FPGA的出现,使实时电路重构成为研究热点。基于FPGA的重构系统具有自适应、自主修复特性,在空间应用中具有非常重要的作用。介绍FPGA可重构技术的分类以及动态可重构技术的原理,并... 近年来,随着计算机技术的发展,尤其是现场可编程门阵列FPGA的出现,使实时电路重构成为研究热点。基于FPGA的重构系统具有自适应、自主修复特性,在空间应用中具有非常重要的作用。介绍FPGA可重构技术的分类以及动态可重构技术的原理,并在此基础之上选取Virtex-4系列FPGA给出一种动态重构的应用以及具体实现,即通过微处理器(ARM)结合多个FPGA,并采用一种新的边界扫描链方法对多个FPGA进行配置,从而实现局部动态可重构。这种实现方法具有较强通用性和适于模块化设计等优点。 展开更多
关键词 可重构计算 fpga 动态可重构 局部重构 Virtex-4配置 JTAG(边界扫描)链
在线阅读 下载PDF
RocketTC:一个基于FPGA的高性能网络流量分类架构 被引量:12
6
作者 付文亮 嵩天 周舟 《计算机学报》 EI CSCD 北大核心 2014年第2期414-422,共9页
基于深包检测技术的流量分类方法可以达到95%以上的识别率和准确率.然而,由于计算复杂性高、存储消耗大等原因,主流软件方法只能提供百兆(线速率)处理能力,而且不能处理大量流并发的情况.文中提出一个基于深包检测技术的芯片级流量分类... 基于深包检测技术的流量分类方法可以达到95%以上的识别率和准确率.然而,由于计算复杂性高、存储消耗大等原因,主流软件方法只能提供百兆(线速率)处理能力,而且不能处理大量流并发的情况.文中提出一个基于深包检测技术的芯片级流量分类架构RocketTC,通过对应用层协议特征、匹配引擎和流管理策略进行优化,使其支持万兆级数据吞吐率.RocketTC具有两个核心模块:基于FPGA的流管理器和动态可重构的分类引擎阵列,前者实现万兆吞吐率下的流表管理,后者快速检测流量特征并支持动态协议特征更新特性.文中提出的分类方法使用轻量级DPI方法,通过缩小检测范围和特征长度进一步减少计算复杂度和存储消耗.我们使用Xilinx Virtex-5FPGA对上述设计进行实现与在线流量测试,结果表明RocketTC可以对92种网络协议进行识别,准确率达到97%,而且稳定提供20Gbps线速处理能力. 展开更多
关键词 架构设计 网络流量分类 fpga 多级流水 部分动态可重构(PDR)中图法
在线阅读 下载PDF
基于FPGA的开放式教学CPU的设计与测试系统 被引量:14
7
作者 李山山 汤志忠 周继群 《计算机工程与应用》 CSCD 北大核心 2005年第14期98-100,198,共4页
设计并实现了一个CPU设计与测试实验装置,适合于计算机原理和系统结构课程的综合实验。该实验装置采用EDA工具在FPGA上实现了CPU设计,应用M CU和上位机软件对所设计的CPU进行了监控和调试,保证了CPU在实验系统上能够运行起来。
关键词 CPU设计与测试 fpga 计算机原理 系统结构 单片机
在线阅读 下载PDF
可重构星载信息处理系统FPGA预规划技术 被引量:2
8
作者 刘源 孙兆伟 +2 位作者 沈毅 邢雷 吴献德 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2013年第7期878-882,888,共6页
为了提高可重构星载信息处理系统的FPGA资源利用效率和在轨长期可靠性,基于对FPGA内部结构与典型任务序列资源占用量的分析,提出了一种在FPGA上具有可实现性的可重构资源预规划方法,并对该方法在轨可靠性进行了理论分析.仿真结果表明:... 为了提高可重构星载信息处理系统的FPGA资源利用效率和在轨长期可靠性,基于对FPGA内部结构与典型任务序列资源占用量的分析,提出了一种在FPGA上具有可实现性的可重构资源预规划方法,并对该方法在轨可靠性进行了理论分析.仿真结果表明:在多任务背景下,该方法能够使可重构星载信息处理系统FPGA资源利用率提升约30%.此外相对常规的静态冗余设计,该方法还能够使FPGA在发生局部永久性损伤的情况下,提升FPGA资源利用率约50%. 展开更多
关键词 可重构计算 fpga 规划 可靠性 可重构星载信息处理系统
在线阅读 下载PDF
基于FPGA的人工神经网络实现方法的研究 被引量:10
9
作者 杨银涛 汪海波 +1 位作者 张志 周建华 《现代电子技术》 2009年第18期170-174,共5页
基于FPGA的神经网络实现方法已成为实际实时应用神经网络的一种途径。本文就十多年来基于FPGA的ANN实现作一个系统的总结,例举关键的技术问题,给出详细的数据分析,引用相关的最新研究成果,对不同的实现方法和思想进行讨论分析,并说明存... 基于FPGA的神经网络实现方法已成为实际实时应用神经网络的一种途径。本文就十多年来基于FPGA的ANN实现作一个系统的总结,例举关键的技术问题,给出详细的数据分析,引用相关的最新研究成果,对不同的实现方法和思想进行讨论分析,并说明存在的问题以及改善方法,强调神经网络FPGA实现的发展方向和潜力及提出自己的想法。另外,还指出基于FPGA实现神经网络存在的瓶颈制约,最后对今后的研究趋势作出估计。 展开更多
关键词 fpga 可重构计算 BP算法 神经网络 FPNA
在线阅读 下载PDF
一种基于FPGA的高斯随机数生成器的设计与实现 被引量:15
10
作者 谷晓忱 张民选 《计算机学报》 EI CSCD 北大核心 2011年第1期165-173,共9页
基于FPGA的高斯随机数生成器需要满足可重构、高吞吐率和高硬件资源使用效率等要求.文中提出了一种易于硬件实现的状态转换逻辑结构,并给出了均匀分布随机数周期和输出位宽的配置方法和配置原则.文中详细分析了应用"最值分析法&qu... 基于FPGA的高斯随机数生成器需要满足可重构、高吞吐率和高硬件资源使用效率等要求.文中提出了一种易于硬件实现的状态转换逻辑结构,并给出了均匀分布随机数周期和输出位宽的配置方法和配置原则.文中详细分析了应用"最值分析法"和"静态误差分析法"求解Box Muller算法实现过程中各操作数位宽的具体过程.硬件实现结果在Xilinx Vertex 5上的工作速度为491 MHz,吞吐率为9.82×108samples/second,硬件资源使用效率为2.085×106samples/second/slice.文中作者使用DIEHARD测试集、χ2和K-S方法对产生的随机数质量进行了检测,文中给出了结果. 展开更多
关键词 现场可编程门阵列 硬件加速器 高斯随机数产生 均匀分布随机数产生 可重构计算
在线阅读 下载PDF
基于双FPGA系统的高速全局动态重构设计与实现 被引量:7
11
作者 夏飞 李晖宙 《现代电子技术》 北大核心 2017年第16期151-154,共4页
基于双FPGA芯片的可重构原型系统,提出一种系统高速全局动态重构设计方法。利用Xilinx Virtex-7系列FPGA的常规配置通道,使用一片规模较小的FPGA芯片作为重构控制器对大规模算法FPGA芯片实现全局动态重构。实验结果表明,系统重构时间小... 基于双FPGA芯片的可重构原型系统,提出一种系统高速全局动态重构设计方法。利用Xilinx Virtex-7系列FPGA的常规配置通道,使用一片规模较小的FPGA芯片作为重构控制器对大规模算法FPGA芯片实现全局动态重构。实验结果表明,系统重构时间小于60 ms,与常规FPGA逻辑下载方法相比,配置效率提高了2~3个数量级。 展开更多
关键词 可编程门阵列 可重构计算 全局动态重构 并行配置通道
在线阅读 下载PDF
基于FPGA的稀疏矩阵向量乘的设计研究 被引量:9
12
作者 张禾 陈客松 《计算机应用研究》 CSCD 北大核心 2014年第6期1756-1759,共4页
作为典型的不规则算法,稀疏矩阵向量乘的计算过程具有非常低的访存局部性和计算访存比,因此在基于cache的通用处理器上计算效率很低。提出了一种面向可重构计算平台的基于IEEE-754浮点数据格式标准的稀疏矩阵向量乘算法加速器的设计。... 作为典型的不规则算法,稀疏矩阵向量乘的计算过程具有非常低的访存局部性和计算访存比,因此在基于cache的通用处理器上计算效率很低。提出了一种面向可重构计算平台的基于IEEE-754浮点数据格式标准的稀疏矩阵向量乘算法加速器的设计。在一维划分的行压缩稀疏矩阵数据存储技术以及计算部件的流水化设计的基础上,提出了一种基于单个浮点加法器的无阻塞累加器设计。通过实验验证表明,简化了算法的设计提高了算法执行的并行度和外部存储器的带宽利用率,获得了相对于传统处理器1.37-2.60倍的性能加速比。 展开更多
关键词 稀疏矩阵向量乘 现场可编程逻辑门阵列 可重构计算 并行算法
在线阅读 下载PDF
FPGA计算 被引量:2
13
作者 杨超峰 胡铭曾 《计算机科学》 CSCD 北大核心 1999年第9期1-4,共4页
1.引言设计计算系统时,一个首要的折衷是速度和通用性,具体体现于系统功能的软硬件划分,即什么功能由硬件实现,什么功能由软件实现。硬件实现速度快,而软件实现灵活性大。基于此,计算系统可以分为两类:通用计算系统和专用计算系统。不... 1.引言设计计算系统时,一个首要的折衷是速度和通用性,具体体现于系统功能的软硬件划分,即什么功能由硬件实现,什么功能由软件实现。硬件实现速度快,而软件实现灵活性大。基于此,计算系统可以分为两类:通用计算系统和专用计算系统。不同计算系统的特点集中体现于其处理部件, 展开更多
关键词 fpga 可编程逻辑器件 计算
在线阅读 下载PDF
基于可重构架构的数据中心异构加速软硬件系统级平台
14
作者 王彦伟 李仁刚 +1 位作者 徐冉 刘钧锴 《计算机研究与发展》 北大核心 2025年第4期963-977,共15页
构建数据中心加速服务的软硬件系统级原型平台,需要考虑高计算能力、扩展性、灵活性和低成本等因素.为了提高数据中心的能力,从软硬件协同的角度研究数据中心异构计算在云平台架构、硬件实现、高速互连和应用等方面的创新,研究设计并构... 构建数据中心加速服务的软硬件系统级原型平台,需要考虑高计算能力、扩展性、灵活性和低成本等因素.为了提高数据中心的能力,从软硬件协同的角度研究数据中心异构计算在云平台架构、硬件实现、高速互连和应用等方面的创新,研究设计并构建了一个可重构组合的软硬件加速原型系统,简化了现有以处理器为中心的系统级计算平台构建方法,实现目标软硬件设计的快速部署与系统级原型验证.针对以上目标,通过解耦的可重构架构设备虚拟化和远程映射等方法,发掘独立计算单元的潜力,构建了一套ISOF(independent system of FPGA(field programmable gate arrays))软硬件计算平台系统,可使其超越普通服务器设计所能提供的能力,实现计算单元低成本高效扩展,使客户端可灵活使用外设资源,并且为满足系统级通信挑战,设计了一套计算单元之间的通信硬件平台和交互机制.此外,为提升软硬件系统级平台的敏捷性,ISOF提供了灵活统一的调用接口.最后,通过对平台目标系统级的分析评估,验证了该平台在满足了当下计算与加速需求下,保证了高速、低延时的通信,以及良好的吞吐率和弹性扩容效率,另外在高速通信的基础上改进的拥塞避免和丢包恢复机制,满足了数据中心规模通信的稳定性需求. 展开更多
关键词 异构计算 加速平台 原型系统 高速互连 可重构架构 fpga
在线阅读 下载PDF
共轭梯度求解器的FPGA设计与实现 被引量:1
15
作者 宋庆增 顾军华 《计算机应用》 CSCD 北大核心 2011年第9期2571-2573,2588,共4页
针对共轭梯度(CG)迭代算法软件执行效率低、实时性差的缺点,提出一种基于现场可编程逻辑门阵列(FPGA)平台的CG迭代求解器。设计采用软硬件结合的方式构建整个系统,CG协处理器执行CG迭代算法中计算量大、控制简单的代码,以达到硬件加速... 针对共轭梯度(CG)迭代算法软件执行效率低、实时性差的缺点,提出一种基于现场可编程逻辑门阵列(FPGA)平台的CG迭代求解器。设计采用软硬件结合的方式构建整个系统,CG协处理器执行CG迭代算法中计算量大、控制简单的代码,以达到硬件加速的目的。控制复杂、计算量较少的代码则依旧在微处理上执行。设计采用行交错数据流,使得整个系统完全无停顿的运行,提高了计算性能。实验结果表明,与软件执行相比,硬件CG协处理器可以获得最高5.7倍的性能加速。 展开更多
关键词 可重构计算 稀疏线性方程组 现场可编程逻辑门阵列 共轭梯度法 行交错数据流
在线阅读 下载PDF
基于PC104总线的FPGA配置刷新管理
16
作者 赵刚 田大新 《火力与指挥控制》 CSCD 北大核心 2010年第S1期175-176,182,共3页
FPGA在火控计算机中的使用即增加了系统性能,也增加了系统的风险。根据系统的特点,设计了FPGA的配置刷新管理系统。该系统利用了火控计算机总线接口和部分FPGA资源,实现了FPGA配置数据错误的实时检测与刷新控制,增加了整个系统的可靠性。
关键词 火控计算机 PC104总线 fpga 配置刷新
在线阅读 下载PDF
一种面向高性能计算的多FPGA互连结构及划分方法 被引量:3
17
作者 肖春华 黄樟钦 李达 《计算机应用研究》 CSCD 北大核心 2015年第1期150-155,共6页
针对高性能计算系统在大规模通信互连中面临的性能、成本及功耗等问题,融合新兴的高速互连技术,结合大规模、超大规模系统通信的局部性和异构性,提出基于多FPGA的混合层级高速互连结构,并给出基于集群的多FPGA逻辑功能划分方法。该方法... 针对高性能计算系统在大规模通信互连中面临的性能、成本及功耗等问题,融合新兴的高速互连技术,结合大规模、超大规模系统通信的局部性和异构性,提出基于多FPGA的混合层级高速互连结构,并给出基于集群的多FPGA逻辑功能划分方法。该方法能够根据不同应用自定义设计高效互连网络,降低大规模计算系统的互连成本和开销。通过应用实例实验证明,该方法能够实现大规模设计向多FPGA高性能计算平台的快速映射,加速高性能可配置计算系统的设计实现。 展开更多
关键词 高性能计算 fpga系统 逻辑资源划分 高性能互连
在线阅读 下载PDF
RESSP:基于FPGA的可重构SDN交换结构 被引量:4
18
作者 何璐蓓 厉俊男 +1 位作者 杨翔瑞 孙志刚 《计算机科学》 CSCD 北大核心 2018年第1期205-210,共6页
SDN采用转发与控制分离的架构和集中的控制管理机制,可有效满足不同网络中不同粒度的管理控制需求。当高校科研人员进行SDN的教学和创新实验时,需要一个处理过程可感且可重新编程的数据平面来支持原理展示和自主研究。然而,传统ASIC交... SDN采用转发与控制分离的架构和集中的控制管理机制,可有效满足不同网络中不同粒度的管理控制需求。当高校科研人员进行SDN的教学和创新实验时,需要一个处理过程可感且可重新编程的数据平面来支持原理展示和自主研究。然而,传统ASIC交换机的内部实现流程不透明且转发查表架构固定,软件交换机的处理性能较低,因此无法充分支持数据平面的研究。目前,通过FPGA设计可编程数据平面,为满足不同科研场景下多样化的处理需求提供了一条可行路径。但是,在基于FPGA的可重构交换机架构和设计方法方面还缺少深入研究,主要表现在难以实现基于模块细粒度的SDN处理流程重构,现有工作复用程度低,同时无法为开源的SDN数据平面设计提供技术支持。为此,提出一种基于FPGA的SDN交换平面实现结构——RESSP(FPGA-based REconfigurable SDN Switching Pipeline)。RESSP将报文处理流程拆解成多个可动态加载的模块,针对交换机具体的应用场景,利用FPGA可编程特性对硬件功能模块进行增加、删除或替换,从而针对实际需求设计出相应的报文处理逻辑。此外,基于RESSP实现了一个SDN交换机的原型系统MiniSwitch。MiniSwitch验证了RESSP在教学科研实验中快速重构所需SDN数据平面的可行性和可扩展性。 展开更多
关键词 软件定义网络 现场可编程门阵列 交换结构 可重构 开源 网络教学
在线阅读 下载PDF
人工神经网络FPGA实现研究进展与发展趋势 被引量:6
19
作者 林祥金 张志利 朱智 《控制工程》 CSCD 2007年第S3期1-3,共3页
综述了人工神经网络FPGA实现的研究进展和关键技术,分析了如何利用FHGA的可重构技术来实现人工神经网络,探讨了实现过程中的一些问题,并介绍了作为神经网络FPGA实现的基础—可重构技术。指出测试平台设计、软件工具、FPGA友好学习算法... 综述了人工神经网络FPGA实现的研究进展和关键技术,分析了如何利用FHGA的可重构技术来实现人工神经网络,探讨了实现过程中的一些问题,并介绍了作为神经网络FPGA实现的基础—可重构技术。指出测试平台设计、软件工具、FPGA友好学习算法及拓扑结构自适应等方面的研究,是今后研究的热点。 展开更多
关键词 人工神经网络 fpga 可重构技术 智能计算
在线阅读 下载PDF
FPGA高层综合中的内存子系统研究综述
20
作者 张展鹏 张治国 《计算机科学》 CSCD 北大核心 2012年第B06期350-356,共7页
高层综合从高级编程语言对系统的行为描述出发,把系统中的计算转移到可重构的硬件中,以加速系统运行。高层综合中生成有效的内存子系统尤为重要,特别是对于数据密集型的计算。分析了现阶段FPGA高层综合技术及其内存子系统,把生成的内存... 高层综合从高级编程语言对系统的行为描述出发,把系统中的计算转移到可重构的硬件中,以加速系统运行。高层综合中生成有效的内存子系统尤为重要,特别是对于数据密集型的计算。分析了现阶段FPGA高层综合技术及其内存子系统,把生成的内存子系统从体系上分为三类:DSP型体系、以CPU为核心的体系以及基于可重构内存功能单元的体系。结合实例介绍了各体系的特点,然后按照高层综合过程中的前端和后端,分类讨论了内存子系统的优化技术。经过分析评价,指出片外与片上内存间的映射、程序的有效建模等问题仍有待解决,自动化生成内存组织体系和多模块综合是可能的研究方向。 展开更多
关键词 高层综合 fpga 内存子系统 可重构体系结构
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部