期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
一种高速定点FFT处理器的设计与实现 被引量:9
1
作者 付博 李栋 谢应科 《计算机工程》 EI CAS CSCD 北大核心 2005年第11期52-55,共4页
提出了一种高速定点FFT处理器的设计方法,此方法在CORDIC算法的基础上,通过优化操作数地址映射方法和旋转因子生成方法,每周期完成一个基4蝶形运算,具有最大的并行性。同时按照本文提出的因子生成方法,每个周期可生成3个旋转因子,且硬... 提出了一种高速定点FFT处理器的设计方法,此方法在CORDIC算法的基础上,通过优化操作数地址映射方法和旋转因子生成方法,每周期完成一个基4蝶形运算,具有最大的并行性。同时按照本文提出的因子生成方法,每个周期可生成3个旋转因子,且硬件实现简单,无须额外的ROM资源。整个系统采用Xilinx公司的XCV2P30仿真,系统频率达到了130MHz,对于1k点16位的复数FFT需要9.8μs,16k点需要221μs,优于目前绝大多数已有的FFT处理器。 展开更多
关键词 快速傅立叶变换 fft处理器 CORDIC算法
在线阅读 下载PDF
基2×2FFT的地址映射算法 被引量:8
2
作者 谢应科 侯紫峰 韩承德 《计算机学报》 EI CSCD 北大核心 2000年第10期1051-1055,共5页
FFT处理器是根据 FFT运算特点来进行设计的 ,可以充分提高处理效率 ,达到平均每周期完成一个蝶式运算的处理能力 .在这类芯片中 ,需要并行无冲突的数据访问部件来提供蝶式运算所需的多个操作数 .文中对已有的一些算法进行了比较 ,并提出... FFT处理器是根据 FFT运算特点来进行设计的 ,可以充分提高处理效率 ,达到平均每周期完成一个蝶式运算的处理能力 .在这类芯片中 ,需要并行无冲突的数据访问部件来提供蝶式运算所需的多个操作数 .文中对已有的一些算法进行了比较 ,并提出基 2× 2 FFT的并行数据访问算法 ,通过使用 4个存储体 ,它可以同时完成所需的 4个数据的读取或写入操作 .该算法易于用硬件实现 ,其操作数访问地址的产生速度快于已有的算法 . 展开更多
关键词 快速傅里叶变换 合成孔径雷达 地址映射算法
在线阅读 下载PDF
可变长FFT并行旋转因子高效产生算法及实现 被引量:6
3
作者 刘红侠 杨靓 +1 位作者 黄巾 黄士坦 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2009年第3期541-546,共6页
为了解决FFT处理并行旋转因子产生复杂、所需存储资源多的问题,该文在分体存储器结构的基础上,提出了一种新的旋转因子存储、访问策略.该策略保证混合基4/2 FFT算法每个蝶式运算所需的3个旋转因子均可无冲突并行访问,且在同一个旋转因... 为了解决FFT处理并行旋转因子产生复杂、所需存储资源多的问题,该文在分体存储器结构的基础上,提出了一种新的旋转因子存储、访问策略.该策略保证混合基4/2 FFT算法每个蝶式运算所需的3个旋转因子均可无冲突并行访问,且在同一个旋转因子查找表的基础上,使计算任意小于最大可处理长度的FFT时,各级访问旋转因子地址的产生仅与最大可处理长度有关,而与当前处理长度无关.该算法仅用一个可移位累加数寄存器,实现计算过程中旋转因子地址产生的级间切换,且使一个存储体容量及访问次数减少了一半以上. 展开更多
关键词 快速傅里叶变换(fft) 旋转因子 混合基4/2 地址产生单元 fft处理器
在线阅读 下载PDF
一种支持多数据块混合处理的FFT优化方法 被引量:6
4
作者 洪钦智 王志君 +1 位作者 郭一凡 梁利平 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2022年第6期42-50,共9页
针对快速傅里叶变换处理器中运算通路深流水线气泡会导致性能损失以及不同点数的快速傅里叶变换存在吞吐率不均衡问题,提出了一种可以同时支持多个快速傅里叶变换数据混合处理的优化方法。设计了一种深度流水的可配置蝶形处理电路以及... 针对快速傅里叶变换处理器中运算通路深流水线气泡会导致性能损失以及不同点数的快速傅里叶变换存在吞吐率不均衡问题,提出了一种可以同时支持多个快速傅里叶变换数据混合处理的优化方法。设计了一种深度流水的可配置蝶形处理电路以及可支持多数据块混合处理的块浮点处理架构,使得在同一硬件框架下可支持1个基9/2个基8/3个基5/4个基4/5个基3的高精度蝶形运算,运算速率和资源效率较高。基于上述方法,实现了一种支持4G/5G标准的多模高性能快速傅里叶变换处理器,可以支持64~4 096点的FFT/iFFT和12~3 240点的DFT/iDFT处理(60种点数模式)。该快速傅里叶变换处理器基于55 nm CMOS工艺实现,面积1.59 mm^(2),最高工作频率500 MHz,单数据模式下最大吞吐率1.5 GS/s,混合数据模式下最大吞吐率2.2 GS/s。与近年研究相比,该设计在增加较少资源的情况下,实现了更多点数支持、更高的吞吐率(2X~6X)和各种点数下更均衡的性能。 展开更多
关键词 快速傅里叶变换处理器 高性能 多模式 5G
在线阅读 下载PDF
块浮点FFT处理器的有限字长效应分析 被引量:3
5
作者 乔树山 黑勇 +1 位作者 吴斌 王晓琴 《电子科技大学学报》 EI CAS CSCD 北大核心 2008年第1期58-60,共3页
研究了基于基8算法的块浮点FFT处理器的有限字长效应问题,提出了一种基于理论统计分析的静态模型。在不考虑输入信号的量化误差和系数量化误差情况下,对基8单元和加权过程的误差进行了分析;给出了有限字长效应所造成的误差随着频率点数... 研究了基于基8算法的块浮点FFT处理器的有限字长效应问题,提出了一种基于理论统计分析的静态模型。在不考虑输入信号的量化误差和系数量化误差情况下,对基8单元和加权过程的误差进行了分析;给出了有限字长效应所造成的误差随着频率点数和级数的变化趋势。通过SPEED开发平台得到的硬件仿真结果验证了该方法估计字长效应的正确性,可以将其应用于工程分析。 展开更多
关键词 fft处理器 有限字长效应 基8单元 SPEED开发平台
在线阅读 下载PDF
基于FPGA的可扩展高速FFT处理器的设计与实现 被引量:6
6
作者 刘晓明 孙学 《电讯技术》 2005年第3期147-151,共5页
本文提出了基于FPGA实现傅里叶变换点数可灵活扩展的流水线FFT处理器的结构设计以及各功能模块的算法实现,包括高组合数FFT算法的流水线实现结构、级间混序读/写RAM地址规律、短点数FFT阵列处理结构以及补码实现CORDIC算法的流水线结构... 本文提出了基于FPGA实现傅里叶变换点数可灵活扩展的流水线FFT处理器的结构设计以及各功能模块的算法实现,包括高组合数FFT算法的流水线实现结构、级间混序读/写RAM地址规律、短点数FFT阵列处理结构以及补码实现CORDIC算法的流水线结构等。利用FPGA实现的各功能模块组装了64点FFT处理器。从其计算性能可知,在输入数据速率为20MHz时,利用此结构实现的FFT处理器计算1024点FFT的运算时间约为52μs。 展开更多
关键词 快速傅里叶变换 处理器 坐标旋转数字计算机 现场可编程门阵列 设计
在线阅读 下载PDF
FFT处理器的一种扫描内建自测试方案 被引量:3
7
作者 杨德才 谢永乐 陈光 《仪器仪表学报》 EI CAS CSCD 北大核心 2008年第2期299-303,共5页
对FFT处理器提出了一种采用扫描的内建自测试方案。该方案充分利用FFT结构上的规则性,采用扫描的可测性设计,不需要对处理器内部基本功能单元作任何更改,且测试序列生成和响应压缩都可通过对已有功能模块如累加器的复用来完成。通过将... 对FFT处理器提出了一种采用扫描的内建自测试方案。该方案充分利用FFT结构上的规则性,采用扫描的可测性设计,不需要对处理器内部基本功能单元作任何更改,且测试序列生成和响应压缩都可通过对已有功能模块如累加器的复用来完成。通过将系统已有流水线寄存器构成扫描链且通过扫描链的可重构,不仅进一步简化了测试设计要求,而且减少了硬件成本和系统性能占用,同时还具有测试向量少、故障覆盖率高的优点。 展开更多
关键词 内建自测试 可测性设计 fft处理器 扫描测试
在线阅读 下载PDF
数据全并行FFT处理器的设计 被引量:7
8
作者 谢应科 付博 《计算机研究与发展》 EI CSCD 北大核心 2004年第6期1022-1029,共8页
讨论了基 4和混和基算法的FFT处理器设计问题 ,提出的操作数地址映射方法充分利用了FFT算法本身的同址性质 ,能同时提供蝶形运算所需的 4个操作数 ,具有最大的数据并行性 按照旋转因子存放规则 ,蝶形运算所需的 3个旋转因子地址相同 ,... 讨论了基 4和混和基算法的FFT处理器设计问题 ,提出的操作数地址映射方法充分利用了FFT算法本身的同址性质 ,能同时提供蝶形运算所需的 4个操作数 ,具有最大的数据并行性 按照旋转因子存放规则 ,蝶形运算所需的 3个旋转因子地址相同 ,且寻址方式简单 运算部件采用 3个乘法的复数运算算法 ,有效减少了运算部件的大小 ,它既可以作基 4蝶形运算 ,也可以同时进行 2个基 2蝶形运算 采用Altera公司的EP2 0 0K4 0 0E ,工作频率达到 89MHz,1 0 2 4点 1 6位复数FFT需要 1 4 1 μs,4 0 96点需要 6 展开更多
关键词 快速傅里叶变换(fft) fft处理器
在线阅读 下载PDF
并行数据FFT/IFFT处理器的设计 被引量:7
9
作者 万红星 陈禾 韩月秋 《北京理工大学学报》 EI CAS CSCD 北大核心 2006年第4期338-341,共4页
针对采用快速傅里叶变换(FFT)技术的多种应用场合,在分析基-2及基-4按时域抽取Cooley-Turkey算法特点的基础上,提出一种高性能FFT/IFFT处理器的硬件设计架构.通过改进基-4蝶形单元,可进行形如2的幂次方点数的FFT/IFFT运算.该结构能够并... 针对采用快速傅里叶变换(FFT)技术的多种应用场合,在分析基-2及基-4按时域抽取Cooley-Turkey算法特点的基础上,提出一种高性能FFT/IFFT处理器的硬件设计架构.通过改进基-4蝶形单元,可进行形如2的幂次方点数的FFT/IFFT运算.该结构能够并行地从4个存储器中读取蝶形运算所需操作数.仿真结果表明,该结构可以运用于对面积和速度要求较高的应用场合. 展开更多
关键词 fft/Ifft处理器 蝶形单元 并行数据
在线阅读 下载PDF
FFT处理器无冲突地址生成方法 被引量:10
10
作者 马余泰 《计算机学报》 EI CSCD 北大核心 1995年第11期875-880,共6页
本文提出了一种新的无冲突地址生成方法,使蝶式运算单元在一个周期内能够同时读取两个操作数.由于取消了地址奇偶判别电路,简化了存储体控制逻辑,同时也加快了输入/输出地址生成.该方法还同样适用于基-4FFT处理器.
关键词 傅里叶变换 fft处理器 地址生成 存储器
在线阅读 下载PDF
基于超标量处理器的高效FFT映射方法 被引量:2
11
作者 高立宁 朱亮 +1 位作者 刘腾飞 刘峰 《北京理工大学学报》 EI CAS CSCD 北大核心 2016年第9期940-946,共7页
针对超标量处理器的结构特点,研究新的映射方法,实现高效FFT运算.对现代超标量结构处理器进行建模,分析FFT算法在其上执行情况,得出内存访问是FFT算法执行的关键点.并进一步对FFT的内访问过程进行建模分析,最终实现了一种基于cache优化... 针对超标量处理器的结构特点,研究新的映射方法,实现高效FFT运算.对现代超标量结构处理器进行建模,分析FFT算法在其上执行情况,得出内存访问是FFT算法执行的关键点.并进一步对FFT的内访问过程进行建模分析,最终实现了一种基于cache优化的高效FFT映射方法,该方法将FFT进行拆分实现,充分发挥了cache的作用,进而提高了处理性能.最后在ADI公司的TS201数字信号处理器上,以该映射方法为指导实现了基2FFT算法,实验结果显示在处理点数超出cache容量时,本映射方法可以大幅度提高处理性能. 展开更多
关键词 快速傅里叶变化(fft) 高速缓存(cache) 超标量处理器
在线阅读 下载PDF
基于FFT的直线电机地铁牵引电机功率因数角测量 被引量:2
12
作者 张进高 卢琴芬 +2 位作者 王利 叶云岳 洪伟明 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第11期1981-1984,2043,共5页
基于传统快速傅里叶变换(FFT)频谱分析,提出测量功率因数角获取功率因数的方法,分析该方法的实现原理,完成一套以定点数字信号处理器(DSP)为核心的测量装置.在同步采样和非同步采样方式下,进行正弦信号与方波信号的测量实验.实验结果表... 基于传统快速傅里叶变换(FFT)频谱分析,提出测量功率因数角获取功率因数的方法,分析该方法的实现原理,完成一套以定点数字信号处理器(DSP)为核心的测量装置.在同步采样和非同步采样方式下,进行正弦信号与方波信号的测量实验.实验结果表明,采用该方法,正弦信号在同步采样和非同步采样情况下都能够获得准确的相角差;而方波信号即使在非同步采样情况下通过提取基波信号也能够获得准确的相角差. 展开更多
关键词 直线电机地铁 功率因数 功率因数角 快速傅里叶变换 数字信号处理器
在线阅读 下载PDF
面向VLSI实现的FFT并行算法 被引量:1
13
作者 马余泰 《计算机学报》 EI CSCD 北大核心 1994年第10期767-776,共10页
本文提出了一种新的面向VLSI实现的FFT并行算法,其中旋转因子所占ROM的存储容量达到最小,因而有利于FFT处理器的片内集成.
关键词 傅里叶变换 并行算法 VLSI
在线阅读 下载PDF
申威26010众核处理器上一维FFT实现与优化 被引量:2
14
作者 赵玉文 敖玉龙 +3 位作者 杨超 刘芳芳 尹万旺 林蓉芬 《软件学报》 EI CSCD 北大核心 2020年第10期3184-3196,共13页
根据申威26010众核处理器的特点提出了基于两层分解的一维FFT众核并行算法.该算法基于迭代的Stockham FFT计算框架和Cooley-Tukey FFT算法,将大规模FFT分解成一系列的小规模FFT来计算,并通过设计合理的任务划分方式、寄存器通信、双缓... 根据申威26010众核处理器的特点提出了基于两层分解的一维FFT众核并行算法.该算法基于迭代的Stockham FFT计算框架和Cooley-Tukey FFT算法,将大规模FFT分解成一系列的小规模FFT来计算,并通过设计合理的任务划分方式、寄存器通信、双缓冲以及SIMD向量化等与计算平台相关的优化方法来提高FFT的计算性能.最后对所提出算法的性能进行了测试,相比于单主核上运行的FFTW3.3.4库,获得了平均44.53x的加速比,最高加速比可达56.33x,且其带宽利用率最高可达83.45%. 展开更多
关键词 申威26010处理器 一维fft 两层分解 Cooley-Tukey 众核并行
在线阅读 下载PDF
FFT处理机的形式化模型及正确性验证
15
作者 张欢欢 宋国新 《计算机工程与应用》 CSCD 北大核心 2007年第2期10-14,共5页
快速傅立叶变换的应用领域非常广泛,其硬件实现方法多种多样,验证这些电路的正确性具有很强的实用价值。传统的电路正确性验证的方法是模拟,这种方法的主要缺点是随着参与运算的点数的增加,穷尽模拟全部输入情况所耗费的时间越来越长,... 快速傅立叶变换的应用领域非常广泛,其硬件实现方法多种多样,验证这些电路的正确性具有很强的实用价值。传统的电路正确性验证的方法是模拟,这种方法的主要缺点是随着参与运算的点数的增加,穷尽模拟全部输入情况所耗费的时间越来越长,甚至难以实现。而形式化方法使用纯数学手段证明电路的正确性,克服了传统方法的缺点。首先用重写系统给出了任意N=2M点的基2的流水式快速傅里叶变换处理机的形式化模型,然后给出它的正确性验证,探索了验证处理复数的复杂电路正确性的方法。 展开更多
关键词 重写 形式化 描速 验证 归纳 快速傅里叶变换处理机
在线阅读 下载PDF
基于FPGA的移位寄存器流水线结构FFT处理器设计与实现
16
作者 郝小龙 韦高 刘娜 《现代电子技术》 2010年第9期172-176,共5页
设计实现了基于FPGA的256点定点FFT处理器。处理器以基-2算法为基础,通过采用高效的两路输入移位寄存器流水线结构,有效提高了碟形运算单元的运算效率,减少了寄存器资源的使用,提高了最大工作频率,增大了数据吞吐量,并且使得处理器具有... 设计实现了基于FPGA的256点定点FFT处理器。处理器以基-2算法为基础,通过采用高效的两路输入移位寄存器流水线结构,有效提高了碟形运算单元的运算效率,减少了寄存器资源的使用,提高了最大工作频率,增大了数据吞吐量,并且使得处理器具有良好的可扩展性。详细描述了具体设计的算法结构和各个模块的实现。设计采用Verilog HDL作为硬件描述语言,采用QuartusⅡ设计仿真工具进行设计、综合和仿真,仿真结果表明,处理器工作频率为72 MHz,是一种高效的FFT处理器IP核。 展开更多
关键词 fft处理器 流水线结构 FPGA QuartusⅡ VERILOG HDL
在线阅读 下载PDF
超长点数FFT处理器的旋转因子生成方法
17
作者 高振斌 王霞 《电讯技术》 2007年第6期71-74,共4页
对于大点数FFT处理器,提出了一种新的旋转因子生成方法。首先对三角函数曲线分段进行折线近似,将线段端点及斜率存入存储器,然后通过查表以及插值计算的方法来生成旋转因子。在保证FFT计算精度的前提下,极大地降低了对旋转因子存储器容... 对于大点数FFT处理器,提出了一种新的旋转因子生成方法。首先对三角函数曲线分段进行折线近似,将线段端点及斜率存入存储器,然后通过查表以及插值计算的方法来生成旋转因子。在保证FFT计算精度的前提下,极大地降低了对旋转因子存储器容量的需求,对大点数FFT处理器的单片ASIC实现具有重要意义。 展开更多
关键词 fft处理器 旋转因子 插值计算 ASIC
在线阅读 下载PDF
一种FFT并行处理机的设计与实现 被引量:2
18
作者 张犁 李双飞 +1 位作者 石光明 李甫 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2010年第4期630-635,共6页
专用指令集处理器具有数字信号处理器的可编程性和专用处理电路的高速性,以专用指令集处理器为核心构成的阵列式并行处理系统在高速实时处理方面有着非常重要的应用.为此,提出了一种基于专用指令集处理器的快速傅里叶变换并行处理机实... 专用指令集处理器具有数字信号处理器的可编程性和专用处理电路的高速性,以专用指令集处理器为核心构成的阵列式并行处理系统在高速实时处理方面有着非常重要的应用.为此,提出了一种基于专用指令集处理器的快速傅里叶变换并行处理机实现方法.设计了基于精简指令集处理器体系结构的可编程处理单元,以其为核心构成并行处理系统,采用通信矩阵解决了并行系统内各个处理单元间的数据交换问题,实现了1 024点快速傅里叶变换的并行处理.实验结果表明,在快速傅里叶变换处理方面,其处理速度比典型数字信号处理器提高30%,且具有系统并行规模大、功能灵活可变、设计复杂程度适当、设计重复利用性好的优点,非常适合在现场可编程逻辑门阵列中以SoC的形式实现. 展开更多
关键词 专用指令集处理器 快速傅里叶变换 精简指令集处理器 并行处理 数据通信
在线阅读 下载PDF
基于CORDIC算法的FFT处理器设计 被引量:1
19
作者 彭清兵 李方军 《计算机工程》 CAS CSCD 北大核心 2011年第23期208-210,共3页
采用CORDIC算法和无乘法器的蝶形运算操作,建立Matlab函数模型。合理选择迭代级数和运算数据位宽,设计一种新的高信噪比快速傅里叶变换(FFT)处理器。在最优化设计中,信噪比可以达到88 dB,在加入溢出保护设计后,硬件实现的信噪比可以达到... 采用CORDIC算法和无乘法器的蝶形运算操作,建立Matlab函数模型。合理选择迭代级数和运算数据位宽,设计一种新的高信噪比快速傅里叶变换(FFT)处理器。在最优化设计中,信噪比可以达到88 dB,在加入溢出保护设计后,硬件实现的信噪比可以达到80 dB,功耗减少20.63%。仿真结果表明,该处理器具有芯片面积较小、精度高、功耗低、信噪比高等优点。 展开更多
关键词 快速傅里叶变换 CORDIC算法 误差 信噪比 处理器
在线阅读 下载PDF
一种采用改良基-2^(6)算法的低复杂度高吞吐量FFT处理器设计
20
作者 于建 《电讯技术》 北大核心 2022年第5期671-677,共7页
面向无线个人局域网应用设计了一种高吞吐量、低复杂度的2048点快速傅里叶变换处理器。提出了新型改良基-2^(6)算法用于降低硬件实现复杂度,采用多路径负反馈架构来提高数据吞吐量。为了减少硬件成本,采取正则有符号数常数乘法器替代布... 面向无线个人局域网应用设计了一种高吞吐量、低复杂度的2048点快速傅里叶变换处理器。提出了新型改良基-2^(6)算法用于降低硬件实现复杂度,采用多路径负反馈架构来提高数据吞吐量。为了减少硬件成本,采取正则有符号数常数乘法器替代布斯乘法器完成除旋转因子W_(2048)外所有旋转因子的复数乘法运算。另外,采用了一种减少存储旋转因子W_(2048)系数只读存储器空间的方法,将其存储空间减少为原来的一半。基于QUARTUS PRIME平台的仿真结果显示,工作频率为320 MHz时,最高数据吞吐速率达到了2.6 Gsample/s,而且对比以往的研究方案至少可节约逻辑单元使用量23%,记忆体单元使用量12%。 展开更多
关键词 无线个局域网(WPAN) 快速傅里叶变换处理器 多路径延迟负反馈(MDF)架构 改良基-2^(6)算法
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部