期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
可重构的微分方程通用解算器研究和实现 被引量:1
1
作者 张多利 魏可 +3 位作者 胡永阳 聂言硕 侯宁 宋宇鲲 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2022年第3期336-341,355,共7页
基于经典微分方程数值解法四阶龙格-库塔法(fourth-order Runge-Kutta,RK4),文章提出一种可重构微分方程解算器(reconfigurable differential equation solver,RDES)。RDES采用可重构的计算原理,内部运算部件能够被映射为不同常微分方程... 基于经典微分方程数值解法四阶龙格-库塔法(fourth-order Runge-Kutta,RK4),文章提出一种可重构微分方程解算器(reconfigurable differential equation solver,RDES)。RDES采用可重构的计算原理,内部运算部件能够被映射为不同常微分方程(ordinary differential equation,ODE)的求解电路。RDES支持ODEs的快速批量求解,具有良好的通用性。几种实际应用的ODEs进行性能验证的实验结果表明,RDES能够求解不同结构、阶数、变量等条件的ODEs,且在批量计算中性能较通用处理器提升约10~120倍。 展开更多
关键词 龙格-库塔法 常微分方程(ODE) 微分方程组 可重构
在线阅读 下载PDF
新型两步式高精度TDC的设计 被引量:8
2
作者 庞高远 孟煦 +3 位作者 郭围围 尹勇生 邓红辉 陈红梅 《电子测量与仪器学报》 CSCD 北大核心 2021年第7期115-122,共8页
时间数字转换器(TDC)是一种常用的时间间隔测量电路,广泛用于飞行时间(ToF)测量,频率测量等领域。针对传统TDC分辨率与测量范围相互制约的问题,基于SMIC 55 nm CMOS工艺提出了一种兼顾分辨率与测量范围的两步式TDC结构。该TDC第1级使用... 时间数字转换器(TDC)是一种常用的时间间隔测量电路,广泛用于飞行时间(ToF)测量,频率测量等领域。针对传统TDC分辨率与测量范围相互制约的问题,基于SMIC 55 nm CMOS工艺提出了一种兼顾分辨率与测量范围的两步式TDC结构。该TDC第1级使用环形结构进行粗量化,以扩大测量范围;第2级利用延迟锁相环(DLL)结构精确控制压控延迟单元的延迟,以产生代表分辨率的延迟差,进而实现细量化,提高了分辨率。其中,设计了一种简便的时间余量求取算法,将第1级的粗量化误差准确传递到第2级。同时特别设计了第一级延迟单元的结构,以消除传统环形TDC中多路选择器(MUX)在信号循环过程中造成的延迟失配。仿真结果表明,该TDC的分辨率为4.8 ps,测量范围达到1.26μs,微分非线性(DNL)小于0.6 LSB,积分非线性(INL)小于1.8 LSB。 展开更多
关键词 时间数字转换器 两步式 分辨率 测量范围 余量求取
在线阅读 下载PDF
基于时间放大技术的时间数字转换器的设计 被引量:6
3
作者 郭围围 尹勇生 +3 位作者 龚号 孟煦 陈珍海 邓红辉 《电子测量与仪器学报》 CSCD 北大核心 2022年第4期98-105,共8页
本文基于时间放大技术设计了一种两步式的时间数字转换器(TDC),可应用于高精度的飞行测量领域。本设计采用SMIC 55 nm CMOS工艺,采用环形延时TDC作为粗量化电路,采用游标式TDC作为细量化电路。游标式TDC的精度受到延时失配限制,导致在... 本文基于时间放大技术设计了一种两步式的时间数字转换器(TDC),可应用于高精度的飞行测量领域。本设计采用SMIC 55 nm CMOS工艺,采用环形延时TDC作为粗量化电路,采用游标式TDC作为细量化电路。游标式TDC的精度受到延时失配限制,导致在设计时难以突破更高精度的要求。时间放大器通过放大粗量化产生的时间余量,并继续进行第二次细量化,降低了细量化电路的设计难度。针对传统时间放大器输入范围有限以及放大精确度不足的弊端,提出一种新的时间放大器结构,具有精确放大宽范围输入时间间隔的能力。仿真结果表明,采用该种时间放大器的TDC可实现的分辨率为3.7 ps,测量范围为80 ns,微分非线性(DNL)为0.73 LSB,积分非线性(INL)为0.95 LSB,该设计能够在高线性度下更好地兼顾TDC的分辨率与测量范围。 展开更多
关键词 时间数字转换器 分辨率 测量范围 时间放大器 时间余量
在线阅读 下载PDF
一种指令级动态可重构浮点处理器设计 被引量:1
4
作者 聂言硕 张多利 +2 位作者 孟晓飞 魏可 宋宇鲲 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2022年第10期1341-1347,共7页
针对高性能计算中非规则寻址模式任务的加速需求,文章设计了一种指令级动态可重构浮点处理器(dynamically reconfigurable floating-point processor, DRFP),区别于传统的可重构处理器,引入一种基于融合指令的实现方式,使得该处理器兼... 针对高性能计算中非规则寻址模式任务的加速需求,文章设计了一种指令级动态可重构浮点处理器(dynamically reconfigurable floating-point processor, DRFP),区别于传统的可重构处理器,引入一种基于融合指令的实现方式,使得该处理器兼具动态重构和乱序执行能力。该处理器作为主要计算核心集成于一款异构多核系统芯片,并在Xilinx Ultrascale系列xcvu440的FPGA芯片上进行了原型验证,系统可以稳定工作在120 MHz。实验结果表明,该处理器在兼顾高性能的同时相较于已有工作能更好地适应非规则运算,且性能提高近3倍。 展开更多
关键词 高性能计算 指令级 融合指令 乱序 多核系统
在线阅读 下载PDF
一种高速可配置二维CFAR检测器设计实现
5
作者 陶相颖 张多利 +2 位作者 刘文娟 倪伟 宋宇鲲 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2023年第5期627-631,677,共6页
恒虚警率(constant false alarm rate,CFAR)检测是雷达在干扰背景下检测目标的重要自适应算法。二维CFAR算法随着参考窗口尺寸增大,运算量较大,仅靠软件实现并不能满足较高的实时性需求。文章基于现场可编程门阵列(field programmable g... 恒虚警率(constant false alarm rate,CFAR)检测是雷达在干扰背景下检测目标的重要自适应算法。二维CFAR算法随着参考窗口尺寸增大,运算量较大,仅靠软件实现并不能满足较高的实时性需求。文章基于现场可编程门阵列(field programmable gate array,FPGA)设计实现了一种兼容CA-CFAR、GO-CFAR、SO-CFAR和OS-CFAR 4种二维CFAR算法的硬件加速器,同时实现标称化因子、检测器类型、排序值K、参考窗口和保护窗口大小可配置的灵活性,对于256×2048点距离-多谱勒矩阵(Range Doppler Matrix,RDM)数据,4种检测器均可在2.71 ms内完成检测。设计采用全流水结构,具有高实时性。 展开更多
关键词 雷达目标检测 二维恒虚警率(CFAR) 滑动窗口 硬件加速 矩形窗
在线阅读 下载PDF
多核SoC中外部存储器并行访存控制器设计
6
作者 王泽中 王春华 +1 位作者 王正茂 张多利 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2021年第10期1353-1358,共6页
当前外部存储器的带宽不断提高,文章针对多核片上系统(system-on-a-chip,SoC)工作过程中多个处理器核需要同时访问外部存储器的问题,设计了一种支持片内多运算单元并行访问同一外部存储器的接口结构。该并行访存控制器利用外部存储器与... 当前外部存储器的带宽不断提高,文章针对多核片上系统(system-on-a-chip,SoC)工作过程中多个处理器核需要同时访问外部存储器的问题,设计了一种支持片内多运算单元并行访问同一外部存储器的接口结构。该并行访存控制器利用外部存储器与单个运算单元间的带宽差异实现并行访存,针对任务访存特点,采用多种并行访存方式,使用两级仲裁结构对任务进行仲裁。经测试,在使用DDR3作为外部存储器时,满载情况下,该并行访存控制器对外部存储器的平均带宽利用率最高能够达到84.738%,实际任务执行过程中平均带宽利用率最高能够达到54.653%。 展开更多
关键词 多核系统 外部存储器 并行访存 时分复用 任务仲裁
在线阅读 下载PDF
一种高速2-D滑动FFT的设计实现
7
作者 许丁鸿 张多利 +2 位作者 陶相颖 韩帅鹏 宋宇鲲 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2023年第7期912-918,共7页
文章介绍了采用2-D快速傅里叶变换(fast Fourier transform,FFT)算法的滑动窗FFT的基本特性原理和硬件实现过程,完成了窗长256点、步长16点的2-D滑动窗FFT的专用集成电路(application specific integrated circuit,ASIC)设计。传统FFT... 文章介绍了采用2-D快速傅里叶变换(fast Fourier transform,FFT)算法的滑动窗FFT的基本特性原理和硬件实现过程,完成了窗长256点、步长16点的2-D滑动窗FFT的专用集成电路(application specific integrated circuit,ASIC)设计。传统FFT算法受序列完整性的制约,时滞较大,无法满足某些高实时性信号分析领域的处理速度要求。该文采用滑动FFT算法,克服了传统FFT对序列完整性的依赖,设计的滑动FFT处理器使用2-D FFT压缩新序列计算时间,以基16蝶形运算器为核心,采用系数复用和高基Booth方法优化系数编码技术压缩乘法器的数量,减少电路面积。所设计的2-D滑动FFT完成单次滑动窗长的计算时间比传统算法节约了16.1%,变换结果与MATLAB的运算结果相比,信噪比(signal-to-noise ratio,SNR)大于130 dB。在TSMC 28 nm的工艺下,工作主频为600 MHz,面积为1980μm×2060μm。 展开更多
关键词 快速傅里叶变换(FFT) 滑动FFT 2-D FFT算法 高基Booth编码
在线阅读 下载PDF
一种全数字前馈式时间交织模数转换器时间误差后台校准算法 被引量:3
8
作者 邓红辉 闫辉 +1 位作者 肖瑞 陈红梅 《电子与信息学报》 EI CSCD 北大核心 2020年第2期410-417,共8页
该文设计实现了一种全数字前馈式时间交织模数转换器(TIADC)时间误差校准算法,其中采样时间误差提取采用改进的时间误差函数求导模块的前馈式提取方法,可以提高在输入信号频率较高时误差提取的准确度;同时,为了降低误差提取单元的复杂性... 该文设计实现了一种全数字前馈式时间交织模数转换器(TIADC)时间误差校准算法,其中采样时间误差提取采用改进的时间误差函数求导模块的前馈式提取方法,可以提高在输入信号频率较高时误差提取的准确度;同时,为了降低误差提取单元的复杂性,采用了以减法实现的时间误差函数;最后,采用基于1阶泰勒补偿完成时间误差的实时校正。仿真验证表明,应用于4通道14位TIADC系统,当输入信号为多频信号时,系统动态性能无杂散动态范围(SFDR)从48.6 dB提高到80.7 dB。与传统基于前馈校准结构对比,可以将有效校准输入信号带宽从0.19提高到0.39,提高了校准算法的应用范围。 展开更多
关键词 时间交织模数转换器 时间误差数字校准 前馈式 时间误差函数
在线阅读 下载PDF
一种多核系统任务扰动迭代算法 被引量:1
9
作者 张多利 廖金月 +2 位作者 罗乐 倪伟 宋宇鲲 《电子测量与仪器学报》 CSCD 北大核心 2020年第9期133-139,共7页
任务调度问题是多核处理器相关技术的一个重要组成部分。基于列表的调度算法因其低复杂度和高效率得到广泛关注,但确定任务优先级列表方法的单一性使得算法对解空间搜索不够,易陷入局部最优。为此,提出一种基于任务扰动的迭代型列表调... 任务调度问题是多核处理器相关技术的一个重要组成部分。基于列表的调度算法因其低复杂度和高效率得到广泛关注,但确定任务优先级列表方法的单一性使得算法对解空间搜索不够,易陷入局部最优。为此,提出一种基于任务扰动的迭代型列表调度算法(task perturbation iteration algorithm, TPIA)。该算法通过选取任务扰动因子按照一定扰动策略进行调度列表迭代,对迭代后的列表进行贪心选择,生成更优的调度列表序列以得到更好的调度结果。通过实例和随机有向无环图(DAG)有限集对算法进行验证,结果表明算法能有效改善调度解,调度性能提升平均可达16.51%,适宜处理大规模、高出入度的复杂DAG图;针对TPIA算法在低任务总数高通讯开销情况下性能有所下降的问题,对平均任务节点数130以下的任务图进行分组测试,获得了对应的CCR上界值及其变化趋势。 展开更多
关键词 静态任务 调度算法 扰动因子 扰动策略 搜索空间
在线阅读 下载PDF
硅通孔负载全局均衡的3D NoC延迟上界优化方法
10
作者 王晓蕾 胡巧 +2 位作者 杜高明 张多利 欧阳一鸣 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第2期270-275,共6页
针对三维片上网络(3D No C)中硅通孔(TSV)的特殊结构,提出了一种3D No C延迟上界优化方法,通过全局均衡硅通孔负载,降低全局业务流的延迟上界.建立3D No C的网格通信模型,搜索网络中所有业务流的可行路径,提出一种基于度的冲突矩阵,求... 针对三维片上网络(3D No C)中硅通孔(TSV)的特殊结构,提出了一种3D No C延迟上界优化方法,通过全局均衡硅通孔负载,降低全局业务流的延迟上界.建立3D No C的网格通信模型,搜索网络中所有业务流的可行路径,提出一种基于度的冲突矩阵,求出目标子流路径的TSV冲突系数,按照路径中TSV冲突系数的大小把目标流流量分配到部分最优路径上.实验结果表明,基于度的冲突矩阵可以有效减少存储空间,将存储复杂度从O(n2)降低到O(n),并且可以清晰直观地表现出业务流在网络中的冲突情况.采用硅通孔负载全局均衡的3D No C延迟上界优化方法,目标业务流的延迟上界得到了显著优化,最大的优化效果可将延迟上界降低58.9%. 展开更多
关键词 三维片上网络 延迟上界 负载全局均衡 冲突矩阵
在线阅读 下载PDF
误差提取自适应修正的前馈式TIADC校准算法 被引量:6
11
作者 闫辉 邓红辉 +3 位作者 万祝娟 孙康康 陈红梅 尹勇生 《电子测量与仪器学报》 CSCD 北大核心 2019年第6期171-176,共6页
在纯数字域设计实现了一种针对时间交织模数转换器采样时间失配误差的前馈式校准算法。定义了一种误差提取函数,并针对其导数求算中存在的误差提出了自适应的修正方法,从而提高在输入信号频率较高时误差提取的准确度;为了降低误差提取... 在纯数字域设计实现了一种针对时间交织模数转换器采样时间失配误差的前馈式校准算法。定义了一种误差提取函数,并针对其导数求算中存在的误差提出了自适应的修正方法,从而提高在输入信号频率较高时误差提取的准确度;为了降低误差提取单元的复杂性,采用了以减法实现的误差提取函数和基于LMS的除法器;采用基于一阶泰勒补偿的方式完成时间失配误差的实时校正。仿真结果表明,应用于4通道14 bit时间交织模数转换器(TIADC)系统,当输入信号为多频信号时,系统动态性能无杂散动态范围(SFDR)从48. 6 dB提高到80. 7 dB。与传统基于前馈校准结构对比,可以将输入信号带宽从0. 19提高到0. 39,提高了校准算法的应用范围。 展开更多
关键词 时间交织模数转换器 数字校准 前馈式 时间误差函数 除法器
在线阅读 下载PDF
基于参考通道随机化的TIADC校准算法 被引量:7
12
作者 肖瑞 陈红梅 +3 位作者 王舰 谢熙明 王兰雨 尹勇生 《电子测量与仪器学报》 CSCD 北大核心 2021年第6期147-153,共7页
提出了一种针对时间交织模数转换器(time interleaved ADC,TI-ADC)通道间失配误差的基于参考通道的后台校准算法。该算法利用参考通道与同采样时刻TI-ADC子通道ADC输出差值估计待校准子ADC的失配误差,然后从系统输出中减之实现自适应误... 提出了一种针对时间交织模数转换器(time interleaved ADC,TI-ADC)通道间失配误差的基于参考通道的后台校准算法。该算法利用参考通道与同采样时刻TI-ADC子通道ADC输出差值估计待校准子ADC的失配误差,然后从系统输出中减之实现自适应误差补偿;为了克服当TI-ADC系统前端不存在单独输入缓冲器时,参考ADC通过输入网络耦合对TI-ADC产生干扰问题,进一步加入随机化技术,减少残余失配误差产生毛刺;该校准系统可以实现3种主要失配误差的同时有效校准,对输入信号带宽没有限制。应用于12位1 GS/s TI-ADC系统,当输入信号频率为470 MHz时,FPGA验证结果表明,校准后无杂散动态范围(SFDR)提升了44.14 dB,达到76.16 dB。 展开更多
关键词 时间交织ADC 回踢干扰 随机化 参考通道
在线阅读 下载PDF
一种适用于多频输入的TIADC时间失配误差校准方法 被引量:6
13
作者 甘凌浩 尹勇生 +3 位作者 孙康康 万祝娟 闫辉 陈红梅 《电子测量与仪器学报》 CSCD 北大核心 2019年第10期134-141,共8页
针对时间交织模数转换器(TIADC)通道间存在的采样时间失配误差问题,提出了一种基于劈分互质通道组的全数字校准方法。该方法从参考通道的角度展开分析,使用了一种适用性广、推导过程简单的采样时间失配误差提取方法。分析了输入多频信号... 针对时间交织模数转换器(TIADC)通道间存在的采样时间失配误差问题,提出了一种基于劈分互质通道组的全数字校准方法。该方法从参考通道的角度展开分析,使用了一种适用性广、推导过程简单的采样时间失配误差提取方法。分析了输入多频信号时,使用三点或五点求导法的泰勒补偿校准效果较差的问题根源,并提出了一种适用于劈分互质通道组的无导数插值补偿方法。建立了一个1 GS/s的12位TIADC模型进行仿真验证,当多频输入包含10个在奈奎斯特频率范围内平均分布的频率点时,校准后的SFDR提升了28.51dB,与使用五点求导法的一阶泰勒补偿相比改善了22.85dB。 展开更多
关键词 时间交织模数转换器 时间失配 劈分 多频
在线阅读 下载PDF
适用于TIADC时间误差校准的斩波调制算法 被引量:6
14
作者 万祝娟 尹勇生 +3 位作者 庞高远 刘涛 谢熙明 陈红梅 《电子测量与仪器学报》 CSCD 北大核心 2020年第5期112-121,共10页
传统的时间交织模数转换器(TIADC)时间误差斩波调制校准算法无法向多通道推广,改进的时间误差斩波调制校准算法将单通道与相邻通道输出相加后分别斩波再求和来提取出时间误差,使其能适用于任意通道误差的提取,时间误差补偿采用一阶泰勒... 传统的时间交织模数转换器(TIADC)时间误差斩波调制校准算法无法向多通道推广,改进的时间误差斩波调制校准算法将单通道与相邻通道输出相加后分别斩波再求和来提取出时间误差,使其能适用于任意通道误差的提取,时间误差补偿采用一阶泰勒近似来实现,避免了传统算法中复杂滤波器设计。然而,当输入信号频率超过子通道奈奎斯特频率时,校准算法的校准方向会出错,从而导致校准失败。因此,设计了一种校准方向修正算法,能够满足整个系统奈奎斯特频率范围内的有效校准。仿真结果表明,应用于一个4通道、1 GS/s、12位的TIADC,当输入信号频率为450 MHz时,系统的信号噪声畸变比(SNDR)由28.4提高到73.1 dB,系统的无杂散动态范围(SFDR)由30.7提高到88.9 dB。 展开更多
关键词 时间交织模数转换器 数字校准 时间失配
在线阅读 下载PDF
适用于宽带宽输入的TIADC时间误差校准算法 被引量:3
15
作者 张宇航 孙康康 +2 位作者 李琨 万祝娟 尹勇生 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2021年第9期1204-1209,共6页
文章设计了一种适用于宽带宽输入的时间交织模数转换器(time-interleaved analog-to-digital converters,TIADC)时间失配误差校准算法。从通道间的相乘互相关原理展开分析,引入误差符号判别模块实现任意输入带宽的TIADC时间失配误差提... 文章设计了一种适用于宽带宽输入的时间交织模数转换器(time-interleaved analog-to-digital converters,TIADC)时间失配误差校准算法。从通道间的相乘互相关原理展开分析,引入误差符号判别模块实现任意输入带宽的TIADC时间失配误差提取。误差补偿模块采用一种改进的基于泰勒级数展开的误差校准方法,进一步减小硬件实现规模。误差提取与误差补偿模块组成闭环自适应结构,能够实时进行宽带宽输入的TIADC时间失配误差校准。利用一个4通道12位的TIADC进行验证,假设通道间存在3%T_(s)(T_(s)为采样时间)以内的时间失配误差,当输入归一化频率f_(in)/f_(s)(f_(in)为输入频率,f_(s)为采样频率)分别为0.406、0.813、1.321时,校准后系统的信噪比提高了43 dB以上,有效位数(effective number of bits,ENOB)提高到11.82 bit以上。仿真结果证明了该方案的有效性。 展开更多
关键词 时间交织模数转换器(TIADC) 宽带宽输入 通道互相关 误差符号判断 泰勒级数展开
在线阅读 下载PDF
一种抗噪声折叠宽范围低杂散小数分频锁相环
16
作者 蔡剑茹 尹勇生 +2 位作者 滕海林 杨文杰 孟煦 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2023年第12期1666-1670,1693,共6页
由于电荷泵的电流失配,小数分频锁相环反馈路径上经整形的量化噪声会被折叠回低频偏处,恶化带内相位噪声的性能。文章提出一种自适应的抗噪声折叠技术,根据工作频率产生合适脉宽的电流以线性化环路,在全频带内避免噪声折叠的同时不恶化... 由于电荷泵的电流失配,小数分频锁相环反馈路径上经整形的量化噪声会被折叠回低频偏处,恶化带内相位噪声的性能。文章提出一种自适应的抗噪声折叠技术,根据工作频率产生合适脉宽的电流以线性化环路,在全频带内避免噪声折叠的同时不恶化参考杂散性能;设计基于TSMC 130 nm CMOS工艺,锁相环覆盖的输出频率范围为0.6~2.7 GHz。仿真结果显示:当输出频率为2.0 GHz时,环路功耗为16 mW,积分抖动为1.98 ps,品质因数为-222 dB;在电荷泵中引入8%的失配后,提出的技术改善带内相位噪声达到7 dB。 展开更多
关键词 小数分频锁相环 噪声折叠 带内相位噪声 参考杂散 低抖动
在线阅读 下载PDF
一种基于变容管偏置的温度补偿LC振荡器
17
作者 张麒 尹勇生 +1 位作者 许江超 孟煦 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2023年第8期1086-1091,共6页
文章介绍一种用于在宽温度范围内产生稳定时钟信号的温度补偿振荡器。该振荡器基于温度对控制电压的影响改变偏置变容管的容值,补偿因温度变化引起的振荡器频率变化,使整个振荡器的温度系数(temperature coefficient,TC)为0。另外,在通... 文章介绍一种用于在宽温度范围内产生稳定时钟信号的温度补偿振荡器。该振荡器基于温度对控制电压的影响改变偏置变容管的容值,补偿因温度变化引起的振荡器频率变化,使整个振荡器的温度系数(temperature coefficient,TC)为0。另外,在通过分频产生几十兆赫兹频率的同时,振荡器的相位噪声性能得到进一步优化。该文在SMIC 180 nm CMOS工艺下完成整体电路的设计与仿真。后仿真结果显示,在1.8 V电源下整体功耗为7.12 mW,中心振荡频率2.4002 GHz处的频率漂移可达到8.68×10^(-6)℃^(-1),经过分频后得到的30 MHz信号在10 kHz偏移下的相位噪声大小为-112.923 dBc/Hz。 展开更多
关键词 LC振荡器 宽温度范围 温度补偿 分频 相位噪声
在线阅读 下载PDF
64位双精度矩阵分解的优化和硬件实现
18
作者 邱俊豪 宋宇鲲 +1 位作者 陈文杰 侯宁 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2021年第12期1640-1645,共6页
矩阵分解是线性代数中最重要的运算之一,广泛应用于现代通讯和控制。文章提出一种针对浮点矩阵的GR-QR(Givens rotation QR)分解一维线性结构,利用GR-QR分解运算过程中的并行特点,提高运算资源利用率,实现任意阶浮点矩阵分解,并设计实... 矩阵分解是线性代数中最重要的运算之一,广泛应用于现代通讯和控制。文章提出一种针对浮点矩阵的GR-QR(Givens rotation QR)分解一维线性结构,利用GR-QR分解运算过程中的并行特点,提高运算资源利用率,实现任意阶浮点矩阵分解,并设计实现了基于此结构的矩阵分解电路,该电路支持2-32阶双精度浮点矩阵的直接分解。在TSMC28 nm工艺,QR分解器的工作主频为700 MHz,面积为2 mm^(2),计算精度达到10^(-15),性能是1.6 GHz RTX2070的95倍。 展开更多
关键词 QR分解 Givens旋转 ASIC实现 硬件加速 一维线性结构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部