期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
用于MIMO检测的基于NoC的多核动态可重构架构
1
作者 范文杰 周牧也 +8 位作者 朱凌晓 李世平 陈铠 邓松峰 何国强 冯书谊 宋文清 李丽 傅玉祥 《现代电子技术》 北大核心 2024年第21期1-6,共6页
随着无线通信技术的发展,实现多输入多输出(MIMO)系统检测性能与复杂度之间的最优权衡日益困难,深度学习DL为此提供了新方向。文中提出基于片上网络(NoC)的多核动态可重构架构MCDBP,以提高基于DL的MIMO检测算法的性能,并增强架构的可编... 随着无线通信技术的发展,实现多输入多输出(MIMO)系统检测性能与复杂度之间的最优权衡日益困难,深度学习DL为此提供了新方向。文中提出基于片上网络(NoC)的多核动态可重构架构MCDBP,以提高基于DL的MIMO检测算法的性能,并增强架构的可编程性和扩展性。MCDBP通过集成轻量级计算内核及片上网络互连,并行处理矢量-矩阵乘法、常数-矢量乘法、矢量点积、矢量加法等大多数深度展开网络的基本运算,有效提高复杂MIMO检测性能。架构的创新在于可重构的处理元件PE设计,可以依据DL驱动的MIMO检测需求动态调整。该设计对基于DL的MIMO检测算法共性进行深入分析,支持多种基本运算模式,展现极高灵活性。实验结果显示,MCDBP在执行基于DL的MIMO检测算法时,与通用CPU相比,可以实现12.66~22.98的加速比,算法性能有所提高,可以适应不同应用场景。 展开更多
关键词 无线通信 MIMO检测 深度学习 数据驱动网络 模型驱动网络 NOC 可重构 多核架构
在线阅读 下载PDF
基于可重构计算的SAR成像与目标识别高性能实现方法
2
作者 纪津伦 宋雨龙 +3 位作者 李世平 邓松峰 何国强 傅玉祥 《现代雷达》 CSCD 北大核心 2024年第12期102-109,共8页
合成孔径雷达(SAR)广泛运用于军用与民用领域,常用于执行成像与目标识别任务。然而,SAR图像的成像与目标识别任务有着庞大的图像尺寸,其性能受到硬件资源的严重限制。文中立足于新兴的可重构计算技术,基于可重构计算芯片提出了SAR成像... 合成孔径雷达(SAR)广泛运用于军用与民用领域,常用于执行成像与目标识别任务。然而,SAR图像的成像与目标识别任务有着庞大的图像尺寸,其性能受到硬件资源的严重限制。文中立足于新兴的可重构计算技术,基于可重构计算芯片提出了SAR成像与目标识别系统的高性能实现方法。可重构计算芯片采用重构控制技术实现不同的计算与数据通路,兼具灵活性与高能效。文中选取线性调频变标算法与YOLOv3-tiny神经网络构建系统算法内核,针对SAR图像大尺寸的特点,在成像阶段提出了多核并行与内存规划方案,在目标识别阶段提出了图像分割策略和多核并行方案。文中的成像与目标识别系统经实验证明达到了显著的性能提升效果;在1000×1000大小图像成像方面取得了单张图66.8 ms的用时表现,优于Intel i5-12500的115 ms;在480×480大小图像识别方面取得31.3 ms的用时表现,优于Jetson nano的147 ms。 展开更多
关键词 合成孔径雷达信号处理 可重构计算 并行计算 线性调频变标成像算法 目标识别算法
在线阅读 下载PDF
超标量处理器中寄存器别名表恢复方法的改进研究 被引量:1
3
作者 杨思博 黎炜桁 +2 位作者 于敦山 祖靖昭 李世平 《计算机应用研究》 CSCD 北大核心 2022年第12期3701-3705,3712,共6页
寄存器重命名是超标量处理器用于提升指令集并行度的重要方法,其基本实现方式是通过寄存器别名表来记录逻辑寄存器和物理寄存器的映射关系,当发生分支预测错误时需要对寄存器别名表中的内容进行恢复。针对于现有的恢复方法没有利用重命... 寄存器重命名是超标量处理器用于提升指令集并行度的重要方法,其基本实现方式是通过寄存器别名表来记录逻辑寄存器和物理寄存器的映射关系,当发生分支预测错误时需要对寄存器别名表中的内容进行恢复。针对于现有的恢复方法没有利用重命名的局部性特征,在处理器的指令窗口增加时暴露出实现代价过大的问题,提出了一种基于区间进行寄存器别名表恢复的改进型恢复方法,通过对walk方法的改造,使用区间计分板来确定需要扫描的地址范围,并精确地控制每个区间的扫描,可以大大减小资源浪费。通过对逻辑综合结果和性能进行分析,相比于检查点恢复的传统设计,这种方法使用更少的面积和功耗,达到与检查点方式恢复接近的性能,也具有更好的扩展潜力。 展开更多
关键词 寄存器重命名 寄存器别名表 计分板 重命名历史扫描
在线阅读 下载PDF
基于ADRES处理器的并行FFT设计及实现
4
作者 李世平 陈铠 +2 位作者 陈晓东 周海斌 何国强 《现代雷达》 CSCD 北大核心 2022年第10期59-64,共6页
根据动态可重构嵌入式系统架构(ADRES)处理器单指令多数据流(SIMD)结构的特点,提出了一种基于SIMD的并行化快速傅里叶变换(FFT)算法,其在每个指令周期并行执行8个基4蝶形运算,同时将数据混洗和地址倒序操作嵌入向量蝶形运算过程中执行,... 根据动态可重构嵌入式系统架构(ADRES)处理器单指令多数据流(SIMD)结构的特点,提出了一种基于SIMD的并行化快速傅里叶变换(FFT)算法,其在每个指令周期并行执行8个基4蝶形运算,同时将数据混洗和地址倒序操作嵌入向量蝶形运算过程中执行,既保证了向量运算的并行度,也掩盖了FFT结果倒序所需的时间。该算法在ADRES处理器上实现,结果显示,与其他同等规模运算资源的处理器相比,处理性能达到1.1~10倍。 展开更多
关键词 并行FFT 单指令多数据流 向量蝶形运算
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部