期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
主动声呐实时信号处理算法的MPSoC优化实现
1
作者 邹佳运 师英杰 +2 位作者 吴永清 郝程鹏 王东辉 《系统工程与电子技术》 北大核心 2025年第10期3137-3147,共11页
针对水下无人航行器(underwater unmanned vehicle,UUV)主动声呐系统对信号处理实时性、能效比及集成度的需求,采用模块化设计以及软硬件协同设计思想,提出一种基于异构多处理器片上系统(multi-processor system on chip,MPSoC)的主动... 针对水下无人航行器(underwater unmanned vehicle,UUV)主动声呐系统对信号处理实时性、能效比及集成度的需求,采用模块化设计以及软硬件协同设计思想,提出一种基于异构多处理器片上系统(multi-processor system on chip,MPSoC)的主动声呐实时信号处理算法的加速方案。首先研究适合边缘端部署的声呐信号处理算法;然后设计基于MPSoC的加速计算结构,将数字下变频、逆/快速傅里叶变换、波束形成等具有高计算复杂性的处理步骤移植到可编程逻辑端,实现显著加速;最后将目标检测等复杂度较低的步骤部署在处理器系统端,实现更高的灵活性。仿真及湖上试验结果表明,提出的方案可在数据更新周期的41%时间内完成1帧回波数据的实时处理,并可在复杂水下环境下实时有效探测运动目标。该方案在水下UUV主动声呐探测领域具有广阔的应用前景。 展开更多
关键词 水下无人航行器 主动声呐 多处理器片上系统 实时信号处理 硬件加速
在线阅读 下载PDF
访存与用户行为敏感的MPSoC应用映射 被引量:3
2
作者 王一拙 左琦 +2 位作者 计卫星 王小军 石峰 《电子学报》 EI CAS CSCD 北大核心 2015年第4期631-638,共8页
应用映射是MPSo C设计中的关键问题,针对多应用负载的MPSo C,提出一种访存与用户行为敏感的动态映射策略,该策略根据应用的数据访问特征区分热点与非热点应用,并对用户行为进行建模,根据用户行为模型,进一步在运行时区分关键与非关键应... 应用映射是MPSo C设计中的关键问题,针对多应用负载的MPSo C,提出一种访存与用户行为敏感的动态映射策略,该策略根据应用的数据访问特征区分热点与非热点应用,并对用户行为进行建模,根据用户行为模型,进一步在运行时区分关键与非关键应用.对每个进入系统的应用,按照应用的热点及关键性分类动态选择在线映射算法,让热点应用围绕存储器布局,非热点应用尽量避免占用存储器附近的资源;对关键应用,最小化应用内通信开销和链路竞争,对非关键应用,最小化应用间通信开销和链路竞争.实验表明,与单纯考虑访存或用户行为的映射策略相比,本文策略能够降低系统整体的通信能耗. 展开更多
关键词 多处理器片上系统 片上网络 应用映射 任务映射
在线阅读 下载PDF
利用冗余核的MPSoC故障检测方法 被引量:2
3
作者 唐柳 黄樟钦 +2 位作者 侯义斌 方凤才 张会兵 《计算机应用》 CSCD 北大核心 2014年第1期41-45,共5页
在处理器可靠性研究中,为在容错机制部署与容错开销之间达到较好的平衡,提出一个利用冗余核进行检测代码计算任务的多处理器片上系统(MPSoC)故障检测方法。该方法利用多核系统天然的冗余特性,将用于进行故障检测的冗余代码中的大部分计... 在处理器可靠性研究中,为在容错机制部署与容错开销之间达到较好的平衡,提出一个利用冗余核进行检测代码计算任务的多处理器片上系统(MPSoC)故障检测方法。该方法利用多核系统天然的冗余特性,将用于进行故障检测的冗余代码中的大部分计算任务转移到冗余核中进行,检测软件控制流的正确性和数据的一致性,实现MPSoC的故障检测。所提方法无需添加额外硬件,通过指令级的冗余进行故障检测,可满足系统可靠性需求,同时又能减少面积开销,在性能方面和花销上做到有效的权衡。在一个MPSoC上对所提方法进行验证实验,通过故障注入,运行多个基准程序进行有效性验证,并将所提方法与几种具有代表性的软件检测硬件故障方法故障检测能力、面积、内存以及性能花销等方面进行比较,实验结果证明所提方法有效且能够在性能和花销之间取得较好的权衡。 展开更多
关键词 多处理器片上系统 可靠性 故障检测 冗余核 检测代码
在线阅读 下载PDF
基于MPSoC的遥感图像目标检测算法硬件加速研究 被引量:9
4
作者 李强 武文波 何明一 《航天返回与遥感》 CSCD 北大核心 2022年第1期58-68,共11页
遥感图像目标实时检测是遥感应用领域的关键技术问题之一。深度神经网络遥感图像目标检测准确率高,但此类网络通常结构复杂、参数多、计算量大,对计算资源和存储的需求较高,设计轻量化软硬件系统实现星载边缘端部署较为困难。针对上述问... 遥感图像目标实时检测是遥感应用领域的关键技术问题之一。深度神经网络遥感图像目标检测准确率高,但此类网络通常结构复杂、参数多、计算量大,对计算资源和存储的需求较高,设计轻量化软硬件系统实现星载边缘端部署较为困难。针对上述问题,文章提出了一种基于多处理器片上系统(MPSoC)现场可编程门阵列(FPGA)的遥感图像目标检测算法硬件加速方案。首先研究了适合星载边缘端部署的目标检测算法;然后设计了深度卷积神经网络并行加速计算结构和引擎,采用有限精度运算实现网络参数,使其数字量减少了75%,显著降低了计算和存储开销;最后基于MPSoC FPGA处理器实现了飞机目标检测的原型演示验证系统。实验结果表明,文章提出的遥感图像目标检测系统方案的目标检测精度可达92%以上;与基于嵌入式CPU、CPU、GPU的方案相比,单帧图像推理时间从100s、1000ms、100ms缩短至10ms级,可以满足遥感图像目标检测实时处理要求,具有一定的工程应用价值。 展开更多
关键词 目标检测 多处理器片上系统 现场可编程门阵列 深度卷积神经网络 嵌入式 硬件 加速 遥感应用
在线阅读 下载PDF
访存敏感的增量式MPSoC应用映射 被引量:1
5
作者 王一拙 左琦 +2 位作者 计卫星 王小军 石峰 《计算机研究与发展》 EI CSCD 北大核心 2015年第5期1198-1209,共12页
现代多处理器片上系统(multiprocessor system-on-chip,MPSoC)通常采用片上网络(networkon-chip,NoC)作为其基本互连结构,应用映射是基于片上网络互连的MPSoC设计中的关键问题,应用映射决定应用划分成的各个任务到片上网络节点的分配.... 现代多处理器片上系统(multiprocessor system-on-chip,MPSoC)通常采用片上网络(networkon-chip,NoC)作为其基本互连结构,应用映射是基于片上网络互连的MPSoC设计中的关键问题,应用映射决定应用划分成的各个任务到片上网络节点的分配.许多基于片上网络互连的MPSoC系统将共享存储作为网络中的独立节点,针对这类MPSoC系统,提出一种访存敏感的增量式动态映射策略.该策略离线分析获取应用的访存特征,运行中当应用到达系统时,根据其访存特征选择不同的映射算法,将热点应用围绕共享存储器布局,非热点应用远离共享存储器布局,并最小化应用间以及应用所含任务间的通信链路竞争.模拟实验表明:与贪恋区域选择加随机节点映射的策略相比较,提出的策略对系统整体通信功耗平均节约34.6%,性能提升可达36.3%,并能适应不同片上网络规模. 展开更多
关键词 多处理器片上系统 片上网络 应用映射 任务映射 访存敏感
在线阅读 下载PDF
基于FPGA面向多媒体处理的MPSoC 被引量:1
6
作者 李晶皎 陆振林 +1 位作者 王爱侠 王骄 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第4期486-490,共5页
针对嵌入式单核处理器处理速度慢及主频提升受限等问题,提出了嵌入式双核处理器(two-cores embedded processor,TEP)模型.针对处理器运行时对存储器的依赖和分配问题,提出了基于非统一存储结构模拟分布式存储结构的方案;针对多核间对共... 针对嵌入式单核处理器处理速度慢及主频提升受限等问题,提出了嵌入式双核处理器(two-cores embedded processor,TEP)模型.针对处理器运行时对存储器的依赖和分配问题,提出了基于非统一存储结构模拟分布式存储结构的方案;针对多核间对共享数据存储器的访存问题,给出了从属单元的仲裁机制,实现了共享资源的访问;针对面向多媒体应用的多核处理器间传输数据量大及通讯开销高的问题,提出了基于消息数据分离的传输方案.系统在FPGA平台进行了实现和验证,测试结果表明,TEP系统以较少的资源消耗和通讯开销获得了大加速比的性能. 展开更多
关键词 片上多处理器 嵌入式双核处理器 非统一存储结构 FPGA 消息数据分离
在线阅读 下载PDF
基于MPSoC的Sub-6 GHz频段SDR测试系统设计与实现 被引量:3
7
作者 黄继业 谢辉 董哲康 《实验室研究与探索》 CAS 北大核心 2022年第8期14-18,76,共6页
为实现5G高带宽信号的快速测试和复杂通信算法的快速验证,提出了一种基于MPSoC的Sub-6 GHz频段软件无线电(SDR)测试实验平台。平台采用Xilinx ZYNQ UltraScale~+MPSoC和射频收发器ADRV9009搭建,两者通过JESD204B高速串行接口进行数据流... 为实现5G高带宽信号的快速测试和复杂通信算法的快速验证,提出了一种基于MPSoC的Sub-6 GHz频段软件无线电(SDR)测试实验平台。平台采用Xilinx ZYNQ UltraScale~+MPSoC和射频收发器ADRV9009搭建,两者通过JESD204B高速串行接口进行数据流传输。采用软硬件协同设计思想,具备高可重构性和移植性,其中,硬件/PL逻辑部分负责射频信号到基带信号的转换与信号处理;软件部分依托Petalinux和Libiio的加持,可对测试系统进行全局控制。此外,该系统还拥有超宽调谐范围、可配置MIMO等优势,可作为5G SDR实验平台使用。经高带宽信号收发实验验证,该测试系统满足5G Sub-6 GHz信号收发链路要求,信道可靠性较高,在5G信号测试和算法原型验证方面,具有一定的应用价值。 展开更多
关键词 通信测试 单芯片集成多处理器片上系统 第五代移动通信技术 宽带收发器 软件无线电实验平台
在线阅读 下载PDF
一种异构多核系统动态调度协处理器设计
8
作者 曾树铭 倪伟 《合肥工业大学学报(自然科学版)》 北大核心 2025年第2期185-195,共11页
为研究异构多核片上系统(multi-processor system on chip,MPSoC)在密集并行计算任务中的潜力,文章设计并实现了一种适用于粗粒度数据特征、面向任务级并行应用的异构多核系统动态调度协处理器,采用了片上缓存、任务输出的多级写回管理... 为研究异构多核片上系统(multi-processor system on chip,MPSoC)在密集并行计算任务中的潜力,文章设计并实现了一种适用于粗粒度数据特征、面向任务级并行应用的异构多核系统动态调度协处理器,采用了片上缓存、任务输出的多级写回管理、任务自动映射、通讯任务乱序执行等机制。实验结果表明,该动态调度协处理器不仅能够实现任务级乱序执行等基本设计目标,还具有极低的调度开销,相较于基于动态记分牌算法的调度器,运行多个子孔径距离压缩算法的时间降低达17.13%。研究结果证明文章设计的动态调度协处理器能够有效优化目标场景下的任务调度效果。 展开更多
关键词 动态调度 硬件调度器 异构多核系统 任务级并行 编程模型 片上缓存 片上网络
在线阅读 下载PDF
MPSoc上动静态结合的SPM分配策略 被引量:3
9
作者 罗飞 过敏意 陈英 《计算机工程》 CAS CSCD 北大核心 2010年第21期275-276,279,共3页
基于片上多处理器系统,提出一种动静态结合的便签式内存分配策略,采用整数线性规划方法将全局变量静态地分配到SPM中,使用拓展的数据程序关系图来描述任务和数据,根据贪心算法将合适的局部变量动态的分配到SPM中。实验结果表明,该分配... 基于片上多处理器系统,提出一种动静态结合的便签式内存分配策略,采用整数线性规划方法将全局变量静态地分配到SPM中,使用拓展的数据程序关系图来描述任务和数据,根据贪心算法将合适的局部变量动态的分配到SPM中。实验结果表明,该分配策略比纯静态分配策略平均减少程序执行时间27%,比不使用SPM时减少35%。 展开更多
关键词 片上多处理器系统 便签式内存 调度
在线阅读 下载PDF
基于OpenCL的流式应用程序在MPSoC上的动态并行度伸缩调度
10
作者 黄姗 石晶林 萧放 《高技术通讯》 CSCD 北大核心 2016年第12期925-934,共10页
分析了嵌入式系统应用程序的复杂化和多样化趋势,面向嵌入式系统常见的流式应用程序,提出了基于开放运算语言(OpenCL)的统一编程框架,并在此框架的基础上设计一个运行时系统,在应用程序可用计算资源发生变化的场景下,该系统可在线调整... 分析了嵌入式系统应用程序的复杂化和多样化趋势,面向嵌入式系统常见的流式应用程序,提出了基于开放运算语言(OpenCL)的统一编程框架,并在此框架的基础上设计一个运行时系统,在应用程序可用计算资源发生变化的场景下,该系统可在线调整应用程序的并行度,并进行动态调度。实验结果显示,与已有的Flextream动态调度系统相比,该调度系统在性能上最高可以提场17%,在动态调度的时间开销上最多可以降低7%。 展开更多
关键词 多处理器片上系统(mpsoc) 开放运算语言(OpenCL) 编程框架 并行度伸缩 运行时系统
在线阅读 下载PDF
帮助线程预取技术研究综述 被引量:3
11
作者 张建勋 古志民 《计算机科学》 CSCD 北大核心 2013年第7期19-23,39,共6页
帮助线程预取是当前多核平台提高非规则数据密集应用预取效果性能的关键技术之一,近年来已成为国内外的研究热点。针对非规则数据密集应用访存规律的非连续局部性特征,帮助线程预取技术利用CMP平台的最后一级共享缓存(LLC)将应用的非连... 帮助线程预取是当前多核平台提高非规则数据密集应用预取效果性能的关键技术之一,近年来已成为国内外的研究热点。针对非规则数据密集应用访存规律的非连续局部性特征,帮助线程预取技术利用CMP平台的最后一级共享缓存(LLC)将应用的非连续局部性转换为瞬时的连续时空局部性(即时局部性),从而达到通过线程级数据预取提高程序性能的目的。归纳了帮助线程预取技术的分类,概括和比较了不同帮助线程实现技术的优势和局限性,深入分析和探讨了现有的几种典型帮助线程技术的预取控制策略。最后从帮助线程实时控制、参数动态选取和优化方面指出了帮助线程预取技术的研究方向。 展开更多
关键词 帮助线程 数据预取 CMP(chip multi-processor)平台 非规则数据密集应用
在线阅读 下载PDF
一种一维可重构计算系统模型的设计 被引量:1
12
作者 杜高明 张敏 +2 位作者 宋宇鲲 张多利 倪伟 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第1期61-64,共4页
文章提出了一种PE个数可配置的一维可重构计算系统模型,设计了PE间3种重构模式和PE内3种重构模式,大大简化了系统配置信息。建立C++描述的周期精确级系统模型,映射复数矩阵乘算法,分析比较不同PE内重构模式、同一PE内重构模式不同PE个... 文章提出了一种PE个数可配置的一维可重构计算系统模型,设计了PE间3种重构模式和PE内3种重构模式,大大简化了系统配置信息。建立C++描述的周期精确级系统模型,映射复数矩阵乘算法,分析比较不同PE内重构模式、同一PE内重构模式不同PE个数下系统的计算性能。实验结果表明,2-PE系统简单、灵活而高效。 展开更多
关键词 mpsoc 可重构计算 系统建模 可重构模式
在线阅读 下载PDF
基于共享存储器多处理器片上系统的互斥模型
13
作者 徐成 龙榜 +2 位作者 刘彦 陶海洋 王立东 《计算机应用研究》 CSCD 北大核心 2009年第12期4484-4487,共4页
在原有模型和算法分析的基础上,提出了一种共享存储器MPSOC互斥模型。该模型能适应各种互斥算法的描述、论证需求,能更好地描述任务优先级、实时性;能够适应区分处理器源任务的互斥算法(即区分对待来自不同处理器的任务);严格区分并发... 在原有模型和算法分析的基础上,提出了一种共享存储器MPSOC互斥模型。该模型能适应各种互斥算法的描述、论证需求,能更好地描述任务优先级、实时性;能够适应区分处理器源任务的互斥算法(即区分对待来自不同处理器的任务);严格区分并发性、并行性,描述更加精确;扩展了服务周期、事件之间关系;能够精确地量化互斥性能指标,以便更好地比较互斥算法优劣。最后,给出了该模型的一个简单实例,对模型应用提供指导。 展开更多
关键词 共享存储器 多处理器片上系统 互斥模型
在线阅读 下载PDF
多核SoC可扩展性设计技术研究
14
作者 杜高明 张多利 汤益华 《电子测量与仪器学报》 CSCD 2008年第6期33-37,共5页
近年来,使用多核SoC代替传统的单处理器系统,在提高系统并行性方面显示出了巨大的优势。本文在已有层次化总线结构MPSoC的基础上,研究多核SoC原型芯片可扩展性设计问题。在RTL级设计了上述平台,并用FPGA进行原型验证,以流水矩阵乘法为... 近年来,使用多核SoC代替传统的单处理器系统,在提高系统并行性方面显示出了巨大的优势。本文在已有层次化总线结构MPSoC的基础上,研究多核SoC原型芯片可扩展性设计问题。在RTL级设计了上述平台,并用FPGA进行原型验证,以流水矩阵乘法为例研究其在不同工作负载下的加速比变化。实验结果表明,在6个处理器的情形下,循环次数为6次时加速比仅为4.10;随着循环次数增多,加速比可达5.48。研究表明多核层次化总线原型芯片的性能提升百分比以及面积增加百分比与处理器数目成正比。可以通过增加处理器的数目来提升MPSoC原型芯片的性能。 展开更多
关键词 多核SoC 原型芯片 可扩展性设计 双层总线 加速比
在线阅读 下载PDF
多核片上系统主控式内存控制器预取
15
作者 李鹏 王剑 +1 位作者 曾露 王焕东 《高技术通讯》 EI CAS 北大核心 2019年第5期423-431,共9页
本文提出了一种多核片上系统(MPSoC)主控式内存控制器预取方法来解决多IP核导致内存控制器端预取资源竞争的问题。该方法综合考虑了不同访存流预取的及时性和访存冲突性,将预取数据及时性差的访存流进行过滤,使之在stream buffer资源紧... 本文提出了一种多核片上系统(MPSoC)主控式内存控制器预取方法来解决多IP核导致内存控制器端预取资源竞争的问题。该方法综合考虑了不同访存流预取的及时性和访存冲突性,将预取数据及时性差的访存流进行过滤,使之在stream buffer资源紧张的情况下不占用流缓冲空间,同时利用流缓冲地址记录表使得存在冲突的访存流优先使用stream buffer,进一步降低了访存冲突的概率。实验表明,该方法可以提升近20%的最大访存带宽,而对带宽需求小的访存IP核可以降低60%左右的访存延迟。 展开更多
关键词 多核片上系统(mpsoc) 及时性 访存冲突 预取 流缓冲
在线阅读 下载PDF
多核片上系统全局主动访存优化研究
16
作者 李鹏 曾露 +1 位作者 王焕东 章隆兵 《高技术通讯》 EI CAS 北大核心 2019年第3期203-212,共10页
本文提出了一种多核片上系统(MPSoC)全局主动访存调度优化方法(GPMS)来提升系统的访存性能。该方法利用IP(intellectual property)核的访存局部性和延迟容忍度,通过限制访存冲突的IP核使其在一个调度窗口内分别连续访问内存,从而减少访... 本文提出了一种多核片上系统(MPSoC)全局主动访存调度优化方法(GPMS)来提升系统的访存性能。该方法利用IP(intellectual property)核的访存局部性和延迟容忍度,通过限制访存冲突的IP核使其在一个调度窗口内分别连续访问内存,从而减少访存冲突次数,同时不存在访存冲突的IP核在调度窗口内一直保持内存的使用权,从而可以充分发挥内存控制器端访存队列调度的自由度和DRAM的bank级并行性。实验结果表明,当IP核间访存冲突严重时,该方法相比访存队列调度方式可以提升1到2倍的访存带宽。 展开更多
关键词 多核片上系统(mpsoc) 访存调度 访存局部性 延迟容忍度 服务质量
在线阅读 下载PDF
多处理器片上系统中一种结合二阶导数的温度预测模型 被引量:1
17
作者 魏琳 周磊 +1 位作者 吴宁 杨睛 《电子学报》 EI CAS CSCD 北大核心 2016年第6期1272-1278,共7页
区域温度预测是多处理器片上系统(Multi Processor System-on-Chips,MPSo Cs)高效散热的基础.本文以RC热传导(Thermal Resistance and Capacitance,Thermal RC)模型为基础,结合二阶导数提出了一种温度预测模型.该模型不仅可以在较低的... 区域温度预测是多处理器片上系统(Multi Processor System-on-Chips,MPSo Cs)高效散热的基础.本文以RC热传导(Thermal Resistance and Capacitance,Thermal RC)模型为基础,结合二阶导数提出了一种温度预测模型.该模型不仅可以在较低的运算复杂度下准确预测温度,而且能在固定的预测误差率范围内拓宽预测时间长度,进而减少模型在实际运行中被调用的次数,降低额外功耗.实验结果表明,相比现有的一次导数预测模型,在相同可接受误差率范围内,该模型能将预测时长拓宽至对比模型的1.6倍.同时,当预测时长拓展至2.5s时,该模型的预测准确率比对比模型高3.84%. 展开更多
关键词 多处理器片上系统(mpsocs) RC热传导模型 温度预测模型
在线阅读 下载PDF
基于有色Petri网的多处理器片上系统调度方法(英文)
18
作者 冯晓静 李曦 +2 位作者 王超 陈鹏 周学海 《中国科学技术大学学报》 CAS CSCD 北大核心 2014年第1期19-33,共15页
为了生成一个适用于多处理器片上系统的硬件调度器,提出一种新型的基于有色Petri网(CPN)的动态调度方法.该调度方法使用CPN对包括写后读、写后写、读后写数据相关以及结构相关在内的任务间相关性进行了建模,这些相关会在模型运行的过程... 为了生成一个适用于多处理器片上系统的硬件调度器,提出一种新型的基于有色Petri网(CPN)的动态调度方法.该调度方法使用CPN对包括写后读、写后写、读后写数据相关以及结构相关在内的任务间相关性进行了建模,这些相关会在模型运行的过程中被自动检测出来.根据相关性,任务会被动态地调度并分配到不同的计算单元上乱序执行,从而达到提高任务级并行度的目的.该调度方法分别在软件仿真平台和基于FPGA的硬件平台上得以实现.状态空间分析和对比实验的结果证明了调度方法的正确性和有效性. 展开更多
关键词 有色PETRI网 任务调度 多处理器片上系统 基于模型的设计方法
在线阅读 下载PDF
TriBA互联拓扑结构及其性能分析
19
作者 刘彩霞 石峰 +2 位作者 乔保军 HAROON Ur Rashid 宋红 《计算机工程》 CAS CSCD 北大核心 2010年第15期105-107,共3页
基于计算局域性原理提出评价网络性能的底层全互联率,利用该指标对TriBA拓扑结构的直接互联网络在计算速度、物理布局2个方面进行性能分析。结果表明,TriBA的底层全互连结构可降低网络复杂度、提高通信性能,对角线VLSI布局得到的功耗相... 基于计算局域性原理提出评价网络性能的底层全互联率,利用该指标对TriBA拓扑结构的直接互联网络在计算速度、物理布局2个方面进行性能分析。结果表明,TriBA的底层全互连结构可降低网络复杂度、提高通信性能,对角线VLSI布局得到的功耗相比2D Mesh结构节省了11%,该功耗优势在大规模片上多核系统中尤为明显。 展开更多
关键词 片上多核系统 TriBA拓扑结构 局域性 直接互联网络 VLSI布局
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部