期刊文献+
共找到99篇文章
< 1 2 5 >
每页显示 20 50 100
主动声呐实时信号处理算法的MPSoC优化实现
1
作者 邹佳运 师英杰 +2 位作者 吴永清 郝程鹏 王东辉 《系统工程与电子技术》 北大核心 2025年第10期3137-3147,共11页
针对水下无人航行器(underwater unmanned vehicle,UUV)主动声呐系统对信号处理实时性、能效比及集成度的需求,采用模块化设计以及软硬件协同设计思想,提出一种基于异构多处理器片上系统(multi-processor system on chip,MPSoC)的主动... 针对水下无人航行器(underwater unmanned vehicle,UUV)主动声呐系统对信号处理实时性、能效比及集成度的需求,采用模块化设计以及软硬件协同设计思想,提出一种基于异构多处理器片上系统(multi-processor system on chip,MPSoC)的主动声呐实时信号处理算法的加速方案。首先研究适合边缘端部署的声呐信号处理算法;然后设计基于MPSoC的加速计算结构,将数字下变频、逆/快速傅里叶变换、波束形成等具有高计算复杂性的处理步骤移植到可编程逻辑端,实现显著加速;最后将目标检测等复杂度较低的步骤部署在处理器系统端,实现更高的灵活性。仿真及湖上试验结果表明,提出的方案可在数据更新周期的41%时间内完成1帧回波数据的实时处理,并可在复杂水下环境下实时有效探测运动目标。该方案在水下UUV主动声呐探测领域具有广阔的应用前景。 展开更多
关键词 水下无人航行器 主动声呐 多处理器片上系统 实时信号处理 硬件加速
在线阅读 下载PDF
嵌入式MPSoC的调试功能实现 被引量:8
2
作者 成杏梅 刘鹏 +2 位作者 钟耿 王小航 姚庆栋 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2008年第4期438-445,共8页
从软件角度讨论了嵌入式MPSoC的调试功能实现.在实时操作系统中设置了调试管理部分,通过构建操作系统的调试进程实现相应的调试功能,实现的调试功能模块包括相应的调试命令集规范、输入/输出模块及执行命令模块.实时操作系统驻住在MPSo... 从软件角度讨论了嵌入式MPSoC的调试功能实现.在实时操作系统中设置了调试管理部分,通过构建操作系统的调试进程实现相应的调试功能,实现的调试功能模块包括相应的调试命令集规范、输入/输出模块及执行命令模块.实时操作系统驻住在MPSoC的主控芯片上,通过将执行命令模块放置到不同的处理器核上实现调试各核及核上程序的功能.为了保证操作系统自身功能正确,首先通过硬件EJTAG模块调试操作系统本身,并开发了相应的软件RDView;然后使用操作系统的调试管理部分实现调试本机及其他处理器核上应用程序的执行状况.基于软件实现的调试管理功能以较小的内存代价,方便、有效地实现了MPSoC的调试功能. 展开更多
关键词 实时操作系统 片上多核系统 调试管理
在线阅读 下载PDF
利用冗余核的MPSoC故障检测方法 被引量:2
3
作者 唐柳 黄樟钦 +2 位作者 侯义斌 方凤才 张会兵 《计算机应用》 CSCD 北大核心 2014年第1期41-45,共5页
在处理器可靠性研究中,为在容错机制部署与容错开销之间达到较好的平衡,提出一个利用冗余核进行检测代码计算任务的多处理器片上系统(MPSoC)故障检测方法。该方法利用多核系统天然的冗余特性,将用于进行故障检测的冗余代码中的大部分计... 在处理器可靠性研究中,为在容错机制部署与容错开销之间达到较好的平衡,提出一个利用冗余核进行检测代码计算任务的多处理器片上系统(MPSoC)故障检测方法。该方法利用多核系统天然的冗余特性,将用于进行故障检测的冗余代码中的大部分计算任务转移到冗余核中进行,检测软件控制流的正确性和数据的一致性,实现MPSoC的故障检测。所提方法无需添加额外硬件,通过指令级的冗余进行故障检测,可满足系统可靠性需求,同时又能减少面积开销,在性能方面和花销上做到有效的权衡。在一个MPSoC上对所提方法进行验证实验,通过故障注入,运行多个基准程序进行有效性验证,并将所提方法与几种具有代表性的软件检测硬件故障方法故障检测能力、面积、内存以及性能花销等方面进行比较,实验结果证明所提方法有效且能够在性能和花销之间取得较好的权衡。 展开更多
关键词 多处理器片上系统 可靠性 故障检测 冗余核 检测代码
在线阅读 下载PDF
基于FPGA面向多媒体处理的MPSoC 被引量:1
4
作者 李晶皎 陆振林 +1 位作者 王爱侠 王骄 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第4期486-490,共5页
针对嵌入式单核处理器处理速度慢及主频提升受限等问题,提出了嵌入式双核处理器(two-cores embedded processor,TEP)模型.针对处理器运行时对存储器的依赖和分配问题,提出了基于非统一存储结构模拟分布式存储结构的方案;针对多核间对共... 针对嵌入式单核处理器处理速度慢及主频提升受限等问题,提出了嵌入式双核处理器(two-cores embedded processor,TEP)模型.针对处理器运行时对存储器的依赖和分配问题,提出了基于非统一存储结构模拟分布式存储结构的方案;针对多核间对共享数据存储器的访存问题,给出了从属单元的仲裁机制,实现了共享资源的访问;针对面向多媒体应用的多核处理器间传输数据量大及通讯开销高的问题,提出了基于消息数据分离的传输方案.系统在FPGA平台进行了实现和验证,测试结果表明,TEP系统以较少的资源消耗和通讯开销获得了大加速比的性能. 展开更多
关键词 片上多处理器 嵌入式双核处理器 非统一存储结构 FPGA 消息数据分离
在线阅读 下载PDF
面向异构MPSoC的多媒体应用程序任务分配方法 被引量:1
5
作者 赵鹏 沈弼龙 +2 位作者 王大伟 熊志輝 李思昆 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第10期1671-1678,共8页
任务分配是多处理器SoC功能实现与性能优化的重要步骤,严重影响着多处理器SoC系统的处理性能与效率.文中针对多媒体应用程序向异构多处理器SoC的任务分配问题,提出图结点多着色模型来描述任务分配问题,并使用进化蚁群算法进行任务分配.... 任务分配是多处理器SoC功能实现与性能优化的重要步骤,严重影响着多处理器SoC系统的处理性能与效率.文中针对多媒体应用程序向异构多处理器SoC的任务分配问题,提出图结点多着色模型来描述任务分配问题,并使用进化蚁群算法进行任务分配.在任务分配的过程中,首先对多媒体应用进行预处理,包括应用特征分析、并行任务划分与功能模型生成;然后启动进化蚁群算法进行分配空间探索,直至找到满足条件的高质量任务分配方案.实验结果表明,相对于采用基本蚁群算法与遗传算法的任务分配方法,文中方法可以获得高质量的分配方案,并较大幅度地加快了任务分配空间探索的收敛速度. 展开更多
关键词 多处理器片上系统 任务分配 多媒体处理 蚁群优化算法 遗传算法
在线阅读 下载PDF
基于MPSoC的Sub-6 GHz频段SDR测试系统设计与实现 被引量:3
6
作者 黄继业 谢辉 董哲康 《实验室研究与探索》 CAS 北大核心 2022年第8期14-18,76,共6页
为实现5G高带宽信号的快速测试和复杂通信算法的快速验证,提出了一种基于MPSoC的Sub-6 GHz频段软件无线电(SDR)测试实验平台。平台采用Xilinx ZYNQ UltraScale~+MPSoC和射频收发器ADRV9009搭建,两者通过JESD204B高速串行接口进行数据流... 为实现5G高带宽信号的快速测试和复杂通信算法的快速验证,提出了一种基于MPSoC的Sub-6 GHz频段软件无线电(SDR)测试实验平台。平台采用Xilinx ZYNQ UltraScale~+MPSoC和射频收发器ADRV9009搭建,两者通过JESD204B高速串行接口进行数据流传输。采用软硬件协同设计思想,具备高可重构性和移植性,其中,硬件/PL逻辑部分负责射频信号到基带信号的转换与信号处理;软件部分依托Petalinux和Libiio的加持,可对测试系统进行全局控制。此外,该系统还拥有超宽调谐范围、可配置MIMO等优势,可作为5G SDR实验平台使用。经高带宽信号收发实验验证,该测试系统满足5G Sub-6 GHz信号收发链路要求,信道可靠性较高,在5G信号测试和算法原型验证方面,具有一定的应用价值。 展开更多
关键词 通信测试 单芯片集成多处理器片上系统 第五代移动通信技术 宽带收发器 软件无线电实验平台
在线阅读 下载PDF
MPSoC在多轴伺服电机驱动器上的应用 被引量:1
7
作者 王邦继 王东 +2 位作者 许睿 张文轩 刘庆想 《电机与控制学报》 EI CSCD 北大核心 2021年第12期19-26,共8页
针对单块芯片难以实现多轴伺服电机的独立、同步驱动控制问题,提出一种基于多处理器片上系统(MPSoC)的多轴伺服电机驱动控制方案。首先,采用软硬件协同设计技术实现单轴伺服电机的速度与电流环控制,将具有高实时性、控制算法相对单一的... 针对单块芯片难以实现多轴伺服电机的独立、同步驱动控制问题,提出一种基于多处理器片上系统(MPSoC)的多轴伺服电机驱动控制方案。首先,采用软硬件协同设计技术实现单轴伺服电机的速度与电流环控制,将具有高实时性、控制算法相对单一的电流矢量控制算法以及信号采集和处理算法采用纯硬件逻辑实现,而具有强灵活性的速度环算法采用软件方式实现;其次,采用MPSoC的设计方法,在单片现场可编程门阵列(FPGA)之中集成了主控制器、多路单轴伺服驱动控制模块、网络通信等功能模块,构建了多轴伺服电机驱动控制片上系统;最后,搭建了两路实验系统,并进行了实验验证。实验结果表明,该方案可实现对两(多)路伺服电机的独立、同步驱动控制,电流环具有延时小,速度环具有响应快、滞后小的特征,验证了该方案的可行性与有效性。 展开更多
关键词 伺服电机 多轴伺服驱动 矢量控制 多处理器片上系统 现场可编程门阵列 软硬件协同设计
在线阅读 下载PDF
一种异构多核系统动态调度协处理器设计
8
作者 曾树铭 倪伟 《合肥工业大学学报(自然科学版)》 北大核心 2025年第2期185-195,共11页
为研究异构多核片上系统(multi-processor system on chip,MPSoC)在密集并行计算任务中的潜力,文章设计并实现了一种适用于粗粒度数据特征、面向任务级并行应用的异构多核系统动态调度协处理器,采用了片上缓存、任务输出的多级写回管理... 为研究异构多核片上系统(multi-processor system on chip,MPSoC)在密集并行计算任务中的潜力,文章设计并实现了一种适用于粗粒度数据特征、面向任务级并行应用的异构多核系统动态调度协处理器,采用了片上缓存、任务输出的多级写回管理、任务自动映射、通讯任务乱序执行等机制。实验结果表明,该动态调度协处理器不仅能够实现任务级乱序执行等基本设计目标,还具有极低的调度开销,相较于基于动态记分牌算法的调度器,运行多个子孔径距离压缩算法的时间降低达17.13%。研究结果证明文章设计的动态调度协处理器能够有效优化目标场景下的任务调度效果。 展开更多
关键词 动态调度 硬件调度器 异构多核系统 任务级并行 编程模型 片上缓存 片上网络
在线阅读 下载PDF
三模冗余MPSOC容错设计与验证 被引量:2
9
作者 陈陈 杨孟飞 刘鸿瑾 《空间控制技术与应用》 2012年第4期45-50,共6页
为了提高MPSOC处理器的可靠性,提出了一种基于软件表决和硬件仲裁的三模冗余容错处理器设计方案,并对这种容错设计进行了原型实现和验证,试验结果表明了方案的正确性和有效性.
关键词 片上系统 多核处理器 三模冗余 容错
在线阅读 下载PDF
基于节点预测的直接Cache一致性协议 被引量:33
10
作者 张骏 田泽 +1 位作者 梅魁志 赵季中 《计算机学报》 EI CSCD 北大核心 2014年第3期700-720,共21页
处理器性能的提升依赖于对存储系统性能的挖掘.随着片上集成内核数量的不断增大和特征尺寸的持续缩小,延迟、存储可扩展的Cache一致性协议已经成为提升访存效率的关键性因素.文中提出一种基于节点预测的直接Cache一致性协议-NPP协议... 处理器性能的提升依赖于对存储系统性能的挖掘.随着片上集成内核数量的不断增大和特征尺寸的持续缩小,延迟、存储可扩展的Cache一致性协议已经成为提升访存效率的关键性因素.文中提出一种基于节点预测的直接Cache一致性协议-NPP协议,研究一致性交互延迟隐藏和目录存储开销减少技术.针对读、写缺失中存在的间接性问题和现有解决方案破坏已有数据局部性、无法获得最近数据副本等问题,分别提出节点挂起技术和直接写缺失处理技术,有效隐藏了目录访问延迟.为了实现准确的节点预测,作者还提出基于“签名”回收的历史信息更新算法,避免了冗余更新和不完整更新.使用SPLASH-2测试程序集,在基于2DMESHNoC互联的64核CMP下,相对于全映射目录协议,NPP协议的平均执行时间降幅为21.78%~31.11%;平均读缺失延迟降低14.22%~18.9%;平均写缺失延迟降低17.89%~21.13%.而获得上述性能提升的代价是网络流量平均增加6.62%~7.28%. 展开更多
关键词 单芯片多处理器(CMP) 预测 一致性协议 目录 可扩展中图法
在线阅读 下载PDF
龙芯3号互联系统的设计与实现 被引量:23
11
作者 王焕东 高翔 +1 位作者 陈云霁 胡伟武 《计算机研究与发展》 EI CSCD 北大核心 2008年第12期2001-2010,共10页
龙芯3号的互联结构设计采用了一种基于二维Mesh的可伸缩分布式多核结构,可为芯片级、主板级和系统级的互联提供统一的拓扑结构和逻辑设计.龙芯3号的对外接口采用扩展的HyperTransport协议,既可以用于连接IO,又可以实现多芯片的互联.在龙... 龙芯3号的互联结构设计采用了一种基于二维Mesh的可伸缩分布式多核结构,可为芯片级、主板级和系统级的互联提供统一的拓扑结构和逻辑设计.龙芯3号的对外接口采用扩展的HyperTransport协议,既可以用于连接IO,又可以实现多芯片的互联.在龙芯3号的互联结构中还设置了软件路由配置机制,可以在板级直接构筑中等规模的CC-NUMA系统和更大规模的NCC-NUMA系统,提供高效的通信机制.介绍了基于龙芯3号的多处理器系统互联架构.采用了双层可伸缩互联结构:片内由二维Mesh连接多个结点,结点内由交叉开关连接多个处理器核和二级缓存模块.片间无需额外硬件支持即可通过支持缓存一致性的HyperTransport接口实现16核的多处理器系统.利用层次化目录技术,龙芯3号还可以支持更大规模的多处理器系统.龙芯3号的互联架构为搭建简洁、高效、灵活、高度可扩展的共享存储多处理器系统提供了有力支持. 展开更多
关键词 龙芯3号 多核 多片 体系结构 互联 处理器
在线阅读 下载PDF
片上多核处理器存储一致性验证 被引量:13
12
作者 王朋宇 陈云霁 +2 位作者 沈海华 陈天石 张珩 《软件学报》 EI CSCD 北大核心 2010年第4期863-874,共12页
存储一致性验证是片上多核处理器功能验证的重要部分.由于验证并行程序的执行结果是否符合存储一致性模型理论上是NP难问题,现有的验证方法中只能采用一些时间复杂度大于O(n3)的不完全方法.发现在支持写原子性的多处理器系统中,两条执... 存储一致性验证是片上多核处理器功能验证的重要部分.由于验证并行程序的执行结果是否符合存储一致性模型理论上是NP难问题,现有的验证方法中只能采用一些时间复杂度大于O(n3)的不完全方法.发现在支持写原子性的多处理器系统中,两条执行时间不重叠的操作之间存在确定的时间序.通过引入时间序的概念,设计并实现了一种线性时间复杂度的存储一致性验证工具LCHECK.LCHECK利用时间序将验证局部化,使得在表示程序执行结果的有向图中,序关系边的推导和正确性检测都被限定在有限范围内.与现有其他方法相比,LCHECK时间复杂度低,对程序长度和访存地址数没有限制,因此验证效率更高.作为国产片上多核处理器龙芯3号的重要验证工具,LCHECK发现了一些存储系统的设计错误. 展开更多
关键词 存储一致性模型 验证 时间序 片上多核处理器 缓存一致性
在线阅读 下载PDF
多核处理器的关键技术及其发展趋势 被引量:49
13
作者 黄国睿 张平 魏广博 《计算机工程与设计》 CSCD 北大核心 2009年第10期2414-2418,共5页
多核处理器以其高性能、低功耗优势正逐步取代传统的单处理器成为市场的主流。介绍了Hydra、Cell、RAW这3种典型的多核处理器结构,重点讨论了核心结构选择、存储结构设计、片上通信、低功耗、操作系统设计、软件应用开发等7个影响当前... 多核处理器以其高性能、低功耗优势正逐步取代传统的单处理器成为市场的主流。介绍了Hydra、Cell、RAW这3种典型的多核处理器结构,重点讨论了核心结构选择、存储结构设计、片上通信、低功耗、操作系统设计、软件应用开发等7个影响当前多核处理器发展的关键技术,最后得出多核处理器的未来将呈现众核、低功耗和异构结构3种发展趋势。 展开更多
关键词 多核处理器结构 存储结构 片上通信 低功耗 异构
在线阅读 下载PDF
片上多核处理器共享资源分配与调度策略研究综述 被引量:9
14
作者 王磊 刘道福 +2 位作者 陈云霁 陈天石 李玲 《计算机研究与发展》 EI CSCD 北大核心 2013年第10期2212-2227,共16页
对于片上多核处理器,如何在多线程间公平有效地分配调度有限的共享资源是一个很重要的问题.随着处理器核规模的增长,多线程对于系统中有限的共享资源的争夺将愈发激烈,由此导致的对于系统性能的影响也将更加显著.为了缓解乃至解决这一问... 对于片上多核处理器,如何在多线程间公平有效地分配调度有限的共享资源是一个很重要的问题.随着处理器核规模的增长,多线程对于系统中有限的共享资源的争夺将愈发激烈,由此导致的对于系统性能的影响也将更加显著.为了缓解乃至解决这一问题,除了增加可用共享资源外,一个能够公平有效地在多线程间分配共享资源的调度算法也至关重要.在各类共享资源中,对于系统性能有着最大影响的是共享缓存和动态随机存储器(dynamic random-access memory,DRAM)系统.对于共享缓存,可以通过缓存分区来降低由于线程间的争夺所带来的影响;对于DRAM系统,可以采取适当的调度算法来调节各个线程发出的访存请求的服务优先级,从而改善系统性能.首先分别以系统吞吐量和公平性为优化目标介绍了一系列对共享缓存的分区调度算法,并针对缓存分区粒度过大的问题给出了相关解决方案.然后从利用线程的访存行为特征和借鉴网络路由算法等多个角度介绍了DRAM的调度算法.研究了从全局出发的联合调度算法,以解决针对不同共享资源的调度算法间相互矛盾的问题.最后从不同角度对于今后的研究进行了展望. 展开更多
关键词 片上多核处理器 多线程 共享缓存 缓存分区 访存调度
在线阅读 下载PDF
多核处理器——技术、趋势和挑战 被引量:20
15
作者 彭晓明 郭浩然 庞建民 《计算机科学》 CSCD 北大核心 2012年第S3期320-326,共7页
多核处理器已经成为当前微处理器技术发展的重要方向。介绍了多核处理器的起源和发展现状,分析了多核处理器技术的发展趋势。重点讨论了多核处理器技术涉及的片上网络、存储结构设计、编程接口以及资源管理等关键技术;在此基础上,进一... 多核处理器已经成为当前微处理器技术发展的重要方向。介绍了多核处理器的起源和发展现状,分析了多核处理器技术的发展趋势。重点讨论了多核处理器技术涉及的片上网络、存储结构设计、编程接口以及资源管理等关键技术;在此基础上,进一步探讨了多核处理器的发展所面临的主要挑战。 展开更多
关键词 多核处理器 体系结构 片上网络 存储结构
在线阅读 下载PDF
基于多核平台的乐观并行离散事件仿真 被引量:9
16
作者 苏年乐 吴雪阳 +2 位作者 李群 王维平 朱一凡 《系统仿真学报》 CAS CSCD 北大核心 2010年第4期858-863,共6页
计算机处理器的发展已进入多核时代,为并行离散事件仿真的推广提供了良好的契机。分析了离散事件仿真多核并行化的并行编程模型及时间同步问题,采用乐观同步协议设计实现了一个基于多核平台的并行离散事件仿真引擎。在具有8个执行核的... 计算机处理器的发展已进入多核时代,为并行离散事件仿真的推广提供了良好的契机。分析了离散事件仿真多核并行化的并行编程模型及时间同步问题,采用乐观同步协议设计实现了一个基于多核平台的并行离散事件仿真引擎。在具有8个执行核的惠普多核服务器上,使用Phold模型系统地测试了并行仿真引擎的各项开销以及事件粒度、进程数目、前瞻量、事件的本地性对仿真性能的影响。实验结果表明,对于事件粒度较大的仿真应用,基于多核平台的乐观并行离散事件仿真能获得良好的加速比。 展开更多
关键词 多核 单芯片多处理器 并行离散事件仿真 时间同步 仿真引擎
在线阅读 下载PDF
基于DVS的多核实时系统节能调度 被引量:7
17
作者 钟虓 齐勇 +2 位作者 侯迪 苗蕾 郑晓梅 《电子学报》 EI CAS CSCD 北大核心 2006年第B12期2481-2484,共4页
动态电压调节是一种有效的节能技术.本文提出了多核处理器平台上的一种近似最优的动态电压调节算法.算法将电压调节问题转化为松弛时间分配问题,由任务集结构找到存在的松弛时间,针对不同类型的松弛时间,使用了并行补偿等分配方法.实验... 动态电压调节是一种有效的节能技术.本文提出了多核处理器平台上的一种近似最优的动态电压调节算法.算法将电压调节问题转化为松弛时间分配问题,由任务集结构找到存在的松弛时间,针对不同类型的松弛时间,使用了并行补偿等分配方法.实验结果表明本文的算法能够有效的降低能量消耗且具有较低的时间复杂度. 展开更多
关键词 动态电压调节 实时任务调度 多核处理器
在线阅读 下载PDF
片上多核处理器验证:挑战、现状与展望 被引量:7
18
作者 郭阳 李思昆 屈婉霞 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2012年第12期1521-1532,共12页
随着集成电路工艺水平的不断提升以及应用对处理器性能要求的日益增长,验证已成为未来片上多核处理器发展的主要技术瓶颈.文中深入分析了片上多核处理器验证中状态空间大、完备性不足、存储结构与互连网络验证复杂、硅后验证困难等突出... 随着集成电路工艺水平的不断提升以及应用对处理器性能要求的日益增长,验证已成为未来片上多核处理器发展的主要技术瓶颈.文中深入分析了片上多核处理器验证中状态空间大、完备性不足、存储结构与互连网络验证复杂、硅后验证困难等突出问题,系统地总结了片上多核处理器模拟验证、硬件仿真、形式验证、硅后验证等方面的研究进展,并对该领域未来的发展方向进行了分析与展望. 展开更多
关键词 片上多核处理器 模拟验证 形式验证 片上网络 集成电路
在线阅读 下载PDF
多核环境下边缘提取并行算法研究 被引量:7
19
作者 张思乾 程果 +1 位作者 陈荦 熊伟 《计算机科学》 CSCD 北大核心 2012年第1期295-298,共4页
随着处理器由高主频的单核处理器逐步转向片上多核处理器(CMP),计算机并行处理能力不断提升。通过分析GIS串行算法面临的性能瓶颈,利用CMP的优势,采用线程级并行处理栅格数据。针对边缘提取算法,深入分析和比较了MPI、OpenMP等当前主流... 随着处理器由高主频的单核处理器逐步转向片上多核处理器(CMP),计算机并行处理能力不断提升。通过分析GIS串行算法面临的性能瓶颈,利用CMP的优势,采用线程级并行处理栅格数据。针对边缘提取算法,深入分析和比较了MPI、OpenMP等当前主流的并行编程模式,提出了并行性能估计模型。基于OpenMP编程模型分析线程数、调度方式和分块大小对算法并行性能的影响,实现边缘提取最优并行。实验证明,性能评估模型能够准确预测CMP环境下的并行性能,基于OpenMP实现的边缘提取并行算法能够提高图像边缘提取效率。 展开更多
关键词 片上多核处理器 OPENMP 边缘提取
在线阅读 下载PDF
片上多核处理器Cache一致性协议优化研究综述 被引量:5
20
作者 胡森森 计卫星 +3 位作者 王一拙 陈旭 付文飞 石峰 《软件学报》 EI CSCD 北大核心 2017年第4期1027-1047,共21页
现代晶体管技术在单芯片上集成多个处理器已经成为现实.近年来,随着多核处理器集成核数的不断增加,高速缓存的一致性问题凸显出来,已成为多核处理器的性能瓶颈之一,亟待解决.介绍了片上多核处理器一致性问题的由来.总结了多核时代高速... 现代晶体管技术在单芯片上集成多个处理器已经成为现实.近年来,随着多核处理器集成核数的不断增加,高速缓存的一致性问题凸显出来,已成为多核处理器的性能瓶颈之一,亟待解决.介绍了片上多核处理器一致性问题的由来.总结了多核时代高速缓存一致性协议设计的关键问题,综述了近年来学术界对一致性的研究.从程序访存行为模式、目录组织结构、一致性粒度、一致性协议流量、目录协议的可扩展性等方面,阐述了近年来缓存一致性协议性能优化的方向.对目前片上多核处理器缓存一致性协议设计中存在的问题进行了讨论,并指出了未来进一步研究的方向. 展开更多
关键词 片上多核处理器 缓存一致性协议 性能优化
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部