期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于遗传算法的片上多处理器任务调度策略研究 被引量:6
1
作者 苗蕾 齐勇 +2 位作者 侯迪 钟虓 郑晓梅 《微电子学与计算机》 CSCD 北大核心 2007年第6期8-11,15,共5页
针对在片上多处理器上任务调度的特征,提出了一种基于立体编码的遗传算法。采用适合片上多处理器结构的三维立体编码,使计算节点之间的距离得到了描述,结合提出的个体适应度函数计算公式,使通信代价较小的调度策略优先得到选择,从而通... 针对在片上多处理器上任务调度的特征,提出了一种基于立体编码的遗传算法。采用适合片上多处理器结构的三维立体编码,使计算节点之间的距离得到了描述,结合提出的个体适应度函数计算公式,使通信代价较小的调度策略优先得到选择,从而通过减少因结点间距离产生的通信开销降低了总的任务完成时间。此外,对算法结构、遗传算子进行了改进提出了内部二维交叉算子,加速了算法的收敛。仿真实验结果表明立体编码的遗传算法能够有效地对任务进行分配和调度,较之传统遗传算法具有较好的性能。 展开更多
关键词 遗传算法 任务分配与调度 片上多处理器 个体编码 遗传算子
在线阅读 下载PDF
基于总线共享架构的片上多处理器系统性能探索 被引量:3
2
作者 杨盛光 李丽 +2 位作者 徐懿 张宇昂 张冰 《微电子学与计算机》 CSCD 北大核心 2007年第12期16-19,共4页
采用SystemC建立了一个基于共享总线的MPSoC仿真平台,设计了3个实验分别用于建模3种典型应用(低计算/通讯比、高计算/通讯比和非独立任务),对系统性能进行了详细的调研。实验结果显示:处理器数≤6时,总线架构MPSoC体现出很高的效率,而... 采用SystemC建立了一个基于共享总线的MPSoC仿真平台,设计了3个实验分别用于建模3种典型应用(低计算/通讯比、高计算/通讯比和非独立任务),对系统性能进行了详细的调研。实验结果显示:处理器数≤6时,总线架构MPSoC体现出很高的效率,而处理器数=16几乎达到了总线架构MPSoC适用规模的极限;计算/通讯比对性能和规模有重要影响;流水线方案能略微缓解通讯状况。建议:处理器数≤6时,推荐采用总线方案;6<处理器数≤16时,总线方案是否合适由任务计算/通讯比决定;处理器数>16时,需要采用更高级的通讯方案。 展开更多
关键词 片上多处理器系统 总线 加速比 单核效率 总线占用率
在线阅读 下载PDF
NoC架构片上多处理器系统性能探索 被引量:1
3
作者 杨盛光 李丽 +2 位作者 张宇昂 董岚 娄孝祥 《微电子学与计算机》 CSCD 北大核心 2009年第1期63-66,共4页
采用SystemC建模和仿真环境建立了一款NoC系统级仿真平台,设计了3个实验分别用于建模3种典型应用(低计算/通信比、高计算/通信比和非独立任务),以定量模拟的方法对NoC架构MPSoC性能进行了详细的调研,并将其结果与总线架构MPSoC进行了对... 采用SystemC建模和仿真环境建立了一款NoC系统级仿真平台,设计了3个实验分别用于建模3种典型应用(低计算/通信比、高计算/通信比和非独立任务),以定量模拟的方法对NoC架构MPSoC性能进行了详细的调研,并将其结果与总线架构MPSoC进行了对比分析.实验结果显示:NoC系统加速比与处理器数目呈线性关系,不受规模的影响,而总线系统则明显受到处理器数目的限制;共享存储资源成为NoC系统性能提升的限制,但可以通过采用分布式存储策略得到解决,而总线系统却无法克服其共享总线通信瓶颈.因此,在系统规模较大(N>12)时推荐采用NoC体系结构. 展开更多
关键词 NOC 总线 片上多处理器系统 加速比 单核效率
在线阅读 下载PDF
基于多目标粒子群优化的片上多处理器节能调度研究
4
作者 苗蕾 齐勇 +1 位作者 侯迪 戴月华 《电子学报》 EI CAS CSCD 北大核心 2007年第B12期113-117,共5页
研究片上多核处理器系统的性能.功耗问题有两个重要因素:任务的执行时间以及系统的能量消耗.通过对CMP系统任务调度和能量消耗的分析建立了新颖的编码策略,并使用随机权重适应度以及精华解保留策略对粒子群优化算法进行改进,提出... 研究片上多核处理器系统的性能.功耗问题有两个重要因素:任务的执行时间以及系统的能量消耗.通过对CMP系统任务调度和能量消耗的分析建立了新颖的编码策略,并使用随机权重适应度以及精华解保留策略对粒子群优化算法进行改进,提出了多目标粒子群算法(MPSO).仿真实验结果表明使用MPSO算法可以增加CMP系统中任务调度的效率,降低任务运行时间和系统能耗. 展开更多
关键词 片上多处理器 节能调度 粒子群优化 多目标优化
在线阅读 下载PDF
基于反馈的片上多处理器系统层次负载平衡算法
5
作者 王鹏 董渭清 王甜 《西安交通大学学报》 EI CAS CSCD 北大核心 2008年第2期179-183,共5页
针对现有负载平衡算法未能有效利用片上多处理器系统线程级并行性,没有考虑线程间数据共享与通信以及产生颠簸等问题,提出了一种基于反馈的层次负载平衡算法.采用层次式调度,将属于同一进程的多个线程静态调度到特定规模的内核子集上,... 针对现有负载平衡算法未能有效利用片上多处理器系统线程级并行性,没有考虑线程间数据共享与通信以及产生颠簸等问题,提出了一种基于反馈的层次负载平衡算法.采用层次式调度,将属于同一进程的多个线程静态调度到特定规模的内核子集上,并在此基础上根据系统实时负载情况在特定内核子集内动态迁移线程,以降低同一进程的多个线程之间的通信代价.在线程迁移过程中,引入反馈机制,即以系统颠簸情况为反馈信息,实时调整迁移数目,最终使系统较快地达到平衡.实验表明,基于反馈的层次负载平衡算法能使系统的平衡程度达到较高的水平,引入的反馈机制可使系统平衡速度提高28%,并在系统平衡前使'颠簸'数目减少54%. 展开更多
关键词 片上多处理器 多线程 负载平衡 反馈
在线阅读 下载PDF
片上多处理器的层次化高速测试和验证技术
6
作者 郭松柳 汪东升 姚文斌 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2007年第5期566-570,共5页
片上多处理器的体系结构具有高效、低功耗的特点,但由于整体逻辑规模较大,且存储系统有一致性的要求,因此其模拟器测试和验证的计算量大、复杂度高,整体采用传统的形式化测试方法测试速度慢.运用分隔测试技术可以在测试过程中降低整体... 片上多处理器的体系结构具有高效、低功耗的特点,但由于整体逻辑规模较大,且存储系统有一致性的要求,因此其模拟器测试和验证的计算量大、复杂度高,整体采用传统的形式化测试方法测试速度慢.运用分隔测试技术可以在测试过程中降低整体计算的复杂度,将使用传统测试方法不能测试的复杂系统测试简单化;利用随机程序生成技术可以减少测试人员编写测试程序的时间并加速发现系统的错误,并行测试技术可以快速低功耗检验片上多处理器存储器系统的功能并具有良好的可扩充性.将上述测试方法集成在片上多处理器的测试中,能够对整体的计算量进行合理的分割和并行化,迅速定位整个系统的错误,大大缩减所需要的测试时间,降低了测试人员的工作量,提高测试结果的覆盖率和可信性. 展开更多
关键词 片上多处理器 存储系统测试 并行测试 层次化验证
在线阅读 下载PDF
片上多处理器共享Cache的访存时间最优划分方法
7
作者 李浩 谢伦国 《通信学报》 EI CSCD 北大核心 2012年第4期136-142,共7页
提出的访存时间最优Cache划分(OMTP,optimal memory time Cache partitioning)方法通过特征获取部件来获取不同应用程序的平均失效开销和Cache命中的路分布情况,以此作为划分依据来给竞争程序分配合适的Cache空间,达到优化程序整体执行... 提出的访存时间最优Cache划分(OMTP,optimal memory time Cache partitioning)方法通过特征获取部件来获取不同应用程序的平均失效开销和Cache命中的路分布情况,以此作为划分依据来给竞争程序分配合适的Cache空间,达到优化程序整体执行性能的目的。实验结果表明,OMTP方法相比基于利用率的Cache划分(UCP)方法吞吐率平均提高3.1%,加权加速比平均提高1.3%,整体性能更优。 展开更多
关键词 片上多处理器 共享CACHE CACHE划分 访存时间最优划分
在线阅读 下载PDF
基于WKR结构片上多处理器系统任务分配策略 被引量:1
8
作者 吴琳 《航空计算技术》 2011年第5期113-117,共5页
对现有CMP系统研究现状进行了研究,结合WKR结构模块性良好的特点,设计了基于WKR结构的16核CMP系统框架,在此基础上以提高任务的并行度为目标提出了静态任务层次分配策略。策略分为任务和线程两层分配过程,任务层分配定义任务的并行度,采... 对现有CMP系统研究现状进行了研究,结合WKR结构模块性良好的特点,设计了基于WKR结构的16核CMP系统框架,在此基础上以提高任务的并行度为目标提出了静态任务层次分配策略。策略分为任务和线程两层分配过程,任务层分配定义任务的并行度,采用LDLPT算法将任务分配到以子WKR结构互连的内核子集上;线程层分配以减少核间通信和均衡核间负载为目标,通过TAGM算法完成任务内的线程在内核子集内的分配。仿真试验表明,静态任务层次分配策略能够实现负载较为均衡的分配,且与类似算法相比具有明显的时间开销优势。 展开更多
关键词 片上多处理器 WKR结构 任务调度
在线阅读 下载PDF
基于FPGA面向多媒体处理的MPSoC 被引量:1
9
作者 李晶皎 陆振林 +1 位作者 王爱侠 王骄 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第4期486-490,共5页
针对嵌入式单核处理器处理速度慢及主频提升受限等问题,提出了嵌入式双核处理器(two-cores embedded processor,TEP)模型.针对处理器运行时对存储器的依赖和分配问题,提出了基于非统一存储结构模拟分布式存储结构的方案;针对多核间对共... 针对嵌入式单核处理器处理速度慢及主频提升受限等问题,提出了嵌入式双核处理器(two-cores embedded processor,TEP)模型.针对处理器运行时对存储器的依赖和分配问题,提出了基于非统一存储结构模拟分布式存储结构的方案;针对多核间对共享数据存储器的访存问题,给出了从属单元的仲裁机制,实现了共享资源的访问;针对面向多媒体应用的多核处理器间传输数据量大及通讯开销高的问题,提出了基于消息数据分离的传输方案.系统在FPGA平台进行了实现和验证,测试结果表明,TEP系统以较少的资源消耗和通讯开销获得了大加速比的性能. 展开更多
关键词 片上多处理器 嵌入式双核处理器 非统一存储结构 FPGA 消息数据分离
在线阅读 下载PDF
NoC_MPSim:基于片上网络通信架构多核仿真平台 被引量:1
10
作者 王进祥 付方发 孙俊 《中国集成电路》 2011年第6期31-37,共7页
实现了一个用于探索基于片上网络通信架构多核系统设计空间的可配置仿真平台———NoC_MPSim。该平台包含处理器工具链、平台自动化配置脚本以及一个包含处理器、网络适配器以及多种路由器的RTL模型库,可根据用户输入的系统配置信息自... 实现了一个用于探索基于片上网络通信架构多核系统设计空间的可配置仿真平台———NoC_MPSim。该平台包含处理器工具链、平台自动化配置脚本以及一个包含处理器、网络适配器以及多种路由器的RTL模型库,可根据用户输入的系统配置信息自动生成周期精确的多核仿真系统。针对片上网络通信架构的特征,定义了基于该通信架构的多核系统的高层次通信抽象模型,并借鉴并行机中的消息传递机制,提出了一种可有效隐藏网络乱序的并行编程模型及其通信原语,并完成其所需要的软\硬件建模。应用提出的编程模型,实现了MUSIC算法基于四核仿真系统的分布式并行计算,并经实验得到该并行MUSIC算法在该系统中加速比可达2.6。 展开更多
关键词 片上多处理器 片上网络 编程模型 通信抽象
在线阅读 下载PDF
基于片内WISHBONE总线的高速缓存一致性实现 被引量:2
11
作者 王科兵 郭松柳 +1 位作者 汪东升 崔光佐 《电子技术应用》 北大核心 2004年第5期4-6,共3页
基于IP可重用的设计方法,利用WISHBONE总线协议,把两个已成功开发出的具有自主知识产权的THUMP内核集成在一个芯片上,实现了片上多处理器FPGA。开发重点是实现基于片内WISHBONE总线的高速缓存一致性协议。
关键词 WISHBONE总线 高速缓存 片上多处理器 IP FPGA
在线阅读 下载PDF
一种软硬件协同控制的片上缓存功耗优化方法
12
作者 李嵩 褚廷斌 袁正希 《电子技术应用》 北大核心 2016年第2期6-8,13,共4页
片上多处理器系统的发展导致片上高速缓存的所占面积急剧增加,其对应的泄露功耗也相应增加。将高速缓存行划分成3部分进行控制,其中数据部分的访问分为协议访问和数据访问两部分,每部分支持多种工作模式来进行管控。通过工作模式的切换... 片上多处理器系统的发展导致片上高速缓存的所占面积急剧增加,其对应的泄露功耗也相应增加。将高速缓存行划分成3部分进行控制,其中数据部分的访问分为协议访问和数据访问两部分,每部分支持多种工作模式来进行管控。通过工作模式的切换对高速缓存的三部分进行管控可以使漏过功耗平均减少76.78%,但相应的性能损失最高会达到7.74%。由于性能损失较大,提出了一种改进的高速缓存衰退的方法来优化管控策略。这种策略不仅能够把性能损失控制在3%以下,而且能够保证平均能耗优化达到近75%。 展开更多
关键词 片上多处理器 高速缓存 漏过功耗 性能损失
在线阅读 下载PDF
基于缓存行为特征的线程数据预取距离控制策略 被引量:1
13
作者 黄艳 张启坤 +1 位作者 段赵磊 古志民 《电子与信息学报》 EI CSCD 北大核心 2015年第7期1633-1638,共6页
针对目前大多数面向指针应用程序的线程数据预取方法在预取距离控制方面的不足,该文提出一种基于缓存行为特征的数据预取距离控制策略。该策略利用指针应用程序执行时的数据缓存特征构建预取距离控制模型,以避免共享缓存污染,降低系统... 针对目前大多数面向指针应用程序的线程数据预取方法在预取距离控制方面的不足,该文提出一种基于缓存行为特征的数据预取距离控制策略。该策略利用指针应用程序执行时的数据缓存特征构建预取距离控制模型,以避免共享缓存污染,降低系统资源竞争,并通过忽略对部分非循环依赖数据预取平衡帮助线程与主线程间的执行任务,提高线程数据预取的时效性。实验结果表明,通过该策略控制线程数据预取距离能进一步提高线程预取性能。 展开更多
关键词 片上多处理器 线程预取 帮助线程 预取率 预取距离
在线阅读 下载PDF
基于MPSoC的无线传感器网络节点设计 被引量:1
14
作者 佟吉钢 张振新 +1 位作者 陈增强 孙青林 《科技通报》 北大核心 2010年第5期670-675,共6页
无线传感器网络的应用目前比较普遍,但其网络节点的实时数据处理能力还较为有限。对此本文提出了一种新的设计解决方案,即设计基于MPSoC(Multiprocessor Systems-on-Chip)的无线网络传感器节点。设计实现在FPGA开发板上嵌入多个处理器,... 无线传感器网络的应用目前比较普遍,但其网络节点的实时数据处理能力还较为有限。对此本文提出了一种新的设计解决方案,即设计基于MPSoC(Multiprocessor Systems-on-Chip)的无线网络传感器节点。设计实现在FPGA开发板上嵌入多个处理器,同时使用典型的基于ZigBee协议的无线传感器网络,将其使用的灵活性与片上多处理器系统的强大实时数据计算处理能力结合起来,充分发挥两者的优势,实现一种更具优势的无线传感器网络节点设计。 展开更多
关键词 无线传感网络 片上多处理器系统 FPGA ZIGBEE协议
在线阅读 下载PDF
CCSim:基于Pin的CMPCache访问模拟器
15
作者 郑启龙 栾俊 +1 位作者 房明 吴晓伟 《微电子学与计算机》 CSCD 北大核心 2008年第10期5-7,11,共4页
随着芯片集成制造工艺的日益发展,拥有多级Cache的片上多处理器(CMP)已成为桌面应用和高端计算的主流平台.为了优化程序在CMP下运行性能,文中以Pin工具软件为基础,提出并设计了一个面向CMP体系架构的多级Cache访问模拟器——CCSim.该模... 随着芯片集成制造工艺的日益发展,拥有多级Cache的片上多处理器(CMP)已成为桌面应用和高端计算的主流平台.为了优化程序在CMP下运行性能,文中以Pin工具软件为基础,提出并设计了一个面向CMP体系架构的多级Cache访问模拟器——CCSim.该模拟器不仅可以模拟同构CMP下传统方式的Cache访问,而且还可以对CMP中最后一级共享Cache的竞争访问以及非传统方式的Barcelona式Cache访问模式进行模拟分析. 展开更多
关键词 PIN Cache模拟器 片上多处理器
在线阅读 下载PDF
帮助线程预取性能的分析与优化
16
作者 黄艳 古志民 《电子科技大学学报》 EI CAS CSCD 北大核心 2012年第1期85-91,共7页
针对访存延迟对现代处理器性能的影响,基于片上多处理器分析与测试了访存密集型应用程序的帮助线程数据预取性能。结果表明热点区计算/访存延迟比率对帮助线程预取性能有重大影响。依据热点区计算/访存延迟比率合理安排帮助线程与主线... 针对访存延迟对现代处理器性能的影响,基于片上多处理器分析与测试了访存密集型应用程序的帮助线程数据预取性能。结果表明热点区计算/访存延迟比率对帮助线程预取性能有重大影响。依据热点区计算/访存延迟比率合理安排帮助线程与主线程的访存任务比例时,能达到对帮助线程性能的优化,使帮助线程预取获得更好的性能收益。基准测试程序的测试实验结果表明当热点区计算量很小可以忽略不计时,帮助线程与主线程的访存任务比接近1时,帮助线程预取获得最好的性能收益。 展开更多
关键词 片上多处理器 计算/访存延迟比率 热点区 性能分析 预取线程
在线阅读 下载PDF
支持推测多线程的扩展多核模拟器Prophet+ 被引量:3
17
作者 宋少龙 赵银亮 +3 位作者 冯博琴 韦远科 王旭昊 赵恒星 《西安交通大学学报》 EI CAS CSCD 北大核心 2010年第10期13-17,35,共6页
推测多线程技术是软硬件协同开发非规则应用程序的线程级并行性的有效方法.通过体系结构对推测并行执行模式的支持,编译器产生推测多线程目标代码实现自动并行化加速.文中针对硬件平台如何有效支持程序运行过程的分析及测试,提出了一种... 推测多线程技术是软硬件协同开发非规则应用程序的线程级并行性的有效方法.通过体系结构对推测并行执行模式的支持,编译器产生推测多线程目标代码实现自动并行化加速.文中针对硬件平台如何有效支持程序运行过程的分析及测试,提出了一种支持推测并行执行模式的超标量流水线结构和一种基于独立栈的运行时内存空间管理方法.通过对Prophet模拟器扩展实现,并经Olden基准程序测试表明,扩展后的Prophet+在保持Prophet模拟器性能的前提下,提高了模拟器的精度和灵活性. 展开更多
关键词 线程级并行 推测多线程 片上多处理器 流水线 模拟器
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部