期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
一种针对处理器集群的源代码级调试系统实现方案 被引量:1
1
作者 林广栋 朱艳 +1 位作者 黄光红 耿锐 《中国集成电路》 2018年第5期43-50,54,共9页
本文提出一种针对处理器集群的源代码级调试系统实现方案,支持同时对处理器集群中的所有计算核心进行源代码级调试。该调试系统还支持同时对系统中的不同类型的芯片进行源代码级调试。该调试系统使用一种统一的调试通信协议屏蔽了底层... 本文提出一种针对处理器集群的源代码级调试系统实现方案,支持同时对处理器集群中的所有计算核心进行源代码级调试。该调试系统还支持同时对系统中的不同类型的芯片进行源代码级调试。该调试系统使用一种统一的调试通信协议屏蔽了底层硬件的差异。该调试系统使用命令行接口作为用户接口,通过网关来管理不同的底层硬件。该调试系统支持集成到可视化开发环境中,以图形化的方式进行调试。 展开更多
关键词 处理器集群 源代码级调试 魂芯 MCCD
在线阅读 下载PDF
基于共享Cache多核处理器的Radix聚集连接优化
2
作者 邓亚丹 景宁 +1 位作者 熊伟 吴秋云 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第4期68-73,共6页
基于目前主流的多核处理器,研究了数据库Radix-Join算法中的聚集连接优化。针对多线程聚集连接执行时,线程Cache访问缺失严重的问题,采用预读线程预先将聚集连接线程需要访问的聚集对从内存读入L2-Cache,提高了线程的Cache访问性能。并... 基于目前主流的多核处理器,研究了数据库Radix-Join算法中的聚集连接优化。针对多线程聚集连接执行时,线程Cache访问缺失严重的问题,采用预读线程预先将聚集连接线程需要访问的聚集对从内存读入L2-Cache,提高了线程的Cache访问性能。并根据聚集连接执行时的代价模型,优化了聚集连接执行框架和各种线程参数。在实验中,基于内存数据库EaseDB实现了本文提出了算法,实验结果表明,聚集连接性能得到较大提高。 展开更多
关键词 多核处理器 radix—join 聚集连接
在线阅读 下载PDF
分簇处理器中分簇投机的L0 Cache设计
3
作者 杨兵 毛志刚 +1 位作者 陈晓 尹捷明 《微电子学与计算机》 CSCD 北大核心 2010年第7期15-20,共6页
处理器分簇技术是进一步提高超标量处理器性能的一种有效手段,实现了更大指令窗口和发射宽度的同时对Cache系统提出了严峻要求,需要一种访存延迟更小、扩展性更强的Cache结构.采用分簇投机的L0 Cache结构,处理器在访存时投机访问各簇内... 处理器分簇技术是进一步提高超标量处理器性能的一种有效手段,实现了更大指令窗口和发射宽度的同时对Cache系统提出了严峻要求,需要一种访存延迟更小、扩展性更强的Cache结构.采用分簇投机的L0 Cache结构,处理器在访存时投机访问各簇内简单快速的L0 Cache,较好地隐藏了下级Cache的访问延迟.仿真结果显示在8簇的分簇处理器中,采用4kB,2路组相连的分簇L0 Cache后处理器性能平均提升5.6%,在部分测试程序中达到20%以上. 展开更多
关键词 分簇处理器 CACHE结构 投机访问
在线阅读 下载PDF
基于簇的寄存器堆功耗管理方法 被引量:2
4
作者 孙含欣 佟冬 +1 位作者 袁鹏 程旭 《电子学报》 EI CAS CSCD 北大核心 2008年第2期278-284,共7页
本文采用软硬件协同设计技术,提出以寄存器簇为粒度对嵌入式处理器寄存器堆进行功耗管理的方法.在软件方面,面向寄存器簇的编译优化使循环程序段中寄存器的编号尽可能相邻;在硬件方面,采用寄存器簇缓冲器过滤对寄存器堆的访问并降低其... 本文采用软硬件协同设计技术,提出以寄存器簇为粒度对嵌入式处理器寄存器堆进行功耗管理的方法.在软件方面,面向寄存器簇的编译优化使循环程序段中寄存器的编号尽可能相邻;在硬件方面,采用寄存器簇缓冲器过滤对寄存器堆的访问并降低其动态功耗,采用基于寄存器簇的动态电压调节电路和门控预充电路降低存储单元和位线的泄漏功耗.实验结果表明,本文方法将寄存器堆的总功耗降低约44.7%,比传统方法达到了功耗、面积和延迟的更优折衷. 展开更多
关键词 嵌入式处理器 寄存器堆 寄存器簇 动态功耗 泄漏功耗
在线阅读 下载PDF
基于BWDSP100的传播分簇算法研究与实现 被引量:4
5
作者 王昊 黄光红 王向前 《中国集成电路》 2014年第8期24-28,共5页
BWDSP100是一款SIMD和VLIW架构高性能DSP,它的指令级并行性主要通过指令分簇和软件流水来实现。本文针对BWDSP100的特点,提出了一种新的分簇算法——传播分簇,该算法考虑了负载均衡和特殊ABI规则,不会产生簇间转移指令。实验结果表明,... BWDSP100是一款SIMD和VLIW架构高性能DSP,它的指令级并行性主要通过指令分簇和软件流水来实现。本文针对BWDSP100的特点,提出了一种新的分簇算法——传播分簇,该算法考虑了负载均衡和特殊ABI规则,不会产生簇间转移指令。实验结果表明,该分簇方法在Open64编译器上的实现可以取得比传统方法更好的效果。 展开更多
关键词 数字信号处理器 超长指令字 指令级并行 分簇
在线阅读 下载PDF
基于任务流水化的簇状流处理器专用通信单元的设计
6
作者 杭赟 谢憬 毛志刚 《微电子学与计算机》 CSCD 北大核心 2015年第5期91-94,共4页
针对基于任务流水化机制的高性能DSP流处理器的运算簇簇间数据通信问题,提出了COMM通信单元的设计思想.该单元通过对各个簇输出数据进行重新排布,提升了簇间数据交换的性能,避免了主控核参与所引起的较大的时间开销.基于若干个典型DSP... 针对基于任务流水化机制的高性能DSP流处理器的运算簇簇间数据通信问题,提出了COMM通信单元的设计思想.该单元通过对各个簇输出数据进行重新排布,提升了簇间数据交换的性能,避免了主控核参与所引起的较大的时间开销.基于若干个典型DSP应用对设计方案进行实验,测得平均性能提升可达24.6%,实现了性能优化的目标. 展开更多
关键词 流处理器 运算簇 任务流水化机制 COMM通信单元
在线阅读 下载PDF
分布式集群处理环境平台软件技术研究 被引量:5
7
作者 姜晓辉 郭久武 +2 位作者 王博 刘承 崔赛楠 《吉林大学学报(信息科学版)》 CAS 2015年第3期331-337,共7页
针对嵌入式设备资源受限、软件集成困难、通信环境复杂等问题,结合目前车辆综合电子系统、航空综合电子系统等分布式集群处理机环境下信息处理的特点,提出了嵌入式软件构件形态及嵌入式构件化软件集成方法,改进了在分布式集群处理机环... 针对嵌入式设备资源受限、软件集成困难、通信环境复杂等问题,结合目前车辆综合电子系统、航空综合电子系统等分布式集群处理机环境下信息处理的特点,提出了嵌入式软件构件形态及嵌入式构件化软件集成方法,改进了在分布式集群处理机环境下设备之间通信数据的处理方式,并在嵌入式实时操作系统中实施验证。实验结果表明,嵌入式构件化软件平台能实现软件快速集成,有效监控和管理系统资源。 展开更多
关键词 分布式系统 集群处理机 构件化 嵌入式
在线阅读 下载PDF
GPU-Hi:GPU RTL平台实现及效率分析
8
作者 张立志 赵士彭 章隆兵 《高技术通讯》 CAS 2022年第5期484-492,共9页
实现了寄存器传输级(RTL)图形处理器(GPU)研究平台——GPU-Hi。GPU-Hi支持OpenGL 2.0 API,支持统一着色器渲染架构,使用专用集成电路(ASIC)完成图形流水线的固定功能算法,使用单指令多线程(SIMT)架构流处理器完成图形流水线的可编程着... 实现了寄存器传输级(RTL)图形处理器(GPU)研究平台——GPU-Hi。GPU-Hi支持OpenGL 2.0 API,支持统一着色器渲染架构,使用专用集成电路(ASIC)完成图形流水线的固定功能算法,使用单指令多线程(SIMT)架构流处理器完成图形流水线的可编程着色器模块。在使用28 nm工艺的情况下,该平台的物理设计面积为7.9μm^(2)。使用glmark2的测试集作为性能测试程序,完成了该平台的功能正确性验证,同时使用该测试集研究了3D图形应用的计算特性,并进行了GPU微结构级的性能分析。测试结果表明,图形应用的光栅化任务与像素着色任务不随图形应用分辨率等比例增大;同时GPU硬件的光栅化模块性能受着色程序处理能力与显存访问能力的影响。本平台的实现对GPU RTL平台的研究发展有重要的借鉴价值,本文中得到的结论对GPU性能优化具有重要参考意义,有力支持了GPU硬件研究的发展。 展开更多
关键词 图形处理器(GPU) 性能分析 glmark2 流处理器集群
在线阅读 下载PDF
基于模糊免疫网络算法的嵌入式数字图像处理系统 被引量:3
9
作者 廖娟 阮运飞 《现代电子技术》 2021年第15期85-88,共4页
由于使用监督算法、神经网络算法构建的系统受到噪声影响,导致图像处理效果较差,为此提出基于模糊免疫网络算法的嵌入式数字图像处理系统。根据硬件系统结构,将PC上的文件和应用程序下载到开发平台上,SDRAM作为帧缓冲区,将4个FIFO缓冲... 由于使用监督算法、神经网络算法构建的系统受到噪声影响,导致图像处理效果较差,为此提出基于模糊免疫网络算法的嵌入式数字图像处理系统。根据硬件系统结构,将PC上的文件和应用程序下载到开发平台上,SDRAM作为帧缓冲区,将4个FIFO缓冲器设计成4个虚拟端口,向内部发送读写请求。使用FBGA封装模式设计的S3C2410处理器可缓存指令和数据。设置交叉编译开发模式,对图像进行模糊免疫网络聚类处理,在模糊聚类结果下设计图像处理流程。由仿真实验结果可知,该系统在正常情况下图像无噪点,在噪声影响下噪点较少,具有良好的图像处理效果。 展开更多
关键词 模糊免疫网络 嵌入式数字图像处理系统 交叉编译 模糊聚类 免疫网络聚类 S3C2410处理器
在线阅读 下载PDF
基于大地电磁测深的多金属矿集区电磁数据处理系统
10
作者 王亮 张绍栋 +1 位作者 吕志斌 朱杰君 《世界有色金属》 2020年第17期29-30,共2页
由于传统多金属矿集区电磁数据处理系统采用复杂指令集,在实际应用中处理后的数据中仍然含有大量含噪数据,为此提出基于大地电磁测深的多金属矿集区电磁数据处理系统研究。在系统硬件方面设计了DSP双结构处理器,提高系统电磁数据处理能... 由于传统多金属矿集区电磁数据处理系统采用复杂指令集,在实际应用中处理后的数据中仍然含有大量含噪数据,为此提出基于大地电磁测深的多金属矿集区电磁数据处理系统研究。在系统硬件方面设计了DSP双结构处理器,提高系统电磁数据处理能力,采用ROM存储器保证数据存储安全,利用KUGB-181型号大地电磁测深仪保证电磁数据采集质量,然后通过误差棒编辑去除掉含噪数据,以此完成基于大地电磁测深的多金属矿集区电磁数据处理系统设计。 展开更多
关键词 多金属矿集区 数据处理系统 DSP双结构处理器 ROM存储器
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部