期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
面向实时流处理的多核多线程处理器访存队列 被引量:3
1
作者 田杭沛 高德远 +1 位作者 樊晓桠 朱怡安 《计算机研究与发展》 EI CSCD 北大核心 2009年第10期1634-1641,共8页
针对多核多线程处理器中乱序访存影响计算实时性的问题,在对典型访存队列进行研究的基础上提出了一种新的访存队列构建模型及其硬件结构.该模型采用窗口优化算法控制最差情况下的访存延迟,保证访存的实时性,同时又利用优化的乱序调度策... 针对多核多线程处理器中乱序访存影响计算实时性的问题,在对典型访存队列进行研究的基础上提出了一种新的访存队列构建模型及其硬件结构.该模型采用窗口优化算法控制最差情况下的访存延迟,保证访存的实时性,同时又利用优化的乱序调度策略减少访存延迟.实验证明,该访存队列可控制最大访存延迟,与顺序访存相比,存储器具备更高的带宽,与传统的乱序访存相比较,可以充分满足计算的实时性需求,而存储器有效带宽基本不受影响,解决了多核多线程处理器承担实时流计算的基础难题. 展开更多
关键词 计算机体系结构 实时流处理 多核多线程处理器 访存队列 窗口优化
在线阅读 下载PDF
多核多线程处理器的随机测试流量生成技术
2
作者 刘瑞东 安克 张烁 《计算机工程》 CAS CSCD 北大核心 2009年第10期95-97,100,共4页
以可编程多核多线程处理器IXP2400为例,围绕随机测试流量的生成问题进行讨论,推导出随机测试流量生成公式,利用分解法对GI/G/m/∞/FCFS多类型客户输入开放排队网络求解,给出输出流到达时间间隔变异系数的求解方法,通过控制测试帧间时延... 以可编程多核多线程处理器IXP2400为例,围绕随机测试流量的生成问题进行讨论,推导出随机测试流量生成公式,利用分解法对GI/G/m/∞/FCFS多类型客户输入开放排队网络求解,给出输出流到达时间间隔变异系数的求解方法,通过控制测试帧间时延使得生成的测试流量符合多种概率分布。提出的技术应用于"基于IXP2400的网络测试系统",并对其进行测试,实验验证了该技术的可用性及有效性。 展开更多
关键词 多核多线程处理器 排队网络 测试流量 变异系数
在线阅读 下载PDF
多核多线程处理器XLR732的多核间通信
3
作者 张国杰 张毅 《重庆工学院学报(自然科学版)》 2008年第10期148-152,共5页
介绍了CMP、SMP处理器与多核多线程处理器的特点,然后以多核多线程处理器XLR732为例,分析对比了该处理器几种可用的核间通信机制,提出其适用范围,最后在一款使用该处理器的网络设备中实现了多核间通信方案.
关键词 多核多线程处理器 XIR732 间通信
在线阅读 下载PDF
基于SB3500多核处理器的软件无线电系统设计 被引量:3
4
作者 钟达 郭伟 +1 位作者 习勇 唐麒 《现代电子技术》 2014年第21期5-8,共4页
针对基于软件无线电架构的现代移动通信手持终端设计,研究了基于SB3500国产多核多线程数字信号处理器的软件无线电设计方法,实现了基于SB3500的软件无线电硬件系统。在此基础上开发了一套适合该硬件系统的OFDM通信波形软件,用于验证该... 针对基于软件无线电架构的现代移动通信手持终端设计,研究了基于SB3500国产多核多线程数字信号处理器的软件无线电设计方法,实现了基于SB3500的软件无线电硬件系统。在此基础上开发了一套适合该硬件系统的OFDM通信波形软件,用于验证该硬件系统是否满足手持终端小型化和低功耗的要求。研究表明,使用该国产多核多线程处理器进行软件无线电系统的设计开发具有广泛的应用前景。 展开更多
关键词 软件无线电 手持终端 SB3500 多核多线程处理器
在线阅读 下载PDF
Using multi-threads to hide deduplication I/O latency with low synchronization overhead 被引量:1
5
作者 朱锐 秦磊华 +1 位作者 周敬利 郑寰 《Journal of Central South University》 SCIE EI CAS 2013年第6期1582-1591,共10页
Data deduplication, as a compression method, has been widely used in most backup systems to improve bandwidth and space efficiency. As data exploded to be backed up, two main challenges in data deduplication are the C... Data deduplication, as a compression method, has been widely used in most backup systems to improve bandwidth and space efficiency. As data exploded to be backed up, two main challenges in data deduplication are the CPU-intensive chunking and hashing works and the I/0 intensive disk-index access latency. However, CPU-intensive works have been vastly parallelized and speeded up by multi-core and many-core processors; the I/0 latency is likely becoming the bottleneck in data deduplication. To alleviate the challenge of I/0 latency in multi-core systems, multi-threaded deduplication (Multi-Dedup) architecture was proposed. The main idea of Multi-Dedup was using parallel deduplication threads to hide the I/0 latency. A prefix based concurrent index was designed to maintain the internal consistency of the deduplication index with low synchronization overhead. On the other hand, a collisionless cache array was also designed to preserve locality and similarity within the parallel threads. In various real-world datasets experiments, Multi-Dedup achieves 3-5 times performance improvements incorporating with locality-based ChunkStash and local-similarity based SiLo methods. In addition, Multi-Dedup has dramatically decreased the synchronization overhead and achieves 1.5-2 times performance improvements comparing to traditional lock-based synchronization methods. 展开更多
关键词 MULTI-THREAD MULTI-CORE parallel data deduplication
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部