期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
CC-NUMA并行系统通信优化的变换技术
1
作者 陈渝 nudt.edu.cn +2 位作者 李春江 杨学军 陈福接 《软件学报》 EI CSCD 北大核心 2000年第4期507-514,共8页
减少通信开销是并行编译优化的主要目标之一 .该文针对具有 cache一致性的非一致存储访问并行系统 ( CC- NUMA)的特点 ,提出通过结合计算变换和数据变换 ,在统一的代数框架下对并行程序进行通信优化的策略和方法 .通过实验测试 。
关键词 并行编译 通信优化 数据变换 cc-numa
在线阅读 下载PDF
Elastic pointer directory organization for scalable shared memory multiprocessors
2
作者 Yuhang Liu Mingfa Zhu Limin Xiao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2014年第1期158-167,共10页
In the field of supercomputing, one key issue for scal-able shared-memory multiprocessors is the design of the directory which denotes the sharing state for a cache block. A good direc-tory design intends to achieve t... In the field of supercomputing, one key issue for scal-able shared-memory multiprocessors is the design of the directory which denotes the sharing state for a cache block. A good direc-tory design intends to achieve three key attributes: reasonable memory overhead, sharer position precision and implementation complexity. However, researchers often face the problem that gain-ing one attribute may result in losing another. The paper proposes an elastic pointer directory (EPD) structure based on the analysis of shared-memory applications, taking the fact that the number of sharers for each directory entry is typical y smal . Analysis re-sults show that for 4 096 nodes, the ratio of memory overhead to the ful-map directory is 2.7%. Theoretical analysis and cycle-accurate execution-driven simulations on a 16 and 64-node cache coherence non uniform memory access (CC-NUMA) multiproces-sor show that the corresponding pointer overflow probability is reduced significantly. The performance is observed to be better than that of a limited pointers directory and almost identical to the ful-map directory, except for the slight implementation complex-ity. Using the directory cache to explore directory access locality is also studied. The experimental result shows that this is a promis-ing approach to be used in the state-of-the-art high performance computing domain. 展开更多
关键词 DIRECTORY scalabUity memory overhead positioningprecision OVERFLOW cache coherence non uniform memory accesscc-numa).
在线阅读 下载PDF
MPD:结点具有多个并行缓存一致性域的CC-NUMA系统
3
作者 陈继承 赵雅倩 +3 位作者 李一韩 王恩东 史宏志 唐士斌 《计算机研究与发展》 EI CSCD 北大核心 2017年第4期775-786,共12页
大规模高速缓存一致性非均匀存储访问(cache coherence non-uniform memory access,CC-NUMA)系统通常采用两级一致性域方法来降低缓存一致性协议维护开销,提升系统性能.两级一致性域系统中,多个处理器互连,形成结点内一致性域;多个结点... 大规模高速缓存一致性非均匀存储访问(cache coherence non-uniform memory access,CC-NUMA)系统通常采用两级一致性域方法来降低缓存一致性协议维护开销,提升系统性能.两级一致性域系统中,多个处理器互连,形成结点内一致性域;多个结点互连,形成结点间一致性域.然而,受限于处理器直连能力与处理器可识别ID数,系统的单结点规模有限,系统规模的扩展不得不依靠增加结点数来实现,使得大规模CC-NUMA系统的结点间互连复杂度上升,跨结点访问带宽和延迟急剧增长,影响了系统性能的有效扩展.MPD系统通过在结点内构建多个并行缓存一致性域,突破了处理器直连能力与可识别ID数对单结点规模的限制,能够大幅减少结点数量,并将部分结点间访问转化为结点内访问,实现系统性能的有效扩展.理论分析和实验结果表明:采用同规格处理器的32路系统中,结点内4个并行缓存一致性域的MPD系统可实现结点数目减少75%、一致性目录存储开销节省40%以上、平均访问延迟降低约27.9%、系统整体性能提升约14.4%. 展开更多
关键词 cc-numa系统 两级一致性域 并行缓存一致性域 一致性协同芯片 系统可扩展性
在线阅读 下载PDF
基于基地址寄存器映射的数据缓存研究
4
作者 沈秀红 赵朝君 +1 位作者 孟建熠 项晓燕 《计算机工程》 CAS CSCD 2013年第5期73-77,共5页
针对深流水线中加载指令的延时长和功耗高的问题,提出一种基于基地址寄存器映射的数据缓存访问方法。该方法在加载指令执行过程中,动态构建基地址寄存器与目标数据的局部性访问历史,并通过设计基地址寄存器跟踪缓存器,在指令译码后直接... 针对深流水线中加载指令的延时长和功耗高的问题,提出一种基于基地址寄存器映射的数据缓存访问方法。该方法在加载指令执行过程中,动态构建基地址寄存器与目标数据的局部性访问历史,并通过设计基地址寄存器跟踪缓存器,在指令译码后直接获得目标数据,从而加速加载指令的数据获取过程,减少地址计算和对高速缓存的访问。测试结果表明,该方法的处理器性能平均提高约3.7%,数据高速缓存功耗平均降低约18.7%。 展开更多
关键词 映射关系 基地址寄存器映射 内存访问局部性 数据一致性 高速缓存
在线阅读 下载PDF
基于紧耦合单跳步多平面架构的高端服务器设计 被引量:7
5
作者 王恩东 陈继承 +1 位作者 胡雷钧 公维峰 《高技术通讯》 CAS CSCD 北大核心 2014年第2期111-116,共6页
针对高端服务器设计面临的可扩展性问题,提出了一种紧耦合单跳步多平面(TSMP)体系结构设计方法。该方法采用双侧多平面互连结构,支持8-32路规模无缝扩展;基于两级目录结构的高速缓存一致性实现方法,支持高并发一致性访问和高效冲突处理... 针对高端服务器设计面临的可扩展性问题,提出了一种紧耦合单跳步多平面(TSMP)体系结构设计方法。该方法采用双侧多平面互连结构,支持8-32路规模无缝扩展;基于两级目录结构的高速缓存一致性实现方法,支持高并发一致性访问和高效冲突处理,有效降低一致性访问传输、处理延迟。该方法已应用于浪潮32路K1高端服务器的设计,对设计的系统进行了内存性能、处理性能和可扩展性测试,测试结果表明,采用该设计可使高端服务器的计算、访存性能随系统规模从单路到32路线性增长。K1高端服务器支持基于QPI1.0协议的Intel安腾(Itanium)4核CPU-Tukwila和8核CPU-Polson,是中国研制的首台投入商业化应用的高端服务器。 展开更多
关键词 缓存一致性非均匀存储访问(cc-numa) 紧耦合单跳步多平面(TSMP) QPI协议 cache一致性 目录cache
在线阅读 下载PDF
片上多核处理器的区域共享的双粒度目录
6
作者 曾露 陈新科 王焕东 《高技术通讯》 CAS CSCD 北大核心 2015年第7期669-676,共8页
研究了双粒度目录(DGD)下片上多核处理器的访存行为以及DGD对不同共享行为的目录开销,以进一步降低DGD结构的面积开销。针对DGD需要为共享缓存区域创建额外的块目录项的问题,提出了创新的区域共享的双粒度目录(RSDGD)结构。该结构可用... 研究了双粒度目录(DGD)下片上多核处理器的访存行为以及DGD对不同共享行为的目录开销,以进一步降低DGD结构的面积开销。针对DGD需要为共享缓存区域创建额外的块目录项的问题,提出了创新的区域共享的双粒度目录(RSDGD)结构。该结构可用一个区域共享目录项同时维护最多3个共享者共享同一个缓存区域的一致性,从而能有效减少所需的块目录项数量,降低总的目录开销。实验结果表明,和原有的DGD相比,该结构平均减少了25%的目录空间需求,而仅产生了不到0.6%的性能损失。该结构有效地降低了芯片的面积开销,提高了目录结构的可伸缩性。 展开更多
关键词 双粒度目录(DGD) 片上多核处理器 缓存一致性 区域共享 目录一致性协议 访存优化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部