检索结果-维普期刊中文期刊服务平台

CC-NUMA并行系统通信优化的变换技术: 1; 作者陈渝 nudt.edu.cn +2 位作者李春江杨学军陈福接《软件学报》 EI CSCD 北大核心 2000年第4期507-514,共8页; 减少通信开销是并行编译优化的主要目标之一 .该文针对具有 cache一致性的非一致存储访问并行系统 ( CC- NUMA)的特点 ,提出通过结合计算变换和数据变换 ,在统一的代数框架下对并行程序进行通信优化的策略和方法 .通过实验测试。; 关键词并行编译通信优化数据变换 cc-numa; 在线阅读下载PDF 职称材料

Elastic pointer directory organization for scalable shared memory multiprocessors: 2; 作者 Yuhang Liu Mingfa Zhu Limin Xiao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2014年第1期158-167,共10页; In the field of supercomputing, one key issue for scal-able shared-memory multiprocessors is the design of the directory which denotes the sharing state for a cache block. A good direc-tory design intends to achieve t... 展开更多; 关键词 DIRECTORY scalabUity memory overhead positioningprecision OVERFLOW cache coherence non uniform memory access（cc-numa）.; 在线阅读下载PDF 职称材料

MPD:结点具有多个并行缓存一致性域的CC-NUMA系统: 3; 作者陈继承赵雅倩 +3 位作者李一韩王恩东史宏志唐士斌《计算机研究与发展》 EI CSCD 北大核心 2017年第4期775-786,共12页; 大规模高速缓存一致性非均匀存储访问(cache coherence non-uniform memory access,CC-NUMA)系统通常采用两级一致性域方法来降低缓存一致性协议维护开销,提升系统性能.两级一致性域系统中,多个处理器互连,形成结点内一致性域;多个结点... 展开更多; 关键词 cc-numa系统两级一致性域并行缓存一致性域一致性协同芯片系统可扩展性; 在线阅读下载PDF 职称材料

基于基地址寄存器映射的数据缓存研究: 4; 作者沈秀红赵朝君 +1 位作者孟建熠项晓燕《计算机工程》 CAS CSCD 2013年第5期73-77,共5页; 针对深流水线中加载指令的延时长和功耗高的问题,提出一种基于基地址寄存器映射的数据缓存访问方法。该方法在加载指令执行过程中,动态构建基地址寄存器与目标数据的局部性访问历史,并通过设计基地址寄存器跟踪缓存器,在指令译码后直接... 展开更多; 关键词映射关系基地址寄存器映射内存访问局部性数据一致性高速缓存; 在线阅读下载PDF 职称材料

基于紧耦合单跳步多平面架构的高端服务器设计被引量：7: 5; 作者王恩东陈继承 +1 位作者胡雷钧公维峰《高技术通讯》 CAS CSCD 北大核心 2014年第2期111-116,共6页; 针对高端服务器设计面临的可扩展性问题,提出了一种紧耦合单跳步多平面(TSMP)体系结构设计方法。该方法采用双侧多平面互连结构,支持8-32路规模无缝扩展;基于两级目录结构的高速缓存一致性实现方法,支持高并发一致性访问和高效冲突处理... 展开更多; 关键词缓存一致性非均匀存储访问(cc-numa) 紧耦合单跳步多平面(TSMP) QPI协议 cache一致性目录cache; 在线阅读下载PDF 职称材料

片上多核处理器的区域共享的双粒度目录: 6; 作者曾露陈新科王焕东《高技术通讯》 CAS CSCD 北大核心 2015年第7期669-676,共8页; 研究了双粒度目录(DGD)下片上多核处理器的访存行为以及DGD对不同共享行为的目录开销,以进一步降低DGD结构的面积开销。针对DGD需要为共享缓存区域创建额外的块目录项的问题,提出了创新的区域共享的双粒度目录(RSDGD)结构。该结构可用... 展开更多; 关键词双粒度目录(DGD) 片上多核处理器缓存一致性区域共享目录一致性协议访存优化; 在线阅读下载PDF 职称材料

题名CC-NUMA并行系统通信优化的变换技术: 1; 作者陈渝 nudt.edu.cn 李春江杨学军陈福接; 机构国防科学技术大学计算机学院; 出处《软件学报》 EI CSCD 北大核心 2000年第4期507-514,共8页; 基金国家杰出青年科学基金!(No.6982 5104)资助; 文摘减少通信开销是并行编译优化的主要目标之一 .该文针对具有 cache一致性的非一致存储访问并行系统 ( CC- NUMA)的特点 ,提出通过结合计算变换和数据变换 ,在统一的代数框架下对并行程序进行通信优化的策略和方法 .通过实验测试。; 关键词并行编译通信优化数据变换 cc-numa; Keywords Parallel compiling, communication optimization, computing transformation, data transformation, cc-numa (cache coherent non uniform memory access).; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名Elastic pointer directory organization for scalable shared memory multiprocessors: 2; 作者 Yuhang Liu Mingfa Zhu Limin Xiao; 机构 Laboratory of Software Development Environment School of Computer Science and Engineering; 出处《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2014年第1期158-167,共10页; 基金 supported by the National Natural Science Foundation of China(61232009 61370059) +1 种基金 the Fund of the State Key Laboratory of Software Development Environment(SKLSDE2012ZX06); 文摘 In the field of supercomputing, one key issue for scal-able shared-memory multiprocessors is the design of the directory which denotes the sharing state for a cache block. A good direc-tory design intends to achieve three key attributes： reasonable memory overhead, sharer position precision and implementation complexity. However, researchers often face the problem that gain-ing one attribute may result in losing another. The paper proposes an elastic pointer directory （EPD） structure based on the analysis of shared-memory applications, taking the fact that the number of sharers for each directory entry is typical y smal . Analysis re-sults show that for 4 096 nodes, the ratio of memory overhead to the ful-map directory is 2.7%. Theoretical analysis and cycle-accurate execution-driven simulations on a 16 and 64-node cache coherence non uniform memory access （CC-NUMA） multiproces-sor show that the corresponding pointer overflow probability is reduced significantly. The performance is observed to be better than that of a limited pointers directory and almost identical to the ful-map directory, except for the slight implementation complex-ity. Using the directory cache to explore directory access locality is also studied. The experimental result shows that this is a promis-ing approach to be used in the state-of-the-art high performance computing domain.; 关键词 DIRECTORY scalabUity memory overhead positioningprecision OVERFLOW cache coherence non uniform memory access（cc-numa）.; Keywords directory, scalabUity, memory overhead, positioningprecision, overflow, cache coherence non uniform memory access（cc-numa）.; 分类号 TP332 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名MPD:结点具有多个并行缓存一致性域的CC-NUMA系统: 3; 作者陈继承赵雅倩李一韩王恩东史宏志唐士斌; 机构高效能服务器和存储技术国家重点实验室(浪潮集团有限公司); 出处《计算机研究与发展》 EI CSCD 北大核心 2017年第4期775-786,共12页; 基金国家"八六三"高技术研究发展计划基金项目(2013AA011701)~~; 文摘大规模高速缓存一致性非均匀存储访问(cache coherence non-uniform memory access,CC-NUMA)系统通常采用两级一致性域方法来降低缓存一致性协议维护开销,提升系统性能.两级一致性域系统中,多个处理器互连,形成结点内一致性域;多个结点互连,形成结点间一致性域.然而,受限于处理器直连能力与处理器可识别ID数,系统的单结点规模有限,系统规模的扩展不得不依靠增加结点数来实现,使得大规模CC-NUMA系统的结点间互连复杂度上升,跨结点访问带宽和延迟急剧增长,影响了系统性能的有效扩展.MPD系统通过在结点内构建多个并行缓存一致性域,突破了处理器直连能力与可识别ID数对单结点规模的限制,能够大幅减少结点数量,并将部分结点间访问转化为结点内访问,实现系统性能的有效扩展.理论分析和实验结果表明:采用同规格处理器的32路系统中,结点内4个并行缓存一致性域的MPD系统可实现结点数目减少75%、一致性目录存储开销节省40%以上、平均访问延迟降低约27.9%、系统整体性能提升约14.4%.; 关键词 cc-numa系统两级一致性域并行缓存一致性域一致性协同芯片系统可扩展性; Keywords cc-numa (cache coherence non-uniform memory access) system two-tier architecture multiple parallel cache coherency domain (MPD) coherence chip (CC) system scalability; 分类号 TP303 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名基于基地址寄存器映射的数据缓存研究: 4; 作者沈秀红赵朝君孟建熠项晓燕; 机构浙江大学超大规模集成电路设计研究所; 出处《计算机工程》 CAS CSCD 2013年第5期73-77,共5页; 文摘针对深流水线中加载指令的延时长和功耗高的问题,提出一种基于基地址寄存器映射的数据缓存访问方法。该方法在加载指令执行过程中,动态构建基地址寄存器与目标数据的局部性访问历史,并通过设计基地址寄存器跟踪缓存器,在指令译码后直接获得目标数据,从而加速加载指令的数据获取过程,减少地址计算和对高速缓存的访问。测试结果表明,该方法的处理器性能平均提高约3.7%,数据高速缓存功耗平均降低约18.7%。; 关键词映射关系基地址寄存器映射内存访问局部性数据一致性高速缓存; Keywords mapping relationship base address register mapping locality of memory access data coherence high rate cache; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名基于紧耦合单跳步多平面架构的高端服务器设计被引量：7: 5; 作者王恩东陈继承胡雷钧公维峰; 机构浪潮集团有限公司高效能服务器和存储技术国家重点实验室; 出处《高技术通讯》 CAS CSCD 北大核心 2014年第2期111-116,共6页; 基金 863计划(2008AA01A202) 973计划(2010CB735905)资助项目; 文摘针对高端服务器设计面临的可扩展性问题,提出了一种紧耦合单跳步多平面(TSMP)体系结构设计方法。该方法采用双侧多平面互连结构,支持8-32路规模无缝扩展;基于两级目录结构的高速缓存一致性实现方法,支持高并发一致性访问和高效冲突处理,有效降低一致性访问传输、处理延迟。该方法已应用于浪潮32路K1高端服务器的设计,对设计的系统进行了内存性能、处理性能和可扩展性测试,测试结果表明,采用该设计可使高端服务器的计算、访存性能随系统规模从单路到32路线性增长。K1高端服务器支持基于QPI1.0协议的Intel安腾(Itanium)4核CPU-Tukwila和8核CPU-Polson,是中国研制的首台投入商业化应用的高端服务器。; 关键词缓存一致性非均匀存储访问(cc-numa) 紧耦合单跳步多平面(TSMP) QPI协议 cache一致性目录cache; Keywords cache coherence non-uniform memory access（ cc-numa）, tightly-coupled single-hop multi-plane（TSMP）, QPI, cache coherence, cache directory; 分类号 TP393.05 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名片上多核处理器的区域共享的双粒度目录: 6; 作者曾露陈新科王焕东; 机构计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京中国科学院计算技术研究所北京中国科学院大学北京龙芯中科技术有限公司北京; 出处《高技术通讯》 CAS CSCD 北大核心 2015年第7期669-676,共8页; 基金国家“核高基”科技重大专项课题(2009ZX01028-002-003,2009ZX01029-001-003,2010ZX01036-001-002,2012ZX01029-001-002-002) 国家自然科学基金(61221062,61100163,61133004,61173001,61232009,61222204) 863计划(2012AA010901,2012AA011002,2012AA012202,2013AA014301)资助项目; 文摘研究了双粒度目录(DGD)下片上多核处理器的访存行为以及DGD对不同共享行为的目录开销,以进一步降低DGD结构的面积开销。针对DGD需要为共享缓存区域创建额外的块目录项的问题,提出了创新的区域共享的双粒度目录(RSDGD)结构。该结构可用一个区域共享目录项同时维护最多3个共享者共享同一个缓存区域的一致性,从而能有效减少所需的块目录项数量,降低总的目录开销。实验结果表明,和原有的DGD相比,该结构平均减少了25%的目录空间需求,而仅产生了不到0.6%的性能损失。该结构有效地降低了芯片的面积开销,提高了目录结构的可伸缩性。; 关键词双粒度目录(DGD) 片上多核处理器缓存一致性区域共享目录一致性协议访存优化; Keywords dual-grain directory （DGD）, chip multi-core processor, cache coherence, region shared, direc-tory coherence protocol, memory access optimization; 分类号 TP332 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	CC-NUMA并行系统通信优化的变换技术	陈渝 nudt.edu.cn 李春江杨学军陈福接	《软件学报》 EI CSCD 北大核心	2000	0	在线阅读下载PDF 职称材料
2	Elastic pointer directory organization for scalable shared memory multiprocessors	Yuhang Liu Mingfa Zhu Limin Xiao	《Journal of Systems Engineering and Electronics》 SCIE EI CSCD	2014	0	在线阅读下载PDF 职称材料
3	MPD:结点具有多个并行缓存一致性域的CC-NUMA系统	陈继承赵雅倩李一韩王恩东史宏志唐士斌	《计算机研究与发展》 EI CSCD 北大核心	2017	0	在线阅读下载PDF 职称材料
4	基于基地址寄存器映射的数据缓存研究	沈秀红赵朝君孟建熠项晓燕	《计算机工程》 CAS CSCD	2013	0	在线阅读下载PDF 职称材料
5	基于紧耦合单跳步多平面架构的高端服务器设计	王恩东陈继承胡雷钧公维峰	《高技术通讯》 CAS CSCD 北大核心	2014	7	在线阅读下载PDF 职称材料
6	片上多核处理器的区域共享的双粒度目录	曾露陈新科王焕东	《高技术通讯》 CAS CSCD 北大核心	2015	0	在线阅读下载PDF 职称材料