期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
多核处理器机群Memory层次化并行计算模型研究 被引量:17
1
作者 涂碧波 邹铭 +2 位作者 詹剑锋 赵晓芳 樊建平 《计算机学报》 EI CSCD 北大核心 2008年第11期1948-1955,共8页
多核处理器机群点对点通信同时具有memory纵向层次化特征和横向层次化的新特征.纵向层次化特征揭示了对不同大小和步长的消息进行点对点通信时消息通信中间件对其性能的影响;横向层次化的新特征由intra-CMPi、nter-CMP和inter-node消息... 多核处理器机群点对点通信同时具有memory纵向层次化特征和横向层次化的新特征.纵向层次化特征揭示了对不同大小和步长的消息进行点对点通信时消息通信中间件对其性能的影响;横向层次化的新特征由intra-CMPi、nter-CMP和inter-node消息通信性能的显著差异引起,目前缺少有效的分析模型.文中提出一种新的memory层次化并行计算模型,对多核处理器机群memory横向、纵向层次化特征进行了统一的抽象.在对多核处理器机群点对点通信和集合通信的开销进行模型分析和实际测试中,新模型的精确性优于现有的未引入memory横向层次化特征的模型. 展开更多
关键词 多核处理器机群 memory层次化 并行计算模型 MPI 多核意识
在线阅读 下载PDF
嵌入式处理器中访存部件的低功耗设计研究 被引量:11
2
作者 黄海林 范东睿 +1 位作者 许彤 唐志敏 《计算机学报》 EI CSCD 北大核心 2006年第5期815-821,共7页
以“龙芯1号”处理器为研究对象,探讨了嵌入式处理器中访存部件的低功耗设计方法.通过对访存部件的结构、功耗以及关键路径进行分析,利用局部性原理,提出一种根据虚拟地址历史记录进行判断的方法,可以显著减少TLB和Cache对RAM块的访问次... 以“龙芯1号”处理器为研究对象,探讨了嵌入式处理器中访存部件的低功耗设计方法.通过对访存部件的结构、功耗以及关键路径进行分析,利用局部性原理,提出一种根据虚拟地址历史记录进行判断的方法,可以显著减少TLB和Cache对RAM块的访问次数,使得TLB部件功耗平均降低了28.1%,Cache部件功耗平均降低了54.3%,处理器总功耗平均降低了23.2%,而关键路径延时反而减少,处理器性能略有提高. 展开更多
关键词 访存部件 TLB CACHE 低功耗 龙芯1号
在线阅读 下载PDF
面向Cell宽带引擎架构的异构多核访存技术 被引量:10
3
作者 冯国富 董小社 +1 位作者 丁彦飞 王旭昊 《西安交通大学学报》 EI CAS CSCD 北大核心 2009年第2期1-5,共5页
针对Cell宽带引擎架构(CBEA)多核高性能处理器要求软件显式地对分层存储结构进行管理,带来架构的可编程性及性能等问题,提出了一种基于CBEA的异构多核访存技术.将CBEA访存分为批量访存和按需访存;通过合理部署数据缓冲区来减小批... 针对Cell宽带引擎架构(CBEA)多核高性能处理器要求软件显式地对分层存储结构进行管理,带来架构的可编程性及性能等问题,提出了一种基于CBEA的异构多核访存技术.将CBEA访存分为批量访存和按需访存;通过合理部署数据缓冲区来减小批量访存计算中的片内访存开销,利用支持粗粒度访问的软件管理cache及数据预取来降低按需访存的片外访存开销;以访存接口库的方式来改善软件的可编程性.实验结果表明,所提技术的访存接口库在批量访存方式下的性能比ALF和CellSs提高了30%~50%,按需访存中软件管理cache性能比CBE软件开发工具包提高了20%~30%,4路数据预取访存比单路缓存的性能提高约50%. 展开更多
关键词 异构多核 访存技术 分层存储结构 Cell宽带引擎架构
在线阅读 下载PDF
GPU异构系统中的存储层次和负载均衡策略研究 被引量:12
4
作者 马安国 成玉 +1 位作者 唐遇星 邢座程 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第5期38-43,共6页
GPU体系结构的革新和相应开发平台的发展使得GPU广泛地应用于科学计算领域。通过深入地分析GPU体系结构和存储层次的优缺点以及GPU上的关键性能特征,阐明了GPU体系结构、编程模型和存储层次之间的关系。针对GPU异构系统上的应用映射提... GPU体系结构的革新和相应开发平台的发展使得GPU广泛地应用于科学计算领域。通过深入地分析GPU体系结构和存储层次的优缺点以及GPU上的关键性能特征,阐明了GPU体系结构、编程模型和存储层次之间的关系。针对GPU异构系统上的应用映射提出三种基本负载均衡优化策略:预取、流化、任务划分。试验结果揭示了不同的优化因子与优化效率之间的具体关联。 展开更多
关键词 GPGPU 存储层次 负载均衡策略 流计算 任务划分
在线阅读 下载PDF
一种基于两级存储结构的网络流量测量算法 被引量:3
5
作者 张进 刘勤让 +1 位作者 司亮 邬江兴 《计算机工程》 CAS CSCD 北大核心 2007年第10期10-12,21,共4页
为了准确而完备地测量高速骨干网中各条流的流量,需要容量大且速度快的存储器来保存所有流的状态信息,因而代价极高。该文提出了一种基于两级存储结构的网络流量测量算法。两级存储结构由容量小但速度快的一级存储器和容量大但速度慢的... 为了准确而完备地测量高速骨干网中各条流的流量,需要容量大且速度快的存储器来保存所有流的状态信息,因而代价极高。该文提出了一种基于两级存储结构的网络流量测量算法。两级存储结构由容量小但速度快的一级存储器和容量大但速度慢的二级存储器构成。考虑到网络流量分布的Quasi-Zipf法则,测量算法尽量将大流量流的状态信息保存在一级存储器中,将小流量流的状态信息保存在二级存储器中,较好地解决了存储器容量和速度之间的矛盾。仿真结果表明,与抽样测量相比,该算法具有较小、较平均的测量误差。 展开更多
关键词 流量测量 分级存储结构 网络监测
在线阅读 下载PDF
面向存储层次设计优化的GPU程序性能分析 被引量:2
6
作者 唐滔 彭林 +1 位作者 黄春 杨灿群 《计算机科学》 CSCD 北大核心 2017年第12期1-10,共10页
图形处理器凭借着比传统CPU更高的峰值性能和能效,以及日渐成熟的软件环境,逐渐成为构建异构并行系统的最流行的加速器之一。虽然GPU依靠轻量级线程的灵活切换来隐藏访存延迟,但其超高的并发度仍然给存储系统带来了很大压力,其性能的有... 图形处理器凭借着比传统CPU更高的峰值性能和能效,以及日渐成熟的软件环境,逐渐成为构建异构并行系统的最流行的加速器之一。虽然GPU依靠轻量级线程的灵活切换来隐藏访存延迟,但其超高的并发度仍然给存储系统带来了很大压力,其性能的有效发挥受访存效率的强烈影响。因此GPU程序的访存行为分析及优化一直是GPU相关领域的研究热点,但很少有工作从体系结构的角度分析存储层次的设计对性能的影响。为了更好地指导GPU存储层次的设计和访存优化,从实验的角度详细地分析了GPU各存储层次对程序性能的影响,并总结出若干指导性的优化策略,为未来类似体系结构的存储层次设计和程序优化提供建议。 展开更多
关键词 异构系统 图形处理器 存储层次 性能分析 优化
在线阅读 下载PDF
Linux环境下软PLC开发系统的设计与实现 被引量:4
7
作者 陈雪 刘荫忠 杨东升 《组合机床与自动化加工技术》 北大核心 2010年第11期40-43,共4页
文章主要介绍了在Linux操作系统环境下,软PLC梯形图的编辑技术。采用基于面向对象的方法,在分析了梯形图组成元素的基础上,阐述了设计过程中使用的类层次结构,并根据梯形图动态存储的特点,描述了存储梯形图元素及元素间拓扑关系的数据... 文章主要介绍了在Linux操作系统环境下,软PLC梯形图的编辑技术。采用基于面向对象的方法,在分析了梯形图组成元素的基础上,阐述了设计过程中使用的类层次结构,并根据梯形图动态存储的特点,描述了存储梯形图元素及元素间拓扑关系的数据结构。在Linux操作系统平台上,对系统的各个设计阶段进行了测试,测试结果表明所设计的开发系统能够正确实现编辑、转换和编译功能,将生成的目标代码C语言程序最终编译成目标逻辑组件,被运行系统调用执行。 展开更多
关键词 梯形图 编辑 类层次 存储结构 C语言程序
在线阅读 下载PDF
基于经典存储器的量子计算机存储系统 被引量:1
8
作者 吴俊杰 姜晶菲 +1 位作者 潘晓辉 杨学军 《计算机工程与应用》 CSCD 北大核心 2006年第30期98-101,共4页
量子计算机具有许多与经典计算机不同的量子特性,其性能远远优于经典计算机,但量子力学特有的性质也使得量子计算机的设计方法不同于经典计算机。在量子计算机中应用经典计算机的存储层次将会遇到一些前所未有的困难,文章提出了一种解... 量子计算机具有许多与经典计算机不同的量子特性,其性能远远优于经典计算机,但量子力学特有的性质也使得量子计算机的设计方法不同于经典计算机。在量子计算机中应用经典计算机的存储层次将会遇到一些前所未有的困难,文章提出了一种解决方案,以便能够在量子计算机的存储系统中应用与经典计算机类似的层次结构来提高访存性能。最后,文章给出了这种层次结构下访存性能的分析结果,指出了在何种条件下才能最大程度地发挥层次结构的性能。 展开更多
关键词 量子计算机 存储层次 量子存储器
在线阅读 下载PDF
一种基于容量复用的异构CMP Cache 被引量:2
9
作者 高翔 章隆兵 胡伟武 《计算机研究与发展》 EI CSCD 北大核心 2008年第5期877-885,共9页
多核环境下的Cache设计技术受到线延时和应用等多方面因素影响,私有和共享方案都存在各自的不足.提出了一种异构的CMP Cache结构,采用两类具有不同Cache层次的结点组成多核芯片,设计了基于间接索引的Cache容量复用等技术,提供了容量有... 多核环境下的Cache设计技术受到线延时和应用等多方面因素影响,私有和共享方案都存在各自的不足.提出了一种异构的CMP Cache结构,采用两类具有不同Cache层次的结点组成多核芯片,设计了基于间接索引的Cache容量复用等技术,提供了容量有效且访问迅速的片上存储层次.在全系统环境下对SPEC CPU2000,SPLASH2等程序的评测结果表明,异构CMP Cache结构能够适应各类应用的需要,对单进程和多线程应用平均性能提高分别可达16%和9%.异构CMP Cache同时具有硬件设计简单的特点,具有较好的工程可实现性,其设计思想将应用在未来的龙芯多核处理器设计中. 展开更多
关键词 片上多核处理器 存储层次 异构 容量复用 高速缓存一致性
在线阅读 下载PDF
单片多处理器的研究 被引量:7
10
作者 史莉雯 樊晓桠 张盛兵 《计算机应用研究》 CSCD 北大核心 2007年第9期46-49,共4页
单片多处理器结构支持较高线程级的并行,能显著提高性能。介绍了单片多处理器的结构,对一些结构模型和实际的商用处理器进行举例,并对关键技术进行了研究分析。
关键词 单片多处理器 线程级并行 存储层次 核间互连 多核任务调度
在线阅读 下载PDF
基于FPGA的RISC CPU设计 被引量:4
11
作者 龙惠民 吴静 《兵工自动化》 2006年第12期86-87,92,共3页
基于FPGA的RISC CPU系统,以RISC CPU为核心,FPGA为目标芯片,RISC CPU与存储器使用WISHBONE总线接口。采用高速缓存、主存和虚拟存储器三级层次体系,以哈佛结构满足同时钟周期内同时处理取指令和读写数据的请求。其Cache系统含标志寄存... 基于FPGA的RISC CPU系统,以RISC CPU为核心,FPGA为目标芯片,RISC CPU与存储器使用WISHBONE总线接口。采用高速缓存、主存和虚拟存储器三级层次体系,以哈佛结构满足同时钟周期内同时处理取指令和读写数据的请求。其Cache系统含标志寄存器、数据寄存器和状态机。当CPU读取Cache的数据时,先将物理地址的最高位与标志存储器中对应地址标签比较。判断是否将数据总线直接传送给CPU。 展开更多
关键词 RISC CPU FPGA 三级层次存储体系 WISHBOEN接口
在线阅读 下载PDF
面向嵌入式多核存储层次的OpenMP优化研究 被引量:2
12
作者 王庆 季振洲 刘涛 《计算机研究与发展》 EI CSCD 北大核心 2011年第S1期273-277,共5页
当前嵌入式多核处理器的应用越来越普遍,如何充分认识与利用嵌入式多核的并行计算效率已经成为嵌入式多核并行计算的热门问题.讨论了两种不同的共享式嵌入式多核存储层次结构,即无二级共享Cache和拥有二级共享Cache的多核存储结构,在这... 当前嵌入式多核处理器的应用越来越普遍,如何充分认识与利用嵌入式多核的并行计算效率已经成为嵌入式多核并行计算的热门问题.讨论了两种不同的共享式嵌入式多核存储层次结构,即无二级共享Cache和拥有二级共享Cache的多核存储结构,在这些嵌入式多核系统中进行实际的OpenMP并行应用计算,并通过增加OpenMP对循环分块的支持来对并行程序进行数据优化.实验结果对比分析表明,在嵌入式多核中采用共享二级Cache对并行程序性能影响不大,而在对并行程序进行优化后性能平均有6%的提高. 展开更多
关键词 嵌入式多核 层次存储 共享二级Cache 数据局部性
在线阅读 下载PDF
Cholesky分解递归算法与改进 被引量:11
13
作者 陈建平 Jerzy Wasniew ski 《计算机研究与发展》 EI CSCD 北大核心 2001年第8期923-926,共4页
递归算法是计算稠密线性代数的一种新的有效方法 .递归产生自动、变化的矩阵分块 ,能充分发挥当今分级存储高性能计算机的效率 .对 Cholesky分解递归算法进行了研究 ,给出了算法的详细推导过程 ,用具有递归功能的 Fortran 90实现了算法 ... 递归算法是计算稠密线性代数的一种新的有效方法 .递归产生自动、变化的矩阵分块 ,能充分发挥当今分级存储高性能计算机的效率 .对 Cholesky分解递归算法进行了研究 ,给出了算法的详细推导过程 ,用具有递归功能的 Fortran 90实现了算法 ,并通过矩阵元素顺序重排的方法 ,进一步提高了递归算法的运算速度 .研究产生的算法比目前常用的分块算法快 15 %~ 2 5 % . 展开更多
关键词 数值计算 矩阵分块 分级存储 CHOLESKY分解 递归算法 计算机
在线阅读 下载PDF
一种识别作战意图的层次聚合模型 被引量:8
14
作者 李颖 武君胜 +2 位作者 李伟刚 董玮 房爱青 《西北工业大学学报》 EI CAS CSCD 北大核心 2023年第2期400-408,共9页
作战意图识别是指对敌方目标的状态信息进行分析,从而解释和判断敌方想要达到的目的。随着作战平台信息化程度的不断提高,这些具有时序性的敌方状态信息呈现多维、海量的特点。面对这样的特点,提出基于神经网络的方法学习敌方状态信息... 作战意图识别是指对敌方目标的状态信息进行分析,从而解释和判断敌方想要达到的目的。随着作战平台信息化程度的不断提高,这些具有时序性的敌方状态信息呈现多维、海量的特点。面对这样的特点,提出基于神经网络的方法学习敌方状态信息。由于作战意图具有层次性,并且意图行为之间具有依赖关系,设计了一种层次聚合模型,模型底层基于卷积神经网络感知行为特征,中间层基于双向长短时记忆网络聚合子意图之间的长时依赖信息,表达意图内部关系。顶层通过注意力机制将特征聚焦于对识别意图有更高贡献的高级特征,最终感知全局信息以识别目标作战意图。实验数据表明,相比其他网络结构,提出的模型可以表达意图的层次性以及意图之间的长时依赖关系,识别准确率可以达到88.83%,适用于现代战场空中目标意图的识别问题。 展开更多
关键词 意图识别 卷积神经网络 双向长短时记忆网络 注意力机制 层次聚合
在线阅读 下载PDF
改进的基于目录的Cache一致性协议 被引量:1
15
作者 王铮 张毅 《计算机工程》 CAS CSCD 北大核心 2009年第1期87-89,共3页
介绍几种典型目录一致性协议并分析它们的优缺点。在综合全映射目录和有限目录优点的基础上,通过在存储器层上增加一个存储器高速缓存(Cache)层的方式,提出并讨论一种改进后的Cache一致性协议。该协议相对有限目录存储开销增加不多的情... 介绍几种典型目录一致性协议并分析它们的优缺点。在综合全映射目录和有限目录优点的基础上,通过在存储器层上增加一个存储器高速缓存(Cache)层的方式,提出并讨论一种改进后的Cache一致性协议。该协议相对有限目录存储开销增加不多的情况下,提高了系统性能和可扩展性。 展开更多
关键词 高速缓存 一致性 可扩展性 存储器层次 多处理机系统
在线阅读 下载PDF
宋代家庙制度考略 被引量:5
16
作者 刘雅萍 《兰州大学学报(社会科学版)》 CSSCI 北大核心 2009年第1期62-68,共7页
祭祀祖先是古人一项重要的生活内容,上至天子,下至庶民,都要进行祭祖活动,并形成了一套完整的祭祀制度。社会各个阶层按照其不同的身份地位,有着规制不同的祭祀规定:太庙是皇帝祭祖之所,家庙是世族大臣祭祖之所,庶民只能在寝室祭拜祖先... 祭祀祖先是古人一项重要的生活内容,上至天子,下至庶民,都要进行祭祖活动,并形成了一套完整的祭祀制度。社会各个阶层按照其不同的身份地位,有着规制不同的祭祀规定:太庙是皇帝祭祖之所,家庙是世族大臣祭祖之所,庶民只能在寝室祭拜祖先。随着社会的发展,祭祀制度发生了巨大的变化,象征身份等级的家庙制度逐步瓦解,为民间祠堂所替代。 展开更多
关键词 宋代 家庙 祭祀 等级制度
在线阅读 下载PDF
家族认同到中华民族认同的演进逻辑--基于南岭竹篙火龙节的讨论 被引量:10
17
作者 林继富 吴佩琦 《青海民族研究》 CSSCI 北大核心 2021年第3期90-97,共8页
传统节日蕴含了地方核心文化和价值观念,是认同表达的符号系统。南岭人围绕流传竹篙火龙节中包含的历史事件、文化记忆,形成了现代竹篙火龙节不同层次的记忆和认同。南岭竹篙火龙节呈现出家族、地域和中华民族认同层次的表达内容与表达... 传统节日蕴含了地方核心文化和价值观念,是认同表达的符号系统。南岭人围绕流传竹篙火龙节中包含的历史事件、文化记忆,形成了现代竹篙火龙节不同层次的记忆和认同。南岭竹篙火龙节呈现出家族、地域和中华民族认同层次的表达内容与表达方式的演进逻辑,并将区域性家族生活、地方社会交往交流交融过程中的共同记忆凝聚为中华民族的共同记忆,进而形成南岭人的中华民族共同体认同。 展开更多
关键词 传统节日 竹篙火龙节 认同表达 记忆层次性
在线阅读 下载PDF
高速缓存优化的并行连接算法 被引量:1
18
作者 胡泽林 张云泉 《计算机工程与设计》 CSCD 北大核心 2009年第20期4581-4584,共4页
由于嵌套循环连接操作过程中存在较大的高速缓存缺失,严重影响了连接查询的性能。提出了一种基于缓冲的高速缓存参数无关的嵌套循环并行连接算法。通过高速缓存参数无关和缓冲技术,提高了连接算法的空间局部性和时间局部性。理论分析和... 由于嵌套循环连接操作过程中存在较大的高速缓存缺失,严重影响了连接查询的性能。提出了一种基于缓冲的高速缓存参数无关的嵌套循环并行连接算法。通过高速缓存参数无关和缓冲技术,提高了连接算法的空间局部性和时间局部性。理论分析和实验结果表明,高速缓存优化后的串行连接算法的性能是原来的2倍,其并行算法效果近似线性加速比。 展开更多
关键词 存储层次 理想高速缓存模型 高速缓存参数无关 高度划分聚类 缓冲 并行化
在线阅读 下载PDF
多核机群下MPI程序优化技术的研究 被引量:2
19
作者 王洁 衷璐洁 曾宇 《计算机科学》 CSCD 北大核心 2011年第10期281-284,共4页
多核处理器的新特性使多核机群的存储层次更加复杂,同时也给MPI程序带来了新的优化空间。国内外学者提出了许多多核机群下MPI程序的优化方法和技术。测试了3个不同多核机群的通信性能,并分别在Intel与AMD多核机群下实验评估了几种具有... 多核处理器的新特性使多核机群的存储层次更加复杂,同时也给MPI程序带来了新的优化空间。国内外学者提出了许多多核机群下MPI程序的优化方法和技术。测试了3个不同多核机群的通信性能,并分别在Intel与AMD多核机群下实验评估了几种具有普遍意义的优化技术:混合MPI/OpenMP、优化MPI运行时参数以及优化MPI进程摆放,同时对实验结果和优化性能进行了分析。 展开更多
关键词 多核机群 存储层次化 MPI程序优化 混合MPI/OpenMP MPI运行时参数 MPI进程摆放
在线阅读 下载PDF
基本线性计算模型的CUR分析与并行程序有效速度的实用测定方法 被引量:1
20
作者 王文义 张行进 《计算机工程与应用》 CSCD 北大核心 2002年第17期135-137,共3页
具有巨量数据的科学计算程序在并行计算机上的有效速度往往是很低的,因此需要尽可能地借助算法来改善这种状况。基于高性能科学计算中对某些基本线性计算模型的处理要耗费大部分CPU时间以及cache具有较高速度这一事实,文章着重对这些计... 具有巨量数据的科学计算程序在并行计算机上的有效速度往往是很低的,因此需要尽可能地借助算法来改善这种状况。基于高性能科学计算中对某些基本线性计算模型的处理要耗费大部分CPU时间以及cache具有较高速度这一事实,文章着重对这些计算模型的cache利用率CUR(CacheUsingRatio)进行了分析与实验比较,同时也对用户如何获取程序的浮点运算速度的方法进行了讨论。 展开更多
关键词 线性计算模型 CUR分析 并行程序 有效速度 实用测定方法 消息传递接口 算法 并行计算机
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部