期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
cache profiling信息指导的软件流水 被引量:1
1
作者 周谦 冯晓兵 张兆庆 《计算机研究与发展》 EI CSCD 北大核心 2008年第5期834-840,共7页
软件流水是一种重要的指令调度技术,它通过同时执行来自不同循环迭代的指令来加快循环的执行时间.随着处理器速度和访存速度差距越拉越大,访存指令尤其是cache miss的访存指令日益成为系统性能提高的瓶颈.由于这些指令的延迟不是固定的... 软件流水是一种重要的指令调度技术,它通过同时执行来自不同循环迭代的指令来加快循环的执行时间.随着处理器速度和访存速度差距越拉越大,访存指令尤其是cache miss的访存指令日益成为系统性能提高的瓶颈.由于这些指令的延迟不是固定的,如何在软件流水中预测并掩盖这些访存指令的延迟是非常重要的.与前人预测访存延迟的方法不同,引入cache profiling技术,通过动态收集到profile信息来预测访存延迟,并进行适当的调度.当增加模调度循环中的访存指令的延迟时,启动间隔也会随之增大,导致性能不会随之上升.CSMS算法和FLMS算法在尽量不增大启动间隔的情况下,改变访存指令的延迟.改进了CSMS算法和FLMS算法,根据cache profiling的信息来改变访存延迟,所以比前人的方法更为准确.实验表明,新方法可以有效地提高程序性能,对SPEC2000测试程序平均性能提高1%左右,个别例子的性能改进高达11%. 展开更多
关键词 软件流水 模调度 CACHE PRofILING 访存延迟 高性能计算
在线阅读 下载PDF
异质存储系统中的高速缓存机制研究 被引量:6
2
作者 王超 张惠臻 +1 位作者 周学海 马宏星 《电子学报》 EI CAS CSCD 北大核心 2011年第6期1267-1271,共5页
存储子系统是嵌入式系统的重要组成部分.由于传统存储系统的设计已经无法满足容量日益增长的需求,固态存储器的应用越来越广泛.针对固态存储系统的存取速率慢的问题,目前常用的优化技术主要有缓存和并行读写技术.然而,在大多数应用和研... 存储子系统是嵌入式系统的重要组成部分.由于传统存储系统的设计已经无法满足容量日益增长的需求,固态存储器的应用越来越广泛.针对固态存储系统的存取速率慢的问题,目前常用的优化技术主要有缓存和并行读写技术.然而,在大多数应用和研究中,如何将这两类技术进行融合是目前遇到的一个重大挑战.对此,本文提出一种融合了缓存技术和并行读写技术的基于循环缓冲的新型缓存机制.本方案将缓冲和固态存储模块通过交叉矩阵进行互联,并用专门的缓冲来进行读写过程中的错误处理.理论计算和仿真实验表明该机制能够有效地提升大容量固态存储系统的访问速率.原型系统证明本方案具有直接在电路板布局布线实现的高可行性. 展开更多
关键词 异构存储系统 交叉矩阵 缓冲调度
在线阅读 下载PDF
一种全球实时漫游的算法 被引量:1
3
作者 杜伟 李学军 刘涛 《计算机应用》 CSCD 北大核心 2004年第1期136-139,共4页
文中提出了对全球DEM数据按照四叉树分块进行多分辨率存储的方法 ,在此基础上 ,设计了DEM数据块可见性判断算法和动态缓存调度策略。该方法通过了 10GB以上全球范围内多分辨率的DEM数据测试 ,在微机平台上图形绘制速度可达每秒 15帧。
关键词 数字高程模型 实时漫游 四叉树 可见性判断 缓存调度策略
在线阅读 下载PDF
避免模调度中cache代价的优化方法 被引量:1
4
作者 刘利 李文龙 +2 位作者 郭振宇 李胜梅 汤志忠 《软件学报》 EI CSCD 北大核心 2005年第10期1842-1852,共11页
软件流水能够加快循环的执行速度.模调度是一种被广泛采用的软件流水的启发式.为了改善存储系统,cache使用了分级机制,但这也带来了额外的存储延迟-cache代价.证明了模调度可能导致cache代价,并提出了一种可以避免模调度的cache代价的PC... 软件流水能够加快循环的执行速度.模调度是一种被广泛采用的软件流水的启发式.为了改善存储系统,cache使用了分级机制,但这也带来了额外的存储延迟-cache代价.证明了模调度可能导致cache代价,并提出了一种可以避免模调度的cache代价的PCPMS(preventcachepenaltyinmoduloscheduling)算法.实验结果表明,PCPMS能够避免模调度中的cache代价,提高程序性能. 展开更多
关键词 软件流水 模调度 存储优化 cache代价
在线阅读 下载PDF
基于存储技术的高速嵌入式处理器的设计与实现 被引量:2
5
作者 张钦 韩承德 《计算机学报》 EI CSCD 北大核心 2007年第5期831-837,共7页
SoPC(片上可编程系统,System on a Programmable Chip)在嵌入式系统中有着广泛的应用,通常用FPGA(现场可编程门阵列,Field Programmable Gate Array)实现.一类嵌入式处理器,例如小波变换处理器、压缩和解压缩处理器、FFT处理器,都可以... SoPC(片上可编程系统,System on a Programmable Chip)在嵌入式系统中有着广泛的应用,通常用FPGA(现场可编程门阵列,Field Programmable Gate Array)实现.一类嵌入式处理器,例如小波变换处理器、压缩和解压缩处理器、FFT处理器,都可以采用基于存储技术的设计方法.FPGA的片内存储资源相对较少,如何有效地利用FPGA的片内存储资源实现高速的嵌入式处理器成为需要研究的问题.文中以FFT处理器为例说明这种方法的有效性,通过采用一种地址映射调度策略和两种无冲突操作数地址映射方式,减少了所使用的FPGA片内存储资源,提高了处理速度.该FFT处理器在实际系统中起到了关键作用. 展开更多
关键词 存储技术 嵌入式处理器 FFT处理器 地址映射调度策略 无冲突操作数地址映射方式 SOPC
在线阅读 下载PDF
数据流处理系统的调度策略研究 被引量:1
6
作者 陈磊松 《计算机工程与设计》 CSCD 北大核心 2007年第8期1845-1847,共3页
对于高速网络中大容量数据流的实时查询处理,由于数据流的突发性,要求调度策略能够适应这一特点,在不降低处理系统性能的情况下进行较合适地处理。以链式调度为基础,综合先进先出和贪心策略的优点,采用一种低延迟的分段调度策略来处理... 对于高速网络中大容量数据流的实时查询处理,由于数据流的突发性,要求调度策略能够适应这一特点,在不降低处理系统性能的情况下进行较合适地处理。以链式调度为基础,综合先进先出和贪心策略的优点,采用一种低延迟的分段调度策略来处理数据流,可以尽量避免这些调度策略的缺陷,既能在一定程度上降低运行期间系统的存储需求,同时保持较低的输出延迟。 展开更多
关键词 数据流 调度策略 分段调度 低延迟 低内存需求
在线阅读 下载PDF
面向混杂流计算的适应性存储器体系结构 被引量:1
7
作者 张萌 赵磊 +1 位作者 樊晓桠 田杭沛 《西北工业大学学报》 EI CAS CSCD 北大核心 2012年第6期961-967,共7页
可将科学计算中大量算法的计算形式视为由流计算和相当比例的通用计算混合而成。针对低并行度计算以及不易流化(Streamlization)的数据结构对流计算整体性能具有较大影响,提出了一种软、硬件可控的适应性片上存储结构DAMS Cache。该结... 可将科学计算中大量算法的计算形式视为由流计算和相当比例的通用计算混合而成。针对低并行度计算以及不易流化(Streamlization)的数据结构对流计算整体性能具有较大影响,提出了一种软、硬件可控的适应性片上存储结构DAMS Cache。该结构能够同时适应混杂流计算中流数据以及标量数据的存储需求;采用了适应性动态存储资源分配策略和适应性动态地址映射策略解决地址映射冲突问题;通过全硬件支持非规则流、条件流的存储与访问,混合数据替换策略能够充分挖掘数据的生产者-消费者局部性及时间、空间局部性。验证评估实验表明,相对Cache以及SPM(Scratchpad Memory),DAMS Cache算法的适应性较好,面向混杂流计算的性能较优。 展开更多
关键词 片内高速缓存 计算机体系结构 计算机硬件 计算机仿真 计算机软件 数据处理 高效率 微处理器芯片 多处理系统 优化 资源配置 调度 结构框图 DAMS动态地址映射流
在线阅读 下载PDF
延长相变存储器寿命的写操作Cache及其调度策略
8
作者 王党辉 徐如意 +3 位作者 刘朝锋 张萌 安建峰 孙靖国 《西北工业大学学报》 EI CAS CSCD 北大核心 2016年第5期900-906,共7页
相变存储器具有可扩展性好、单元尺寸小、静态功耗低等优点,是替代DRAM做主存的候选器件之一,但其可重复写入的次数有限。提出了一种基于DRAM写操作Cache的相变存储器主存结构,包括存储器控制器、读/写操作数据通路和标志域查找等。同... 相变存储器具有可扩展性好、单元尺寸小、静态功耗低等优点,是替代DRAM做主存的候选器件之一,但其可重复写入的次数有限。提出了一种基于DRAM写操作Cache的相变存储器主存结构,包括存储器控制器、读/写操作数据通路和标志域查找等。同时还提出了相应的调度策略,包括整体的读写调度以及基于写操作频率的替换策略等。仿真结果显示,所提出的方法可将相变存储器的寿命平均延长50%以上,同时使平均仿存延迟降低35%以上。 展开更多
关键词 相变存储器 寿命 控制器 可扩展性 DRAM写操作Cache 调度 替换策略 访问延迟
在线阅读 下载PDF
导弹全寿命周期大数据分布式存储系统研究 被引量:7
9
作者 王西超 高颂 +1 位作者 浦乐 曲晓雷 《弹箭与制导学报》 北大核心 2020年第5期5-9,共5页
针对Hadoop HDFS存储大数据性能低下的问题,结合导弹全寿命周期大数据存储性能要求,以不同类型的分布式应用为依据,提出一种由大数据分布式存储层、典型缓存策略层、典型数据访问模式层和导弹上层分布式应用层构成的四层次分布式存储系... 针对Hadoop HDFS存储大数据性能低下的问题,结合导弹全寿命周期大数据存储性能要求,以不同类型的分布式应用为依据,提出一种由大数据分布式存储层、典型缓存策略层、典型数据访问模式层和导弹上层分布式应用层构成的四层次分布式存储系统。试验表明:该系统可实现导弹全寿命周期大数据的稳定快速存储;存储较小数据时平均时间高于WR算法2%,内存占用率降低32%;深度学习框架下的存储效率具有更大的缓存命中率和缓存效用。 展开更多
关键词 大数据 全寿命周期 数据访问模式 缓存调度策略 分布式存储
在线阅读 下载PDF
基于混合内存的Apache Spark缓存系统实现与优化 被引量:4
10
作者 魏森 周浩然 +1 位作者 胡创 程大钊 《计算机科学》 CSCD 北大核心 2023年第6期10-21,共12页
随着大数据时代数据规模的激增,内存计算框架得到了长足发展。主流内存计算框架Apache Spark使用内存来缓存中间结果,大幅度地提升了数据处理速度。同时,具有较快的读写速度和较大容量的非易失性存储器NVM在内存计算领域展现出了巨大的... 随着大数据时代数据规模的激增,内存计算框架得到了长足发展。主流内存计算框架Apache Spark使用内存来缓存中间结果,大幅度地提升了数据处理速度。同时,具有较快的读写速度和较大容量的非易失性存储器NVM在内存计算领域展现出了巨大的发展前景,使用DRAM和NVM构建Spark混合缓存系统成为一种可行方案。文中提出了一种基于DRAM-NVM混合内存的Spark缓存系统,该系统选择平面混合缓存模型作为设计方案,然后为缓存块管理系统设计了专用的数据结构,并提出了适用于Spark的混合缓存系统整体设计架构。另外,为了将频繁访问的缓存块保存在DRAM缓存中,提出了基于缓存块最小重用代价的混合缓存管理策略。首先从DAG信息中获取RDD的未来重用次数,未来重用次数多的缓存块将被优先保存在DRAM缓存中,并在缓存块迁移时考虑了迁移成本。设计实验表明,DRAM-NVM混合缓存相比原有缓存系统的性能平均提升了53.06%,对于相同的混合内存,所提策略相比默认缓存策略有平均35.09%的提升。同时,使用文中设计的混合系统只需要1/4的DRAM和3/4的NVM作为缓存,就能达到全部DRAM缓存约79%的性能表现。 展开更多
关键词 SPARK 缓存管理策略 NVM 混合内存
在线阅读 下载PDF
Spark框架中RDD缓存替换策略优化 被引量:9
11
作者 陈天宇 张龙信 +1 位作者 李肯立 周立前 《小型微型计算机系统》 CSCD 北大核心 2019年第6期1248-1253,共6页
Spark作为分布式计算引擎,其基于内存的抽象概念弹性分布式数据集(RDD)产生了高效的数据处理能力.实际的生产环境中,任务在执行的过程中经常由于内存空间不足需要替换掉部分RDD. Spark默认的最近最少使用替换算法(LRU)仅考虑最近是否使... Spark作为分布式计算引擎,其基于内存的抽象概念弹性分布式数据集(RDD)产生了高效的数据处理能力.实际的生产环境中,任务在执行的过程中经常由于内存空间不足需要替换掉部分RDD. Spark默认的最近最少使用替换算法(LRU)仅考虑最近是否使用RDD分片而忽略其它因素.基于RDD权重值改进后的WR缓存替换策略侧重于RDD的权值替换,在此研究基础上,本文提出了缓存权重替换(CWS)策略,优化选择策略,并在替换阶段考虑了历史访问次数与计算成本.本文的实验使用斯坦福大学提供的公开网络分析项目进行测试,实验结果表明CWS策略在充足内存条件下处理较小数据的平均执行时间高于WR算法2. 4%,内存占用率相比降低36%. 展开更多
关键词 缓存策略 SPARK 弹性分布式数据集 内存计算
在线阅读 下载PDF
一种基于Inter-warp异构性的缓存管理与内存调度机制
12
作者 方娟 魏泽琳 于婷雯 《计算机工程与科学》 CSCD 北大核心 2019年第5期788-795,共8页
在GPU中,一个warp内的所有线程在锁步中执行相同的指令。某些线程的内存请求可以得到快速处理,而其余请求会经历较长时间。在最慢的请求完成之前,warp不能执行下一条指令,导致内存发散。对GPU中warp间的异构性进行了研究,实现并优化了... 在GPU中,一个warp内的所有线程在锁步中执行相同的指令。某些线程的内存请求可以得到快速处理,而其余请求会经历较长时间。在最慢的请求完成之前,warp不能执行下一条指令,导致内存发散。对GPU中warp间的异构性进行了研究,实现并优化了一种基于inter-warp异构性的缓存管理机制和内存调度策略,以减少内存发散和缓存排队延迟的负面影响。根据缓存命中率将warp分类,以驱动后面的3个组件:(1)基于warp类型的缓存旁路技术组件,使低缓存利用率的warp进入旁路,不访问L2缓存;(2)基于warp类型的缓存插入/提升策略组件,防止来自高缓存利用率warp的数据被过早清除;(3)基于warp类型的内存控制器组件,优先处理从高缓存利用率的warp接收到的请求,并优先处理来自相同warp的请求。基于warp间异构性的缓存管理和内存调度机制在8种不同的GPGPU应用中,与基准GPU相比,平均加速18.0%。 展开更多
关键词 缓存管理 内存调度 内存发散 线程束
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部