期刊文献+
共找到65篇文章
< 1 2 4 >
每页显示 20 50 100
深度学习在多核缓存预取中的应用研究综述
1
作者 张建勋 乔欣雨 林炳辉 《计算机应用研究》 CSCD 北大核心 2024年第2期341-347,共7页
当前人工智能技术应用于系统结构领域的研究前景广阔,特别是将深度学习应用于多核架构的数据预取研究已经成为国内外的研究热点。针对基于深度学习的缓存预取任务进行了研究,形式化地定义了深度学习缓存预取模型。在介绍当前常见的多核... 当前人工智能技术应用于系统结构领域的研究前景广阔,特别是将深度学习应用于多核架构的数据预取研究已经成为国内外的研究热点。针对基于深度学习的缓存预取任务进行了研究,形式化地定义了深度学习缓存预取模型。在介绍当前常见的多核缓存架构和预取技术的基础上,全面分析了现有基于深度学习的典型缓存预取器的设计思路。深度学习神经网络在多核缓存预取领域的应用主要采用了深度神经网络、循环神经网络、长短期记忆网络和注意力机制等机器学习方法,综合对比分析现有基于深度学习的数据预取神经网络模型后发现,基于深度学习的多核缓存预取技术在计算成本、模型优化和实用性等方面还存在着局限性,未来在自适应预取模型以及神经网络预取模型的实用性方面还有很大的研究探索空间和发展前景。 展开更多
关键词 深度学习 数据预取 多核架构 缓存优化 神经网络 研究综述
在线阅读 下载PDF
基于龙芯2F体系结构的BLAS库优化 被引量:13
2
作者 顾乃杰 李凯 +1 位作者 陈国良 吴超 《中国科学技术大学学报》 CAS CSCD 北大核心 2008年第7期854-859,共6页
在KD-50-I平台上,基于常用优化技术,根据龙芯2F体系结构的特点,在数据预取、指令调度方面,针对高性能计算机系统中能有效解决线性代数问题的子程序集合BLAS,提出了新的优化技术,充分发挥龙芯2F处理器的性能,实现了高性能的BLAS.实际测... 在KD-50-I平台上,基于常用优化技术,根据龙芯2F体系结构的特点,在数据预取、指令调度方面,针对高性能计算机系统中能有效解决线性代数问题的子程序集合BLAS,提出了新的优化技术,充分发挥龙芯2F处理器的性能,实现了高性能的BLAS.实际测试表明,高性能BLAS在750 MHz的龙芯2F处理器(双精度浮点峰值3 Gflops)上HPL实测峰值达到1.47 GHz,比原始BLAS提高了6倍以上,比ATLAS提高了45%. 展开更多
关键词 BLAS 龙芯2F KD-50-Ⅰ 数据预取 指令调度
在线阅读 下载PDF
移动环境下支持实时事务处理的数据预取 被引量:8
3
作者 李国徽 杨兵 +1 位作者 陈辉 杜建强 《计算机学报》 EI CSCD 北大核心 2008年第10期1841-1847,共7页
随着移动通信技术的迅速发展,人们提出了新的应用要求:在移动环境下处理实时事务.而移动通信带宽有限性引起较大的数据访问延迟,有时甚至由于网络传输的断接使得事务得不到所需要的数据,数据预取能够很好地解决这个问题.已有的移动环境... 随着移动通信技术的迅速发展,人们提出了新的应用要求:在移动环境下处理实时事务.而移动通信带宽有限性引起较大的数据访问延迟,有时甚至由于网络传输的断接使得事务得不到所需要的数据,数据预取能够很好地解决这个问题.已有的移动环境下数据预取没有考虑到数据的流行性和事务的时间特性.该文分析影响实时事务数据预取的因素,首先考虑数据易变性、活跃性等因素,获得高价值预取数据集合;然后考虑访问预取数据的事务优先级、数据流行性等因素,构造预取数据的选择函数,通过该函数在前面选取的集合中筛选出对满足实时事务截止期更有价值的数据对象进行预取.实验表明,该数据预取策略能降低移动实时事务满足截止期的比率,更好地支持移动实时事务处理. 展开更多
关键词 数据预取 移动实时事务 缓存失效 预取策略
在线阅读 下载PDF
一种自适应的数据预取与缓冲算法 被引量:6
4
作者 朱鸿宇 刘瑰 +1 位作者 唐福华 陈左宁 《计算机工程与应用》 CSCD 北大核心 2006年第24期13-15,42,共4页
在海量数据中进行的直接查找往往耗时巨大,在实际应用中很难满足实时性的需求,因此采用数据预取和缓冲技术实现对查找操作的优化成为实际系统中的重要环节。自适应的数据预取和缓冲算法是通过使用人工智能中的技术来分析用户的查询习惯... 在海量数据中进行的直接查找往往耗时巨大,在实际应用中很难满足实时性的需求,因此采用数据预取和缓冲技术实现对查找操作的优化成为实际系统中的重要环节。自适应的数据预取和缓冲算法是通过使用人工智能中的技术来分析用户的查询习惯,从而实现动态的预取策略并对预取的数据进行缓冲,以达到提高查询速度的目的。文章根据不同的数据查询需求提出了两类智能算法以适应不同的应用场合。在实验中分别针对单个用户的历史查询应用和多用户的并发查询应用分别进行了分析,证明了这两类智能算法分别对不同的应用场合拥有较好的性能。 展开更多
关键词 自适应 数据预取 人工智能
在线阅读 下载PDF
指令级并行编译器的数据预取及优化方法 被引量:8
5
作者 连瑞琦 张兆庆 乔如良 《计算机学报》 EI CSCD 北大核心 2000年第6期576-584,共9页
微处理器芯片的处理能力越来越强 .但是 ,存储器的速度却远远不能与其匹配 ,造成了整个系统的性能不理想 .为解决这个问题 ,编译器发展了局部性优化、数据预取等多种技术 .文中将介绍一种用于 IL P(Instructionlevel Parallelism)优化... 微处理器芯片的处理能力越来越强 .但是 ,存储器的速度却远远不能与其匹配 ,造成了整个系统的性能不理想 .为解决这个问题 ,编译器发展了局部性优化、数据预取等多种技术 .文中将介绍一种用于 IL P(Instructionlevel Parallelism)优化编译器的数据预取技术以及一种利用寄存器堆减少主存访问次数、对程序进行优化的方法 .利用它们可以提高平均存储性能 。 展开更多
关键词 数据预取 寄存器堆 预取优化 指令级并行编译器
在线阅读 下载PDF
网络化移动应用的全局适应性数据预取机制 被引量:4
6
作者 张晓薇 曹东刚 +1 位作者 田刚 陈向群 《软件学报》 EI CSCD 北大核心 2010年第8期1783-1794,共12页
提出一种多目标的数据预取方法(multiple goals oriented data prefetching,简称MGODP)来满足不同用户的数据预取需求.MGODP不仅从用户偏好出发为其预取合适量的数据,而且从服务器角度出发,对于Client/Server模式下的数据访问提出全局... 提出一种多目标的数据预取方法(multiple goals oriented data prefetching,简称MGODP)来满足不同用户的数据预取需求.MGODP不仅从用户偏好出发为其预取合适量的数据,而且从服务器角度出发,对于Client/Server模式下的数据访问提出全局合作的方法,以大幅度提高服务质量.另外,MGODP提供了移动客户端和服务器之间平衡工作负载的合作机制,合理分配系统资源,保障系统性能.通过一系列实验可以看出,MGODP方法能够很好地满足不同用户的需求,并通过全局合作和负载均衡机制在保证用户性能需求的前提下,尽可能地减小对电池电量和网络带宽的消耗. 展开更多
关键词 数据预取 用户偏好 上下文可感知 移动计算 全局协作
在线阅读 下载PDF
面向龙芯3B1500体系结构的DGEMM函数优化 被引量:3
7
作者 刘刚 张恒 +1 位作者 毛睿 陆克中 《小型微型计算机系统》 CSCD 北大核心 2014年第7期1523-1527,共5页
双精度普通矩阵乘法DGEMM函数是高性能计算基础软件BLAS库中最重要的第三级函数.本文针对龙芯3B1500处理器体系结构的特点,利用保留的物理内存与大页技术减少内存页的换进换出以及TLB缺失,通过龙芯128位向量访存指令和向量乘加指令实现... 双精度普通矩阵乘法DGEMM函数是高性能计算基础软件BLAS库中最重要的第三级函数.本文针对龙芯3B1500处理器体系结构的特点,利用保留的物理内存与大页技术减少内存页的换进换出以及TLB缺失,通过龙芯128位向量访存指令和向量乘加指令实现矩阵乘法的向量化运算,同时针对矩阵乘法中各矩阵的访存特点设计合理分块策略,并运用3B1500的cache锁机制将重复利用率高的分块锁在cache中以减少cache缺失,最后针对矩阵A和B的预取时间大于计算时间这一问题,设计了一种新的矩阵预取算法.该预取算法通过增大核心计算的计算量,将矩阵A和B的预取时间全部掩藏在计算中,并且通过ld指令与$0寄存器的配合使用来实现对C矩阵的预取.优化后的DGEMM函数无论在单线程和多线程时的性能都达到了理论峰值的80%以上. 展开更多
关键词 龙芯3B1500处理器 BLAS DGEMM 矩阵乘法 数据预取
在线阅读 下载PDF
基于龙芯3B处理器的Linpack优化实现 被引量:3
8
作者 刘刚 张恒 +1 位作者 张滇 毛睿 《深圳大学学报(理工版)》 EI CAS 北大核心 2014年第3期286-292,共7页
HPL是高性能计算广泛采用的Linpack测试软件包.针对龙芯3B处理器体系结构的特点,为Linpack中的核心部分——矩阵乘法设计矩阵分块策略,利用龙芯3B的cache锁机制将频繁调用的数据分块锁在cache中,从而显著降低cache缺失率.同时为龙芯3B... HPL是高性能计算广泛采用的Linpack测试软件包.针对龙芯3B处理器体系结构的特点,为Linpack中的核心部分——矩阵乘法设计矩阵分块策略,利用龙芯3B的cache锁机制将频繁调用的数据分块锁在cache中,从而显著降低cache缺失率.同时为龙芯3B处理器中的访存加速部件设计了高效的预取算法,以实现计算时间掩盖访存时间.另外,分别对Linpack所调用的dtrsm和行交换等热点函数进行优化,并通过参数训练来优化Linpack参数.实验结果表明,在龙芯3B处理器上,单节点4核以及双节点8核的Linpack实测性能均达到理论峰值的60%左右,优化后的Linpack性能较优化前提升了10倍左右. 展开更多
关键词 计算机系统结构 龙芯3B处理器 线性系统软件包 矩阵乘法 数据预取
在线阅读 下载PDF
三维网站智能导航系统的设计与实现 被引量:4
9
作者 陈明志 许春耀 余轮 《计算机工程与设计》 CSCD 北大核心 2010年第20期4438-4441,4483,共5页
为解决目前网络虚拟环境下信息交互因缺乏导航理论而产生的各种现实问题,如用户容易产生疲劳感与"迷航"现象,引入智能导航的设计思想。对组成智能导航系统的3个关键技术(信息推荐、路径规划与数据预取)进行了深入地分析与研究... 为解决目前网络虚拟环境下信息交互因缺乏导航理论而产生的各种现实问题,如用户容易产生疲劳感与"迷航"现象,引入智能导航的设计思想。对组成智能导航系统的3个关键技术(信息推荐、路径规划与数据预取)进行了深入地分析与研究;提出了适合网络三维虚拟环境关键技术的相应改进算法;接着整合3种技术,设计了带智能导航功能的三维网站原型系统;最后通过构建网上三维虚拟博物馆,表明智能导航系统的工作性能。 展开更多
关键词 网络虚拟环境 智能导航 信息推荐 路径规划 数据预取
在线阅读 下载PDF
基于马尔可夫模型的数据值预取方案 被引量:5
10
作者 谢学军 叶以正 +1 位作者 邱善勤 喻明艳 《电子学报》 EI CAS CSCD 北大核心 2007年第2期307-310,共4页
根据程序中Load指令的行为特征构造马尔可夫模型,进而提出预取器的结构方案.SPEC仿真结果表明,与采用二级值预测方案以及基于程序语句相关的预取方案相比,在预测指令的覆盖率上分别提高了9.51%和2.02%,在预测精度上分别提高了12.9%和8.... 根据程序中Load指令的行为特征构造马尔可夫模型,进而提出预取器的结构方案.SPEC仿真结果表明,与采用二级值预测方案以及基于程序语句相关的预取方案相比,在预测指令的覆盖率上分别提高了9.51%和2.02%,在预测精度上分别提高了12.9%和8.2%,而在IPC上,则分别提高了16.7%和7.4%. 展开更多
关键词 数据相关 马尔可夫模型 数据值预取
在线阅读 下载PDF
基于CMP的指针数据预取方法 被引量:4
11
作者 朱会东 黄永丽 宋宝卫 《计算机工程》 CAS CSCD 北大核心 2011年第6期71-73,共3页
针对现代计算机系统中的存储墙问题,提出一种适合于链式数据结构的数据预取方法——纯遍历推送方法。采用基于共享高速缓存的多核处理器平台CMP上的多线程技术,在主程序运行时分离出一个推送线程,由其将主线程需要的数据提前预取至处理... 针对现代计算机系统中的存储墙问题,提出一种适合于链式数据结构的数据预取方法——纯遍历推送方法。采用基于共享高速缓存的多核处理器平台CMP上的多线程技术,在主程序运行时分离出一个推送线程,由其将主线程需要的数据提前预取至处理器共享高速缓存中以隐藏主线程的存储器延迟。实验结果证明该方法在CMP架构下对以链式结构为主的内存受限程序的性能有一定的改进。 展开更多
关键词 存储墙 链式数据结构 多核多线程 数据预取
在线阅读 下载PDF
YHFT-DX高性能DSP中Cache失效流水设计 被引量:2
12
作者 郭阳 傅祎晖 +1 位作者 刘胜 李勇 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第6期6-11,共6页
YHFT-DX是国防科技大学自主研制的一款高性能DSP。以提升YHFT-DX的Cache性能为目标,研究了降低Cache失效延迟的优化策略,设计并实现了一种针对高频高性能DSP的一级数据Cache优化策略——失效流水。与传统优化策略相比,该策略将连续访问C... YHFT-DX是国防科技大学自主研制的一款高性能DSP。以提升YHFT-DX的Cache性能为目标,研究了降低Cache失效延迟的优化策略,设计并实现了一种针对高频高性能DSP的一级数据Cache优化策略——失效流水。与传统优化策略相比,该策略将连续访问Cache的失效请求并进行流水化处理,使多个Cache失效延迟重叠,从而达到降低平均Cache失效代价的目的。将该策略应用到YHFT-DX芯片的一级数据Cache控制器的设计与优化中,使访问Cache失效引起的流水线停顿从8拍降为2拍,显著提升了系统性能。 展开更多
关键词 DSP 失效流水 非阻塞Cache 数据预取
在线阅读 下载PDF
p-HPF并行编译系统核外计算的实现及优化策略 被引量:4
13
作者 丁文魁 汪剑平 +2 位作者 向华 李晓明 许卓群 《计算机学报》 EI CSCD 北大核心 1999年第10期1042-1049,共8页
文中阐述了p-HPF编译系统中对核外计算的支持以及采取的优化策略.通过对编程模型的扩充和并行I/O模型的构造,p-HPF编译系统已能对核外数组进行有效的处理.通过采用数据筛选、行列优先、预取、文件与数组的一一映射等优... 文中阐述了p-HPF编译系统中对核外计算的支持以及采取的优化策略.通过对编程模型的扩充和并行I/O模型的构造,p-HPF编译系统已能对核外数组进行有效的处理.通过采用数据筛选、行列优先、预取、文件与数组的一一映射等优化策略,使并行程序执行核外计算的效率得到了大幅度地提高.文中叙述了核外计算模型及其优化的设计思想与实现。 展开更多
关键词 核外计算 核外数组 数据筛选 并行编译系统
在线阅读 下载PDF
基于数据路由的分布式备份数据去重系统 被引量:2
14
作者 姚敏 尹建伟 +1 位作者 唐彦 罗智凌 《计算机工程》 CAS CSCD 北大核心 2017年第2期85-91,共7页
传统数据去重备份系统在大数据应用场景下存在备份存储空间过大和数据吞吐量不足等缺点。为此,基于数据路由设计一种分布式备份数据去重系统。该系统以数据片为去重粒度,具有数据路由和数据预取2个功能。数据路由使用布隆过滤器对需要... 传统数据去重备份系统在大数据应用场景下存在备份存储空间过大和数据吞吐量不足等缺点。为此,基于数据路由设计一种分布式备份数据去重系统。该系统以数据片为去重粒度,具有数据路由和数据预取2个功能。数据路由使用布隆过滤器对需要处理的数据片进行路由查询,数据预取则使用平均取样和基于Jaccard距离的近邻取样方案。通过数据路由分配数据片到相应处理节点进行处理,平均取样得到的数据片哈希码为数据路由提供路由信息,近邻取样得到的数据片哈希码用于系统首次数据去重。实验结果表明,该系统在保证数据去重率的同时,相对全节点查询和定点路由的数据片路由方式数据吞吐量提升明显。 展开更多
关键词 数据去重 数据路由 数据预取 布隆过滤器 Jaccard距离
在线阅读 下载PDF
导航数字地图数据组织方法和预取策略探讨 被引量:9
15
作者 叶常春 周兴铭 《计算机工程与科学》 CSCD 2004年第4期39-41,76,共4页
成本、环境因素、数据特性和应用特性使得有效实现汽车导航系统的地图显示成为一项挑战。为解决这些问题,本文从数据组织和数据缓冲角度,提出了分级数据组织、分级预取策略和基于启发信息的预取策略,并简要介绍了得到实用验证的多级Hilb... 成本、环境因素、数据特性和应用特性使得有效实现汽车导航系统的地图显示成为一项挑战。为解决这些问题,本文从数据组织和数据缓冲角度,提出了分级数据组织、分级预取策略和基于启发信息的预取策略,并简要介绍了得到实用验证的多级Hilbert-R-Tree索引。 展开更多
关键词 汽车导航系统 数字地图 数据组织 数据预取策略 数据特性
在线阅读 下载PDF
面向移动导航设备的数字地图分级组织与预取策略 被引量:4
16
作者 方钰 何启海 《小型微型计算机系统》 CSCD 北大核心 2006年第7期1339-1342,共4页
由地图数据的分级组织出发,提出一种基于多级H ilbert网格的地图数据组织与预取策略.通过多级H ilbert网格的二进制编码,使网格之间层次关系和邻近关系的刻画更加准确和灵活.而分级的数据组织,更加符合地图显示的现实情况,降低了数据预... 由地图数据的分级组织出发,提出一种基于多级H ilbert网格的地图数据组织与预取策略.通过多级H ilbert网格的二进制编码,使网格之间层次关系和邻近关系的刻画更加准确和灵活.而分级的数据组织,更加符合地图显示的现实情况,降低了数据预取和更新操作的代价.测试表明该策略优于普通的预取策略,并已在上海市交通信息网格移动信息终端的研发中取得了良好的实施效果. 展开更多
关键词 移动导航系统 数据组织 数据预取 Hilbert网格
在线阅读 下载PDF
虚拟企业合作伙伴智能优化选择研究 被引量:2
17
作者 朱会东 段赵磊 黄艳 《计算机工程与应用》 CSCD 2012年第24期57-61,100,共6页
针对复杂的虚拟企业伙伴选择问题,利用神经网络的推理功能,并结合模糊技术处理不确定因素的优势,实现最优伙伴的确定。通过分析建立了包括成本、技术能力、服务水平等指标的评价体系,采用实例验证了该方法的可行性。
关键词 虚拟企业 合作伙伴 神经网络 评价体系
在线阅读 下载PDF
帮助线程预取技术研究综述 被引量:3
18
作者 张建勋 古志民 《计算机科学》 CSCD 北大核心 2013年第7期19-23,39,共6页
帮助线程预取是当前多核平台提高非规则数据密集应用预取效果性能的关键技术之一,近年来已成为国内外的研究热点。针对非规则数据密集应用访存规律的非连续局部性特征,帮助线程预取技术利用CMP平台的最后一级共享缓存(LLC)将应用的非连... 帮助线程预取是当前多核平台提高非规则数据密集应用预取效果性能的关键技术之一,近年来已成为国内外的研究热点。针对非规则数据密集应用访存规律的非连续局部性特征,帮助线程预取技术利用CMP平台的最后一级共享缓存(LLC)将应用的非连续局部性转换为瞬时的连续时空局部性(即时局部性),从而达到通过线程级数据预取提高程序性能的目的。归纳了帮助线程预取技术的分类,概括和比较了不同帮助线程实现技术的优势和局限性,深入分析和探讨了现有的几种典型帮助线程技术的预取控制策略。最后从帮助线程实时控制、参数动态选取和优化方面指出了帮助线程预取技术的研究方向。 展开更多
关键词 帮助线程 数据预取 CMP(Chip Multi-Processor)平台 非规则数据密集应用
在线阅读 下载PDF
基于Agent的医疗信息整合平台的研究 被引量:2
19
作者 余腊生 李礼 《计算机工程与设计》 CSCD 北大核心 2010年第19期4197-4200,共4页
通过分析国外已开发的医疗信息整合平台,发现存在中心服务器负载过高以及用户获取数据缓慢的问题。针对问题并结合多Agent技术,对平台结构进行了改进,设计了新的整合平台架构。新架构通过在医疗机构服务器端设计Agent群体,形成新层以分... 通过分析国外已开发的医疗信息整合平台,发现存在中心服务器负载过高以及用户获取数据缓慢的问题。针对问题并结合多Agent技术,对平台结构进行了改进,设计了新的整合平台架构。新架构通过在医疗机构服务器端设计Agent群体,形成新层以分担中心服务器数据整合的工作,减轻了中心服务器的负载。在新架构的基础上,详细设计了平台内部Agent的功能及其协作关系。通过医院的挂号系统,触发平台Agent之间的分工协作,实现数据预取,解决了用户获取数据缓慢的问题。最后通过国内的实例验证了该方案的有效性。 展开更多
关键词 医疗信息整合 信息共享 多AGENT 负载 数据预取 信息孤岛
在线阅读 下载PDF
核外计算中的几种I/O优化方法 被引量:4
20
作者 唐剑琪 方滨兴 +1 位作者 胡铭曾 王威 《计算机研究与发展》 EI CSCD 北大核心 2005年第10期1820-1825,共6页
大数据量应用问题引入核外计算模式,由于访问磁盘数据的速度比较慢,I/O成为核外计算性能重要的限制因素·提出了一种使用运行库进行I/O优化的方法,给出了3种有效的优化策略:规则区域筛选、数据预取和边缘重用·编程人员可针对... 大数据量应用问题引入核外计算模式,由于访问磁盘数据的速度比较慢,I/O成为核外计算性能重要的限制因素·提出了一种使用运行库进行I/O优化的方法,给出了3种有效的优化策略:规则区域筛选、数据预取和边缘重用·编程人员可针对不同的应用问题使用相应的优化API来缩短程序执行时间·实验结果表明,通过减少I/O操作次数和内外存交换的数据量以及隐藏部分I/O操作延迟,有效提高了核外计算的性能· 展开更多
关键词 核外计算 规则区域筛选 预取 边缘重用
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部