期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
一种高效的压缩Page Walk Cache结构
1
作者 贾朝阳 张敦博 +1 位作者 王琼 沈立 《计算机工程与科学》 CSCD 北大核心 2020年第9期1521-1528,共8页
通用图形处理单元(GPGPU)已被广泛应用于现代高性能计算系统中。GPGPU的单指令多线程执行模型导致快表命中率较低,特别是对于那些不规则应用,需要借助PWC减少实际的页表访问次数。传统PWC中存在很多冗余信息,加之容量有限,实际效果并不... 通用图形处理单元(GPGPU)已被广泛应用于现代高性能计算系统中。GPGPU的单指令多线程执行模型导致快表命中率较低,特别是对于那些不规则应用,需要借助PWC减少实际的页表访问次数。传统PWC中存在很多冗余信息,加之容量有限,实际效果并不理想。分析了传统PWC中的信息冗余情况,提出了一种新结构——压缩PWC。压缩PWC在保证查找开销不变的基础上,完全消除了冗余信息,压缩了空间,使PWC能够记录更多的页表访问历史,从而有效减少地址转换过程中访问页表的次数。测试结果表明,与相同容量的传统PWC相比,压缩PWC可以显著缩短虚实地址转换时间开销。 展开更多
关键词 通用图形处理器 虚实地址转换 页表遍历缓存
在线阅读 下载PDF
飞机座舱图形显示加速系统设计及FPGA实现 被引量:11
2
作者 胡小龙 周俊明 +2 位作者 夏显忠 李迅 郑博文 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第5期1042-1048,共7页
提出一种飞机座舱综合显示系统中基于现场可编程门阵列(FPGA)的2D图形硬件加速引擎设计方案,将图形分解为一系列基本的点和水平线输出。为避免图形加速引擎直接对SDRAM的零碎操作导致的存储器操作瓶颈,引入图形缓存机制,并根据图形像素... 提出一种飞机座舱综合显示系统中基于现场可编程门阵列(FPGA)的2D图形硬件加速引擎设计方案,将图形分解为一系列基本的点和水平线输出。为避免图形加速引擎直接对SDRAM的零碎操作导致的存储器操作瓶颈,引入图形缓存机制,并根据图形像素的存储特点,提出远区域优先(FAF)图形缓存页面淘汰算法。讨论图形加速引擎内部各模块的逻辑结构及其逻辑设计,在对模块进行波形仿真的基础上,实现系统级仿真结果的可视化验证。仿真及实际应用结果表明,所提出的图形加速引擎提高了图形显示性能,满足当前飞机中对2D图形实时显示及飞控系统的可靠性要求。 展开更多
关键词 2D图形 硬件加速 图形缓存 现场可编程门阵列
在线阅读 下载PDF
图形处理器低功耗设计技术研究 被引量:9
3
作者 田泽 张骏 +2 位作者 许宏杰 郭亮 黎小玉 《计算机科学》 CSCD 北大核心 2013年第06A期210-216,共7页
图形处理器(GPU)以其强大的图形加速性能以及在通用计算领域的出色表现正在被越来越广泛地应用。但随着芯片规模和集成度的不断提升,单个GPU芯片的功耗已经高达376W,是高端通用处理器的2~3倍。高功耗带来的可靠性、稳定性以及芯片成本... 图形处理器(GPU)以其强大的图形加速性能以及在通用计算领域的出色表现正在被越来越广泛地应用。但随着芯片规模和集成度的不断提升,单个GPU芯片的功耗已经高达376W,是高端通用处理器的2~3倍。高功耗带来的可靠性、稳定性以及芯片成本问题使"功耗墙"已经成为未来GPU设计过程中需要突破的关键问题之一。立足于体系结构层次,结合图形处理器的渲染流水线的结构特点,从深度测试和消隐、染色器数据通路、纹理映射和压缩、渲染策略、寄存器文件和片上Cache等角度描述了图形处理器的低功耗设计技术,并指出了GPU低功耗设计技术的进一步研究方向。 展开更多
关键词 图形处理器 低功耗 渲染 cachE
在线阅读 下载PDF
通用图形处理器缓存子系统性能优化方法综述 被引量:4
4
作者 张军 谢竟成 +3 位作者 沈凡凡 谭海 汪吕蒙 何炎祥 《计算机研究与发展》 EI CSCD 北大核心 2020年第6期1191-1207,共17页
随着工艺和制程技术的不断发展以及体系架构的日趋完善,通用图形处理器(general purpose graphics processing units,GPGPU)的并行计算能力得到了很大的提升,其在高性能、高吞吐量等通用计算应用场景的使用越来越广泛.GPGPU通过支持大... 随着工艺和制程技术的不断发展以及体系架构的日趋完善,通用图形处理器(general purpose graphics processing units,GPGPU)的并行计算能力得到了很大的提升,其在高性能、高吞吐量等通用计算应用场景的使用越来越广泛.GPGPU通过支持大量线程的并发执行,可以较好地隐藏长延时访存操作,从而获得高并行计算能力.然而,GPGPU在处理计算和访存不规则的应用时,其存储子系统的效率受到很大影响,尤其是片上缓存的争用情况尤为突出,难以及时提供计算操作所需的数据,使得GPGPU的高并行计算能力不能得到充分发挥.解决片上缓存的争用问题、优化缓存子系统的性能,是优化GPGPU性能的主要解决方案之一,也是目前研究GPGPU性能优化的主要热点之一.目前,针对GPGPU缓存子系统的性能优化研究主要集中在线程级并行度(thread level parallelism,TLP)调节、访存顺序调节、数据通量增强、最后一级缓存(last level cache,LLC)优化和基于非易失性存储(non-volatile memory,NVM)的GPGPU缓存新架构设计等5个方面.也从这5个方面重点分析讨论了目前主要的GPGPU缓存子系统性能优化方法,并在最后指出了未来GPGPU缓存子系统优化需要进一步探讨的问题,对GPGPU缓存子系统性能优化的研究有重要意义. 展开更多
关键词 通用图形处理器 缓存子系统 性能优化 延迟隐藏 缓存争用
在线阅读 下载PDF
嵌入式系统GUI调色板查找改进算法 被引量:1
5
作者 杨军 高小鹏 龙翔 《计算机工程与应用》 CSCD 北大核心 2005年第33期34-35,50,共3页
通过分析硬件调色板的基本工作原理和嵌入式系统GUI图形引擎中调色板查找算法的实现,提出了一种应用于硬件调色板的嵌入式系统GUI中,基于软件Cache技术的改进调色板查找算法,极大地提高了嵌入式系统GUI图形引擎的效率。
关键词 嵌入式系统GUI 图形引擎 硬件调色板 软件cache
在线阅读 下载PDF
基于勘探数据的数字盆地建设研究 被引量:2
6
作者 梁党卫 余学锋 +2 位作者 郭俊 吴雪超 范峥 《地质科技情报》 CSCD 北大核心 2018年第4期253-257,共5页
中国在2000年已经进入数字盆地建设研究阶段,传统建设思路是整体考虑,局部细化,实践证明,依照该思路建设数字盆地,只有建的过程,没有用的过程。为了使数字盆地与油田科研活动紧密融合并可持续发展,提出了从局部走向整体的分布式建设数... 中国在2000年已经进入数字盆地建设研究阶段,传统建设思路是整体考虑,局部细化,实践证明,依照该思路建设数字盆地,只有建的过程,没有用的过程。为了使数字盆地与油田科研活动紧密融合并可持续发展,提出了从局部走向整体的分布式建设数字盆地的新思路,即将数字盆地划分成若干个勘探区带,每个勘探区带采用统一的数据描述、数据访问接口、Web页面管理。结合专业应用,基于模型缓存机制、图形引擎以及第三方UI框架,形成了一款数字盆地图形可视化软件,并支持Web页面的三维可视化调用。最终搭建了一套基于Web发布和应用的数字盆地综合管理平台,将若干个分散的勘探区带汇聚成数字盆地,既实现了数字盆地数据模型的高效管理、可视化展示与专业应用,又实现了不同部门、不同人员、不同时期的勘探地质认识在三维地质空间里的可视化集成,从而有益于整体解剖盆地结构,为有利区带优选、勘探决策提供参考。 展开更多
关键词 数字盆地 勘探区带 WEB页面 缓存机制 图形引擎 勘探决策
在线阅读 下载PDF
异构计算环境下的三维Kirchhoff叠前深度偏移混合域并行算法 被引量:1
7
作者 王一达 赵长海 +3 位作者 李超 张建磊 晏海华 张威毅 《石油地球物理勘探》 EI CSCD 北大核心 2018年第3期478-486,共9页
三维Kirchhoff叠前深度偏移(KPSDM)面对数据量的不断增长以及可编程图形处理器(GPU)的引入,传统的并行策略已经不再适合当前的超大规模异构集群的体系架构。本文提出了一种新的混合域KPSDM并行算法,从成像空间、输入数据两个维度对偏移... 三维Kirchhoff叠前深度偏移(KPSDM)面对数据量的不断增长以及可编程图形处理器(GPU)的引入,传统的并行策略已经不再适合当前的超大规模异构集群的体系架构。本文提出了一种新的混合域KPSDM并行算法,从成像空间、输入数据两个维度对偏移任务进行拆分,消除了任务之间的依赖性。为了应对异构计算环境,将核心计算部分移植到GPU上,并实现了"动态异步"的任务调度策略,保证了负载均衡;对于KPSDM执行过程中重复访问地震数据与旅行时场带来的巨大I/O开销,利用作业节点的本地存储构建分布式缓存系统,解决KPSDM可扩展性受限于共享存储能力的问题。在256节点的集群上处理实际地震数据,获得了接近线性的加速比效果。 展开更多
关键词 Kirchhoff叠前深度偏移 并行算法 混合域 GPU 异构集群 分布式缓存
在线阅读 下载PDF
面向瘦客户计算的应用特定图形缓存机制(英文)
8
作者 张杨 管雪涛 程旭 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第3期427-434,共8页
研究由重绘应用程序的图形对象产生的像素冗余,提出利用应用特定缓存机制识别并减少此类冗余,并在VNC系统中实现了这一机制。试验表明该机制能够减少约17.8%-22.7%的网络通信,并能降低大部分由此类冗余引起的高延迟;同时该机制还具有较... 研究由重绘应用程序的图形对象产生的像素冗余,提出利用应用特定缓存机制识别并减少此类冗余,并在VNC系统中实现了这一机制。试验表明该机制能够减少约17.8%-22.7%的网络通信,并能降低大部分由此类冗余引起的高延迟;同时该机制还具有较低的计算及存储开销。 展开更多
关键词 瘦客户计算 屏幕冗余 应用特定图形缓存 带宽优化
在线阅读 下载PDF
Matlab与Java混合编程的算法复用模型及实现 被引量:3
9
作者 周涛 《计算机应用》 CSCD 北大核心 2017年第A02期259-262,共4页
针对当前企业信息化系统中Java对数据处理算法支持不够的问题,构建了一种基于Redis缓存的Matlab和Java混合编程及复用模型。采用Matlab的核心算法库设计数据处理算法,采用Java同步实现算法的输入和输出管理,较好克服了Java在算法编程支... 针对当前企业信息化系统中Java对数据处理算法支持不够的问题,构建了一种基于Redis缓存的Matlab和Java混合编程及复用模型。采用Matlab的核心算法库设计数据处理算法,采用Java同步实现算法的输入和输出管理,较好克服了Java在算法编程支持上的不足,同时也满足了企业将算法研究成果有效转换到业务信息化系统中应用的需求。应用实例及效果表明采用Matlab和Java混合编程及复用算法是可行有效的。 展开更多
关键词 图形分析 混合编程 算法融合 Redis缓存
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部