-
题名一种基于页面级流缓存结构的流检测和预取算法
被引量:1
- 1
-
-
作者
刘立
陈明宇
包云岗
许建卫
樊建平
-
机构
中国科学院计算技术研究所体系结构重点实验室
中国科学院研究生院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第10期1758-1767,共10页
-
文摘
为了提高网络内存的访存性能,基于一种页面级流缓存和预取结构提出了可变步长的带状流检测算法VSS(variable stride stream)和基于时钟步长的流预取优化算法来优化网络访存性能.带状流检测算法解决了固定步长流检测下循环访问中虚拟页地址的跳跃问题,消除了断流,可以有效提高流检测的覆盖率.基于时钟步长的流预取优化动态调整预取长度,可以解决有些预取不能及时取回的问题,进一步提高预取性能.通过和顺序预取算法的比较可以看出,VSS算法可以实现高准确率、低通信开销的预取.通过模拟分析了这种流缓存和预取机制在网络访存系统中的应用,验证了以少量性能下降换取灵活的远程内存扩展方法的可行性.
-
关键词
流
检测
结构
预取
算法
-
Keywords
stream
checking
architecture
prefetch
algorithm
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于OpenCL的直方图生成算法优化方法研究
被引量:3
- 2
-
-
作者
安小景
张云泉
贾海鹏
-
机构
中国科学院计算技术研究所体系结构国家重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2015年第11期32-36,共5页
-
基金
国家自然科学基金(61272136)
国家自然科学基金创新群体(61221062)资助
-
文摘
随着GPU计算能力及可编程性的不断增强,采用GPU作为通用加速器对应用程序进行性能加速已经成为提升程序性能的主要模式.直方图生成算法是计算机视觉的常用算法,在图像处理、模式识别、图像搜索等领域都有着广泛的应用.随着图像处理规模的扩大和实时性要求的提高,通过GPU提升直方图生成算法性能的需求也越来越强.在GPU计算平台关键优化方法和技术的基础上,完成了直方图生成算法在GPU计算平台上的实现及优化.实验结果表明,通过使用直方图备份、访存优化、数据本地化及规约优化等优化方法,直方图生成算法在AMD HD7850 GPU计算平台上的性能相对于优化前的版本达到了1.8~13.3倍的提升;相对于CPU版本,在不同数据规模下也达到了7.2~210.8倍的性能提升.
-
关键词
GPGPU
OPENCL
数据本地化
直方图生成
-
Keywords
GPGPU,OpenCL,Data localization, Histogram generation
-
分类号
TP302.7
[自动化与计算机技术—计算机系统结构]
-
-
题名主流视频编解码软件的硬件性能分析与设计
被引量:3
- 3
-
-
作者
汤旭龙
安虹
范东睿
-
机构
中国科学技术大学计算机科学与技术学院
中国科学院计算技术研究所体系结构国家重点实验室
-
出处
《计算机工程》
CAS
CSCD
2014年第6期300-305,共6页
-
基金
国家自然科学基金资助项目(60970023)
国家"973"计划基金资助项目(2011CB302501)
-
文摘
网络视频会议以及高清视频点播等应用的广泛流行,对视频编解码的编码质量以及编码速度提出了更高的要求。为帮助硬件设计人员设计更强大的专用处理器去适应视频编解码应用的发展趋势,并评估处理器设计的合理性和正确性,对视频编解码进行分析和测试,提出一套基准测试程序。采用自顶向下的分析方法,以流行性、编解码效率、压缩质量和开源性为标准,选取主流的视频编解码软件,进行热点函数分析。抽取变换、量化以及滤波过程中的热点函数,使之成为视频编解码测试程序,为其构造典型输入集。通过分析真实硬件平台上这些测试程序的计算和访存特性,给出处理器设计的建议。结果证明,该基准测试程序使用10%的代码量即可反映视频编解码过程的主要特征,对处理器设计具有指导意义。
-
关键词
视频编解码
体系结构
热点函数
性能分析
变换
量化
滤波
-
Keywords
video codec
architecture
hotspots function
performance analysis
transformation
quantization
filtering
-
分类号
TP37
[自动化与计算机技术—计算机系统结构]
-
-
题名一种高效的基于局部特征的显著区域检测算法
被引量:3
- 4
-
-
作者
朱斐文
肖菁
戴晨
张为华
-
机构
复旦大学并行处理研究所
中国科学院计算技术研究所体系结构重点实验室
上海交通大学电子信息与工程学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2012年第8期5-9,共5页
-
基金
国家自然科学基金项目(60903015)
Intel大学合作资助
+1 种基金
国家高技术研究发展计划重点项目(2009AA012201)
中国科学院计算技术研究所体系结构重点实验室开放课题(ICT-ARCH2009082009)
-
文摘
图像特征提取是图像/视频检索问题的关键。研究人员发现,假如对整张图像或视频帧做特征提取,会产生大量的特征信息,从而影响图像/视频帧的匹配时间。由于人们通常只对图像中部分关键的区域感兴趣,因此在对图像做局部特征提取时可以先对图像进行显著区域检测,排除非关键区域上的特征信息,从而减低匹配所需的特征点数,提高匹配的处理速度。但是由于传统的显著区域检测算法计算复杂,会对图像特征提取过程产生额外的时间开销。提出一种快速的显著区域检测算法,根据局部特征提取算法特征检测阶段得到的特征点分布,利用最大子矩阵和算法,在损失较小的准确度的情况下快速检测出图像的显著区。
-
关键词
图像显著区域
局部特征
最大子矩阵和
-
Keywords
Salient region of image Local feature Max sum of sub-matrix
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-