-
题名基于OpenCL的直方图生成算法优化方法研究
被引量:3
- 1
-
-
作者
安小景
张云泉
贾海鹏
-
机构
中国科学院计算技术研究所体系结构国家重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2015年第11期32-36,共5页
-
基金
国家自然科学基金(61272136)
国家自然科学基金创新群体(61221062)资助
-
文摘
随着GPU计算能力及可编程性的不断增强,采用GPU作为通用加速器对应用程序进行性能加速已经成为提升程序性能的主要模式.直方图生成算法是计算机视觉的常用算法,在图像处理、模式识别、图像搜索等领域都有着广泛的应用.随着图像处理规模的扩大和实时性要求的提高,通过GPU提升直方图生成算法性能的需求也越来越强.在GPU计算平台关键优化方法和技术的基础上,完成了直方图生成算法在GPU计算平台上的实现及优化.实验结果表明,通过使用直方图备份、访存优化、数据本地化及规约优化等优化方法,直方图生成算法在AMD HD7850 GPU计算平台上的性能相对于优化前的版本达到了1.8~13.3倍的提升;相对于CPU版本,在不同数据规模下也达到了7.2~210.8倍的性能提升.
-
关键词
GPGPU
OPENCL
数据本地化
直方图生成
-
Keywords
GPGPU,OpenCL,Data localization, Histogram generation
-
分类号
TP302.7
[自动化与计算机技术—计算机系统结构]
-
-
题名主流视频编解码软件的硬件性能分析与设计
被引量:3
- 2
-
-
作者
汤旭龙
安虹
范东睿
-
机构
中国科学技术大学计算机科学与技术学院
中国科学院计算技术研究所体系结构国家重点实验室
-
出处
《计算机工程》
CAS
CSCD
2014年第6期300-305,共6页
-
基金
国家自然科学基金资助项目(60970023)
国家"973"计划基金资助项目(2011CB302501)
-
文摘
网络视频会议以及高清视频点播等应用的广泛流行,对视频编解码的编码质量以及编码速度提出了更高的要求。为帮助硬件设计人员设计更强大的专用处理器去适应视频编解码应用的发展趋势,并评估处理器设计的合理性和正确性,对视频编解码进行分析和测试,提出一套基准测试程序。采用自顶向下的分析方法,以流行性、编解码效率、压缩质量和开源性为标准,选取主流的视频编解码软件,进行热点函数分析。抽取变换、量化以及滤波过程中的热点函数,使之成为视频编解码测试程序,为其构造典型输入集。通过分析真实硬件平台上这些测试程序的计算和访存特性,给出处理器设计的建议。结果证明,该基准测试程序使用10%的代码量即可反映视频编解码过程的主要特征,对处理器设计具有指导意义。
-
关键词
视频编解码
体系结构
热点函数
性能分析
变换
量化
滤波
-
Keywords
video codec
architecture
hotspots function
performance analysis
transformation
quantization
filtering
-
分类号
TP37
[自动化与计算机技术—计算机系统结构]
-