期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
分子动力学模拟计算在通用图形处理芯片上的实现 被引量:1
1
作者 宋国梁 翁经纬 +2 位作者 李振华 王文宁 范康年 《高等学校化学学报》 SCIE EI CAS CSCD 北大核心 2008年第12期2425-2429,共5页
将在计算生物分子中广泛应用的CHARMM力场应用于Windows computer cluster server(WCCS)环境下,并实现了该力场及分子动力学模拟程序的通用显卡(GPU)并行计算.对一些多肽链的动力学模拟结果显示,与CPU计算相比,GPU计算在计算速度上有巨... 将在计算生物分子中广泛应用的CHARMM力场应用于Windows computer cluster server(WCCS)环境下,并实现了该力场及分子动力学模拟程序的通用显卡(GPU)并行计算.对一些多肽链的动力学模拟结果显示,与CPU计算相比,GPU计算在计算速度上有巨大的提升.与64位Athlon2.0G相比,在NVIDIA Ge-Force8800GT显卡上的动力学模拟速度提高了至少10倍,而且这个效率比会随着模拟体系及每块尺寸的增大而增大.模拟体系的增大使得GPU并行单元的计算空载相对减少,块尺寸的增大使缓存区尺寸相对减少,单块计算效率得以提高.在测试样本中,该效率比最高可达到28倍以上.利用GPU计算还对一条含有397个原子的多肽链进行了分子动力学模拟,给出了氢键分布随时间的变化结果. 展开更多
关键词 分子动力学 图形处理芯片 CHARMM Windows COMPUTER CLUSTER server
在线阅读 下载PDF
基于国产化图形芯片JM5400的座舱显示系统设计 被引量:7
2
作者 符鹤 谢永芳 《计算机工程与科学》 CSCD 北大核心 2016年第10期2083-2090,共8页
综合化、数字化和智能化是座舱显示系统的发展趋势,高性能低功耗图形处理芯片是实现这种需求的核心部件之一。在分析现代战机对座舱显控系统的需求基础上,给出了一个基于国产化图形处理芯片JM5400、国产化CPU、国产化操作系统的座舱显... 综合化、数字化和智能化是座舱显示系统的发展趋势,高性能低功耗图形处理芯片是实现这种需求的核心部件之一。在分析现代战机对座舱显控系统的需求基础上,给出了一个基于国产化图形处理芯片JM5400、国产化CPU、国产化操作系统的座舱显示控制系统设计方案,并已成功应用于实际系统,可满足装备国产化、信息安全化的要求。 展开更多
关键词 座舱显示系统 图形处理芯片 JM5400 龙芯2F 装备国产化
在线阅读 下载PDF
准对角矩阵与向量相乘在CPU+GPU异构集群上的实现与优化 被引量:2
3
作者 阳王东 李肯立 《小型微型计算机系统》 CSCD 北大核心 2015年第7期1659-1664,共6页
稀疏矩阵与向量相乘(Sp MV)是科学计算和工程应用中一个重要问题,而且非常适宜进行并行计算,目前在GPU对Sp M V的实现和优化是一个研究热点.针对准对角矩阵存在的一些不规则性,采用CSR+DLA混合存储格式来进行Sp M V计算,能够提高压缩的... 稀疏矩阵与向量相乘(Sp MV)是科学计算和工程应用中一个重要问题,而且非常适宜进行并行计算,目前在GPU对Sp M V的实现和优化是一个研究热点.针对准对角矩阵存在的一些不规则性,采用CSR+DLA混合存储格式来进行Sp M V计算,能够提高压缩的效果.为了发挥CPU多核的并行计算能力,采用一种CPU+GPU混合计算模式,这样可以把混合存储格式不同格式的数据分割到CPU和GPU上,从而提高了资源的利用效能.本文另外还在分析CPU+GPU异构计算模式的特征基础上,提出一些优化策略,能够改进准对角矩阵与向量相乘在异构计算环境中的计算性能. 展开更多
关键词 图形处理芯片 稀疏矩阵 稀疏矩阵与向量相乘 异构计算
在线阅读 下载PDF
一种准对角矩阵的混合压缩算法及其与向量相乘在GPU上的实现 被引量:5
4
作者 阳王东 李肯立 石林 《计算机科学》 CSCD 北大核心 2014年第7期290-296,共7页
稀疏矩阵与向量乘(SpMV)属于科学计算和工程应用中的一种基本运算,其高性能实现与优化是计算科学的研究热点之一。在微分方程的求解过程中会产生大规模的稀疏矩阵,而且很大一部分是一种准对角矩阵。针对准对角矩阵存在的一些不规则性,... 稀疏矩阵与向量乘(SpMV)属于科学计算和工程应用中的一种基本运算,其高性能实现与优化是计算科学的研究热点之一。在微分方程的求解过程中会产生大规模的稀疏矩阵,而且很大一部分是一种准对角矩阵。针对准对角矩阵存在的一些不规则性,提出一种混合对角存储(DIA)和行压缩存储(CSR)格式来进行SpMV计算,对于分割出来的对角线区域之外的离散非零元素采用CSR存储,这样能够克服DIA在不规则情况下存储矩阵的列迅速增加的缺陷,同时对角线采用DIA存储又能充分利用矩阵的对角特征,以减少CSR的行非零元素数目的不均衡现象,并可以通过调整存储对角线的带宽来适应准对角矩阵的不同的离散形式,以获得比DIA和CSR更高的压缩比,减小计算的数据规模。利用CUDA平台在GPU上进行了实验测试,结果表明该方法比DIA和CSR具有更高的加速比。 展开更多
关键词 图形处理芯片 稀疏矩阵 稀疏矩阵与向量相乘 CUDA
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部