期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于GPU的混合精度平方根共轭梯度算法
被引量:
6
1
作者
李熙铭
欧阳丹彤
白洪涛
《仪器仪表学报》
EI
CAS
CSCD
北大核心
2012年第1期97-104,共8页
针对当前基于GPU的数值算法具有双精度数据性能低下的缺陷。提出了一种适于GPU统一计算架构Fermi-CUDA的混合精度平方根共轭梯度算法用以求解稀疏线性方程组。该算法采用单精度内迭代与双精度外迭代结合的方法,以充分利用GPU体系结构下...
针对当前基于GPU的数值算法具有双精度数据性能低下的缺陷。提出了一种适于GPU统一计算架构Fermi-CUDA的混合精度平方根共轭梯度算法用以求解稀疏线性方程组。该算法采用单精度内迭代与双精度外迭代结合的方法,以充分利用GPU体系结构下单精度高性能和双精度高精度的优点。整个算法的计算部分完全在GPU端进行,减少了CPU和GPU之间的数据通信。实现了基于GPU的平方根共轭梯度法、Jacobi迭代法和Gauss-Seidel迭代法,分析它们作为内迭代算子对算法收敛性的影响。实验表明,该算法获得了与全双精度数据处理等同的计算精度,比GPU全双精度在浮点性能上提升近一倍,相对于CPU全双精度串行算法,最大加速比达到70以上。
展开更多
关键词
线性方程组
平方根共轭梯度算法
内外迭代子
混合精度
图形处理器
在线阅读
下载PDF
职称材料
题名
基于GPU的混合精度平方根共轭梯度算法
被引量:
6
1
作者
李熙铭
欧阳丹彤
白洪涛
机构
吉林大学计算机科学与技术学院
吉林大学符号计算与知识工程教育部重点实验室
吉林大学公共计算机教学与研究中心
吉林大学地球探测科学与技术学院
出处
《仪器仪表学报》
EI
CAS
CSCD
北大核心
2012年第1期97-104,共8页
基金
国家自然科学基金(60973089
60873148
+11 种基金
60773097
61003101)
吉林省科技发展计划项目基金(201101039
20101501
20100185
20090108
20080107)
欧盟合作项目(155776-EM-1-2009-1-IT-ERAMUNDUS-ECW-L12)
国家教育部博士点专项基金(20100061110031)
吉林大学符号计算与知识工程教育部重点实验室开放项目(93K-17-2011-K01
93K-17-2009-K05)
吉林大学科学前沿与交叉学科创新项目(201103134)资助
文摘
针对当前基于GPU的数值算法具有双精度数据性能低下的缺陷。提出了一种适于GPU统一计算架构Fermi-CUDA的混合精度平方根共轭梯度算法用以求解稀疏线性方程组。该算法采用单精度内迭代与双精度外迭代结合的方法,以充分利用GPU体系结构下单精度高性能和双精度高精度的优点。整个算法的计算部分完全在GPU端进行,减少了CPU和GPU之间的数据通信。实现了基于GPU的平方根共轭梯度法、Jacobi迭代法和Gauss-Seidel迭代法,分析它们作为内迭代算子对算法收敛性的影响。实验表明,该算法获得了与全双精度数据处理等同的计算精度,比GPU全双精度在浮点性能上提升近一倍,相对于CPU全双精度串行算法,最大加速比达到70以上。
关键词
线性方程组
平方根共轭梯度算法
内外迭代子
混合精度
图形处理器
Keywords
linear equations
CGS algorithm
inner and outer iteration
mixed precision
graphics processing unit
分类号
TP311.1 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于GPU的混合精度平方根共轭梯度算法
李熙铭
欧阳丹彤
白洪涛
《仪器仪表学报》
EI
CAS
CSCD
北大核心
2012
6
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部