期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一个结构网格并行CFD程序的单机性能优化
被引量:
3
1
作者
车永刚
张理论
+4 位作者
王勇献
徐传福
刘巍
王正华
刘化勇
《计算机科学》
CSCD
北大核心
2013年第3期116-120,共5页
从单机性能优化角度对一个高阶精度结构网格CFD并行程序进行了优化。通过识别关键变量并对其进行常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特点及访问模式,设计了分级数据缓存技术,使程序主要计算代码能...
从单机性能优化角度对一个高阶精度结构网格CFD并行程序进行了优化。通过识别关键变量并对其进行常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特点及访问模式,设计了分级数据缓存技术,使程序主要计算代码能够以更优的方式访问主要数据结构,提高了访存空间局部性;进行了各种循环变换,以优化访存性能。在国家超算长沙中心"Tianhe-1A"并行机上的测试结果表明,相对于采用Intel编译器最高优化级别的版本,其对100万网格点二维翼型算例,串行程序性能提高约22.2%~28.9%;对1.12亿网格点三角翼算例,并行程序性能提高约13.9%~20.2%。
展开更多
关键词
CFD并行计算
单机性能优化
关键变量参数化
分级数据缓存
在线阅读
下载PDF
职称材料
题名
一个结构网格并行CFD程序的单机性能优化
被引量:
3
1
作者
车永刚
张理论
王勇献
徐传福
刘巍
王正华
刘化勇
机构
国防科技大学计算机学院
空气动力学国家重点实验室
出处
《计算机科学》
CSCD
北大核心
2013年第3期116-120,共5页
基金
国家重点基础研究发展计划(973)课题(G2009CB723803)
国家自然科学基金项目(11272352
+1 种基金
61103014
60603055)资助
文摘
从单机性能优化角度对一个高阶精度结构网格CFD并行程序进行了优化。通过识别关键变量并对其进行常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特点及访问模式,设计了分级数据缓存技术,使程序主要计算代码能够以更优的方式访问主要数据结构,提高了访存空间局部性;进行了各种循环变换,以优化访存性能。在国家超算长沙中心"Tianhe-1A"并行机上的测试结果表明,相对于采用Intel编译器最高优化级别的版本,其对100万网格点二维翼型算例,串行程序性能提高约22.2%~28.9%;对1.12亿网格点三角翼算例,并行程序性能提高约13.9%~20.2%。
关键词
CFD并行计算
单机性能优化
关键变量参数化
分级数据缓存
Keywords
Parallel CFD, Uniprocessor performance tuning, Key variable parameterization, Multi-level data buffering
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一个结构网格并行CFD程序的单机性能优化
车永刚
张理论
王勇献
徐传福
刘巍
王正华
刘化勇
《计算机科学》
CSCD
北大核心
2013
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部