期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一个结构网格并行CFD程序的单机性能优化
被引量:
3
1
作者
车永刚
张理论
+4 位作者
王勇献
徐传福
刘巍
王正华
刘化勇
《计算机科学》
CSCD
北大核心
2013年第3期116-120,共5页
从单机性能优化角度对一个高阶精度结构网格CFD并行程序进行了优化。通过识别关键变量并对其进行常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特点及访问模式,设计了分级数据缓存技术,使程序主要计算代码能...
从单机性能优化角度对一个高阶精度结构网格CFD并行程序进行了优化。通过识别关键变量并对其进行常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特点及访问模式,设计了分级数据缓存技术,使程序主要计算代码能够以更优的方式访问主要数据结构,提高了访存空间局部性;进行了各种循环变换,以优化访存性能。在国家超算长沙中心"Tianhe-1A"并行机上的测试结果表明,相对于采用Intel编译器最高优化级别的版本,其对100万网格点二维翼型算例,串行程序性能提高约22.2%~28.9%;对1.12亿网格点三角翼算例,并行程序性能提高约13.9%~20.2%。
展开更多
关键词
CFD并行计算
单机性能优化
关键变量参数化
分级数据缓存
在线阅读
下载PDF
职称材料
基于RISC-V参数化超标量处理器的优化设计
被引量:
1
2
作者
刘有耀
潘宇晨
《计算机工程与应用》
CSCD
北大核心
2022年第5期66-74,共9页
为解决嵌入式领域对处理器不同性能面积的需求,以及对重排序缓冲区阻塞,保留站派遣长短周期指令时导致的吞吐率不平衡及堵塞问题,设计并优化了一种简便配置的参数化流水线超标量处理器。通过定制化流水线中的分支预测,缓存与运算单元,将...
为解决嵌入式领域对处理器不同性能面积的需求,以及对重排序缓冲区阻塞,保留站派遣长短周期指令时导致的吞吐率不平衡及堵塞问题,设计并优化了一种简便配置的参数化流水线超标量处理器。通过定制化流水线中的分支预测,缓存与运算单元,将RISC-V指令划分5大类处理,对不同周期的执行单元采用级联与并行的混合分布方式,将充当排序缓存中的指令再派遣,达到指令暂存和分类执行的目的,使一条不定周期指令可以携带多条单周期指令提交。缓存之间以直连方式进行通信,以避免复杂的公共数据总线以降低时序损耗。实验结果表明,该处理器可以通过配置达到IPC为0.746~1.476之间的性能,平均比同类型处理器IPC提升132.4%。
展开更多
关键词
流水线缓存
RISC-V指令集
超标量
参数化
指令划分
在线阅读
下载PDF
职称材料
题名
一个结构网格并行CFD程序的单机性能优化
被引量:
3
1
作者
车永刚
张理论
王勇献
徐传福
刘巍
王正华
刘化勇
机构
国防科技大学计算机学院
空气动力学国家重点实验室
出处
《计算机科学》
CSCD
北大核心
2013年第3期116-120,共5页
基金
国家重点基础研究发展计划(973)课题(G2009CB723803)
国家自然科学基金项目(11272352
+1 种基金
61103014
60603055)资助
文摘
从单机性能优化角度对一个高阶精度结构网格CFD并行程序进行了优化。通过识别关键变量并对其进行常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特点及访问模式,设计了分级数据缓存技术,使程序主要计算代码能够以更优的方式访问主要数据结构,提高了访存空间局部性;进行了各种循环变换,以优化访存性能。在国家超算长沙中心"Tianhe-1A"并行机上的测试结果表明,相对于采用Intel编译器最高优化级别的版本,其对100万网格点二维翼型算例,串行程序性能提高约22.2%~28.9%;对1.12亿网格点三角翼算例,并行程序性能提高约13.9%~20.2%。
关键词
CFD并行计算
单机性能优化
关键变量参数化
分级数据缓存
Keywords
Parallel CFD, Uniprocessor performance tuning, Key variable
parameter
ization, Multi-level data
buffer
ing
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于RISC-V参数化超标量处理器的优化设计
被引量:
1
2
作者
刘有耀
潘宇晨
机构
西安邮电大学电子工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2022年第5期66-74,共9页
基金
国家自然科学基金(61834005,61874087,61772417,61802304,61634004)。
文摘
为解决嵌入式领域对处理器不同性能面积的需求,以及对重排序缓冲区阻塞,保留站派遣长短周期指令时导致的吞吐率不平衡及堵塞问题,设计并优化了一种简便配置的参数化流水线超标量处理器。通过定制化流水线中的分支预测,缓存与运算单元,将RISC-V指令划分5大类处理,对不同周期的执行单元采用级联与并行的混合分布方式,将充当排序缓存中的指令再派遣,达到指令暂存和分类执行的目的,使一条不定周期指令可以携带多条单周期指令提交。缓存之间以直连方式进行通信,以避免复杂的公共数据总线以降低时序损耗。实验结果表明,该处理器可以通过配置达到IPC为0.746~1.476之间的性能,平均比同类型处理器IPC提升132.4%。
关键词
流水线缓存
RISC-V指令集
超标量
参数化
指令划分
Keywords
pipeline
buffer
RISC-V instruction set
superscalar
parameter
ization
instruction partition
分类号
TP332 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一个结构网格并行CFD程序的单机性能优化
车永刚
张理论
王勇献
徐传福
刘巍
王正华
刘化勇
《计算机科学》
CSCD
北大核心
2013
3
在线阅读
下载PDF
职称材料
2
基于RISC-V参数化超标量处理器的优化设计
刘有耀
潘宇晨
《计算机工程与应用》
CSCD
北大核心
2022
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部