期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
一个结构网格并行CFD程序的单机性能优化 被引量:3
1
作者 车永刚 张理论 +4 位作者 王勇献 徐传福 刘巍 王正华 刘化勇 《计算机科学》 CSCD 北大核心 2013年第3期116-120,共5页
从单机性能优化角度对一个高阶精度结构网格CFD并行程序进行了优化。通过识别关键变量并对其进行常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特点及访问模式,设计了分级数据缓存技术,使程序主要计算代码能... 从单机性能优化角度对一个高阶精度结构网格CFD并行程序进行了优化。通过识别关键变量并对其进行常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特点及访问模式,设计了分级数据缓存技术,使程序主要计算代码能够以更优的方式访问主要数据结构,提高了访存空间局部性;进行了各种循环变换,以优化访存性能。在国家超算长沙中心"Tianhe-1A"并行机上的测试结果表明,相对于采用Intel编译器最高优化级别的版本,其对100万网格点二维翼型算例,串行程序性能提高约22.2%~28.9%;对1.12亿网格点三角翼算例,并行程序性能提高约13.9%~20.2%。 展开更多
关键词 CFD并行计算 单机性能优化 关键变量参数化 分级数据缓存
在线阅读 下载PDF
基于RISC-V参数化超标量处理器的优化设计 被引量:1
2
作者 刘有耀 潘宇晨 《计算机工程与应用》 CSCD 北大核心 2022年第5期66-74,共9页
为解决嵌入式领域对处理器不同性能面积的需求,以及对重排序缓冲区阻塞,保留站派遣长短周期指令时导致的吞吐率不平衡及堵塞问题,设计并优化了一种简便配置的参数化流水线超标量处理器。通过定制化流水线中的分支预测,缓存与运算单元,将... 为解决嵌入式领域对处理器不同性能面积的需求,以及对重排序缓冲区阻塞,保留站派遣长短周期指令时导致的吞吐率不平衡及堵塞问题,设计并优化了一种简便配置的参数化流水线超标量处理器。通过定制化流水线中的分支预测,缓存与运算单元,将RISC-V指令划分5大类处理,对不同周期的执行单元采用级联与并行的混合分布方式,将充当排序缓存中的指令再派遣,达到指令暂存和分类执行的目的,使一条不定周期指令可以携带多条单周期指令提交。缓存之间以直连方式进行通信,以避免复杂的公共数据总线以降低时序损耗。实验结果表明,该处理器可以通过配置达到IPC为0.746~1.476之间的性能,平均比同类型处理器IPC提升132.4%。 展开更多
关键词 流水线缓存 RISC-V指令集 超标量 参数化 指令划分
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部