期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于分数Alpha模型的缓存计算方法 被引量:1
1
作者 张冰怡 张宏科 +1 位作者 边裕兰 张辉 《计算机工程》 CAS CSCD 北大核心 2007年第12期34-36,共3页
缓存大小计算是高性能路由器设计中一个必不可少的内容,常规缓存计算方法是基于Poisson通信量模型得到的,不符合网络通信量的实际特征,在使用中存在丢包率较高的问题。已提出的分数Alpha通信量模型能体现通信量的自相似性和非高斯特征,... 缓存大小计算是高性能路由器设计中一个必不可少的内容,常规缓存计算方法是基于Poisson通信量模型得到的,不符合网络通信量的实际特征,在使用中存在丢包率较高的问题。已提出的分数Alpha通信量模型能体现通信量的自相似性和非高斯特征,用于缓存溢出概率计算,能得到比其它网络模型更好的结果。基于该模型得到了一个缓存计算方法,在高速路由器转发引擎的缓存设计应用中得到了满意的结果,与常规方法相比更体现了实际通信量的变化规律,计算结果更准确。 展开更多
关键词 路由器设计 缓存计算 Poisson模型 分数Alpha通信量模型
在线阅读 下载PDF
基于计算缓存方法的分子动力学程序性能优化 被引量:3
2
作者 张宝印 莫则尧 曹小林 《计算机工程与科学》 CSCD 北大核心 2009年第11期77-79,83,共4页
分子动力学数值模拟程序在现代高性能计算机上的计算效率往往很低,只能发挥系统峰值性能的几个百分点。本文对并行分子动力学程序PMD3D在联想深腾6800超级计算机上进行性能优化。通过性能分析,我们发现粒子相互作用力计算中相互关联的... 分子动力学数值模拟程序在现代高性能计算机上的计算效率往往很低,只能发挥系统峰值性能的几个百分点。本文对并行分子动力学程序PMD3D在联想深腾6800超级计算机上进行性能优化。通过性能分析,我们发现粒子相互作用力计算中相互关联的浮点运算严重影响了处理器的指令级并行效率,为此我们应用计算缓存的方法,将大量不规则的浮点计算进行缓存,达到一定规模后再进行向量化计算。这样使得单机性能在优化后提升4倍多,达到处理器峰值性能5.2GFlops的32.3%。最后,在深腾6800的64个节点的256个CPU上进行了并行性能测试,达到峰值运算性能1.3万亿次的27%。 展开更多
关键词 分子动力学 性能优化 计算缓存 指令级并行
在线阅读 下载PDF
面向混杂流计算的适应性存储器体系结构 被引量:1
3
作者 张萌 赵磊 +1 位作者 樊晓桠 田杭沛 《西北工业大学学报》 EI CAS CSCD 北大核心 2012年第6期961-967,共7页
可将科学计算中大量算法的计算形式视为由流计算和相当比例的通用计算混合而成。针对低并行度计算以及不易流化(Streamlization)的数据结构对流计算整体性能具有较大影响,提出了一种软、硬件可控的适应性片上存储结构DAMS Cache。该结... 可将科学计算中大量算法的计算形式视为由流计算和相当比例的通用计算混合而成。针对低并行度计算以及不易流化(Streamlization)的数据结构对流计算整体性能具有较大影响,提出了一种软、硬件可控的适应性片上存储结构DAMS Cache。该结构能够同时适应混杂流计算中流数据以及标量数据的存储需求;采用了适应性动态存储资源分配策略和适应性动态地址映射策略解决地址映射冲突问题;通过全硬件支持非规则流、条件流的存储与访问,混合数据替换策略能够充分挖掘数据的生产者-消费者局部性及时间、空间局部性。验证评估实验表明,相对Cache以及SPM(Scratchpad Memory),DAMS Cache算法的适应性较好,面向混杂流计算的性能较优。 展开更多
关键词 片内高速缓存 计算机体系结构 计算机硬件 计算机仿真 计算机软件 数据处理 高效率 微处理器芯片 多处理系统 优化 资源配置 调度 结构框图 DAMS动态地址映射流
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部