期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于便笺式存储器的向量化SpMV算法的性能评估与分析
1
作者 张宗茂 董德尊 +3 位作者 王子聪 常俊胜 张晓云 王绍聪 《计算机工程与科学》 CSCD 北大核心 2024年第9期1521-1528,共8页
便笺式存储器是一种结构简单、访问延迟固定且软件可直接控制的片上高速存储,在现代处理器设计中得到了广泛应用。稀疏矩阵向量乘SpMV是高性能计算、人工智能等应用领域重要的内核计算函数之一。在传统多级Cache处理器中,SpMV算法计算... 便笺式存储器是一种结构简单、访问延迟固定且软件可直接控制的片上高速存储,在现代处理器设计中得到了广泛应用。稀疏矩阵向量乘SpMV是高性能计算、人工智能等应用领域重要的内核计算函数之一。在传统多级Cache处理器中,SpMV算法计算过程中对稠密输入向量的不规则访问操作会导致大量Cache访问请求失效,从而影响SpMV算法执行效率。为了评估便笺式存储器对SpMV向量算法的性能影响,使用ARM SVE指令对基于CSR格式的SpMV算法向量化,并将算法中的热点数据即稠密输入向量存储在便笺式存储器中,在集成了便笺式存储器的ARM架构处理器中对SpMV向量算法进行了性能分析。在gem5模拟器中针对来自真实应用程序的2562个稀疏矩阵进行了实验。实验结果表明,集成了便笺式存储器的处理器与传统多级Cache处理器相比,针对向量化SpMV算法能够实现的最大加速比为7.45,平均加速比为1.11。 展开更多
关键词 稀疏矩阵向量乘 便笺式存储器 CSR ARM SVE
在线阅读 下载PDF
便笺式存储器中一种新颖的交错映射数据布局
2
作者 曾灵灵 张敦博 +1 位作者 沈立 窦强 《计算机工程》 CAS CSCD 北大核心 2024年第5期33-40,共8页
现代计算机一直沿用传统的线性数据布局模式,该模式允许对使用行主序模式存储的二维矩阵进行高效的行优先数据访问,但是增加了高效执行列优先数据访问的复杂性,造成列优先访问的空间局部性较差。改善列优先数据访存效率的常见解决方案... 现代计算机一直沿用传统的线性数据布局模式,该模式允许对使用行主序模式存储的二维矩阵进行高效的行优先数据访问,但是增加了高效执行列优先数据访问的复杂性,造成列优先访问的空间局部性较差。改善列优先数据访存效率的常见解决方案是对原始矩阵进行预先转置操作,将列优先访问的复杂性集中在一次矩阵转置运算中,然而矩阵转置不仅会引入额外的数据传输操作,而且会消耗额外的存储空间用于存储转置后的矩阵。为了在不引入额外开销的情况下使行优先与列优先数据访问具有同样高效的访存效率,提出一种新颖的交错映射(IM)数据布局,同时在不改变便笺式存储器(SPM)内部结构的基础上,在SPM的输入和输出(I/O)接口处添加循环移位单元和译码单元2个新组件,实现交错映射数据布局并定制访存指令,使程序员可通过定制的访存指令充分利用该数据布局。实验结果表明,应用交错映射数据布局的SPM在仅额外增加了1.73%面积开销的情况下获得了1.4倍的加速。 展开更多
关键词 矩阵转置 单指令多数据 便笺式存储器 数据布局 静态随机存储器
在线阅读 下载PDF
基于CK-CPU的Linux2.6实时性能优化 被引量:1
3
作者 江健勇 李春强 胡军山 《计算机工程》 CAS CSCD 北大核心 2011年第17期236-238,共3页
针对Linux2.6在实时中断应用上的局限性,提出一种基于CK-CPU的实时性能优化方案。设计用于实时中断的快速中断请求(FIQ)机制,在FIQ处理程序退出时增加实时进程调度策略,将FIQ服务程序的公共代码和堆栈保留在便笺式存储器中,减少FIQ服务... 针对Linux2.6在实时中断应用上的局限性,提出一种基于CK-CPU的实时性能优化方案。设计用于实时中断的快速中断请求(FIQ)机制,在FIQ处理程序退出时增加实时进程调度策略,将FIQ服务程序的公共代码和堆栈保留在便笺式存储器中,减少FIQ服务程序的内存访问次数并加快其执行速度。实验结果证明,该方案可显著提高Linux2.6的实时性能。 展开更多
关键词 LINUX2.6内核 实时性能 便笺式存储器 CK-CPU微处理器
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部