期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于便笺式存储器的向量化SpMV算法的性能评估与分析
1
作者
张宗茂
董德尊
+3 位作者
王子聪
常俊胜
张晓云
王绍聪
《计算机工程与科学》
CSCD
北大核心
2024年第9期1521-1528,共8页
便笺式存储器是一种结构简单、访问延迟固定且软件可直接控制的片上高速存储,在现代处理器设计中得到了广泛应用。稀疏矩阵向量乘SpMV是高性能计算、人工智能等应用领域重要的内核计算函数之一。在传统多级Cache处理器中,SpMV算法计算...
便笺式存储器是一种结构简单、访问延迟固定且软件可直接控制的片上高速存储,在现代处理器设计中得到了广泛应用。稀疏矩阵向量乘SpMV是高性能计算、人工智能等应用领域重要的内核计算函数之一。在传统多级Cache处理器中,SpMV算法计算过程中对稠密输入向量的不规则访问操作会导致大量Cache访问请求失效,从而影响SpMV算法执行效率。为了评估便笺式存储器对SpMV向量算法的性能影响,使用ARM SVE指令对基于CSR格式的SpMV算法向量化,并将算法中的热点数据即稠密输入向量存储在便笺式存储器中,在集成了便笺式存储器的ARM架构处理器中对SpMV向量算法进行了性能分析。在gem5模拟器中针对来自真实应用程序的2562个稀疏矩阵进行了实验。实验结果表明,集成了便笺式存储器的处理器与传统多级Cache处理器相比,针对向量化SpMV算法能够实现的最大加速比为7.45,平均加速比为1.11。
展开更多
关键词
稀疏矩阵向量乘
便笺式存储器
CSR
ARM
SVE
在线阅读
下载PDF
职称材料
便笺式存储器中一种新颖的交错映射数据布局
2
作者
曾灵灵
张敦博
+1 位作者
沈立
窦强
《计算机工程》
CAS
CSCD
北大核心
2024年第5期33-40,共8页
现代计算机一直沿用传统的线性数据布局模式,该模式允许对使用行主序模式存储的二维矩阵进行高效的行优先数据访问,但是增加了高效执行列优先数据访问的复杂性,造成列优先访问的空间局部性较差。改善列优先数据访存效率的常见解决方案...
现代计算机一直沿用传统的线性数据布局模式,该模式允许对使用行主序模式存储的二维矩阵进行高效的行优先数据访问,但是增加了高效执行列优先数据访问的复杂性,造成列优先访问的空间局部性较差。改善列优先数据访存效率的常见解决方案是对原始矩阵进行预先转置操作,将列优先访问的复杂性集中在一次矩阵转置运算中,然而矩阵转置不仅会引入额外的数据传输操作,而且会消耗额外的存储空间用于存储转置后的矩阵。为了在不引入额外开销的情况下使行优先与列优先数据访问具有同样高效的访存效率,提出一种新颖的交错映射(IM)数据布局,同时在不改变便笺式存储器(SPM)内部结构的基础上,在SPM的输入和输出(I/O)接口处添加循环移位单元和译码单元2个新组件,实现交错映射数据布局并定制访存指令,使程序员可通过定制的访存指令充分利用该数据布局。实验结果表明,应用交错映射数据布局的SPM在仅额外增加了1.73%面积开销的情况下获得了1.4倍的加速。
展开更多
关键词
矩阵转置
单指令多数据
便笺式存储器
数据布局
静态随机
存储器
在线阅读
下载PDF
职称材料
基于CK-CPU的Linux2.6实时性能优化
被引量:
1
3
作者
江健勇
李春强
胡军山
《计算机工程》
CAS
CSCD
北大核心
2011年第17期236-238,共3页
针对Linux2.6在实时中断应用上的局限性,提出一种基于CK-CPU的实时性能优化方案。设计用于实时中断的快速中断请求(FIQ)机制,在FIQ处理程序退出时增加实时进程调度策略,将FIQ服务程序的公共代码和堆栈保留在便笺式存储器中,减少FIQ服务...
针对Linux2.6在实时中断应用上的局限性,提出一种基于CK-CPU的实时性能优化方案。设计用于实时中断的快速中断请求(FIQ)机制,在FIQ处理程序退出时增加实时进程调度策略,将FIQ服务程序的公共代码和堆栈保留在便笺式存储器中,减少FIQ服务程序的内存访问次数并加快其执行速度。实验结果证明,该方案可显著提高Linux2.6的实时性能。
展开更多
关键词
LINUX2.6内核
实时性能
便笺式存储器
CK-CPU微处理器
在线阅读
下载PDF
职称材料
题名
基于便笺式存储器的向量化SpMV算法的性能评估与分析
1
作者
张宗茂
董德尊
王子聪
常俊胜
张晓云
王绍聪
机构
国防科技大学计算机学院
出处
《计算机工程与科学》
CSCD
北大核心
2024年第9期1521-1528,共8页
基金
湖南省杰出青年科学基金(2021JJ10050)
国防科技大学科研计划项目(ZK22-23)。
文摘
便笺式存储器是一种结构简单、访问延迟固定且软件可直接控制的片上高速存储,在现代处理器设计中得到了广泛应用。稀疏矩阵向量乘SpMV是高性能计算、人工智能等应用领域重要的内核计算函数之一。在传统多级Cache处理器中,SpMV算法计算过程中对稠密输入向量的不规则访问操作会导致大量Cache访问请求失效,从而影响SpMV算法执行效率。为了评估便笺式存储器对SpMV向量算法的性能影响,使用ARM SVE指令对基于CSR格式的SpMV算法向量化,并将算法中的热点数据即稠密输入向量存储在便笺式存储器中,在集成了便笺式存储器的ARM架构处理器中对SpMV向量算法进行了性能分析。在gem5模拟器中针对来自真实应用程序的2562个稀疏矩阵进行了实验。实验结果表明,集成了便笺式存储器的处理器与传统多级Cache处理器相比,针对向量化SpMV算法能够实现的最大加速比为7.45,平均加速比为1.11。
关键词
稀疏矩阵向量乘
便笺式存储器
CSR
ARM
SVE
Keywords
sparse matrix vector multiplication
scratchpad memory
compressed sparse row(CSR)
ARM scalable vector extension(SVE)
分类号
TP302 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
便笺式存储器中一种新颖的交错映射数据布局
2
作者
曾灵灵
张敦博
沈立
窦强
机构
国防科技大学计算机学院
飞腾信息技术有限公司
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第5期33-40,共8页
基金
国家自然科学基金面上项目(61972407)。
文摘
现代计算机一直沿用传统的线性数据布局模式,该模式允许对使用行主序模式存储的二维矩阵进行高效的行优先数据访问,但是增加了高效执行列优先数据访问的复杂性,造成列优先访问的空间局部性较差。改善列优先数据访存效率的常见解决方案是对原始矩阵进行预先转置操作,将列优先访问的复杂性集中在一次矩阵转置运算中,然而矩阵转置不仅会引入额外的数据传输操作,而且会消耗额外的存储空间用于存储转置后的矩阵。为了在不引入额外开销的情况下使行优先与列优先数据访问具有同样高效的访存效率,提出一种新颖的交错映射(IM)数据布局,同时在不改变便笺式存储器(SPM)内部结构的基础上,在SPM的输入和输出(I/O)接口处添加循环移位单元和译码单元2个新组件,实现交错映射数据布局并定制访存指令,使程序员可通过定制的访存指令充分利用该数据布局。实验结果表明,应用交错映射数据布局的SPM在仅额外增加了1.73%面积开销的情况下获得了1.4倍的加速。
关键词
矩阵转置
单指令多数据
便笺式存储器
数据布局
静态随机
存储器
Keywords
matrix transposition
Single Instruction Multiple Data(SIMD)
Scratch Pad Memory(SPM)
data layout
Static Random Access Memory(SRAM)
分类号
TP302.7 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于CK-CPU的Linux2.6实时性能优化
被引量:
1
3
作者
江健勇
李春强
胡军山
机构
浙江大学超大规模集成电路设计研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第17期236-238,共3页
基金
国家"863"计划基金资助项目(2009AA011706)
文摘
针对Linux2.6在实时中断应用上的局限性,提出一种基于CK-CPU的实时性能优化方案。设计用于实时中断的快速中断请求(FIQ)机制,在FIQ处理程序退出时增加实时进程调度策略,将FIQ服务程序的公共代码和堆栈保留在便笺式存储器中,减少FIQ服务程序的内存访问次数并加快其执行速度。实验结果证明,该方案可显著提高Linux2.6的实时性能。
关键词
LINUX2.6内核
实时性能
便笺式存储器
CK-CPU微处理器
Keywords
Linux2.6 kernel
real-time performance
Scratch Pad Memory(SPM)
CK-CPU microprocessor
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于便笺式存储器的向量化SpMV算法的性能评估与分析
张宗茂
董德尊
王子聪
常俊胜
张晓云
王绍聪
《计算机工程与科学》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
2
便笺式存储器中一种新颖的交错映射数据布局
曾灵灵
张敦博
沈立
窦强
《计算机工程》
CAS
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
3
基于CK-CPU的Linux2.6实时性能优化
江健勇
李春强
胡军山
《计算机工程》
CAS
CSCD
北大核心
2011
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部