-
题名混洗SRAM:SRAM中的并行按位数据混洗
- 1
-
-
作者
张敦博
曾灵灵
王若曦
王耀华
沈立
-
机构
国防科技大学计算机学院
先进微处理器芯片与系统重点实验室(国防科技大学)
-
出处
《计算机研究与发展》
北大核心
2025年第1期75-89,共15页
-
基金
国家自然科学基金项目(61972407)。
-
文摘
向量处理单元(vector processing unit,VPU)已被广泛应用于神经网络、信号处理和高性能计算等处理器设计中,但其总体性能仍受限于专门用于对齐数据的混洗操作.传统上,处理器使用其数据混洗单元来处理混洗操作.然而,使用数据混洗单元来处理混洗指令将带来昂贵的数据移动开销,并且数据混洗单元只能串行混洗数据.事实上,混洗操作只会改变数据的布局,理想情况下混洗操作应在内存中完成.随着存内计算技术的发展,SRAM不仅可以作为存储部件,同时还能作为计算单元.为了实现存内混洗,提出了混洗SRAM,它可以在SRAM体中逐位地并行混洗多个向量.混洗SRAM的关键思想是利用SRAM体中位线的数据移动能力来改变数据的布局.这样SRAM体中位于同一位线上不同数据的相同位可以同时被移动,从而使混洗操作拥有高度的并行性.通过适当的数据布局和向量混洗扩展指令的支持,混洗SRAM可以高效地处理常用的混洗操作.评测结果表明,对于常用的混洗操作,混洗SRAM可以实现平均28倍的性能增益,对于FFT,AlexNet,VggNet等实际的应用,可以实现平均3.18倍的性能增益.混洗SRAM相较于传统SRAM的面积开销仅增加了4.4%.
-
关键词
向量单指令多数据体系结构
静态随机访问存储器
混洗操作
向量内存
存内计算
-
Keywords
vector SIMD architecture
SRAM
shuffle operations
vector memory
processing in memory
-
分类号
TP333
[自动化与计算机技术—计算机系统结构]
-
-
题名x86处理器向量条件访存指令安全脆弱性分析
- 2
-
-
作者
李丹萍
朱子元
史岗
孟丹
-
机构
中国科学院信息工程研究所
中国科学院大学网络空间安全学院
-
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2024年第3期525-543,共19页
-
基金
中国科学院战略性先导科技专项(XDC02010400)资助.
-
文摘
单指令多数据流(Single Instruction stream,Multiple Data streams,SIMD)是一种利用数据级并行提高处理器性能的技术,旨在利用多个处理器并行执行同一条指令增加数据处理的吞吐量.随着大数据、人工智能等技术的兴起,人们对数据并行化处理的需求不断提高,这使得SIMD技术愈发重要.为了支持SIMD技术,Intel和AMD等x86处理器厂商从1996年开始在其处理器中陆续引入了MMX(MultiMedia Extensions)、SSE(Streaming SIMD Extensions)、AVX(Advanced Vector eXtensions)等SIMD指令集扩展.通过调用SIMD指令,程序员能够无需理解SIMD技术的硬件层实现细节就方便地使用它的功能.然而,随着熔断、幽灵等处理器硬件漏洞的发现,人们逐渐认识到并行优化技术是一柄双刃剑,它在提高性能的同时也能带来安全风险.本文聚焦于x86 SIMD指令集扩展中的VMASKMOV指令,对它的安全脆弱性进行了分析.本文的主要贡献如下:(1)利用时间戳计数器等技术对VMASKMOV指令进行了微架构逆向工程,首次发现VMASKMOV指令与内存页管理和CPU Fill Buffer等安全风险的相关性;(2)披露了一个新的处理器漏洞EvilMask,它广泛存在于Intel和AMD处理器上,并提出了3个EvilMask攻击原语:VMASKMOVL+Time(MAP)、VMASKMOVS+Time(XD)和VMASKMOVL+MDS,可用于实施去地址空间布局随机化攻击和进程数据窃取攻击;(3)给出了2个EvilMask概念验证示例(Proof-of-Concept,PoC)验证了EvilMask对真实世界的信息安全危害;(4)讨论了针对EvilMask的防御方案,指出最根本的解决方法是在硬件层面上重新实现VMASKMOV指令,并给出了初步的实现方案.
-
关键词
处理器安全
单指令多数据流(SIMD)
微体系结构侧信道攻击
VMASKMOV指令
地址空间布局随机化(ASLR)
-
Keywords
processor security
Single Instruction stream,Multiple Data streams(SIMD)
microarchitectural side-channel attacks
VMASKMOV instruction
Address Space Layout Randomization(ASLR)
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名DSP体系结构发展的新趋势
被引量:5
- 3
-
-
作者
黄 峰
李胜平
朱全庆
熊召新
邹雪城
-
机构
图像信息处理与智能控制教育部重点实验室
华中科技大学电子科学与技术系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2002年第4期1-2,218,共3页
-
文摘
CISC→RISC设计思想对DSP体系结构设计中数据和指令级并行性开发产生了深刻影响,融合RISC和SIMD技术的单核处理器已经成为DSP体系结构设计的新趋势。
-
关键词
超长指令字
单指令多数据流
数据级并行性
指令级并行性
DSP
数字信号处理器
体系结构
单核处理器
-
Keywords
VLIW
SIMD
Data level parallelism
Instruction level parallelism
-
分类号
TP332
[自动化与计算机技术—计算机系统结构]
TN911.72
[电子电信—通信与信息系统]
-