-
题名基于SSE指令的大内存快速拷贝
被引量:1
- 1
-
-
作者
钱昌松
刘志刚
刘代志
-
机构
第二炮兵工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2005年第2期113-114,120,共3页
-
基金
国家自然科学基金资助项目(40274044)
-
文摘
在深入研究单指令多数据流扩展指令集(StreamingSIMDExtensions,SSE)数据传输指令操作特点的基础上,充分考虑了数据预取、数据对齐、CPU缓存和新的128位寄存器等因素,在VisualC++平台上用嵌入汇编开发了内存拷贝函数。通过实验分析了各内存拷贝函数拷贝速度与拷贝内存量之间的对应关系。
-
关键词
单指令多数据流扩展指令集
内存拷贝
MMX
代码优化
-
Keywords
streaming simd extensions(sse)
Memory Copy
MMX
Code Optimization
-
分类号
TP319
[自动化与计算机技术—计算机软件与理论]
-
-
题名AES算法的SIMD指令集扩展方法与实现
- 2
-
-
作者
卢仕听
王帅
韩军
曾晓洋
-
机构
复旦大学专用集成电路与系统国家重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第6期121-123,共3页
-
基金
国家自然科学基金资助项目(60776028)
教育部重点基金资助项目(109055)
-
文摘
基于MIPS32 4k系列的处理器架构,提出一种AES算法的SIMD指令集扩展方法,利用处理器流水线对齐级和AES数据访问单元,实现64 bit数据位宽的并行处理操作。对不同实现方式的性能进行比较,结果表明,该方法的加解密运算性能有较大提高,硬件代价相对较小,且具有编程灵活性。
-
关键词
单指令流多数据流
高等加密标准
指令集扩展
-
Keywords
simd
Advanced Encryption Standard(AES)
instruction set extension
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名FDTD算法的三级并行实现
被引量:1
- 3
-
-
作者
张立红
余文华
-
机构
中国传媒大学信息工程学院
中国人民武装警察部队学院基础部
Penn State University
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第S1期333-335,共3页
-
文摘
传统的并行FDTD算法都是基于MPI或OpenMP或MPI+OpenMP的一级或两级并行算法。为加速基于MPI+OpenMP的两级并行FDTD算法,把基于SSE指令集的并行加速技术引入到FDTD算法中,采用基于MPI+OpenMP+SSE指令集的三级并行加速技术。在PC集群上对CPML吸收边界下点源在真空中传播的理想情况进行加速测试。基于SSE指令集的加速技术理想加速比为4,实验中在网格数为200 200 200情况下得到的加速比为2.44,加速效果较好。
-
关键词
时域有限差分
消息传递接口
OpenMP共享存储编程
sse指令集
并行
-
Keywords
Finite Difference Time Domain(FDTD)
Message Passing Interface(MPI)
OpenMP shared memory programming
streaming simd extensions(sse) instruction set
parallel
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-