期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
Multi-core optimization for conjugate gradient benchmark on heterogeneous processors
1
作者 邓林 窦勇 《Journal of Central South University》 SCIE EI CAS 2011年第2期490-498,共9页
Developing parallel applications on heterogeneous processors is facing the challenges of 'memory wall',due to limited capacity of local storage,limited bandwidth and long latency for memory access. Aiming at t... Developing parallel applications on heterogeneous processors is facing the challenges of 'memory wall',due to limited capacity of local storage,limited bandwidth and long latency for memory access. Aiming at this problem,a parallelization approach was proposed with six memory optimization schemes for CG,four schemes of them aiming at all kinds of sparse matrix-vector multiplication (SPMV) operation. Conducted on IBM QS20,the parallelization approach can reach up to 21 and 133 times speedups with size A and B,respectively,compared with single power processor element. Finally,the conclusion is drawn that the peak bandwidth of memory access on Cell BE can be obtained in SPMV,simple computation is more efficient on heterogeneous processors and loop-unrolling can hide local storage access latency while executing scalar operation on SIMD cores. 展开更多
关键词 multi-core processor NAS parallelization CG memory optimization
在线阅读 下载PDF
面向分组密码的可重构异构多核并行处理架构 被引量:7
2
作者 冯晓 李伟 +2 位作者 戴紫彬 马超 李功丽 《电子学报》 EI CAS CSCD 北大核心 2017年第6期1311-1320,共10页
现有的可重构分组密码实现结构中,专用指令处理器吞吐率不高,阵列结构资源利用率低、算法映射过程复杂.为此,设计了分组密码可重构异构多核并行处理架构RAMCA(Reconfigurable Asymmetrical Multi-Core Architecture),分析了典型SP(AES-1... 现有的可重构分组密码实现结构中,专用指令处理器吞吐率不高,阵列结构资源利用率低、算法映射过程复杂.为此,设计了分组密码可重构异构多核并行处理架构RAMCA(Reconfigurable Asymmetrical Multi-Core Architecture),分析了典型SP(AES-128)、Feistel(SMS4)、L-M(IDEA)及MISTY(KASUMI)结构算法在RAMCA上的映射过程.在65nm CMOS工艺下完成了逻辑综合和功能仿真.实验表明,RAMCA工作频率可达到1GHz,面积约为1.13mm2,消除工艺影响后,对各分组密码算法的运算速度均高于现有专用指令处理器以及Celator、RCPA和BCORE等阵列结构密码处理系统. 展开更多
关键词 分组密码 异构多核 可重构 并行处理 密码处理器
在线阅读 下载PDF
基于流体系架构的分组密码处理器设计 被引量:2
3
作者 李功丽 戴紫彬 +3 位作者 徐进辉 王寿成 朱玉飞 冯晓 《计算机研究与发展》 EI CSCD 北大核心 2017年第12期2824-2833,共10页
为提升密码处理器性能,构建了密码处理器性能模型.基于该模型,提出多级资源共享、绑定前/后异或操作、最大化算法并行度等处理器性能提升技术,并根据性能提升技术确定了功能单元的种类和数量.然而功能单元不仅数量较多,而且在操作位宽... 为提升密码处理器性能,构建了密码处理器性能模型.基于该模型,提出多级资源共享、绑定前/后异或操作、最大化算法并行度等处理器性能提升技术,并根据性能提升技术确定了功能单元的种类和数量.然而功能单元不仅数量较多,而且在操作位宽和操作延迟方面均有较大差异,如何有效组织这些功能单元成为了一个关键问题.利用流体系结构可以高效集成大量功能单元的特点,设计并实现了基于流体系结构的可重构分组密码处理器原型,并通过把功能单元划分为基本处理单元,bank间共享单元和簇间共享单元3个层次来解决功能单元处理位宽和操作延迟的差异.在65nm CMOS工艺下对处理器原型进行综合,并在该结构上映射了典型的分组密码算法.实验结果证明:该处理器以较小的面积获得了较高的性能,对典型分组密码算法的处理速度,不仅超越了国际上的密码专用指令处理器,而且高于国内可重构阵列结构密码处理器. 展开更多
关键词 分组密码 流处理器 性能模型 可重构 密码处理器
在线阅读 下载PDF
基于流体系结构的高效能分组密码处理器研究 被引量:3
4
作者 王寿成 严迎建 徐进辉 《电子学报》 EI CAS CSCD 北大核心 2017年第4期937-943,共7页
针对现有密码处理器存在的问题,借鉴流处理器架构,提出了高效能的可重构分组密码流处理器架构.该架构采用层次化设计思想,通过分块式本地寄存器组的数据组织方式和共享拼接使用运算单元机制,实现了软件流水和硬件流水的协同工作,能够挖... 针对现有密码处理器存在的问题,借鉴流处理器架构,提出了高效能的可重构分组密码流处理器架构.该架构采用层次化设计思想,通过分块式本地寄存器组的数据组织方式和共享拼接使用运算单元机制,实现了软件流水和硬件流水的协同工作,能够挖掘分组内和分组间的指令级并行性并提高功能单元的利用率.在65nm CMOS工艺下对架构进行了综合仿真,并经过了大量算法映射.实验结果证明,该架构在CBC和ECB加密模式下均具有良好的加密性能.与其他密码处理器相比,该架构具有小面积、高效能的特点. 展开更多
关键词 分组密码 流处理器 可重构 软件流水 面积能效比
在线阅读 下载PDF
密码指令集扩展研究 被引量:1
5
作者 李美峰 戴冠中 +2 位作者 刘航 苗胜 张德刚 《计算机应用研究》 CSCD 北大核心 2008年第6期1833-1835,共3页
详细分析了常见密码算法的基本操作以及密码指令集扩展的研究现状,针对当前密码系统需要支持多种密码算法的特点指出未来密码指令集扩展的发展方向:指令设计需朝通用性上发展且通用密码处理器是处理器密码指令集扩展的最终目的。
关键词 密码指令集扩展 基本操作 通用性 通用密码处理器
在线阅读 下载PDF
面向密码流体系结构的超长指令字可重构研究 被引量:2
6
作者 严迎建 王寿成 +1 位作者 徐进辉 陈韬 《电子与信息学报》 EI CSCD 北大核心 2017年第1期206-212,共7页
可重构密码流体系结构是一种面向密码运算的新型体系结构,但存在着超长指令字(VLIW)代码稀疏和Kernel体积过大的问题。该文以可重构密码流处理架构S-RCCPA为研究平台,通过大量密码算法在S-RCCPA架构上的适配分析,提出了VLIW可重构技术,... 可重构密码流体系结构是一种面向密码运算的新型体系结构,但存在着超长指令字(VLIW)代码稀疏和Kernel体积过大的问题。该文以可重构密码流处理架构S-RCCPA为研究平台,通过大量密码算法在S-RCCPA架构上的适配分析,提出了VLIW可重构技术,并设计了Kernel级指令集、VLIW可重构算法及指令可重构单元。实验证明,该技术能够有效提高VLIW的指令密度,同时降低了VLIW的指令宽度,使得整个Kernel体积减小了约33.3%,并将微码存储器的容量由96 k B降为64 k B,有效降低芯片整体面积和系统功耗。 展开更多
关键词 密码流处理器 Kernel级指令 超长指令字 可重构 指令密度
在线阅读 下载PDF
基于多核密码处理器的AES算法并行映射技术
7
作者 杨宇航 徐金甫 闫少阁 《计算机工程与设计》 北大核心 2017年第4期916-921,共6页
为解决多核处理器实现算法应用中出现的算法映射和数据划分调度问题,提出一种面向多核密码处理器的密码算法映射方案。通过对AES算法和密码处理器指令特点分析,提出一种高效的单核映射方案,保证单核单运算任务的高效处理。通过对多核结... 为解决多核处理器实现算法应用中出现的算法映射和数据划分调度问题,提出一种面向多核密码处理器的密码算法映射方案。通过对AES算法和密码处理器指令特点分析,提出一种高效的单核映射方案,保证单核单运算任务的高效处理。通过对多核结构和任务处理特点进行分析建模,建立一种符合任务级并行特点的数据划分调度模型,设计无阻塞数据并行调度方案,充分发挥多核平台的并行运算优势。实验结果表明,多核加速比接近理论值,平均单核吞吐率达到理论值的99.7%。 展开更多
关键词 高级加密标准 多核密码处理器 映射 数据划分调度 吞吐率 加速比
在线阅读 下载PDF
通用密码处理器在FPGA中的实现
8
作者 邹候文 刘磊 +1 位作者 王峰 唐屹 《计算机工程与应用》 CSCD 北大核心 2006年第4期98-101,共4页
考虑密码应用中存在密码算法基本操作的多样性、使用的复杂性和安全需求等因素,讨论了一种通用密码处理器的设计方案,并在FPGA上实现了该设计的原型。原型的主要设计思想是在一个精简的64位处理器中挂上所需要的密码算法功能部件再增加... 考虑密码应用中存在密码算法基本操作的多样性、使用的复杂性和安全需求等因素,讨论了一种通用密码处理器的设计方案,并在FPGA上实现了该设计的原型。原型的主要设计思想是在一个精简的64位处理器中挂上所需要的密码算法功能部件再增加相应的指令。该原型支持39条指令,除DES、AES和正规基乘法MMU外其它指令都在一个时钟周期完成。支持DES、3DES和AES算法的任意工作模式,同时支持RSA、特征P和特征2上最优正规基的ECC。 展开更多
关键词 处理器 密码 体系结构
在线阅读 下载PDF
基于指令级冗余的密码流处理器并发错误检测方法
9
作者 戴强 戴紫彬 +2 位作者 王寿成 李功丽 李伟 《计算机应用与软件》 北大核心 2018年第10期286-291,298,共7页
自然故障与恶意故障将降低密码流处理器的可靠性与安全性。针对此情况,提出基于指令级冗余的低开销并发错误检测方法。分析密码流处理器上不同算法实现时的功能单元利用率,验证指令级冗余方法实现的可行性与高效性。提出脆弱性感知的指... 自然故障与恶意故障将降低密码流处理器的可靠性与安全性。针对此情况,提出基于指令级冗余的低开销并发错误检测方法。分析密码流处理器上不同算法实现时的功能单元利用率,验证指令级冗余方法实现的可行性与高效性。提出脆弱性感知的指令复制算法,在满足性能约束条件下优先复制脆弱性高的指令。实验证明,该方法引入的硬件开销仅为1. 5%,且在相同性能开销时,对随机故障与恶意故障的检测能力优于其他指令级冗余方法。全指令复制后典型SP(AES-128)、Feistel(SMS4)、L-M(IDEA)结构算法实现性能开销分别为25.6%、17. 9%、15. 7%,对比于具有相似故障检测能力的其他指令级冗余方法,其性能开销最低。 展开更多
关键词 密码流处理器 并发错误检测 VLIW 指令复制
在线阅读 下载PDF
面向任务级的多核密码处理器数据分配机制 被引量:3
10
作者 戴乐育 李伟 +1 位作者 徐金甫 李军伟 《计算机工程与设计》 北大核心 2015年第1期98-102,共5页
为解决在多核密码处理器算法映射中单密码算法高速实现、多密码算法并行实现和复杂信息安全协议实现带来的数据分配问题,对多核密码处理器密码算法的映射方式进行研究,对多核密码处理器进行任务级划分,构建信息安全系统的使用需求、多... 为解决在多核密码处理器算法映射中单密码算法高速实现、多密码算法并行实现和复杂信息安全协议实现带来的数据分配问题,对多核密码处理器密码算法的映射方式进行研究,对多核密码处理器进行任务级划分,构建信息安全系统的使用需求、多核密码处理器密码算法的映射方式和多核密码处理器的数据分配方式三者之间的桥梁,提出一种面向任务级的多核密码处理器的数据分配机制。对比实验结果表明,面向任务级的数据分配机制具有更高的性能和灵活性。 展开更多
关键词 信息安全 多核密码处理器 密码算法映射 任务级 数据分配机制
在线阅读 下载PDF
SHA-2算法在多核密码处理器上的实现研究 被引量:1
11
作者 曲思源 戴紫彬 +1 位作者 李伟 戴强 《计算机应用与软件》 CSCD 2016年第4期51-55,共5页
为了找出一种适合多核密码处理器的SHA-2算法高速实现方式,提高SHA-2算法在多核密码处理器上的执行速度。首先研究SHA-256、SHA-512算法在密码处理器上的实现方式,并研究多核密码处理器的结构特点与数据传输方式,分析SHA-2算法在多核上... 为了找出一种适合多核密码处理器的SHA-2算法高速实现方式,提高SHA-2算法在多核密码处理器上的执行速度。首先研究SHA-256、SHA-512算法在密码处理器上的实现方式,并研究多核密码处理器的结构特点与数据传输方式,分析SHA-2算法在多核上的高速实现原理。然后对SHA-2算法进行任务划分,提出SHA-2在多核密码处理器上的调度与映射算法并使用软件实现调度算法。在ASIC上的仿真验证结果表明,经优化后的SHA-2算法在多核上并行执行吞吐率有了较大提升,满足性能上的需求。 展开更多
关键词 SHA-2 多核 密码处理器 任务调度与映射
在线阅读 下载PDF
多核密码处理器的数据分配控制器研究与设计 被引量:2
12
作者 戴乐育 徐金甫 李伟 《小型微型计算机系统》 CSCD 北大核心 2015年第9期2140-2143,共4页
为了解决在提供复杂多样的高速信息安全服务时日益凸显的数据分配问题,对多核密码处理的数据分配特征进行了分析,设计了多核密码处理器数据分配控制器,实现了多核密码处理器的快速灵活分配.特别针对数据分配控制器任务解析及数据传输的... 为了解决在提供复杂多样的高速信息安全服务时日益凸显的数据分配问题,对多核密码处理的数据分配特征进行了分析,设计了多核密码处理器数据分配控制器,实现了多核密码处理器的快速灵活分配.特别针对数据分配控制器任务解析及数据传输的问题,设计了任务引导单元和快速传输通道.在CMOS 65nm工艺下综合,数据分配控制器的最高时钟频率可达到638M Hz.实验结果证明,本文设计的数据分配控制器具有更高的数据分配效率和灵活性. 展开更多
关键词 信息安全 多核密码处理器 信息安全协议 数据分配控制器 任务引导单元
在线阅读 下载PDF
面向多任务密码处理的多核核间通信单元设计与研究 被引量:1
13
作者 陈帆 徐金甫 李伟 《计算机应用与软件》 CSCD 2016年第3期324-326,333,共4页
为了解决面向多任务密码处理的多核核间通信机制的优化实现问题,设计一种混合通信机制。在分析多核处理架构及核间通信特点的基础上,融合了簇内共享存储通信和簇间No C通信机制,同时引入了DMA通信机制,提出构建混合通信机制,进一步提升... 为了解决面向多任务密码处理的多核核间通信机制的优化实现问题,设计一种混合通信机制。在分析多核处理架构及核间通信特点的基础上,融合了簇内共享存储通信和簇间No C通信机制,同时引入了DMA通信机制,提出构建混合通信机制,进一步提升通信效率。其次,给出核间通信同步机制的优化实现,解决了同步和存储一致性冲突问题。最后,基于Design Complier对设计方案进行了实验评估。实验结果表明,相比其他方案,该方案具有较小的资源代价和较高的性能指标,获得了满意的通信吞吐率。 展开更多
关键词 多核密码处理器 密码运算 核间通信 同步机制
在线阅读 下载PDF
高速网络安全协处理器中PCI-X接口设计 被引量:1
14
作者 朱莹 白国强 陈弘毅 《计算机工程》 CAS CSCD 北大核心 2009年第7期212-214,共3页
介绍高速网络安全协处理器中PCI-X接口模块的设计方法,利用IPSec和SSL/TLS2种协议优化系统,并配置各种算法引擎。协处理器采用具有更高性能的PCI-X总线接口及SoC芯片,能够同时满足PCI-X总线协议和协处理器内部的特殊传输要求。实验结果... 介绍高速网络安全协处理器中PCI-X接口模块的设计方法,利用IPSec和SSL/TLS2种协议优化系统,并配置各种算法引擎。协处理器采用具有更高性能的PCI-X总线接口及SoC芯片,能够同时满足PCI-X总线协议和协处理器内部的特殊传输要求。实验结果表明,该设计方法是可行的。 展开更多
关键词 PCI-X总线接口 密码安全 协处理器
在线阅读 下载PDF
可重构密码流体系结构模拟器设计与实现 被引量:1
15
作者 王寿成 严迎建 +2 位作者 徐进辉 李功丽 朱玉飞 《计算机工程与设计》 北大核心 2016年第11期2923-2927,共5页
面向可重构密码流处理器RCSP,设计并实现基于SystemC语言的全系统模拟器RCSPSim,提出模拟器的硬件资源建模方法、指令集及译码方案和性能统计方案,实现对RCSP处理器的高效精确模拟。RCSPSim能够准确实现密码算法,进行详细的吞吐率评测,... 面向可重构密码流处理器RCSP,设计并实现基于SystemC语言的全系统模拟器RCSPSim,提出模拟器的硬件资源建模方法、指令集及译码方案和性能统计方案,实现对RCSP处理器的高效精确模拟。RCSPSim能够准确实现密码算法,进行详细的吞吐率评测,为实际处理器开发和优化提供重要的评估和借鉴作用。在单簇(核)前提下,与其它结构的专用密码处理器相比较,RCSPSim在实现典型密码算法时具有较高的吞吐率,验证了可重构密码流体系结构的性能优势。 展开更多
关键词 可重构技术 密码流处理器 流体系结构 SYSTEMC 模拟器
在线阅读 下载PDF
可重构分组密码指令集处理器自动映射方法研究 被引量:1
16
作者 李盛 戴紫彬 《电子与信息学报》 EI CSCD 北大核心 2021年第9期2526-2533,共8页
计算资源与寄存器资源分配是可重构处理器自动并行映射的重要问题,该文针对可重构分组密码指令集处理器的资源分配问题,建立算子调度参数模型和处理器资源参数模型,研究了分组密码并行调度与资源消耗之间的约束关系;在此基础上提出基于... 计算资源与寄存器资源分配是可重构处理器自动并行映射的重要问题,该文针对可重构分组密码指令集处理器的资源分配问题,建立算子调度参数模型和处理器资源参数模型,研究了分组密码并行调度与资源消耗之间的约束关系;在此基础上提出基于贪婪思维、列表调度和线性扫描的自动映射算法,实现了分组密码在可重构分组密码指令集处理器上的自动映射。通过可用资源变化实验验证算法并行映射的有效性,并对AES-128算法的映射效果做了横向对比验证算法的先进性,所提自动映射算法对分组密码在可重构处理中的并行计算研究有一定的指导意义。 展开更多
关键词 可重构分组密码指令集处理器 自动映射 资源分配 列表调度 线性扫描
在线阅读 下载PDF
基于可重构密码模块的VPN安全网关 被引量:3
17
作者 褚有睿 王志远 欧阳旦 《计算机工程》 CAS CSCD 北大核心 2011年第5期152-154,共3页
结合片上可编程系统和IPSec技术,设计一种基于可重构密码处理模块的虚拟专用网安全网关。该网关采用双处理器结构,主处理器完成系统芯片的初始化配置、系统控制、管理和数据包的预处理,协处理器完成IPSec处理功能,可重构密码处理模块加... 结合片上可编程系统和IPSec技术,设计一种基于可重构密码处理模块的虚拟专用网安全网关。该网关采用双处理器结构,主处理器完成系统芯片的初始化配置、系统控制、管理和数据包的预处理,协处理器完成IPSec处理功能,可重构密码处理模块加速加解密处理,从而提高算法执行效率,同时扩展IPSec协议的安全性。实验结果表明,该网关具有较高的吞吐率,能满足中低端网络安全的需求。 展开更多
关键词 虚拟专用网安全网关 NIOSⅡ处理器 片上可编程系统 可重构密码处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部