期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
格基后量子密码的可重构NTT运算单元与高效调度算法研究
1
作者 付秋兴 李伟 +2 位作者 别梦妮 陈韬 南龙梅 《电子学报》 北大核心 2025年第4期1182-1191,共10页
为进一步提高格基后量子密码算法中多项式乘法的运算速率,同时考虑到不同格基密码中多项式乘法参数各异的现状,本文提出了一种面向高速的可重构数论变换(Number Theoretic Transforms,NTT)运算单元,并提出了相应的数据调度方案解决时序... 为进一步提高格基后量子密码算法中多项式乘法的运算速率,同时考虑到不同格基密码中多项式乘法参数各异的现状,本文提出了一种面向高速的可重构数论变换(Number Theoretic Transforms,NTT)运算单元,并提出了相应的数据调度方案解决时序冲突和空间冲突问题.本文首先分析了不同格基后量子密码算法中NTT算法的运算特征,提出一款4×4的可重构运算单元,满足不同位宽的基2/3/4-NTT运算需求.其次,基于上述硬件设计提出了一种针对基4-NTT算法的数据调度方案,解决了高并行多流水级设计下的时序冲突问题.最后,提出了基于m-着色算法的多Bank数据存储方案,解决数据访问冲突的问题.实验结果表明,本文设计的硬件结构具备实现基2/3/4-NTT及其逆运算功能,能够支持Kyber、Dilithium在内的多种格基后量子密码算法,硬件支持最大并行度为4.为进一步验证本文硬件设计的优越性,在Xilinx Virtex-7器件上进行实验验证,工作频率达169 MHz,可在0.40μs内完成NTT算法功能,ATP降低约42%;在40 nm CMOS工艺节点进行综合实现,与现有的设计相比,本文的硬件设计AT积降低18%~90%. 展开更多
关键词 后量子密码 NTT 可重构 并行化 高速
在线阅读 下载PDF
基于异构多核心GPU的高性能密码计算技术研究进展 被引量:3
2
作者 董建阔 黄跃花 +4 位作者 付宇笙 肖甫 郑昉昱 林璟锵 董振江 《软件学报》 EI CSCD 北大核心 2024年第12期5582-5608,共27页
密码学是保障网络安全的核心基础,其在数据保护、身份验证、加密通信等方面发挥着至关重要的作用.随着5G和物联网技术的迅速普及,网络安全面临着空前的挑战,对密码学性能的要求呈现出爆发式增长.GPU能够利用数以千计的计算核心并行化加... 密码学是保障网络安全的核心基础,其在数据保护、身份验证、加密通信等方面发挥着至关重要的作用.随着5G和物联网技术的迅速普及,网络安全面临着空前的挑战,对密码学性能的要求呈现出爆发式增长.GPU能够利用数以千计的计算核心并行化加速复杂计算问题,这种并行化特性非常适用于密码学算法的计算密集型特性.鉴于此,研究人员广泛探索了在GPU平台上加速各种密码算法的方法,与CPU、FPGA等平台相比,GPU展现出明显的性能优势.论述各类密码算法的分类与GPU平台架构,对各类密码在GPU异构平台上的研究现状进行详细分析,总结当前基于GPU平台高性能密码学面临的技术难题,并对未来技术发展进行展望.通过深入研究和总结,旨在为密码工程研究从业者提供有关基于GPU的高性能密码计算的最新研究进展和应用实践的综合参考. 展开更多
关键词 公钥密码 后量子密码 同态密码 并行计算 GPU加速
在线阅读 下载PDF
基于AVX512的格密码高速并行实现 被引量:1
3
作者 雷斗威 何德彪 +1 位作者 罗敏 彭聪 《计算机工程》 CAS CSCD 北大核心 2024年第2期15-24,共10页
量子计算的迅速发展可能对当前广泛使用的公钥密码算法造成严重威胁。格密码因优秀的抗量子安全性和高效的计算效率在后量子密码中占据重要地位。美国国家标准技术研究院于2022年5月公布4个后量子密码标准,其中3个是格密码算法,Kyber算... 量子计算的迅速发展可能对当前广泛使用的公钥密码算法造成严重威胁。格密码因优秀的抗量子安全性和高效的计算效率在后量子密码中占据重要地位。美国国家标准技术研究院于2022年5月公布4个后量子密码标准,其中3个是格密码算法,Kyber算法便是其中之一。随着后量子密码标准的确定,Kyber算法高效实现的需求日益增加。基于512位高级向量扩展(AVX512),对Kyber算法进行优化与高速并行实现。使用惰性模约减、优化的蒙哥马利模约减及优化的快速数论变化等技术,充分利用计算机的存储空间,减少大量不必要的模约减操作,提高多项式计算的效率与并行性。采用冗余比特技术,增强多项式抽样过程中比特的并行处理能力。通过AVX512的512 bit位宽和8路并行实现哈希运算,并对其产生的伪随机比特串进行合理调度,充分发挥并行性能。基于AVX512指令集高速并行实现Kyber上的多项式计算和抽样,并进一步实现整个Kyber公钥加密方案。性能测试结果表明,与C语言实现相比,基于AVX512实现的密钥生成和加密算法获得了10~16倍的加速,解密算法获得了约56倍的加速。 展开更多
关键词 后量子密码 格密码 公钥加密 512位高级向量扩展指令集 并行计算
在线阅读 下载PDF
Falcon后量子算法的密钥树生成部件GPU并行优化设计与实现 被引量:1
4
作者 张磊 赵光岳 +1 位作者 肖超恩 王建新 《计算机工程》 CAS CSCD 北大核心 2024年第9期208-215,共8页
近年来,后量子密码算法因其具有抗量子攻击的特性成为安全领域的研究热点。基于格的Falcon数字签名算法是美国国家标准与技术研究所(NIST)公布的首批4个后量子密码标准算法之一。密钥树生成是Falcon算法的核心部件,在实际运算中占用较... 近年来,后量子密码算法因其具有抗量子攻击的特性成为安全领域的研究热点。基于格的Falcon数字签名算法是美国国家标准与技术研究所(NIST)公布的首批4个后量子密码标准算法之一。密钥树生成是Falcon算法的核心部件,在实际运算中占用较多的时间和消耗较多的资源。为此,提出一种基于图形处理器(GPU)的Falcon密钥树并行生成方案。该方案使用奇偶线程联合控制的单指令多线程(SIMT)并行模式和无中间变量的直接计算模式,达到了提升速度和减少资源占用的目的。基于Python的CUDA平台进行了实验,验证结果的正确性。实验结果表明,Falcon密钥树生成在RTX 3060 Laptop的延迟为6 ms,吞吐量为167次/s,在计算单个Falcon密钥树生成部件时相对于CPU实现了1.17倍的加速比,在同时并行1024个Falcon密钥树生成部件时,GPU相对于CPU的加速比达到了约56倍,在嵌入式Jetson Xavier NX平台上的吞吐量为32次/s。 展开更多
关键词 后量子密码 Falcon算法 图形处理器 CUDA平台 并行计算
在线阅读 下载PDF
NTRU格基密钥封装方案GPU高性能实现
5
作者 李文倩 沈诗羽 赵运磊 《计算机学报》 EI CAS CSCD 北大核心 2024年第9期2163-2178,共16页
随着量子计算技术的发展,传统加密算法受到的威胁日益严重.为应对量子计算时代的挑战,各国正积极加强后量子密码算法的实现和迁移部署工作.由于NTRU密码方案具有结构简洁、计算效率高、尺寸较小、无专利风险等优点,因此NTRU格基密钥封... 随着量子计算技术的发展,传统加密算法受到的威胁日益严重.为应对量子计算时代的挑战,各国正积极加强后量子密码算法的实现和迁移部署工作.由于NTRU密码方案具有结构简洁、计算效率高、尺寸较小、无专利风险等优点,因此NTRU格基密钥封装算法对于后量子时代的密码技术储备和应用具有重要意义.同时,图形处理器(Graphics Processing Unit,GPU)以其强大的并行计算能力、高吞吐量、低能耗等特性,已成为当前高并发密码工程实现的重要平台.本文给出后量子密码算法CTRU/CNTR的首个GPU高性能实现方案.对GPU主要资源占用进行分析,我们综合考虑并行计算、内存访问、数据布局和算法优化等多个方面,采用一系列计算和内存优化技术,旨在并行加速计算、优化访存、合理占用GPU资源以及减少I/O时延,从而提高本方案的计算能力和性能.本文的主要贡献在于以下几个方面:首先,针对模约减操作,使用NVIDIA并行指令集实现,有效减少所需指令条数;其次,针对耗时的多项式乘法模块,采用混合基NTT,并采用层融合、循环展开和延迟约减等方法,加快计算速度;此外,针对内存重复访问和冲突访问等问题,通过合并访存、核函数融合等优化技术,实现内存的高效访问;最后,为实现高并行的算法,设计恰当的线程块大小和数量,采用内存池机制,实现多任务的快速访存和高效处理.基于NVIDIA RTX4090平台,本方案CTRU768实现中密钥生成、封装和解封装的吞吐量分别为每秒1170.9万次、926.7万次和315.4万次.与参考实现相比,密钥生成、封装和解封装的吞吐量分别提高了336倍、174倍和128倍.本方案CNTR768实现中密钥生成、封装和解封装的吞吐量分别为每秒1117.3万次、971.8万次和322.2万次.与参考实现相比,密钥生成、封装和解封装的吞吐量分别提高了329倍、175倍和134倍;与开源Kyber实现相比,密钥生成、密钥封装和密钥解封装的吞吐量分别提升10.84~11.36倍、9.49~9.95倍和5.11~5.22倍.高性能的密钥封装实现在大规模任务处理场景下具有较大的应用潜力,对保障后量子时代的信息和数据安全具有重要意义. 展开更多
关键词 后量子密码 格基密码 密钥封装方案 并行处理 图形处理器
在线阅读 下载PDF
基于负载均衡的随机作业流密码服务调度算法 被引量:5
6
作者 李莉 史国振 +2 位作者 耿魁 董秀则 李凤华 《通信学报》 EI CSCD 北大核心 2018年第6期11-19,共9页
针对安全领域业务流并行处理系统面临数据密码服务请求多样,串行工作模式和并行工作模式交叉,不同业务的数据流相互交叉的现状以及服务响应的高速、高可靠性需求的问题,为了提高多密码算法并行处理的效率,以负载均衡为调度目标,在基于... 针对安全领域业务流并行处理系统面临数据密码服务请求多样,串行工作模式和并行工作模式交叉,不同业务的数据流相互交叉的现状以及服务响应的高速、高可靠性需求的问题,为了提高多密码算法并行处理的效率,以负载均衡为调度目标,在基于业务标识的分层硬件调度方法 HHS-ACDID基础上,综合考虑算法处理节点的存储容量和处理速度,设计一种同时支持非关联任务和关联任务的负载均衡作业调度算法,实现了高速的密码处理吞吐率。仿真结果表明,该算法能够完成对数据流系统的动态调度并且得到较优的负载均衡效果,与HHS-ACDID相比,执行效率提高12%左右。 展开更多
关键词 作业调度 并行处理 负载均衡 多密码算法 数据流
在线阅读 下载PDF
面向椭圆曲线密码的处理器并行体系结构研究与设计 被引量:4
7
作者 杨晓辉 戴紫彬 +1 位作者 李淼 张永福 《通信学报》 EI CSCD 北大核心 2011年第5期70-77,共8页
在研究椭圆曲线密码算法的处理特征以及有限域层上的并行调度算法基础上,采用指令级并行和数据级并行方法,提出了面向椭圆曲线密码的并行处理器体系结构模型,并就模型的存储结构进行了分析。基于该模型实现了一款验证原型,在FPGA上成功... 在研究椭圆曲线密码算法的处理特征以及有限域层上的并行调度算法基础上,采用指令级并行和数据级并行方法,提出了面向椭圆曲线密码的并行处理器体系结构模型,并就模型的存储结构进行了分析。基于该模型实现了一款验证原型,在FPGA上成功进行了验证测试并在0.18μm CMOS工艺标准单元库下进行逻辑综合以及布局布线。实验证明提出的并行处理器体系结构既能保证椭圆曲线密码算法应用的灵活性,又能够达到较高的性能。 展开更多
关键词 椭圆曲线密码 专用指令处理器 并行体系结构 验证原型
在线阅读 下载PDF
采用细胞神经网络结构进行图像加密的框架及算法 被引量:4
8
作者 周庆 廖晓峰 胡月 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2009年第11期1676-1681,共6页
为提高图像加密算法的安全性和速度,基于细胞神经网络的并行计算和局部扩散特点,提出一种图像分组加密框架,并设计出相应的加密算法.在每轮加密中,各细胞先对其负责的图像块进行像素混合、轮密钥异或和S盒替代加密操作,再与相邻8个细胞... 为提高图像加密算法的安全性和速度,基于细胞神经网络的并行计算和局部扩散特点,提出一种图像分组加密框架,并设计出相应的加密算法.在每轮加密中,各细胞先对其负责的图像块进行像素混合、轮密钥异或和S盒替代加密操作,再与相邻8个细胞的输出进行异或运算.该算法适于VLSI实现,且支持并行计算.理论分析和实验结果表明,该算法在安全性能方面表现优异. 展开更多
关键词 细胞神经网络 图像加密 并行计算 密码学
在线阅读 下载PDF
一种新的图像加密并行算法 被引量:2
9
作者 刘君 周庆 胡月 《计算机工程》 CAS CSCD 北大核心 2010年第11期20-21,24,共3页
针对传统的图像加密算法在效率和安全性上的不足,提出一种图像加密并行算法Square,该算法由Square像素排列和改进的混合操作等运算构成。满足图像加密并行算法的4个要求,加密速度和安全特性超过了MASK图像加密并行算法,具有安全、快速... 针对传统的图像加密算法在效率和安全性上的不足,提出一种图像加密并行算法Square,该算法由Square像素排列和改进的混合操作等运算构成。满足图像加密并行算法的4个要求,加密速度和安全特性超过了MASK图像加密并行算法,具有安全、快速和简洁等优点,可在实际的并行计算平台上使用。 展开更多
关键词 图像加密 并行计算 密码学
在线阅读 下载PDF
新的基于身份的多签名体制 被引量:4
10
作者 纪家慧 李大兴 《计算机工程与应用》 CSCD 北大核心 2004年第27期17-18,37,共3页
首次提出一个新的利用椭圆曲线上双线性对的基于身份的多签名体制。所提出的体制基于Hess的基于身份的签名体制,能实现并行和串行的签名结构,而且在此新多签名体制中,多签名的大小和验证与任意共同签名者产生的单个签名完全相同。同时... 首次提出一个新的利用椭圆曲线上双线性对的基于身份的多签名体制。所提出的体制基于Hess的基于身份的签名体制,能实现并行和串行的签名结构,而且在此新多签名体制中,多签名的大小和验证与任意共同签名者产生的单个签名完全相同。同时也讨论了新体制抵抗外部攻击和内部攻击的安全性。 展开更多
关键词 基于身份密码 多签名 并行 串行 双线性对
在线阅读 下载PDF
椭圆曲线密码处理器的高效并行处理架构研究与设计 被引量:6
11
作者 戴紫彬 易肃汶 +1 位作者 李伟 南龙梅 《电子与信息学报》 EI CSCD 北大核心 2017年第10期2487-2494,共8页
为了解决当前椭圆曲线密码处理器普遍存在灵活性低、资源占用大的问题,该文采用统计建模的方式,以面积-时间(AT)综合性能指标为指导,提出了一种面向椭圆曲线密码并行处理架构的量化评估方式,并确定3路异构并行处理架构可使处理器综合性... 为了解决当前椭圆曲线密码处理器普遍存在灵活性低、资源占用大的问题,该文采用统计建模的方式,以面积-时间(AT)综合性能指标为指导,提出了一种面向椭圆曲线密码并行处理架构的量化评估方式,并确定3路异构并行处理架构可使处理器综合性能达到最优。其次,该文提出一个分离分级式存储结构和一个运算资源高度复用的模运算单元,可增强存储器的访问效率和运算资源的利用率。在90 nm CMOS工艺下综合,该文处理器的面积为1.62 mm^2,完成一次GF(2^(571))和GF(p^(521))上的点乘运算分别需要2.26 ms/612.4μJ和2.63 ms/665.4μJ。与同类设计相比,该文处理器不仅具有较高的灵活性、可伸缩性,而且其芯片面积和运算速度达到了很好的折中。 展开更多
关键词 椭圆曲线密码 并行处理架构 量化评估 分离分级式存储结构 资源复用
在线阅读 下载PDF
运用SPIN对云环境双向认证协议Nayak的安全性验证 被引量:1
12
作者 肖美华 梅映天 李伟 《计算机应用与软件》 2017年第10期298-303,共6页
随着云计算的发展,由欺诈行为驱动的窃取云资源和云服务的行为日趋严重,导致云资源提供商与用户间出现信任危机。Nayak协议是一种改进的云环境双向认证协议,用于保障用户安全登录云服务器,防止第三方恶意窃取用户信息。采用对称密钥密... 随着云计算的发展,由欺诈行为驱动的窃取云资源和云服务的行为日趋严重,导致云资源提供商与用户间出现信任危机。Nayak协议是一种改进的云环境双向认证协议,用于保障用户安全登录云服务器,防止第三方恶意窃取用户信息。采用对称密钥密码体系对Nayak协议进行加密,基于Dolev-Yao攻击者模型,提出四通道并行建模法描述攻击者能力。该建模方法解决了Nayak协议并行运行过程中的模型检测问题以及安全隐患,优化了模型复杂度与存储状态数。运用SPIN模型验证工具分析表明采用对称密钥密码体系对Nayak协议加密不安全。此方法可运用于类似复杂协议形式化分析与验证。 展开更多
关键词 Nayak协议 模型检测 四通道并行建模 对称密钥加密
在线阅读 下载PDF
GF(p)上椭圆曲线密码的并行基点选取算法研究 被引量:1
13
作者 刘晓玲 《计算机应用研究》 CSCD 北大核心 2007年第4期33-36,共4页
提出一种GF(p)上椭圆曲线密码系统的并行基点选取算法,该算法由并行随机点产生算法和并行基点判断算法两个子算法组成,给出了算法性能的理论分析和实验结果。结果表明:各并行处理器单元具有较好的负载均衡特性;当执行并行基点判断算法,... 提出一种GF(p)上椭圆曲线密码系统的并行基点选取算法,该算法由并行随机点产生算法和并行基点判断算法两个子算法组成,给出了算法性能的理论分析和实验结果。结果表明:各并行处理器单元具有较好的负载均衡特性;当执行并行基点判断算法,其标量乘的点加计算时间是点倍数计算时间的三倍时,算法的并行效率可达90%。因此该算法可用于椭圆曲线密码(Elliptic Curve Cryptography,ECC)中基点的快速选取,从而提高ECC的加/解密速度。 展开更多
关键词 椭圆曲线密码 椭圆曲线 标量乘 并行算法 基点
在线阅读 下载PDF
并行设计的高性能随机椭圆曲线加密协处理器
14
作者 但永平 邹雪城 +1 位作者 刘政林 韩煜 《计算机工程与科学》 CSCD 北大核心 2009年第2期104-107,115,共5页
为加速椭圆曲线加密的运算,本文提出了一种新的并行设计的椭圆曲线加密处理器结构。该处理器采用的模运算单元的特点是含有两个模乘、一个模加和一个模平方模块。两个模乘可以并行运算,而且在模乘运算的同时可并行完成模加或模平方的运... 为加速椭圆曲线加密的运算,本文提出了一种新的并行设计的椭圆曲线加密处理器结构。该处理器采用的模运算单元的特点是含有两个模乘、一个模加和一个模平方模块。两个模乘可以并行运算,而且在模乘运算的同时可并行完成模加或模平方的运算。Xilinx公司的VirtexE XCV2600 FPGA硬件实现结果表明,完成有限域GF(2163)上任意椭圆曲线上的一次标量乘的全部运算只需3064个时钟,时间消耗为31.17μs,资源消耗为3994个寄存器和15527个查找表,适合高性能椭圆曲线加密应用的要求。 展开更多
关键词 椭圆曲线 标量乘 硬件实现 并行设计 高性能
在线阅读 下载PDF
多媒体环境下语音保密体制的研究与实现
15
作者 王丽娜 郝玉君 +1 位作者 蓝春岭 李克洪 《小型微型计算机系统》 EI CSCD 北大核心 1998年第4期9-13,共5页
本文提出了一种在多媒体环境下适合于语音保密的并行m序列随机抽样密码算法,基于该算法设计一个多媒体语音保密系统模型,系统包括语音的录音、放音、集成、效果修饰、加密、解密等功能。
关键词 语音保密 多媒体 信息保密 信息处理
在线阅读 下载PDF
众核计算平台的高吞吐率密码算法加速
16
作者 符鹤 李春江 +1 位作者 王昊 谢永芳 《计算机工程与科学》 CSCD 北大核心 2018年第4期580-586,共7页
众核处理器适应于加速高吞吐率的计算密集型应用,而密码算法需要进行大量的数学计算,特别需要使用高吞吐率的计算平台。提出了一种面向众核平台的粗粒度并行加速框架,该框架不考虑算法内部的运算过程,将数据以计算函数为单位分配到众核... 众核处理器适应于加速高吞吐率的计算密集型应用,而密码算法需要进行大量的数学计算,特别需要使用高吞吐率的计算平台。提出了一种面向众核平台的粗粒度并行加速框架,该框架不考虑算法内部的运算过程,将数据以计算函数为单位分配到众核协处理器上执行。使用MIC众核协处理器,采用三级并行结构及任务分配机制,提升了高吞吐率密码算法处理的并行性。针对多种密码算法应用的实验结果表明,该框架可充分利用众核平台实现粗粒度并行的高吞吐率加解密处理。 展开更多
关键词 众核平台 密码算法 高吞吐率 粗粒度并行
在线阅读 下载PDF
无证书并行密钥隔离加密体制 被引量:1
17
作者 何粒波 闫东杰 +1 位作者 熊虎 秦志光 《计算机应用研究》 CSCD 北大核心 2017年第7期2164-2166,2171,共4页
无证书公钥加密体制不仅避免了公钥加密体制中复杂的公钥证书管理,同时也解决了基于身份加密体制里的密钥托管问题。在无证书公钥加密体制里融合了并行密钥隔离体制的方案,提出了一种新的无证书并行密钥隔离加密(CL-PKIE)体制。这种新... 无证书公钥加密体制不仅避免了公钥加密体制中复杂的公钥证书管理,同时也解决了基于身份加密体制里的密钥托管问题。在无证书公钥加密体制里融合了并行密钥隔离体制的方案,提出了一种新的无证书并行密钥隔离加密(CL-PKIE)体制。这种新的体制满足了恶劣复杂的实际应用环境的安全性要求,减轻了密钥泄露问题。给出了CL-PKIE体制的具体结构并证明了在随机预言机模型下方案的IND-CCA2安全性。 展开更多
关键词 无证书公钥加密体制 并行密钥加密体制 随机预言机
在线阅读 下载PDF
高速量子随机数产生中的实时并行后处理 被引量:2
18
作者 吴明川 成琛 +2 位作者 张江江 郭晓敏 郭龑强 《光通信研究》 北大核心 2020年第5期1-6,共6页
针对目前串行量子随机数发生器方案中,量子模式提取的信号带宽与数据处理速率之间的权衡在实时产生速率方面造成了瓶颈,文章利用现场可编程门阵列(FPGA)对多个量子边带模式的并行托普利茨(Toeplitz)哈希实时后处理,研究分析了不同规模To... 针对目前串行量子随机数发生器方案中,量子模式提取的信号带宽与数据处理速率之间的权衡在实时产生速率方面造成了瓶颈,文章利用现场可编程门阵列(FPGA)对多个量子边带模式的并行托普利茨(Toeplitz)哈希实时后处理,研究分析了不同规模Toeplitz矩阵的逻辑资源占用,设计了两层并行流水线算法并进行了仿真验证,充分利用FPGA的并行处理优势和硬件资源,最终实现了实时速率8.24 Gbit/s的量子随机数安全后处理。仿真结果表明,量子随机数发生器的熵源具有较好的随机性,经后处理后的随机数自相关系数保持在10-4量级且能通过Diehard测试。通过与集成电路匹配并行提取多个量子边带模式,实现了一种可商业化的高鲁棒性、高速实时量子随机数发生器。 展开更多
关键词 量子随机数 现场可编程门阵列 并行实时后处理 量子密码
在线阅读 下载PDF
基于GPU的高性能密码计算 被引量:1
19
作者 郑昉昱 董建阔 +1 位作者 林璟锵 高莉莉 《信息安全研究》 2019年第1期88-96,共9页
密码技术是保障网络安全的重要基石和工具.近年来,随着大数据行业、电子商务和云计算技术的持续快速发展,各个服务商面对的用户量、业务量和相应的密码计算量也在急速地攀升;面向这一情况,研究人员开始打破密码算法由CPU,ASIC,FPGA实现... 密码技术是保障网络安全的重要基石和工具.近年来,随着大数据行业、电子商务和云计算技术的持续快速发展,各个服务商面对的用户量、业务量和相应的密码计算量也在急速地攀升;面向这一情况,研究人员开始打破密码算法由CPU,ASIC,FPGA实现的传统格局,将密码算法迁移至GPU等各类并行计算平台上.受到高分辨率图形渲染、人工智能的巨大需求所带动,GPU在过去10年获得超过10倍的计算性能提升,大幅领先于其他计算平台.这也使得基于GPU的高性能算法实现的性能远超其他平台的同类实现,显示出了GPU在密码算法实现领域的巨大潜能.内容主要包括2部分:一是总结基于GPU的高性能密码计算的发展和研究现状;二是简要分析它未来的发展趋势. 展开更多
关键词 图形处理器 RSA 椭圆曲线密码学 密码计算 并行计算
在线阅读 下载PDF
Aigis密钥封装算法多平台高效实现与优化 被引量:4
20
作者 沈诗羽 何峰 赵运磊 《计算机研究与发展》 EI CSCD 北大核心 2021年第10期2238-2252,共15页
量子计算技术快速发展带来的新挑战使得后量子密码(post-quantum cryptography,PQC)成为当前密码学界研究热点.基于格的密码方案因其安全高效的特性,已经成为后量子公钥密码的主流之一.Aigis密钥封装算法(Aigis-enc)是我国学者自主设计... 量子计算技术快速发展带来的新挑战使得后量子密码(post-quantum cryptography,PQC)成为当前密码学界研究热点.基于格的密码方案因其安全高效的特性,已经成为后量子公钥密码的主流之一.Aigis密钥封装算法(Aigis-enc)是我国学者自主设计的基于模格上非对称错误学习(A-MLWE)问题的后量子密码算法,是中国密码学会举办的全国密码算法设计竞赛公钥密码算法一等奖获奖算法之一.为了应对量子攻击,维护国家网络空间的长远安全,为未来国家后量子密码算法标准的制定和实际部署贡献力量,对我国自行研发的优秀后量子密码算法进行优化具有重要意义.工作重点关注Aigis-enc算法在不同平台的实现优化,包含高性能平台的快速并行实现与嵌入式低功耗平台的紧凑实现.具体而言,运用单指令多数据流(single instruction multiple data,SIMD)指令,充分优化了Aigis-enc现有AVX2实现,并提供了其首个ARM Cortex-M4平台的轻量级紧凑实现.实现包含4个关键优化点:降低Montgomery约减与Barrett约减汇编指令数目,提升了约减效率;使用裁剪层数的数论变换并优化指令流水调度,加速多项式乘法运算并减少了预计算表存储需求;提供了多项式序列化与反序列化的并行汇编指令实现,加快了编码解码与加解密过程;结合on-the-fly计算与空间复用优化算法存储空间.实验结果表明:提出的优化技术在8核Intel Core i7处理器上可将Aigis-enc算法原始AVX2实现提升25%,且大幅减少了其在ARM Cortex-M4平台的预计算表存储、代码尺寸与运行堆栈占用,对算法的实际应用有重要现实意义. 展开更多
关键词 后量子密码 格密码 密钥封装机制 AVX2并行优化 嵌入式轻量级实现
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部